音声生成 / TTS GitHub unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 65.8k ⑂ 5.9k Apache-2.0 2026-06-05
音声生成 / TTS GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 59.9k ⑂ 9.4k NOASSERTION 2026-03-09
音声生成 / TTS GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 58.4k ⑂ 6.4k MIT 2026-04-30
音声生成 / TTS GitHub TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.4k ⑂ 6.1k MPL-2.0 2024-08-16
音声生成 / TTS GitHub ChatTTS
ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。自然で表現豊かな音声合成を…
★ 39.4k ⑂ 4.2k AGPL-3.0 2026-04-10
音声生成 / TTS GitHub MockingBird
Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニン…
★ 36.9k ⑂ 5.2k NOASSERTION 2026-03-03
音声生成 / TTS GitHub OpenVoice
OpenVoiceは、MITとMyShellが開発した高性能なインスタント音声クローン技術です。V1では、参照音源の正確な音色クロ…
★ 36.6k ⑂ 4.1k MIT 2025-04-19
音声生成 / TTS GitHub fish-speech
Fish Speechは、最先端のオープンソーステキスト音声合成(TTS)ツールであり、表情豊かな音声クローンと多言語対応…
★ 30.6k ⑂ 2.6k NOASSERTION 2026-05-26
音声生成 / TTS GitHub mastra
Mastraは、現代的なTypeScriptスタックを使用してAIパワードアプリケーションやエージェントを構築するためのフレー…
★ 24.7k ⑂ 2.2k NOASSERTION 2026-06-02
音声生成 / TTS GitHub VoxCPM
VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…
★ 23.1k ⑂ 2.7k Apache-2.0 2026-05-22
音声生成 / TTS GitHub CosyVoice
FunAudioLLMが開発するCosyVoiceは、大規模言語モデル(LLM)を基盤とした多言語対応の音声生成モデルです。最新版の…
★ 21.3k ⑂ 2.5k Apache-2.0 2026-05-25
音声生成 / TTS GitHub readest
Readestは、熱心な読書家のために設計された、没入感のある深い読書体験を提供するオープンソースの電子書籍リーダー…
★ 21.3k ⑂ 1.2k AGPL-3.0 2026-06-04
音声生成 / TTS GitHub index-tts
IndexTTS2は、感情豊かで再生時間の厳密な制御が可能な自己回帰型ゼロショットテキスト音声合成(TTS)モデルです。…
★ 20.9k ⑂ 2.6k NOASSERTION 2026-03-16
音声生成 / TTS GitHub dia
Diaは、Nari Labsが開発した1.6Bパラメータのテキスト読み上げ(TTS)モデルです。このツールは、スクリプトから直接…
★ 19.3k ⑂ 1.7k Apache-2.0 2025-11-19
音声生成 / TTS GitHub ebook2audiobook
「ebook2audiobook (E2A)」は、電子書籍(非DRM)を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…
★ 19.1k ⑂ 1.6k Apache-2.0 2026-05-29
音声生成 / TTS GitHub pot-desktop
Potは、Windows、macOS、Linuxに対応したクロスプラットフォームのテキスト翻訳およびOCRソフトウェアです。主要機能…
★ 18.7k ⑂ 911 GPL-3.0 2026-05-25
音声生成 / TTS GitHub NeMo
NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI(自動音声認識、Text-to-Speech)向けにNVIDIAが…
★ 17.3k ⑂ 3.4k Apache-2.0 2026-06-04
音声生成 / TTS GitHub VideoLingo
VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…
★ 17.2k ⑂ 1.9k Apache-2.0 2026-03-24
音声生成 / TTS GitHub supertonic
Supertonicは、ONNX Runtimeを介してデバイス上で動作する、超高速かつ高品質な多言語テキスト読み上げシステムです…
★ 11.2k ⑂ 1.2k MIT 2026-05-22
音声生成 / TTS GitHub edge-tts
edge-ttsは、Microsoft Edgeのオンラインテキスト読み上げサービスをPythonコードやコマンドラインから利用できるツ…
★ 11.2k ⑂ 1.0k NOASSERTION 2026-03-22
音声生成 / TTS GitHub voice-pro
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…
★ 10.8k ⑂ 1.6k GPL-3.0 2025-12-05
音声生成 / TTS GitHub KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.2k ⑂ 952 GPL-3.0 2026-05-31
音声生成 / TTS GitHub TTS
TTSは、最先端の研究に基づいた高度なText-to-Speech生成ライブラリです。トレーニングの容易さ、速度、品質のバラン…
★ 10.1k ⑂ 1.3k MPL-2.0 2023-11-09
音声生成 / TTS GitHub voltagent
VoltAgentは、オープンソースのTypeScriptフレームワークとVoltOpsコンソールからなるAIエージェント開発プラットフ…
★ 9.4k ⑂ 972 MIT 2026-06-04