3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#音声合成 (58 repos)

「音声合成」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-10
音声生成 / TTS
GitHub
claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-05-26
音声生成 / TTS
GitHub
kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
音声生成 / TTS
GitHub
XiaomiMiMo-TUI
XiaomiMiMo-TUIは、Xiaomi MiMo専用のターミナルTUI/CLIクライアントです。Xiaomi MiMoのToken Planに特化したOpenAI…
★ 5 NOASSERTION 2026-05-15
音声生成 / TTS
GitHub
openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
音声生成 / TTS
GitHub
BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 5 ⑂ 1 MIT 2026-05-10
音声生成 / TTS
GitHub
voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
音声生成 / TTS
GitHub
voxcpm-easy-launcher
「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM(優れたオープンソースのテキスト音声変換および音声クローンモデル)…
★ 4 ⑂ 1 MIT 2026-06-09
ComfyUI
GitHub
aeon-radio-drama
aeon-radio-dramaは、ラジオドラマ、オーディオブック、オーディオフィクションを制作するためのフルパイプラインツ…
★ 4 ⑂ 3 MIT 2026-05-01
ComfyUI
GitHub
ComfyUI-Text2Speech
ComfyUI向けのText-to-Speechカスタムノードです。Microsoft Edge TTSを使って自然な音声のWAVを書き出せ、テキスト…
★ 3 ⑂ 1 2026-01-18
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
マルチモーダル
GitHub
mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
音声生成 / TTS
GitHub
supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
動画生成
GitHub
makeslide
makeslideは、PDFやテキストファイル、YouTube動画から音声付きプレゼンテーションを生成・再生するシステムです。AI…
★ 2 2026-06-19
音声生成 / TTS
GitHub
Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
音声生成 / TTS
GitHub
strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
動画生成
GitHub
ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 2 NOASSERTION 2026-05-10
LLM
GitHub
voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
音声生成 / TTS
GitHub
godot_volcengine_tts
Godot 4.4+向けの火山エンジン豆包TTS音声大モデルのサードパーティSDKです。ゲームやインタラクティブプロジェクト…
★ 2 MIT 2026-05-20
音声生成 / TTS
GitHub
minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
音声生成 / TTS
GitHub
md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
音声生成 / TTS
GitHub
cartesia_tts
cartesia_ttsは、Home AssistantにCartesia Sonicのテキスト読み上げ機能を追加するツールです。これにより、スマー…
★ 1 MIT 2026-06-16
音声生成 / TTS
GitHub
afterwords
Afterwordsは、ローカルで動作するボイスクローニングTTS(テキスト読み上げ)サーバーです。15秒のYouTubeクリップ…
★ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-18