3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#音声合成 (58 repos)
「音声合成」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub gb-speech
「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…
★ 7 MIT 2026-05-03
音声生成 / TTS GitHub Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-10
音声生成 / TTS GitHub kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
音声生成 / TTS GitHub claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-05-26
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
音声生成 / TTS GitHub XiaomiMiMo-TUI
XiaomiMiMo-TUIは、Xiaomi MiMo専用のターミナルTUI/CLIクライアントです。Xiaomi MiMoのToken Planに特化したOpenAI…
★ 5 NOASSERTION 2026-05-15
音声生成 / TTS GitHub openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
音声生成 / TTS GitHub BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 5 ⑂ 1 MIT 2026-05-10
音声生成 / TTS GitHub voxcpm-easy-launcher
「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM(優れたオープンソースのテキスト音声変換および音声クローンモデル)…
★ 4 ⑂ 1 MIT 2026-06-09
ComfyUI GitHub aeon-radio-drama
aeon-radio-dramaは、ラジオドラマ、オーディオブック、オーディオフィクションを制作するためのフルパイプラインツ…
★ 4 ⑂ 3 MIT 2026-05-01
ComfyUI GitHub ComfyUI-Text2Speech
ComfyUI向けのText-to-Speechカスタムノードです。Microsoft Edge TTSを使って自然な音声のWAVを書き出せ、テキスト…
★ 3 ⑂ 1 2026-01-18
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
マルチモーダル GitHub mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
音声生成 / TTS GitHub supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
音声生成 / TTS GitHub godot_volcengine_tts
Godot 4.4+向けの火山エンジン豆包TTS音声大モデルのサードパーティSDKです。ゲームやインタラクティブプロジェクト…
★ 2 MIT 2026-05-20
動画生成 GitHub makeslide
makeslideは、PDFやテキストファイル、YouTube動画から音声付きプレゼンテーションを生成・再生するシステムです。AI…
★ 2 2026-06-19
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
音声生成 / TTS GitHub strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
動画生成 GitHub ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 2 NOASSERTION 2026-05-10
LLM GitHub voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
音声生成 / TTS GitHub minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
音声生成 / TTS GitHub md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
音声生成 / TTS GitHub cartesia_tts
cartesia_ttsは、Home AssistantにCartesia Sonicのテキスト読み上げ機能を追加するツールです。これにより、スマー…
★ 1 MIT 2026-06-16
音声生成 / TTS GitHub afterwords
Afterwordsは、ローカルで動作するボイスクローニングTTS(テキスト読み上げ)サーバーです。15秒のYouTubeクリップ…
★ 1 MIT 2026-06-15