3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#音声合成 (58 repos)

「音声合成」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

gb-speech

「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…

#CLI #C言語 #Game Boy

★ 7 MIT 2026-05-03

音声生成 / TTS

GitHub

Local-TTS-studio

Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ（TTS）スタジオ…

#Electron #Python #Web UI

★ 7 Apache-2.0 2026-06-10

音声生成 / TTS

GitHub

kokoro

Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ（TTS）サーバーレスエンド…

#API #GPU必須 #RunPod Serverless

★ 6 ⑂ 4 Apache-2.0 2026-02-10

音声生成 / TTS

GitHub

claude-code-audio-recap

このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…

#Claude Code Plugin #CLI #macOS

★ 6 Apache-2.0 2026-05-26

音声生成 / TTS

GitHub

voice-snap

「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…

#AI #Python #ライブラリ

★ 5 NOASSERTION 2026-05-19

音声生成 / TTS

GitHub

XiaomiMiMo-TUI

XiaomiMiMo-TUIは、Xiaomi MiMo専用のターミナルTUI/CLIクライアントです。Xiaomi MiMoのToken Planに特化したOpenAI…

#CLI #OpenAI互換API #Rust

★ 5 NOASSERTION 2026-05-15

音声生成 / TTS

GitHub

openvoice-cloning

OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…

#AI/ML #Python #多言語対応

★ 5 MIT 2026-06-13

音声生成 / TTS

GitHub

BridgeSpeak

BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…

#AIエージェント対応 #CLI #Python

★ 5 ⑂ 1 MIT 2026-05-10

音声生成 / TTS

GitHub

voxcpm-easy-launcher

「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM（優れたオープンソースのテキスト音声変換および音声クローンモデル）…

#macOS対応 #Python #Web UI

★ 4 ⑂ 1 MIT 2026-06-09

ComfyUI

GitHub

aeon-radio-drama

aeon-radio-dramaは、ラジオドラマ、オーディオブック、オーディオフィクションを制作するためのフルパイプラインツ…

#CLI #ComfyUI対応 #Python

★ 4 ⑂ 3 MIT 2026-05-01

ComfyUI

GitHub

ComfyUI-Text2Speech

ComfyUI向けのText-to-Speechカスタムノードです。Microsoft Edge TTSを使って自然な音声のWAVを書き出せ、テキスト…

#ComfyUI対応 #Python #Web UI

★ 3 ⑂ 1 2026-01-18

マルチモーダル

GitHub

reachy-mini-agent

reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…

#GPU必須 #Local LLM #Python

★ 3 Apache-2.0 2026-06-01

マルチモーダル

GitHub

mimo-code

MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…

#macOS #Windows #デスクトップアプリ

★ 3 MIT 2026-06-15

音声生成 / TTS

GitHub

supertonic_embeddings_trainer

Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…

#GPU必須 #Python #SupertonicTTS対応

★ 3 MIT 2026-05-26

音声生成 / TTS

GitHub

godot_volcengine_tts

Godot 4.4+向けの火山エンジン豆包TTS音声大モデルのサードパーティSDKです。ゲームやインタラクティブプロジェクト…

#Godot 4.4+ #HTTP #SDK

★ 2 MIT 2026-05-20

動画生成

GitHub

makeslide

makeslideは、PDFやテキストファイル、YouTube動画から音声付きプレゼンテーションを生成・再生するシステムです。AI…

#AI活用 #Python #Web UI

★ 2 2026-06-19

音声生成 / TTS

GitHub

Project-Siren

Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成（TTS）モデルを作成するための、エ…

#CLI #GPU必須 #HuggingFace

★ 2 2026-05-04

音声生成 / TTS

GitHub

strands-omnivoice

strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-16

動画生成

GitHub

ai-content-automation-system

このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…

#AI活用 #CLI #FFmpeg

★ 2 NOASSERTION 2026-05-10

LLM

GitHub

voice-rag-agent

VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…

#Python #RAG #Web UI

★ 2 MIT 2026-06-01

音声生成 / TTS

GitHub

minimax-hub

このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成（多言語…

#AI生成 #CLI #Python

★ 1 MIT 2026-05-29

音声生成 / TTS

GitHub

md-tts

md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…

#CLI #Python #オフライン対応

★ 1 MIT 2026-06-04

音声生成 / TTS

GitHub

cartesia_tts

cartesia_ttsは、Home AssistantにCartesia Sonicのテキスト読み上げ機能を追加するツールです。これにより、スマー…

#Cartesia Sonic #Home Assistant #TTS

★ 1 MIT 2026-06-16

音声生成 / TTS

GitHub

afterwords

Afterwordsは、ローカルで動作するボイスクローニングTTS（テキスト読み上げ）サーバーです。15秒のYouTubeクリップ…

#AIエージェント連携 #Apple Silicon #CLI

★ 1 MIT 2026-06-15