3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#音声合成 (58 repos)
「音声合成」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 5 ⑂ 1 MIT 2026-05-10
ComfyUI GitHub aeon-radio-drama
aeon-radio-dramaは、ラジオドラマ、オーディオブック、オーディオフィクションを制作するためのフルパイプラインツ…
★ 4 ⑂ 3 MIT 2026-05-01
音声生成 / TTS GitHub voxcpm-easy-launcher
「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM(優れたオープンソースのテキスト音声変換および音声クローンモデル)…
★ 4 ⑂ 1 MIT 2026-06-09
音声生成 / TTS GitHub supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
マルチモーダル GitHub mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
動画生成 GitHub ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 2 NOASSERTION 2026-05-10
LLM GitHub voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
動画生成 GitHub makeslide
makeslideは、PDFやテキストファイル、YouTube動画から音声付きプレゼンテーションを生成・再生するシステムです。AI…
★ 2 2026-06-19
音声生成 / TTS GitHub godot_volcengine_tts
Godot 4.4+向けの火山エンジン豆包TTS音声大モデルのサードパーティSDKです。ゲームやインタラクティブプロジェクト…
★ 2 MIT 2026-05-20
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
音声生成 / TTS GitHub strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
ASR / 音声認識 GitHub VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
AIエージェント GitHub claude-code-companion
Claude Code Companionは、Apple Silicon Mac上で動作する、コーディング時の孤独を和らげる音声コンパニオンツール…
★ 1 2026-05-28
音声生成 / TTS GitHub omnivoice-gfx1150
このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU(gfx1150/Strix Point)上で動作…
★ 1 MIT 2026-05-30
ASR / 音声認識 GitHub AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
その他 GitHub my-podcast
「My Podcast Studio」は、AI音声合成とポッドキャストナレーションを提供するオープンソースのSaaSプラットフォーム…
★ 1 ⑂ 3 2026-06-09
音声生成 / TTS GitHub everything-to-podcast
「万物播客(Everything-to-Podcast)」は、AIを活用してあらゆるテキストコンテンツをポッドキャストやオーディオブ…
★ 1 2026-05-27
音声生成 / TTS GitHub lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
音声生成 / TTS GitHub f5-tts-hotkey
このツールは、任意のアプリケーションで選択したテキストを、Alt+Xのホットキー操作でF5-TTSによる音声合成で読み上…
★ 1 2026-06-02
音声生成 / TTS GitHub md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
音声生成 / TTS GitHub voxcpm2-pinokio-launcher
このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…
★ 1 2026-05-03
音声生成 / TTS GitHub afterwords
Afterwordsは、ローカルで動作するボイスクローニングTTS(テキスト読み上げ)サーバーです。15秒のYouTubeクリップ…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-18