音声生成 / TTS GitHub TTS
Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成(Text-to-Speech)ライブラリです。1100以上の言語に…
★ 45.6k ⑂ 6.1k MPL-2.0 2024-08-16
ASR / 音声認識 GitHub voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 30.8k ⑂ 3.8k MIT 2026-04-26
音声生成 / TTS GitHub CosyVoice
FunAudioLLMが開発するCosyVoiceは、大規模言語モデル(LLM)を基盤とした多言語対応の音声生成モデルです。最新版の…
★ 21.8k ⑂ 2.5k Apache-2.0 2026-05-25
音声生成 / TTS GitHub voice-pro
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…
★ 11.0k ⑂ 1.6k GPL-3.0 2025-12-05
画像生成 GitHub runanywhere-sdks
RunAnywhereは、LLM(大規模言語モデル)、音声認識、音声合成、ボイスアシスタントといったAI機能をデバイス上で完…
★ 10.3k ⑂ 359 NOASSERTION 2026-06-22
音声生成 / TTS HF Kokoro-82M
Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成(TTS)を提供するオープ…
❤ 6.4k ↓ 16.9M apache-2.0 2025-04-10
画像生成 GitHub StyleTTS2
StyleTTS 2は、テキストから人間レベルの自然な音声を合成する最新のText-to-Speech(TTS)モデルです。スタイル拡散…
★ 6.3k ⑂ 691 MIT 2024-08-10
ASR / 音声認識 GitHub argmax-oss-swift
Argmax Open-Source SDK Swiftは、Apple Siliconデバイス上で動作する高性能なオープンソースAI推論フレームワーク群…
★ 6.2k ⑂ 572 MIT 2026-06-10
ComfyUI GitHub VibeVoice-ComfyUI
VibeVoice ComfyUI Nodesは、MicrosoftのVibeVoiceテキスト読み上げモデルをComfyUIに統合するツールです。これによ…
★ 1.5k ⑂ 241 MIT 2026-02-18
音声生成 / TTS GitHub Voice-Cloning-App
「Voice Cloning App」は、PythonとPyTorchを利用して人間の音声を簡単に合成できるアプリケーションです。自動デー…
★ 1.4k ⑂ 239 BSD-3-Clause 2024-12-02
音声生成 / TTS GitHub TTS-Audio-Suite
ComfyUI用のカスタムノードとして、ローカル環境で複数の音声合成エンジンと多言語対応のテキスト読み上げ(TTS)、…
★ 1.0k ⑂ 120 NOASSERTION 2026-06-17
画像生成 GitHub Irodori-TTS
Irodori-TTSは、Flow Matching技術を用いたテキスト音声合成モデルで、絵文字によるスタイル制御が可能です。参照音…
★ 967 ⑂ 109 MIT 2026-06-04
音声生成 / TTS GitHub Confucius4-TTS
Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…
★ 187 ⑂ 19 NOASSERTION 2026-06-17
音声生成 / TTS GitHub cc-beeper
CC-Beeperは、AIコーディングアシスタント「Claude Code」専用のmacOSデスクトップウィジェットです。Claude Codeの…
★ 172 ⑂ 15 NOASSERTION 2026-04-12
音声生成 / TTS GitHub ai-avatar-bot
「AI仮想人ウィジェット」は、Live2Dキャラクターを任意のウェブサイトに簡単に埋め込むことができる音声AIアシスタ…
★ 152 ⑂ 48 NOASSERTION 2026-06-11
音声生成 / TTS GitHub feros
Feros Voice Agent OSは、オープンソースでエンタープライズ級の音声AIエージェント開発・運用インフラを提供するプ…
★ 97 ⑂ 18 Apache-2.0 2026-05-25
音声生成 / TTS GitHub vibe-schooling
「Vibe Schooling」は、学生がAIを活用して学業を効率的に進めるためのツール群です。学習せずに「雰囲気」だけで好…
★ 76 ⑂ 22 MIT 2026-05-26
音声生成 / TTS GitHub omnivoice-server
omnivoice-serverは、OmniVoiceテキスト読み上げモデルのOpenAI互換HTTPサーバーです。OpenAIのTTSエンドポイントの…
★ 67 ⑂ 21 MIT 2026-06-08
音声生成 / TTS GitHub voice-zero
Voice-Zeroは、ゼロショットテキスト音声合成エンジン(Chatterbox、Pocket TTSなど)で利用可能な、高品質なオープ…
★ 38 ⑂ 7 NOASSERTION 2026-05-14
音声生成 / TTS GitHub jarvis-v3
Jarvis v3は、Apple Silicon Mac向けに設計された、Claude Codeを完全ローカルで音声操作するためのインターフェース…
★ 31 ⑂ 3 2026-03-24
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 28 ⑂ 8 MIT 2026-05-25
ASR / 音声認識 GitHub jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 24 ⑂ 1 MIT 2026-06-19
音声生成 / TTS GitHub AI-Audio-Content-Creator
AIを活用した次世代オーディオ制作プラットフォーム「Audio Content Creator」。テキストを基に、高品質な音声合成、…
★ 15 2026-06-13
音声生成 / TTS GitHub cosyvoice3-lora-finetuning
このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供し…
★ 10 NOASSERTION 2026-03-29