3,116 repos GH 3,001 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS (330 repos)

カテゴリ「音声生成 / TTS」のリポジトリ一覧

← 全カテゴリ

音声生成 / TTS

GitHub

unsloth

Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…

#CLI #GPU必須 #Python

★ 65.8k ⑂ 5.9k Apache-2.0 2026-06-05

音声生成 / TTS

GitHub

Real-Time-Voice-Cloning

このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…

#CLI #GPU対応 #GUI

★ 59.9k ⑂ 9.4k NOASSERTION 2026-03-09

音声生成 / TTS

GitHub

GPT-SoVITS

GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech（TTS）モデルをトレーニングできる強力なFew-s…

#Docker対応 #GPU必須 #Python

★ 58.4k ⑂ 6.4k MIT 2026-04-30

音声生成 / TTS

GitHub

TTS

Coqui.aiの🐸TTSは、深層学習を用いた先進的なテキスト音声合成（Text-to-Speech）ライブラリです。1100以上の言語に…

#CLI #Python #ディープラーニング

★ 45.4k ⑂ 6.1k MPL-2.0 2024-08-16

音声生成 / TTS

GitHub

ChatTTS

ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。自然で表現豊かな音声合成を…

#CLI #GPU必須 #LLM連携

★ 39.4k ⑂ 4.2k AGPL-3.0 2026-04-10

音声生成 / TTS

GitHub

MockingBird

Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニン…

#GPU必須 #Python #PyTorch

★ 36.9k ⑂ 5.2k NOASSERTION 2026-03-03

音声生成 / TTS

GitHub

OpenVoice

OpenVoiceは、MITとMyShellが開発した高性能なインスタント音声クローン技術です。V1では、参照音源の正確な音色クロ…

#CLI #Python #商用利用可能

★ 36.6k ⑂ 4.1k MIT 2025-04-19

音声生成 / TTS

GitHub

fish-speech

Fish Speechは、最先端のオープンソーステキスト音声合成（TTS）ツールであり、表情豊かな音声クローンと多言語対応…

#CLI #Docker #Python

★ 30.6k ⑂ 2.6k NOASSERTION 2026-05-26

音声生成 / TTS

GitHub

mastra

Mastraは、現代的なTypeScriptスタックを使用してAIパワードアプリケーションやエージェントを構築するためのフレー…

#Next.js #Node.js #React

★ 24.7k ⑂ 2.2k NOASSERTION 2026-06-02

音声生成 / TTS

GitHub

VoxCPM

VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…

#GPU必須 #Python #Web UI

★ 23.1k ⑂ 2.7k Apache-2.0 2026-05-22

音声生成 / TTS

GitHub

CosyVoice

FunAudioLLMが開発するCosyVoiceは、大規模言語モデル（LLM）を基盤とした多言語対応の音声生成モデルです。最新版の…

#API #LLMベース #Python

★ 21.3k ⑂ 2.5k Apache-2.0 2026-05-25

音声生成 / TTS

GitHub

readest

Readestは、熱心な読書家のために設計された、没入感のある深い読書体験を提供するオープンソースの電子書籍リーダー…

#Ebookリーダー #Next.js #Tauri

★ 21.3k ⑂ 1.2k AGPL-3.0 2026-06-04

音声生成 / TTS

GitHub

index-tts

IndexTTS2は、感情豊かで再生時間の厳密な制御が可能な自己回帰型ゼロショットテキスト音声合成（TTS）モデルです。…

#GPU推奨 #Python #Web UI

★ 20.9k ⑂ 2.6k NOASSERTION 2026-03-16

音声生成 / TTS

GitHub

dia

Diaは、Nari Labsが開発した1.6Bパラメータのテキスト読み上げ（TTS）モデルです。このツールは、スクリプトから直接…

#Hugging Face Transformers対応 #Python #TTSモデル

★ 19.3k ⑂ 1.7k Apache-2.0 2025-11-19

音声生成 / TTS

GitHub

ebook2audiobook

「ebook2audiobook (E2A)」は、電子書籍（非DRM）を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…

#CLI #Docker対応 #GPU対応

★ 19.1k ⑂ 1.6k Apache-2.0 2026-05-29

音声生成 / TTS

GitHub

pot-desktop

Potは、Windows、macOS、Linuxに対応したクロスプラットフォームのテキスト翻訳およびOCRソフトウェアです。主要機能…

#OCR #Wayland対応 #クロスプラットフォーム

★ 18.7k ⑂ 911 GPL-3.0 2026-05-25

音声生成 / TTS

GitHub

NeMo

NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI（自動音声認識、Text-to-Speech）向けにNVIDIAが…

#GPU必須 #HuggingFace対応 #低遅延

★ 17.3k ⑂ 3.4k Apache-2.0 2026-06-04

音声生成 / TTS

GitHub

VideoLingo

VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…

#AI活用 #GPU必須 #Python

★ 17.2k ⑂ 1.9k Apache-2.0 2026-03-24

音声生成 / TTS

GitHub

supertonic

Supertonicは、ONNX Runtimeを介してデバイス上で動作する、超高速かつ高品質な多言語テキスト読み上げシステムです…

#GPU不要 #ONNX Runtime #Python

★ 11.2k ⑂ 1.2k MIT 2026-05-22

音声生成 / TTS

GitHub

edge-tts

edge-ttsは、Microsoft Edgeのオンラインテキスト読み上げサービスをPythonコードやコマンドラインから利用できるツ…

#CLI #Cross-platform #Python

★ 11.2k ⑂ 1.0k NOASSERTION 2026-03-22

音声生成 / TTS

GitHub

voice-pro

Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…

#GPU必須 #Python #Web UI

★ 10.8k ⑂ 1.6k GPL-3.0 2025-12-05

音声生成 / TTS

GitHub

KrillinAI

KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…

#AI Agent対応 #CLI #LLM活用

★ 10.2k ⑂ 952 GPL-3.0 2026-05-31

音声生成 / TTS

GitHub

TTS

TTSは、最先端の研究に基づいた高度なText-to-Speech生成ライブラリです。トレーニングの容易さ、速度、品質のバラン…

#CLI #Deep Learning #Python

★ 10.1k ⑂ 1.3k MPL-2.0 2023-11-09

音声生成 / TTS

GitHub

voltagent

VoltAgentは、オープンソースのTypeScriptフレームワークとVoltOpsコンソールからなるAIエージェント開発プラットフ…

#API連携 #TypeScript #Web UI

★ 9.4k ⑂ 972 MIT 2026-06-04