3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

TTS-Audio-Suite

★ 973 ⑂ 105 NOASSERTION 更新: 2026-06-12 GitHubで見る →

概要

ComfyUI用のカスタムノードとして、ローカル環境で複数の音声合成エンジンと多言語対応のテキスト読み上げ(TTS)、音声変換、音声編集、RVCモデルトレーニングを統合的に提供するツールです。

F5-TTS、ChatterBox、VibeVoice、Higgs Audio 2、IndexTTS-2、CosyVoice3、Qwen3-TTS、Step Audio EditXなど、多種多様なエンジンに対応し、日本語を含む複数の言語での音声生成が可能です。

無制限のテキスト長、SRTタイミング調整、文字サポートといった豊富なオーディオ機能に加え、字幕の生成・再構築・タイミング推定など、高度な字幕ワークフローもサポートします。

モジュール化されたアーキテクチャにより拡張性も高く、高品質な音声コンテンツ制作を目指すComfyUIユーザーや、複数のTTSエンジンを効率的に活用したいクリエイター、開発者に最適なソリューションです。

互換性・特徴

  • ComfyUI対応
  • 多言語対応
  • 音声合成
  • 音声変換
  • 音声編集
  • SRT対応

基本情報

ライセンスNOASSERTION
Stars973
Forks105
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

最新リリース: v4.27.0 – Initial MOSS-TTS LoRA Training Support (2026-05-26)

GitHub: https://github.com/diodiogod/TTS-Audio-Suite