422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ComfyUI-OmniVoice-TTS

★ 372 ⑂ 52 Apache-2.0 更新: 2026-05-01 GitHubで見る →

概要

ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノードです。

最先端の音声クローニングと音声デザイン機能を備え、600以上の言語に対応しています。

短時間の参照音声から任意の声をクローンしたり、テキスト記述(性別、年齢、ピッチ、アクセントなど)に基づいて合成音声を生成したりできます。

複数の話者による対話生成や非言語的表現の追加も可能です。

高速な推論とVRAM効率に優れた設計が特徴で、ComfyUIユーザーが高度な音声合成機能を容易に利用できることを想定しています。

互換性・特徴

  • ComfyUI対応
  • GPU必須
  • 多言語対応
  • 音声クローニング
  • 音声デザイン
  • Python

基本情報

ライセンスApache-2.0
Stars372
Forks52
カテゴリComfyUI
アクティビティmid

最新リリース: 0.4.4 (2026-05-01)

GitHub: https://github.com/Saganaki22/ComfyUI-OmniVoice-TTS