2,941 repos GH 2,826 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

MisoTTS-ComfyUI

★ 3 MIT 更新: 2026-06-04 GitHubで見る →

概要

MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。

Miso TTS 8BモデルとMimiオーディオトークンを使用し、セサミスタイルのCSMテキスト音声合成を提供します。

オプションで参照オーディオを用いた音声継続生成、Whisperによる音声認識、ComfyUIのAUDIO配線、およびAimdo/VRAM管理機能との統合が可能です。

BF16対応、ローカルアセット保存、自動dtype判別、効率的なVRAM管理などの特徴を持ちます。

ComfyUIユーザーで、高品質なテキスト音声変換、音声からのテキスト書き起こし、または特定の音声スタイルを継続した音声生成を行いたい開発者やクリエイターに最適です。

互換性・特徴

  • ComfyUI対応
  • GPU必須
  • Python
  • テキスト音声変換
  • 音声認識
  • VRAM管理

基本情報

ライセンスMIT
Stars3
カテゴリComfyUI
アクティビティlow

GitHub: https://github.com/Saganaki22/MisoTTS-ComfyUI