3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Irodori-TTS

★ 967 ⑂ 109 MIT 更新: 2026-06-04 GitHubで見る →

概要

Irodori-TTSは、Flow Matching技術を用いたテキスト音声合成モデルで、絵文字によるスタイル制御が可能です。

参照音声からのゼロショット音声クローニング、キャプションによるスタイル制御、自動的な音声長の予測、生成音声への自動透かし入れといった多様な機能を持ちます。

また、マルチGPUでの学習やPEFT/LoRAによるファインチューニングにも対応しており、CLI、Gradio Web UI、HuggingFace Hubを通じて柔軟な推論が可能です。

研究者や開発者が高度な音声合成モデルを構築・利用するのに適しています。

互換性・特徴

  • Python
  • CLI
  • Web UI
  • GPU必須
  • 音声合成
  • スタイル制御

基本情報

ライセンスMIT
Stars967
Forks109
カテゴリ画像生成
アクティビティmid

最新のissue

GitHub: https://github.com/Aratako/Irodori-TTS