概要
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。
小説のテキストファイルをアップロードすると、自動的に章に分割し、LLM(大規模言語モデル)がキャラクターを認識します。
認識されたキャラクターの性格や話し方に基づき、50種類以上の音色ライブラリから最適なボイスが自動で割り当てられ、多キャラクター対話型のオーディオブックを制作できます。
直感的なWeb UIを通じて、章ごとの詳細な編集やキャラクターカードの永続化、LLM設定のカスタマイズ、リアルタイムでのトークン消費確認などが可能です。
小説をオーディオブック化したい個人や、効率的に高品質な音声コンテンツを制作したいクリエイターに最適なソリューションを提供します。
互換性・特徴
- Python
- Web UI
- Docker
- LLM活用
- AI
基本情報
| ライセンス | MIT |
| Stars | 7 |
| Forks | 1 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
最新のissue
- セグメンテーション編集時の認識結果が全てナレーションになる (更新: 2026-06-09 / 划分编辑时识别的结果全部都是“旁白”)
