概要
このKitten TTS Serverは、軽量なKitten TTSモデルをセルフホストするための高性能なAPIサーバーです。
15MのNanoから80MのMiniまで、全7種類のKittenTTSモデルをサポートし、ホットスワップで簡単にモデルを切り替えられます。
直感的なWeb UI、柔軟なAPI、オーディオブックなどの大容量テキスト処理、NVIDIA GPUからRaspberry Pi 5まで対応するGPUアクセラレーションが特徴です。
開発者や、高品質で軽量なテキスト読み上げ機能を自社環境で運用したい個人・企業、オーディオブック作成者などに適しています。
FastAPIで構築されており、Dockerでのデプロイも容易で、OpenAI互換APIも提供します。
互換性・特徴
- Web UI
- API
- GPUアクセラレーション
- Python
- Docker
- FastAPI
- OpenAI互換API
基本情報
| ライセンス | MIT |
| Stars | 263 |
| Forks | 35 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- Macシステムサポートに関する問題 (更新: 2026-01-08 / There are issues regarding support for the mac system)
- Intel GPUのサポートを追加しますか? (更新: 2025-08-11 / Add Intel GPU support?)
- A100 GPUを使用してもRTX 2の推論が遅い (更新: 2025-08-07 / slow inference RTX 2 even with A100 GPU)
