概要
このツールは、テキスト読み上げ(TTS)サーバー「Kokoro」をDockerコンテナとして手軽にデプロイできるイメージです。
OpenAI互換の音声APIを提供するため、既存のOpenAI TTS APIを使用しているアプリケーションは、わずかな変更でこの自己ホスト型サーバーに切り替えることができます。
日本語を含む9言語で54種類以上の高品質な音声に対応し、ストリーミング、NVIDIA GPU(CUDA)による高速化、オフラインモード、永続的なモデルキャッシュなどの豊富な機能を備えています。
プライバシーを重視し、音声データを自身のサーバー内で管理したい開発者や、スケーラブルな自己ホスト型AIスタックを構築したい企業に最適です。
互換性・特徴
- Docker
- OpenAI API互換
- GPU対応
- 日本語対応
- Python
- 自己ホスト型
基本情報
| ライセンス | NOASSERTION |
| Stars | 13 |
| Forks | 2 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |