概要
Kokoroは8200万パラメータを持つオープンウェイトのテキスト読み上げ(TTS)モデルです。
軽量なアーキテクチャながら、より大規模なモデルと同等の品質を実現し、大幅な高速化とコスト効率の向上を両立しています。
Apacheライセンスのウェイトにより、本番環境から個人プロジェクトまで幅広い用途でデプロイ可能です。
API経由での利用コストは、100万文字あたり1ドル未満と非常に低く抑えられています。
Google Colabで手軽に利用でき、多言語に対応しています。
高品質で費用対効果の高い音声合成を求める開発者や企業に適しています。
互換性・特徴
- 音声合成
- Python
- CLI
- Web UI
- 多言語対応
- Apache License
基本情報
| ライセンス | apache-2.0 |
| Likes | 6,108 |
| Downloads | 9,535,335 |
| Pipeline | text-to-speech |
| カテゴリ | TTS / 音声 |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/hexgrad/Kokoro-82M
