概要
Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成(TTS)を提供するオープンウェイトモデルです。
高速かつコスト効率に優れており、Apache-2.0ライセンスで提供されているため、商用環境から個人のプロジェクトまで幅広く利用できます。
特に、API利用時の低コストが特徴で、高品質な音声合成を手軽に導入したい開発者や企業に最適です。
Pythonベースで、Google Colabでの実行例も提供されており、手軽に試すことができます。
互換性・特徴
- Text-to-Speech
- Python
- CLI
- Google Colab対応
- Apache-2.0ライセンス
- GPU推奨
基本情報
| ライセンス | apache-2.0 |
| Likes | 6,367 |
| Downloads | 16,925,704 |
| Pipeline | text-to-speech |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/hexgrad/Kokoro-82M
