252 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Kokoro-82M

★ 6.1k apache-2.0 更新: 2025-04-10 GitHubで見る →

概要

Kokoroは8200万パラメータを持つオープンウェイトのテキスト読み上げ(TTS)モデルです。

軽量なアーキテクチャながら、より大規模なモデルと同等の品質を実現し、大幅な高速化とコスト効率の向上を両立しています。

Apacheライセンスのウェイトにより、本番環境から個人プロジェクトまで幅広い用途でデプロイ可能です。

API経由での利用コストは、100万文字あたり1ドル未満と非常に低く抑えられています。

Google Colabで手軽に利用でき、多言語に対応しています。

高品質で費用対効果の高い音声合成を求める開発者や企業に適しています。

互換性・特徴

  • 音声合成
  • Python
  • CLI
  • Web UI
  • 多言語対応
  • Apache License

基本情報

ライセンスapache-2.0
Likes6,108
Downloads9,535,335
Pipelinetext-to-speech
カテゴリTTS / 音声
アクティビティmid

HuggingFace: https://huggingface.co/hexgrad/Kokoro-82M