概要
CosyVoice.cppは、CosyVoice3のPython推論パイプラインをC/C++およびGGMLに非公式に移植したプロジェクトです。
これにより、オリジナルプロジェクトとは独立して、高速かつ効率的な音声合成推論をC/C++環境で実現します。
本プロジェクトは、コマンドラインインターフェース(CLI)での利用、OpenAI Speech API互換のサーバー機能、およびGGUFモデルの量子化ツールを提供します。
Windows、Linux、macOSのクロスプラットフォームに対応し、CPUだけでなくCUDA、Metal、SYCLといった多様なバックエンドでの動作をサポートしています。
想定ユーザーは、CosyVoiceモデルを用いた高速な音声合成をC/C++アプリケーションに組み込みたい開発者や、OpenAI Speech API互換の音声合成サービスを構築したい方々です。
メモリ使用量の削減や並列リクエスト処理などの機能も備えています。
互換性・特徴
- CLI
- C++
- API
- クロスプラットフォーム
- GPU対応
- CPU対応
基本情報
| ライセンス | MIT |
| Stars | 27 |
| Forks | 8 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
最新のissue
- VulkanとCUDAでの実行が困難な場合、既存ソリューションによる混合推論を検討 (更新: 2026-04-26 / 如果 vulkan 和 cuda 运行难以解决,可以考虑混合推理,用现成方案)
- ストリーミング音声生成のサポート (更新: 2026-04-25 / streaming audio generation support)
最新リリース: b8b69f7 (2026-05-31)
