概要
PocketTTS.cppは、Kyutaiの軽量テキスト読み上げ(TTS)モデル「Pocket TTS」向けのC++推論ランタイムで、CPU上で完全に動作する最速のオープンソースTTSエンジンです。
ONNX Runtimeを介して、短い音声サンプルからのゼロショット音声クローンに対応し、Ryzen 7 3800Xで9.2倍のリアルタイム性能、初回オーディオまでわずか30msの低遅延を実現します。
単一のC++ファイルで実装されており、Pythonランタイムの依存性がなく、CLI、HTTPサーバー、共有ライブラリとして利用可能です。
パイプラインストリーミング、2層ディスクキャッシュ、INT8/FP32精度対応、内蔵プロファイラといった機能を持ち、OpenAI互換APIも提供するため、既存のOpenAI TTSクライアントからのドロップイン代替として使用できます。
高速かつ軽量な音声クローンTTSを、Python以外の環境や組み込みシステムで利用したい開発者に最適です。
互換性・特徴
- C++
- CLI
- HTTP Server
- 音声クローン
- ストリーミング
- OpenAI API互換
基本情報
| ライセンス | MIT |
| Stars | 32 |
| Forks | 8 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
最新のissue
- ロボットのような声の修正 (更新: 2026-04-30 / Fix for the robotic voice)
- [feature] ビルド済みファイルの提供 (更新: 2026-04-27 / [feature] Provide the built files)
- Kyutai LabsがPocket TTSモデルを更新しました (更新: 2026-04-19 / Kyutai Labs updated Pocket TTS models)