1,538 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

PocketTTS.cpp

★ 32 ⑂ 8 MIT 更新: 2026-03-29 GitHubで見る →

概要

PocketTTS.cppは、Kyutaiの軽量テキスト読み上げ(TTS)モデル「Pocket TTS」向けのC++推論ランタイムで、CPU上で完全に動作する最速のオープンソースTTSエンジンです。

ONNX Runtimeを介して、短い音声サンプルからのゼロショット音声クローンに対応し、Ryzen 7 3800Xで9.2倍のリアルタイム性能、初回オーディオまでわずか30msの低遅延を実現します。

単一のC++ファイルで実装されており、Pythonランタイムの依存性がなく、CLI、HTTPサーバー、共有ライブラリとして利用可能です。

パイプラインストリーミング、2層ディスクキャッシュ、INT8/FP32精度対応、内蔵プロファイラといった機能を持ち、OpenAI互換APIも提供するため、既存のOpenAI TTSクライアントからのドロップイン代替として使用できます。

高速かつ軽量な音声クローンTTSを、Python以外の環境や組み込みシステムで利用したい開発者に最適です。

互換性・特徴

  • C++
  • CLI
  • HTTP Server
  • 音声クローン
  • ストリーミング
  • OpenAI API互換

基本情報

ライセンスMIT
Stars32
Forks8
カテゴリTTS / 音声
アクティビティlow

最新のissue

GitHub: https://github.com/VolgaGerm/PocketTTS.cpp