概要
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ ggmlランタイムを提供する統一された音声エンジンです。
OpenAI Whisper、NVIDIA Parakeet、Mistral Voxtralなど24種のASRバックエンドと5種のTTSエンジン、さらに多言語翻訳に対応しています。
Python依存関係が一切なく、単一のC++バイナリとして提供され、CLI、HTTPサーバー、C-ABI、Python/Rust/Dartなどの言語バインディングを介して利用可能です。
Python環境に依存せず、高速で多様な音声処理機能をアプリケーションに統合したい開発者や、オフラインでの高精度な音声認識・合成を求めるユーザーに最適です。
互換性・特徴
- CLI
- C++
- 多言語対応
- ASR
- TTS
- Pythonバインディング
基本情報
| ライセンス | MIT |
| Stars | 239 |
| Forks | 32 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- DockerコンテナがSIGINT (Ctrl+C) に応答せず、終了時にゾンビプロセスを生成する可能性 (更新: 2026-05-30 / Docker container fails to respond to SIGINT (Ctrl+C) and potentially creates zombie processes on termination)
- –vadフラグによるパフォーマンス低下: 複数回実行後、処理速度が70倍に低下 (更新: 2026-05-30 / Performance regression with –vad flag: processing speed drops 70x after multiple runs)
- 全ての backends v0.6.10 をテスト – 長いオーディオで6つが破損 (更新: 2026-05-30 / Tested all backends v0.6.10 – 6 broken on long audio)
- [提案] cohere-asr-ja は cohere-asr-ja-v0.1 に置き換えるべき (更新: 2026-05-30 / [suggestion] cohere-asr-ja should replaced over cohere-asr-ja-v0.1)
- llama-server のような –hf-repo をサポート (更新: 2026-05-30 / support –hf-repo like llama-server)
最新リリース: v0.6.11 (2026-05-26)
