概要
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ ggmlランタイムを提供する統一された音声エンジンです。
OpenAI Whisper、NVIDIA Parakeet、Mistral Voxtralなど24種のASRバックエンドと5種のTTSエンジン、さらに多言語翻訳に対応しています。
Python依存関係が一切なく、単一のC++バイナリとして提供され、CLI、HTTPサーバー、C-ABI、Python/Rust/Dartなどの言語バインディングを介して利用可能です。
Python環境に依存せず、高速で多様な音声処理機能をアプリケーションに統合したい開発者や、オフラインでの高精度な音声認識・合成を求めるユーザーに最適です。
互換性・特徴
- CLI
- C++
- 多言語対応
- ASR
- TTS
- Pythonバインディング
基本情報
| ライセンス | MIT |
| Stars | 178 |
| Forks | 21 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- Parakeet日本語:チャンクと欠落単語 (更新: 2026-05-15 / Parakeet Japanese, chunks and missing words)
- ONNX-ASRの比較 (更新: 2026-05-13 / onnx-asr comparison)
- 回帰: Voxtral 4bが動作停止 (更新: 2026-05-12 / Regression: voxtral 4b stopped working)
- Parakeet TDT greedy decode: blank + duration-0がフレーム進行を強制し、NeMo/MLXリファレンスと乖離 (更新: 2026-05-12 / parakeet TDT greedy decode: blank + duration-0 forces frame advance, diverging from NeMo/MLX reference)
- indexttsの追加 (更新: 2026-05-12 / add indextts)
最新リリース: v0.6.6 (2026-05-12)