概要
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ ggmlランタイムを提供する統一された音声エンジンです。
OpenAI Whisper、NVIDIA Parakeet、Mistral Voxtralなど24種のASRバックエンドと5種のTTSエンジン、さらに多言語翻訳に対応しています。
Python依存関係が一切なく、単一のC++バイナリとして提供され、CLI、HTTPサーバー、C-ABI、Python/Rust/Dartなどの言語バインディングを介して利用可能です。
Python環境に依存せず、高速で多様な音声処理機能をアプリケーションに統合したい開発者や、オフラインでの高精度な音声認識・合成を求めるユーザーに最適です。
互換性・特徴
- CLI
- C++
- 多言語対応
- ASR
- TTS
- Pythonバインディング
基本情報
| ライセンス | MIT |
| Stars | 356 |
| Forks | 55 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- TADA TTS: talker decodes greedily with no repetition penalty (diverges from the HumeAI reference) (更新: 2026-06-28)
- crispasr-sys: cmake build runs serially — pass –parallel to `cmake –build` (更新: 2026-06-28)
- Speakers Profiles / Voiceprints (更新: 2026-06-28)
- FR: TADA: ability to set the voice at inference time (更新: 2026-06-28)
- May I ask whether this new model can be supported? (更新: 2026-06-28)
最新リリース: v0.8.5 — TADA multilingual TTS + ReazonSpeech JA ASR + CosyVoice3 GPU + C# bindings (2026-06-27)
