概要
rust-whisper-diarizationは、純粋なRustで実装されたストリーミング音声認識と話者分離のライブラリです。
whisper.cppとsherpa-onnxを基盤とし、Pythonや外部プロセスに依存せず、低遅延(500ms以下)でのリアルタイム処理を実現します。
音声チャンクを効率的に処理し、安定した話者IDを付与して発話イベントを出力するため、複数の話者が混在する音声の文字起こしに最適です。
macOS(CoreML)とLinux(ONNX Runtime)で動作するクロスプラットフォーム対応で、リアルタイム音声処理や高精度な話者分離機能をRustアプリケーションに組み込みたい開発者やプロジェクトに強く推奨されます。
互換性・特徴
- Rust
- ストリーミング
- 話者分離
- クロスプラットフォーム
- Whisper
- ONNX
基本情報
| Stars | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |