概要
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えたPython製音声認識ライブラリです。
アシスタント、ディクテーションツール、ブラウザストリーミングサーバー、プロトタイプなど、少量のコードで音声をテキストに変換したいアプリケーション向けに設計されています。
デフォルトで`faster_whisper`を使用し、`kroko_onnx`などの他のエンジンもサポートしており、効率的かつ低遅延での音声認識を実現します。
互換性・特徴
- Python
- CLI
- リアルタイム処理
- 音声認識
- VAD
- ウェイクワード
基本情報
| ライセンス | MIT |
| Stars | 9,883 |
| Forks | 836 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- リアルタイム翻訳機能の実装について:実現可能性の検討 (更新: 2026-05-31 / Realtime translation possible?)
- 新機能:代替STTエンジンとしてFunASR/SenseVoiceを追加 (更新: 2026-05-31 / Feature: Add FunASR/SenseVoice as alternative STT engine)
- Python 3.13+でのopenwakeword silent APIの互換性問題とドキュメントの課題 (更新: 2026-05-28 / openwakeword silent API incompatibility on Python 3.13+ and documentation issues)
- モデルと互換性の問題 (更新: 2026-05-22 / Model and compatibility issues)
- 異常終了エラー (更新: 2026-05-20 / Aborted Error)
最新リリース: v1.0.2 (2026-05-31)
