概要
Voskは、20以上の言語と方言(日本語含む)に対応したオフライン・オープンソースの音声認識ツールキットです。
50MBと小型ながら、連続的な大規模語彙の書き起こし、ストリーミングAPIによるゼロ遅延応答、語彙の再構成、話者識別といった機能を提供します。
Python、Java、Node.jsなど多様なプログラミング言語で利用でき、チャットボット、スマートホーム、バーチャルアシスタント、映画の字幕作成、講演やインタビューの書き起こしなど幅広い用途が想定されます。
Raspberry Piから大規模なサーバーまで、様々なデバイスで動作可能です。
互換性・特徴
- オフライン動作
- 多言語対応
- Python
- Java
- Node.js
- CLI
- Android
- iOS
- Raspberry Pi
基本情報
| ライセンス | Apache-2.0 |
| Stars | 14,777 |
| Forks | 1,722 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- ドイツ語の小規模モデルとウムラウト (更新: 2026-05-18 / German small model and the umlaut)
- vosk-model-en-us-0.22-compile には srilm が必要ですが、見つかりません。 (更新: 2026-05-14 / vosk-model-en-us-0.22-compile needs srilm, but it’s gone)
- 動的グラフを用いた大規模な米国英語モデルの構築 (更新: 2026-04-10 / build big US English model with dynamic graph)
最新リリース: v0.3.50 (2024-04-22)