概要
wav2letter++は、Facebook AI Researchが開発した自動音声認識(ASR)ツールキットです。
現在はFlashlightフレームワークのASRアプリケーションに統合されており、今後の開発もFlashlight内で行われます。
本ツールキットは、スケーリングオンライン音声認識、エンドツーエンドASR、自己学習、語彙なし音声認識、シーケンス・トゥ・シーケンス音声認識などの最先端の研究論文を再現するためのレシピと事前学習済みモデルを提供します。
主なターゲットユーザーは、音声認識技術の研究開発に携わる研究者やエンジニアです。
Flashlight 0.3ブランチのビルドが必須となります。
互換性・特徴
- ASR
- CLI
- Python
- C++
- Flashlight
- 研究ツール
基本情報
| ライセンス | NOASSERTION |
| Stars | 6,444 |
| Forks | 992 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- 無効な正規化Non-overlap LMコーパスリンク (更新: 2025-10-30 / Invalid normalized Non-overlap LM corpus link)
- MLSモデルのパラメータ数とpolish dev損失曲線の変動 (更新: 2025-02-15 / the number of MLS model parameters and polish dev loss curve fluctuations)
- 事前学習済みwav2letter重み (更新: 2024-03-20 / Pretrained wav2letter weights)
最新リリース: v0.2 (pre Flashlight-consolidation) (2020-12-28)
