3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

wav2letter

★ 6.4k ⑂ 992 NOASSERTION 更新: 2026-01-12 GitHubで見る →

概要

wav2letter++は、Facebook AI Researchが開発した自動音声認識(ASR)ツールキットです。

現在はFlashlightフレームワークのASRアプリケーションに統合されており、今後の開発もFlashlight内で行われます。

本ツールキットは、スケーリングオンライン音声認識、エンドツーエンドASR、自己学習、語彙なし音声認識、シーケンス・トゥ・シーケンス音声認識などの最先端の研究論文を再現するためのレシピと事前学習済みモデルを提供します。

主なターゲットユーザーは、音声認識技術の研究開発に携わる研究者やエンジニアです。

Flashlight 0.3ブランチのビルドが必須となります。

互換性・特徴

  • ASR
  • CLI
  • Python
  • C++
  • Flashlight
  • 研究ツール

基本情報

ライセンスNOASSERTION
Stars6,444
Forks992
カテゴリASR / 音声認識
アクティビティmid

最新のissue

最新リリース: v0.2 (pre Flashlight-consolidation) (2020-12-28)

GitHub: https://github.com/flashlight/wav2letter