wav2vec2-large-xlsr-53-russian

概要

このリポジトリは、Jonatas Grosman氏が開発したロシア語音声認識用のWav2Vec2-large-xlsr-53モデルを提供します。

Hugging Faceの事前学習済みモデルをCommon Voice 6.1およびCSS10のロシア語データでファインチューニングしており、16kHzでサンプリングされた音声入力に対応しています。

HuggingSoundまたはHugging Face Transformersライブラリを使ってPythonで簡単に利用でき、ロシア語の音声データを高精度でテキストに変換することが可能です。

ロシア語の音声認識機能をアプリケーションに組み込みたい開発者や研究者に適しています。

ライセンス	apache-2.0
Likes	75
Downloads	3,463,019
Pipeline	automatic-speech-recognition
カテゴリ	ASR / 音声認識
アクティビティ	low

HuggingFace: https://huggingface.co/jonatasgrosman/wav2vec2-large-xlsr-53-russian