概要
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。
音声認識(ASR)、音声活動検出(VAD)、句読点復元、話者検証、多言語対応など、幅広い機能を提供します。
高精度かつ高効率なParaformer-largeモデルや、31言語に対応し低遅延リアルタイム文字起こしが可能なFun-ASR-Nano-2512といった、多数の事前学習済みモデルがModelScopeやHuggingFaceで公開されており、これらを活用して音声認識サービスを容易に構築できます。
学術研究から産業応用まで、音声認識モデルの開発とデプロイを支援し、エコシステムの発展を促進します。
主にPythonでの利用が想定され、大規模モデルではGPU利用が一般的です。
互換性・特徴
- Python
- CLI
- GPU必須
- 日本語対応
- 音声認識
- 事前学習モデル
基本情報
| ライセンス | MIT |
| Stars | 16,092 |
| Forks | 1,675 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- FunASR hotword 是否支持设置热词权重 (更新: 2026-05-15)
- FunASRNano is not registered (更新: 2026-05-15)
- FunAudioLLM/Fun-ASR-Nano-2512 AssertionError: FunASRNano is not registered (更新: 2026-05-13)
- 使用 fsmn_vad 的时候报错 (更新: 2026-05-11)
最新リリース: 0.3.0 (2023-03-16)
