1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

FunASR

★ 16.1k ⑂ 1,675 MIT 更新: 2026-03-17 GitHubで見る →

概要

FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。

音声認識(ASR)、音声活動検出(VAD)、句読点復元、話者検証、多言語対応など、幅広い機能を提供します。

高精度かつ高効率なParaformer-largeモデルや、31言語に対応し低遅延リアルタイム文字起こしが可能なFun-ASR-Nano-2512といった、多数の事前学習済みモデルがModelScopeやHuggingFaceで公開されており、これらを活用して音声認識サービスを容易に構築できます。

学術研究から産業応用まで、音声認識モデルの開発とデプロイを支援し、エコシステムの発展を促進します。

主にPythonでの利用が想定され、大規模モデルではGPU利用が一般的です。

互換性・特徴

  • Python
  • CLI
  • GPU必須
  • 日本語対応
  • 音声認識
  • 事前学習モデル

基本情報

ライセンスMIT
Stars16,092
Forks1,675
カテゴリASR / 音声認識
アクティビティmid

最新のissue

最新リリース: 0.3.0 (2023-03-16)

GitHub: https://github.com/modelscope/FunASR