3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

FunASR

★ 19.0k ⑂ 1,912 MIT 更新: 2026-07-07 GitHubで見る →

#CLI #GPU必須 #Python #事前学習モデル #日本語対応 #音声認識

概要

FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。

音声認識（ASR）、音声活動検出（VAD）、句読点復元、話者検証、多言語対応など、幅広い機能を提供します。

高精度かつ高効率なParaformer-largeモデルや、31言語に対応し低遅延リアルタイム文字起こしが可能なFun-ASR-Nano-2512といった、多数の事前学習済みモデルがModelScopeやHuggingFaceで公開されており、これらを活用して音声認識サービスを容易に構築できます。

学術研究から産業応用まで、音声認識モデルの開発とデプロイを支援し、エコシステムの発展を促進します。

主にPythonでの利用が想定され、大規模モデルではGPU利用が一般的です。

互換性・特徴

Python
CLI
GPU必須
日本語対応
音声認識
事前学習モデル

基本情報

ライセンス	MIT
Stars	19,005
Forks	1,912
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

npu 运行 FunAudioLLM/Fun-ASR-Nano-2512 (更新: 2026-07-07)
即時轉錄一段時間後會自行斷線 (更新: 2026-07-07)
关于onnx并发问题 (更新: 2026-07-07)
关于serve_realtime_ws.py服务的客户端测试达不到实时 (更新: 2026-07-07)
关于Benchmark的RTF值 (更新: 2026-07-07)

最新リリース: FunASR llama.cpp runtime runtime-llamacpp-v0.1.4 (2026-06-29)

GitHub: https://github.com/modelscope/FunASR

← 全リポジトリ一覧へ