1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

taiwan-asr-toolkit

★ 2 NOASSERTION 更新: 2026-05-07 GitHubで見る →

概要

Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。

Qwen3-ASRとMediaTek Breeze-ASR-25を統合し、ホットワード注入、LLMによる文脈補正、話者分離、そして簡体字から繁体字台湾表記への自動変換(OpenCC s2twp)といった豊富な機能を備えています。

従来のWhisperモデルが台湾華語で抱えていた、簡体字出力、固有名詞の誤認識、長尺音声でのVAD失敗といった課題を解決し、RTX 5090で最大1554倍という驚異的なリアルタイム処理速度(RTF)を提供します。

台湾華語の音声を効率的かつ正確にテキスト化したい開発者や研究者に最適なソリューションです。

互換性・特徴

  • Python
  • GPU必須
  • CLI
  • Colab対応
  • 繁體中文対応

基本情報

ライセンスNOASSERTION
Stars2
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v0.5.5 — correctness + asymmetry pass (20 fixes, +37 tests) (2026-05-07)

GitHub: https://github.com/thc1006/taiwan-asr-toolkit