概要
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。
Qwen3-ASRとMediaTek Breeze-ASR-25を統合し、ホットワード注入、LLMによる文脈補正、話者分離、そして簡体字から繁体字台湾表記への自動変換(OpenCC s2twp)といった豊富な機能を備えています。
従来のWhisperモデルが台湾華語で抱えていた、簡体字出力、固有名詞の誤認識、長尺音声でのVAD失敗といった課題を解決し、RTX 5090で最大1554倍という驚異的なリアルタイム処理速度(RTF)を提供します。
台湾華語の音声を効率的かつ正確にテキスト化したい開発者や研究者に最適なソリューションです。
互換性・特徴
- Python
- GPU必須
- CLI
- Colab対応
- 繁體中文対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 2 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
最新リリース: v0.5.5 — correctness + asymmetry pass (20 fixes, +37 tests) (2026-05-07)