概要
Qwen3-ASR向けのマルチテナントストリーミング自動音声認識(ASR)サーバーです。
オリジナルの`qwen-asr-demo-streaming` Flaskデモの代替として設計されており、セッションごとの分離、LIDメタデータサニタイズ、SDKのローリングデコードといった機能を備え、本番環境での利用を想定しています。
vLLMのAsyncLLMEngineを利用し、高い並行性と効率性を実現します。
NVIDIA GPUとCUDA 12.8+が必須で、Docker Composeで簡単にデプロイできます。
Pythonで実装されており、Qwen3-ASRを用いたストリーミングASRサービスを開発・運用したいユーザーに適しています。
互換性・特徴
- Python
- GPU必須
- Web API
- Docker
- マルチテナント対応
- ASR
基本情報
| ライセンス | Apache-2.0 |
| Stars | 8 |
| Forks | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |