概要
Qwen2-Audio-7B-Instructは、音声入力を受けて会話や解析を行えるQwen系の音声対応大規模言語モデルです。
テキストなしの音声チャットと、音声に対して質問や指示を添える音声解析の2モードに対応し、発話内容の理解、音の種類の判定、応答生成を行えます。
Hugging Face Transformers経由でPythonから利用でき、複数会話のバッチ推論例も用意されているため、音声AIアプリや研究用途の開発者向けです。
互換性・特徴
- Python
- Transformers
- 音声入力対応
- GPU推奨
- バッチ推論対応
- 英語対応
基本情報
| ライセンス | apache-2.0 |
| Likes | 530 |
| Downloads | 428,065 |
| Pipeline | audio-text-to-text |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/Qwen/Qwen2-Audio-7B-Instruct