概要
Qwen2-Audio-7B-GGUFは、Nexa-SDK上でローカル実行できる音声・テキスト対応のマルチモーダルAIモデルです。
ASRを別途組み合わせなくても音声対話ができ、音声認識、翻訳、話者識別、雑音検出、音楽や環境音の分析まで幅広く扱えます。
複数のGGUF量子化版が用意され、端末のRAMに合わせて選択可能です。
音声AIを手元のPCやエッジ端末で動かしたい開発者、検証用途の研究者、ローカル完結を重視する利用者向けです。
互換性・特徴
- CLI
- Web UI
- ローカル実行
- GGUF
- 音声入力対応
基本情報
| ライセンス | apache-2.0 |
| Likes | 171 |
| Downloads | 3,225 |
| Pipeline | audio-text-to-text |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/NexaAI/Qwen2-Audio-7B-GGUF
