Qwen2-Audio-7B-GGUF

概要

Qwen2-Audio-7B-GGUFは、Nexa-SDK上でローカル実行できる音声・テキスト対応のマルチモーダルAIモデルです。

ASRを別途組み合わせなくても音声対話ができ、音声認識、翻訳、話者識別、雑音検出、音楽や環境音の分析まで幅広く扱えます。

複数のGGUF量子化版が用意され、端末のRAMに合わせて選択可能です。

音声AIを手元のPCやエッジ端末で動かしたい開発者、検証用途の研究者、ローカル完結を重視する利用者向けです。

HuggingFace: https://huggingface.co/NexaAI/Qwen2-Audio-7B-GGUF