1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Qwen2-Audio-7B-GGUF

★ 171 apache-2.0 更新: 2024-11-25 HFで見る →

概要

Qwen2-Audio-7B-GGUFは、Nexa-SDK上でローカル実行できる音声・テキスト対応のマルチモーダルAIモデルです。

ASRを別途組み合わせなくても音声対話ができ、音声認識、翻訳、話者識別、雑音検出、音楽や環境音の分析まで幅広く扱えます。

複数のGGUF量子化版が用意され、端末のRAMに合わせて選択可能です。

音声AIを手元のPCやエッジ端末で動かしたい開発者、検証用途の研究者、ローカル完結を重視する利用者向けです。

互換性・特徴

  • CLI
  • Web UI
  • ローカル実行
  • GGUF
  • 音声入力対応

基本情報

ライセンスapache-2.0
Likes171
Downloads3,225
Pipelineaudio-text-to-text
カテゴリマルチモーダル
アクティビティmid

HuggingFace: https://huggingface.co/NexaAI/Qwen2-Audio-7B-GGUF