1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Qwen2-Audio-7B-Instruct

★ 530 apache-2.0 更新: 2025-01-12 HFで見る →

概要

Qwen2-Audio-7B-Instructは、音声入力を受けて会話や解析を行えるQwen系の音声対応大規模言語モデルです。

テキストなしの音声チャットと、音声に対して質問や指示を添える音声解析の2モードに対応し、発話内容の理解、音の種類の判定、応答生成を行えます。

Hugging Face Transformers経由でPythonから利用でき、複数会話のバッチ推論例も用意されているため、音声AIアプリや研究用途の開発者向けです。

互換性・特徴

  • Python
  • Transformers
  • 音声入力対応
  • GPU推奨
  • バッチ推論対応
  • 英語対応

基本情報

ライセンスapache-2.0
Likes530
Downloads428,065
Pipelineaudio-text-to-text
カテゴリマルチモーダル
アクティビティmid

HuggingFace: https://huggingface.co/Qwen/Qwen2-Audio-7B-Instruct