1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

audio-flamingo-next-hf

★ 48 other 更新: 2026-04-15 HFで見る →

概要

Audio Flamingo Nextは、音声・環境音・音楽をまとめて理解できるNVIDIAの大規模音声言語モデルです。

音声Q&A、文字起こし、翻訳、話者分離付きASR、長時間音声の要約やキャプション生成に対応し、最長30分の長文音声やタイムスタンプ付き指示も扱えます。

Transformers経由で使える研究向けの指示追従モデルで、音声理解を試したい研究者や開発者に向いています。

互換性・特徴

  • Python
  • Transformers
  • CLI
  • GPU推奨
  • 音声処理
  • 長時間音声対応

基本情報

ライセンスother
Likes48
Downloads7,796
Pipelineaudio-text-to-text
カテゴリマルチモーダル
アクティビティlow

HuggingFace: https://huggingface.co/nvidia/audio-flamingo-next-hf