1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

music-flamingo-hf

★ 95 other 更新: 2026-04-04 HFで見る →

概要

Music Flamingoは、楽曲やインストゥルメンタル音源を対象に、ジャンル・テンポ・キー・楽器構成・雰囲気・歌詞や文化的背景まで含めて解析・説明できるNVIDIAの大規模音声言語モデルです。

Hugging Face Transformersから利用でき、音声+テキスト指示、音声のみ、テキストのみ、バッチ推論や学習にも対応します。

音楽理解や音楽QA、研究用途の評価・実験を行いたい研究者や開発者向けで、商用利用ではなく非商用研究向けに公開されています。

互換性・特徴

  • Python
  • Transformers
  • CLI
  • 音声入力対応
  • GPU推奨
  • 研究用途限定

基本情報

ライセンスother
Likes95
Downloads9,579
Pipelineaudio-text-to-text
カテゴリマルチモーダル
アクティビティlow

HuggingFace: https://huggingface.co/nvidia/music-flamingo-hf