1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ultravox-v0_5-llama-3_2-1b

★ 77 mit 更新: 2026-03-11 HFで見る →

概要

Ultravoxは、Llama 3.2 1B InstructとWhisper large v3 turboを組み合わせた音声対応マルチモーダルLLMです。

音声とテキストを同時に入力でき、音声理解、対話型ボイスエージェント、音声翻訳、話し言葉の分析などに使えます。

Transformersのpipeline経由でPythonから利用でき、既存LLMに“聞く力”を追加したい開発者や、軽量寄りの音声AIを試したい研究・実装ユーザー向けのモデルです。

互換性・特徴

  • Transformers
  • Python
  • 音声入力対応
  • マルチモーダル
  • MITライセンス

基本情報

ライセンスmit
Likes77
Downloads848,261
Pipelineaudio-text-to-text
カテゴリマルチモーダル
アクティビティlow

HuggingFace: https://huggingface.co/fixie-ai/ultravox-v0_5-llama-3_2-1b