262 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Voxtral-Small-24B-2507

★ 493 apache-2.0 更新: 2025-12-20 GitHubで見る →

概要

Voxtral Small 1.0(24B)は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。

音声の文字起こし、翻訳、音声内容の要約や質問応答を1つでこなせる点が特徴で、多言語自動判定や音声からの関数呼び出しにも対応します。

vLLMまたはTransformers経由で利用でき、音声AIを自前運用したい開発者、研究者、音声対応アプリや業務自動化を構築する技術者向けのモデルです。

互換性・特徴

  • vLLM対応
  • Transformers対応
  • GPU必須
  • 多言語対応
  • Python
  • 音声入力対応

基本情報

ライセンスapache-2.0
Likes493
Downloads47,627
Pipelineaudio-text-to-text
カテゴリASR / 音声認識
アクティビティmid

HuggingFace: https://huggingface.co/mistralai/Voxtral-Small-24B-2507