概要
Voxtral Small 1.0(24B)は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。
音声の文字起こし、翻訳、音声内容の要約や質問応答を1つでこなせる点が特徴で、多言語自動判定や音声からの関数呼び出しにも対応します。
vLLMまたはTransformers経由で利用でき、音声AIを自前運用したい開発者、研究者、音声対応アプリや業務自動化を構築する技術者向けのモデルです。
互換性・特徴
- vLLM対応
- Transformers対応
- GPU必須
- 多言語対応
- Python
- 音声入力対応
基本情報
| ライセンス | apache-2.0 |
| Likes | 493 |
| Downloads | 47,627 |
| Pipeline | audio-text-to-text |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/mistralai/Voxtral-Small-24B-2507
