概要
MLX-VLMは、Apple Silicon Mac上でMLXを利用してVision Language Models(VLM)および音声・動画対応のOmni Modelsの推論とファインチューニングを行うためのパッケージです。
CLI、GradioによるチャットUI、Pythonスクリプト、FastAPIサーバーを通じて利用でき、推論の高速化と効率化のための様々な機能(投機的デコーディング、バッチ処理、KVキャッシュ量子化など)を提供します。
VLM/OmniモデルをMacで手軽に利用・開発したい研究者や開発者、AI愛好家を対象としています。
互換性・特徴
- Mac対応
- Python
- CLI
- Web UI
- GPU必須
- 多モーダル
基本情報
| ライセンス | MIT |
| Stars | 5,066 |
| Forks | 597 |
| カテゴリ | マルチモーダル |
| アクティビティ | high |
最新のissue
- DiffusionGemmaの繰り返しリクエストでRSSリーク/レイテンシ発生 (MLXアクティブメモリは横ばい) (更新: 2026-06-17 / DiffusionGemma repeated requests leak RSS / latency while MLX active memory stays flat)
最新リリース: v0.6.3 (2026-06-10)
