概要
LabVLAは、Qwen3-VL-4B-Instructビジョン言語モデルを、DiTフローマッチングアクションエキスパートと独自のπ0.5レシピ(高速アクション予測事前学習、知識分離フローマッチング事後学習、タスクファインチューニング)を組み合わせることで、科学研究室向けのリアルタイムロボットコントローラーに変革するツールです。
大規模なVLAモデルを効率的かつ高速に学習・ファインチューニングできる点が特徴で、特に科学実験の自動化やロボット制御、VLAモデルの研究開発を行う研究者やエンジニアを想定しています。
互換性・特徴
- Python
- GPU必須
- CLI
- 大規模言語モデル
- ロボット制御
- 研究開発
基本情報
| ライセンス | MIT |
| Stars | 72 |
| Forks | 4 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新のissue
- fasttokenで学習されたVLMは、通常のVLMよりも優れているか? (更新: 2026-06-15 / does fasttoken trained VLM better than vanilla vlm?)
- Hugging FaceでLabEmbodied-Dataをリリース (更新: 2026-06-13 / Release LabEmbodied-Data on Hugging Face)
GitHub: https://github.com/zjunlp/LabVLA
