概要
NaVILA → K1は、視覚言語モデル(VLM)であるNaVILAを活用し、Booster K1ヒューマノイドロボットを自然言語のナビゲーション目標に基づいてMuJoCoシミュレーション環境または実機で歩行させるツールです。
特徴として、ヘッドカメラからの視覚情報とNaVILAによる自然言語アクション生成、マルチステッププランナー、ヘディングアシスト、オープンループターンコントローラーによる精密な動作制御が挙げられます。
これにより、「赤い箱まで歩く」といった具体的な指示でロボットを自律的に動かすことが可能です。
想定されるユーザーは、ヒューマノイドロボットのナビゲーション技術、VLMとロボット制御の統合に関心のある研究者や開発者です。
互換性・特徴
- Python
- VLM
- ロボット制御
- MuJoCo
- 自然言語処理
- CLI
基本情報
| Stars | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
