概要
この「alpamayo-trace」は、NVIDIA Alpamayo R1(Vision-Language-Actionモデル)とQwen2.5-VL(Vision-Languageモデル)という2種類のAIモデルが、同一のドライブレコーダー映像に対してどのように異なる認識や判断を下すかを並行して比較・可視化するウェブベースのビューアです。
両モデルが示す「行動は正しいがラベルが不安定」なVLAの挙動や、「明確な障害物を流暢に否定する」VLMの振る舞いといった、異なる種類の失敗モードを詳細に分析できます。
主に自動運転AIや大規模言語モデルの研究者、開発者、AIの評価に関心のあるユーザーが、モデルの長所と短所、そしてそれぞれの限界を深く理解するために役立ちます。
互換性・特徴
- Web UI
- Python
- CLI
- 比較ツール
- 研究ツール
- GPU必須
基本情報
| ライセンス | Apache-2.0 |
| Stars | 2 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
