概要
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Model)活用スタジオです。
HuggingFace LeRobotデータセットを取り込み、視覚、運動学、タスク成功、戦略、安全性という5つの専門VLM批評エージェントが各エピソードを評価します。
その結果を統合し、「維持」「修正」「却下」のいずれかの判断と、その理由、タイムスタンプ付きの証拠を生成します。
OpenAI互換のVLMエンドポイントやLiteLLMを介して、様々なVLMモデル(OpenAI, Anthropic, Geminiなど)をサポート。
ロボット工学チームが、データの品質を向上させ、ポリシーに誤った習慣が学習されるのを防ぐことを目的としています。
CLIから操作可能で、テストではGPU不要、Dockerによるセルフホストも可能です。
互換性・特徴
- Python
- CLI
- VLM非依存
- Docker対応
- LeRobotデータセット対応
- OpenAI互換API対応
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |