概要
autoresearch-qwenは、Qwen3-VL-4B-InstructモデルをDocumentVQAベンチマークで自律的に改善することを目的とした研究プラットフォームです。
このツールは、固定されたベンチマークと評価器を使用し、エージェントが`train.py`ファイルを繰り返し編集しながらトレーニングと評価のループを実行し、モデル性能の真の向上のみを保持する仕組みを提供します。
NVIDIA CUDAマルチGPU環境(mainブランチ)およびApple Silicon/MPS環境(mlxブランチ)の両方に対応しており、VLM(Vision-Language Model)のトレーニング研究者や、Qwenモデルの性能向上、自動研究システム構築に関心のある開発者にとって有用です。
再現性の高い実験環境を提供し、より良いトレーニング手法の探求を支援します。
互換性・特徴
- Python
- CLI
- GPU必須
- 研究ツール
- Qwenモデル
- VLM
基本情報
| ライセンス | MIT |
| Stars | 209 |
| Forks | 33 |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
最新リリース: autoresearch-qwen (2026-04-14)