autoresearch-qwen

概要

autoresearch-qwenは、Qwen3-VL-4B-InstructモデルをDocumentVQAベンチマークで自律的に改善することを目的とした研究プラットフォームです。

このツールは、固定されたベンチマークと評価器を使用し、エージェントが`train.py`ファイルを繰り返し編集しながらトレーニングと評価のループを実行し、モデル性能の真の向上のみを保持する仕組みを提供します。

NVIDIA CUDAマルチGPU環境（mainブランチ）およびApple Silicon/MPS環境（mlxブランチ）の両方に対応しており、VLM（Vision-Language Model）のトレーニング研究者や、Qwenモデルの性能向上、自動研究システム構築に関心のある開発者にとって有用です。

再現性の高い実験環境を提供し、より良いトレーニング手法の探求を支援します。

互換性・特徴

Python
CLI
GPU必須
研究ツール
Qwenモデル
VLM

基本情報

ライセンス	MIT
Stars	211
Forks	33
カテゴリ	マルチモーダル
アクティビティ	mid

最新リリース: autoresearch-qwen (2026-04-14)

GitHub: https://github.com/wadeKeith/autoresearch-qwen