概要
VeRL-Omniは、拡散モデルやオムニモダリティモデルといったマルチモーダル生成モデルに特化した強化学習(RL)トレーニングフレームワークです。
既存のverlを基盤とし、マルチモーダル生成RLの訓練において、特にモデル構造、I/Oパターン、計算特性、実行時のボトルネックといった側面に対応するために設計されています。
vLLM-Omniによる最適化されたロールアウト、柔軟かつ非同期なマルチ報酬提供、モジュール式のトレーニングバックエンド、安定性向上ツール(ロールアウト補正など)が特徴で、高いトレーニングスループットを実現します。
画像、動画、音声生成のための拡散モデル、統一マルチモーダル理解・生成モデル、テキスト・画像・音声・動画を統合的に扱うオムニモダリティモデルのRL後トレーニングを行う研究者や開発者を主な対象としています。
互換性・特徴
- Python
- RLフレームワーク
- GPU必須
- 分散トレーニング
- マルチモーダル
- 拡散モデル
基本情報
| ライセンス | Apache-2.0 |
| Stars | 344 |
| Forks | 50 |
| カテゴリ | 画像生成 |
| アクティビティ | mid |
最新のissue
- DPO/GRPO/OPD トレーニング機能のサポート (更新: 2026-06-11 / DPO/GRPO/OPD 训练功能支持)
