概要
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。
従来の理論先行型ではなく、コードと直感的な訓練現象から学び、強化学習の基本的な概念からLLM後訓練、DPO/GRPO、RLVR、マルチモーダルなAgenticシステムといった最先端のAI技術までを網羅しています。
実践を重視し、コードのデバッグ能力や可読性を高める設計原則に基づいています。
機械学習エンジニア、LLM実務者、Agentic RLの構築者、研究者、学生など、強化学習をシステム構築を通じて理解したいPythonおよびPyTorch経験者向けに設計されています。
互換性・特徴
- Python
- PyTorch
- LLM
- 強化学習
- オンラインコース
- オープンソース
基本情報
| ライセンス | NOASSERTION |
| Stars | 1,145 |
| Forks | 57 |
| カテゴリ | AIエージェント |
| アクティビティ | high |
最新のissue
- なぜ rlhf から dpo では4つのモデルが2つのモデルに削減されたのか (更新: 2026-05-07 / 【提问】为什么 rlhf 到 dpo 是从四个模型砍到两个模型了)
- 書籍とウェブサイトの英語版を提供できますか (更新: 2026-05-07 / Can we get a English version of the book and website)
最新リリース: Hands-On Modern RL Open Textbook v0.1.4 (2026-05-05)
