3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#強化学習 (9 repos)
「強化学習」タグが付いたリポジトリ
← 全リポジトリ
LLM GitHub hands-on-modern-rl
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…
★ 3.0k ⑂ 199 NOASSERTION 2026-06-18
LLM GitHub AgentsMeetRL
AgentsMeetRLは、強化学習を活用してLLMエージェントを訓練するためのオープンソースリポジトリを厳選し、一覧化した…
★ 1.6k ⑂ 62 2026-05-26
動画生成 GitHub World-R1
World-R1は、テキストからビデオを生成する際に、3Dの幾何学的制約を強化学習で強化する新しいフレームワークです。…
★ 391 ⑂ 15 MIT 2026-06-03
マルチモーダル GitHub OpenSearch-VL
OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…
★ 231 ⑂ 25 Apache-2.0 2026-05-19
マルチモーダル GitHub EI-Beginner
このリポジトリは、OpenMOSS研究室が提供する具身知能および人型ロボット知能の入門実践チュートリアルです。ロボッ…
★ 155 ⑂ 7 2026-05-27
LLM GitHub konash
KONASHは、強化学習を用いて知識エージェントを訓練するツールです。文書コーパスから「検索する方法」を学習するエ…
★ 17 2026-03-23
マルチモーダル GitHub cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
画像生成 GitHub mini-pi0
mini-pi0は、ロボットの動作ポリシーをフローマッチングにより学習するためのコンパクトな研究コードベースです。特…
★ 4 2026-05-24
LLM GitHub awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15