3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#強化学習 (9 repos)

「強化学習」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

hands-on-modern-rl

このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…

#LLM #Python #PyTorch

★ 3.0k ⑂ 199 NOASSERTION 2026-06-18

LLM

GitHub

AgentsMeetRL

AgentsMeetRLは、強化学習を活用してLLMエージェントを訓練するためのオープンソースリポジトリを厳選し、一覧化した…

#LLM #Web UI #エージェント

★ 1.6k ⑂ 62 2026-05-26

動画生成

GitHub

World-R1

World-R1は、テキストからビデオを生成する際に、3Dの幾何学的制約を強化学習で強化する新しいフレームワークです。…

#GPU必須 #Python #強化学習

★ 391 ⑂ 15 MIT 2026-06-03

マルチモーダル

GitHub

OpenSearch-VL

OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…

#CLI #Python #マルチモーダル

★ 231 ⑂ 25 Apache-2.0 2026-05-19

マルチモーダル

GitHub

EI-Beginner

このリポジトリは、OpenMOSS研究室が提供する具身知能および人型ロボット知能の入門実践チュートリアルです。ロボッ…

#LLM/VLM対応 #Python #シミュレーション

★ 155 ⑂ 7 2026-05-27

LLM

GitHub

konash

KONASHは、強化学習を用いて知識エージェントを訓練するツールです。文書コーパスから「検索する方法」を学習するエ…

#AI #CLI #GPU

★ 17 2026-03-23

マルチモーダル

GitHub

cppo

CPPO（Contrastive Perception Policy Optimization）は、視覚言語モデル（VLM）エージェントのファインチューニング…

#Hugging Face #Python #VLM

★ 9 2026-05-28

画像生成

GitHub

mini-pi0

mini-pi0は、ロボットの動作ポリシーをフローマッチングにより学習するためのコンパクトな研究コードベースです。特…

#CLI #GPU必須 #Python

★ 4 2026-05-24

LLM

GitHub

awesome-opd

「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…

#LLM #Python #ディスティレーション

★ 1 2026-05-15