Awesome-Process-Reward-Models

概要

「Awesome Process Reward Models」は、プロセス報酬モデル（PRM）に関する最新かつ包括的な研究論文やプロジェクトのコレクションです。

大規模言語モデル（LLM）の推論プロセスを評価・改善するPRM、特に数学的タスクに特化したモデルが多数掲載されています。

CoLD、SPARE、SP-PRM、SCAN、FreePRM、Q-RM、PathFinder-PRM、ThinkPRM、ActPRM、GenPRM、EDU-PRM、R-PRM、BiRM、EpicPRMなど、様々なアプローチが網羅されており、それぞれの研究成果がarXiv、GitHub、Hugging Faceのリンクと共に提供されます。

このリポジトリは、PRMの研究者、開発者、AI分野の学生など、LLMの内部推論メカニズムに関心を持つすべての人にとって、最新の研究動向を把握し、自身のプロジェクトに活かすための貴重な情報源となるでしょう。

互換性・特徴

研究リソース
論文集
Python

基本情報

Stars	168
Forks	4
カテゴリ	LLM
アクティビティ	mid

GitHub: https://github.com/RyanLiu112/Awesome-Process-Reward-Models