概要
SR-Agentsは、大規模言語モデル(LLM)エージェントにおけるスキル検索拡張(SRA)の研究と評価を目的としたコミュニティリソースです。
エージェントが多数のスキルの中から関連性の高いものを効率的に見つけ出し、活用するための手法「スキル検索拡張」の概念を提唱し、その評価のための初のベンチマーク「SRA-Bench」を提供します。
SRA-Benchは、5,400のテストインスタンスと636の手動構築されたゴールドスキルを含む大規模なデータセットを擁し、スキルの検索、組み込み、最終タスク実行の全パイプラインを評価します。
また、「SR-Agents」ツールキットは、BM25やBGEなどの様々なスキル検索手法、LLM Directなどのスキル利用方法、そしてエンドツーエンドのCLIパイプラインを提供し、OpenAI互換のエンドポイントをサポートします。
これにより、LLMエージェントの能力向上を目指す研究者や開発者が、スキル管理と利用の課題を克服し、より高度なエージェントを構築するための基盤を築くことが期待されます。
互換性・特徴
- LLM
- 研究ツール
- Python
- CLI
- HuggingFace
- OpenAI互換
基本情報
| ライセンス | MIT |
| Stars | 81 |
| Forks | 11 |
| カテゴリ | LLM |
| アクティビティ | low |
最新のissue
- need-aware分析で使用されるSkill-Free Correct / Skill-Free Wrongサンプル分割のリクエスト (更新: 2026-06-02 / Request for Skill-Free Correct / Skill-Free Wrong sample splits used in need-aware analysis)
最新リリース: Initial release of SRA-Bench and SR-Agents (2026-05-13)
