概要
EnterpriseRAG-Benchは、企業の社内文書に特化したRAGシステム評価用のデータセットおよびベンチマークを提供します。
50万点以上の文書と500の質問から構成され、Slack、Gmail、GitHubなど実際の企業データソースを模倣しています。
RAGシステムのベンチマークや、現実の企業データを用いたエージェントのファインチューニングを検討しているチームが主な利用者です。
また、異なる業界や規模の企業向けに類似のデータセットを生成するコードも提供されています。
互換性・特徴
- データセット
- ベンチマーク
- RAG対応
- Python
基本情報
| ライセンス | MIT |
| Stars | 308 |
| Forks | 28 |
| カテゴリ | LLM |
| アクティビティ | mid |
最新のissue
- LettaとHindsightを追加する (更新: 2026-05-09 / Add Letta and Hindsight)
- LLM WikiまたはMemPalaceを追加する (更新: 2026-05-09 / Add LLM Wiki and/or MemPalace)
- Hermes AgentとNanoCatを追加する (更新: 2026-05-08 / Add Hermes Agent and NanoCat)
最新リリース: Dataset v1.0.0 (2026-03-29)