概要
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。
本ツールは、RAGの引用検証を統計的な多重検定問題として再構築し、各クレームの真偽に対して適合p値を割り当てます。
ユーザーが指定する偽発見率(FDR)レベルに基づいて、Benjamini-Hochberg (BH) またはBenjamini-Yekutieli (BY) 選択を適用することで、統計的に有意な証拠に裏付けられたクレームのみを厳密に受け入れます。
これにより、RAGシステムにおける誤情報の流布を効果的に抑制します。
Python 3.9以降に対応し、CLIベースで動作し、有限サンプル、分布によらないFDR制御、適応型BH/BY選択、および複数のベースライン比較機能を提供します。
RAGシステムの信頼性と正確性を向上させたい研究者や開発者、特に引用の検証プロセスに統計的厳密さを求めるユーザーに最適なツールです。
互換性・特徴
- Python
- CLI
- RAG
- 自然言語処理
- 機械学習
基本情報
| ライセンス | MIT |
| Stars | 1 |
| カテゴリ | LLM |
| アクティビティ | low |
