llm-eval-layer

概要

llm-eval-layerは、LLMの出力品質を評価し、ハルシネーションを検出するための軽量なPython製決定エンジンです。

アトリビューション（根拠）、特異性（具体性）、関連性、コンテキスト品質をスコアリングすることで、主観的なLLMの出力を決定論的な「ACCEPT / REVIEW / REJECT」という判断に変換します。

RAG（検索拡張生成）システムにおいて、モデルの出力が信頼できるものか、あるいは再試行や再生成が必要かを判断し、その理由を明確に提示します。

これにより、LLMベースのアプリケーションのプロダクション運用における信頼性と堅牢性を向上させたい開発者や企業に最適です。

GitHub: https://github.com/Emmimal/llm-eval-layer