3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

llm-eval-layer

★ 10 ⑂ 1 MIT 更新: 2026-05-18 GitHubで見る →

概要

llm-eval-layerは、LLMの出力品質を評価し、ハルシネーションを検出するための軽量なPython製決定エンジンです。

アトリビューション(根拠)、特異性(具体性)、関連性、コンテキスト品質をスコアリングすることで、主観的なLLMの出力を決定論的な「ACCEPT / REVIEW / REJECT」という判断に変換します。

RAG(検索拡張生成)システムにおいて、モデルの出力が信頼できるものか、あるいは再試行や再生成が必要かを判断し、その理由を明確に提示します。

これにより、LLMベースのアプリケーションのプロダクション運用における信頼性と堅牢性を向上させたい開発者や企業に最適です。

互換性・特徴

  • Python
  • CLI
  • ハルシネーション検出
  • RAG
  • LLM評価
  • 意思決定エンジン

基本情報

ライセンスMIT
Stars10
Forks1
カテゴリLLM
アクティビティlow

GitHub: https://github.com/Emmimal/llm-eval-layer