CaptionEvalKit-for-VLMs

概要

CaptionEvalKit-for-VLMsは、VLM（Visual Language Model）向け画像キャプション評価を再現性高く、オールインワンで提供するツールキットです。

キャプションメトリクスの開発者向けには、Kendall’s tauの再現を容易にし、メトリクス評価と結果の再現を単一コマンドで可能にします。

VLM開発者向けには、個々のメトリクスごとに異なる依存環境を準備する手間を省き、確立された包括的なキャプションメトリクスセットを使用してVLM生成キャプションを評価できます。

LLMフリー、LLM-as-a-Judge、および従来のキャプションメトリクス（BLEU, ROUGE-L, METEOR, CIDEr, SPICE, JaSPICEなど）をサポートし、多様なベンチマークに対応しています。

GitHub: https://github.com/YuigaWada/CaptionEvalKit-for-VLMs