ATM-Bench

概要

ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた参照記憶QA（質問応答）のための初のベンチマークです。

このツールは、証拠に基づいた検索と回答、および複数の情報源からの推論を特徴としています。

AIの記憶、マルチモーダルQA、パーソナライズされたAIシステムを研究・開発する研究者や開発者が、長期記憶と根拠に基づいた応答に焦点を当てたシステムを評価・構築するのに役立ちます。

GitHub: https://github.com/JingbiaoMei/ATM-Bench