概要
ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた参照記憶QA(質問応答)のための初のベンチマークです。
このツールは、証拠に基づいた検索と回答、および複数の情報源からの推論を特徴としています。
AIの記憶、マルチモーダルQA、パーソナライズされたAIシステムを研究・開発する研究者や開発者が、長期記憶と根拠に基づいた応答に焦点を当てたシステムを評価・構築するのに役立ちます。
互換性・特徴
- Python
- CLI
- AI/ML
- Multimodal
- Research Benchmark
基本情報
| ライセンス | MIT |
| Stars | 46 |
| Forks | 2 |
| カテゴリ | LLM |
| アクティビティ | low |
