概要
JavisVerse/Awesome-AVIは、「大規模基盤モデルにおけるオーディオ・ビジュアル・インテリジェンス(AVI)」に関する包括的な調査論文と関連リソースをまとめたGitHubリポジトリです。
AVIとは、視覚と聴覚を通じて世界を共同で認識、生成、相互作用させる機械の能力を研究する分野であり、本リポジトリでは基盤モデルパラダイムにおけるAVIを体系的に扱っています。
「認識」「生成」「相互作用」の3つの柱を中心に、関連する手法、データセット、ベンチマークが整理されており、この分野の研究者や開発者が最新の研究動向を把握し、自身の研究や開発を進める上で有用な情報源となることを想定しています。
基本情報
| Stars | 51 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新のissue
- 📌 リポジトリメンテナンス / 論文・リソース更新の欠落 (更新: 2026-05-11 / 📌 Repository Maintenance / Missing Paper & Resource Updates)
- 📌 WeChatディスカッショングループ (更新: 2026-05-06 / 📌 WeChat Discussion Group)
