RetrieveVGGT

概要

RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。

VGGTにおけるコンテキスト構築を検索問題として再定義し、過去のフレームから関連性の高いものをクエリ・キー類似性に基づいて動的に取得することで、シーケンス長に依存しない一定のメモリコストで高精度な処理を実現します。

セグメントサンプリングとポーズ認識空間メモリにより、情報多様性とスケーラブルな長期メモリ管理を両立。

既存手法と比較して最大20%の性能向上を達成しており、リアルタイム3D再構築、ビデオ深度推定、カメラポーズ推定を行う研究者や開発者に最適です。

GitHub: https://github.com/zzctmd/RetrieveVGGT