概要
このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。
VGGT(Video-based General-purpose Geometric Tracking)のポーズ推定結果をファクターグラフで最適化することで、既存のVGGT-SLAM 2.0が抱えるメモリ不足や複雑なセットアップ、24GB GPU要求といった課題を解決します。
ユーザーはシンプルなコマンド一つでビデオを入力するだけで、COLMAPやnerfstudio形式、PLY、.splat形式の3Dデータを直接出力できます。
特に、8GB以上のGPUで動作し、ポーズ精度とGaussian Splattingのレンダリング品質を大幅に向上させる点が特徴です。
3DGSパイプラインやnerfstudioを利用して、実用的な3Dモデルをビデオから高精度に生成したい研究者や開発者に最適です。
互換性・特徴
- Python
- CLI
- GPU必須
- COLMAP形式出力
- nerfstudio形式出力
- 3D再構築
基本情報
| Stars | 11 |
| Forks | 1 |
| カテゴリ | 3D / NeRF |
| アクティビティ | low |
GitHub: https://github.com/jashshah999/vggt-factor-refinement
