概要
SceneTokは、3Dシーンデータを圧縮された、非構造化かつ拡散可能な1Dトークン表現へと変換するシーンオートエンコーダーです。
VA-VAE画像コンプレッサーとパーシーバーモジュールを組み合わせることで、視点セットから独自のトークンを生成し、これを基に新しい視点からのレンダリングや、限られた画像情報からの3Dシーン生成(SceneGen)を実現します。
主に、3Dシーンの効率的な表現と生成に興味を持つ研究者や開発者を対象としており、CVPR 2026に採択された先進的な研究成果を提供します。
互換性・特徴
- GPU必須
- Python
- PyTorch
- 3Dシーン処理
- 機械学習
基本情報
| ライセンス | MIT |
| Stars | 201 |
| Forks | 9 |
| カテゴリ | 3D / NeRF |
| アクティビティ | mid |
最新のissue
- scenetok向けのdl3dv.ckptをファインチューニングする際のscene tokensにおけるNaNの問題 (更新: 2026-04-13 / NaN issues in scene tokens when fine-tuning dl3dv.ckpt for scenetok)
