概要
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフィールドを共同で学習する新しい手法です。
本リポジトリはその公式実装であり、リアルなオーディオビジュアル生成を可能にします。
Nerfstudio上に構築されており、GPU環境での実行が必須です。
3Dオーディオビジュアル生成の研究者やNerfstudioユーザーを主な想定ユーザーとしています。
学習済みモデルはHugging Faceで公開されており、CLIを通じてモデルの訓練や評価が可能です。
互換性・特徴
- Nerfstudio対応
- GPU必須
- Python
- CLI
- Hugging Face
基本情報
| ライセンス | NOASSERTION |
| Stars | 36 |
| Forks | 2 |
| カテゴリ | 3D / NeRF |
| アクティビティ | low |
最新のissue
- Loudness Mapと動画の可視化ツールに関するお問い合わせ (更新: 2026-02-09 / Inquiry regarding Visualization Tools for Loudness Maps and Videos)
- 3D Grid Visualizationについて (更新: 2025-12-03 / About 3D Grid Visualization)
- 「NeRAF audio-visual joint training improves vision performance」に関する質問 (更新: 2025-12-03 / Questions about "NeRAF audio-visual joint training improves vision performance")
