概要
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。
離散的なクロスビュー人物割り当て問題をポリ確率テンソル空間での生成拡散プロセスとして再定義し、微分可能なSinkhorn投影を用いて、複数のカメラビューからの一貫した3Dスケルトンを推定します。
3D正解データなしで、2D擬似ラベルのみで学習できる点が特徴です。
主に機械学習の研究者や、3D人体ポーズ推定、拡散モデル、グラフニューラルネットワークに関心のある開発者向けに設計されています。
互換性・特徴
- Python
- PyTorch
- GPU必須
- CLI
- 機械学習
- 3Dポーズ推定
基本情報
| ライセンス | MIT |
| Stars | 6 |
| カテゴリ | 画像生成 |
| アクティビティ | low |
GitHub: https://github.com/wngTn/DisPOSE
