3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
nerf-emitter
gerwang/nerf-emitterは、物理ベースの逆レンダリングにおいてNeRF(Neural Radiance Fields)を非遠方環境光源とし…
★ 18 ⑂ 3 Apache-2.0 2026-01-26
画像生成
GitHub
RealUID
RealUIDは、ICLR 2026で発表された「Universal Inverse Distillation for Matching Models with Real-Data Supervisi…
★ 17 ⑂ 1 MIT 2026-06-24
画像生成
GitHub
av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 16 ⑂ 3 MIT 2026-06-09
3D / NeRF
GitHub
Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
3D / NeRF
GitHub
ru4dslam
RU4D-SLAMは、ガウススプラッティングSLAMにおいて不確実性の重み付けを行うことで、4Dシーン再構築を実現するシステ…
★ 15 ⑂ 2 2026-06-01
LLM
GitHub
ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 15 Apache-2.0 2026-05-13
音声生成 / TTS
GitHub
voxtral-codec-pytoch
Voxtral Codec PyTorchは、24kHzモノラル音声波形をTTS(Text-to-Speech)トレーニング用の離散コードに変換するVoxt…
★ 15 ⑂ 1 2026-03-27
3D / NeRF
GitHub
SLARM
SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…
★ 15 MIT 2026-06-09
画像生成
GitHub
minFLUX
minFLUXは、Black Forest LabsによるFLUX.1およびFLUX.2拡散トランスフォーマーの、非公式かつ最小限のPyTorch実装で…
★ 13 ⑂ 2 Apache-2.0 2026-05-13
3D / NeRF
GitHub
splatreg
splatregは、3D Gaussian Splatting(3DGS)スキャン間の位置合わせ(アライメント)と結合を目的としたPythonライブ…
★ 12 BSD-3-Clause 2026-06-25
動画生成
GitHub
NanoI2V
NanoI2Vは、最先端の画像-動画変換(I2V)モデルをゼロから構築するためのステップバイステップのガイドです。拡散ベ…
★ 12 MIT 2026-06-19
3D / NeRF
GitHub
ODE-GS
ODE-GSは、ICLR 2026で発表された「Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting」の公…
★ 12 ⑂ 2 MIT 2026-04-25
3D / NeRF
GitHub
SplAttN
SplAttNは、3D点群補完のための公式PyTorch実装です。従来の2D投影で生じる「クロスモーダルエントロピー崩壊」問題…
★ 11 ⑂ 1 MIT 2026-06-16
画像生成
GitHub
pytorch-memory-fix
このツールは、PyTorch/Python環境で大規模な機械学習モデル(LLM、Diffusionモデルなど)を繰り返しロード・アンロ…
★ 10 ⑂ 2 MIT 2026-03-24
画像生成
GitHub
CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
画像生成
GitHub
diffusion-tutorials-cn
本プロジェクトは、Tsuyoshi Matsuzaki氏による「diffusion-tutorials」の中国語翻訳・理論強化版です。拡散モデル(…
★ 9 MIT 2026-03-28
画像生成
GitHub
Prox-E
Prox-Eは、SIGGRAPH 2026に採択された、3D形状の精密な編集を可能にするトレーニング不要なフレームワークです。プリ…
★ 8 ⑂ 2 MIT 2026-05-30
画像生成
GitHub
DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 MIT 2026-06-15
マルチモーダル
GitHub
egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
マルチモーダル
GitHub
CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
3D / NeRF
GitHub
LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01