3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
TokenFlow
TokenFlowは、事前学習済みのテキストから画像への拡散モデルを利用し、追加のトレーニングやファインチューニングな…
★ 1.7k ⑂ 140 MIT 2025-02-03
音声生成 / TTS
GitHub
soundstorm-pytorch
このツールは、Google Deepmindが開発した効率的な並列オーディオ生成モデル「SoundStorm」をPyTorchで実装したもの…
★ 1.5k ⑂ 94 MIT 2025-04-24
音声生成 / TTS
GitHub
Voice-Cloning-App
「Voice Cloning App」は、PythonとPyTorchを利用して人間の音声を簡単に合成できるアプリケーションです。自動デー…
★ 1.4k ⑂ 239 BSD-3-Clause 2024-12-02
音声生成 / TTS
GitHub
BigVGAN
BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…
★ 1.2k ⑂ 145 MIT 2024-09-05
動画生成
GitHub
SparkVSR
SparkVSRは、インタラクティブな動画超解像(VSR)フレームワークです。ユーザーが任意の画像超解像(ISR)モデルで…
★ 678 ⑂ 73 Apache-2.0 2026-06-23
ComfyUI
GitHub
scepter
SCEPTERは、生成AIモデルの学習・微調整・推論を一通り扱えるオープンソース基盤です。画像生成、画像編集、スタイル…
★ 549 ⑂ 30 Apache-2.0 2025-04-03
3D / NeRF
GitHub
Scal3R
Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…
★ 494 ⑂ 37 NOASSERTION 2026-05-11
3D / NeRF
GitHub
OmniVGGT-official
OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…
★ 339 ⑂ 28 MIT 2026-05-21
3D / NeRF
GitHub
video_to_world
本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…
★ 258 ⑂ 23 MIT 2026-04-27
LLM
GitHub
steerling
Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。…
★ 229 ⑂ 14 Apache-2.0 2026-06-24
3D / NeRF
GitHub
scenetok
SceneTokは、3Dシーンデータを圧縮された、非構造化かつ拡散可能な1Dトークン表現へと変換するシーンオートエンコー…
★ 203 ⑂ 9 MIT 2026-06-15
3D / NeRF
GitHub
faster-gaussian-splatting
このツールは「Faster Gaussian Splatting (Faster-GS)」という3D Gaussian Splatting (3DGS) の最適化を効率的に行…
★ 183 ⑂ 27 Apache-2.0 2026-05-28
ComfyUI
GitHub
Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 166 ⑂ 17 MIT 2026-06-12
画像生成
GitHub
WaDi
WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…
★ 164 ⑂ 23 2026-05-26
LLM
GitHub
Thinking-with-Visual-Primitives-pytorch
このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…
★ 140 ⑂ 18 MIT 2026-06-25
動画生成
GitHub
lpwm
「Latent Particle World Models (LPWM)」は、ICLR 2026で発表された自己教師ありオブジェクト中心ワールドモデルのP…
★ 117 ⑂ 5 MIT 2026-03-19
画像生成
GitHub
UNITE-tokenization-generation
UNITEは、画像や分子などのモダリティに対応した、トークン化と潜在拡散モデルの生成を単一ステージでend-to-endに学…
★ 116 ⑂ 1 2026-03-24
3D / NeRF
GitHub
NAS3R
NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…
★ 114 ⑂ 8 MIT 2026-05-12
3D / NeRF
GitHub
NeRF2Physics
NeRF2Physicsは、CVPR 2024で発表された、言語埋め込み特徴フィールドから物理的特性を理解するためのツールです。Ne…
★ 93 ⑂ 4 MIT 2025-11-16
ComfyUI
GitHub
UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 76 ⑂ 2 GPL-3.0 2026-05-11
音声生成 / TTS
GitHub
Talker-T2AV
Talker-T2AVは、自己回帰拡散モデリングを使い、テキスト、音声、動画を連携させて生成するAIツールです。Qwen3-0.6B…
★ 75 ⑂ 3 Apache-2.0 2026-05-24
画像生成
GitHub
Rose
RoseはPyTorch向けに開発された、ステートレスな最適化を実現する新しいオプティマイザです。従来の適応型オプティマ…
★ 74 ⑂ 5 Apache-2.0 2026-04-28
動画生成
GitHub
ReImagine
ReImagineは、画像優先合成という先進的な手法を用いて、高品質で制御可能な人間動画を生成するためのフレームワーク…
★ 73 ⑂ 12 Apache-2.0 2026-04-23
動画生成
GitHub
LiveWorld
LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…
★ 63 ⑂ 3 Apache-2.0 2026-06-23