3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
LiveWorld
LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…
★ 63 ⑂ 3 Apache-2.0 2026-06-23
画像生成
GitHub
W-Flow
W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…
★ 60 ⑂ 4 MIT 2026-06-09
画像生成
GitHub
LeapAlign_Code
LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…
★ 53 ⑂ 1 Apache-2.0 2026-06-13
画像生成
GitHub
MagicBokeh
MagicBokehは、高ズームで撮影された写真に対し、フォトリアリスティックで高品質なボケ効果を効率的に生成するため…
★ 46 ⑂ 1 2026-06-17
3D / NeRF
GitHub
gaussiancar
GaussianCaRは、自律走行車向けの効率的なカメラとレーダー融合技術です。このツールは、Gaussian Splattingをユニバ…
★ 46 ⑂ 2 Apache-2.0 2026-05-07
3D / NeRF
GitHub
ULF-Loc
ULF-Locは、CVPR 2026 Highlight論文として発表された、3D Gaussian Splattingを用いた堅牢な視覚ローカライゼーショ…
★ 46 ⑂ 6 2026-06-16
画像生成
GitHub
Coarse-guided-Gen
「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…
★ 42 ⑂ 4 2026-05-08
動画生成
GitHub
PhyMotion
PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…
★ 39 ⑂ 5 MIT 2026-05-15
画像生成
GitHub
colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
音声生成 / TTS
GitHub
utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
LLM
GitHub
attn_res
このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…
★ 33 ⑂ 3 Apache-2.0 2026-03-16
画像生成
GitHub
StyleExpert
StyleExpertは、HVision-NKUによって開発された、多様な画像スタイル変換を可能にするツールです。Mixture of Style …
★ 33 2026-03-19
音声生成 / TTS
GitHub
xRIR_code
xRIRは、CVPR 2025で発表された論文「Hearing Anywhere in Any Environment」をPyTorchで実装したもので、部屋を跨ぐ…
★ 33 ⑂ 1 NOASSERTION 2025-09-18
画像生成
GitHub
Micro-Diffusion
Micro Diffusionは、Pythonで実装されたテキスト拡散モデルの基礎を学習するためのプロジェクトです。KarpathyのMicr…
★ 33 ⑂ 2 MIT 2026-04-13
画像生成
GitHub
RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
ComfyUI
GitHub
ComfyUI-Janus_pro_vision
ComfyUI上でDeepSeek AIのJanus-Pro-7Bを使えるようにするカスタムノード拡張です。1枚または2枚の画像を入力し、詳…
★ 31 ⑂ 1 MIT 2025-03-20
音声生成 / TTS
GitHub
wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
3D / NeRF
GitHub
iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
マルチモーダル
GitHub
weld-anomaly-classifier
WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…
★ 28 ⑂ 1 MIT 2026-03-06
音楽生成
GitHub
Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
動画生成
GitHub
Hand2World
「Hand2World」は、自由空間での手のジェスチャーから一人称視点でのインタラクションを自動回帰的に生成する研究プ…
★ 20 2026-06-17
ComfyUI
GitHub
ComfyUI-ControlOrder-FreeMemory
ComfyUI-ControlOrder-FreeMemoryは、ComfyUIのカスタムノードで、ノードの実行順序を柔軟に制御し、ワークフローの…
★ 20 ⑂ 1 MIT 2026-04-15
LLM
GitHub
Prism
PRISMは、マルチモーダル大規模言語モデル(特にLLaVA)の継続的学習設定における命令チューニングのためのPyTorchベ…
★ 20 ⑂ 5 MIT 2026-06-15
画像生成
GitHub
DVS
DVS (Drift Variation Score)は、グラフ拡散モデルにおけるサンプリング過程を改善する情報幾何学的な適応サンプリン…
★ 18 2026-05-04