3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#PyTorch (148 repos)
「PyTorch」タグが付いたリポジトリ
← 全リポジトリ
動画生成 GitHub LiveWorld
LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…
★ 63 ⑂ 3 Apache-2.0 2026-06-23
画像生成 GitHub W-Flow
W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…
★ 60 ⑂ 4 MIT 2026-06-09
画像生成 GitHub LeapAlign_Code
LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…
★ 53 ⑂ 1 Apache-2.0 2026-06-13
画像生成 GitHub MagicBokeh
MagicBokehは、高ズームで撮影された写真に対し、フォトリアリスティックで高品質なボケ効果を効率的に生成するため…
★ 46 ⑂ 1 2026-06-17
3D / NeRF GitHub gaussiancar
GaussianCaRは、自律走行車向けの効率的なカメラとレーダー融合技術です。このツールは、Gaussian Splattingをユニバ…
★ 46 ⑂ 2 Apache-2.0 2026-05-07
3D / NeRF GitHub ULF-Loc
ULF-Locは、CVPR 2026 Highlight論文として発表された、3D Gaussian Splattingを用いた堅牢な視覚ローカライゼーショ…
★ 46 ⑂ 6 2026-06-16
画像生成 GitHub Coarse-guided-Gen
「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…
★ 42 ⑂ 4 2026-05-08
動画生成 GitHub PhyMotion
PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…
★ 39 ⑂ 5 MIT 2026-05-15
画像生成 GitHub colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
音声生成 / TTS GitHub utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
LLM GitHub attn_res
このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…
★ 33 ⑂ 3 Apache-2.0 2026-03-16
画像生成 GitHub StyleExpert
StyleExpertは、HVision-NKUによって開発された、多様な画像スタイル変換を可能にするツールです。Mixture of Style …
★ 33 2026-03-19
音声生成 / TTS GitHub xRIR_code
xRIRは、CVPR 2025で発表された論文「Hearing Anywhere in Any Environment」をPyTorchで実装したもので、部屋を跨ぐ…
★ 33 ⑂ 1 NOASSERTION 2025-09-18
画像生成 GitHub Micro-Diffusion
Micro Diffusionは、Pythonで実装されたテキスト拡散モデルの基礎を学習するためのプロジェクトです。KarpathyのMicr…
★ 33 ⑂ 2 MIT 2026-04-13
画像生成 GitHub RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
ComfyUI GitHub ComfyUI-Janus_pro_vision
ComfyUI上でDeepSeek AIのJanus-Pro-7Bを使えるようにするカスタムノード拡張です。1枚または2枚の画像を入力し、詳…
★ 31 ⑂ 1 MIT 2025-03-20
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
マルチモーダル GitHub weld-anomaly-classifier
WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…
★ 28 ⑂ 1 MIT 2026-03-06
音楽生成 GitHub Steerable-music-transformer
このプロジェクトは、論文「Steerable Rhythmic Complexity in Autoregressive Music Generation」の公式PyTorch実装…
★ 21 ⑂ 5 MIT 2026-05-27
動画生成 GitHub Hand2World
「Hand2World」は、自由空間での手のジェスチャーから一人称視点でのインタラクションを自動回帰的に生成する研究プ…
★ 20 2026-06-17
ComfyUI GitHub ComfyUI-ControlOrder-FreeMemory
ComfyUI-ControlOrder-FreeMemoryは、ComfyUIのカスタムノードで、ノードの実行順序を柔軟に制御し、ワークフローの…
★ 20 ⑂ 1 MIT 2026-04-15
LLM GitHub Prism
PRISMは、マルチモーダル大規模言語モデル(特にLLaVA)の継続的学習設定における命令チューニングのためのPyTorchベ…
★ 20 ⑂ 5 MIT 2026-06-15
画像生成 GitHub DVS
DVS (Drift Variation Score)は、グラフ拡散モデルにおけるサンプリング過程を改善する情報幾何学的な適応サンプリン…
★ 18 2026-05-04