3D / NeRF GitHub map-anything
MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…
★ 3.5k ⑂ 269 Apache-2.0 2026-06-03
3D / NeRF GitHub SuGaR
SuGaRは、CVPR 2024で発表された、3D Gaussian Splattingから効率的に高品質な3Dメッシュを再構築し、レンダリングす…
★ 3.4k ⑂ 301 NOASSERTION 2024-09-24
3D / NeRF GitHub UnityGaussianSplatting
aras-p/UnityGaussianSplattingは、SIGGRAPH 2023で発表された「3D Gaussian Splatting」技術をUnityでリアルタイム…
★ 3.3k ⑂ 468 MIT 2025-10-17
マルチモーダル GitHub MGM
「Mini-Gemini」は、画像理解、推論、生成を同時に行うことができるマルチモダリティ大規模言語モデル(LLM)フレー…
★ 3.3k ⑂ 275 Apache-2.0 2024-05-04
3D / NeRF GitHub 2d-gaussian-splatting
「2D Gaussian Splatting for Geometrically Accurate Radiance Fields」論文の公式実装です。2Dの指向性ディスク(…
★ 3.2k ⑂ 313 NOASSERTION 2025-11-24
音声生成 / TTS GitHub TTS-WebUI
TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ(TTS)、音…
★ 3.2k ⑂ 326 MIT 2026-05-14
動画生成 GitHub DynamiCrafter
DynamiCrafterは、テキストプロンプトに基づいてオープンドメインの静止画をアニメーション化するツールです。事前学…
★ 3.0k ⑂ 245 Apache-2.0 2024-09-08
ComfyUI GitHub ComfyUI-nunchaku
Nunchaku ComfyUI Pluginは、SVDQuantで量子化された4-bitニューラルネットワーク向けの効率的な推論エンジン「Nunch…
★ 2.9k ⑂ 166 Apache-2.0 2026-02-19
音声生成 / TTS GitHub AudioLDM
AudioLDMは、テキスト入力からスピーチ、効果音、音楽などを生成できる革新的なオーディオ生成ツールです。ICML 2023…
★ 2.9k ⑂ 266 NOASSERTION 2025-06-25
画像生成 GitHub Kandinsky-2
Kandinsky 2.2は、多言語対応のテキストから画像を生成する強力な潜在拡散モデルです。前バージョンのKandinsky 2.1…
★ 2.8k ⑂ 317 Apache-2.0 2024-05-01
3D / NeRF GitHub nerf_pl
このツールは、NeRF (Neural Radiance Fields) をPyTorch-Lightningで非公式に実装したものです。公式実装と比較して…
★ 2.8k ⑂ 460 MIT 2023-08-03
画像生成 GitHub dalle-playground
このプロジェクトは、Stable Diffusion V2を用いてテキストプロンプトから画像を生成するためのプレイグラウンドです…
★ 2.7k ⑂ 577 MIT 2024-06-03
動画生成 GitHub Stable-Diffusion
Dr. Furkan Gözükara氏によるジェネレーティブAIに関する専門的なチュートリアル、研究、開発リソース集です。Stable…
★ 2.7k ⑂ 364 GPL-3.0 2026-06-18
3D / NeRF GitHub GeneFace
GeneFaceは、音声駆動による汎用的で高忠実度な3D話者顔合成を実現するICLR 2023で発表された公式PyTorch実装です。…
★ 2.7k ⑂ 294 MIT 2024-10-18
音声生成 / TTS GitHub AudioLDM2
AudioLDM 2は、テキストプロンプトからオーディオ(音楽を含む)、スピーチ、超解像インペインティングを生成できる…
★ 2.6k ⑂ 209 NOASSERTION 2024-09-29
画像生成 HF sdxl-turbo
SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイム合成に特化しており…
❤ 2.6k ↓ 632.4k other 2024-07-10
ComfyUI GitHub ComfyUI-SeedVR2_VideoUpscaler
ComfyUI-SeedVR2_VideoUpscalerは、高品質なビデオと画像のアップスケーリングを可能にするComfyUI向けの公式SeedVR2…
★ 2.6k ⑂ 199 Apache-2.0 2025-12-24
3D / NeRF GitHub 3dgrut
nv-tlabs/3dgrutは、3D Gaussian Ray Tracing (3DGRT) および3D Gaussian Unscented Transform (3DGUT) の公式実装を…
★ 2.3k ⑂ 261 Apache-2.0 2026-06-26
動画生成 HF HunyuanVideo
HunyuanVideoは、Tencentが公開した大規模な動画生成基盤モデルの実装リポジトリです。PyTorch製のモデル定義、学習…
❤ 2.2k ↓ 902 other 2025-03-06
画像生成 HF stable-diffusion-xl-refiner-1.0
Stability AIが開発した「SD-XL 1.0-refiner」は、テキストプロンプトから画像を生成・変更できる拡散ベースの画像生…
❤ 2.0k ↓ 167.9k openrail++ 2023-09-25
ComfyUI GitHub ComfyUI-RMBG
ComfyUI-RMBGは、ComfyUI向けの高度な画像背景除去およびオブジェクト、顔、服、ファッション要素の精密なセグメンテ…
★ 2.0k ⑂ 124 GPL-3.0 2026-02-03
AIエージェント GitHub agi
このシステムは、自律AIエージェントがP2Pネットワーク上で連携し、実験結果を共有することで、継続的に学習し進化す…
★ 1.9k ⑂ 235 MIT 2026-06-28
画像生成 GitHub Helios
Heliosは、リアルタイムでの長尺ビデオ生成を可能にする革新的なモデルです。従来のアンチドリフト戦略やアクセラレ…
★ 1.9k ⑂ 152 Apache-2.0 2026-06-10
動画生成 GitHub HunyuanVideo-I2V
HunyuanVideo-I2Vは、HunyuanVideoを基盤としたカスタマイズ可能な画像から動画への生成モデルです。静止画像を入力…
★ 1.8k ⑂ 190 NOASSERTION 2026-04-07