画像生成 GitHub ComfyUI-PuLID-Flux2
このツールは、ComfyUIユーザー向けにFLUX.2モデルでの顔の一貫性を実現するPuLIDの初めての実装です。特に、生成さ…
★ 108 ⑂ 9 MIT 2026-05-21
LLM GitHub PersonaVLM
PersonaVLMは、長期的なパーソナライゼーションを実現する革新的なマルチモーダルLLMエージェントフレームワークです…
★ 108 ⑂ 8 Apache-2.0 2026-04-16
3D / NeRF GitHub SpatialBench
SpatialBenchは、マルチモーダル大規模言語モデル(MLLM)のビデオ空間理解能力を評価するオープンソースベンチマー…
★ 106 2026-05-28
ComfyUI GitHub XB_ToolBox
XB_ToolBoxは、ComfyUIのAI初心者が効率的にワークフローを構築し、ローカルでAIモデルを実行できるように設計された…
★ 102 ⑂ 5 Apache-2.0 2026-06-26
音声生成 / TTS GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 102 ⑂ 19 Apache-2.0 2026-05-29
画像生成 GitHub HiFi-Inpaint
HiFi-Inpaintは、CVPR 2026で発表された、人間と商品を組み合わせた高品質な画像を生成するための参照ベースのインペ…
★ 101 ⑂ 5 Apache-2.0 2026-06-07
画像生成 GitHub FlowInOne
FlowInOneは、画像を入力として画像を出力する、ビジョン中心のマルチモーダル画像生成モデルです。Image-in, Image-…
★ 96 ⑂ 5 MIT 2026-06-18
画像生成 GitHub ComfyUI-PiD
ComfyUI-PiDは、NVIDIAのPiD(Pixel Diffusion)技術をComfyUI上で利用するためのカスタムノード集です。画素拡散デ…
★ 94 ⑂ 8 MIT 2026-06-12
ComfyUI GitHub ComfyUI-DiffusersImageOutpaint
ComfyUI上でDiffusersベースの画像アウトペイントを行うためのカスタムノード集です。SDXL系のUNetとControlNetを読…
★ 92 ⑂ 5 Apache-2.0 2026-05-20
3D / NeRF GitHub superfit
SuperFitは、CVPR 2026で発表された、3D形状にSuperFrusta、直方体、超二次曲面といったコンパクトなプリミティブア…
★ 89 ⑂ 5 NOASSERTION 2026-05-23
ComfyUI GitHub ComfyUI-RookieUI
ComfyUI-RookieUIは、ComfyUIのカスタムノード拡張で、A1111(Automatic1111)スタイルのサイドバーUIとワークフロー…
★ 88 ⑂ 7 AGPL-3.0 2026-06-24
動画生成 GitHub MobileI2V
「MobileI2V」は、画像から高品質な動画を高速で生成できるツールです。特にモバイルデバイスでの利用に最適化されて…
★ 87 ⑂ 5 Apache-2.0 2026-05-20
画像生成 GitHub Unify-Agent
「Unify-Agent」は、Web検索等で外部の知識を能動的に参照し、事実に忠実な画像を生成する統一マルチモーダルAIエー…
★ 83 ⑂ 4 MIT 2026-05-02
ComfyUI GitHub comfyui-sdnq
「ComfyUI-SDNQ」は、ComfyUIユーザーが大規模な画像生成モデルを少ないVRAMで効率的に実行するためのツールです。本…
★ 81 ⑂ 13 GPL-3.0 2026-04-13
LLM GitHub granite-switch
「Granite Switch」は、IBM Researchが開発したオープンソースプロジェクトで、複数のファインチューニングされたLoR…
★ 81 ⑂ 8 Apache-2.0 2026-06-24
3D / NeRF GitHub MBA-SLAM
MBA-SLAMは、TPAMI 2025で発表された、モーションブラーを意識したDense Visual SLAMシステムです。動きによってぼや…
★ 77 ⑂ 2 Apache-2.0 2026-05-19
画像生成 GitHub ReactiveGWM
ReactiveGWMは、プレイヤー操作とNPCの自律性を分離することで、ゲーム内のNPCをより動的に制御する新しいゲーム世界…
★ 77 ⑂ 9 2026-06-16
画像生成 GitHub LongLive-RAG
LongLive-RAGは、長尺動画生成における品質と一貫性の課題を解決するための汎用的なRetrieval-Augmented Frameworkで…
★ 76 Apache-2.0 2026-06-04
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 76 ⑂ 2 GPL-3.0 2026-05-11
ComfyUI GitHub ComfyUI-Darkroom
ComfyUI-Darkroomは、ComfyUIユーザー向けのプロフェッショナルなカラーグレーディングおよびフィルムエミュレーショ…
★ 76 ⑂ 6 2026-06-15
AIエージェント GitHub uv-scripts-for-ai
このツールは、OCR、画像処理、音声処理など、データおよび機械学習タスク向けの自己完結型UVスクリプト集です。各ス…
★ 76 ⑂ 4 Apache-2.0 2026-06-23
マルチモーダル GitHub locate-anything
「locate-anything」は、NVIDIAのLocateAnything-3Bモデルを利用した、モバイルフレンドリーなWebインターフェースで…
★ 76 ⑂ 10 Apache-2.0 2026-06-22
ComfyUI GitHub ComfyUI_GraftingRayman
GraftingRayman/ComfyUI_GraftingRaymanは、画像生成と操作を行うComfyUIユーザー向けのカスタムノード集です。既存…
★ 75 ⑂ 6 GPL-3.0 2026-05-19
音声生成 / TTS GitHub Talker-T2AV
Talker-T2AVは、自己回帰拡散モデリングを使い、テキスト、音声、動画を連携させて生成するAIツールです。Qwen3-0.6B…
★ 75 ⑂ 3 Apache-2.0 2026-05-24