3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI

GitHub

ComfyUI-Depth-Anything-Tensorrt

「ComfyUI Depth Anything TensorRT」は、人気のある画像生成UIであるComfyUI向けのカスタムノードで、Depth Anythin…

#ComfyUI対応 #GPU必須 #Python

★ 133 ⑂ 14 NOASSERTION 2026-06-04

音声生成 / TTS

GitHub

VTS

VTS（Voice To Sound）は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…

#CLI #GPU必須 #Hugging Face

★ 131 ⑂ 4 MIT 2026-06-18

動画生成

GitHub

EffectErase

「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…

#CLI #GPU必須 #Hugging Face

★ 128 ⑂ 7 NOASSERTION 2026-04-10

マルチモーダル

GitHub

count-anything

Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…

#CLI #GPU必須 #Hugging Face

★ 127 ⑂ 6 Apache-2.0 2026-06-04

LLM

GitHub

VidCom2

VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワーク…

#CLI #GPU必須 #Python

★ 126 ⑂ 14 Apache-2.0 2026-05-14

画像生成

GitHub

Spectrum

「Spectrum」は、学習不要なスペクトル拡散特徴予測を用いて、拡散モデルのサンプリング速度を大幅に向上させるツー…

#CLI #ComfyUI対応 #GPU必須

★ 125 ⑂ 7 MIT 2026-04-30

動画生成

GitHub

PSIVG

このリポジトリは、CVPR 2026で発表される研究プロジェクト「Physical Simulator In-the-Loop Video Generation」の…

#CLI #GPU必須 #コンピュータビジョン

★ 125 ⑂ 14 Apache-2.0 2026-06-01

動画生成

Matrix-Game-3.0

Matrix-Game 3.0は、画像とテキストを入力に、長時間の一貫性を保った720pインタラクティブ動画をリアルタイム生成で…

#CLI #GPU必須 #Hugging Faceモデル

❤ 123 ↓ 255 apache-2.0 2026-04-28

マルチモーダル

GitHub

ScreenMind

ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…

#AI #GPU必須 #Python

★ 123 ⑂ 6 MIT 2026-06-23

動画生成

GitHub

Echo-Memory

Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…

#CLI #GPU必須 #Hugging Face対応

★ 119 ⑂ 6 2026-06-25

3D / NeRF

GitHub

gaussian-point-splatting

本ツールは、独自の確率的なアプローチ「Gaussian Point Splatting」により、数億個に及ぶ大規模な3D Gaussian Splat…

#3Dグラフィックス #CLI #CUDA対応

★ 116 ⑂ 10 BSD-3-Clause 2026-06-05

画像生成

GitHub

guaardvark

Guaardvarkは、自己ホスト型AIワークステーションであり、自律型スクリーンエージェント、3層ニューラルルーティング…

#AIエージェント #GPU必須 #Web UI

★ 115 ⑂ 27 MIT 2026-06-28

3D / NeRF

GitHub

NAS3R

NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…

#CLI #GPU必須 #Hugging Face

★ 114 ⑂ 8 MIT 2026-05-12

ComfyUI

GitHub

ComfyUI-Woosh

ComfyUI-Wooshは、ComfyUI向けのサウンドエフェクト生成ノード集です。Sony AIのWoosh基盤モデルを活用し、テキスト…

#ComfyUI対応 #GPU必須 #Python

★ 112 ⑂ 7 MIT 2026-05-07

動画生成

Motif-Video-2B

Motif-Video 2BはMotif Technologiesが開発した、テキストや画像から動画を生成する低予算の拡散トランスフォーマー…

#ComfyUI対応 #Diffusers #GGUF

❤ 112 ↓ 251 apache-2.0 2026-05-15

画像生成

GitHub

ComfyUI-PuLID-Flux2

このツールは、ComfyUIユーザー向けにFLUX.2モデルでの顔の一貫性を実現するPuLIDの初めての実装です。特に、生成さ…

#AI画像生成 #ComfyUI対応 #GPU必須

★ 108 ⑂ 9 MIT 2026-05-21

LLM

GitHub

PersonaVLM

PersonaVLMは、長期的なパーソナライゼーションを実現する革新的なマルチモーダルLLMエージェントフレームワークです…

#CLI #GPU必須 #Hugging Face

★ 108 ⑂ 8 Apache-2.0 2026-04-16

3D / NeRF

GitHub

SpatialBench

SpatialBenchは、マルチモーダル大規模言語モデル（MLLM）のビデオ空間理解能力を評価するオープンソースベンチマー…

#AI/MLベンチマーク #CLI #GPU必須

★ 106 2026-05-28

ComfyUI

GitHub

XB_ToolBox

XB_ToolBoxは、ComfyUIのAI初心者が効率的にワークフローを構築し、ローカルでAIモデルを実行できるように設計された…

#AMD GPU最適化 #ComfyUI対応 #GPU必須

★ 102 ⑂ 5 Apache-2.0 2026-06-26

音声生成 / TTS

GitHub

Qwen3-TTS-EasyFinetuning

「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…

#CLI #Docker #GPU必須

★ 102 ⑂ 19 Apache-2.0 2026-05-29

画像生成

GitHub

HiFi-Inpaint

HiFi-Inpaintは、CVPR 2026で発表された、人間と商品を組み合わせた高品質な画像を生成するための参照ベースのインペ…

#Deep Learning #GPU必須 #Python

★ 101 ⑂ 5 Apache-2.0 2026-06-07

マルチモーダル

MOSS-VL-Instruct-0408

MOSS-VL-Instruct-0408は、OpenMOSS系の視覚言語モデルを教師あり微調整したマルチモーダル推論用チェックポイントで…

#CLI #GPU必須 #動画対応

❤ 97 ↓ 331 apache-2.0 2026-04-22

画像生成

GitHub

FlowInOne

FlowInOneは、画像を入力として画像を出力する、ビジョン中心のマルチモーダル画像生成モデルです。Image-in, Image-…

#CLI #GPU必須 #Python

★ 96 ⑂ 5 MIT 2026-06-18

画像生成

GitHub

ComfyUI-PiD

ComfyUI-PiDは、NVIDIAのPiD（Pixel Diffusion）技術をComfyUI上で利用するためのカスタムノード集です。画素拡散デ…

#ComfyUI対応 #GPU必須 #NVIDIA PiD

★ 94 ⑂ 8 MIT 2026-06-12