3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub ComfyUI-Depth-Anything-Tensorrt
「ComfyUI Depth Anything TensorRT」は、人気のある画像生成UIであるComfyUI向けのカスタムノードで、Depth Anythin…
★ 133 ⑂ 14 NOASSERTION 2026-06-04
音声生成 / TTS GitHub VTS
VTS(Voice To Sound)は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…
★ 131 ⑂ 4 MIT 2026-06-18
動画生成 GitHub EffectErase
「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…
★ 128 ⑂ 7 NOASSERTION 2026-04-10
マルチモーダル GitHub count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 127 ⑂ 6 Apache-2.0 2026-06-04
LLM GitHub VidCom2
VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワーク…
★ 126 ⑂ 14 Apache-2.0 2026-05-14
画像生成 GitHub Spectrum
「Spectrum」は、学習不要なスペクトル拡散特徴予測を用いて、拡散モデルのサンプリング速度を大幅に向上させるツー…
★ 125 ⑂ 7 MIT 2026-04-30
動画生成 GitHub PSIVG
このリポジトリは、CVPR 2026で発表される研究プロジェクト「Physical Simulator In-the-Loop Video Generation」の…
★ 125 ⑂ 14 Apache-2.0 2026-06-01
動画生成 HF Matrix-Game-3.0
Matrix-Game 3.0は、画像とテキストを入力に、長時間の一貫性を保った720pインタラクティブ動画をリアルタイム生成で…
❤ 123 ↓ 255 apache-2.0 2026-04-28
マルチモーダル GitHub ScreenMind
ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…
★ 123 ⑂ 6 MIT 2026-06-23
動画生成 GitHub Echo-Memory
Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…
★ 119 ⑂ 6 2026-06-25
3D / NeRF GitHub gaussian-point-splatting
本ツールは、独自の確率的なアプローチ「Gaussian Point Splatting」により、数億個に及ぶ大規模な3D Gaussian Splat…
★ 116 ⑂ 10 BSD-3-Clause 2026-06-05
画像生成 GitHub guaardvark
Guaardvarkは、自己ホスト型AIワークステーションであり、自律型スクリーンエージェント、3層ニューラルルーティング…
★ 115 ⑂ 27 MIT 2026-06-28
3D / NeRF GitHub NAS3R
NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…
★ 114 ⑂ 8 MIT 2026-05-12
ComfyUI GitHub ComfyUI-Woosh
ComfyUI-Wooshは、ComfyUI向けのサウンドエフェクト生成ノード集です。Sony AIのWoosh基盤モデルを活用し、テキスト…
★ 112 ⑂ 7 MIT 2026-05-07
動画生成 HF Motif-Video-2B
Motif-Video 2BはMotif Technologiesが開発した、テキストや画像から動画を生成する低予算の拡散トランスフォーマー…
❤ 112 ↓ 251 apache-2.0 2026-05-15
画像生成 GitHub ComfyUI-PuLID-Flux2
このツールは、ComfyUIユーザー向けにFLUX.2モデルでの顔の一貫性を実現するPuLIDの初めての実装です。特に、生成さ…
★ 108 ⑂ 9 MIT 2026-05-21
LLM GitHub PersonaVLM
PersonaVLMは、長期的なパーソナライゼーションを実現する革新的なマルチモーダルLLMエージェントフレームワークです…
★ 108 ⑂ 8 Apache-2.0 2026-04-16
3D / NeRF GitHub SpatialBench
SpatialBenchは、マルチモーダル大規模言語モデル(MLLM)のビデオ空間理解能力を評価するオープンソースベンチマー…
★ 106 2026-05-28
ComfyUI GitHub XB_ToolBox
XB_ToolBoxは、ComfyUIのAI初心者が効率的にワークフローを構築し、ローカルでAIモデルを実行できるように設計された…
★ 102 ⑂ 5 Apache-2.0 2026-06-26
音声生成 / TTS GitHub Qwen3-TTS-EasyFinetuning
「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クロー…
★ 102 ⑂ 19 Apache-2.0 2026-05-29
画像生成 GitHub HiFi-Inpaint
HiFi-Inpaintは、CVPR 2026で発表された、人間と商品を組み合わせた高品質な画像を生成するための参照ベースのインペ…
★ 101 ⑂ 5 Apache-2.0 2026-06-07
マルチモーダル HF MOSS-VL-Instruct-0408
MOSS-VL-Instruct-0408は、OpenMOSS系の視覚言語モデルを教師あり微調整したマルチモーダル推論用チェックポイントで…
❤ 97 ↓ 331 apache-2.0 2026-04-22
画像生成 GitHub FlowInOne
FlowInOneは、画像を入力として画像を出力する、ビジョン中心のマルチモーダル画像生成モデルです。Image-in, Image-…
★ 96 ⑂ 5 MIT 2026-06-18
画像生成 GitHub ComfyUI-PiD
ComfyUI-PiDは、NVIDIAのPiD(Pixel Diffusion)技術をComfyUI上で利用するためのカスタムノード集です。画素拡散デ…
★ 94 ⑂ 8 MIT 2026-06-12