3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

WaDi

WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…

#GPU必須 #Hugging Face #Python

★ 164 ⑂ 23 2026-05-26

マルチモーダル

GitHub

Multimodal-Recommendation-Library

MRLibは、マルチモーダル推薦システムの研究開発に特化したオープンソースライブラリです。画像、テキスト、音声など…

#CLI #GPU必須 #Python

★ 155 ⑂ 13 MIT 2026-05-08

3D / NeRF

GitHub

MAGICIAN

MAGICIANは、CVPR 2026で発表された、能動的なマッピングのための効率的な長期計画手法です。このツールは「Imagined…

#3Dマッピング #CLI #GPU必須

★ 151 ⑂ 8 2026-05-27

動画生成

GitHub

HiAR

HiARは、階層的な自己回帰型のビデオ生成ツールで、従来のブロックファースト型からステップファースト型へと処理を…

#CLI #GPU必須 #HuggingFace対応

★ 150 ⑂ 6 Apache-2.0 2026-06-19

3D / NeRF

GitHub

vgg-ttt

VGG-T³は、大規模な画像コレクションからオフラインで高速な3D再構築を可能にするツールです。CVPR'26で発表された論…

#3D再構築 #CLI #GPU必須

★ 146 ⑂ 14 NOASSERTION 2026-05-25

画像生成

GitHub

CDM

本ツールは、「Continuous-Time Distribution Matching (CDM)」技術を用いた、少ステップ拡散蒸留のためのフレームワ…

#CLI #GPU必須 #HuggingFace

★ 145 ⑂ 6 MIT 2026-05-11

ASR / 音声認識

GitHub

livecaption

livecaptionは、macOS (Apple Silicon) 向けのリアルタイムオンデバイス音声転写および翻訳を行うCLIツールです。UI…

#Apple Silicon #CLI #GPU必須

★ 144 ⑂ 18 2026-06-19

音声生成 / TTS

GitHub

Artemis

「Shiki Natsume」は、四季夏目をキャラクターとする、完全オフライン動作のAIガールフレンドプロジェクトです。Open…

#ComfyUI対応 #GPU必須 #Python

★ 144 ⑂ 8 NOASSERTION 2026-06-26

LLM

GitHub

Thinking-with-Visual-Primitives-pytorch

このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…

#GPU必須 #Hugging Face #LLM

★ 140 ⑂ 18 MIT 2026-06-25

音声生成 / TTS

GitHub

controlfoley

ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…

#ClawHub #GPU必須 #HuggingFace

★ 138 ⑂ 3 Apache-2.0 2026-06-11

マルチモーダル

GitHub

GEMS

GEMSは、エージェントネイティブなマルチモーダル生成のための先進的なフレームワークです。記憶とスキルを活用し、K…

#Agent-based #CLI #GPU必須

★ 137 ⑂ 10 2026-04-01

ComfyUI

GitHub

ComfyUI-Depth-Anything-Tensorrt

「ComfyUI Depth Anything TensorRT」は、人気のある画像生成UIであるComfyUI向けのカスタムノードで、Depth Anythin…

#ComfyUI対応 #GPU必須 #Python

★ 133 ⑂ 14 NOASSERTION 2026-06-04

音声生成 / TTS

GitHub

VTS

VTS（Voice To Sound）は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…

#CLI #GPU必須 #Hugging Face

★ 131 ⑂ 4 MIT 2026-06-18

動画生成

GitHub

EffectErase

「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…

#CLI #GPU必須 #Hugging Face

★ 128 ⑂ 7 NOASSERTION 2026-04-10

マルチモーダル

GitHub

count-anything

Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…

#CLI #GPU必須 #Hugging Face

★ 127 ⑂ 6 Apache-2.0 2026-06-04

LLM

GitHub

VidCom2

VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワーク…

#CLI #GPU必須 #Python

★ 126 ⑂ 14 Apache-2.0 2026-05-14

画像生成

GitHub

Spectrum

「Spectrum」は、学習不要なスペクトル拡散特徴予測を用いて、拡散モデルのサンプリング速度を大幅に向上させるツー…

#CLI #ComfyUI対応 #GPU必須

★ 125 ⑂ 7 MIT 2026-04-30

動画生成

GitHub

PSIVG

このリポジトリは、CVPR 2026で発表される研究プロジェクト「Physical Simulator In-the-Loop Video Generation」の…

#CLI #GPU必須 #コンピュータビジョン

★ 125 ⑂ 14 Apache-2.0 2026-06-01

マルチモーダル

GitHub

ScreenMind

ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…

#AI #GPU必須 #Python

★ 123 ⑂ 6 MIT 2026-06-23

動画生成

GitHub

Echo-Memory

Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…

#CLI #GPU必須 #Hugging Face対応

★ 119 ⑂ 6 2026-06-25

3D / NeRF

GitHub

gaussian-point-splatting

本ツールは、独自の確率的なアプローチ「Gaussian Point Splatting」により、数億個に及ぶ大規模な3D Gaussian Splat…

#3Dグラフィックス #CLI #CUDA対応

★ 116 ⑂ 10 BSD-3-Clause 2026-06-05

画像生成

GitHub

guaardvark

Guaardvarkは、自己ホスト型AIワークステーションであり、自律型スクリーンエージェント、3層ニューラルルーティング…

#AIエージェント #GPU必須 #Web UI

★ 115 ⑂ 27 MIT 2026-06-28

3D / NeRF

GitHub

NAS3R

NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…

#CLI #GPU必須 #Hugging Face

★ 114 ⑂ 8 MIT 2026-05-12

ComfyUI

GitHub

ComfyUI-Woosh

ComfyUI-Wooshは、ComfyUI向けのサウンドエフェクト生成ノード集です。Sony AIのWoosh基盤モデルを活用し、テキスト…

#ComfyUI対応 #GPU必須 #Python

★ 112 ⑂ 7 MIT 2026-05-07