3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub WaDi
WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…
★ 164 ⑂ 23 2026-05-26
マルチモーダル GitHub Multimodal-Recommendation-Library
MRLibは、マルチモーダル推薦システムの研究開発に特化したオープンソースライブラリです。画像、テキスト、音声など…
★ 155 ⑂ 13 MIT 2026-05-08
3D / NeRF GitHub MAGICIAN
MAGICIANは、CVPR 2026で発表された、能動的なマッピングのための効率的な長期計画手法です。このツールは「Imagined…
★ 151 ⑂ 8 2026-05-27
動画生成 GitHub HiAR
HiARは、階層的な自己回帰型のビデオ生成ツールで、従来のブロックファースト型からステップファースト型へと処理を…
★ 150 ⑂ 6 Apache-2.0 2026-06-19
3D / NeRF GitHub vgg-ttt
VGG-T³は、大規模な画像コレクションからオフラインで高速な3D再構築を可能にするツールです。CVPR'26で発表された論…
★ 146 ⑂ 14 NOASSERTION 2026-05-25
画像生成 GitHub CDM
本ツールは、「Continuous-Time Distribution Matching (CDM)」技術を用いた、少ステップ拡散蒸留のためのフレームワ…
★ 145 ⑂ 6 MIT 2026-05-11
ASR / 音声認識 GitHub livecaption
livecaptionは、macOS (Apple Silicon) 向けのリアルタイムオンデバイス音声転写および翻訳を行うCLIツールです。UI…
★ 144 ⑂ 18 2026-06-19
音声生成 / TTS GitHub Artemis
「Shiki Natsume」は、四季夏目をキャラクターとする、完全オフライン動作のAIガールフレンドプロジェクトです。Open…
★ 144 ⑂ 8 NOASSERTION 2026-06-26
LLM GitHub Thinking-with-Visual-Primitives-pytorch
このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…
★ 140 ⑂ 18 MIT 2026-06-25
音声生成 / TTS GitHub controlfoley
ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…
★ 138 ⑂ 3 Apache-2.0 2026-06-11
マルチモーダル GitHub GEMS
GEMSは、エージェントネイティブなマルチモーダル生成のための先進的なフレームワークです。記憶とスキルを活用し、K…
★ 137 ⑂ 10 2026-04-01
ComfyUI GitHub ComfyUI-Depth-Anything-Tensorrt
「ComfyUI Depth Anything TensorRT」は、人気のある画像生成UIであるComfyUI向けのカスタムノードで、Depth Anythin…
★ 133 ⑂ 14 NOASSERTION 2026-06-04
音声生成 / TTS GitHub VTS
VTS(Voice To Sound)は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…
★ 131 ⑂ 4 MIT 2026-06-18
動画生成 GitHub EffectErase
「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…
★ 128 ⑂ 7 NOASSERTION 2026-04-10
マルチモーダル GitHub count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 127 ⑂ 6 Apache-2.0 2026-06-04
LLM GitHub VidCom2
VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワーク…
★ 126 ⑂ 14 Apache-2.0 2026-05-14
画像生成 GitHub Spectrum
「Spectrum」は、学習不要なスペクトル拡散特徴予測を用いて、拡散モデルのサンプリング速度を大幅に向上させるツー…
★ 125 ⑂ 7 MIT 2026-04-30
動画生成 GitHub PSIVG
このリポジトリは、CVPR 2026で発表される研究プロジェクト「Physical Simulator In-the-Loop Video Generation」の…
★ 125 ⑂ 14 Apache-2.0 2026-06-01
マルチモーダル GitHub ScreenMind
ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…
★ 123 ⑂ 6 MIT 2026-06-23
動画生成 GitHub Echo-Memory
Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…
★ 119 ⑂ 6 2026-06-25
3D / NeRF GitHub gaussian-point-splatting
本ツールは、独自の確率的なアプローチ「Gaussian Point Splatting」により、数億個に及ぶ大規模な3D Gaussian Splat…
★ 116 ⑂ 10 BSD-3-Clause 2026-06-05
画像生成 GitHub guaardvark
Guaardvarkは、自己ホスト型AIワークステーションであり、自律型スクリーンエージェント、3層ニューラルルーティング…
★ 115 ⑂ 27 MIT 2026-06-28
3D / NeRF GitHub NAS3R
NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…
★ 114 ⑂ 8 MIT 2026-05-12
ComfyUI GitHub ComfyUI-Woosh
ComfyUI-Wooshは、ComfyUI向けのサウンドエフェクト生成ノード集です。Sony AIのWoosh基盤モデルを活用し、テキスト…
★ 112 ⑂ 7 MIT 2026-05-07