3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

minimind-v

MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…

#Apache 2.0 License #CLI #GPU必須

★ 8.2k ⑂ 897 Apache-2.0 2026-05-19

3D / NeRF

GitHub

LiveTalking

LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…

#CLI #GPU必須 #Linux

★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20

画像生成

GitHub

MochiDiffusion

Mochi Diffusionは、Apple Silicon搭載Mac向けに最適化されたStable DiffusionおよびFLUX.2 Kleinのネイティブアプリ…

#Apple Silicon対応 #Core ML #GPU必須

★ 7.9k ⑂ 363 GPL-3.0 2026-06-21

マルチモーダル

GitHub

vllm-omni

vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…

#CLI #Diffusionモデル #GPU必須

★ 5.3k ⑂ 1.2k Apache-2.0 2026-06-29

3D / NeRF

GitHub

gsplat

gsplatは、3D Gaussian Splatting技術のCUDA高速化ラスタライゼーションを実現するオープンソースライブラリで、Pyth…

#CLI #GPU必須 #Python

★ 5.3k ⑂ 884 Apache-2.0 2026-06-23

ASR / 音声認識

GitHub

wenet

WeNetは、「Production First and Production Ready」を掲げるエンドツーエンド音声認識ツールキットです。最先端の…

#CLI #GPU必須 #NPU対応

★ 5.2k ⑂ 1.2k Apache-2.0 2026-06-15

3D / NeRF

GitHub

kaolin

NVIDIA Kaolinは、3D深層学習研究を加速するために設計されたPyTorchライブラリです。GPUに最適化された操作群を提供…

#3D深層学習 #GPU必須 #Jupyter Notebook

★ 5.1k ⑂ 624 Apache-2.0 2026-06-18

画像生成

GitHub

transformerlab-app

Transformer Labは、AI研究者向けに設計されたオープンソースの機械学習プラットフォームです。モデルの訓練、評価、…

#GPU必須 #Python #Web UI

★ 5.1k ⑂ 535 AGPL-3.0 2026-06-25

マルチモーダル

GitHub

mlx-vlm

MLX-VLMは、Apple Silicon Mac上でMLXを利用してVision Language Models（VLM）および音声・動画対応のOmni Modelsの…

#CLI #GPU必須 #Mac対応

★ 5.1k ⑂ 645 MIT 2026-06-24

マルチモーダル

GitHub

PixelRAG

PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…

#Claude対応 #CLI #GPU必須

★ 5.0k ⑂ 387 Apache-2.0 2026-06-24

3D / NeRF

GitHub

tiny-cuda-nn

NVlabs/tiny-cuda-nnは、高速なC++/CUDAベースのニューラルネットワークフレームワークです。「完全に融合された」多…

#C++ #CLI #CUDA

★ 4.5k ⑂ 574 NOASSERTION 2026-04-21

動画生成

GitHub

HunyuanVideo-1.5

HunyuanVideo-1.5は、わずか8.3Bのパラメーターでトップクラスの品質を提供する軽量な動画生成モデルです。コンシュ…

#ComfyUI対応 #GPU必須 #LoRA対応

★ 4.5k ⑂ 229 NOASSERTION 2026-04-10

マルチモーダル

GitHub

lmms-eval

lmms-evalは、テキスト、画像、ビデオ、オーディオといった様々なモダリティを横断する、オールインワンのマルチモー…

#CLI #GPU必須 #Python

★ 4.3k ⑂ 605 NOASSERTION 2026-06-24

ComfyUI

GitHub

SwarmUI

SwarmUIは、AI画像生成に特化したモジュール式のWebユーザーインターフェースで、Stable DiffusionなどのAI画像モデ…

#AI動画生成 #AI画像生成 #GPU必須

★ 4.2k ⑂ 420 MIT 2026-06-23

音楽生成

GitHub

ace-step-ui

ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…

#GPU必須 #Python #React

★ 4.2k ⑂ 629 2026-06-04

動画生成

GitHub

lingbot-world

LingBot-Worldは、ビデオ生成技術を基盤としたオープンソースの世界シミュレーター（ワールドモデル）です。リアルタ…

#CLI #GPU必須 #HuggingFace

★ 4.0k ⑂ 363 Apache-2.0 2026-05-22

動画生成

GitHub

ComfyUI-LTXVideo

ComfyUI-LTXVideoは、人気の画像生成Web UIであるComfyUIの機能を拡張し、LTX-2動画生成モデルを最大限に活用するた…

#ComfyUI対応 #GPU必須 #Python

★ 3.8k ⑂ 439 NOASSERTION 2026-06-17

動画生成

GitHub

FastVideo

FastVideoは、ビデオ生成を高速化するための統合された推論および後処理フレームワークです。最先端のビデオ生成モデ…

#CLI #GPU必須 #Linux対応

★ 3.8k ⑂ 370 Apache-2.0 2026-06-26

画像生成

GitHub

remove-ai-watermarks

「Remove-AI-Watermarks」は、Google Gemini、ChatGPT/DALL-E、Stable Diffusion、Adobe Firefly、Midjourneyなど、…

#CLI #ComfyUI対応 #GPU必須

★ 3.7k ⑂ 334 Apache-2.0 2026-06-26

動画生成

GitHub

MAGI-1

MAGI-1は、大規模な自己回帰型動画生成を実現する革新的なツールです。Sand AIによって開発され、学術論文（arXiv）…

#AI/機械学習 #GPU必須 #プロダクト

★ 3.7k ⑂ 238 Apache-2.0 2026-06-17

画像生成

GitHub

TurboDiffusion

TurboDiffusionは、ビデオ拡散モデルによる動画生成を100〜200倍に高速化するフレームワークです。単一のRTX 5090な…

#CLI #GPU必須 #Python

★ 3.5k ⑂ 267 Apache-2.0 2026-06-17

3D / NeRF

GitHub

map-anything

MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…

#3D再構築 #CLI #GPU必須

★ 3.5k ⑂ 269 Apache-2.0 2026-06-03

音声生成 / TTS

GitHub

TTS-WebUI

TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ（TTS）、音…

#Docker対応 #GPU必須 #Gradio

★ 3.2k ⑂ 326 MIT 2026-05-14

動画生成

GitHub

Stable-Diffusion

Dr. Furkan Gözükara氏によるジェネレーティブAIに関する専門的なチュートリアル、研究、開発リソース集です。Stable…

#ComfyUI対応 #Google Colab #GPU必須

★ 2.7k ⑂ 364 GPL-3.0 2026-06-18