3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
3D / NeRF
GitHub
LiveTalking
LiveTalkingは、リアルタイムでインタラクティブなストリーミングデジタルヒューマンを作成・操作するためのツールで…
★ 8.0k ⑂ 1.3k Apache-2.0 2026-06-20
画像生成
GitHub
MochiDiffusion
Mochi Diffusionは、Apple Silicon搭載Mac向けに最適化されたStable DiffusionおよびFLUX.2 Kleinのネイティブアプリ…
★ 7.9k ⑂ 363 GPL-3.0 2026-06-21
マルチモーダル
GitHub
vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 5.3k ⑂ 1.2k Apache-2.0 2026-06-29
3D / NeRF
GitHub
gsplat
gsplatは、3D Gaussian Splatting技術のCUDA高速化ラスタライゼーションを実現するオープンソースライブラリで、Pyth…
★ 5.3k ⑂ 884 Apache-2.0 2026-06-23
ASR / 音声認識
GitHub
wenet
WeNetは、「Production First and Production Ready」を掲げるエンドツーエンド音声認識ツールキットです。最先端の…
★ 5.2k ⑂ 1.2k Apache-2.0 2026-06-15
3D / NeRF
GitHub
kaolin
NVIDIA Kaolinは、3D深層学習研究を加速するために設計されたPyTorchライブラリです。GPUに最適化された操作群を提供…
★ 5.1k ⑂ 624 Apache-2.0 2026-06-18
画像生成
GitHub
transformerlab-app
Transformer Labは、AI研究者向けに設計されたオープンソースの機械学習プラットフォームです。モデルの訓練、評価、…
★ 5.1k ⑂ 535 AGPL-3.0 2026-06-25
マルチモーダル
GitHub
mlx-vlm
MLX-VLMは、Apple Silicon Mac上でMLXを利用してVision Language Models(VLM)および音声・動画対応のOmni Modelsの…
★ 5.1k ⑂ 645 MIT 2026-06-24
マルチモーダル
GitHub
PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5.0k ⑂ 387 Apache-2.0 2026-06-24
3D / NeRF
GitHub
tiny-cuda-nn
NVlabs/tiny-cuda-nnは、高速なC++/CUDAベースのニューラルネットワークフレームワークです。「完全に融合された」多…
★ 4.5k ⑂ 574 NOASSERTION 2026-04-21
動画生成
GitHub
HunyuanVideo-1.5
HunyuanVideo-1.5は、わずか8.3Bのパラメーターでトップクラスの品質を提供する軽量な動画生成モデルです。コンシュ…
★ 4.5k ⑂ 229 NOASSERTION 2026-04-10
マルチモーダル
GitHub
lmms-eval
lmms-evalは、テキスト、画像、ビデオ、オーディオといった様々なモダリティを横断する、オールインワンのマルチモー…
★ 4.3k ⑂ 605 NOASSERTION 2026-06-24
ComfyUI
GitHub
SwarmUI
SwarmUIは、AI画像生成に特化したモジュール式のWebユーザーインターフェースで、Stable DiffusionなどのAI画像モデ…
★ 4.2k ⑂ 420 MIT 2026-06-23
音楽生成
GitHub
ace-step-ui
ACE-Step UIは、オープンソースのAI音楽生成モデル「ACE-Step 1.5」のためのプロフェッショナルなユーザーインターフ…
★ 4.2k ⑂ 629 2026-06-04
動画生成
GitHub
lingbot-world
LingBot-Worldは、ビデオ生成技術を基盤としたオープンソースの世界シミュレーター(ワールドモデル)です。リアルタ…
★ 4.0k ⑂ 363 Apache-2.0 2026-05-22
動画生成
GitHub
ComfyUI-LTXVideo
ComfyUI-LTXVideoは、人気の画像生成Web UIであるComfyUIの機能を拡張し、LTX-2動画生成モデルを最大限に活用するた…
★ 3.8k ⑂ 439 NOASSERTION 2026-06-17
動画生成
GitHub
FastVideo
FastVideoは、ビデオ生成を高速化するための統合された推論および後処理フレームワークです。最先端のビデオ生成モデ…
★ 3.8k ⑂ 370 Apache-2.0 2026-06-26
画像生成
GitHub
remove-ai-watermarks
「Remove-AI-Watermarks」は、Google Gemini、ChatGPT/DALL-E、Stable Diffusion、Adobe Firefly、Midjourneyなど、…
★ 3.7k ⑂ 334 Apache-2.0 2026-06-26
動画生成
GitHub
MAGI-1
MAGI-1は、大規模な自己回帰型動画生成を実現する革新的なツールです。Sand AIによって開発され、学術論文(arXiv)…
★ 3.7k ⑂ 238 Apache-2.0 2026-06-17
画像生成
GitHub
TurboDiffusion
TurboDiffusionは、ビデオ拡散モデルによる動画生成を100〜200倍に高速化するフレームワークです。単一のRTX 5090な…
★ 3.5k ⑂ 267 Apache-2.0 2026-06-17
3D / NeRF
GitHub
map-anything
MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…
★ 3.5k ⑂ 269 Apache-2.0 2026-06-03
音声生成 / TTS
GitHub
TTS-WebUI
TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ(TTS)、音…
★ 3.2k ⑂ 326 MIT 2026-05-14
動画生成
GitHub
Stable-Diffusion
Dr. Furkan Gözükara氏によるジェネレーティブAIに関する専門的なチュートリアル、研究、開発リソース集です。Stable…
★ 2.7k ⑂ 364 GPL-3.0 2026-06-18