3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

動画生成

GitHub

awesome-seedance-2-guide

Seedance 2.0は、画像、動画、音声、テキストの4つのモダリティを同時に入力として受け付け、自然言語で詳細な効果を…

#AI動画生成 #API #GPU必須

★ 389 ⑂ 46 NOASSERTION 2026-06-15

AIエージェント

GitHub

late-cli

Late CLIは、AI開発チームの作業を効率的にオーケストレーションするためのCLIツールです。エフェメラルなサブエージ…

#AIエージェントオーケストレーション #CLI #GPU必須

★ 365 ⑂ 37 NOASSERTION 2026-06-25

LLM

GitHub

tessera

Tesseraは、大規模なLLM（教師モデル）を小型のLLM（生徒モデル）に蒸留し、その生徒モデルを効率的に提供することを…

#CLI #GPU必須 #LLM蒸留

★ 359 ⑂ 4 NOASSERTION 2026-06-05

3D / NeRF

GitHub

sam-body4d

SAM-Body4Dは、動画からトレーニング不要で一時的に一貫性のある堅牢な4D人体メッシュを復元するツールです。SAM-3、…

#CLI #GPU必須 #Hugging Face

★ 351 ⑂ 33 MIT 2026-05-11

3D / NeRF

GitHub

OmniVGGT-official

OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…

#3D幾何学 #CLI #GPU必須

★ 339 ⑂ 28 MIT 2026-05-21

画像生成

GitHub

RefAlign

RefAlignは、参照画像をもとに動画を生成するReference-to-Video向けのPyTorch実装です。学習時にDiTの参照分岐特徴…

#CLI #GPU必須 #学習済みモデルあり

★ 321 ⑂ 20 NOASSERTION 2026-06-19

LLM

GitHub

NexusRAG

NexusRAGは、ベクトル検索、ナレッジグラフ、クロスエンコーダー再ランキングを統合した高度なハイブリッドRAGシステ…

#Docker #FastAPI #Gemini対応

★ 321 ⑂ 65 2026-04-20

画像生成

GitHub

Hallo-Live

Hallo-Liveは、テキスト入力からリアルタイムでアバターのビデオと音声を生成する先進的なフレームワークです。因果…

#GPU必須 #HuggingFace対応 #リアルタイム

★ 310 ⑂ 50 MIT 2026-06-24

LLM

GitHub

TurboOCR

TurboOCRは、C++、CUDA、TensorRT技術を活用した高速GPU OCRサーバーです。FUNSDデータセットで270 img/s、疎な画像…

#C++ #GPU必須 #Linux対応

★ 301 ⑂ 36 MIT 2026-06-11

動画生成

GitHub

Kiwi-Edit

Kiwi-Editは、自然言語の指示と参照画像を活用した多機能な動画編集を可能にする、完全にオープンソースのフレームワ…

#CLI #GPU必須 #Hugging Face

★ 295 ⑂ 24 MIT 2026-05-13

ASR / 音声認識

GitHub

parakeet.cpp

parakeet.cppは、NVIDIAのParakeet音声認識モデルを超高速でC++に実装し、デバイス上での推論を可能にするライブラリ…

#Apple Silicon対応 #C API #C++

★ 295 ⑂ 13 MIT 2026-05-04

3D / NeRF

GitHub

video_to_world

本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…

#3D再構築 #CLI #conda

★ 258 ⑂ 23 MIT 2026-04-27

動画生成

GitHub

HyDRA

HyDRAは、動的なビデオ世界モデルにおいて、視界外に移動した被写体の追跡と動きの連続性維持を可能にするハイブリッ…

#GPU必須 #Hugging Face #Python

★ 258 ⑂ 14 2026-04-29

ComfyUI

GitHub

ComfyUI-Whisper

ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張…

#ComfyUI対応 #GPU必須 #Whisper対応

★ 247 ⑂ 39 NOASSERTION 2026-06-07

画像生成

GitHub

Local-AI-Image-Generator

「Local AI Image Generator」は、Windowsユーザー向けに設計された、セットアップ不要のAI画像生成デスクトップツー…

#GPU必須 #Safetensors/GGUF対応 #Stable Diffusion

★ 241 ⑂ 81 MIT 2026-06-25

ComfyUI

GitHub

ComfyUI-Pixaroma

ComfyUI Pixaromaは、Stable DiffusionのWeb UIであるComfyUIのワークフローを、プロフェッショナルグレードのクリエ…

#3D #ComfyUI対応 #GPU必須

★ 237 ⑂ 17 MIT 2026-06-26

画像生成

GitHub

MultiWorld

MultiWorldは、マルチエージェント・マルチビュービデオ世界モデルのための統合フレームワークです。複数のエージェ…

#CLI #Conda環境 #GPU必須

★ 237 ⑂ 12 NOASSERTION 2026-05-12

LLM

GitHub

steerling

Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。…

#CLI #GPU必須 #HuggingFace

★ 229 ⑂ 14 Apache-2.0 2026-06-24

3D / NeRF

GitHub

gsplat-unity

gsplat-unityは、Unity 2021以降で3D Gaussian Splatting (3DGS) をレンダリングするためのパッケージです。PlayCanv…

#3DGS #GPU必須 #Unity

★ 223 ⑂ 28 MIT 2026-06-22

3D / NeRF

GitHub

TokenGS

TokenGSは、自己教師ありレンダリング目的で3Dガウスを予測する革新的なツールです。学習可能なガウストークンをエン…

#3D Gaussian Splatting #CLI #CUDA

★ 221 ⑂ 7 Apache-2.0 2026-06-15

動画生成

GitHub

VEFX-Bench

VEFX-Benchは、テキスト駆動型ビデオ編集および視覚効果の総合的な評価ベンチマークです。5,049件のアノテーション付…

#CLI #GPU必須 #HuggingFace対応

★ 214 ⑂ 16 Apache-2.0 2026-05-16

マルチモーダル

nemotron-ocr-v2

Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OC…

#GPU必須 #Linux #NVIDIA GPU対応

❤ 212 ↓ 14.2k other 2026-05-22

マルチモーダル

GitHub

autoresearch-qwen

autoresearch-qwenは、Qwen3-VL-4B-InstructモデルをDocumentVQAベンチマークで自律的に改善することを目的とした研…

#CLI #GPU必須 #Python

★ 211 ⑂ 33 MIT 2026-06-14

マルチモーダル

Qwopus3.6-35B-A3B-v1-GGUF

Qwopus3.6-35B-A3B-v1-GGUFは、Qwen3.6-35B-A3BをベースにLoRAで推論能力を強化した実験的なGGUF形式モデルです。35B…

#GGUF #GPU必須 #ツール呼び出し対応

❤ 210 ↓ 215.4k apache-2.0 2026-05-28