3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
ComfyUI
GitHub
comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
3D / NeRF
GitHub
Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
画像生成
GitHub
sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
マルチモーダル
GitHub
DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30
マルチモーダル
GitHub
ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
ComfyUI
GitHub
ComfyUI-Flux2KontextConditioner
ComfyUI-Flux2KontextConditionerは、ComfyUIのFlux2 Kontext - Klein画像編集ワークフローを強化する高度なコンディ…
★ 1 ⑂ 1 MIT 2026-06-01
3D / NeRF
GitHub
SparseNeRF-pytorch
本ツールは、SparseNeRFに触発された、スパースビュー(少数の視点からの画像)からの新しい視点合成を目的とした非…
★ 1 MIT 2026-06-07
画像生成
GitHub
generative-modeling-scientific
このリポジトリは、科学計算タスクに適用されるスコアベースの生成モデルの研究用ベンチマークフレームワークです。…
★ 1 2026-06-13
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
動画生成
GitHub
comfyui-cinema-worldbuilder
Cinema Worldbuilderは、ComfyUI上でLTX 2.3ビデオ生成を強力に支援するカスタムノードパックです。このツールは、Ca…
★ 1 MIT 2026-05-20
画像生成
GitHub
comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
マルチモーダル
GitHub
vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
音声生成 / TTS
GitHub
mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
画像生成
GitHub
anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
音声生成 / TTS
GitHub
voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
3D / NeRF
GitHub
sfm-monocular-reconstruction
このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …
★ 1 MIT 2026-04-27
音楽生成
GitHub
rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
3D / NeRF
GitHub
Gaussian-Splatting
本プロジェクトは、現実世界の画像データから3D Gaussian Splatting技術を用いてTH OWLキャンパスの建物を高精度に再…
★ 1 2026-05-27
ComfyUI
GitHub
ComfyUI-Distributed-Setup
ComfyUI-Distributed-Setupは、単一のComfyUIインターフェースから複数のマシンに分散された複数のGPUリソースを効率…
★ 1 ⑂ 1 2026-06-10
マルチモーダル
GitHub
FootPrint
FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…
★ 1 MIT 2026-05-18
画像生成
GitHub
reel-forge
reel-forgeは、AIを活用したInstagram Reels動画生成ツールです。人物の静止画と参照となるダンスリール動画を入力す…
★ 1 ⑂ 5 MIT 2026-05-19
ASR / 音声認識
GitHub
funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14