3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

画像生成

GitHub

Heat-Diffusion

このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…

#CLI #GPU必須 #Python

★ 2 MIT 2026-05-24

マルチモーダル

GitHub

kmetbench-release

K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…

#CLI #GPU必須 #Python

★ 2 MIT 2026-05-24

3D / NeRF

GitHub

Ghost-Eye

Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU（ピーク時…

#3D再構築 #GPU必須 #Python

★ 1 Apache-2.0 2026-05-10

ComfyUI

GitHub

vram8gb_comfyui_wan2.2

vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2（14…

#AI / 機械学習 #ComfyUI対応 #GPU必須

★ 1 2026-06-25

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24

マルチモーダル

GitHub

fal-ai

fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…

#AI #GPU必須 #Python

★ 1 2026-06-20

マルチモーダル

GitHub

ControlFoley_test

ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…

#CLI #GPU必須 #Hugging Face

★ 1 Apache-2.0 2026-04-17

音声生成 / TTS

GitHub

omnivoice-gfx1150

このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU（gfx1150/Strix Point）上で動作…

#AMD ROCm #CLI #GPU必須

★ 1 MIT 2026-05-30

3D / NeRF

GitHub

classic_multiview_3d_recon

このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…

#3D再構成 #CLI #CUDA

★ 1 MIT 2026-05-10

マルチモーダル

GitHub

residuos_yolov11m_gemma3

このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…

#AI/ML #CLI #Gemma

★ 1 2026-06-13

ComfyUI

GitHub

saya-comfy-couple-plus

「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…

#ComfyUI対応 #GPU必須 #Python

★ 1 2026-06-11

マルチモーダル

GitHub

vlm-from-scratch-v4

Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…

#CLI #GPU必須 #マルチモーダル

★ 1 MIT 2026-05-19

音楽生成

GitHub

ai-music-studio

ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…

#AMD ROCm #Docker Compose #FastAPI

★ 1 NOASSERTION 2026-04-26

3D / NeRF

GitHub

sam-3d-spark

sam-3d-sparkは、MetaのSAM 3D（BodyおよびObjects）モデルをNVIDIA DGX Spark環境（aarch64/CUDA 13）でローカル実…

#ComfyUI対応 #Docker #FastAPI

★ 1 NOASSERTION 2026-05-03

音声生成 / TTS

GitHub

voxtral-fastapi

voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…

#CLI #GPU必須 #GUI

★ 1 2026-05-17

3D / NeRF

GitHub

sfm-monocular-reconstruction

このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …

#CLI #GPU必須 #Python

★ 1 MIT 2026-04-27

画像生成

GitHub

TBAF

TBAF（Triangle Based Activation Function）は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…

#AI/ML #CLI #GPU必須

★ 1 MIT 2026-05-25

ASR / 音声認識

GitHub

Lumina-AI

Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…

#FastAPI #GPU必須 #Next.js

★ 1 2026-06-05

動画生成

GitHub

NAVA-Text-to-Video

NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …

#GPU必須 #Image-to-Video #Python

★ 1 ⑂ 1 Apache-2.0 2026-06-05

画像生成

GitHub

runpod-sdxl

dwin-gharibi/runpod-sdxlは、Runpod向けのサーバーレスGPU Stable Diffusion XLワーカーで、diffusersを基盤として…

#CLI #GPU必須 #Python

★ 1 2026-05-24

動画生成

GitHub

flow

オープンソースの自律型動画生成パイプライン「Flow」。トピックを与えるだけで、LLMによるスクリプト作成、AI動画（…

#AI Video Generation #CLI #GPU必須

★ 1 ⑂ 1 MIT 2026-06-24

画像生成

GitHub

sonauto-ai-music-gen-saas

Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…

#AI生成 #GPU必須 #Next.js

★ 1 Apache-2.0 2026-05-14

画像生成

GitHub

Pic-generator-

FLUX GENは、FLUX.1とNVIDIA NIMによるGLM-5.1プロンプトエンハンサーを搭載した、エンタープライズグレードのAI画像…

#AI画像生成 #GPU必須 #LLM（プロンプト最適化）

★ 1 2026-06-15