3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音楽生成

GitHub

anvil-audio-v2

Anvil Audioは、Stability AIの`stable-audio-tools`を拡張し、AIオーディオ生成のためのプラグイン可能なスタジオツ…

#AI Audio Generation #Apple Silicon対応 #CLI

★ 2 MIT 2026-06-12

画像生成

GitHub

ReCo-Diff

ReCo-Diffは、スパースビューCT（低線量CT）における画像再構成のための、残差条件付き決定論的サンプリングに基づく…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-15

LLM

GitHub

flash-opd

FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…

#CLI #GPU必須 #LLM関連

★ 2 2026-04-22

動画生成

GitHub

sanatation

NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…

#Apple Silicon #CLI #GPU必須

★ 2 Apache-2.0 2026-05-21

3D / NeRF

GitHub

Ghost-Eye

Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU（ピーク時…

#3D再構築 #GPU必須 #Python

★ 1 Apache-2.0 2026-05-10

ComfyUI

GitHub

mefaihomevideoai-worker

本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…

#ComfyUI対応 #Docker #GPU必須

★ 1 Apache-2.0 2026-06-12

画像生成

GitHub

EdgeDiffusion

EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…

#CLI #GPU必須 #Python

★ 1 2026-06-07

ASR / 音声認識

GitHub

Welcome-to-the-Narthex-Transcripts

このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト（文字…

#CLI #GPU必須 #LLM活用

★ 1 NOASSERTION 2026-05-27

3D / NeRF

GitHub

Cosmo3DFlow

Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-12

画像生成

GitHub

DSCA-ReID-Framework

本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃（DSCA）」に特化した軽量なPyTor…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-28

3D / NeRF

GitHub

faster-trellis

「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…

#AI/ML #GPU必須 #Python

★ 1 NOASSERTION 2026-06-11

マルチモーダル

GitHub

blind-vision-mcp

blind-vision-mcpは、テキストベースのLLM（大規模言語モデル）に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-15

マルチモーダル

GitHub

ControlFoley_test

ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…

#CLI #GPU必須 #Hugging Face

★ 1 Apache-2.0 2026-04-17

LLM

GitHub

l40s-llm-bench

本ツールは、NVIDIA L40SなどのシングルGPU環境で再現可能なLLM推論ベンチマーク実験を行うための最小限の足場を提供…

#CLI #GPU必須 #LLMベンチマーク

★ 1 ⑂ 1 MIT 2026-06-10

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

ComfyUI

GitHub

vram8gb_comfyui_wan2.2

vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2（14…

#AI / 機械学習 #ComfyUI対応 #GPU必須

★ 1 2026-06-25

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24

マルチモーダル

GitHub

fal-ai

fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…

#AI #GPU必須 #Python

★ 1 2026-06-20

3D / NeRF

GitHub

sam-3d-spark

sam-3d-sparkは、MetaのSAM 3D（BodyおよびObjects）モデルをNVIDIA DGX Spark環境（aarch64/CUDA 13）でローカル実…

#ComfyUI対応 #Docker #FastAPI

★ 1 NOASSERTION 2026-05-03

音声生成 / TTS

GitHub

voxtral-fastapi

voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…

#CLI #GPU必須 #GUI

★ 1 2026-05-17

音声生成 / TTS

GitHub

omnivoice-gfx1150

このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU（gfx1150/Strix Point）上で動作…

#AMD ROCm #CLI #GPU必須

★ 1 MIT 2026-05-30

3D / NeRF

GitHub

classic_multiview_3d_recon

このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…

#3D再構成 #CLI #CUDA

★ 1 MIT 2026-05-10

マルチモーダル

GitHub

residuos_yolov11m_gemma3

このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…

#AI/ML #CLI #Gemma

★ 1 2026-06-13

ComfyUI

GitHub

saya-comfy-couple-plus

「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…

#ComfyUI対応 #GPU必須 #Python

★ 1 2026-06-11