3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

fal-ai

fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…

#AI #GPU必須 #Python

★ 1 2026-06-20

3D / NeRF

GitHub

sam-3d-spark

sam-3d-sparkは、MetaのSAM 3D（BodyおよびObjects）モデルをNVIDIA DGX Spark環境（aarch64/CUDA 13）でローカル実…

#ComfyUI対応 #Docker #FastAPI

★ 1 NOASSERTION 2026-05-03

音声生成 / TTS

GitHub

voxtral-fastapi

voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…

#CLI #GPU必須 #GUI

★ 1 2026-05-17

音声生成 / TTS

GitHub

omnivoice-gfx1150

このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU（gfx1150/Strix Point）上で動作…

#AMD ROCm #CLI #GPU必須

★ 1 MIT 2026-05-30

3D / NeRF

GitHub

classic_multiview_3d_recon

このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…

#3D再構成 #CLI #CUDA

★ 1 MIT 2026-05-10

マルチモーダル

GitHub

residuos_yolov11m_gemma3

このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…

#AI/ML #CLI #Gemma

★ 1 2026-06-13

ComfyUI

GitHub

saya-comfy-couple-plus

「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…

#ComfyUI対応 #GPU必須 #Python

★ 1 2026-06-11

マルチモーダル

GitHub

vlm-from-scratch-v4

Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…

#CLI #GPU必須 #マルチモーダル

★ 1 MIT 2026-05-19

音楽生成

GitHub

ai-music-studio

ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…

#AMD ROCm #Docker Compose #FastAPI

★ 1 NOASSERTION 2026-04-26

音声生成 / TTS

GitHub

echome

ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…

#CLI #Docker #GPU必須

★ 1 MIT 2026-05-07

3D / NeRF

GitHub

sfm-monocular-reconstruction

このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …

#CLI #GPU必須 #Python

★ 1 MIT 2026-04-27

画像生成

GitHub

TBAF

TBAF（Triangle Based Activation Function）は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…

#AI/ML #CLI #GPU必須

★ 1 MIT 2026-05-25

ASR / 音声認識

GitHub

Lumina-AI

Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…

#FastAPI #GPU必須 #Next.js

★ 1 2026-06-05

動画生成

GitHub

NAVA-Text-to-Video

NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …

#GPU必須 #Image-to-Video #Python

★ 1 ⑂ 1 Apache-2.0 2026-06-05

画像生成

GitHub

runpod-sdxl

dwin-gharibi/runpod-sdxlは、Runpod向けのサーバーレスGPU Stable Diffusion XLワーカーで、diffusersを基盤として…

#CLI #GPU必須 #Python

★ 1 2026-05-24

動画生成

GitHub

flow

オープンソースの自律型動画生成パイプライン「Flow」。トピックを与えるだけで、LLMによるスクリプト作成、AI動画（…

#AI Video Generation #CLI #GPU必須

★ 1 ⑂ 1 MIT 2026-06-24

マルチモーダル

GitHub

vlm-from-scratch

このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…

#GPU必須 #Hugging Face #Python

★ 1 MIT 2026-05-14

画像生成

GitHub

sonauto-ai-music-gen-saas

Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…

#AI生成 #GPU必須 #Next.js

★ 1 Apache-2.0 2026-05-14

画像生成

GitHub

Pic-generator-

FLUX GENは、FLUX.1とNVIDIA NIMによるGLM-5.1プロンプトエンハンサーを搭載した、エンタープライズグレードのAI画像…

#AI画像生成 #GPU必須 #LLM（プロンプト最適化）

★ 1 2026-06-15

音声生成 / TTS

GitHub

speech-mcp

Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…

#CLI #GPU必須 #Python

★ 1 ⑂ 1 2026-06-17

ComfyUI

GitHub

overtli-studio-suite

overtli-studio-suiteは、ComfyUIユーザー向けの強力な拡張機能で、画像、ビデオ、音声、テキスト生成といった多様な…

#AIサービス連携 #ComfyUI対応 #GPU必須

★ 1 MIT 2026-06-28

画像生成

GitHub

sd-webui-forge-neo-samg

このツールは、SD WebUI Forge Neo向けのSpatial Adaptive Multi Guidance (SAMG)拡張機能です。生成画像の品質向上…

#GPU必須 #Python #Web UI

★ 1 2026-05-11

ComfyUI

GitHub

runpod-comfyui-controller

RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…

#CLI #ComfyUI対応 #GPU必須

★ 1 MIT 2026-06-12

ASR / 音声認識

GitHub

voxtral-journal

このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…

#GPU必須 #Python #Web UI

★ 1 NOASSERTION 2026-05-14