3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
画像生成 GitHub AI-powered-Text-to-Image-Generator
「AI Image Generator」は、Stable Diffusionを搭載した高度なテキスト画像生成ツールです。自然言語のプロンプトか…
★ 2 MIT 2026-06-15
3D / NeRF GitHub Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
マルチモーダル GitHub residuos_yolov11m_gemma3
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…
★ 1 2026-06-13
ComfyUI GitHub saya-comfy-couple-plus
「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…
★ 1 2026-06-11
音楽生成 GitHub ai-music-studio
ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…
★ 1 NOASSERTION 2026-04-26
マルチモーダル GitHub ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
画像生成 GitHub TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
画像生成 GitHub runpod-sdxl
dwin-gharibi/runpod-sdxlは、Runpod向けのサーバーレスGPU Stable Diffusion XLワーカーで、diffusersを基盤として…
★ 1 2026-05-24
動画生成 GitHub flow
オープンソースの自律型動画生成パイプライン「Flow」。トピックを与えるだけで、LLMによるスクリプト作成、AI動画(…
★ 1 ⑂ 1 MIT 2026-06-24
3D / NeRF GitHub classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
画像生成 GitHub sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
画像生成 GitHub Pic-generator-
FLUX GENは、FLUX.1とNVIDIA NIMによるGLM-5.1プロンプトエンハンサーを搭載した、エンタープライズグレードのAI画像…
★ 1 2026-06-15
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
マルチモーダル GitHub vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
画像生成 GitHub sd-webui-forge-neo-samg
このツールは、SD WebUI Forge Neo向けのSpatial Adaptive Multi Guidance (SAMG)拡張機能です。生成画像の品質向上…
★ 1 2026-05-11
ComfyUI GitHub runpod-comfyui-controller
RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…
★ 1 MIT 2026-06-12
3D / NeRF GitHub sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
音声生成 / TTS GitHub voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
3D / NeRF GitHub sfm-monocular-reconstruction
このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …
★ 1 MIT 2026-04-27
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
画像生成 GitHub badhands_scorer
「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…
★ 1 2026-06-03