3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

my-lm

My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…

#Electron #GPU必須 #LLM対応

★ 1 MIT 2026-05-09

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24

ComfyUI

GitHub

ComfyUI-Selective-Sigma-Detailer

ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…

#AI/機械学習 #ComfyUIカスタムノード #GPU必須

★ 1 ⑂ 3 MIT 2026-05-10

マルチモーダル

GitHub

vlm-from-scratch

このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…

#GPU必須 #Hugging Face #Python

★ 1 MIT 2026-05-14

マルチモーダル

GitHub

obsidian-neural-central

OBSIDIAN Neuralは、音楽制作者向けのリアルタイムAI音楽生成サーバーで、OBSIDIAN Neural VSTプラグインと連携しま…

#AI音楽生成 #API #GPU必須

★ 1 AGPL-3.0 2026-06-24

ASR / 音声認識

GitHub

Welcome-to-the-Narthex-Transcripts

このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト（文字…

#CLI #GPU必須 #LLM活用

★ 1 NOASSERTION 2026-05-27

画像生成

GitHub

f1-physics-engine

F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…

#CLI #GPU必須 #HuggingFace対応

★ 1 ⑂ 1 MIT 2026-06-06

マルチモーダル

GitHub

Wally-like-Storytelling-Scene-Interactor

この「Wally-like Storytelling Scene Interactor」は、テキストを基に画像を生成し、その画像内の特定の領域をマス…

#AI #GPU必須 #ストーリーテリング

★ 1 2025-08-12

ComfyUI

GitHub

saya-comfy-couple-plus

「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…

#ComfyUI対応 #GPU必須 #Python

★ 1 2026-06-11

マルチモーダル

GitHub

uitars-mcp

UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-06-07

3D / NeRF

GitHub

sfm-monocular-reconstruction

このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …

#CLI #GPU必須 #Python

★ 1 MIT 2026-04-27

画像生成

GitHub

TBAF

TBAF（Triangle Based Activation Function）は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…

#AI/ML #CLI #GPU必須

★ 1 MIT 2026-05-25

画像生成

GitHub

badhands_scorer

「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…

#Aesthetic Scoring #CLI #ComfyUI対応

★ 1 2026-06-03

マルチモーダル

GitHub

-deepseek-skills

このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識（OCR機能を含む）と音声認識（…

#AI Skills 套装 #CLI #GPU必須

★ 1 2026-06-04

マルチモーダル

GitHub

DeepNumberVision

DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…

#CLI #GPU必須 #OpenCV

★ 1 2026-05-30

マルチモーダル

GitHub

residuos_yolov11m_gemma3

このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…

#AI/ML #CLI #Gemma

★ 1 2026-06-13

マルチモーダル

GitHub

tinyvlm-implementation

このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…

#CLI #FSDP #GPU必須

★ 1 2026-05-10

マルチモーダル

GitHub

local-asset-gen-mcp

このプロジェクトは、テキストから画像、音楽/音声、音声、さらに画像やテキストから3Dモデルを生成できるローカルAI…

#AI生成 #CLI #GPU必須

★ 1 GPL-3.0 2026-03-28

音楽生成

GitHub

MAZ-MUSIC

MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…

#AI生成 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-15

画像生成

GitHub

vision-studio

Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…

#ComfyUI対応 #GPU必須 #Python

★ 1 MIT 2026-06-21

3D / NeRF

GitHub

gsplat-mlx

gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…

#Apple Silicon #C++ #CLI

★ 1 MIT 2026-06-25

音声生成 / TTS

GitHub

speech-mcp

Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…

#CLI #GPU必須 #Python

★ 1 ⑂ 1 2026-06-17

マルチモーダル

GitHub

vlm-from-scratch-v4

Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…

#CLI #GPU必須 #マルチモーダル

★ 1 MIT 2026-05-19

マルチモーダル

GitHub

multimodal-clinical-ai

このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…

#CLI #Docker #GPU必須

★ 1 NOASSERTION 2026-05-20