3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

hexy

HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…

#AI搭載 #GPU必須 #Python

★ 3 ⑂ 1 2026-05-10

マルチモーダル

GitHub

tamart

このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…

#CLI #GPU必須 #Linux

★ 3 2026-05-25

動画生成

GitHub

bernini-studio-ui

Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…

#CLI #GPU必須 #Gradio

★ 3 Apache-2.0 2026-06-14

音楽・音声生成

GitHub

Monolith

Monolithは、LLM（大規模言語モデル）、Stable Diffusion、音声生成などに対応したローカルAIワークステーションです…

#CLI #GPU必須 #Python

★ 3 MIT 2026-03-23

ComfyUI

GitHub

comfyui-cinema-pipeline

このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…

#Blender連携 #ComfyUI対応 #GPU必須

★ 2 NOASSERTION 2026-06-15

3D / NeRF

GitHub

2D-to-Mesh

このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…

#3D再構築 #CLI #CUDA

★ 2 2026-05-31

ComfyUI

GitHub

semcanvas-ai

SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-05-13

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 2 ⑂ 1 MIT 2026-06-14

画像生成

GitHub

Heat-Diffusion

このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…

#CLI #GPU必須 #Python

★ 2 MIT 2026-05-24

マルチモーダル

GitHub

visualdocqa-kit

VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-22

3D / NeRF

GitHub

worldsplat

WorldSplatは、テキストプロンプトからナビゲーション可能な3Dガウスプラットシーンを生成するオープンソースツール…

#3D生成 #CLI #GPU必須

★ 2 NOASSERTION 2026-03-28

動画生成

GitHub

making-commercials-with-ltx-ai-video-guide

「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…

#AIビデオ生成 #CLI #ComfyUI対応

★ 2 Apache-2.0 2026-04-29

動画生成

GitHub

gemini-omni-flash

「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…

#CLI #Google Gemini API #GPU必須

★ 2 2026-05-20

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

マルチモーダル

GitHub

alpamayo-trace

この「alpamayo-trace」は、NVIDIA Alpamayo R1（Vision-Language-Actionモデル）とQwen2.5-VL（Vision-Languageモデ…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-08

画像生成

GitHub

Flux.2-Klein-Small-Decoder-Only

Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 Apache-2.0 2026-06-18

画像生成

GitHub

FluidFlow

FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-10

ComfyUI

GitHub

ComfyUI-PromptDrafter-SceneQueue

ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…

#ComfyUI対応 #GPU必須 #PromptDrafter対応

★ 2 ⑂ 1 MIT 2026-03-20

画像生成

GitHub

SwiftDiffusion

SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…

#GPU必須 #GUI #Linux対応

★ 2 ⑂ 1 MIT 2026-06-11

マルチモーダル

GitHub

video-evaluator

「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…

#GPU必須 #GUI #Windows

★ 2 MIT 2026-06-25

LLM

GitHub

drm_transformer

DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…

#GPU必須 #Python #PyTorch

★ 2 NOASSERTION 2026-06-17

ComfyUI

GitHub

ComfyUI-MemoryVisualization

ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…

#ComfyUI対応 #GPU必須 #Web UI

★ 2 2026-06-23

画像生成

GitHub

SesquiLSR

SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…

#AIモデル #CLI #ComfyUI対応

★ 2 ⑂ 1 MIT 2026-06-16

音声生成 / TTS

GitHub

NeuralForge

NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル（LLM）をファインチューニングするためのツー…

#GGUF #GPU必須 #QLoRA

★ 2 MIT 2026-06-25