3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF

GitHub

2D-to-Mesh

このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…

#3D再構築 #CLI #CUDA

★ 2 2026-05-31

ComfyUI

GitHub

semcanvas-ai

SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-05-13

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 2 ⑂ 1 MIT 2026-06-14

画像生成

GitHub

Heat-Diffusion

このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…

#CLI #GPU必須 #Python

★ 2 MIT 2026-05-24

マルチモーダル

GitHub

visualdocqa-kit

VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-22

3D / NeRF

GitHub

worldsplat

WorldSplatは、テキストプロンプトからナビゲーション可能な3Dガウスプラットシーンを生成するオープンソースツール…

#3D生成 #CLI #GPU必須

★ 2 NOASSERTION 2026-03-28

動画生成

GitHub

making-commercials-with-ltx-ai-video-guide

「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…

#AIビデオ生成 #CLI #ComfyUI対応

★ 2 Apache-2.0 2026-04-29

動画生成

GitHub

gemini-omni-flash

「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…

#CLI #Google Gemini API #GPU必須

★ 2 2026-05-20

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

マルチモーダル

GitHub

alpamayo-trace

この「alpamayo-trace」は、NVIDIA Alpamayo R1（Vision-Language-Actionモデル）とQwen2.5-VL（Vision-Languageモデ…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-08

画像生成

GitHub

Flux.2-Klein-Small-Decoder-Only

Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 Apache-2.0 2026-06-18

画像生成

GitHub

FluidFlow

FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-10

ComfyUI

GitHub

ComfyUI-PromptDrafter-SceneQueue

ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…

#ComfyUI対応 #GPU必須 #PromptDrafter対応

★ 2 ⑂ 1 MIT 2026-03-20

画像生成

GitHub

SwiftDiffusion

SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…

#GPU必須 #GUI #Linux対応

★ 2 ⑂ 1 MIT 2026-06-11

マルチモーダル

GitHub

video-evaluator

「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…

#GPU必須 #GUI #Windows

★ 2 MIT 2026-06-25

LLM

GitHub

drm_transformer

DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…

#GPU必須 #Python #PyTorch

★ 2 NOASSERTION 2026-06-17

ComfyUI

GitHub

ComfyUI-MemoryVisualization

ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…

#ComfyUI対応 #GPU必須 #Web UI

★ 2 2026-06-23

画像生成

GitHub

SesquiLSR

SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…

#AIモデル #CLI #ComfyUI対応

★ 2 ⑂ 1 MIT 2026-06-16

音声生成 / TTS

GitHub

NeuralForge

NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル（LLM）をファインチューニングするためのツー…

#GGUF #GPU必須 #QLoRA

★ 2 MIT 2026-06-25

マルチモーダル

GitHub

omni-retrieval

omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-06-08

音声生成 / TTS

GitHub

Project-Siren

Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成（TTS）モデルを作成するための、エ…

#CLI #GPU必須 #HuggingFace

★ 2 2026-05-04

LLM

GitHub

flash-opd

FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…

#CLI #GPU必須 #LLM関連

★ 2 2026-04-22

画像生成

GitHub

rainfield-diffusion-models

本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…

#CLI #GPU必須 #Python

★ 2 NOASSERTION 2026-05-21

画像生成

GitHub

ernie-image-mlx

ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…

#CLI #GPU必須 #macOS

★ 2 ⑂ 1 MIT 2026-05-22