3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

動画生成

GitHub

ai-video-creator

このツールは、Claude Agent Skillとして機能し、生活の知恵に関するアイデアを、AIナレーション付きで直接公開可能…

#Claude Agent Skill #CLI #GPU必須

★ 3 MIT 2026-06-11

3D / NeRF

GitHub

TGS-SLAM

TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…

#3D Gaussian Splatting #CLI #GPU必須

★ 3 2026-05-28

3D / NeRF

GitHub

Mono-HDR-3D

Mono-HDR-3Dは、ICML 2025で発表された、単一露光の低ダイナミックレンジ（LDR）画像から高ダイナミックレンジ（HDR…

#CLI #GPU必須 #Python

★ 3 Apache-2.0 2026-04-27

音声生成 / TTS

GitHub

Stable-Audio-Insight

Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…

#CPU対応 #GPU必須 #Python

★ 3 NOASSERTION 2026-04-30

音声生成 / TTS

GitHub

ComfyUI_RH_VoxCPM

ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…

#3D/Voxel処理 #ComfyUI対応 #GPU必須

★ 3 Apache-2.0 2026-06-28

ComfyUI

GitHub

Xianxia_Studio

Xianxia Studioは、YouTube向け動画を100%オフラインで制作できるローカルAI映画制作スタジオです。テーマを入力する…

#GPU必須 #Python #Rust

★ 3 Apache-2.0 2026-06-01

マルチモーダル

GitHub

kaggle-llm-server

このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …

#CLI #GPU必須 #OpenAI互換

★ 3 ⑂ 4 2026-05-24

マルチモーダル

GitHub

LangSlice

LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…

#BrainGlobe #CLI #GPU必須

★ 3 BSD-3-Clause 2026-06-03

ComfyUI

GitHub

ComfyUI-zveroboy-photo

ComfyUI-zveroboy-photoは、AI生成画像にリアルなセンサーノイズ、アナログアーティファクト、カメラメタデータを適…

#AI生成画像 #ComfyUI対応 #GPU必須

★ 3 2026-06-29

音楽生成

GitHub

aeon-music-maker

aeon-music-makerは、テキスト記述からスタジオ品質の音楽を生成するCLIツールです。ACE Step 1.5 XLモデルを活用し…

#CLI #GPU必須 #Windows

★ 3 MIT 2026-06-23

音楽生成

GitHub

onpu

Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…

#GPU必須 #Next.js #Python

★ 3 AGPL-3.0 2026-06-15

動画生成

GitHub

ltx-descktop-unlockeds-

「LTX Desktop Unlocked」は、AIによる動画・画像生成を行うデスクトップアプリケーションのアンロック版です。従来…

#AIツール #GPU必須 #デスクトップアプリ

★ 3 Apache-2.0 2026-04-08

音声生成 / TTS

GitHub

AIBLI

AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…

#CLI #GPT-SoVITS #GPU必須

★ 3 ⑂ 1 2026-05-17

画像生成

GitHub

CTGMWorkshop

このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…

#CLI #GPU必須 #Jupyter Notebook

★ 3 Unlicense 2026-06-23

ASR / 音声認識

GitHub

taiwan-asr-toolkit

Taiwan ASR Toolkitは、台湾華語（繁体字中国語）に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…

#CLI #Colab対応 #GPU必須

★ 2 NOASSERTION 2026-05-07

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 2 ⑂ 1 MIT 2026-06-14

ComfyUI

GitHub

Prompt808

Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…

#AI/ML #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-04-25

ComfyUI

GitHub

comfyui-cinema-pipeline

このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…

#Blender連携 #ComfyUI対応 #GPU必須

★ 2 NOASSERTION 2026-06-15

マルチモーダル

GitHub

multimodal-music-genre-classifier

このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…

#CLI #GPU必須 #Jupyter Notebook

★ 2 MIT 2026-05-13

LLM

GitHub

drm_transformer

DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…

#GPU必須 #Python #PyTorch

★ 2 NOASSERTION 2026-06-17

画像生成

GitHub

SesquiLSR

SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…

#AIモデル #CLI #ComfyUI対応

★ 2 ⑂ 1 MIT 2026-06-16

ComfyUI

GitHub

ComfyUI-HiCache

ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…

#ComfyUI-Hunyuan3DWrapper #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-06-11

画像生成

GitHub

DiffVMB-pub

本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 2026-05-04

動画生成

GitHub

gemini-omni-flash

「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…

#CLI #Google Gemini API #GPU必須

★ 2 2026-05-20