3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

その他

GitHub

Neural-Zero-Shot-Voice-Cloning

本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…

#Docker #GPU必須 #Python

★ 2 MIT 2026-06-11

LLM

GitHub

drm_transformer

DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…

#GPU必須 #Python #PyTorch

★ 2 NOASSERTION 2026-06-17

ASR / 音声認識

GitHub

taiwan-asr-toolkit

Taiwan ASR Toolkitは、台湾華語（繁体字中国語）に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…

#CLI #Colab対応 #GPU必須

★ 2 NOASSERTION 2026-05-07

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 2 ⑂ 1 MIT 2026-06-14

ComfyUI

GitHub

Prompt808

Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…

#AI/ML #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-04-25

ComfyUI

GitHub

comfyui-cinema-pipeline

このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…

#Blender連携 #ComfyUI対応 #GPU必須

★ 2 NOASSERTION 2026-06-15

画像生成

GitHub

DiffVMB-pub

本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 2026-05-04

画像生成

GitHub

SesquiLSR

SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…

#AIモデル #CLI #ComfyUI対応

★ 2 ⑂ 1 MIT 2026-06-16

ComfyUI

GitHub

ComfyUI-HiCache

ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…

#ComfyUI-Hunyuan3DWrapper #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-06-11

音声生成 / TTS

GitHub

Project-Siren

Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成（TTS）モデルを作成するための、エ…

#CLI #GPU必須 #HuggingFace

★ 2 2026-05-04

動画生成

GitHub

gemini-omni-flash

「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…

#CLI #Google Gemini API #GPU必須

★ 2 2026-05-20

ComfyUI

GitHub

awesome-ai-video

このリポジトリは、最新のAIテキスト・画像-to-ビデオモデル、ツール、リソースを厳選したリストです。2026年半ばに…

#API #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 CC0-1.0 2026-06-03

3D / NeRF

GitHub

2D-to-Mesh

このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…

#3D再構築 #CLI #CUDA

★ 2 2026-05-31

3D / NeRF

GitHub

Metal-Node

Metal Composerは、macOS向けのノードベースのビジュアルプログラミングアプリです。リアルタイムMetalシェーダー、…

#GPU必須 #macOS #Syphon対応

★ 2 2026-05-29

マルチモーダル

GitHub

omni-retrieval

omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-06-08

3D / NeRF

GitHub

diff-4d-gaussian-rasterization

このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…

#CLI #CUDA #GPU必須

★ 2 NOASSERTION 2026-05-13

音声生成 / TTS

GitHub

strands-omnivoice

strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-16

画像生成

GitHub

FluidFlow

FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-10

画像生成

GitHub

sdxl_container

SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…

#CLI #Docker #GPU必須

★ 2 Apache-2.0 2026-05-27

マルチモーダル

GitHub

alpamayo-trace

この「alpamayo-trace」は、NVIDIA Alpamayo R1（Vision-Language-Actionモデル）とQwen2.5-VL（Vision-Languageモデ…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-08

ComfyUI

GitHub

semcanvas-ai

SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-05-13

ASR / 音声認識

GitHub

YanXi-KCN

Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…

#CLI #GPU必須 #Python

★ 2 2026-05-29

音楽生成

GitHub

portable-music-server

Windows向けのポータブルなマルチGPU音楽生成サーバーで、8種類のモデルを搭載。ワンクリックインストールで依存関係…

#CLI #GPU必須 #Python

★ 2 MIT 2026-04-26

画像生成

GitHub

rainfield-diffusion-models

本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…

#CLI #GPU必須 #Python

★ 2 NOASSERTION 2026-05-21