3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

マルチモーダル

GitHub

visualdocqa-kit

VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-22

マルチモーダル

GitHub

kmetbench-release

K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-24

画像生成

GitHub

hermes-image-local-tools

この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-06-03

ComfyUI

GitHub

LoRA-Gallery-Loader—Custom-Node

「LoRA Gallery Node for ComfyUI」は、画像生成AIツールComfyUI用のカスタムノードです。このツールは、LoRA（Low-R…

#ComfyUI対応 #GPU必須 #Python

★ 2 ⑂ 1 2026-04-18

画像生成

GitHub

AI-powered-Text-to-Image-Generator

「AI Image Generator」は、Stable Diffusionを搭載した高度なテキスト画像生成ツールです。自然言語のプロンプトか…

#FastAPI #GPU必須 #Python

★ 2 MIT 2026-06-24

LLM

GitHub

flash-opd

FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…

#CLI #GPU必須 #LLM関連

★ 2 2026-04-22

ComfyUI

GitHub

ComfyUI-MemoryVisualization

ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…

#ComfyUI対応 #GPU必須 #Web UI

★ 2 2026-07-01

画像生成

GitHub

sage-color

SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…

#CLI #GPU必須 #Hugging Face

★ 2 NOASSERTION 2026-05-28

音楽生成

GitHub

ai-music-studio

ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…

#AMD ROCm #Docker Compose #FastAPI

★ 2 NOASSERTION 2026-04-26

画像生成

GitHub

Flux.2-Klein-Small-Decoder-Only

Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 Apache-2.0 2026-06-18

ASR / 音声認識

GitHub

deckle

Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…

#.NET #CLI #GPU必須

★ 2 MIT 2026-06-16

その他

GitHub

Neural-Zero-Shot-Voice-Cloning

本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…

#Docker #GPU必須 #Python

★ 2 MIT 2026-06-11

画像生成

GitHub

Heat-Diffusion

このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…

#CLI #GPU必須 #Python

★ 2 MIT 2026-05-24

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 2 ⑂ 1 MIT 2026-06-14

ComfyUI

GitHub

comfyui-cinema-pipeline

このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…

#Blender連携 #ComfyUI対応 #GPU必須

★ 2 NOASSERTION 2026-06-15

画像生成

GitHub

awesome-gpu-for-ai

「Awesome GPU for AI」は、AIおよびLLMワークロード向けGPUの選定ガイドです。特にローカルLLM推論に焦点を当て、VR…

#ComfyUI対応 #CUDA対応 #GPU必須

★ 2 2026-06-13

画像生成

GitHub

SesquiLSR

SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…

#AIモデル #CLI #ComfyUI対応

★ 2 ⑂ 1 MIT 2026-06-16

ASR / 音声認識

GitHub

taiwan-asr-toolkit

Taiwan ASR Toolkitは、台湾華語（繁体字中国語）に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…

#CLI #Colab対応 #GPU必須

★ 2 NOASSERTION 2026-05-07

ComfyUI

GitHub

ComfyUI-HiCache

ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…

#ComfyUI-Hunyuan3DWrapper #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-06-11

ComfyUI

GitHub

Prompt808

Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…

#AI/ML #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-04-25

ComfyUI

GitHub

awesome-ai-video

このリポジトリは、最新のAIテキスト・画像-to-ビデオモデル、ツール、リソースを厳選したリストです。2026年半ばに…

#API #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 CC0-1.0 2026-06-03

マルチモーダル

GitHub

vlm-from-scratch-v4

Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…

#CLI #GPU必須 #マルチモーダル

★ 1 MIT 2026-05-19

音声生成 / TTS

GitHub

mlx-indextts-webui

このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…

#Apple Silicon対応 #FastAPI #GPU必須

★ 1 NOASSERTION 2026-05-20