3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (831 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
マルチモーダル GitHub kmetbench-release
K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…
★ 2 MIT 2026-06-24
画像生成 GitHub hermes-image-local-tools
この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…
★ 2 MIT 2026-06-03
ComfyUI GitHub LoRA-Gallery-Loader—Custom-Node
「LoRA Gallery Node for ComfyUI」は、画像生成AIツールComfyUI用のカスタムノードです。このツールは、LoRA(Low-R…
★ 2 ⑂ 1 2026-04-18
画像生成 GitHub AI-powered-Text-to-Image-Generator
「AI Image Generator」は、Stable Diffusionを搭載した高度なテキスト画像生成ツールです。自然言語のプロンプトか…
★ 2 MIT 2026-06-24
LLM GitHub flash-opd
FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…
★ 2 2026-04-22
ComfyUI GitHub ComfyUI-MemoryVisualization
ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…
★ 2 2026-07-01
画像生成 GitHub sage-color
SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…
★ 2 NOASSERTION 2026-05-28
音楽生成 GitHub ai-music-studio
ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…
★ 2 NOASSERTION 2026-04-26
画像生成 GitHub Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
ASR / 音声認識 GitHub deckle
Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…
★ 2 MIT 2026-06-16
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
画像生成 GitHub Heat-Diffusion
このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…
★ 2 MIT 2026-05-24
音声生成 / TTS GitHub HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
ComfyUI GitHub comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
画像生成 GitHub awesome-gpu-for-ai
「Awesome GPU for AI」は、AIおよびLLMワークロード向けGPUの選定ガイドです。特にローカルLLM推論に焦点を当て、VR…
★ 2 2026-06-13
画像生成 GitHub SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
ASR / 音声認識 GitHub taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
ComfyUI GitHub ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
ComfyUI GitHub Prompt808
Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…
★ 2 ⑂ 1 MIT 2026-04-25
ComfyUI GitHub awesome-ai-video
このリポジトリは、最新のAIテキスト・画像-to-ビデオモデル、ツール、リソースを厳選したリストです。2026年半ばに…
★ 2 ⑂ 1 CC0-1.0 2026-06-03
マルチモーダル GitHub vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
音声生成 / TTS GitHub mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20