3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

jarvis-local-ai

Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…

#CLI #GPU必須 #Python

★ 1 2026-05-31

LLM

GitHub

Multilingual-Health-QA-in-Low-Resource-African-Languages

このプロジェクトは、アフリカの低リソース言語に対応した多言語医療質問応答（QA）アシスタントの構築を目指す機械…

#CLI #Colab対応 #GPU必須

★ 1 2026-06-24

音声生成 / TTS

GitHub

nemoflix-studio

Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…

#API-first #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-16

3D / NeRF

GitHub

gmnerf

このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…

#CLI #GPU必須 #Hugging Face

★ 1 MIT 2026-04-03

音声生成 / TTS

GitHub

lux-tts

LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…

#Google Colab #GPU必須 #Python

★ 1 NOASSERTION 2026-05-10

3D / NeRF

GitHub

Cosmo3DFlow

Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-12

画像生成

GitHub

diffusion-models-from-scratch

NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル（DDPM、U-Net、CFG、CLIPコサイン類似度）をFashionMNIS…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-08

音楽生成

GitHub

MAZ-MUSIC

MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…

#AI生成 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-15

LLM

GitHub

Project-adam-v2

Synthesizer V2（Project Adam V2）は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…

#Google Colab #GPU必須 #Jupyter Notebook

★ 1 MIT 2026-05-22

3D / NeRF

GitHub

faster-trellis

「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…

#AI/ML #GPU必須 #Python

★ 1 NOASSERTION 2026-06-11

マルチモーダル

GitHub

blind-vision-mcp

blind-vision-mcpは、テキストベースのLLM（大規模言語モデル）に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-15

LLM

GitHub

l40s-llm-bench

本ツールは、NVIDIA L40SなどのシングルGPU環境で再現可能なLLM推論ベンチマーク実験を行うための最小限の足場を提供…

#CLI #GPU必須 #LLMベンチマーク

★ 1 ⑂ 1 MIT 2026-06-10

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

3D / NeRF

GitHub

DNP-3DDMR-IR

本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…

#GPU必須 #Jupyter Notebook #Python

★ 1 2026-06-23

ASR / 音声認識

GitHub

The-Earful-Tower

「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…

#GPU必須 #Python #Windowsのみ

★ 1 MIT 2026-06-13

ASR / 音声認識

GitHub

Welcome-to-the-Narthex-Transcripts

このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト（文字…

#CLI #GPU必須 #LLM活用

★ 1 NOASSERTION 2026-05-27

ComfyUI

GitHub

vram8gb_comfyui_wan2.2

vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2（14…

#AI / 機械学習 #ComfyUI対応 #GPU必須

★ 1 2026-06-25

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24

ComfyUI

GitHub

ComfyUI-Orakul-SVP

ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…

#ComfyUI対応 #GPU必須 #Linux

★ 1 MIT 2026-06-20

マルチモーダル

GitHub

fal-ai

fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…

#AI #GPU必須 #Python

★ 1 2026-06-20

音声生成 / TTS

GitHub

voxcpm2-pinokio-launcher

このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…

#GPU必須 #HTTP API #Pinokio

★ 1 2026-05-03

画像生成

GitHub

my-lm

My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…

#Electron #GPU必須 #LLM対応

★ 1 MIT 2026-05-09

音声生成 / TTS

GitHub

omnivoice-gfx1150

このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU（gfx1150/Strix Point）上で動作…

#AMD ROCm #CLI #GPU必須

★ 1 MIT 2026-05-30

画像生成

GitHub

EdgeDiffusion

EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…

#CLI #GPU必須 #Python

★ 1 2026-06-07