3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

lux-tts

LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…

#Google Colab #GPU必須 #Python

★ 1 NOASSERTION 2026-05-10

画像生成

GitHub

f1-physics-engine

F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…

#CLI #GPU必須 #HuggingFace対応

★ 1 ⑂ 1 MIT 2026-06-06

画像生成

GitHub

Stream_Mirror

StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…

#GPU必須 #Python #StreamDiffusion

★ 1 MIT 2026-05-13

画像生成

GitHub

AI-FASHION-SHOPPING-ASSISTANT-CHATBOT

このツールは、Stable Diffusion v1.5 を活用したAIファッションショッピングアシスタントチャットボットです。ユー…

#AI機能 #Google Colab #GPU必須

★ 1 2026-05-17

マルチモーダル

GitHub

multimodal-clinical-ai

このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…

#CLI #Docker #GPU必須

★ 1 NOASSERTION 2026-05-20

ASR / 音声認識

GitHub

jarvis-local-ai

Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…

#CLI #GPU必須 #Python

★ 1 2026-05-31

LLM

GitHub

Multilingual-Health-QA-in-Low-Resource-African-Languages

このプロジェクトは、アフリカの低リソース言語に対応した多言語医療質問応答（QA）アシスタントの構築を目指す機械…

#CLI #Colab対応 #GPU必須

★ 1 2026-06-24

3D / NeRF

GitHub

gaussian-splat-based-anomaly-detection

本ツールは、UAVで撮影した高層構造物（携帯電話基地局、風力タービン、電柱など）の画像を3D Gaussian Splatting (3…

#CLI #GPU必須 #Python

★ 1 2026-05-17

ComfyUI

GitHub

ComfyUI-Foundation-1

ComfyUI-Foundation-1は、ComfyUIにFoundation-1カスタムノードを追加し、テキストプロンプトから短時間の音楽サンプ…

#ComfyUI対応 #GPU必須 #Windows

★ 1 ⑂ 1 NOASSERTION 2026-06-29

画像生成

GitHub

ComfyUI_SparkVSR_SM

ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-22

画像生成

GitHub

my-lm

My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…

#Electron #GPU必須 #LLM対応

★ 1 MIT 2026-05-09

音声生成 / TTS

GitHub

nemoflix-studio

Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…

#API-first #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-16

ComfyUI

GitHub

mefaihomevideoai-worker

本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…

#ComfyUI対応 #Docker #GPU必須

★ 1 Apache-2.0 2026-06-12

画像生成

GitHub

EdgeDiffusion

EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…

#CLI #GPU必須 #Python

★ 1 2026-06-07

ASR / 音声認識

GitHub

Welcome-to-the-Narthex-Transcripts

このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト（文字…

#CLI #GPU必須 #LLM活用

★ 1 NOASSERTION 2026-05-27

3D / NeRF

GitHub

Cosmo3DFlow

Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-12

画像生成

GitHub

DSCA-ReID-Framework

本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃（DSCA）」に特化した軽量なPyTor…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-28

3D / NeRF

GitHub

faster-trellis

「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…

#AI/ML #GPU必須 #Python

★ 1 NOASSERTION 2026-06-11

マルチモーダル

GitHub

blind-vision-mcp

blind-vision-mcpは、テキストベースのLLM（大規模言語モデル）に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-15

LLM

GitHub

l40s-llm-bench

本ツールは、NVIDIA L40SなどのシングルGPU環境で再現可能なLLM推論ベンチマーク実験を行うための最小限の足場を提供…

#CLI #GPU必須 #LLMベンチマーク

★ 1 ⑂ 1 MIT 2026-06-10

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

3D / NeRF

GitHub

Ghost-Eye

Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU（ピーク時…

#3D再構築 #GPU必須 #Python

★ 1 Apache-2.0 2026-05-10

ComfyUI

GitHub

vram8gb_comfyui_wan2.2

vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2（14…

#AI / 機械学習 #ComfyUI対応 #GPU必須

★ 1 2026-06-25

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24