3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

voxtral-journal

このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…

#GPU必須 #Python #Web UI

★ 1 NOASSERTION 2026-05-14

マルチモーダル

GitHub

corpus-mill

「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画（人物…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-06

画像生成

GitHub

KinetiDiff

KinetiDiffは、進行性骨化性線維異形成症（FOP）の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…

#CLI #GPU必須 #Linux/macOS

★ 1 MIT 2026-06-25

マルチモーダル

GitHub

tinyvlm-implementation

このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…

#CLI #FSDP #GPU必須

★ 1 2026-05-10

3D / NeRF

GitHub

Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems

このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…

#3D検出 #CLI #GPU必須

★ 1 2026-05-26

3D / NeRF

GitHub

project_slam_gs3lam

GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM（…

#CLI #GPU必須 #Python

★ 1 2026-04-04

画像生成

GitHub

vision-studio

Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…

#ComfyUI対応 #GPU必須 #Python

★ 1 MIT 2026-06-21

音声生成 / TTS

GitHub

Cadence

Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…

#GPU必須 #Python (内部利用) #Windows 10/11

★ 1 MIT 2026-06-16

マルチモーダル

GitHub

-deepseek-skills

このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識（OCR機能を含む）と音声認識（…

#AI Skills 套装 #CLI #GPU必須

★ 1 2026-06-04

3D / NeRF

GitHub

gmnerf

このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…

#CLI #GPU必須 #Hugging Face

★ 1 MIT 2026-04-03

画像生成

GitHub

diffusion-models-from-scratch

NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル（DDPM、U-Net、CFG、CLIPコサイン類似度）をFashionMNIS…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-08

音楽生成

GitHub

MAZ-MUSIC

MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…

#AI生成 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-15

LLM

GitHub

Project-adam-v2

Synthesizer V2（Project Adam V2）は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…

#Google Colab #GPU必須 #Jupyter Notebook

★ 1 MIT 2026-05-22

3D / NeRF

GitHub

OptixGaussianRenderer

「OptixGaussianRenderer」は、NVIDIA OptiXフレームワークを用いてGaussian Splatsのレイトレーシングを実装したプ…

#3Dグラフィックス #C++ #GPU必須

★ 1 GPL-3.0 2026-04-04

3D / NeRF

GitHub

NeRF.cpp

NeRF.cppは、C++とLibTorchを用いてNeRF（Neural Radiance Fields）を実装したツールです。静止したシーンのRGB画像…

#3D再構成 #C++ #CLI

★ 1 BSD-3-Clause 2026-05-17

マルチモーダル

GitHub

PrismRAG

PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…

#CLI #GPU必須 #Multimodal

★ 1 MIT 2026-06-20

画像生成

GitHub

Brain-MRI-Generation-and-Segmentation

このリポジトリは、膠芽腫セグメンテーションのための合成T1c脳MRIスキャン生成に関する修士論文に付随するものです…

#CLI #GPU必須 #Python

★ 1 2026-06-09

3D / NeRF

GitHub

DNP-3DDMR-IR

本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…

#GPU必須 #Jupyter Notebook #Python

★ 1 2026-06-23

ASR / 音声認識

GitHub

The-Earful-Tower

「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…

#GPU必須 #Python #Windowsのみ

★ 1 MIT 2026-06-13

音声生成 / TTS

GitHub

lux-tts

LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…

#Google Colab #GPU必須 #Python

★ 1 NOASSERTION 2026-05-10

画像生成

GitHub

f1-physics-engine

F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…

#CLI #GPU必須 #HuggingFace対応

★ 1 ⑂ 1 MIT 2026-06-06

ComfyUI

GitHub

ComfyUI-Orakul-SVP

ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…

#ComfyUI対応 #GPU必須 #Linux

★ 1 MIT 2026-06-20

ASR / 音声認識

GitHub

jarvis-local-ai

Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…

#CLI #GPU必須 #Python

★ 1 2026-05-31

LLM

GitHub

Multilingual-Health-QA-in-Low-Resource-African-Languages

このプロジェクトは、アフリカの低リソース言語に対応した多言語医療質問応答（QA）アシスタントの構築を目指す機械…

#CLI #Colab対応 #GPU必須

★ 1 2026-06-24