3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

nemoflix-studio

Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…

#API-first #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-16

画像生成

GitHub

comfyui-amd-plug-and-play

miradorventus/comfyui-amd-plug-and-play は、AMD GPU（Ubuntu/Mint）上でComfyUIのセットアップと実行を大幅に簡素…

#AMD ROCm #CLI #ComfyUI対応

★ 1 2026-05-31

マルチモーダル

GitHub

tinyvlm-implementation

このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…

#CLI #FSDP #GPU必須

★ 1 2026-05-10

マルチモーダル

GitHub

local-asset-gen-mcp

このプロジェクトは、テキストから画像、音楽/音声、音声、さらに画像やテキストから3Dモデルを生成できるローカルAI…

#AI生成 #CLI #GPU必須

★ 1 GPL-3.0 2026-03-28

音楽生成

GitHub

MAZ-MUSIC

MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…

#AI生成 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-15

3D / NeRF

GitHub

Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems

このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…

#3D検出 #CLI #GPU必須

★ 1 2026-05-26

動画生成

GitHub

PackForcing

PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…

#CLI #GPU必須 #Python

★ 1 2026-06-24

マルチモーダル

GitHub

fal-ai

fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…

#AI #GPU必須 #Python

★ 1 2026-06-20

マルチモーダル

GitHub

vlm-from-scratch-v4

Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…

#CLI #GPU必須 #マルチモーダル

★ 1 MIT 2026-05-19

3D / NeRF

GitHub

Lid-Lab-NeRF

Lid-Lab-NeRFは、LiDAR点群の新しいスキャンを生成するためのPyTorchベースのNeRFフレームワークです。このツールは…

#CLI #GPU必須 #LiDAR

★ 1 Apache-2.0 2025-11-28

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

画像生成

GitHub

EdgeDiffusion

EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…

#CLI #GPU必須 #Python

★ 1 2026-06-07

3D / NeRF

GitHub

Cosmo3DFlow

Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-12

動画生成

GitHub

NAVA-Text-to-Video

NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …

#GPU必須 #Image-to-Video #Python

★ 1 ⑂ 1 Apache-2.0 2026-06-05

3D / NeRF

GitHub

faster-trellis

「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…

#AI/ML #GPU必須 #Python

★ 1 NOASSERTION 2026-06-11

3D / NeRF

GitHub

2D-X-ray-to-3D-Bone-Reconstruction

このAIツールは、標準的な2D X線画像から3D骨格構造を高精度に再構築します。ConvNeXtエンコーダとニューラルインプ…

#AI #CLI #GPU必須

★ 1 2026-06-15

音声生成 / TTS

GitHub

KuRL

KuRL AIは、インド系言語に特化した超高速Text-to-Speechエンジンで、ゼロショット音声クローン機能を搭載しています…

#API #CLI #Docker

★ 1 MIT 2026-02-13

3D / NeRF

GitHub

Forma-3D-Vision-Engine

Formaは、標準的な2D写真を高密度なカラー3Dメッシュに変換するコンピュータビジョンエンジンです。特殊なカメラやハ…

#3Dモデル生成 #CLI #GPU必須

★ 1 2026-03-24

マルチモーダル

GitHub

corpus-mill

「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画（人物…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-06

LLM

GitHub

l40s-llm-bench

本ツールは、NVIDIA L40SなどのシングルGPU環境で再現可能なLLM推論ベンチマーク実験を行うための最小限の足場を提供…

#CLI #GPU必須 #LLMベンチマーク

★ 1 ⑂ 1 MIT 2026-06-10

音声生成 / TTS

GitHub

voxtral-fastapi

voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…

#CLI #GPU必須 #GUI

★ 1 2026-05-17

3D / NeRF

GitHub

hybrid-3d-human-reconstruction

RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…

#GPU必須 #Python #PyTorch

★ 1 MIT 2026-04-20

画像生成

GitHub

ComfyUI_SparkVSR_SM

ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-07-01

ASR / 音声認識

GitHub

funasr-whisper-api

このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…

#CLI #GPU必須 #OpenAI Whisper API互換

★ 1 MIT 2026-06-14