3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
yolov5-orbslam3-dynamic-scene
このプロジェクトは、YOLOv5とORB-SLAM3を組み合わせることで、高動的な交通シーンにおける視覚SLAM(Simultaneous L…
★ 1 2026-03-01
マルチモーダル
GitHub
FootPrint
FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…
★ 1 MIT 2026-05-18
画像生成
GitHub
sd-webui-forge-neo-samg
このツールは、SD WebUI Forge Neo向けのSpatial Adaptive Multi Guidance (SAMG)拡張機能です。生成画像の品質向上…
★ 1 2026-05-11
ComfyUI
GitHub
runpod-comfyui-controller
RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…
★ 1 MIT 2026-06-12
音声生成 / TTS
GitHub
NeuralSoundForge
NeuralSoundForgeは、StyleGAN2とセマンティック因数分解を駆使した高度な深層学習プラットフォームです。このツール…
★ 1 2026-02-06
3D / NeRF
GitHub
sam-3d-spark
sam-3d-sparkは、MetaのSAM 3D(BodyおよびObjects)モデルをNVIDIA DGX Spark環境(aarch64/CUDA 13)でローカル実…
★ 1 NOASSERTION 2026-05-03
画像生成
GitHub
DSCA-ReID-Framework
本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃(DSCA)」に特化した軽量なPyTor…
★ 1 MIT 2026-05-28
音声生成 / TTS
GitHub
mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
動画生成
GitHub
HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
音声生成 / TTS
GitHub
Cadence
Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…
★ 1 MIT 2026-06-16
音声生成 / TTS
GitHub
kokoro-tts-ultimate
「Kokoro TTS - Ultimate Edition」は、NVIDIA GPUアクセラレーションを活用した「Kokoro-82M」モデルを特徴とするプ…
★ 1 Apache-2.0 2026-01-09
画像生成
GitHub
KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-06-25
3D / NeRF
GitHub
Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
マルチモーダル
GitHub
MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
3D / NeRF
GitHub
gmnerf
このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…
★ 1 MIT 2026-04-03
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
動画生成
GitHub
comfyui-cinema-worldbuilder
Cinema Worldbuilderは、ComfyUI上でLTX 2.3ビデオ生成を強力に支援するカスタムノードパックです。このツールは、Ca…
★ 1 MIT 2026-05-20
音楽生成
GitHub
scrappy-radio
AIを活用したリアルタイムのラジオ局で、オリジナルの楽曲生成、AI DJによる解説、リスナーからのリアルタイムリクエ…
★ 1 MIT 2026-03-16
LLM
GitHub
megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 1 MIT 2026-04-17
画像生成
GitHub
sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04