3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
3D / NeRF
GitHub
gmnerf
このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…
★ 1 MIT 2026-04-03
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
LLM
GitHub
tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
マルチモーダル
GitHub
PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
画像生成
GitHub
runpod-sdxl
dwin-gharibi/runpod-sdxlは、Runpod向けのサーバーレスGPU Stable Diffusion XLワーカーで、diffusersを基盤として…
★ 1 2026-05-24
3D / NeRF
GitHub
TripoSplat
TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…
★ 1 MIT 2026-06-26
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
3D / NeRF
GitHub
nest
NeSTは、3D光弾性効果を活用して、透明な3Dオブジェクト内部に隠れた3D応力テンソル場を明らかにするための、物理学…
★ 1 ⑂ 2 MIT 2025-10-05
画像生成
GitHub
my-lm
My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…
★ 1 MIT 2026-05-09
マルチモーダル
GitHub
easycomputewithgemma
このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン(iOS/Android)から自然言…
★ 1 2026-05-24
画像生成
GitHub
diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
ASR / 音声認識
GitHub
Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
画像生成
GitHub
f1-physics-engine
F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…
★ 1 ⑂ 1 MIT 2026-06-06
マルチモーダル
GitHub
Wally-like-Storytelling-Scene-Interactor
この「Wally-like Storytelling Scene Interactor」は、テキストを基に画像を生成し、その画像内の特定の領域をマス…
★ 1 2025-08-12
ComfyUI
GitHub
saya-comfy-couple-plus
「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…
★ 1 2026-06-11
3D / NeRF
GitHub
DNP-3DDMR-IR
本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…
★ 1 2026-06-23
3D / NeRF
GitHub
gaussian-splatting-pytorch
このプロジェクトは、リアルタイムな新規視点合成を実現する最先端の「3D Gaussian Splatting」技術を、PyTorchのみ…
★ 1 MIT 2025-12-29
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
画像生成
GitHub
badhands_scorer
「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…
★ 1 2026-06-03
マルチモーダル
GitHub
-deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
マルチモーダル
GitHub
DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30