3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
音声生成 / TTS
GitHub
nano-codec
nano-codecは、最小限のニューラルオーディオコーデックであり、16kHzモノラルの音声を128倍に圧縮し、10.2kbpsの低…
★ 5 2026-03-31
3D / NeRF
GitHub
4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 5 Apache-2.0 2026-06-19
音声生成 / TTS
GitHub
Supertonic_3_TTS_App
「Supertonic 3 TTS App」は、Supertone Supertonic 3エンジンを搭載した、Windows向けのオンデバイス・ニューラルテ…
★ 5 MIT 2026-05-31
画像生成
GitHub
FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
3D / NeRF
GitHub
InsightAT
InsightATは、使いやすさと自動化に焦点を当てたオープンソースのオールインワンStructure-from-Motionシステムで、…
★ 5 ⑂ 3 MIT 2026-06-15
マルチモーダル
GitHub
multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
画像生成
GitHub
CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
LLM
GitHub
spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
動画生成
GitHub
wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
ASR / 音声認識
GitHub
whisperx-transcriber
WhisperX Transcriberは、Windowsユーザー向けのオフラインAI音声文字変換ツールです。OpenAIのWhisperモデルとWhisp…
★ 5 ⑂ 1 MIT 2026-06-09
画像生成
GitHub
reward-guidance
このツールは「Are we really tilting?」論文の実験コードで、フロー・拡散モデルにおける報酬ガイダンスのメカニズ…
★ 5 ⑂ 1 MIT 2026-05-07
動画生成
GitHub
comfyui-production-workflows
「ComfyUI Production Workflows」は、デジタルクリエイター向けに提供される、AIコンテンツ作成のための実践的ワー…
★ 4 MIT 2026-04-23
マルチモーダル
GitHub
LiteRTLM-Swift-SDK
LiteRTLM Swift SDKは、GoogleのLiteRT-LM(オンデバイス推論エンジン)の非公式Swift SDKです。このツールはGemma 4…
★ 4 ⑂ 2 MIT 2026-05-02
3D / NeRF
GitHub
ReMap
ReMapは、3DキャプチャデータをGaussian SplattingやNeRFなどの高度なトレーニング用に準備するための強力なデスクト…
★ 4 NOASSERTION 2026-06-21
3D / NeRF
GitHub
multi-mesh
multi-meshは、Godot 4で100万以上の動的インスタンスをGPU駆動で効率的にレンダリングするためのプロジェクトです。…
★ 4 2026-06-24
画像生成
GitHub
rahulk-ddpm
rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。UNetと正…
★ 4 MIT 2026-06-23
マルチモーダル
GitHub
PaintBench
PaintBenchは、生成AIモデルの画像編集能力を決定論的に評価するためのベンチマークツールです。MSペイントのような…
★ 4 MIT 2026-06-02
ComfyUI
GitHub
comfyui-nvidia-container
このツールは、NVIDIA CUDA GPUアクセラレーションに対応したComfyUIをDockerコンテナで動作させるための、軽量かつ…
★ 4 ⑂ 1 NOASSERTION 2026-06-28
音声生成 / TTS
GitHub
CosyVoiceUI
CosyVoiceUIは、NVIDIA Triton Inference ServerとFastAPIを基盤とした高性能なCosyVoiceテキスト読み上げ(TTS)管…
★ 4 2026-06-10
マルチモーダル
GitHub
inst2vec
molchalih/inst2vecは、Instagramのユーザーデータを詳細に分析し、美的クラスタリングと可視化を行うツールです。CS…
★ 4 Apache-2.0 2026-06-10
3D / NeRF
GitHub
ri3d-impl
RI3D(few-shot gaussian splatting)の最新実装で、わずか3枚の画像から高品質なガウシアンスプラットを生成します…
★ 4 Unlicense 2026-05-10
ASR / 音声認識
GitHub
EasyScript
EasyScriptはWhisper AIを搭載したデスクトップアプリケーションで、音声・動画ファイルの文字起こしと翻訳、リアル…
★ 4 ⑂ 5 2026-05-30
画像生成
GitHub
NovaVision
NovaVisionは、感情を条件としたテキストから画像を生成するツールです。入力テキストの感情を検出し、その感情が生…
★ 4 MIT 2026-06-19