3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ComfyUI-TensorRT-Reforge
「ComfyUI-TensorRT-Reforge」は、ComfyUI向けに最適化された超高速TensorRTエンジンエクスポート・ロードツールです…
★ 17 ⑂ 2 MIT 2026-06-12
ComfyUI
GitHub
fxai-toolkit
ComfyUI - 鳳希全能ノードパックは、ComfyUI専用のAI長尺動画制作ソリューションです。低スペックPCでも動作するよう…
★ 17 ⑂ 5 2026-06-21
ASR / 音声認識
GitHub
watch
「/watch」は、YouTube、Instagram、X(旧Twitter)など多様なオンライン動画サイトやローカルファイルから、Claude…
★ 17 ⑂ 1 MIT 2026-05-29
画像生成
GitHub
RealUID
RealUIDは、ICLR 2026で発表された「Universal Inverse Distillation for Matching Models with Real-Data Supervisi…
★ 17 ⑂ 1 MIT 2026-06-24
3D / NeRF
GitHub
FruitNeRFpp
FruitNeRF++は、果樹園における多様な果物の計数を汎用的に行うための新しい手法です。コントラスト学習とニューラル…
★ 17 ⑂ 1 Apache-2.0 2025-12-14
画像生成
GitHub
diffusers-tuner
Diffusers Tunerは、Hugging Face Diffusersモデルのファインチューニングにおける複雑さとオーバーヘッドを排除する…
★ 17 MIT 2026-04-15
3D / NeRF
GitHub
MVCHead
MVCHeadは、CVPR 2026で発表された、高忠実度かつマルチビュー一貫性のある3D Gaussianヘッドアバターを生成するAIモ…
★ 17 ⑂ 1 NOASSERTION 2026-06-01
画像生成
GitHub
av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 16 ⑂ 3 MIT 2026-06-09
マルチモーダル
GitHub
sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 ⑂ 1 2026-03-21
音声生成 / TTS
GitHub
ZastTranslate
ZastTranslateは、動画の翻訳とAI音声クローンによる吹き替えを100%ローカルで実行するツールです。APIキー不要で、…
★ 16 ⑂ 1 2026-06-08
3D / NeRF
GitHub
CrossScore
CrossScoreは、ECCV 2024で発表された、マルチビュー画像の評価とスコアリングを行うための研究プロジェクトです。特…
★ 16 BSD-3-Clause 2026-03-21
画像生成
GitHub
IDLM
IDLM(Inverse-distilled Diffusion Language Models)は、ICML 2026で発表された画期的な技術です。本技術は、高品…
★ 16 MIT 2026-06-08
画像生成
GitHub
VHS
VHSは、DiTベースの画像生成における推論時の効率的なスケーリング検証フレームワークです。テキストプロンプトに基…
★ 16 NOASSERTION 2026-03-25
3D / NeRF
GitHub
VLM-Instruct-FastGS
VLM-Instruct-FastGSは、3D Gaussian Splatting技術を拡張し、Vision-Language Models (VLM) からのセマンティックガ…
★ 15 NOASSERTION 2026-03-05
3D / NeRF
GitHub
ru4dslam
RU4D-SLAMは、ガウススプラッティングSLAMにおいて不確実性の重み付けを行うことで、4Dシーン再構築を実現するシステ…
★ 15 ⑂ 2 2026-06-01
画像生成
GitHub
dlmserve
dlmserveは、拡散型言語モデル(Diffusion LLMs)向けにOpenAI互換のHTTPサービスを提供するツールです。拡散型LLM特…
★ 15 ⑂ 1 MIT 2026-05-26
LLM
GitHub
ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24
3D / NeRF
GitHub
SLARM
SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…
★ 15 MIT 2026-06-09
3D / NeRF
GitHub
Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
マルチモーダル
GitHub
paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 15 ⑂ 4 2026-06-10
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 15 Apache-2.0 2026-05-13
画像生成
GitHub
JoyBoy
JoyBoyは、チャット、コーディング、画像生成、画像編集、動画実験、モデル管理といった多様なAIワークフローを統合…
★ 15 ⑂ 7 Apache-2.0 2026-06-26
画像生成
GitHub
npedit
NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…
★ 15 ⑂ 1 MIT 2026-05-05
ComfyUI
GitHub
free-comfyui-colab-pack
このプロジェクトは、人気のComfyUIワークフローをGoogle Colab上で無料で実行できるように設計されたノートブック集…
★ 14 ⑂ 1 NOASSERTION 2026-03-11