3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

動画生成

GitHub

AVGen-Bench

AVGen-Benchは、Text-to-Audio-Video (T2AV) 生成の多段階評価を目的としたタスク駆動型ベンチマークツールです。既…

#CLI #GPU必須 #Python

★ 20 MIT 2026-06-18

LLM

GitHub

Prism

PRISMは、マルチモーダル大規模言語モデル（特にLLaVA）の継続的学習設定における命令チューニングのためのPyTorchベ…

#CLI #DeepSpeed #GPU必須

★ 20 ⑂ 5 MIT 2026-06-15

ComfyUI

GitHub

ComfyUI-Magos-Nodes

このComfyUI向けノードパック「Magos Nodes」は、動画バッチからDWPoseのボディ/ハンド/フェイスのキーポイントとNLF…

#ComfyUI対応 #DWPose対応 #GPU必須

★ 20 ⑂ 2 GPL-3.0 2026-05-15

LLM

GitHub

Video_Dariy

Video Diaryは、家庭用監視カメラの録画映像をAIで自動分析し、効率的な管理を可能にするシステムです。NASやディレ…

#AI #Docker #Docker Compose

★ 19 ⑂ 1 Apache-2.0 2026-06-14

LLM

GitHub

ChipMATE

ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…

#CLI #Docker #GPU必須

★ 19 ⑂ 2 NOASSERTION 2026-05-29

ComfyUI

GitHub

ComfyUI-Pixal3D

ComfyUI-Pixal3Dは、TencentARCが開発したPixal3D（SIGGRAPH 2026）のComfyUIカスタムノードです。単一の画像からPBR…

#ComfyUI対応 #GPU必須 #PBRメッシュ生成

★ 19 ⑂ 1 NOASSERTION 2026-05-14

ComfyUI

GitHub

ComfyUI-vslinx-nodes

vslinx/ComfyUI-vslinx-nodesは、ComfyUIのワークフローを効率化・高速化するためのカスタムノード集です。複数画像…

#ComfyUI対応 #GPU必須 #Python

★ 19 ⑂ 3 GPL-3.0 2026-06-23

画像生成

GitHub

PHOBOS

PHOBOSは、クラウドに依存せず、ユーザーのハードウェア上で完全に動作する自己主権型クリエイティブAIオペレーティ…

#CLI #GPU必須 #Node.js

★ 19 ⑂ 1 NOASSERTION 2026-06-11

3D / NeRF

GitHub

HairPort

HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…

#3D認識型 #GPU必須 #Python

★ 19 ⑂ 1 NOASSERTION 2026-06-12

音声生成 / TTS

GitHub

Timbre

Timbreは、複数の話者が混在する音声録音（ポッドキャスト、インタビュー、ストリームなど）から、短い参照クリップ…

#CLI #Colab対応 #GPU必須

★ 19 ⑂ 2 Apache-2.0 2026-06-14

ASR / 音声認識

GitHub

breeze-asr-taigi

本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語（台語）に特化した音声文字起こしツールです。NVIDIA…

#CLI #Docker #GPU必須

★ 18 NOASSERTION 2026-06-22

画像生成

GitHub

DVS

DVS (Drift Variation Score)は、グラフ拡散モデルにおけるサンプリング過程を改善する情報幾何学的な適応サンプリン…

#CLI #GPU必須 #Python

★ 18 2026-05-04

音声生成 / TTS

GitHub

MaidWhisper

MaidWhisperは、GPT-SoVITSを搭載したキャラクターボイスで、Windows上の選択したテキストを読み上げるシステムレベ…

#GPT-SoVITS対応 #GPU必須 #GUI

★ 18 ⑂ 1 GPL-3.0 2026-06-05

3D / NeRF

GitHub

MVCHead

MVCHeadは、CVPR 2026で発表された、高忠実度かつマルチビュー一貫性のある3D Gaussianヘッドアバターを生成するAIモ…

#GPU必須 #Python #学術プロジェクト

★ 17 ⑂ 1 NOASSERTION 2026-06-01

ComfyUI

GitHub

ComfyUI-TensorRT-Reforge

「ComfyUI-TensorRT-Reforge」は、ComfyUI向けに最適化された超高速TensorRTエンジンエクスポート・ロードツールです…

#CLI #ComfyUI対応 #GPU必須

★ 17 ⑂ 2 MIT 2026-06-12

画像生成

GitHub

diffusers-tuner

Diffusers Tunerは、Hugging Face Diffusersモデルのファインチューニングにおける複雑さとオーバーヘッドを排除する…

#CLI #GPU必須 #Hugging Face Diffusers対応

★ 17 MIT 2026-04-15

画像生成

GitHub

RealUID

RealUIDは、ICLR 2026で発表された「Universal Inverse Distillation for Matching Models with Real-Data Supervisi…

#CLI #GPU必須 #Python

★ 17 ⑂ 1 MIT 2026-06-24

ComfyUI

GitHub

fxai-toolkit

ComfyUI - 鳳希全能ノードパックは、ComfyUI専用のAI長尺動画制作ソリューションです。低スペックPCでも動作するよう…

#AI動画生成 #ComfyUI対応 #GPU必須

★ 17 ⑂ 5 2026-06-21

ASR / 音声認識

GitHub

watch

「/watch」は、YouTube、Instagram、X（旧Twitter）など多様なオンライン動画サイトやローカルファイルから、Claude…

#APIキー不要 #CLI #GPU必須

★ 17 ⑂ 1 MIT 2026-05-29

画像生成

GitHub

av-pedestrian-diffusion-mppi

このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…

#CLI #GPU必須 #Python

★ 16 ⑂ 3 MIT 2026-06-09

音声生成 / TTS

GitHub

ZastTranslate

ZastTranslateは、動画の翻訳とAI音声クローンによる吹き替えを100%ローカルで実行するツールです。APIキー不要で、…

#AI音声クローン #GPU必須 #Pinokio対応

★ 16 ⑂ 1 2026-06-08

画像生成

GitHub

IDLM

IDLM（Inverse-distilled Diffusion Language Models）は、ICML 2026で発表された画期的な技術です。本技術は、高品…

#AI/機械学習 #GPU必須 #Python

★ 16 MIT 2026-06-08

3D / NeRF

GitHub

RetrieveVGGT

RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…

#3D再構築 #CLI #GPU必須

★ 15 Apache-2.0 2026-05-13

3D / NeRF

GitHub

SLARM

SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…

#CLI #GPU必須 #Python

★ 15 MIT 2026-06-09