3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
AVGen-Bench
AVGen-Benchは、Text-to-Audio-Video (T2AV) 生成の多段階評価を目的としたタスク駆動型ベンチマークツールです。既…
★ 20 MIT 2026-06-18
LLM
GitHub
Prism
PRISMは、マルチモーダル大規模言語モデル(特にLLaVA)の継続的学習設定における命令チューニングのためのPyTorchベ…
★ 20 ⑂ 5 MIT 2026-06-15
ComfyUI
GitHub
ComfyUI-Magos-Nodes
このComfyUI向けノードパック「Magos Nodes」は、動画バッチからDWPoseのボディ/ハンド/フェイスのキーポイントとNLF…
★ 20 ⑂ 2 GPL-3.0 2026-05-15
LLM
GitHub
Video_Dariy
Video Diaryは、家庭用監視カメラの録画映像をAIで自動分析し、効率的な管理を可能にするシステムです。NASやディレ…
★ 19 ⑂ 1 Apache-2.0 2026-06-14
LLM
GitHub
ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 19 ⑂ 2 NOASSERTION 2026-05-29
ComfyUI
GitHub
ComfyUI-Pixal3D
ComfyUI-Pixal3Dは、TencentARCが開発したPixal3D(SIGGRAPH 2026)のComfyUIカスタムノードです。単一の画像からPBR…
★ 19 ⑂ 1 NOASSERTION 2026-05-14
ComfyUI
GitHub
ComfyUI-vslinx-nodes
vslinx/ComfyUI-vslinx-nodesは、ComfyUIのワークフローを効率化・高速化するためのカスタムノード集です。複数画像…
★ 19 ⑂ 3 GPL-3.0 2026-06-23
画像生成
GitHub
PHOBOS
PHOBOSは、クラウドに依存せず、ユーザーのハードウェア上で完全に動作する自己主権型クリエイティブAIオペレーティ…
★ 19 ⑂ 1 NOASSERTION 2026-06-11
3D / NeRF
GitHub
HairPort
HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…
★ 19 ⑂ 1 NOASSERTION 2026-06-12
音声生成 / TTS
GitHub
Timbre
Timbreは、複数の話者が混在する音声録音(ポッドキャスト、インタビュー、ストリームなど)から、短い参照クリップ…
★ 19 ⑂ 2 Apache-2.0 2026-06-14
ASR / 音声認識
GitHub
breeze-asr-taigi
本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語(台語)に特化した音声文字起こしツールです。NVIDIA…
★ 18 NOASSERTION 2026-06-22
画像生成
GitHub
DVS
DVS (Drift Variation Score)は、グラフ拡散モデルにおけるサンプリング過程を改善する情報幾何学的な適応サンプリン…
★ 18 2026-05-04
音声生成 / TTS
GitHub
MaidWhisper
MaidWhisperは、GPT-SoVITSを搭載したキャラクターボイスで、Windows上の選択したテキストを読み上げるシステムレベ…
★ 18 ⑂ 1 GPL-3.0 2026-06-05
3D / NeRF
GitHub
MVCHead
MVCHeadは、CVPR 2026で発表された、高忠実度かつマルチビュー一貫性のある3D Gaussianヘッドアバターを生成するAIモ…
★ 17 ⑂ 1 NOASSERTION 2026-06-01
ComfyUI
GitHub
ComfyUI-TensorRT-Reforge
「ComfyUI-TensorRT-Reforge」は、ComfyUI向けに最適化された超高速TensorRTエンジンエクスポート・ロードツールです…
★ 17 ⑂ 2 MIT 2026-06-12
画像生成
GitHub
diffusers-tuner
Diffusers Tunerは、Hugging Face Diffusersモデルのファインチューニングにおける複雑さとオーバーヘッドを排除する…
★ 17 MIT 2026-04-15
画像生成
GitHub
RealUID
RealUIDは、ICLR 2026で発表された「Universal Inverse Distillation for Matching Models with Real-Data Supervisi…
★ 17 ⑂ 1 MIT 2026-06-24
ComfyUI
GitHub
fxai-toolkit
ComfyUI - 鳳希全能ノードパックは、ComfyUI専用のAI長尺動画制作ソリューションです。低スペックPCでも動作するよう…
★ 17 ⑂ 5 2026-06-21
ASR / 音声認識
GitHub
watch
「/watch」は、YouTube、Instagram、X(旧Twitter)など多様なオンライン動画サイトやローカルファイルから、Claude…
★ 17 ⑂ 1 MIT 2026-05-29
画像生成
GitHub
av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 16 ⑂ 3 MIT 2026-06-09
音声生成 / TTS
GitHub
ZastTranslate
ZastTranslateは、動画の翻訳とAI音声クローンによる吹き替えを100%ローカルで実行するツールです。APIキー不要で、…
★ 16 ⑂ 1 2026-06-08
画像生成
GitHub
IDLM
IDLM(Inverse-distilled Diffusion Language Models)は、ICML 2026で発表された画期的な技術です。本技術は、高品…
★ 16 MIT 2026-06-08
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 15 Apache-2.0 2026-05-13
3D / NeRF
GitHub
SLARM
SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…
★ 15 MIT 2026-06-09