3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
PHOBOS
PHOBOSは、クラウドに依存せず、ユーザーのハードウェア上で完全に動作する自己主権型クリエイティブAIオペレーティ…
★ 19 ⑂ 1 NOASSERTION 2026-06-11
3D / NeRF
GitHub
HairPort
HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…
★ 19 ⑂ 1 NOASSERTION 2026-06-12
音声生成 / TTS
GitHub
Timbre
Timbreは、複数の話者が混在する音声録音(ポッドキャスト、インタビュー、ストリームなど)から、短い参照クリップ…
★ 19 ⑂ 2 Apache-2.0 2026-06-14
LLM
GitHub
Video_Dariy
Video Diaryは、家庭用監視カメラの録画映像をAIで自動分析し、効率的な管理を可能にするシステムです。NASやディレ…
★ 19 ⑂ 1 Apache-2.0 2026-06-14
LLM
GitHub
ChipMATE
ChipMATEは、RTLコード生成のためのマルチエージェント推論フレームワークです。Verilog生成エージェントとPython参…
★ 19 ⑂ 2 NOASSERTION 2026-05-29
ASR / 音声認識
GitHub
breeze-asr-taigi
本ツールは、MediaTekのBreeze-ASR-26モデルを基盤とした台湾語(台語)に特化した音声文字起こしツールです。NVIDIA…
★ 18 NOASSERTION 2026-06-22
画像生成
GitHub
DVS
DVS (Drift Variation Score)は、グラフ拡散モデルにおけるサンプリング過程を改善する情報幾何学的な適応サンプリン…
★ 18 2026-05-04
音声生成 / TTS
GitHub
MaidWhisper
MaidWhisperは、GPT-SoVITSを搭載したキャラクターボイスで、Windows上の選択したテキストを読み上げるシステムレベ…
★ 18 ⑂ 1 GPL-3.0 2026-06-05
3D / NeRF
GitHub
MVCHead
MVCHeadは、CVPR 2026で発表された、高忠実度かつマルチビュー一貫性のある3D Gaussianヘッドアバターを生成するAIモ…
★ 17 ⑂ 1 NOASSERTION 2026-06-01
ComfyUI
GitHub
ComfyUI-TensorRT-Reforge
「ComfyUI-TensorRT-Reforge」は、ComfyUI向けに最適化された超高速TensorRTエンジンエクスポート・ロードツールです…
★ 17 ⑂ 2 MIT 2026-06-12
画像生成
HF
SpatialEdit-16B
SpatialEdit-16Bは、入力画像に対して文章指示で位置や向き、視点を細かく調整できる研究用の画像空間編集モデルです…
❤ 17 ↓ 23 apache-2.0 2026-04-08
画像生成
GitHub
diffusers-tuner
Diffusers Tunerは、Hugging Face Diffusersモデルのファインチューニングにおける複雑さとオーバーヘッドを排除する…
★ 17 MIT 2026-04-15
画像生成
GitHub
RealUID
RealUIDは、ICLR 2026で発表された「Universal Inverse Distillation for Matching Models with Real-Data Supervisi…
★ 17 ⑂ 1 MIT 2026-06-24
ComfyUI
GitHub
fxai-toolkit
ComfyUI - 鳳希全能ノードパックは、ComfyUI専用のAI長尺動画制作ソリューションです。低スペックPCでも動作するよう…
★ 17 ⑂ 5 2026-06-21
ASR / 音声認識
GitHub
watch
「/watch」は、YouTube、Instagram、X(旧Twitter)など多様なオンライン動画サイトやローカルファイルから、Claude…
★ 17 ⑂ 1 MIT 2026-05-29
画像生成
GitHub
av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 16 ⑂ 3 MIT 2026-06-09
音声生成 / TTS
GitHub
ZastTranslate
ZastTranslateは、動画の翻訳とAI音声クローンによる吹き替えを100%ローカルで実行するツールです。APIキー不要で、…
★ 16 ⑂ 1 2026-06-08
画像生成
GitHub
IDLM
IDLM(Inverse-distilled Diffusion Language Models)は、ICML 2026で発表された画期的な技術です。本技術は、高品…
★ 16 MIT 2026-06-08
3D / NeRF
GitHub
Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
マルチモーダル
GitHub
paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 15 ⑂ 4 2026-06-10
LLM
GitHub
ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24
画像生成
GitHub
npedit
NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…
★ 15 ⑂ 1 MIT 2026-05-05
3D / NeRF
GitHub
ru4dslam
RU4D-SLAMは、ガウススプラッティングSLAMにおいて不確実性の重み付けを行うことで、4Dシーン再構築を実現するシステ…
★ 15 ⑂ 2 2026-06-01
画像生成
GitHub
JoyBoy
JoyBoyは、チャット、コーディング、画像生成、画像編集、動画実験、モデル管理といった多様なAIワークフローを統合…
★ 15 ⑂ 7 Apache-2.0 2026-06-26