3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
画像生成 GitHub spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
画像生成 GitHub lora-block-weight-neo
このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…
★ 6 MIT 2026-05-22
動画生成 GitHub ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
音声生成 / TTS GitHub uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
3D / NeRF GitHub LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
画像生成 GitHub ScribeNEO
ScribeNEOは、Stable Diffusion Forge Neo専用に開発されたプロンプトエンジニアリング拡張機能です。AIを活用し、ユ…
★ 6 MIT 2026-05-29
動画生成 GitHub Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
画像生成 GitHub Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
3D / NeRF GitHub 4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 5 Apache-2.0 2026-06-19
画像生成 GitHub reward-guidance
このツールは「Are we really tilting?」論文の実験コードで、フロー・拡散モデルにおける報酬ガイダンスのメカニズ…
★ 5 ⑂ 1 MIT 2026-05-07
3D / NeRF GitHub InsightAT
InsightATは、使いやすさと自動化に焦点を当てたオープンソースのオールインワンStructure-from-Motionシステムで、…
★ 5 ⑂ 3 MIT 2026-06-15
ASR / 音声認識 GitHub whisperx-transcriber
WhisperX Transcriberは、Windowsユーザー向けのオフラインAI音声文字変換ツールです。OpenAIのWhisperモデルとWhisp…
★ 5 ⑂ 1 MIT 2026-06-09
LLM GitHub spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
画像生成 GitHub CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
音声生成 / TTS GitHub VoxFlashTTS
VoxFlash-TTSは、リアルタイム推論に特化した業界最速の音声クローンシステムです。ゼロショット学習により、事前学…
★ 5 2026-06-21
音声生成 / TTS GitHub Supertonic_3_TTS_App
「Supertonic 3 TTS App」は、Supertone Supertonic 3エンジンを搭載した、Windows向けのオンデバイス・ニューラルテ…
★ 5 MIT 2026-05-31
3D / NeRF GitHub Kestrel
Kestrelは、ロボティクスおよびシミュレーションパイプライン向けのリアルタイム2D Gaussian Splattingビューアです…
★ 5 2026-06-05
3D / NeRF GitHub wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
動画生成 GitHub wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
動画生成 GitHub wan2gp-operator
Wan2GP Operatorは、WanGP/Wan2GPによるテキストからビデオ生成を効率化・自動化するオープンソースのCLIツールです…
★ 5 MIT 2026-05-11