3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
2D-to-Mesh
このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…
★ 2 2026-05-31
ComfyUI
GitHub
semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
音声生成 / TTS
GitHub
HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
画像生成
GitHub
Heat-Diffusion
このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…
★ 2 MIT 2026-05-24
マルチモーダル
GitHub
visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
3D / NeRF
GitHub
worldsplat
WorldSplatは、テキストプロンプトからナビゲーション可能な3Dガウスプラットシーンを生成するオープンソースツール…
★ 2 NOASSERTION 2026-03-28
動画生成
GitHub
making-commercials-with-ltx-ai-video-guide
「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…
★ 2 Apache-2.0 2026-04-29
動画生成
GitHub
gemini-omni-flash
「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…
★ 2 2026-05-20
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
マルチモーダル
GitHub
alpamayo-trace
この「alpamayo-trace」は、NVIDIA Alpamayo R1(Vision-Language-Actionモデル)とQwen2.5-VL(Vision-Languageモデ…
★ 2 Apache-2.0 2026-05-08
画像生成
GitHub
Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
画像生成
GitHub
FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
ComfyUI
GitHub
ComfyUI-PromptDrafter-SceneQueue
ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…
★ 2 ⑂ 1 MIT 2026-03-20
画像生成
GitHub
SwiftDiffusion
SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…
★ 2 ⑂ 1 MIT 2026-06-11
マルチモーダル
GitHub
video-evaluator
「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…
★ 2 MIT 2026-06-25
LLM
GitHub
drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
ComfyUI
GitHub
ComfyUI-MemoryVisualization
ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…
★ 2 2026-06-23
画像生成
GitHub
SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
音声生成 / TTS
GitHub
NeuralForge
NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル(LLM)をファインチューニングするためのツー…
★ 2 MIT 2026-06-25
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
音声生成 / TTS
GitHub
Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
LLM
GitHub
flash-opd
FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…
★ 2 2026-04-22
画像生成
GitHub
rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
画像生成
GitHub
ernie-image-mlx
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…
★ 2 ⑂ 1 MIT 2026-05-22