3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
マルチモーダル GitHub tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
動画生成 GitHub bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
音楽・音声生成 GitHub Monolith
Monolithは、LLM(大規模言語モデル)、Stable Diffusion、音声生成などに対応したローカルAIワークステーションです…
★ 3 MIT 2026-03-23
ComfyUI GitHub comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
3D / NeRF GitHub 2D-to-Mesh
このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…
★ 2 2026-05-31
ComfyUI GitHub semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
音声生成 / TTS GitHub HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
画像生成 GitHub Heat-Diffusion
このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…
★ 2 MIT 2026-05-24
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
3D / NeRF GitHub worldsplat
WorldSplatは、テキストプロンプトからナビゲーション可能な3Dガウスプラットシーンを生成するオープンソースツール…
★ 2 NOASSERTION 2026-03-28
動画生成 GitHub making-commercials-with-ltx-ai-video-guide
「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…
★ 2 Apache-2.0 2026-04-29
動画生成 GitHub gemini-omni-flash
「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…
★ 2 2026-05-20
ASR / 音声認識 GitHub IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
マルチモーダル GitHub alpamayo-trace
この「alpamayo-trace」は、NVIDIA Alpamayo R1(Vision-Language-Actionモデル)とQwen2.5-VL(Vision-Languageモデ…
★ 2 Apache-2.0 2026-05-08
画像生成 GitHub Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
画像生成 GitHub FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
ComfyUI GitHub ComfyUI-PromptDrafter-SceneQueue
ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…
★ 2 ⑂ 1 MIT 2026-03-20
画像生成 GitHub SwiftDiffusion
SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…
★ 2 ⑂ 1 MIT 2026-06-11
マルチモーダル GitHub video-evaluator
「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…
★ 2 MIT 2026-06-25
LLM GitHub drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
ComfyUI GitHub ComfyUI-MemoryVisualization
ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…
★ 2 2026-06-23
画像生成 GitHub SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
音声生成 / TTS GitHub NeuralForge
NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル(LLM)をファインチューニングするためのツー…
★ 2 MIT 2026-06-25