3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
マルチモーダル
GitHub
tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
動画生成
GitHub
bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
音楽・音声生成
GitHub
Monolith
Monolithは、LLM(大規模言語モデル)、Stable Diffusion、音声生成などに対応したローカルAIワークステーションです…
★ 3 MIT 2026-03-23
画像生成
GitHub
Preserve-and-Personalize
本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…
★ 3 ⑂ 1 MIT 2026-05-22
ComfyUI
GitHub
Eric_Color_Correction_ComfyUI
Eric Color Correction for ComfyUIは、ComfyUI向けのプロフェッショナルな色補正、スキントーン調整、およびバッチ…
★ 3 ⑂ 1 NOASSERTION 2026-04-23
動画生成
GitHub
ltx-descktop-unlockeds-
「LTX Desktop Unlocked」は、AIによる動画・画像生成を行うデスクトップアプリケーションのアンロック版です。従来…
★ 3 Apache-2.0 2026-04-08
ComfyUI
GitHub
ai-cinema-studio-engine
PopTech Studioが提供するAI Cinema Studio Engineは、自社ホスト型のAI映画制作エンジンです。Higgsfield Cinema St…
★ 3 ⑂ 2 MIT 2026-04-13
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
3D / NeRF
GitHub
Mono-HDR-3D
Mono-HDR-3Dは、ICML 2025で発表された、単一露光の低ダイナミックレンジ(LDR)画像から高ダイナミックレンジ(HDR…
★ 3 Apache-2.0 2026-04-27
マルチモーダル
GitHub
AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
ASR / 音声認識
GitHub
jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
画像生成
GitHub
SCFlow
SCFlow(Self-Corrected Flow Distillation)は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…
★ 3 ⑂ 2 GPL-3.0 2026-05-23
3D / NeRF
GitHub
m3d_rocm
このプロジェクトは、Matrix-3DをAMDのROCmエコシステム向けに最適化した3D世界生成ツールです。テキストまたは画像…
★ 3 MIT 2026-06-19
音声生成 / TTS
GitHub
ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
画像生成
GitHub
Diffusion-Zero-to-Hero
本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…
★ 3 Apache-2.0 2026-05-21
音声生成 / TTS
GitHub
fableforge
FableForgeは、AIを活用して管理学の寓話的な短編ビデオを自動生成するパイプラインです。ユーザーが用意した管理コ…
★ 3 MIT 2026-05-22
3D / NeRF
GitHub
msplat
msplatは、Apple Silicon搭載Mac向けに最適化された高速な3Dガウススプラッティングツールです。ユーザーはコーディ…
★ 3 Apache-2.0 2026-06-22
動画生成
GitHub
ai-video-creator
このツールは、Claude Agent Skillとして機能し、生活の知恵に関するアイデアを、AIナレーション付きで直接公開可能…
★ 3 MIT 2026-06-11
音楽生成
GitHub
onpu
Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…
★ 3 AGPL-3.0 2026-06-15
ASR / 音声認識
GitHub
MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
ComfyUI
GitHub
Xianxia_Studio
Xianxia Studioは、YouTube向け動画を100%オフラインで制作できるローカルAI映画制作スタジオです。テーマを入力する…
★ 3 Apache-2.0 2026-06-01
LLM
GitHub
LongShuGameDev
LongShu (龙枢) は、ゲーム開発に特化した大規模言語モデルです。複雑なゲームシステムの要件を分解し、実行可能な開…
★ 3 NOASSERTION 2026-04-10