3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30
ASR / 音声認識 GitHub hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
マルチモーダル GitHub tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
動画生成 GitHub bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
音楽・音声生成 GitHub Monolith
Monolithは、LLM(大規模言語モデル)、Stable Diffusion、音声生成などに対応したローカルAIワークステーションです…
★ 3 MIT 2026-03-23
画像生成 GitHub Preserve-and-Personalize
本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…
★ 3 ⑂ 1 MIT 2026-05-22
ComfyUI GitHub Eric_Color_Correction_ComfyUI
Eric Color Correction for ComfyUIは、ComfyUI向けのプロフェッショナルな色補正、スキントーン調整、およびバッチ…
★ 3 ⑂ 1 NOASSERTION 2026-04-23
動画生成 GitHub ltx-descktop-unlockeds-
「LTX Desktop Unlocked」は、AIによる動画・画像生成を行うデスクトップアプリケーションのアンロック版です。従来…
★ 3 Apache-2.0 2026-04-08
ComfyUI GitHub ai-cinema-studio-engine
PopTech Studioが提供するAI Cinema Studio Engineは、自社ホスト型のAI映画制作エンジンです。Higgsfield Cinema St…
★ 3 ⑂ 2 MIT 2026-04-13
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
3D / NeRF GitHub Mono-HDR-3D
Mono-HDR-3Dは、ICML 2025で発表された、単一露光の低ダイナミックレンジ(LDR)画像から高ダイナミックレンジ(HDR…
★ 3 Apache-2.0 2026-04-27
マルチモーダル GitHub AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
ASR / 音声認識 GitHub jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
画像生成 GitHub SCFlow
SCFlow(Self-Corrected Flow Distillation)は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…
★ 3 ⑂ 2 GPL-3.0 2026-05-23
3D / NeRF GitHub m3d_rocm
このプロジェクトは、Matrix-3DをAMDのROCmエコシステム向けに最適化した3D世界生成ツールです。テキストまたは画像…
★ 3 MIT 2026-06-19
音声生成 / TTS GitHub ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
画像生成 GitHub Diffusion-Zero-to-Hero
本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…
★ 3 Apache-2.0 2026-05-21
音声生成 / TTS GitHub fableforge
FableForgeは、AIを活用して管理学の寓話的な短編ビデオを自動生成するパイプラインです。ユーザーが用意した管理コ…
★ 3 MIT 2026-05-22
3D / NeRF GitHub msplat
msplatは、Apple Silicon搭載Mac向けに最適化された高速な3Dガウススプラッティングツールです。ユーザーはコーディ…
★ 3 Apache-2.0 2026-06-22
動画生成 GitHub ai-video-creator
このツールは、Claude Agent Skillとして機能し、生活の知恵に関するアイデアを、AIナレーション付きで直接公開可能…
★ 3 MIT 2026-06-11
音楽生成 GitHub onpu
Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…
★ 3 AGPL-3.0 2026-06-15
ASR / 音声認識 GitHub MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
ComfyUI GitHub Xianxia_Studio
Xianxia Studioは、YouTube向け動画を100%オフラインで制作できるローカルAI映画制作スタジオです。テーマを入力する…
★ 3 Apache-2.0 2026-06-01
LLM GitHub LongShuGameDev
LongShu (龙枢) は、ゲーム開発に特化した大規模言語モデルです。複雑なゲームシステムの要件を分解し、実行可能な開…
★ 3 NOASSERTION 2026-04-10