3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30
音声生成 / TTS
GitHub
ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
ComfyUI
GitHub
Xianxia_Studio
Xianxia Studioは、YouTube向け動画を100%オフラインで制作できるローカルAI映画制作スタジオです。テーマを入力する…
★ 3 Apache-2.0 2026-06-01
音楽生成
GitHub
onpu
Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…
★ 3 AGPL-3.0 2026-06-15
動画生成
GitHub
ltx-descktop-unlockeds-
「LTX Desktop Unlocked」は、AIによる動画・画像生成を行うデスクトップアプリケーションのアンロック版です。従来…
★ 3 Apache-2.0 2026-04-08
音楽生成
GitHub
aeon-music-maker
aeon-music-makerは、テキスト記述からスタジオ品質の音楽を生成するCLIツールです。ACE Step 1.5 XLモデルを活用し…
★ 3 MIT 2026-07-01
ComfyUI
GitHub
ComfyUI-zveroboy-photo
ComfyUI-zveroboy-photoは、AI生成画像にリアルなセンサーノイズ、アナログアーティファクト、カメラメタデータを適…
★ 3 2026-06-29
画像生成
GitHub
CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 3 Unlicense 2026-06-23
画像生成
GitHub
ernie-image-mlx
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…
★ 3 ⑂ 1 MIT 2026-05-22
音声生成 / TTS
GitHub
AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
ASR / 音声認識
GitHub
jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
音声生成 / TTS
GitHub
supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
3D / NeRF
GitHub
2D-to-Mesh
このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…
★ 2 2026-05-31
3D / NeRF
GitHub
Metal-Node
Metal Composerは、macOS向けのノードベースのビジュアルプログラミングアプリです。リアルタイムMetalシェーダー、…
★ 2 2026-05-29
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
LLM
GitHub
drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
3D / NeRF
GitHub
diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13
LLM
GitHub
megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 2 ⑂ 1 MIT 2026-04-17
画像生成
GitHub
sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
マルチモーダル
GitHub
alpamayo-trace
この「alpamayo-trace」は、NVIDIA Alpamayo R1(Vision-Language-Actionモデル)とQwen2.5-VL(Vision-Languageモデ…
★ 2 Apache-2.0 2026-05-08
画像生成
GitHub
DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04