3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
awesome-gpu-for-ai
「Awesome GPU for AI」は、AIおよびLLMワークロード向けGPUの選定ガイドです。特にローカルLLM推論に焦点を当て、VR…
★ 2 2026-06-13
画像生成
GitHub
ernie-image-mlx
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…
★ 2 ⑂ 1 MIT 2026-05-22
画像生成
GitHub
sage-color
SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…
★ 2 NOASSERTION 2026-05-28
ASR / 音声認識
GitHub
deckle
Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…
★ 2 MIT 2026-06-16
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
LLM
GitHub
drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
ASR / 音声認識
GitHub
taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
音声生成 / TTS
GitHub
HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
ComfyUI
GitHub
Prompt808
Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…
★ 2 ⑂ 1 MIT 2026-04-25
ComfyUI
GitHub
comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
画像生成
GitHub
DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04
画像生成
GitHub
SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
ComfyUI
GitHub
ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
音声生成 / TTS
GitHub
Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
動画生成
GitHub
gemini-omni-flash
「Gemini Omni Video Generator」は、Googleの次世代LLM技術を搭載したGemini Omni、Gemini Omni Flash、およびVeo動…
★ 2 2026-05-20
ComfyUI
GitHub
awesome-ai-video
このリポジトリは、最新のAIテキスト・画像-to-ビデオモデル、ツール、リソースを厳選したリストです。2026年半ばに…
★ 2 ⑂ 1 CC0-1.0 2026-06-03
3D / NeRF
GitHub
2D-to-Mesh
このツールは、単一の2D RGB画像からテクスチャ付き3Dメッシュを生成するPythonパイプラインです。AppleのDepthProモ…
★ 2 2026-05-31
3D / NeRF
GitHub
Metal-Node
Metal Composerは、macOS向けのノードベースのビジュアルプログラミングアプリです。リアルタイムMetalシェーダー、…
★ 2 2026-05-29
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
3D / NeRF
GitHub
diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13
音声生成 / TTS
GitHub
strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
画像生成
GitHub
FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
画像生成
GitHub
sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27