3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
attn_res
このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…
★ 33 ⑂ 3 Apache-2.0 2026-03-16
画像生成
GitHub
RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
マルチモーダル
GitHub
Uni-ViGU
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…
★ 32 ⑂ 1 Apache-2.0 2026-04-15
ComfyUI
GitHub
Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
ASR / 音声認識
GitHub
FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 31 ⑂ 3 2026-05-23
音声生成 / TTS
GitHub
wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
音声生成 / TTS
GitHub
supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
ComfyUI
GitHub
ComfyUI-Win-Blackwell
「ComfyUI for GeForce RTX 50-Series (Blackwell)」は、NVIDIA GeForce RTX 50シリーズ(Blackwellアーキテクチャ)…
★ 29 ⑂ 1 MIT 2026-03-02
3D / NeRF
GitHub
iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
マルチモーダル
GitHub
SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
マルチモーダル
GitHub
weld-anomaly-classifier
WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…
★ 28 ⑂ 1 MIT 2026-03-06
画像生成
GitHub
comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
画像生成
GitHub
mold
moldは、ローカルGPUを活用して画像や短いビデオクリップを生成する強力なCLIツールです。クラウドやPython環境を必…
★ 27 MIT 2026-06-22
3D / NeRF
GitHub
UniVerse
UniVerseは、ICCV 2025で発表された「動画拡散モデルのシーン事前分布を活用したロバストなラディアンスフィールド再…
★ 27 2025-10-03
マルチモーダル
GitHub
SR-3D
SR-3Dは、ICLR'26で発表された「3D Aware Region Prompted Vision Language Model」の実装です。単一視点と多視点入…
★ 27 Apache-2.0 2026-02-19
マルチモーダル
GitHub
EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
画像生成
GitHub
ComfyUI-HiresFix-Ultra-AllInOne
ComfyUI Hires Fix Ultra - All in Oneは、ComfyUI向けの高性能なHires Fixソリューションです。潜在空間/モデルアッ…
★ 26 ⑂ 2 MIT 2026-04-06
音声生成 / TTS
GitHub
mlx-speech
mlx-speechは、Apple Silicon Mac(M1以降)向けに特化した、純粋なMLXベースの音声技術ツールキットです。クラウド…
★ 26 ⑂ 4 MIT 2026-06-24
音声生成 / TTS
GitHub
silma-tts
SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル(アラビア語と英語)テキスト音声…
★ 25 ⑂ 4 MIT 2026-05-07
画像生成
GitHub
ChaosEngineAI
ChaosEngineAIは、本格的なAI開発者や愛好家向けのローカルAIワークステーションです。オープンウェイトモデルの発見…
★ 25 ⑂ 4 Apache-2.0 2026-06-26
動画生成
GitHub
comfyui-wan-i2v-control
ComfyUI WAN I2V Controlは、WAN Image-to-Video生成において、開始画像の特定の部分を選択的に変換するためのComfyU…
★ 25 ⑂ 1 2026-06-07
画像生成
GitHub
modl
modlは、ローカル環境でAI画像生成とLoRA学習を行うためのツールキットです。モデルのダウンロードから依存関係の解…
★ 25 ⑂ 2 AGPL-3.0 2026-05-06
マルチモーダル
GitHub
MOSAIC
MOSAICは、強化学習(RL)、大規模言語モデル(LLM)、視覚言語モデル(VLM)、そして人間の意思決定者といった異な…
★ 24 ⑂ 4 MIT 2026-04-21