3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
動画生成 GitHub seedance-api
Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…
★ 33 ⑂ 5 2026-06-24
マルチモーダル GitHub Uni-ViGU
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…
★ 32 ⑂ 1 Apache-2.0 2026-04-15
画像生成 GitHub RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
ComfyUI GitHub Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
ASR / 音声認識 GitHub FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 31 ⑂ 3 2026-05-23
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
ComfyUI GitHub ComfyUI-Win-Blackwell
「ComfyUI for GeForce RTX 50-Series (Blackwell)」は、NVIDIA GeForce RTX 50シリーズ(Blackwellアーキテクチャ)…
★ 29 ⑂ 1 MIT 2026-03-02
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
マルチモーダル GitHub SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
マルチモーダル GitHub weld-anomaly-classifier
WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…
★ 28 ⑂ 1 MIT 2026-03-06
画像生成 GitHub comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
3D / NeRF GitHub UniVerse
UniVerseは、ICCV 2025で発表された「動画拡散モデルのシーン事前分布を活用したロバストなラディアンスフィールド再…
★ 27 2025-10-03
マルチモーダル GitHub SR-3D
SR-3Dは、ICLR'26で発表された「3D Aware Region Prompted Vision Language Model」の実装です。単一視点と多視点入…
★ 27 Apache-2.0 2026-02-19
画像生成 GitHub mold
moldは、ローカルGPUを活用して画像や短いビデオクリップを生成する強力なCLIツールです。クラウドやPython環境を必…
★ 27 MIT 2026-06-22
3D / NeRF GitHub QuestRoomScan
QuestRoomScanは、Meta Quest 3向けのリアルタイム3Dルーム再構築ツールです。GPU TSDFとSurface Netsメッシュ抽出を…
★ 27 ⑂ 2 NOASSERTION 2026-04-20
マルチモーダル GitHub EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
画像生成 GitHub ComfyUI-HiresFix-Ultra-AllInOne
ComfyUI Hires Fix Ultra - All in Oneは、ComfyUI向けの高性能なHires Fixソリューションです。潜在空間/モデルアッ…
★ 26 ⑂ 2 MIT 2026-04-06
音声生成 / TTS GitHub mlx-speech
mlx-speechは、Apple Silicon Mac(M1以降)向けに特化した、純粋なMLXベースの音声技術ツールキットです。クラウド…
★ 26 ⑂ 4 MIT 2026-06-24
音声生成 / TTS GitHub silma-tts
SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル(アラビア語と英語)テキスト音声…
★ 25 ⑂ 4 MIT 2026-05-07
画像生成 GitHub ChaosEngineAI
ChaosEngineAIは、本格的なAI開発者や愛好家向けのローカルAIワークステーションです。オープンウェイトモデルの発見…
★ 25 ⑂ 4 Apache-2.0 2026-06-26
動画生成 GitHub comfyui-wan-i2v-control
ComfyUI WAN I2V Controlは、WAN Image-to-Video生成において、開始画像の特定の部分を選択的に変換するためのComfyU…
★ 25 ⑂ 1 2026-06-07
画像生成 GitHub modl
modlは、ローカル環境でAI画像生成とLoRA学習を行うためのツールキットです。モデルのダウンロードから依存関係の解…
★ 25 ⑂ 2 AGPL-3.0 2026-05-06
ComfyUI GitHub ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 24 ⑂ 2 NOASSERTION 2026-05-04