3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

attn_res

このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…

#GPU必須 #Python #PyTorch

★ 33 ⑂ 3 Apache-2.0 2026-03-16

画像生成

GitHub

RTDMD

RTDMD（Reward-Tilted Distribution Matching Distillation）は、少ないステップ数で高品質な画像を生成する「few-st…

#CLI #GPU必須 #Python

★ 32 ⑂ 1 Apache-2.0 2026-06-06

マルチモーダル

GitHub

Uni-ViGU

Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…

#CLI #Diffusionモデル #GPU必須

★ 32 ⑂ 1 Apache-2.0 2026-04-15

ComfyUI

GitHub

Dots-TTS-ComfyUI

このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…

#ComfyUI対応 #GPU必須 #Python

★ 31 ⑂ 3 Apache-2.0 2026-06-11

ASR / 音声認識

GitHub

FastWord

FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…

#GPU必須 #macOS #Rust

★ 31 ⑂ 3 2026-05-23

音声生成 / TTS

GitHub

wavlm-vocoder-french

本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…

#CLI #GPU必須 #Hugging Face

★ 31 MIT 2026-05-13

音声生成 / TTS

GitHub

supertonic3-voice-clone

Supertone/supertonic-3モデル向けに、音声スタイル（.jsonファイル）を学習させるためのツールです。低GPU使用量（…

#AI/ML #Colab対応 #GPU必須

★ 29 ⑂ 8 MIT 2026-05-25

ComfyUI

GitHub

ComfyUI-Win-Blackwell

「ComfyUI for GeForce RTX 50-Series (Blackwell)」は、NVIDIA GeForce RTX 50シリーズ（Blackwellアーキテクチャ）…

#ComfyUI対応 #CUDA 13.0 #GPU必須

★ 29 ⑂ 1 MIT 2026-03-02

3D / NeRF

GitHub

iMaC

このツールは、iMaC（Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル）と…

#CLI #Diffusers #GPU必須

★ 29 2026-06-21

マルチモーダル

GitHub

SSM

このリポジリは、顔の動作単位（AU）と顔の表情（FE）の双方向学習を可能にするStructured Semantic Mapping（SSM）…

#GPU必須 #Python #機械学習

★ 28 2026-04-17

マルチモーダル

GitHub

weld-anomaly-classifier

WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…

#CLI #GPU必須 #Python

★ 28 ⑂ 1 MIT 2026-03-06

画像生成

GitHub

comfyui-ReferenceLatentPlus

このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…

#AI/ML #ComfyUI対応 #GPU必須

★ 28 ⑂ 4 2026-06-07

画像生成

GitHub

mold

moldは、ローカルGPUを活用して画像や短いビデオクリップを生成する強力なCLIツールです。クラウドやPython環境を必…

#AI #CLI #GPU必須

★ 27 MIT 2026-06-22

3D / NeRF

GitHub

UniVerse

UniVerseは、ICCV 2025で発表された「動画拡散モデルのシーン事前分布を活用したロバストなラディアンスフィールド再…

#CLI #GPU必須 #Python

★ 27 2025-10-03

マルチモーダル

GitHub

SR-3D

SR-3Dは、ICLR'26で発表された「3D Aware Region Prompted Vision Language Model」の実装です。単一視点と多視点入…

#CLI #GPU必須 #Hugging Face

★ 27 Apache-2.0 2026-02-19

3D / NeRF

GitHub

QuestRoomScan

QuestRoomScanは、Meta Quest 3向けのリアルタイム3Dルーム再構築ツールです。GPU TSDFとSurface Netsメッシュ抽出を…

#3D再構築 #AIオブジェクト検出 #Gaussian Splatting

★ 27 ⑂ 2 NOASSERTION 2026-04-20

マルチモーダル

GitHub

EfficientVideoAgent

EVA（Efficient Video Agent）は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…

#CLI #GPU必須 #Hugging Face

★ 26 2026-05-06

画像生成

GitHub

ComfyUI-HiresFix-Ultra-AllInOne

ComfyUI Hires Fix Ultra - All in Oneは、ComfyUI向けの高性能なHires Fixソリューションです。潜在空間/モデルアッ…

#ComfyUI対応 #GPU必須 #Python

★ 26 ⑂ 2 MIT 2026-04-06

音声生成 / TTS

GitHub

mlx-speech

mlx-speechは、Apple Silicon Mac（M1以降）向けに特化した、純粋なMLXベースの音声技術ツールキットです。クラウド…

#Apple Silicon #CLI #GPU必須

★ 26 ⑂ 4 MIT 2026-06-24

音声生成 / TTS

GitHub

silma-tts

SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル（アラビア語と英語）テキスト音声…

#CLI #GPU必須 #Python

★ 25 ⑂ 4 MIT 2026-05-07

画像生成

GitHub

ChaosEngineAI

ChaosEngineAIは、本格的なAI開発者や愛好家向けのローカルAIワークステーションです。オープンウェイトモデルの発見…

#GPU必須 #Linux #macOS

★ 25 ⑂ 4 Apache-2.0 2026-06-26

動画生成

GitHub

comfyui-wan-i2v-control

ComfyUI WAN I2V Controlは、WAN Image-to-Video生成において、開始画像の特定の部分を選択的に変換するためのComfyU…

#ComfyUI対応 #GPU必須 #Image-to-Video

★ 25 ⑂ 1 2026-06-07

画像生成

GitHub

modl

modlは、ローカル環境でAI画像生成とLoRA学習を行うためのツールキットです。モデルのダウンロードから依存関係の解…

#CLI #GPU必須 #Python

★ 25 ⑂ 2 AGPL-3.0 2026-05-06

マルチモーダル

GitHub

MOSAIC

MOSAICは、強化学習（RL）、大規模言語モデル（LLM）、視覚言語モデル（VLM）、そして人間の意思決定者といった異な…

#GPU必須 #LLM #Python

★ 24 ⑂ 4 MIT 2026-04-21