3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

動画生成

text-to-video-ms-1.7b

本モデルは、テキストの記述に基づいて動画を生成するマルチステージのテキストから動画生成拡散モデルです。約17億…

#CLI #GPU必須 #Python

❤ 666 ↓ 108.4k cc-by-nc-4.0 2023-12-01

LLM

GitHub

can-i-finetune-this

canifinetuneは、コンシューマー向けNVIDIA GPU（12-24GB）で大規模言語モデル（LLM）のファインチューニングを検討…

#CLI #GPU必須 #Hugging Face

★ 649 ⑂ 92 MIT 2026-06-10

画像生成

GitHub

nano-world-model

「Nano World Model」は、拡散強制（diffusion-forcing）に基づくビデオワールドモデルのトレーニングに特化した、シ…

#CLI #GPU必須 #Hugging Face

★ 643 ⑂ 33 MIT 2026-06-15

マルチモーダル

BiRefNet

BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…

#CLI #GPU必須 #Hugging Face対応

❤ 600 ↓ 719.6k mit 2026-02-04

ComfyUI

GitHub

ComfyUI-VibeVoice

ComfyUI-VibeVoiceは、MicrosoftのVibeVoiceをComfyUIに統合するカスタムノードです。表現力豊かで長尺なマルチスピ…

#ComfyUI対応 #GPU必須 #Python

★ 587 ⑂ 108 MIT 2025-09-25

ComfyUI

GitHub

ComfyUI-IDM-VTON

ComfyUI-IDM-VTONは、IDM-VTONのComfyUI向け適応版で、画像を用いたバーチャル試着を実現するツールです。ComfyUI環…

#AI #ComfyUI対応 #GPU必須

★ 586 ⑂ 68 GPL-3.0 2024-08-20

ComfyUI

GitHub

ComfyUI-Kolors-MZ

ComfyUI上でKwai-Kolorsモデルを利用可能にするためのカスタムノードとワークフローを提供するツールです。ComfyUIの…

#ComfyUI対応 #ControlNet対応 #FaceID対応

★ 584 ⑂ 38 GPL-3.0 2025-03-31

ComfyUI

GitHub

ComfyUI-Marigold

ComfyUI-Marigoldは、画像から深度マップを推定するMarigoldモデルのComfyUI向けラッパーノードです。このツールは、…

#ComfyUI対応 #GPU必須 #Hugging Face

★ 572 ⑂ 25 GPL-3.0 2025-05-16

ComfyUI

GitHub

ComfyUI-AnimateAnyone-Evolved

本ツールは、AnimateAnyoneの実装を改良し、ポーズ画像シーケンスと参照画像を基にスタイライズされた動画を生成しま…

#AI #ComfyUI対応 #GPU必須

★ 560 ⑂ 50 MIT 2024-06-14

マルチモーダル

Voxtral-Small-24B-2507

Voxtral Small 1.0（24B）は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。音声の…

#GPU必須 #音声入力対応

❤ 501 ↓ 105.6k apache-2.0 2025-12-20

3D / NeRF

GitHub

Scal3R

Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…

#3D再構築 #CLI #GPU必須

★ 494 ⑂ 37 NOASSERTION 2026-05-11

動画生成

GitHub

Google-Colab_Notebooks

このリポジトリは、様々なAIプロジェクトのためのGoogle Colabノートブック集です。特に、ビジュアルプログラミング…

#ComfyUI対応 #Google Colab #GPU必須

★ 483 ⑂ 167 2026-06-20

画像生成

GitHub

PixelSmile

PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…

#CLI #ComfyUI対応 #GPU必須

★ 478 ⑂ 22 Apache-2.0 2026-04-22

動画生成

LTX-2.3-GGUF

unsloth/LTX-2.3-GGUFは、LightricksのLTX-2.3をGGUF量子化し、ComfyUI上でローカル実行しやすくした音声付き動画生…

#CLI #ComfyUI対応 #GGUF

❤ 478 ↓ 300.6k other 2026-04-20

画像生成

Z-Anime

Z-Animeは、AlibabaのZ-Image Baseを土台にしたアニメ画像生成向けのフルファインチューニングモデル群です。LoRAマ…

#ComfyUI対応 #Diffusers #GGUF

❤ 461 ↓ 1.9k apache-2.0 2026-04-27

音声生成 / TTS

GitHub

Confucius4-TTS

Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…

#CLI #GPU必須 #Hugging Face対応

★ 448 ⑂ 45 NOASSERTION 2026-06-17

LLM

GitHub

orthrus

Orthrusは、大規模言語モデル（LLM）の推論を高速化するためのデュアルアーキテクチャフレームワークです。自己回帰…

#CLI #Colab対応 #GPU必須

★ 446 ⑂ 19 MIT 2026-05-18

画像生成

GitHub

Bonsai-Image-Demo

Bonsai Image Demoは、Apple Silicon (macOS) またはNVIDIA GPU (Linux/Windows) を利用して、ローカルで画像を生成…

#CLI #GPU必須 #Linux

★ 444 ⑂ 58 Apache-2.0 2026-06-14

画像生成

Flux2-Klein-9B-Consistency

Flux2-Klein-9B-Consistencyは、black-forest-labs/FLUX.2-klein-9B向けのLoRAで、追加のキーワードなしでもキャラク…

#Diffusers #GPU必須

❤ 436 ↓ 36.3k apache-2.0 2026-04-19

ComfyUI

GitHub

ComfyUI-OmniVoice-TTS

ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ（TTS）ノード…

#ComfyUI対応 #GPU必須 #Python

★ 434 ⑂ 56 Apache-2.0 2026-06-11

画像生成

GitHub

verl-omni

VeRL-Omniは、拡散モデルやオムニモダリティモデルといったマルチモーダル生成モデルに特化した強化学習（RL）トレー…

#GPU必須 #Python #RLフレームワーク

★ 431 ⑂ 63 Apache-2.0 2026-06-26

LLM

GitHub

KVarN

KVarNは、LLMのKVキャッシュ量子化をvLLM環境で実現するネイティブバックエンドです。特に、エージェントや長文コン…

#CLI #GPU必須 #KVキャッシュ量子化

★ 419 ⑂ 27 Apache-2.0 2026-06-22

3D / NeRF

HY-Motion-1.0

「HY-Motion 1.0」は、Tencentが開発した、テキストプロンプトから3Dヒューマンモーションを生成するための最先端モ…

#CLI #GPU必須 #Linux対応

❤ 418 ↓ 483 other 2025-12-31

マルチモーダル

GitHub

VEGA-3D

VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…

#CLI #GPU必須 #HuggingFace対応

★ 418 ⑂ 23 Apache-2.0 2026-06-18