3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

stable-diffusion-webui

Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…

#API #GPU必須 #Python

★ 163.9k ⑂ 30.4k AGPL-3.0 2026-03-02

LLM

GitHub

vllm

vLLMは、大規模言語モデル (LLM) の高速かつ効率的な推論とサービングを可能にするPythonライブラリです。最先端のス…

#CLI #GPU必須 #Hugging Face対応

★ 84.8k ⑂ 18.6k Apache-2.0 2026-06-29

LLM

GitHub

LlamaFactory

LlamaFactoryは、100以上の大規模言語モデル（LLM）と視覚言語モデル（VLM）を効率的にファインチューニングするため…

#CLI #GPU必須 #Python

★ 72.5k ⑂ 8.9k Apache-2.0 2026-06-24

音声生成 / TTS

GitHub

unsloth

Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…

#CLI #GPU必須 #Python

★ 67.5k ⑂ 6.1k Apache-2.0 2026-06-28

音声生成 / TTS

GitHub

GPT-SoVITS

GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech（TTS）モデルをトレーニングできる強力なFew-s…

#Docker対応 #GPU必須 #Python

★ 59.1k ⑂ 6.4k MIT 2026-06-20

LLM

GitHub

minimind

この「MiniMind」プロジェクトは、わずか数元の費用と短時間の訓練で、GPT-3の約1/2700という超小型言語モデルをゼロ…

#CLI #GPU必須 #OpenAI API互換

★ 52.3k ⑂ 6.7k Apache-2.0 2026-06-28

音声生成 / TTS

GitHub

ChatTTS

ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。自然で表現豊かな音声合成を…

#CLI #GPU必須 #LLM連携

★ 39.5k ⑂ 4.2k AGPL-3.0 2026-04-10

音声生成 / TTS

GitHub

MockingBird

Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニン…

#GPU必須 #Python #PyTorch

★ 36.9k ⑂ 5.2k NOASSERTION 2026-03-03

画像生成

GitHub

diffusers

🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…

#3Dモデル生成 #GPU必須 #Python

★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27

音声生成 / TTS

GitHub

VoxCPM

VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…

#GPU必須 #Python #Web UI

★ 32.1k ⑂ 3.6k Apache-2.0 2026-06-29

LLM

GitHub

happy-llm

このプロジェクトは、Datawhaleが提供する大規模言語モデル（LLM）の体系的な学習チュートリアルです。NLPの基礎、Tr…

#GPU必須 #LLaMA2 #LLM学習

★ 31.6k ⑂ 3.0k NOASSERTION 2026-05-06

LLM

GitHub

llmfit

llmfitは、ユーザーのRAM、CPU、GPUといったハードウェアリソースに合わせて最適な大規模言語モデル（LLM）を効率的…

#CLI #Docker対応 #GPU必須

★ 28.7k ⑂ 1.8k MIT 2026-06-24

画像生成

GitHub

pytorch-CycleGAN-and-pix2pix

本ツールは、PyTorchフレームワーク上で動作する画像から画像への変換（Image-to-Image Translation）を実現するライ…

#CLI #GPU必須 #Python

★ 25.2k ⑂ 6.6k NOASSERTION 2025-08-06

マルチモーダル

GitHub

LLaVA

LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…

#GPU必須 #Hugging Face対応 #llama.cpp互換

★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12

ComfyUI

GitHub

Pixelle-Video

Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…

#AI動画生成 #ComfyUI対応 #GPU必須

★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14

ASR / 音声認識

GitHub

whisperX

WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離（Diarization）機能…

#CLI #GPU必須 #Python

★ 22.7k ⑂ 2.3k BSD-2-Clause 2026-06-26

動画生成

GitHub

Open-Generative-AI

Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…

#GPU必須 #Python #Web UI

★ 21.6k ⑂ 3.7k MIT 2026-06-28

ASR / 音声認識

GitHub

FunASR

FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識（ASR）、音声活…

#CLI #GPU必須 #Python

★ 18.7k ⑂ 1.9k MIT 2026-06-28

動画生成

GitHub

LivePortrait

LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…

#ComfyUI連携 #GPU必須 #Python

★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01

ASR / 音声認識

GitHub

pyvideotrans

pyVideoTransは、動画を多言語に翻訳し、吹き替えと字幕を埋め込むための強力なオープンソースツールです。音声認識…

#AI吹き替え #CLI #GPU必須

★ 18.1k ⑂ 2.2k GPL-3.0 2026-06-23

音声生成 / TTS

GitHub

VideoLingo

VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…

#AI活用 #GPU必須 #Python

★ 17.6k ⑂ 1.9k Apache-2.0 2026-06-13

音声生成 / TTS

GitHub

NeMo

NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI（自動音声認識、Text-to-Speech）向けにNVIDIAが…

#GPU必須 #HuggingFace対応 #低遅延

★ 17.5k ⑂ 3.5k Apache-2.0 2026-06-24

動画生成

GitHub

Wan2.2

Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合（MoE）アーキテ…

#GPU必須 #Hugging Face対応 #Image-to-Video

★ 16.4k ⑂ 2.0k Apache-2.0 2026-03-17

画像生成

GitHub

stable-diffusion-webui-colab

このリポジトリは、Stable Diffusion WebUIをGoogle Colabで利用するためのもので、DreamBoothやLoRAトレーナーの機…

#Google Colab #GPU必須 #Python

★ 15.9k ⑂ 2.6k Unlicense 2025-12-16