3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
stable-diffusion-webui
Stable Diffusion web UIは、Gradioライブラリで実装された、画像生成AI「Stable Diffusion」の多機能なWebインター…
★ 163.9k ⑂ 30.4k AGPL-3.0 2026-03-02
LLM
GitHub
vllm
vLLMは、大規模言語モデル (LLM) の高速かつ効率的な推論とサービングを可能にするPythonライブラリです。最先端のス…
★ 84.8k ⑂ 18.6k Apache-2.0 2026-06-29
LLM
GitHub
LlamaFactory
LlamaFactoryは、100以上の大規模言語モデル(LLM)と視覚言語モデル(VLM)を効率的にファインチューニングするため…
★ 72.5k ⑂ 8.9k Apache-2.0 2026-06-24
音声生成 / TTS
GitHub
unsloth
Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…
★ 67.5k ⑂ 6.1k Apache-2.0 2026-06-28
音声生成 / TTS
GitHub
GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 59.1k ⑂ 6.4k MIT 2026-06-20
LLM
GitHub
minimind
この「MiniMind」プロジェクトは、わずか数元の費用と短時間の訓練で、GPT-3の約1/2700という超小型言語モデルをゼロ…
★ 52.3k ⑂ 6.7k Apache-2.0 2026-06-28
音声生成 / TTS
GitHub
ChatTTS
ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。自然で表現豊かな音声合成を…
★ 39.5k ⑂ 4.2k AGPL-3.0 2026-04-10
音声生成 / TTS
GitHub
MockingBird
Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニン…
★ 36.9k ⑂ 5.2k NOASSERTION 2026-03-03
画像生成
GitHub
diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27
音声生成 / TTS
GitHub
VoxCPM
VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…
★ 32.1k ⑂ 3.6k Apache-2.0 2026-06-29
LLM
GitHub
happy-llm
このプロジェクトは、Datawhaleが提供する大規模言語モデル(LLM)の体系的な学習チュートリアルです。NLPの基礎、Tr…
★ 31.6k ⑂ 3.0k NOASSERTION 2026-05-06
LLM
GitHub
llmfit
llmfitは、ユーザーのRAM、CPU、GPUといったハードウェアリソースに合わせて最適な大規模言語モデル(LLM)を効率的…
★ 28.7k ⑂ 1.8k MIT 2026-06-24
画像生成
GitHub
pytorch-CycleGAN-and-pix2pix
本ツールは、PyTorchフレームワーク上で動作する画像から画像への変換(Image-to-Image Translation)を実現するライ…
★ 25.2k ⑂ 6.6k NOASSERTION 2025-08-06
マルチモーダル
GitHub
LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12
ComfyUI
GitHub
Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14
ASR / 音声認識
GitHub
whisperX
WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離(Diarization)機能…
★ 22.7k ⑂ 2.3k BSD-2-Clause 2026-06-26
動画生成
GitHub
Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 21.6k ⑂ 3.7k MIT 2026-06-28
ASR / 音声認識
GitHub
FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 18.7k ⑂ 1.9k MIT 2026-06-28
動画生成
GitHub
LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01
ASR / 音声認識
GitHub
pyvideotrans
pyVideoTransは、動画を多言語に翻訳し、吹き替えと字幕を埋め込むための強力なオープンソースツールです。音声認識…
★ 18.1k ⑂ 2.2k GPL-3.0 2026-06-23
音声生成 / TTS
GitHub
VideoLingo
VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…
★ 17.6k ⑂ 1.9k Apache-2.0 2026-06-13
音声生成 / TTS
GitHub
NeMo
NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI(自動音声認識、Text-to-Speech)向けにNVIDIAが…
★ 17.5k ⑂ 3.5k Apache-2.0 2026-06-24
動画生成
GitHub
Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 16.4k ⑂ 2.0k Apache-2.0 2026-03-17
画像生成
GitHub
stable-diffusion-webui-colab
このリポジトリは、Stable Diffusion WebUIをGoogle Colabで利用するためのもので、DreamBoothやLoRAトレーナーの機…
★ 15.9k ⑂ 2.6k Unlicense 2025-12-16