3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

vllm

vLLMは、大規模言語モデル (LLM) の高速かつ効率的な推論とサービングを可能にするPythonライブラリです。最先端のス…

#CLI #GPU必須 #Hugging Face対応

★ 84.8k ⑂ 18.6k Apache-2.0 2026-06-29

LLM

GitHub

LlamaFactory

LlamaFactoryは、100以上の大規模言語モデル（LLM）と視覚言語モデル（VLM）を効率的にファインチューニングするため…

#CLI #GPU必須 #Python

★ 72.5k ⑂ 8.9k Apache-2.0 2026-06-24

音声生成 / TTS

GitHub

unsloth

Unsloth Studioは、Gemma 4、Qwen3.6、DeepSeek、gpt-ossなどのオープンな大規模言語モデルをローカル環境で効率的に…

#CLI #GPU必須 #Python

★ 67.5k ⑂ 6.1k Apache-2.0 2026-06-28

音声生成 / TTS

GitHub

GPT-SoVITS

GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech（TTS）モデルをトレーニングできる強力なFew-s…

#Docker対応 #GPU必須 #Python

★ 59.1k ⑂ 6.4k MIT 2026-06-20

LLM

GitHub

minimind

この「MiniMind」プロジェクトは、わずか数元の費用と短時間の訓練で、GPT-3の約1/2700という超小型言語モデルをゼロ…

#CLI #GPU必須 #OpenAI API互換

★ 52.3k ⑂ 6.7k Apache-2.0 2026-06-28

音声生成 / TTS

GitHub

ChatTTS

ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。自然で表現豊かな音声合成を…

#CLI #GPU必須 #LLM連携

★ 39.5k ⑂ 4.2k AGPL-3.0 2026-04-10

画像生成

GitHub

diffusers

🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…

#3Dモデル生成 #GPU必須 #Python

★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27

音声生成 / TTS

GitHub

VoxCPM

VoxCPM2は、OpenBMBが開発した、テキストを直接音声に変換するトークナイザーフリーの画期的なTTSシステムです。エン…

#GPU必須 #Python #Web UI

★ 32.1k ⑂ 3.6k Apache-2.0 2026-06-29

LLM

GitHub

happy-llm

このプロジェクトは、Datawhaleが提供する大規模言語モデル（LLM）の体系的な学習チュートリアルです。NLPの基礎、Tr…

#GPU必須 #LLaMA2 #LLM学習

★ 31.6k ⑂ 3.0k NOASSERTION 2026-05-06

LLM

GitHub

llmfit

llmfitは、ユーザーのRAM、CPU、GPUといったハードウェアリソースに合わせて最適な大規模言語モデル（LLM）を効率的…

#CLI #Docker対応 #GPU必須

★ 28.7k ⑂ 1.8k MIT 2026-06-24

ComfyUI

GitHub

Pixelle-Video

Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…

#AI動画生成 #ComfyUI対応 #GPU必須

★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14

ASR / 音声認識

GitHub

whisperX

WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離（Diarization）機能…

#CLI #GPU必須 #Python

★ 22.7k ⑂ 2.3k BSD-2-Clause 2026-06-26

動画生成

GitHub

Open-Generative-AI

Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…

#GPU必須 #Python #Web UI

★ 21.6k ⑂ 3.7k MIT 2026-06-28

ASR / 音声認識

GitHub

FunASR

FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識（ASR）、音声活…

#CLI #GPU必須 #Python

★ 18.7k ⑂ 1.9k MIT 2026-06-28

動画生成

GitHub

LivePortrait

LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…

#ComfyUI連携 #GPU必須 #Python

★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01

ASR / 音声認識

GitHub

pyvideotrans

pyVideoTransは、動画を多言語に翻訳し、吹き替えと字幕を埋め込むための強力なオープンソースツールです。音声認識…

#AI吹き替え #CLI #GPU必須

★ 18.1k ⑂ 2.2k GPL-3.0 2026-06-23

音声生成 / TTS

GitHub

VideoLingo

VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…

#AI活用 #GPU必須 #Python

★ 17.6k ⑂ 1.9k Apache-2.0 2026-06-13

音声生成 / TTS

GitHub

NeMo

NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI（自動音声認識、Text-to-Speech）向けにNVIDIAが…

#GPU必須 #HuggingFace対応 #低遅延

★ 17.5k ⑂ 3.5k Apache-2.0 2026-06-24

画像生成

GitHub

HunyuanVideo

HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…

#AI動画生成 #GPU必須 #HuggingFace Diffusers

★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29

画像生成

GitHub

krita-ai-diffusion

Krita用AI画像生成プラグイン「Generative AI for Krita」は、画像ペイント・編集ワークフローにAIを統合します。本…

#ComfyUI対応 #GPU必須 #Inpainting

★ 10.2k ⑂ 597 GPL-3.0 2026-06-17

ASR / 音声認識

GitHub

espnet

ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…

#Docker #GPU必須 #Python

★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24

3D / NeRF

GitHub

awesome-3D-gaussian-splatting

「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting（3DGS）および関連技術に特化した厳選されたリソース…

#C++ #GPU必須 #Python

★ 8.7k ⑂ 538 MIT 2026-06-26

動画生成

GitHub

Sana

SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…

#ComfyUI対応 #GPU必須 #Python

★ 8.4k ⑂ 671 Apache-2.0 2026-06-25

ASR / 音声認識

GitHub

ASRT_SpeechRecognition

ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…

#CLI #GPU必須 #Python

★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10