3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

DeepLearningExamples

NVIDIA Deep Learning Examplesは、NVIDIA Volta、Turing、Ampere GPU上でNVIDIA CUDA-Xソフトウェアスタックを用い…

#Docker #GPU必須 #PyTorch

★ 14.8k ⑂ 3.4k 2024-08-12

画像生成

GitHub

Hunyuan3D-2

Tencent-Hunyuan/Hunyuan3D-2は、大規模Hunyuan3D拡散モデルを活用した高解像度3Dアセット生成システムです。Hunyuan…

#Blender対応 #CLI #ComfyUI対応

★ 14.1k ⑂ 1.4k NOASSERTION 2025-10-28

画像生成

GitHub

CycleGAN

CycleGANは、ペアになっていない画像データセット間で画像変換を行うためのソフトウェアです。具体的には、絵画を写…

#CLI #GPU必須 #Linux対応

★ 12.9k ⑂ 2.0k NOASSERTION 2023-09-12

動画生成

GitHub

CogVideo

「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。CogVideoXシリーズは、テキストから…

#CLI #GPU必須 #Hugging Face対応

★ 12.8k ⑂ 1.3k Apache-2.0 2025-11-04

画像生成

GitHub

Awesome-Diffusion-Models

「Awesome-Diffusion-Models」は、拡散モデルに関する最新の研究論文や多様なリソースを網羅的に収集したGitHubリポ…

#GPU必須 #Python #学術リソース

★ 12.4k ⑂ 1.0k MIT 2024-08-01

画像生成

GitHub

HunyuanVideo

HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…

#AI動画生成 #GPU必須 #HuggingFace Diffusers

★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29

3D / NeRF

GitHub

nerfstudio

nerfstudioは、NeRF（Neural Radiance Fields）の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…

#CLI #GPU必須 #Python

★ 11.7k ⑂ 1.6k Apache-2.0 2025-07-29

画像生成

GitHub

DALLE2-pytorch

このツールは、OpenAIのテキストから画像への合成ニューラルネットワーク「DALL-E 2」をPyTorchで再現したものです。…

#CLI #GPU必須 #Python

★ 11.3k ⑂ 1.1k MIT 2024-05-11

音声生成 / TTS

GitHub

voice-pro

Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…

#GPU必須 #Python #Web UI

★ 11.0k ⑂ 1.6k GPL-3.0 2025-12-05

3D / NeRF

GitHub

nerf

NeRF (Neural Radiance Fields)は、単一シーンの入力ビューを再現し、新しい視点からのレンダリングを可能にするニュ…

#3Dレンダリング #CLI #Colab対応

★ 10.9k ⑂ 1.4k MIT 2025-04-12

画像生成

GitHub

pix2pix

pix2pixは、条件付き敵対的ネットワーク（GAN）を利用して、入力画像を異なるスタイルの出力画像へ変換するTorchベー…

#CLI #GPU必須 #Torch

★ 10.6k ⑂ 1.7k NOASSERTION 2021-06-06

動画生成

GitHub

LTX-Video

LTX-Video（現在開発の中心はLTX-2）は、DiTベースの最先端オーディオ・ビデオ基盤モデルで、音声同期ビデオ生成、4K…

#ComfyUI対応 #GPU必須 #LoRA学習対応

★ 10.6k ⑂ 1.1k Apache-2.0 2026-01-05

画像生成

GitHub

krita-ai-diffusion

Krita用AI画像生成プラグイン「Generative AI for Krita」は、画像ペイント・編集ワークフローにAIを統合します。本…

#ComfyUI対応 #GPU必須 #Inpainting

★ 10.2k ⑂ 597 GPL-3.0 2026-06-17

マルチモーダル

GitHub

InternVL

InternVL Familyは、GPT-4o/GPT-5に匹敵する性能を目指すオープンソースの多モーダル会話モデル群です。特にInternVL…

#GPU必須 #Hugging Face対応 #Python

★ 10.1k ⑂ 788 MIT 2025-09-22

音楽生成

GitHub

Amphion

Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…

#CLI #GPU必須 #HuggingFace

★ 9.9k ⑂ 819 MIT 2026-03-25

ASR / 音声認識

GitHub

espnet

ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…

#Docker #GPU必須 #Python

★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24

3D / NeRF

GitHub

stable-dreamfusion

Stable-Dreamfusionは、テキストや画像から3Dモデルを生成するDreamfusionのPyTorch実装です。Stable Diffusionを2D…

#CLI #Colab #GPU必須

★ 8.8k ⑂ 770 Apache-2.0 2023-12-10

3D / NeRF

GitHub

awesome-3D-gaussian-splatting

「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting（3DGS）および関連技術に特化した厳選されたリソース…

#C++ #GPU必須 #Python

★ 8.7k ⑂ 538 MIT 2026-06-26

音声生成 / TTS

GitHub

EmotiVoice

EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ（TTS）エンジン…

#API #Docker対応 #GPU必須

★ 8.5k ⑂ 755 Apache-2.0 2024-08-13

画像生成

GitHub

imagen-pytorch

lucidrains/imagen-pytorchは、Googleが開発した最先端のText-to-Imageニューラルネットワーク「Imagen」のPyTorch実…

#CLI #GPU必須 #Python

★ 8.4k ⑂ 800 MIT 2024-10-07

動画生成

GitHub

Sana

SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…

#ComfyUI対応 #GPU必須 #Python

★ 8.4k ⑂ 671 Apache-2.0 2026-06-25

ASR / 音声認識

GitHub

ASRT_SpeechRecognition

ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…

#CLI #GPU必須 #Python

★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10

マルチモーダル

GitHub

minimind-v

MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…

#Apache 2.0 License #CLI #GPU必須

★ 8.2k ⑂ 897 Apache-2.0 2026-05-19

画像生成

GitHub

dream-textures

BlenderにStable Diffusionを統合するアドオン「Dream Textures」は、テキストプロンプトからテクスチャ、コンセプト…

#AI Upscaling #Blender Add-on #GPU必須

★ 8.2k ⑂ 437 GPL-3.0 2024-08-26