3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
DeepLearningExamples
NVIDIA Deep Learning Examplesは、NVIDIA Volta、Turing、Ampere GPU上でNVIDIA CUDA-Xソフトウェアスタックを用い…
★ 14.8k ⑂ 3.4k 2024-08-12
画像生成
GitHub
Hunyuan3D-2
Tencent-Hunyuan/Hunyuan3D-2は、大規模Hunyuan3D拡散モデルを活用した高解像度3Dアセット生成システムです。Hunyuan…
★ 14.1k ⑂ 1.4k NOASSERTION 2025-10-28
画像生成
GitHub
CycleGAN
CycleGANは、ペアになっていない画像データセット間で画像変換を行うためのソフトウェアです。具体的には、絵画を写…
★ 12.9k ⑂ 2.0k NOASSERTION 2023-09-12
動画生成
GitHub
CogVideo
「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。CogVideoXシリーズは、テキストから…
★ 12.8k ⑂ 1.3k Apache-2.0 2025-11-04
画像生成
GitHub
Awesome-Diffusion-Models
「Awesome-Diffusion-Models」は、拡散モデルに関する最新の研究論文や多様なリソースを網羅的に収集したGitHubリポ…
★ 12.4k ⑂ 1.0k MIT 2024-08-01
画像生成
GitHub
HunyuanVideo
HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…
★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29
3D / NeRF
GitHub
nerfstudio
nerfstudioは、NeRF(Neural Radiance Fields)の作成、学習、テストを簡素化するAPIを提供する、コラボレーションし…
★ 11.7k ⑂ 1.6k Apache-2.0 2025-07-29
画像生成
GitHub
DALLE2-pytorch
このツールは、OpenAIのテキストから画像への合成ニューラルネットワーク「DALL-E 2」をPyTorchで再現したものです。…
★ 11.3k ⑂ 1.1k MIT 2024-05-11
音声生成 / TTS
GitHub
voice-pro
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…
★ 11.0k ⑂ 1.6k GPL-3.0 2025-12-05
3D / NeRF
GitHub
nerf
NeRF (Neural Radiance Fields)は、単一シーンの入力ビューを再現し、新しい視点からのレンダリングを可能にするニュ…
★ 10.9k ⑂ 1.4k MIT 2025-04-12
画像生成
GitHub
pix2pix
pix2pixは、条件付き敵対的ネットワーク(GAN)を利用して、入力画像を異なるスタイルの出力画像へ変換するTorchベー…
★ 10.6k ⑂ 1.7k NOASSERTION 2021-06-06
動画生成
GitHub
LTX-Video
LTX-Video(現在開発の中心はLTX-2)は、DiTベースの最先端オーディオ・ビデオ基盤モデルで、音声同期ビデオ生成、4K…
★ 10.6k ⑂ 1.1k Apache-2.0 2026-01-05
画像生成
GitHub
krita-ai-diffusion
Krita用AI画像生成プラグイン「Generative AI for Krita」は、画像ペイント・編集ワークフローにAIを統合します。本…
★ 10.2k ⑂ 597 GPL-3.0 2026-06-17
マルチモーダル
GitHub
InternVL
InternVL Familyは、GPT-4o/GPT-5に匹敵する性能を目指すオープンソースの多モーダル会話モデル群です。特にInternVL…
★ 10.1k ⑂ 788 MIT 2025-09-22
音楽生成
GitHub
Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.9k ⑂ 819 MIT 2026-03-25
ASR / 音声認識
GitHub
espnet
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…
★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24
3D / NeRF
GitHub
stable-dreamfusion
Stable-Dreamfusionは、テキストや画像から3Dモデルを生成するDreamfusionのPyTorch実装です。Stable Diffusionを2D…
★ 8.8k ⑂ 770 Apache-2.0 2023-12-10
3D / NeRF
GitHub
awesome-3D-gaussian-splatting
「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting(3DGS)および関連技術に特化した厳選されたリソース…
★ 8.7k ⑂ 538 MIT 2026-06-26
音声生成 / TTS
GitHub
EmotiVoice
EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ(TTS)エンジン…
★ 8.5k ⑂ 755 Apache-2.0 2024-08-13
画像生成
GitHub
imagen-pytorch
lucidrains/imagen-pytorchは、Googleが開発した最先端のText-to-Imageニューラルネットワーク「Imagen」のPyTorch実…
★ 8.4k ⑂ 800 MIT 2024-10-07
動画生成
GitHub
Sana
SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…
★ 8.4k ⑂ 671 Apache-2.0 2026-06-25
ASR / 音声認識
GitHub
ASRT_SpeechRecognition
ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。深度畳み込みニューラルネット…
★ 8.4k ⑂ 1.9k GPL-3.0 2026-04-10
マルチモーダル
GitHub
minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
画像生成
GitHub
dream-textures
BlenderにStable Diffusionを統合するアドオン「Dream Textures」は、テキストプロンプトからテクスチャ、コンセプト…
★ 8.2k ⑂ 437 GPL-3.0 2024-08-26