3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

HiggsAudiov2TokenizerUnofficial

本ツールは、HuBERTのセマンティック特徴量を用いたHiggs Audio V2 Tokenizerの非公式PyTorch実装です。960倍ダウン…

#CLI #GPU必須 #Python

★ 6 ⑂ 2 2025-10-08

画像生成

GitHub

nanoDLM

「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル（MDM）の実装です。約110…

#CLI #GPU推奨 #Python

★ 6 ⑂ 1 2026-05-16

マルチモーダル

GitHub

wgram-lm

W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…

#AGPLライセンス #CLI #Hugging Face Transformers

★ 6 AGPL-3.0 2026-06-21

画像生成

GitHub

Multi-Modal-105

このプロジェクトは、テキストから画像（T2I）およびテキストから動画（T2V）を生成する、プロダクションレベルかつ…

#CLI #GPU必須 #Python

★ 5 MIT 2026-06-06

LLM

GitHub

Local-Brain-Retrieval-Augmented-Generation

Local Brain RAGは、プライバシーを最優先し、完全にオフラインで動作する超最適化された知識ベースです。複雑なコー…

#GPU必須 #Python #PyTorch

★ 4 ⑂ 1 2026-06-22

画像生成

GitHub

rahulk-ddpm

rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。UNetと正…

#DDPM #GPU必須 #Python

★ 4 MIT 2026-06-23

3D / NeRF

GitHub

rgb-lidar-imu-3d-reconstruction

このプロジェクトは、CARLAシミュレーションデータを使用して、同期されたマルチカメラRGB、LiDAR、IMUセンサーフュ…

#3D再構築 #CARLA #IMU

★ 4 2026-06-12

マルチモーダル

GitHub

open_qwen

オープンQwenは、Qwen 3.5モデルを基にした、PyTorchを利用した非公式のAIテキスト生成アプリケーションです。プログ…

#AI/LLM #GUI #PyTorch

★ 4 Apache-2.0 2026-06-24

画像生成

GitHub

NovaVision

NovaVisionは、感情を条件としたテキストから画像を生成するツールです。入力テキストの感情を検出し、その感情が生…

#Docker #GPU必須 #Hugging Face

★ 4 MIT 2026-06-19

画像生成

GitHub

CTGMWorkshop

このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…

#CLI #GPU必須 #Jupyter Notebook

★ 3 Unlicense 2026-06-23

3D / NeRF

GitHub

TGS-SLAM

TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…

#3D Gaussian Splatting #CLI #GPU必須

★ 3 2026-05-28

画像生成

GitHub

SCFlow

SCFlow（Self-Corrected Flow Distillation）は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…

#CLI #GPU必須 #Python

★ 3 ⑂ 2 GPL-3.0 2026-05-23

画像生成

GitHub

Preserve-and-Personalize

本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…

#CLI #GPU必須 #Hugging Face Diffusers

★ 3 ⑂ 1 MIT 2026-05-22

画像生成

GitHub

Diffusion-Zero-to-Hero

本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…

#GPU必須 #Hugging Face Diffusers #Jupyter

★ 3 Apache-2.0 2026-05-21

画像生成

GitHub

bucketsampler

このツールは、拡散モデルのトレーニング（SDXLのようなマルチARバッチ）において、アスペクト比の異なる画像を効率…

#CLI #HuggingFace #Python

★ 2 MIT 2026-05-15

その他

GitHub

Neural-Zero-Shot-Voice-Cloning

本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…

#Docker #GPU必須 #Python

★ 2 MIT 2026-06-11

画像生成

GitHub

sdx

SDXは、テキストから画像を生成するモジュール式のオープンソース拡散フレームワークです。DiTトレーニング、精密な…

#CLI #Python #PyTorch

★ 2 NOASSERTION 2026-06-24

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

LLM

GitHub

OpenArch

このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…

#LLM #Python #PyTorch

★ 2 ⑂ 1 MIT 2026-06-19

画像生成

GitHub

adafactor-8bit

このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…

#CLI #GPU必須 #JITコンパイル

★ 2 MIT 2026-06-24

3D / NeRF

GitHub

diff-nexel-rasterization

このリポジトリは、リアルタイムでの新規視点合成を可能にするニューラルテクスチャ付きサーフェル「Nexels」のため…

#3Dレンダリング #CLI #GPU必須

★ 2 NOASSERTION 2025-12-18

3D / NeRF

GitHub

diff-4d-gaussian-rasterization

このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…

#CLI #CUDA #GPU必須

★ 2 NOASSERTION 2026-05-13

マルチモーダル

GitHub

multimodal-music-genre-classifier

このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…

#CLI #GPU必須 #Jupyter Notebook

★ 2 MIT 2026-05-13

ASR / 音声認識

GitHub

speech-emotion-recognition-transfer-learning

このプロジェクトは、音声感情認識（SER）におけるテキストのみ（RoBERTa）、音声のみ（wav2vec2/WavLM/HuBERT）、お…

#Gradio #HuggingFace #Python

★ 2 MIT 2026-06-26