3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
HiggsAudiov2TokenizerUnofficial
本ツールは、HuBERTのセマンティック特徴量を用いたHiggs Audio V2 Tokenizerの非公式PyTorch実装です。960倍ダウン…
★ 6 ⑂ 2 2025-10-08
画像生成
GitHub
nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
マルチモーダル
GitHub
wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
画像生成
GitHub
Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
LLM
GitHub
Local-Brain-Retrieval-Augmented-Generation
Local Brain RAGは、プライバシーを最優先し、完全にオフラインで動作する超最適化された知識ベースです。複雑なコー…
★ 4 ⑂ 1 2026-06-22
画像生成
GitHub
rahulk-ddpm
rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。UNetと正…
★ 4 MIT 2026-06-23
3D / NeRF
GitHub
rgb-lidar-imu-3d-reconstruction
このプロジェクトは、CARLAシミュレーションデータを使用して、同期されたマルチカメラRGB、LiDAR、IMUセンサーフュ…
★ 4 2026-06-12
マルチモーダル
GitHub
open_qwen
オープンQwenは、Qwen 3.5モデルを基にした、PyTorchを利用した非公式のAIテキスト生成アプリケーションです。プログ…
★ 4 Apache-2.0 2026-06-24
画像生成
GitHub
NovaVision
NovaVisionは、感情を条件としたテキストから画像を生成するツールです。入力テキストの感情を検出し、その感情が生…
★ 4 MIT 2026-06-19
画像生成
GitHub
CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 3 Unlicense 2026-06-23
3D / NeRF
GitHub
TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
画像生成
GitHub
SCFlow
SCFlow(Self-Corrected Flow Distillation)は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…
★ 3 ⑂ 2 GPL-3.0 2026-05-23
画像生成
GitHub
Preserve-and-Personalize
本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…
★ 3 ⑂ 1 MIT 2026-05-22
画像生成
GitHub
Diffusion-Zero-to-Hero
本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…
★ 3 Apache-2.0 2026-05-21
画像生成
GitHub
bucketsampler
このツールは、拡散モデルのトレーニング(SDXLのようなマルチARバッチ)において、アスペクト比の異なる画像を効率…
★ 2 MIT 2026-05-15
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
画像生成
GitHub
sdx
SDXは、テキストから画像を生成するモジュール式のオープンソース拡散フレームワークです。DiTトレーニング、精密な…
★ 2 NOASSERTION 2026-06-24
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
LLM
GitHub
OpenArch
このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…
★ 2 ⑂ 1 MIT 2026-06-19
画像生成
GitHub
adafactor-8bit
このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…
★ 2 MIT 2026-06-24
3D / NeRF
GitHub
diff-nexel-rasterization
このリポジトリは、リアルタイムでの新規視点合成を可能にするニューラルテクスチャ付きサーフェル「Nexels」のため…
★ 2 NOASSERTION 2025-12-18
3D / NeRF
GitHub
diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26