3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
rgb-lidar-imu-3d-reconstruction
このプロジェクトは、CARLAシミュレーションデータを使用して、同期されたマルチカメラRGB、LiDAR、IMUセンサーフュ…
★ 4 2026-06-12
画像生成
GitHub
CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 3 Unlicense 2026-06-23
画像生成
GitHub
SCFlow
SCFlow(Self-Corrected Flow Distillation)は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…
★ 3 ⑂ 2 GPL-3.0 2026-05-23
3D / NeRF
GitHub
TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
画像生成
GitHub
Preserve-and-Personalize
本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…
★ 3 ⑂ 1 MIT 2026-05-22
画像生成
GitHub
Diffusion-Zero-to-Hero
本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…
★ 3 Apache-2.0 2026-05-21
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
画像生成
GitHub
Heat-Diffusion
このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…
★ 2 MIT 2026-05-24
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
LLM
GitHub
OpenArch
このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…
★ 2 ⑂ 1 MIT 2026-06-19
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
3D / NeRF
GitHub
diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13
画像生成
GitHub
bucketsampler
このツールは、拡散モデルのトレーニング(SDXLのようなマルチARバッチ)において、アスペクト比の異なる画像を効率…
★ 2 MIT 2026-05-15
画像生成
GitHub
sdx
SDXは、テキストから画像を生成するモジュール式のオープンソース拡散フレームワークです。DiTトレーニング、精密な…
★ 2 NOASSERTION 2026-06-24
画像生成
GitHub
adafactor-8bit
このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…
★ 2 MIT 2026-06-24
LLM
GitHub
drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
3D / NeRF
GitHub
hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
LLM
GitHub
megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 1 MIT 2026-04-17
マルチモーダル
GitHub
radscore
radscoreは、AI生成の放射線レポートを評価するための軽量なPythonツールキットです。BLEU、ROUGE、BERTScoreといっ…
★ 1 NOASSERTION 2026-06-16
マルチモーダル
GitHub
ai-learning-guides
このプロジェクトは、「AI Learning Guides」と題され、PyTorch、LLM、画像生成、強化学習、ロボティクス、マルチモ…
★ 1 MIT 2026-06-16
マルチモーダル
GitHub
tinyvlm-implementation
このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…
★ 1 2026-05-10
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24