3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#PyTorch (148 repos)

「PyTorch」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

transformers

Transformersは、Hugging Faceが提供する機械学習モデル定義フレームワークで、テキスト・画像・音声・動画・マルチ…

#CLI #Python #PyTorch

★ 162.0k ⑂ 33.6k Apache-2.0 2026-06-27

LLM

GitHub

LLMs-from-scratch

このリポジトリは、書籍「Build a Large Language Model (From Scratch)」の公式コードベースです。GPTに似た大規模…

#CLI #GPU推奨 #Python

★ 98.0k ⑂ 15.0k NOASSERTION 2026-06-02

画像生成

GitHub

diffusers

🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…

#3Dモデル生成 #GPU必須 #Python

★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27

動画生成

GitHub

LivePortrait

LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…

#ComfyUI連携 #GPU必須 #Python

★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01

マルチモーダル

GitHub

ms-swift

ms-swiftは、ModelScopeコミュニティが提供する、大規模言語モデル（LLM）およびマルチモーダル大規模言語モデル（ML…

#CLI #GPU対応 #LLM

★ 14.6k ⑂ 1.5k Apache-2.0 2026-06-24

ASR / 音声認識

GitHub

speechbrain

SpeechBrainは、PyTorchを基盤としたオープンソースのツールキットで、会話型AI（音声アシスタント、チャットボット…

#CLI #HuggingFace連携 #Python

★ 11.6k ⑂ 1.7k Apache-2.0 2026-06-15

ASR / 音声認識

GitHub

espnet

ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…

#Docker #GPU必須 #Python

★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24

ASR / 音声認識

GitHub

silero-models

Silero Modelsは、事前学習済みのテキスト読み上げ（TTS）モデルを開発者向けに提供するライブラリです。このツール…

#CPU対応 #GPU対応 #Python

★ 6.0k ⑂ 366 NOASSERTION 2026-06-04

3D / NeRF

GitHub

kaolin

NVIDIA Kaolinは、3D深層学習研究を加速するために設計されたPyTorchライブラリです。GPUに最適化された操作群を提供…

#3D深層学習 #GPU必須 #Jupyter Notebook

★ 5.1k ⑂ 624 Apache-2.0 2026-06-18

LLM

GitHub

hands-on-modern-rl

このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…

#LLM #Python #PyTorch

★ 3.1k ⑂ 216 NOASSERTION 2026-06-27

動画生成

GitHub

HunyuanVideo-I2V

HunyuanVideo-I2Vは、HunyuanVideoを基盤としたカスタマイズ可能な画像から動画への生成モデルです。静止画像を入力…

#GPU必須 #HuggingFace #I2V

★ 1.8k ⑂ 190 NOASSERTION 2026-04-07

動画生成

GitHub

SparkVSR

SparkVSRは、インタラクティブな動画超解像（VSR）フレームワークです。ユーザーが任意の画像超解像（ISR）モデルで…

#CLI #ComfyUI対応 #GPU必須

★ 678 ⑂ 73 Apache-2.0 2026-06-23

3D / NeRF

GitHub

Scal3R

Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…

#3D再構築 #CLI #GPU必須

★ 494 ⑂ 37 NOASSERTION 2026-05-11

3D / NeRF

GitHub

OmniVGGT-official

OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…

#3D幾何学 #CLI #GPU必須

★ 339 ⑂ 28 MIT 2026-05-21

3D / NeRF

GitHub

video_to_world

本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…

#3D再構築 #CLI #conda

★ 258 ⑂ 23 MIT 2026-04-27

LLM

GitHub

steerling

Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。…

#CLI #GPU必須 #HuggingFace

★ 229 ⑂ 14 Apache-2.0 2026-06-24

3D / NeRF

GitHub

scenetok

SceneTokは、3Dシーンデータを圧縮された、非構造化かつ拡散可能な1Dトークン表現へと変換するシーンオートエンコー…

#3Dシーン処理 #GPU必須 #Python

★ 203 ⑂ 9 MIT 2026-06-15

3D / NeRF

GitHub

faster-gaussian-splatting

このツールは「Faster Gaussian Splatting (Faster-GS)」という3D Gaussian Splatting (3DGS) の最適化を効率的に行…

#CLI #CUDA #GPU必須

★ 183 ⑂ 27 Apache-2.0 2026-05-28

ComfyUI

GitHub

Pixal3D-ComfyUI

Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…

#ComfyUI対応 #GLBエクスポート #GPU必須

★ 166 ⑂ 17 MIT 2026-06-12

画像生成

GitHub

WaDi

WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…

#GPU必須 #Hugging Face #Python

★ 164 ⑂ 23 2026-05-26

LLM

GitHub

Thinking-with-Visual-Primitives-pytorch

このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…

#GPU必須 #Hugging Face #LLM

★ 140 ⑂ 18 MIT 2026-06-25

3D / NeRF

GitHub

NAS3R

NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…

#CLI #GPU必須 #Hugging Face

★ 114 ⑂ 8 MIT 2026-05-12

ComfyUI

GitHub

UniVidX_ComfyUI

このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…

#AIモデル #ComfyUI対応 #GPU必須

★ 76 ⑂ 2 GPL-3.0 2026-05-11

音声生成 / TTS

GitHub

Talker-T2AV

Talker-T2AVは、自己回帰拡散モデリングを使い、テキスト、音声、動画を連携させて生成するAIツールです。Qwen3-0.6B…

#CLI #GPU必須 #HuggingFace

★ 75 ⑂ 3 Apache-2.0 2026-05-24