LLM GitHub transformers
Transformersは、Hugging Faceが提供する機械学習モデル定義フレームワークで、テキスト・画像・音声・動画・マルチ…
★ 162.0k ⑂ 33.6k Apache-2.0 2026-06-27
LLM GitHub LLMs-from-scratch
このリポジトリは、書籍「Build a Large Language Model (From Scratch)」の公式コードベースです。GPTに似た大規模…
★ 98.0k ⑂ 15.0k NOASSERTION 2026-06-02
画像生成 GitHub diffusers
🤗 Diffusersは、画像、音声、分子の3D構造生成のための最先端の拡散モデルを提供するPythonライブラリです。シンプ…
★ 33.9k ⑂ 7.1k Apache-2.0 2026-06-27
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01
マルチモーダル GitHub ms-swift
ms-swiftは、ModelScopeコミュニティが提供する、大規模言語モデル(LLM)およびマルチモーダル大規模言語モデル(ML…
★ 14.6k ⑂ 1.5k Apache-2.0 2026-06-24
ASR / 音声認識 GitHub speechbrain
SpeechBrainは、PyTorchを基盤としたオープンソースのツールキットで、会話型AI(音声アシスタント、チャットボット…
★ 11.6k ⑂ 1.7k Apache-2.0 2026-06-15
ASR / 音声認識 GitHub espnet
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…
★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24
ASR / 音声認識 GitHub silero-models
Silero Modelsは、事前学習済みのテキスト読み上げ(TTS)モデルを開発者向けに提供するライブラリです。このツール…
★ 6.0k ⑂ 366 NOASSERTION 2026-06-04
3D / NeRF GitHub kaolin
NVIDIA Kaolinは、3D深層学習研究を加速するために設計されたPyTorchライブラリです。GPUに最適化された操作群を提供…
★ 5.1k ⑂ 624 Apache-2.0 2026-06-18
LLM GitHub hands-on-modern-rl
このプロジェクトは、現代の強化学習を実践的に学ぶためのオープンソースカリキュラム「Hands-On Modern RL」です。…
★ 3.1k ⑂ 216 NOASSERTION 2026-06-27
動画生成 GitHub HunyuanVideo-I2V
HunyuanVideo-I2Vは、HunyuanVideoを基盤としたカスタマイズ可能な画像から動画への生成モデルです。静止画像を入力…
★ 1.8k ⑂ 190 NOASSERTION 2026-04-07
動画生成 GitHub SparkVSR
SparkVSRは、インタラクティブな動画超解像(VSR)フレームワークです。ユーザーが任意の画像超解像(ISR)モデルで…
★ 678 ⑂ 73 Apache-2.0 2026-06-23
3D / NeRF GitHub Scal3R
Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…
★ 494 ⑂ 37 NOASSERTION 2026-05-11
3D / NeRF GitHub OmniVGGT-official
OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…
★ 339 ⑂ 28 MIT 2026-05-21
3D / NeRF GitHub video_to_world
本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…
★ 258 ⑂ 23 MIT 2026-04-27
LLM GitHub steerling
Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。…
★ 229 ⑂ 14 Apache-2.0 2026-06-24
3D / NeRF GitHub scenetok
SceneTokは、3Dシーンデータを圧縮された、非構造化かつ拡散可能な1Dトークン表現へと変換するシーンオートエンコー…
★ 203 ⑂ 9 MIT 2026-06-15
3D / NeRF GitHub faster-gaussian-splatting
このツールは「Faster Gaussian Splatting (Faster-GS)」という3D Gaussian Splatting (3DGS) の最適化を効率的に行…
★ 183 ⑂ 27 Apache-2.0 2026-05-28
ComfyUI GitHub Pixal3D-ComfyUI
Pixal3D-ComfyUIは、単一の画像から高品質な3Dモデルを生成するためのComfyUI用カスタムノードです。TencentARCのPix…
★ 166 ⑂ 17 MIT 2026-06-12
画像生成 GitHub WaDi
WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…
★ 164 ⑂ 23 2026-05-26
LLM GitHub Thinking-with-Visual-Primitives-pytorch
このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…
★ 140 ⑂ 18 MIT 2026-06-25
3D / NeRF GitHub NAS3R
NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…
★ 114 ⑂ 8 MIT 2026-05-12
ComfyUI GitHub UniVidX_ComfyUI
このツールは、ComfyUI向けのカスタムノード「UniVidX Intrinsic & Alpha Decomposition」を提供します。SIGGRAPH 20…
★ 76 ⑂ 2 GPL-3.0 2026-05-11
音声生成 / TTS GitHub Talker-T2AV
Talker-T2AVは、自己回帰拡散モデリングを使い、テキスト、音声、動画を連携させて生成するAIツールです。Qwen3-0.6B…
★ 75 ⑂ 3 Apache-2.0 2026-05-24