#Hugging Face (80 repos)
「Hugging Face」タグが付いたリポジトリ
← 全リポジトリ
AIエージェント GitHub agents-course
Hugging Face Agents Courseは、AIエージェントの基礎から応用までを網羅した包括的な学習コースです。大規模言語モ…
★ 29.6k ⑂ 2.1k Apache-2.0 2026-06-05
マルチモーダル GitHub minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
3D / NeRF GitHub map-anything
MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…
★ 3.5k ⑂ 269 Apache-2.0 2026-06-03
動画生成 GitHub Causal-Forcing
「Causal Forcing」およびその改良版「Causal Forcing++」は、因果ODEや因果Consistency Distillationを活用し、高品…
★ 803 ⑂ 46 Apache-2.0 2026-06-17
LLM GitHub can-i-finetune-this
canifinetuneは、コンシューマー向けNVIDIA GPU(12-24GB)で大規模言語モデル(LLM)のファインチューニングを検討…
★ 649 ⑂ 92 MIT 2026-06-10
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 643 ⑂ 33 MIT 2026-06-15
画像生成 GitHub PixelSmile
PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…
★ 478 ⑂ 22 Apache-2.0 2026-04-22
マルチモーダル HF Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…
❤ 469 ↓ 557.7k apache-2.0 2026-06-11
3D / NeRF GitHub sam-body4d
SAM-Body4Dは、動画からトレーニング不要で一時的に一貫性のある堅牢な4D人体メッシュを復元するツールです。SAM-3、…
★ 351 ⑂ 33 MIT 2026-05-11
3D / NeRF GitHub OmniVGGT-official
OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…
★ 339 ⑂ 28 MIT 2026-05-21
動画生成 GitHub Kiwi-Edit
Kiwi-Editは、自然言語の指示と参照画像を活用した多機能な動画編集を可能にする、完全にオープンソースのフレームワ…
★ 295 ⑂ 24 MIT 2026-05-13
LLM GitHub nullsec-s1
Nullsec-S1は、AI生成アプリケーション、エージェント、MCPツール、Web3フロー、およびvibecodedソフトウェアのセキ…
★ 269 ⑂ 73 2026-06-04
動画生成 GitHub HyDRA
HyDRAは、動的なビデオ世界モデルにおいて、視界外に移動した被写体の追跡と動きの連続性維持を可能にするハイブリッ…
★ 258 ⑂ 14 2026-04-29
動画生成 GitHub OpenS2V-Nexus
OpenS2V-Nexusは、PKU-YuanGroupによるSubject-to-Video生成のための公式実装で、NeurIPS 2025 D&Bで発表されます。…
★ 223 ⑂ 9 Apache-2.0 2026-05-19
画像生成 GitHub WaDi
WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…
★ 164 ⑂ 23 2026-05-26
LLM GitHub Thinking-with-Visual-Primitives-pytorch
このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…
★ 140 ⑂ 18 MIT 2026-06-25
AIエージェント GitHub AgentFigureGallery
AgentFigureGalleryは、Claude Code、Codex、Cursorなどのコーディングエージェント向けの科学プロットリファレンス…
★ 131 ⑂ 1 MIT 2026-05-29
音声生成 / TTS GitHub VTS
VTS(Voice To Sound)は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…
★ 131 ⑂ 4 MIT 2026-06-18
動画生成 GitHub EffectErase
「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…
★ 128 ⑂ 7 NOASSERTION 2026-04-10
マルチモーダル GitHub count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 127 ⑂ 6 Apache-2.0 2026-06-04
LLM GitHub delegate52
DELEGATE-52は、大規模言語モデル(LLM)が様々な専門ドメインの文書編集タスクを長期にわたって委任された際の性能…
★ 114 ⑂ 11 MIT 2026-06-12
3D / NeRF GitHub NAS3R
NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…
★ 114 ⑂ 8 MIT 2026-05-12
LLM GitHub PersonaVLM
PersonaVLMは、長期的なパーソナライゼーションを実現する革新的なマルチモーダルLLMエージェントフレームワークです…
★ 108 ⑂ 8 Apache-2.0 2026-04-16
3D / NeRF GitHub SpatialBench
SpatialBenchは、マルチモーダル大規模言語モデル(MLLM)のビデオ空間理解能力を評価するオープンソースベンチマー…
★ 106 2026-05-28