3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Hugging Face (80 repos)

「Hugging Face」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
Kiwi-Edit
Kiwi-Editは、自然言語の指示と参照画像を活用した多機能な動画編集を可能にする、完全にオープンソースのフレームワ…
★ 295 ⑂ 24 MIT 2026-05-13
動画生成
GitHub
HyDRA
HyDRAは、動的なビデオ世界モデルにおいて、視界外に移動した被写体の追跡と動きの連続性維持を可能にするハイブリッ…
★ 258 ⑂ 14 2026-04-29
動画生成
GitHub
OpenS2V-Nexus
OpenS2V-Nexusは、PKU-YuanGroupによるSubject-to-Video生成のための公式実装で、NeurIPS 2025 D&Bで発表されます。…
★ 223 ⑂ 9 Apache-2.0 2026-05-19
画像生成
GitHub
WaDi
WaDiは、CVPR 2026で発表された、ワンステップ画像生成のための公式PyTorch実装です。Weight Direction-aware Distil…
★ 164 ⑂ 23 2026-05-26
LLM
GitHub
Thinking-with-Visual-Primitives-pytorch
このツールは、DeepSeekの「Thinking with Visual Primitives」を非公式にPyTorchで再現したものです。マルチモーダ…
★ 140 ⑂ 18 MIT 2026-06-25
音声生成 / TTS
GitHub
VTS
VTS(Voice To Sound)は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…
★ 131 ⑂ 4 MIT 2026-06-18
AIエージェント
GitHub
AgentFigureGallery
AgentFigureGalleryは、Claude Code、Codex、Cursorなどのコーディングエージェント向けの科学プロットリファレンス…
★ 131 ⑂ 1 MIT 2026-05-29
動画生成
GitHub
EffectErase
「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…
★ 128 ⑂ 7 NOASSERTION 2026-04-10
マルチモーダル
GitHub
count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 127 ⑂ 6 Apache-2.0 2026-06-04
3D / NeRF
GitHub
NAS3R
NAS3Rは、新規ビュー合成を介して自己教師あり3D再構築を行うためのフィードフォワードフレームワークです。このツー…
★ 114 ⑂ 8 MIT 2026-05-12
LLM
GitHub
delegate52
DELEGATE-52は、大規模言語モデル(LLM)が様々な専門ドメインの文書編集タスクを長期にわたって委任された際の性能…
★ 114 ⑂ 11 MIT 2026-06-12
3D / NeRF
GitHub
ObjaversePlusPlus
Objaverse++は、低品質な3Dモデルが多数存在する既存のObjaverseデータセットの課題を解決するため、厳選されアノテ…
★ 110 ⑂ 2 NOASSERTION 2025-12-04
LLM
GitHub
PersonaVLM
PersonaVLMは、長期的なパーソナライゼーションを実現する革新的なマルチモーダルLLMエージェントフレームワークです…
★ 108 ⑂ 8 Apache-2.0 2026-04-16
3D / NeRF
GitHub
SpatialBench
SpatialBenchは、マルチモーダル大規模言語モデル(MLLM)のビデオ空間理解能力を評価するオープンソースベンチマー…
★ 106 2026-05-28
画像生成
GitHub
Unify-Agent
「Unify-Agent」は、Web検索等で外部の知識を能動的に参照し、事実に忠実な画像を生成する統一マルチモーダルAIエー…
★ 83 ⑂ 4 MIT 2026-05-02
画像生成
GitHub
ReactiveGWM
ReactiveGWMは、プレイヤー操作とNPCの自律性を分離することで、ゲーム内のNPCをより動的に制御する新しいゲーム世界…
★ 77 ⑂ 9 2026-06-16
画像生成
GitHub
Pulse-of-Motion
「Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics」は、動画のコンテナメタデータに依らず、…
★ 71 ⑂ 5 2026-03-26
音声生成 / TTS
GitHub
personaplex-mlx
PersonaPlex-MLXは、NVIDIAのフルデュプレックス音声対音声モデル「PersonaPlex」をApple Silicon向けにMLXで移植し…
★ 71 ⑂ 14 MIT 2026-02-18
3D / NeRF
GitHub
EcoSplat
EcoSplatは、効率制御可能なフィードフォワード3D Gaussian Splatting技術を実装したツールです。マルチビュー画像か…
★ 53 ⑂ 2 MIT 2026-06-11
画像生成
GitHub
RvR
RvR (Refinement via Regeneration) は、清華大学とTencent Hunyuanが開発した、画像リファインメントのための革新的…
★ 50 ⑂ 1 MIT 2026-05-26
画像生成
GitHub
gpic
GPIC(Giant Permissive Image Corpus)は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。約…
★ 46 ⑂ 1 MIT 2026-06-04
音声生成 / TTS
GitHub
Higgs_v3-TTS-ComfyUI
このツールは、ComfyUI用のノード集であり、bosonai/higgs-audio-v3-tts-4bモデルを活用して、多言語(100言語対応)…
★ 43 ⑂ 8 MIT 2026-06-20
LLM
GitHub
ThinkJEPA
ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…
★ 42 ⑂ 5 NOASSERTION 2026-04-30