3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Hugging Face (80 repos)

「Hugging Face」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
Unify-Agent
「Unify-Agent」は、Web検索等で外部の知識を能動的に参照し、事実に忠実な画像を生成する統一マルチモーダルAIエー…
★ 83 ⑂ 4 MIT 2026-05-02
画像生成
GitHub
ReactiveGWM
ReactiveGWMは、プレイヤー操作とNPCの自律性を分離することで、ゲーム内のNPCをより動的に制御する新しいゲーム世界…
★ 77 ⑂ 9 2026-06-16
3D / NeRF
GitHub
EcoSplat
EcoSplatは、効率制御可能なフィードフォワード3D Gaussian Splatting技術を実装したツールです。マルチビュー画像か…
★ 53 ⑂ 2 MIT 2026-06-11
画像生成
GitHub
RvR
RvR (Refinement via Regeneration) は、清華大学とTencent Hunyuanが開発した、画像リファインメントのための革新的…
★ 50 ⑂ 1 MIT 2026-05-26
画像生成
GitHub
gpic
GPIC(Giant Permissive Image Corpus)は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。約…
★ 46 ⑂ 1 MIT 2026-06-04
音声生成 / TTS
GitHub
Higgs_v3-TTS-ComfyUI
このツールは、ComfyUI用のノード集であり、bosonai/higgs-audio-v3-tts-4bモデルを活用して、多言語(100言語対応)…
★ 43 ⑂ 8 MIT 2026-06-20
LLM
GitHub
ThinkJEPA
ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…
★ 42 ⑂ 5 NOASSERTION 2026-04-30
動画生成
GitHub
PhyMotion
PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…
★ 39 ⑂ 5 MIT 2026-05-15
画像生成
GitHub
AHD
このリポジトリは、拡散大規模言語モデル(dLLM)向けのトレーニング不要でプラグアンドプレイな動的デコーディング…
★ 38 2026-04-13
マルチモーダル
GitHub
OmniAgent
OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。従来のモデルとは…
★ 36 ⑂ 3 Apache-2.0 2026-06-24
動画生成
GitHub
Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
LLM
GitHub
TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
音声生成 / TTS
GitHub
wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
ComfyUI
GitHub
ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
マルチモーダル
GitHub
EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
マルチモーダル
GitHub
ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 22 NOASSERTION 2026-05-25
マルチモーダル
GitHub
GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 15 ⑂ 6 MIT 2026-05-05
LLM
GitHub
awesome-vintage-llms
「ヴィンテージLLM」とは、特定の歴史的期間のテキストのみで訓練された大規模言語モデルのキュレーションリストです…
★ 12 2026-05-09
LLM
GitHub
rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
LLM
GitHub
tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
マルチモーダル
GitHub
cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
3D / NeRF
GitHub
SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
画像生成
GitHub
FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01