3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Hugging Face (80 repos)

「Hugging Face」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
NeRAF
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…
★ 36 ⑂ 2 NOASSERTION 2026-03-11
LLM
GitHub
TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
動画生成
GitHub
Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
音声生成 / TTS
GitHub
wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
ComfyUI
GitHub
ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
マルチモーダル
GitHub
SR-3D
SR-3Dは、ICLR'26で発表された「3D Aware Region Prompted Vision Language Model」の実装です。単一視点と多視点入…
★ 27 Apache-2.0 2026-02-19
マルチモーダル
GitHub
EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
マルチモーダル
GitHub
ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 22 NOASSERTION 2026-05-25
マルチモーダル
GitHub
sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 ⑂ 1 2026-03-21
マルチモーダル
GitHub
GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 15 ⑂ 6 MIT 2026-05-05
LLM
GitHub
awesome-vintage-llms
「ヴィンテージLLM」とは、特定の歴史的期間のテキストのみで訓練された大規模言語モデルのキュレーションリストです…
★ 12 2026-05-09
3D / NeRF
GitHub
claravid_code
ClaraVidは、低高度UAV/航空画像からのセマンティックおよび幾何学的ニューラル再構築のための合成データセットです…
★ 11 MIT 2025-10-31
LLM
GitHub
tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
マルチモーダル
GitHub
cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
LLM
GitHub
rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
3D / NeRF
GitHub
SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
画像生成
GitHub
FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
画像生成
GitHub
NovaVision
NovaVisionは、感情を条件としたテキストから画像を生成するツールです。入力テキストの感情を検出し、その感情が生…
★ 4 MIT 2026-06-19
音声生成 / TTS
GitHub
lingo-agent
LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…
★ 2 2026-06-18
画像生成
GitHub
sage-color
SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…
★ 2 NOASSERTION 2026-05-28
LLM
GitHub
transformer-roofline-analyzer
Transformer Roofline Analyzerは、Hugging FaceのTransformerモデル設定ファイルから、計算量(FLOPs)、メモリ帯域…
★ 1 MIT 2026-05-30
音声生成 / TTS
GitHub
SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18
LLM
GitHub
AI-Arena-History
「Arena AI Model Elo History」は、主要AIラボ(OpenAI、Anthropic、Googleなど)のフラッグシップAIモデルの公開El…
★ 1 MIT 2026-06-22