3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Hugging Face (80 repos)
「Hugging Face」タグが付いたリポジトリ
← 全リポジトリ
3D / NeRF GitHub NeRAF
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…
★ 36 ⑂ 2 NOASSERTION 2026-03-11
LLM GitHub TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
動画生成 GitHub Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
ComfyUI GitHub ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
マルチモーダル GitHub SR-3D
SR-3Dは、ICLR'26で発表された「3D Aware Region Prompted Vision Language Model」の実装です。単一視点と多視点入…
★ 27 Apache-2.0 2026-02-19
マルチモーダル GitHub EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
マルチモーダル GitHub ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 22 NOASSERTION 2026-05-25
マルチモーダル GitHub sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 ⑂ 1 2026-03-21
マルチモーダル GitHub GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 15 ⑂ 6 MIT 2026-05-05
LLM GitHub awesome-vintage-llms
「ヴィンテージLLM」とは、特定の歴史的期間のテキストのみで訓練された大規模言語モデルのキュレーションリストです…
★ 12 2026-05-09
3D / NeRF GitHub claravid_code
ClaraVidは、低高度UAV/航空画像からのセマンティックおよび幾何学的ニューラル再構築のための合成データセットです…
★ 11 MIT 2025-10-31
LLM GitHub tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
マルチモーダル GitHub cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
マルチモーダル GitHub MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
LLM GitHub rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
3D / NeRF GitHub SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
画像生成 GitHub NovaVision
NovaVisionは、感情を条件としたテキストから画像を生成するツールです。入力テキストの感情を検出し、その感情が生…
★ 4 MIT 2026-06-19
音声生成 / TTS GitHub lingo-agent
LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…
★ 2 2026-06-18
画像生成 GitHub sage-color
SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…
★ 2 NOASSERTION 2026-05-28
LLM GitHub transformer-roofline-analyzer
Transformer Roofline Analyzerは、Hugging FaceのTransformerモデル設定ファイルから、計算量(FLOPs)、メモリ帯域…
★ 1 MIT 2026-05-30
音声生成 / TTS GitHub SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18
LLM GitHub AI-Arena-History
「Arena AI Model Elo History」は、主要AIラボ(OpenAI、Anthropic、Googleなど)のフラッグシップAIモデルの公開El…
★ 1 MIT 2026-06-22