3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#HuggingFace (31 repos)

「HuggingFace」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
lingbot-world
LingBot-Worldは、ビデオ生成技術を基盤としたオープンソースの世界シミュレーター(ワールドモデル)です。リアルタ…
★ 4.0k ⑂ 363 Apache-2.0 2026-05-22
画像生成
GitHub
Helios
Heliosは、リアルタイムでの長尺ビデオ生成を可能にする革新的なモデルです。従来のアンチドリフト戦略やアクセラレ…
★ 1.9k ⑂ 152 Apache-2.0 2026-06-10
動画生成
GitHub
HunyuanVideo-I2V
HunyuanVideo-I2Vは、HunyuanVideoを基盤としたカスタマイズ可能な画像から動画への生成モデルです。静止画像を入力…
★ 1.8k ⑂ 190 NOASSERTION 2026-04-07
動画生成
GitHub
Bernini
Berniniは、MLLMベースのセマンティックプランナーとDiTベースのレンダラーを組み合わせた、ビデオ生成および編集の…
★ 954 ⑂ 74 Apache-2.0 2026-06-22
動画生成
GitHub
AlayaRenderer
このリポジトリは、ゲームや仮想世界向けのAIネイティブなレンダラー「Generative World Renderer」を提供します。微…
★ 683 ⑂ 12 Apache-2.0 2026-05-05
LLM
GitHub
steerling
Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。…
★ 229 ⑂ 14 Apache-2.0 2026-06-24
3D / NeRF
GitHub
MotionCrafter
MotionCrafterは、単一のモノクロビデオ入力から密な4Dジオメトリとオブジェクトの動きを同時に再構築する、革新的な…
★ 169 ⑂ 10 NOASSERTION 2026-06-11
音声生成 / TTS
GitHub
eva
EVAは、会話型音声エージェントの性能をエンドツーエンドで評価するためのオープンソースフレームワークです。エージ…
★ 167 ⑂ 24 MIT 2026-06-26
画像生成
GitHub
CDM
本ツールは、「Continuous-Time Distribution Matching (CDM)」技術を用いた、少ステップ拡散蒸留のためのフレームワ…
★ 145 ⑂ 6 MIT 2026-05-11
音声生成 / TTS
GitHub
controlfoley
ControlFoleyは、ビデオ、テキスト、参照オーディオを組み合わせることで、高精度かつ制御可能なビデオ-オーディオ生…
★ 138 ⑂ 3 Apache-2.0 2026-06-11
LLM
GitHub
SR-Agents
SR-Agentsは、大規模言語モデル(LLM)エージェントにおけるスキル検索拡張(SRA)の研究と評価を目的としたコミュニ…
★ 86 ⑂ 11 MIT 2026-05-21
画像生成
GitHub
LongLive-RAG
LongLive-RAGは、長尺動画生成における品質と一貫性の課題を解決するための汎用的なRetrieval-Augmented Frameworkで…
★ 76 Apache-2.0 2026-06-04
音声生成 / TTS
GitHub
Talker-T2AV
Talker-T2AVは、自己回帰拡散モデリングを使い、テキスト、音声、動画を連携させて生成するAIツールです。Qwen3-0.6B…
★ 75 ⑂ 3 Apache-2.0 2026-05-24
マルチモーダル
GitHub
HY-Embodied-0.5-X
HY-Embodied-0.5-Xは、Tencent Robotics XとHY Vision Teamが共同開発した、リアルワールドエージェント向けの拡張さ…
★ 64 ⑂ 4 NOASSERTION 2026-05-14
動画生成
GitHub
EgoSim
EgoSimは、初期の3D状態とアクションシーケンスに基づき、実体化されたインタラクションを生成する自己中心的な世界…
★ 49 ⑂ 2 2026-06-05
マルチモーダル
GitHub
UniM
UniMは、マルチモーダルな理解と生成の両方を単一のパラダイムで評価するための、初の統一されたAny-to-Anyインター…
★ 16 ⑂ 1 Apache-2.0 2026-05-30
画像生成
GitHub
npedit
NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…
★ 15 ⑂ 1 MIT 2026-05-05
LLM
GitHub
ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24
動画生成
GitHub
phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 10 NOASSERTION 2026-06-08
画像生成
GitHub
PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 9 MIT 2026-05-20
音声生成 / TTS
GitHub
nano-codec
nano-codecは、最小限のニューラルオーディオコーデックであり、16kHzモノラルの音声を128倍に圧縮し、10.2kbpsの低…
★ 5 2026-03-31
LLM
GitHub
LongShuGameDev
LongShu (龙枢) は、ゲーム開発に特化した大規模言語モデルです。複雑なゲームシステムの要件を分解し、実行可能な開…
★ 3 NOASSERTION 2026-04-10
画像生成
GitHub
bucketsampler
このツールは、拡散モデルのトレーニング(SDXLのようなマルチARバッチ)において、アスペクト比の異なる画像を効率…
★ 2 MIT 2026-05-15
音声生成 / TTS
GitHub
Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04