#Hugging Face対応 (30 repos)
「Hugging Face対応」タグが付いたリポジトリ
← 全リポジトリ
LLM GitHub vllm
vLLMは、大規模言語モデル (LLM) の高速かつ効率的な推論とサービングを可能にするPythonライブラリです。最先端のス…
★ 83.5k ⑂ 18.3k Apache-2.0 2026-06-22
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12
動画生成 GitHub Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 16.3k ⑂ 2.0k Apache-2.0 2026-03-17
動画生成 GitHub CogVideo
「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。CogVideoXシリーズは、テキストから…
★ 12.8k ⑂ 1.3k Apache-2.0 2025-11-04
マルチモーダル GitHub InternVL
InternVL Familyは、GPT-4o/GPT-5に匹敵する性能を目指すオープンソースの多モーダル会話モデル群です。特にInternVL…
★ 10.1k ⑂ 784 MIT 2025-09-22
マルチモーダル GitHub Qwen-VL
Qwen-VLは、Alibaba Cloudが開発した大規模ビジョン言語モデル「通义千问-VL」の公式リポジトリです。Qwen-VL-Plusお…
★ 6.7k ⑂ 492 NOASSERTION 2024-08-07
画像生成 GitHub LatentSync
LatentSyncは、音声入力に基づいて動画のリップシンクを生成する、エンドツーエンドの革新的な手法です。既存のピク…
★ 5.8k ⑂ 947 Apache-2.0 2025-06-20
動画生成 GitHub VideoCrafter
VideoCrafter2は、データ制約を克服し高品質な動画を生成するためのオープンソースの動画生成および編集ツールボック…
★ 5.1k ⑂ 412 NOASSERTION 2026-01-09
マルチモーダル GitHub DeepSeek-VL
DeepSeek-VLは、実世界の視覚と言語の理解を目指して開発されたオープンソースのVision-Language (VL) モデルです。…
★ 4.1k ⑂ 593 MIT 2024-04-24
マルチモーダル GitHub MGM
「Mini-Gemini」は、画像理解、推論、生成を同時に行うことができるマルチモダリティ大規模言語モデル(LLM)フレー…
★ 3.3k ⑂ 275 Apache-2.0 2024-05-04
動画生成 GitHub MiniMax-MCP
MiniMax-AIの公式Model Context Protocol (MCP) サーバーであり、強力なテキスト読み上げ、画像生成、ビデオ生成のAP…
★ 1.5k ⑂ 270 MIT 2026-05-21
音声生成 / TTS GitHub BigVGAN
BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…
★ 1.2k ⑂ 145 MIT 2024-09-05
音楽生成 GitHub MidiTok
MidiTokは、MIDIやabcといった音楽ファイルをディープラーニングモデル(Transformerなど)が扱えるトークンシーケン…
★ 879 ⑂ 101 MIT 2026-06-08
音声生成 / TTS GitHub Confucius4-TTS
Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…
★ 187 ⑂ 19 NOASSERTION 2026-06-17
3D / NeRF GitHub vgg-ttt
VGG-T³は、大規模な画像コレクションからオフラインで高速な3D再構築を可能にするツールです。CVPR'26で発表された論…
★ 133 ⑂ 13 NOASSERTION 2026-05-25
ComfyUI GitHub comfyui-model-downloader
ComfyUI上で機械学習モデルを直接ダウンロードし、管理しやすくする実験的なカスタムノードです。Hugging FaceとCivi…
★ 124 ⑂ 33 AGPL-3.0 2026-03-20
動画生成 GitHub Echo-Memory
Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…
★ 111 ⑂ 5 2026-06-14
LLM GitHub granite-switch
「Granite Switch」は、IBM Researchが開発したオープンソースプロジェクトで、複数のファインチューニングされたLoR…
★ 80 ⑂ 8 Apache-2.0 2026-06-16
動画生成 GitHub LiveWorld
LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…
★ 60 ⑂ 3 Apache-2.0 2026-03-31
画像生成 GitHub LeapAlign_Code
LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…
★ 53 ⑂ 1 Apache-2.0 2026-06-13
画像生成 GitHub W-Flow
W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…
★ 53 ⑂ 4 MIT 2026-06-09
3D / NeRF GitHub wanderland
Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…
★ 44 Apache-2.0 2026-06-18
動画生成 GitHub Helios-Page
Heliosは、リアルタイムで長尺の動画を生成する革新的なモデルです。140億パラメータという大規模モデルでありながら…
★ 22 ⑂ 2 2026-05-30
画像生成 GitHub VHS
VHSは、DiTベースの画像生成における推論時の効率的なスケーリング検証フレームワークです。テキストプロンプトに基…
★ 16 NOASSERTION 2026-03-25