3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Hugging Face対応 (30 repos)

「Hugging Face対応」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

vllm

vLLMは、大規模言語モデル (LLM) の高速かつ効率的な推論とサービングを可能にするPythonライブラリです。最先端のス…

#CLI #GPU必須 #Hugging Face対応

★ 83.5k ⑂ 18.3k Apache-2.0 2026-06-22

マルチモーダル

GitHub

LLaVA

LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…

#GPU必須 #Hugging Face対応 #llama.cpp互換

★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12

動画生成

GitHub

Wan2.2

Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合（MoE）アーキテ…

#GPU必須 #Hugging Face対応 #Image-to-Video

★ 16.3k ⑂ 2.0k Apache-2.0 2026-03-17

動画生成

GitHub

CogVideo

「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。CogVideoXシリーズは、テキストから…

#CLI #GPU必須 #Hugging Face対応

★ 12.8k ⑂ 1.3k Apache-2.0 2025-11-04

マルチモーダル

GitHub

InternVL

InternVL Familyは、GPT-4o/GPT-5に匹敵する性能を目指すオープンソースの多モーダル会話モデル群です。特にInternVL…

#GPU必須 #Hugging Face対応 #Python

★ 10.1k ⑂ 784 MIT 2025-09-22

マルチモーダル

GitHub

Qwen-VL

Qwen-VLは、Alibaba Cloudが開発した大規模ビジョン言語モデル「通义千问-VL」の公式リポジトリです。Qwen-VL-Plusお…

#API対応 #Hugging Face対応 #ModelScope対応

★ 6.7k ⑂ 492 NOASSERTION 2024-08-07

画像生成

GitHub

LatentSync

LatentSyncは、音声入力に基づいて動画のリップシンクを生成する、エンドツーエンドの革新的な手法です。既存のピク…

#Diffusion Model #GPU必須 #Hugging Face対応

★ 5.8k ⑂ 947 Apache-2.0 2025-06-20

動画生成

GitHub

VideoCrafter

VideoCrafter2は、データ制約を克服し高品質な動画を生成するためのオープンソースの動画生成および編集ツールボック…

#Hugging Face対応 #Image2Video #Python

★ 5.1k ⑂ 412 NOASSERTION 2026-01-09

マルチモーダル

GitHub

DeepSeek-VL

DeepSeek-VLは、実世界の視覚と言語の理解を目指して開発されたオープンソースのVision-Language (VL) モデルです。…

#GPU必須 #Hugging Face対応 #Python

★ 4.1k ⑂ 593 MIT 2024-04-24

マルチモーダル

GitHub

MGM

「Mini-Gemini」は、画像理解、推論、生成を同時に行うことができるマルチモダリティ大規模言語モデル（LLM）フレー…

#GPU必須 #Hugging Face対応 #LLMフレームワーク

★ 3.3k ⑂ 275 Apache-2.0 2024-05-04

動画生成

GitHub

MiniMax-MCP

MiniMax-AIの公式Model Context Protocol (MCP) サーバーであり、強力なテキスト読み上げ、画像生成、ビデオ生成のAP…

#API #Hugging Face対応 #Python

★ 1.5k ⑂ 270 MIT 2026-05-21

音声生成 / TTS

GitHub

BigVGAN

BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…

#CLI #GPU必須 #Hugging Face対応

★ 1.2k ⑂ 145 MIT 2024-09-05

音楽生成

GitHub

MidiTok

MidiTokは、MIDIやabcといった音楽ファイルをディープラーニングモデル（Transformerなど）が扱えるトークンシーケン…

#Deep Learning #Hugging Face対応 #Python

★ 879 ⑂ 101 MIT 2026-06-08

音声生成 / TTS

GitHub

Confucius4-TTS

Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…

#CLI #GPU必須 #Hugging Face対応

★ 187 ⑂ 19 NOASSERTION 2026-06-17

3D / NeRF

GitHub

vgg-ttt

VGG-T³は、大規模な画像コレクションからオフラインで高速な3D再構築を可能にするツールです。CVPR'26で発表された論…

#3D再構築 #CLI #GPU必須

★ 133 ⑂ 13 NOASSERTION 2026-05-25

ComfyUI

GitHub

comfyui-model-downloader

ComfyUI上で機械学習モデルを直接ダウンロードし、管理しやすくする実験的なカスタムノードです。Hugging FaceとCivi…

#CivitAI対応 #ComfyUI対応 #Hugging Face対応

★ 124 ⑂ 33 AGPL-3.0 2026-03-20

動画生成

GitHub

Echo-Memory

Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…

#CLI #GPU必須 #Hugging Face対応

★ 111 ⑂ 5 2026-06-14

LLM

GitHub

granite-switch

「Granite Switch」は、IBM Researchが開発したオープンソースプロジェクトで、複数のファインチューニングされたLoR…

#CLI #GPU必須 #Hugging Face対応

★ 80 ⑂ 8 Apache-2.0 2026-06-16

動画生成

GitHub

LiveWorld

LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…

#AI/機械学習 #GPU必須 #Hugging Face対応

★ 60 ⑂ 3 Apache-2.0 2026-03-31

画像生成

GitHub

LeapAlign_Code

LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…

#CLI #GPU必須 #Hugging Face対応

★ 53 ⑂ 1 Apache-2.0 2026-06-13

画像生成

GitHub

W-Flow

W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…

#Colab対応 #Hugging Face対応 #Python

★ 53 ⑂ 4 MIT 2026-06-09

3D / NeRF

GitHub

wanderland

Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…

#3Dシミュレーション #AI/ML #CLI

★ 44 Apache-2.0 2026-06-18

動画生成

GitHub

Helios-Page

Heliosは、リアルタイムで長尺の動画を生成する革新的なモデルです。140億パラメータという大規模モデルでありながら…

#GPU必須 #Hugging Face対応 #Python

★ 22 ⑂ 2 2026-05-30

画像生成

GitHub

VHS

VHSは、DiTベースの画像生成における推論時の効率的なスケーリング検証フレームワークです。テキストプロンプトに基…

#CLI #GPU必須 #Hugging Face対応

★ 16 NOASSERTION 2026-03-25