3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Hugging Face (80 repos)

「Hugging Face」タグが付いたリポジトリ

← 全リポジトリ

AIエージェント

GitHub

agents-course

Hugging Face Agents Courseは、AIエージェントの基礎から応用までを網羅した包括的な学習コースです。大規模言語モ…

#AI/ML #Hugging Face #LLM

★ 29.6k ⑂ 2.1k Apache-2.0 2026-06-05

マルチモーダル

GitHub

Janus

Janus-Seriesは、DeepSeek AIによって開発された、統合されたマルチモーダル理解および生成モデルです。Janus-Proは…

#Hugging Face #Python #Web UI

★ 17.8k ⑂ 2.2k MIT 2025-02-01

マルチモーダル

GitHub

minimind-v

MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…

#Apache 2.0 License #CLI #GPU必須

★ 8.2k ⑂ 897 Apache-2.0 2026-05-19

画像生成

GitHub

Dreambooth-Stable-Diffusion

本リポジトリは、GoogleのDreamboothのアイデアをStable Diffusionに実装したものです。従来のTextual Inversionが単…

#CLI #GPU必須 #Hugging Face

★ 7.7k ⑂ 799 MIT 2022-12-08

音楽生成

GitHub

YuE

YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…

#Google Colab #Hugging Face #Web UI (Gradio)

★ 6.3k ⑂ 746 Apache-2.0 2025-06-04

画像生成

GitHub

StyleTTS2

StyleTTS 2は、テキストから人間レベルの自然な音声を合成する最新のText-to-Speech（TTS）モデルです。スタイル拡散…

#CLI #Colab #GPU必須

★ 6.3k ⑂ 690 MIT 2024-08-10

ASR / 音声認識

GitHub

whisper-jax

Whisper JAXは、OpenAIのWhisperモデルをJAXで実装したもので、特にTPUでの実行時にOpenAIのPyTorch版と比較して最大…

#CLI #GPU対応 #Hugging Face

★ 4.7k ⑂ 414 Apache-2.0 2024-04-03

3D / NeRF

GitHub

map-anything

MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…

#3D再構築 #CLI #GPU必須

★ 3.5k ⑂ 269 Apache-2.0 2026-06-03

動画生成

GitHub

VBench

VBenchは、ビデオ生成モデルの包括的な評価とベンチマークを目的としたツール群の統一実装リポジトリです。幅広い能…

#CLI #GPU必須 #Hugging Face

★ 1.7k ⑂ 127 Apache-2.0 2026-03-23

音声生成 / TTS

Qwen3-TTS-12Hz-1.7B-CustomVoice

Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…

#GPU必須 #Hugging Face #Python

❤ 1.6k ↓ 2.0M apache-2.0 2026-01-29

動画生成

GitHub

stable-virtual-camera

Stable Virtual Camera (SEVA)は、拡散モデルを活用した汎用的な新規ビュー合成（NVS）ツールです。このツールは、与…

#CLI #GPU必須 #Hugging Face

★ 1.6k ⑂ 121 NOASSERTION 2026-03-03

動画生成

GitHub

text-to-video-synthesis-colab

このリポジトリは、テキストから動画を生成する複数のAIモデル（longscope、zeroscopeなど）をGoogle Colab上で手軽…

#AI/ML #Google Colab #GPU必須

★ 1.5k ⑂ 185 Unlicense 2024-03-28

LLM

Qwen2.5-7B-Instruct

Qwen2.5-7B-Instructは、Qwen大規模言語モデルの最新シリーズであり、特に命令チューニングされた7Bモデルです。コー…

#GPU必須 #Hugging Face #LLM

❤ 1.4k ↓ 12.7M apache-2.0 2025-01-12

音声生成 / TTS

GitHub

tango

Tangoは、LLM（Flan-T5）によってガイドされる潜在拡散モデル（LDM）を用いた、テキストからオーディオを生成するツ…

#GitHub #Google Colab対応 #GPU推奨

★ 1.2k ⑂ 105 NOASSERTION 2025-07-29

ComfyUI

GitHub

ComfyUI-segment-anything-2

このツールは、ComfyUIでSegment Anything 2モデルを使用するためのノードを提供します。現在開発中のPointsEditor機…

#ComfyUI対応 #GPU必須 #Hugging Face

★ 1.2k ⑂ 83 Apache-2.0 2025-09-28

動画生成

GitHub

Causal-Forcing

「Causal Forcing」およびその改良版「Causal Forcing++」は、因果ODEや因果Consistency Distillationを活用し、高品…

#CLI #GPU必須 #Hugging Face

★ 803 ⑂ 46 Apache-2.0 2026-06-17

LLM

GitHub

can-i-finetune-this

canifinetuneは、コンシューマー向けNVIDIA GPU（12-24GB）で大規模言語モデル（LLM）のファインチューニングを検討…

#CLI #GPU必須 #Hugging Face

★ 649 ⑂ 92 MIT 2026-06-10

画像生成

GitHub

nano-world-model

「Nano World Model」は、拡散強制（diffusion-forcing）に基づくビデオワールドモデルのトレーニングに特化した、シ…

#CLI #GPU必須 #Hugging Face

★ 643 ⑂ 33 MIT 2026-06-15

ComfyUI

GitHub

ComfyUI-Marigold

ComfyUI-Marigoldは、画像から深度マップを推定するMarigoldモデルのComfyUI向けラッパーノードです。このツールは、…

#ComfyUI対応 #GPU必須 #Hugging Face

★ 572 ⑂ 25 GPL-3.0 2025-05-16

画像生成

GitHub

PixelSmile

PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…

#CLI #ComfyUI対応 #GPU必須

★ 478 ⑂ 22 Apache-2.0 2026-04-22

マルチモーダル

Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…

#GGUF #Hugging Face #コーディング向け

❤ 469 ↓ 557.7k apache-2.0 2026-06-11

マルチモーダル

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…

#CLI #GPU推奨 #Hugging Face

❤ 411 ↓ 724.6k mit 2025-01-14

3D / NeRF

GitHub

sam-body4d

SAM-Body4Dは、動画からトレーニング不要で一時的に一貫性のある堅牢な4D人体メッシュを復元するツールです。SAM-3、…

#CLI #GPU必須 #Hugging Face

★ 351 ⑂ 33 MIT 2026-05-11

3D / NeRF

GitHub

OmniVGGT-official

OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…

#3D幾何学 #CLI #GPU必須

★ 339 ⑂ 28 MIT 2026-05-21