3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Hugging Face (80 repos)

「Hugging Face」タグが付いたリポジトリ

← 全リポジトリ

AIエージェント
GitHub
agents-course
Hugging Face Agents Courseは、AIエージェントの基礎から応用までを網羅した包括的な学習コースです。大規模言語モ…
★ 29.6k ⑂ 2.1k Apache-2.0 2026-06-05
マルチモーダル
GitHub
Janus
Janus-Seriesは、DeepSeek AIによって開発された、統合されたマルチモーダル理解および生成モデルです。Janus-Proは…
★ 17.8k ⑂ 2.2k MIT 2025-02-01
マルチモーダル
GitHub
minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.2k ⑂ 897 Apache-2.0 2026-05-19
画像生成
GitHub
Dreambooth-Stable-Diffusion
本リポジトリは、GoogleのDreamboothのアイデアをStable Diffusionに実装したものです。従来のTextual Inversionが単…
★ 7.7k ⑂ 799 MIT 2022-12-08
音楽生成
GitHub
YuE
YuEは、歌詞からボーカルと伴奏を含む数分間のフルソングを生成できる、オープンソースの音楽生成基盤モデルです。多…
★ 6.3k ⑂ 746 Apache-2.0 2025-06-04
画像生成
GitHub
StyleTTS2
StyleTTS 2は、テキストから人間レベルの自然な音声を合成する最新のText-to-Speech(TTS)モデルです。スタイル拡散…
★ 6.3k ⑂ 690 MIT 2024-08-10
ASR / 音声認識
GitHub
whisper-jax
Whisper JAXは、OpenAIのWhisperモデルをJAXで実装したもので、特にTPUでの実行時にOpenAIのPyTorch版と比較して最大…
★ 4.7k ⑂ 414 Apache-2.0 2024-04-03
3D / NeRF
GitHub
map-anything
MapAnythingは、画像、キャリブレーション、ポーズ、深度などの多様な入力から、統一されたフィードフォワードのトラ…
★ 3.5k ⑂ 269 Apache-2.0 2026-06-03
動画生成
GitHub
VBench
VBenchは、ビデオ生成モデルの包括的な評価とベンチマークを目的としたツール群の統一実装リポジトリです。幅広い能…
★ 1.7k ⑂ 127 Apache-2.0 2026-03-23
音声生成 / TTS
HF
Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.6k ↓ 2.0M apache-2.0 2026-01-29
動画生成
GitHub
stable-virtual-camera
Stable Virtual Camera (SEVA)は、拡散モデルを活用した汎用的な新規ビュー合成(NVS)ツールです。このツールは、与…
★ 1.6k ⑂ 121 NOASSERTION 2026-03-03
動画生成
GitHub
text-to-video-synthesis-colab
このリポジトリは、テキストから動画を生成する複数のAIモデル(longscope、zeroscopeなど)をGoogle Colab上で手軽…
★ 1.5k ⑂ 185 Unlicense 2024-03-28
LLM
HF
Qwen2.5-7B-Instruct
Qwen2.5-7B-Instructは、Qwen大規模言語モデルの最新シリーズであり、特に命令チューニングされた7Bモデルです。コー…
❤ 1.4k ↓ 12.7M apache-2.0 2025-01-12
音声生成 / TTS
GitHub
tango
Tangoは、LLM(Flan-T5)によってガイドされる潜在拡散モデル(LDM)を用いた、テキストからオーディオを生成するツ…
★ 1.2k ⑂ 105 NOASSERTION 2025-07-29
ComfyUI
GitHub
ComfyUI-segment-anything-2
このツールは、ComfyUIでSegment Anything 2モデルを使用するためのノードを提供します。現在開発中のPointsEditor機…
★ 1.2k ⑂ 83 Apache-2.0 2025-09-28
動画生成
GitHub
Causal-Forcing
「Causal Forcing」およびその改良版「Causal Forcing++」は、因果ODEや因果Consistency Distillationを活用し、高品…
★ 803 ⑂ 46 Apache-2.0 2026-06-17
LLM
GitHub
can-i-finetune-this
canifinetuneは、コンシューマー向けNVIDIA GPU(12-24GB)で大規模言語モデル(LLM)のファインチューニングを検討…
★ 649 ⑂ 92 MIT 2026-06-10
画像生成
GitHub
nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 643 ⑂ 33 MIT 2026-06-15
ComfyUI
GitHub
ComfyUI-Marigold
ComfyUI-Marigoldは、画像から深度マップを推定するMarigoldモデルのComfyUI向けラッパーノードです。このツールは、…
★ 572 ⑂ 25 GPL-3.0 2025-05-16
画像生成
GitHub
PixelSmile
PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…
★ 478 ⑂ 22 Apache-2.0 2026-04-22
マルチモーダル
HF
Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…
❤ 469 ↓ 557.7k apache-2.0 2026-06-11
マルチモーダル
HF
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…
❤ 411 ↓ 724.6k mit 2025-01-14
3D / NeRF
GitHub
sam-body4d
SAM-Body4Dは、動画からトレーニング不要で一時的に一貫性のある堅牢な4D人体メッシュを復元するツールです。SAM-3、…
★ 351 ⑂ 33 MIT 2026-05-11
3D / NeRF
GitHub
OmniVGGT-official
OmniVGGTは、空間認識のための最先端の基盤モデルです。本ツールは、深度、カメラ内部パラメータ、ポーズといった任…
★ 339 ⑂ 28 MIT 2026-05-21