ASR / 音声認識
HF whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.0k mit 2024-10-04
マルチモーダル
HF gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 8.7M apache-2.0 2026-05-07
マルチモーダル
HF sam3
SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。短いテキスト、点、ボッ…
❤ 2.0k ↓ 3.1M other 2025-11-20
ComfyUI GitHub ComfyUI-ReActor
ComfyUI向けの高速・簡単な顔交換ノード集で、画像内の顔を別の顔へ差し替えるワークフローをWeb UI上で構築できます…
★ 1.2k ⑂ 217 GPL-3.0 2026-04-25
ComfyUI GitHub ComfyUI-Frame-Interpolation
ComfyUI上で動画や連番画像の中間フレームを生成し、フレーム補間による滑らかな映像化を行うためのカスタムノード集…
★ 1.0k ⑂ 127 MIT 2026-03-29
マルチモーダル
HF clip-vit-base-patch32
openai/clip-vit-base-patch32は、画像とテキストを同じ埋め込み空間で比較し、任意のラベル文との類似度からゼロシ…
❤ 932 ↓ 21.6M 2024-02-29
ComfyUI GitHub SeargeSDXL
Searge-SDXLは、ComfyUI向けのSDXL 1.0用カスタムノード拡張と統合ワークフローです。baseモデルとrefinerモデルを組…
★ 873 ⑂ 65 MIT 2024-05-22
ComfyUI GitHub ComfyUI-Wan22FMLF
ComfyUI-Wan22FMLFは、Wan2.2 A14B I2V向けに複数の参照画像・参照フレームを使って動画生成を安定化させるComfyUI用…
★ 542 ⑂ 24 2026-02-09
画像生成 HF BFS-Best-Face-Swap
BFS(Best Face Swap)は、Qwen Image Edit 2509/2511およびFlux 2 Klein 4b/9b向けに作られた顔・頭部差し替え用のL…
❤ 500 ↓ 84.9k mit 2026-03-08
その他
HF segformer_b2_clothes
SegFormer B2をATRベースの人間パースデータセットで衣服セグメンテーション向けに微調整したモデルです。人物画像か…
❤ 499 ↓ 225.5k other 2025-09-19
マルチモーダル
HF BiomedCLIP-PubMedBERT_256-vit_base_patch16_224
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…
❤ 403 ↓ 883.3k mit 2025-01-14
ComfyUI GitHub ComfyUI-DepthAnythingV3
ComfyUI上でDepth Anything V3を使えるようにするカスタムノード集です。単一画像や複数視点画像から深度推定を行い…
★ 399 ⑂ 28 MIT 2026-05-08
その他 HF BEN2
BEN2は、画像や動画から人物・物体の前景を高精度に切り抜き、背景除去やマスク生成を行うためのPython向けセグメン…
❤ 231 ↓ 225.0k mit 2025-12-31
ComfyUI GitHub ComfyUI_ZenID
ZenIDは、ComfyUI向けのカスタムノードとして提供される顔入れ替え・顔合成ツールです。InstantID系を土台に、Face S…
★ 222 ⑂ 23 Apache-2.0 2025-07-03
マルチモーダル HF audio-flamingo-3-hf
Audio Flamingo 3は、音声・環境音・音楽を横断して理解し、文字起こし、音の内容把握、推論、対話まで行えるオープ…
❤ 183 ↓ 188.7k other 2026-04-13
ComfyUI GitHub ComfyI2I
ComfyI2Iは、ComfyUIのImage-to-Image(I2I)機能を拡張するカスタムノードのセットです。主な機能として、ComfyUI内…
★ 178 ⑂ 17 NOASSERTION 2024-06-14
マルチモーダル
GitHub DISCO
DISCOは、タンパク質配列と3次元構造を同時に設計できる拡散ベースのマルチモーダル生成モデルです。小分子リガンド…
★ 165 ⑂ 19 Apache-2.0 2026-04-09
ComfyUI GitHub ComfyUI-Geowizard
ComfyUI上でGeoWizardを使うためのラッパーノードです。GeoWizard本体をComfyUIのワークフローに組み込み、対応モデ…
★ 127 ⑂ 7 2024-12-16
マルチモーダル
GitHub ComfyUI-Ollama-Describer
ComfyUI-Ollama-Describerは、ComfyUIの拡張機能で、Ollamaの多様なLLMモデル(Gemma、Llava、Llama2/3、Mistralなど…
★ 116 ⑂ 23 MIT 2026-03-19
その他
HF yolos-small
YOLOS smallは、Vision Transformerをベースにした物体検出モデルで、COCO 2017で学習済みの軽量版です。画像内の物…
❤ 94 ↓ 746.4k apache-2.0 2024-05-08
マルチモーダル HF Falcon-OCR
Falcon OCRは、画像から文書テキストを抽出する300Mパラメータ級の軽量OCR向けビジョン言語モデルです。通常の文字起…
❤ 93 ↓ 20.9k apache-2.0 2026-04-01
画像生成 HF ddpm-cifar10-32
google/ddpm-cifar10-32は、CIFAR-10向けに学習済みのDDPM画像生成モデルです。Hugging Face Diffusersの`DDPMPipeli…
❤ 85 ↓ 43.8k apache-2.0 2023-08-03
ASR / 音声認識
HF wav2vec2-large-xlsr-53-russian
このリポジトリは、Jonatas Grosman氏が開発したロシア語音声認識用のWav2Vec2-large-xlsr-53モデルを提供します。Hu…
❤ 74 apache-2.0 2022-12-14
ComfyUI GitHub comfyui_sam3
ComfyUI向けのSAM3カスタムノード集で、自然言語のテキスト指示から画像内の対象物を高精度に切り抜き・マスク生成で…
★ 72 ⑂ 9 MIT 2026-01-01