Unified-Vision-Prompt-Generator

概要

ComfyUI向けのプロンプト生成ツールで、画像内容をもとに各種マルチモーダルLLMからキャプションや生成用プロンプトを作成できます。

Qwen2-VL／Qwen2.5-VL、Moondream、SmolVLM など複数モデルに対応し、利用環境や精度要件に応じて選べる点が特徴です。

README上では作者が16GB VRAM環境で運用しており、大規模Qwen系の検証は限定的です。

ComfyUIで画像解析やプロンプト補助を組み込みたいユーザー向けのツールです。

GitHub: https://github.com/GraftingRayman/Unified-Vision-Prompt-Generator