概要
ComfyUI向けのプロンプト生成ツールで、画像内容をもとに各種マルチモーダルLLMからキャプションや生成用プロンプトを作成できます。
Qwen2-VL/Qwen2.5-VL、Moondream、SmolVLM など複数モデルに対応し、利用環境や精度要件に応じて選べる点が特徴です。
README上では作者が16GB VRAM環境で運用しており、大規模Qwen系の検証は限定的です。
ComfyUIで画像解析やプロンプト補助を組み込みたいユーザー向けのツールです。
互換性・特徴
- ComfyUI対応
- Python
- LLM
- 画像キャプション生成
- プロンプト生成
- GPU推奨
基本情報
| Stars | 1 |
| Forks | 1 |
| カテゴリ | ComfyUI |
| アクティビティ | low |
GitHub: https://github.com/GraftingRayman/Unified-Vision-Prompt-Generator
