概要
nanofatdog/video-to-promptは、動画からAI画像生成プロンプトを抽出するためのGradioベースのWebアプリケーションです。
動画のフレームを抽出し、Vision LLM(llama.cpp API経由)に送信して、詳細な説明、タグ、要約などを生成します。
主要な機能として、多様な動画形式のアップロード、5種類のプロンプトモード、温度設定、フレームダウンロード、出力履歴、設定可能なAPIエンドポイントなどがあります。
AIプロンプトエンジニアリング、コンテンツ分析、AIワークフローの自動化を目指すユーザーに最適で、ワンクリックインストールやCLI、REST APIもサポートしています。
互換性・特徴
- Web UI
- CLI
- Python
- llama.cpp API
- REST API
- GPU必須
基本情報
| ライセンス | NOASSERTION |
| Stars | 5 |
| カテゴリ | ComfyUI |
| アクティビティ | low |