Unify-Agent

概要

「Unify-Agent」は、Web検索等で外部の知識を能動的に参照し、事実に忠実な画像を生成する統一マルチモーダルAIエージェントです。

プロンプト理解(THINK)、情報収集(RESEARCH)、キャプション再生成(RECAPTION)、画像生成(GENERATE)の4機能を単一モデルに統合。

実在の人物やマイナーIP等、従来のモデルでは困難だった対象の高精度な生成を実現します。

AI研究者や開発者が、より知識集約的な画像合成を探求するためのツールです。

GitHub: https://github.com/shawn0728/Unify-Agent