概要
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を解決する新しい手法です。
「Coupled Prompt Field」という概念に基づき、ベースクラスと新規クラスを共有の最適化空間で共同学習させることで、学習可能なプロンプトをVLMのネイティブな特徴スケールに動的にアラインします。
これにより、表現劣化(norm driftやEntanglement Collapse)を抑制し、事前学習済み表現空間の幾何学的構造をより良く保存します。
VLMのプロンプト学習の効率と性能向上を目指す研究者や開発者に向けた、シンプルかつ効果的なツールです。
互換性・特徴
- Python
- Vision-Language Models
- プロンプト学習
- 研究ツール
- ICML論文
基本情報
| ライセンス | MIT |
| Stars | 4 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
