マルチモーダル HF clip-vit-large-patch14OpenAIが開発したCLIPモデルは、画像とテキストの関連性を学習し、未知の画像分類タスクに対してゼロショットで高い… #Vision Transformer #ゼロショット分類 #英語前提 ❤ 2.0k ↓ 11.8M 2023-09-15