272 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

siglip-so400m-patch14-384

★ 674 apache-2.0 更新: 2024-09-26 HFで見る →

概要

SigLIP So400m Patch14 384は、Googleの画像と言語を結び付けるマルチモーダルモデルで、ゼロショット画像分類や画像テキスト検索に使えます。

CLIP系モデルを改良したsigmoid lossを採用し、画像とテキストのペア学習に最適化されている点が特徴です。

384×384入力のshape-optimized SoViT-400m構成で、TransformersからPythonコードやpipeline APIで利用できます。

画像理解や検索機能を自作アプリに組み込みたい研究者・開発者向けです。

互換性・特徴

  • Python
  • Transformers
  • Vision
  • Zero-shot classification
  • Image-text retrieval

基本情報

ライセンスapache-2.0
Likes674
Downloads2,129,671
Pipelinezero-shot-image-classification
カテゴリマルチモーダル
アクティビティmid

HuggingFace: https://huggingface.co/google/siglip-so400m-patch14-384