262 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224

★ 403 mit 更新: 2025-01-14 GitHubで見る →

概要

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事前学習された、生物医学向けの画像と言語の基盤モデルです。

PubMedBERTとVision Transformerを組み合わせ、ゼロショット画像分類、画像検索、クロスモーダル検索、視覚質問応答などに対応します。

医療AIやバイオ系研究で、病理画像・X線・MRIなど専門画像をテキストと結び付けて扱いたい研究者や開発者向けで、open_clip経由でHugging Faceまたはローカルファイルから利用できます。

互換性・特徴

  • Python
  • CLI
  • GPU推奨
  • Hugging Face
  • open_clip
  • 医用画像対応

基本情報

ライセンスmit
Likes403
Downloads883,349
Pipelinezero-shot-image-classification
カテゴリマルチモーダル
アクティビティmid

HuggingFace: https://huggingface.co/microsoft/BiomedCLIP-PubMedBERT_256-vit_base_patch16_224