概要
SAM3-LiteTextは、視覚言語セグメンテーションモデルSAM3の重いテキストエンコーダを、知識蒸留で最適化した軽量なMobileCLIP系エンコーダに置き換えたモデルです。
画像エンコーダは維持したまま、テキスト側のパラメータを最大約88%削減しつつ、元モデルに近い分割性能を保てます。
Transformersから既存SAM3と同じ入出力で使えるため、軽量化して推論負荷やメモリ使用量を抑えたいPythonユーザーや研究・実装用途に向いています。
互換性・特徴
- Transformers対応
- Python
- mask-generation
- Vision-Language
- GPU推奨
基本情報
| ライセンス | apache-2.0 |
| Likes | 17 |
| Downloads | 5,759 |
| Pipeline | mask-generation |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
HuggingFace: https://huggingface.co/yonigozlan/sam3-litetext-s0