マルチモーダル HF sam3-litetext-s0SAM3-LiteTextは、視覚言語セグメンテーションモデルSAM3の重いテキストエンコーダを、知識蒸留で最適化した軽量なMo… #GPU推奨 #mask-generation #Vision-Language ❤ 17 ↓ 5.8k apache-2.0 2026-04-21