概要
SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。
短いテキスト、点、ボックス、マスク、画像例を入力にして、該当する物体を検出・切り出し・追跡できます。
従来より広いオープンボキャブラリ概念に対応し、指定概念の全インスタンスを網羅的に分割できる点が特徴です。
Pythonコード例に加え、Hugging Face Transformers経由でも利用できるため、研究者やAI開発者、画像解析・動画解析ワークフローを構築したいユーザー向けです。
互換性・特徴
- Python
- Transformers
- CLI
- GPU推奨
- 画像対応
- 動画対応
基本情報
| ライセンス | other |
| Likes | 1,957 |
| Downloads | 3,056,113 |
| Pipeline | mask-generation |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/facebook/sam3