sam3 | AIAI Hub

概要

SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。

短いテキスト、点、ボックス、マスク、画像例を入力にして、該当する物体を検出・切り出し・追跡できます。

従来より広いオープンボキャブラリ概念に対応し、指定概念の全インスタンスを網羅的に分割できる点が特徴です。

Pythonコード例に加え、Hugging Face Transformers経由でも利用できるため、研究者やAI開発者、画像解析・動画解析ワークフローを構築したいユーザー向けです。

HuggingFace: https://huggingface.co/facebook/sam3