マルチモーダル GitHub zero-shot-video-classifierこのツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有… #Docker #HuggingFace Transformers #Python ★ 1 2026-05-07