1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Qwen3-VL-Video-Grounding

★ 14 ⑂ 3 Apache-2.0 更新: 2026-02-28 GitHubで見る →

概要

Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。

ビデオ内のオブジェクト追跡、ポイント追跡、自然言語によるビデオ質問応答機能を提供します。

ユーザーはテキストで指定したオブジェクトをバウンディングボックスで検出・追跡したり、精密なポイント追跡でモーション軌跡を可視化したりできます。

また、ビデオコンテンツに関する質問に対して詳細なテキスト回答を生成。

ZeroGPUサポート、Webカメラ入力対応、Hugging Face Spacesへのデプロイも可能です。

ビデオ分析や視覚情報からの知見抽出に関心のある開発者や研究者に最適なツールです。

互換性・特徴

  • Web UI
  • Python
  • AIモデル使用
  • GPU利用
  • ビデオ分析
  • Gradio

基本情報

ライセンスApache-2.0
Stars14
Forks3
カテゴリマルチモーダル
アクティビティlow

最新のissue

GitHub: https://github.com/PRITHIVSAKTHIUR/Qwen3-VL-Video-Grounding