3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

VidCom2

★ 126 ⑂ 14 Apache-2.0 更新: 2026-05-14 GitHubで見る →

概要

VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワークです。

動的なフレーム予算配分を特徴とする初のトークン圧縮フレームワークであり、VideoLLMの効率的な推論を実現します。

VisionZip、DyCoke、FastVIDなどの代表的なベースラインと統合され、QwenやLLaVAといった多様なモデルシリーズをサポートしています。

長尺動画の理解において推論速度の向上を目指すAI研究者や開発者、特にVideoLLMのパフォーマンス最適化に関心のあるユーザーに最適です。

互換性・特徴

  • Python
  • GPU必須
  • CLI
  • VideoLLM
  • 推論高速化
  • フレームワーク

基本情報

ライセンスApache-2.0
Stars126
Forks14
カテゴリLLM
アクティビティmid

GitHub: https://github.com/xuyang-liu16/VidCom2