1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

claude-video-vision

★ 593 ⑂ 72 MIT 更新: 2026-05-13 GitHubで見る →

概要

このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。

ffmpegを用いて動画フレームを抽出し、Gemini API、ローカルWhisper、またはOpenAI APIを介して音声を分析します。

これにより、Claudeは視覚情報(画像フレーム)と聴覚情報(タイムスタンプ付き音声テキスト)の両方から動画を多角的に理解できます。

YouTube URLの直接サポート、質問内容に応じたフレームレートや解像度の自動調整、簡単なセットアップウィザードが特徴です。

Claude Codeのユーザーが動画コンテンツの分析、要約、特定の情報抽出を効率的に行いたい場合に最適です。

互換性・特徴

  • Claude Code
  • CLI
  • Python
  • YouTube対応
  • Gemini API
  • OpenAI API

基本情報

ライセンスMIT
Stars593
Forks72
カテゴリマルチモーダル
アクティビティmid

最新のissue

GitHub: https://github.com/jordanrendric/claude-video-vision