概要
このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。
ffmpegを用いて動画フレームを抽出し、Gemini API、ローカルWhisper、またはOpenAI APIを介して音声を分析します。
これにより、Claudeは視覚情報(画像フレーム)と聴覚情報(タイムスタンプ付き音声テキスト)の両方から動画を多角的に理解できます。
YouTube URLの直接サポート、質問内容に応じたフレームレートや解像度の自動調整、簡単なセットアップウィザードが特徴です。
Claude Codeのユーザーが動画コンテンツの分析、要約、特定の情報抽出を効率的に行いたい場合に最適です。
互換性・特徴
- Claude Code
- CLI
- Python
- YouTube対応
- Gemini API
- OpenAI API
基本情報
| ライセンス | MIT |
| Stars | 593 |
| Forks | 72 |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
最新のissue
- `video_watch`: `end_time` は絶対時刻であり期間ではないことを明確化 — LLMの初回呼び出しでの誤用 (更新: 2026-05-11 / `video_watch`: clarify `end_time` is absolute, not duration — LLMs misuse on first call)
GitHub: https://github.com/jordanrendric/claude-video-vision
