3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

OmniAgent

★ 13 Apache-2.0 更新: 2026-06-18 GitHubで見る →

概要

OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。

従来のモデルとは異なり、動画の全フレームを事前に処理するのではなく、「観察、思考、行動」のサイクルを通じて必要なフレームや音声を能動的に知覚します。

これにより、情報ニーズに応じてスケーリングし、少ないフレーム数で高精度な結果を達成。

動画解析の効率化、マルチモーダルAIの研究、あるいはより高度な動画理解システムを開発したい研究者やエンジニアに最適なツールです。

Hugging Faceでモデルが公開されており、CLIおよびWeb UIでの利用も可能です。

互換性・特徴

  • オムニモーダルAI
  • 動画解析
  • アクティブラーニング
  • Python
  • CLI
  • Web UI
  • Hugging Face

基本情報

ライセンスApache-2.0
Stars13
カテゴリマルチモーダル
アクティビティlow

GitHub: https://github.com/HarryHsing/OmniAgent