3,666 repos GH 3,551 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

mixpeek-extractors

★ 1 MIT 更新: 2026-06-16 GitHubで見る →

概要

Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め込みと構造化メタデータを生成するマルチモーダルな処理パイプラインです。

SigLIP、Gemini、E5、CLAP、ArcFaceなどの先進的な埋め込みモデルに対応し、動画のシーン検出、音声の文字起こし、顔認識、ドキュメントのレイアウト解析といった豊富な機能を提供します。

主に開発者やデータサイエンティストが、複雑なマルチモーダルデータから効率的に情報を抽出し、AIアプリケーションや検索システムに活用することを想定しています。

互換性・特徴

  • Python
  • API
  • Multimodal
  • Vector Embeddings
  • CLI

基本情報

ライセンスMIT
Stars1
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/mixpeek/mixpeek-extractors