mixpeek-extractors

概要

Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め込みと構造化メタデータを生成するマルチモーダルな処理パイプラインです。

SigLIP、Gemini、E5、CLAP、ArcFaceなどの先進的な埋め込みモデルに対応し、動画のシーン検出、音声の文字起こし、顔認識、ドキュメントのレイアウト解析といった豊富な機能を提供します。

主に開発者やデータサイエンティストが、複雑なマルチモーダルデータから効率的に情報を抽出し、AIアプリケーションや検索システムに活用することを想定しています。

GitHub: https://github.com/mixpeek/mixpeek-extractors