概要
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め込みと構造化メタデータを生成するマルチモーダルな処理パイプラインです。
SigLIP、Gemini、E5、CLAP、ArcFaceなどの先進的な埋め込みモデルに対応し、動画のシーン検出、音声の文字起こし、顔認識、ドキュメントのレイアウト解析といった豊富な機能を提供します。
主に開発者やデータサイエンティストが、複雑なマルチモーダルデータから効率的に情報を抽出し、AIアプリケーションや検索システムに活用することを想定しています。
互換性・特徴
- Python
- API
- Multimodal
- Vector Embeddings
- CLI
基本情報
| ライセンス | MIT |
| Stars | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
