概要
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め込み、FAISSインデックスを構築して検索APIを提供するフレームワークです。
スケーラブルなピクセルネイティブ検索を可能にし、あらゆるドキュメントタイプに対応します。
Wikipediaのような大規模データセットをベンチマークとしつつ汎用的に利用でき、開発者は既存のインデックス検索、自身のドキュメントからのインデックス構築、あるいはClaude Codeプラグインを通じたLLMへの視覚情報提供が可能です。
互換性・特徴
- Python
- CLI
- Web API
- GPU必須
- Claude対応
- ドキュメント検索
- 画像処理
基本情報
| ライセンス | Apache-2.0 |
| Stars | 5 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |