概要
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特性を分析した技術レポートです。
RAG (Retrieval Augmented Generation) が純粋なコサイン類似度検索において記憶として機能しない構造的な理由を定量的に明らかにしています。
テキスト、画像、音声、ビデオの4つのモダリティにおける埋め込みの参加比率や、否定、数値、役割交換、ハブネス、エビングハウスの忘却といった主要なRAGの失敗モードを`gemini-embedding-2`上で検証。
約6分、2ドルのAPI費用で再現可能なPythonベースの実験コードを提供し、RAGシステム開発者やマルチモーダル埋め込みモデルの研究者向けに、その限界と挙動の深い理解を促します。
互換性・特徴
- Python
- CLI
- Google Gemini API
- OpenAI API
- RAG
- マルチモーダルAI
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
GitHub: https://github.com/niashwin/sentra-rag-failure-modes
