概要
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエージェントRAG(検索拡張生成)システムです。
ハイブリッド検索、クロスエンコーダ再ランキング、インテリジェントなクエリ分解、セマンティックキャッシュ、適応型LLMルーティング、ONNX最適化された推論など、高度な機能を組み合わせることで、複雑なクエリにも対応できるインテリジェントな多段推論を可能にします。
Qdrant、Groq、Gemini、BGE埋め込みを活用し、主に大規模なAIアプリケーションを構築する開発者や企業を想定しています。
互換性・特徴
- Python
- RAG
- AI-powered Retrieval
- Scalable
- Low-latency
- ONNX Optimized
基本情報
| Stars | 1 |
| カテゴリ | LLM |
| アクティビティ | low |
GitHub: https://github.com/imgirish07/Scalable-RAG-Application