概要
このプロジェクトは、企業法務向けのRAG(Retrieval-Augmented Generation)Q&Aシステムです。
Alibaba Cloudの埋め込みモデルとQwen-Maxを基盤とし、Elasticsearchをベクトルデータベース、Redisを短期履歴、Neo4jを長期対話履歴として活用するハイブリッドなデータベースアーキテクチャが特徴です。
複数の閾値制御により、トークン消費、生成遅延、応答精度のバランスを最適化し、優れた対話体験を提供します。
また、WebSocket経由の人力エージェント転送検出や、ベクトル、BM25、ルールベースの複数経路検索、BGE-reranker-largeによる再ランキング機能も備えています。
主にPythonで開発されており、Dockerでのデプロイをサポートし、FastAPIとVue3でWeb UIを提供します。
企業法務の専門家や、複雑な法的文書に基づく高精度なQ&Aシステムを求める企業が想定ユーザーです。
互換性・特徴
- Python
- Docker
- Web UI
- GPU必須
- RAGシステム
- グラフデータベース
基本情報
| Stars | 62 |
| カテゴリ | LLM |
| アクティビティ | low |
