概要
「Dhruvish-28/PDF-RAG-from_scratch」は、複数のPDFドキュメントを同時にアップロードし、質問できるRetrieval-Augmented Generation(RAG)チャットボットです。
LangChainに依存せず、Python、Sentence Transformers、FAISS HNSW、Gemini 2.5 Flashを用いてゼロから構築されており、RAGパイプラインの各段階を深く理解したい開発者や、複数の文書から効率的に情報を検索・抽出したい研究者・ビジネスユーザーを想定しています。
マルチフォーマット対応(PDF, DOCX, TXT, MD)、パラグラフを考慮した再帰的チャンキング、会話メモリ、ソース引用、取得の透明性、Streamlitによる使いやすいWeb UIが特徴です。
互換性・特徴
- Python
- Web UI
- Gemini
- FAISS
- Streamlit
- RAG
基本情報
| Stars | 2 |
| カテゴリ | LLM |
| アクティビティ | low |
最新リリース: Multi-PDF RAG Chatbot (2026-06-09)
