3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

PDF-RAG-from_scratch

★ 2 更新: 2026-06-14 GitHubで見る →

概要

「Dhruvish-28/PDF-RAG-from_scratch」は、複数のPDFドキュメントを同時にアップロードし、質問できるRetrieval-Augmented Generation(RAG)チャットボットです。

LangChainに依存せず、Python、Sentence Transformers、FAISS HNSW、Gemini 2.5 Flashを用いてゼロから構築されており、RAGパイプラインの各段階を深く理解したい開発者や、複数の文書から効率的に情報を検索・抽出したい研究者・ビジネスユーザーを想定しています。

マルチフォーマット対応(PDF, DOCX, TXT, MD)、パラグラフを考慮した再帰的チャンキング、会話メモリ、ソース引用、取得の透明性、Streamlitによる使いやすいWeb UIが特徴です。

互換性・特徴

  • Python
  • Web UI
  • Gemini
  • FAISS
  • Streamlit
  • RAG

基本情報

Stars2
カテゴリLLM
アクティビティlow

最新リリース: Multi-PDF RAG Chatbot (2026-06-09)

GitHub: https://github.com/Dhruvish-28/PDF-RAG-from_scratch