3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

rag-document-engine

★ 1 更新: 2026-06-19 GitHubで見る →

概要

「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG(検索拡張生成)システムです。

生の埋め込みとコサイン類似度から始まり、ドキュメントの取り込み、チャンク化、OpenAIの「text-embedding-3-small」による埋め込み、Chromaへのベクトル保存、そしてクエリに対するトップK検索、引用付きの回答生成まで、完全なパイプラインを構築します。

テキストファイルの取り込み、再ランキング、ハイブリッド検索、ロールベースのアクセス制御などの機能を提供し、柔軟で拡張性の高い情報検索システムを求める開発者や研究者に最適です。

互換性・特徴

  • Python
  • CLI
  • OpenAI
  • Chroma
  • RAG

基本情報

Stars1
カテゴリLLM
アクティビティlow

GitHub: https://github.com/Buffden/rag-document-engine