3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

LongParser

★ 29 ⑂ 2 NOASSERTION 更新: 2026-05-05 GitHubで見る →

概要

LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。

PDF、DOCX、PPTX、XLSX、CSVといった様々な形式のドキュメントを解析し、AIが利用しやすいチャンクデータに変換します。

RAGパイプライン向けに設計され、トークン、見出し、テーブルを考慮したハイブリッドチャンキングや、セマンティックチャンキングが可能です。

人間参加型レビュー(HITL)による品質管理やPII匿名化機能、OpenAIやGeminiを含む複数のLLMプロバイダーへの対応、さらには3層メモリチャットやプロダクション対応のFastAPIサーバーを備えています。

データが外部インフラに出ることなく、全ての処理がローカルで完結するため、機密性の高いドキュメントを安全にAI活用したい開発者や企業に最適なソリューションです。

互換性・特徴

  • Python
  • Web API
  • GPU対応
  • LangChain
  • RAG
  • Gemini対応

基本情報

ライセンスNOASSERTION
Stars29
Forks2
カテゴリLLM
アクティビティlow

最新リリース: v0.1.5 (2026-05-05)

GitHub: https://github.com/ENDEVSOLS/LongParser