概要
LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。
PDF、DOCX、PPTX、XLSX、CSVといった様々な形式のドキュメントを解析し、AIが利用しやすいチャンクデータに変換します。
RAGパイプライン向けに設計され、トークン、見出し、テーブルを考慮したハイブリッドチャンキングや、セマンティックチャンキングが可能です。
人間参加型レビュー(HITL)による品質管理やPII匿名化機能、OpenAIやGeminiを含む複数のLLMプロバイダーへの対応、さらには3層メモリチャットやプロダクション対応のFastAPIサーバーを備えています。
データが外部インフラに出ることなく、全ての処理がローカルで完結するため、機密性の高いドキュメントを安全にAI活用したい開発者や企業に最適なソリューションです。
互換性・特徴
- Python
- Web API
- GPU対応
- LangChain
- RAG
- Gemini対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 29 |
| Forks | 2 |
| カテゴリ | LLM |
| アクティビティ | low |
最新リリース: v0.1.5 (2026-05-05)
