概要
このツールは、IBM Doclingを基盤としたセルフホスト型のドキュメント解析サーバーをDockerで簡単にデプロイするためのものです。
PDF、DOCX、PPTX、XLSX、HTML、Markdown、LaTeXなど多様な形式のドキュメントを高精度に解析し、構造化されたMarkdown、JSON、HTML形式で出力するAPIを提供します。
特徴としては、高精度なレイアウト解析、OCR、テーブル構造認識、RAG(検索拡張生成)アプリケーション向けのチャンキング機能、NVIDIA GPU (CUDA) による高速化が挙げられます。
データはユーザーのサーバー内で処理され、外部に送信されることがないため、高いプライバシーを保てます。
自社環境でドキュメント解析サービスを構築したい開発者や企業、RAGシステムにドキュメント解析機能を組み込みたいユーザーに最適です。
互換性・特徴
- Docker
- セルフホスト
- ドキュメント解析
- OCR
- RAG
- GPU対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 4 |
| カテゴリ | LLM |
| アクティビティ | low |
