paddleocr-pdf-api

概要

このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。

PaddleOCRとPaddleOCR-VLモデルを搭載しており、GPUを利用してDockerコンテナ内で動作します。

スキャンされたPDFドキュメントをページごとに処理し、JSON形式でMarkdownコンテンツを返します。

約8.5GBのVRAMを搭載したNVIDIA GPUが必須であり、Latvian語やLithuanian語に良好な（完璧ではない）対応をしています。

大規模なドキュメントのOCR処理を自動化したい開発者や企業ユーザーに適しています。

最新リリース: v0.3.0 (2026-05-29)

GitHub: https://github.com/Edgaras0x4E/paddleocr-pdf-api