概要
PaddleOCRは、PDFや画像ドキュメントを構造化されたデータ(JSON/Markdown)に変換し、大規模言語モデル(LLM)で活用できるようにする最先端のOCRツールキットおよびドキュメントAIエンジンです。
100以上の言語に対応し、軽量でありながら高機能な点が特徴です。
画像やPDFから効率的に情報を抽出し、AIアプリケーションに統合したい開発者や企業向けに設計されています。
互換性・特徴
- Python
- 日本語対応
- GPU対応
- CPU対応
- マルチプラットフォーム
- CLI
基本情報
| ライセンス | Apache-2.0 |
| Stars | 83,174 |
| Forks | 10,830 |
| カテゴリ | LLM |
| アクティビティ | high |
最新のissue
- 【Hackathon 10th】PaddleOCR 全球衍生模型挑战赛 / PaddleOCR Global Derivative Model Challenge (更新: 2026-06-21)
- cpp_infer Crashes When Using PP-OCRv6 (更新: 2026-06-19)
- HPIとTensorRTは放棄されたのでしょうか? (更新: 2026-06-19 / 请问是放弃了HPI和TensorRT吗?)
- リンクチェッカーレポート (更新: 2026-06-19 / Link Checker Report)
最新リリース: v3.7.0 (2026-06-11)
