3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

PaddleOCR

★ 83.2k ⑂ 10,830 Apache-2.0 更新: 2026-06-16 GitHubで見る →

#CLI #CPU対応 #GPU対応 #Python #マルチプラットフォーム #日本語対応

概要

PaddleOCRは、PDFや画像ドキュメントを構造化されたデータ（JSON/Markdown）に変換し、大規模言語モデル（LLM）で活用できるようにする最先端のOCRツールキットおよびドキュメントAIエンジンです。

100以上の言語に対応し、軽量でありながら高機能な点が特徴です。

画像やPDFから効率的に情報を抽出し、AIアプリケーションに統合したい開発者や企業向けに設計されています。

互換性・特徴

Python
日本語対応
GPU対応
CPU対応
マルチプラットフォーム
CLI

基本情報

ライセンス	Apache-2.0
Stars	83,174
Forks	10,830
カテゴリ	LLM
アクティビティ	high

最新のissue

【Hackathon 10th】PaddleOCR 全球衍生模型挑战赛 / PaddleOCR Global Derivative Model Challenge (更新: 2026-06-21)
cpp_infer Crashes When Using PP-OCRv6 (更新: 2026-06-19)
HPIとTensorRTは放棄されたのでしょうか？ (更新: 2026-06-19 / 请问是放弃了HPI和TensorRT吗？)
リンクチェッカーレポート (更新: 2026-06-19 / Link Checker Report)

最新リリース: v3.7.0 (2026-06-11)

GitHub: https://github.com/PaddlePaddle/PaddleOCR

← 全リポジトリ一覧へ