3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

PaddleOCR

★ 83.2k ⑂ 10,830 Apache-2.0 更新: 2026-06-16 GitHubで見る →

概要

PaddleOCRは、PDFや画像ドキュメントを構造化されたデータ(JSON/Markdown)に変換し、大規模言語モデル(LLM)で活用できるようにする最先端のOCRツールキットおよびドキュメントAIエンジンです。

100以上の言語に対応し、軽量でありながら高機能な点が特徴です。

画像やPDFから効率的に情報を抽出し、AIアプリケーションに統合したい開発者や企業向けに設計されています。

互換性・特徴

  • Python
  • 日本語対応
  • GPU対応
  • CPU対応
  • マルチプラットフォーム
  • CLI

基本情報

ライセンスApache-2.0
Stars83,174
Forks10,830
カテゴリLLM
アクティビティhigh

最新のissue

最新リリース: v3.7.0 (2026-06-11)

GitHub: https://github.com/PaddlePaddle/PaddleOCR