概要
TurboOCRは、C++、CUDA、TensorRT技術を活用した高速GPU OCRサーバーです。
FUNSDデータセットで270 img/s、疎な画像では1,200+ img/sという驚異的な処理速度を達成し、PaddleOCR Pythonより50倍高速です。
PP-OCRv5を基盤とし、印刷物と手書き文字の両方に高精度で対応。
PDFのネイティブ処理、高度なレイアウト検出、および正確な読解順序決定機能を備えています。
HTTPとgRPCを介してアクセス可能で、LinuxとNVIDIA GPU環境で動作します。
大量の文書を高速かつ高精度に処理する必要がある企業や、バックエンドシステムに効率的なOCR機能を統合したい開発者に最適なツールです。
互換性・特徴
- GPU必須
- OCR
- サーバー
- Linux対応
- C++
- 高速処理
基本情報
| ライセンス | MIT |
| Stars | 301 |
| Forks | 36 |
| カテゴリ | LLM |
| アクティビティ | mid |
最新のissue
- ?layout=1使用時、デモと比較してレイアウト検出結果が不足または不整合 (更新: 2026-06-12 / Layout Detection Results Missing or Inconsistent Compared to Demo When Using ?layout=1)
- [機能] aarch64サポートの追加 (更新: 2026-06-09 / [Feature] Add aarch64 support)
- 単一インスタンスでの複数言語のサポート (更新: 2026-05-20 / support multiple languages in one instance)
- LaTeX数式出力が未サポートで、論文中の数式処理が不十分です (更新: 2026-05-07 / It appears that LaTeX formula output is not currently supported, resulting in poor handling of formulas in the paper.)
最新リリース: Models — pdf-page-images variant (v2.4.0) (2026-06-11)
