DeepNumberVision

概要

DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。

ユーザーが描画またはアップロードした複数桁の数字文字列を認識することを目的としています。

MNIST手書きベンチマークで99.2%以上の高い精度を達成しており、OpenCVによる個々の桁の分離、カスタムのデュアルブロック畳み込みニューラルネットワーク、コントラスト反転処理やガウスストロークスムージングなどのスマートな前処理機能を特徴としています。

Gradioを使用したクリーンなドラッグアンドドロップのウェブインターフェースも提供されており、深層学習ベースの数字認識技術を試したい開発者、研究者、または手軽に体験したい一般ユーザーに適しています。

GitHub: https://github.com/sinidiem/DeepNumberVision