概要
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。
ユーザーが描画またはアップロードした複数桁の数字文字列を認識することを目的としています。
MNIST手書きベンチマークで99.2%以上の高い精度を達成しており、OpenCVによる個々の桁の分離、カスタムのデュアルブロック畳み込みニューラルネットワーク、コントラスト反転処理やガウスストロークスムージングなどのスマートな前処理機能を特徴としています。
Gradioを使用したクリーンなドラッグアンドドロップのウェブインターフェースも提供されており、深層学習ベースの数字認識技術を試したい開発者、研究者、または手軽に体験したい一般ユーザーに適しています。
互換性・特徴
- PyTorch
- OpenCV
- Python
- Web UI
- CLI
- GPU必須
基本情報
| Stars | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
