3,358 repos GH 3,243 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

DeepNumberVision

★ 1 更新: 2026-05-30 GitHubで見る →

概要

DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。

ユーザーが描画またはアップロードした複数桁の数字文字列を認識することを目的としています。

MNIST手書きベンチマークで99.2%以上の高い精度を達成しており、OpenCVによる個々の桁の分離、カスタムのデュアルブロック畳み込みニューラルネットワーク、コントラスト反転処理やガウスストロークスムージングなどのスマートな前処理機能を特徴としています。

Gradioを使用したクリーンなドラッグアンドドロップのウェブインターフェースも提供されており、深層学習ベースの数字認識技術を試したい開発者、研究者、または手軽に体験したい一般ユーザーに適しています。

互換性・特徴

  • PyTorch
  • OpenCV
  • Python
  • Web UI
  • CLI
  • GPU必須

基本情報

Stars1
カテゴリマルチモーダル
アクティビティlow

GitHub: https://github.com/sinidiem/DeepNumberVision