3,701 repos GH 3,586 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

japan-ocr-mini-benchmark-public

★ 1 NOASSERTION 更新: 2026-06-16 GitHubで見る →

概要

このツールは、ノイズの多い合成レシート画像、グラウンドトゥルースJSON、ローカルのLM Studioベースライン結果を含む、コンパクトな日本語レシートOCR/VLMミニベンチマークです。

OCRモデルがテキストを読み取るだけでなく、店舗名、住所、日付、時間、支払い、税金、合計などのレシートレベルのフィールド、および商品名、数量、単価、行合計などの項目レベルのフィールドを構造化された形式で回復できるかを評価します。

プリントの退色、局所的なぼかし、バンディング、影、回転、JPEG圧縮などのノイズの多いカメラのような入力を特徴とします。

小さく、検証可能で、ローカルで簡単に実行できるため、大規模な評価に時間や費用を費やす前に、OCR/VLMのモデルのクイックなスモークテストに役立ちます。

想定ユーザーは、日本語レシートのOCR/VLMモデルの性能を効率的に評価したい開発者や研究者です。

互換性・特徴

  • 日本語対応
  • OCRベンチマーク
  • VLMベンチマーク
  • LM Studio
  • CLI
  • データセット

基本情報

ライセンスNOASSERTION
Stars1
カテゴリマルチモーダル
アクティビティlow

最新リリース: Japan OCR Mini Benchmark v0.2.0 (2026-06-14)

GitHub: https://github.com/K10124/japan-ocr-mini-benchmark-public