概要
このツールは、ノイズの多い合成レシート画像、グラウンドトゥルースJSON、ローカルのLM Studioベースライン結果を含む、コンパクトな日本語レシートOCR/VLMミニベンチマークです。
OCRモデルがテキストを読み取るだけでなく、店舗名、住所、日付、時間、支払い、税金、合計などのレシートレベルのフィールド、および商品名、数量、単価、行合計などの項目レベルのフィールドを構造化された形式で回復できるかを評価します。
プリントの退色、局所的なぼかし、バンディング、影、回転、JPEG圧縮などのノイズの多いカメラのような入力を特徴とします。
小さく、検証可能で、ローカルで簡単に実行できるため、大規模な評価に時間や費用を費やす前に、OCR/VLMのモデルのクイックなスモークテストに役立ちます。
想定ユーザーは、日本語レシートのOCR/VLMモデルの性能を効率的に評価したい開発者や研究者です。
互換性・特徴
- 日本語対応
- OCRベンチマーク
- VLMベンチマーク
- LM Studio
- CLI
- データセット
基本情報
| ライセンス | NOASSERTION |
| Stars | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新リリース: Japan OCR Mini Benchmark v0.2.0 (2026-06-14)
GitHub: https://github.com/K10124/japan-ocr-mini-benchmark-public
