概要
Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OCRモデルです。
テキスト検出、文字認識、レイアウト・読順解析の3要素を統合し、英語専用版と日本語を含む多言語版を用意しています。
RAG、検索基盤、エージェント型アプリ、業務文書処理を作る開発者や企業向けで、構造化OCR結果を返せる点が特徴です。
互換性・特徴
- GPU必須
- NVIDIA GPU対応
- Linux
- Python
- OCR
- 多言語対応
基本情報
| ライセンス | other |
| Likes | 176 |
| Downloads | 2,485 |
| Pipeline | image-to-text |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/nvidia/nemotron-ocr-v2