269 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

nemotron-ocr-v2

★ 176 other 更新: 2026-04-28 HFで見る →

概要

Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OCRモデルです。

テキスト検出、文字認識、レイアウト・読順解析の3要素を統合し、英語専用版と日本語を含む多言語版を用意しています。

RAG、検索基盤、エージェント型アプリ、業務文書処理を作る開発者や企業向けで、構造化OCR結果を返せる点が特徴です。

互換性・特徴

  • GPU必須
  • NVIDIA GPU対応
  • Linux
  • Python
  • OCR
  • 多言語対応

基本情報

ライセンスother
Likes176
Downloads2,485
Pipelineimage-to-text
カテゴリマルチモーダル
アクティビティmid

HuggingFace: https://huggingface.co/nvidia/nemotron-ocr-v2