3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Falcon-OCR

★ 119 apache-2.0 更新: 2026-05-13 HFで見る →

概要

Falcon OCRは、3億パラメータを持つ早期結合型ビジョン・言語モデルで、文書のOCR(光学文字認識)に特化しています。

画像を入力として受け取り、要求に応じてプレーンテキスト、数式を表現するLaTeX、または表を表現するHTML形式で情報を抽出できます。

従来のOCRシステムが複数のモジュールを組み合わせるのに対し、Falcon OCRは単一のTransformerで画像パッチとテキストトークンを処理するため、インターフェースがシンプルで、既存のOCR VLMと比較して低レイテンシーで高いスループットを実現します。

主にPythonでの利用が想定されており、開発者や研究者が低コストかつ高速で高精度な文書解析を行うのに適しています。

互換性・特徴

  • Python
  • Hugging Face Transformers
  • 画像処理
  • OCR
  • GPU必須
  • CLI

基本情報

ライセンスapache-2.0
Likes119
Downloads5,569
Pipelineimage-to-text
カテゴリマルチモーダル
アクティビティmid

HuggingFace: https://huggingface.co/tiiuae/Falcon-OCR