概要
tendernessは、テキストと画像から合成かつ決定的なドキュメントを高速でレンダリングするためのPythonライブラリです。
CairoとPangoを基盤とし、OCRやヒューリスティクスに頼ることなく、テキストや画像の配置、改行、ブロック位置といった正確なレイアウト情報を備えたドキュメント(画像、SVG、PDF、NumPy配列)を直接生成します。
これにより、大規模な合成ドキュメントデータセットの作成、ビジョン言語モデルの構造的教師データの提供、レイアウト理解システムのベンチマーク構築が可能になります。
開発者や研究者が、グラウンドトゥルースのレイアウト情報を持つドキュメントを効率的に生成するのに適しています。
互換性・特徴
- Python
- CLI
- ドキュメント生成
- 画像出力
- PDF出力
- SVG出力
基本情報
| ライセンス | Apache-2.0 |
| Stars | 3 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
