3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

docker-docling

★ 4 NOASSERTION 更新: 2026-06-15 GitHubで見る →

概要

このツールは、IBM Doclingを基盤としたセルフホスト型のドキュメント解析サーバーをDockerで簡単にデプロイするためのものです。

PDF、DOCX、PPTX、XLSX、HTML、Markdown、LaTeXなど多様な形式のドキュメントを高精度に解析し、構造化されたMarkdown、JSON、HTML形式で出力するAPIを提供します。

特徴としては、高精度なレイアウト解析、OCR、テーブル構造認識、RAG(検索拡張生成)アプリケーション向けのチャンキング機能、NVIDIA GPU (CUDA) による高速化が挙げられます。

データはユーザーのサーバー内で処理され、外部に送信されることがないため、高いプライバシーを保てます。

自社環境でドキュメント解析サービスを構築したい開発者や企業、RAGシステムにドキュメント解析機能を組み込みたいユーザーに最適です。

互換性・特徴

  • Docker
  • セルフホスト
  • ドキュメント解析
  • OCR
  • RAG
  • GPU対応

基本情報

ライセンスNOASSERTION
Stars4
カテゴリLLM
アクティビティlow

GitHub: https://github.com/hwdsl2/docker-docling