655 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

DAYA

★ 2 Apache-2.0 更新: 2026-05-13 GitHubで見る →

概要

DAYAは、イラスト豊富なドキュメント(プレゼンテーション資料など)に特化した、ドキュメント認識型ハイブリッドアーキテクチャRAG(Retrieval-Augmented Generation)パイプラインです。

従来のフレームワークがテキストとビジュアル情報の統合で抱えていた課題を解決するため、Doclingの高度なレイアウト解析とPageIndex着想の階層ツリー構造を組み合わせ、ドキュメントのあらゆる要素(テキスト、テーブル、チャート、画像)を構造的・視覚的に完全に把握します。

Llama 4 Scout (VLM)による図の記述、Jina AIの埋め込み、ChromaDBでの保存、Groq LLMによる検索・推論を通じて、ページレベルの精度で質問に回答します。

これにより、視覚情報を含む複雑なドキュメントから高精度な情報を求める研究者や開発者に最適です。

互換性・特徴

  • Python
  • Docling
  • VLM
  • ChromaDB
  • Jina AI
  • Groq

基本情報

ライセンスApache-2.0
Stars2
カテゴリLLM
アクティビティlow

GitHub: https://github.com/RoneyBABA/DAYA