概要
DAYAは、イラスト豊富なドキュメント(プレゼンテーション資料など)に特化した、ドキュメント認識型ハイブリッドアーキテクチャRAG(Retrieval-Augmented Generation)パイプラインです。
従来のフレームワークがテキストとビジュアル情報の統合で抱えていた課題を解決するため、Doclingの高度なレイアウト解析とPageIndex着想の階層ツリー構造を組み合わせ、ドキュメントのあらゆる要素(テキスト、テーブル、チャート、画像)を構造的・視覚的に完全に把握します。
Llama 4 Scout (VLM)による図の記述、Jina AIの埋め込み、ChromaDBでの保存、Groq LLMによる検索・推論を通じて、ページレベルの精度で質問に回答します。
これにより、視覚情報を含む複雑なドキュメントから高精度な情報を求める研究者や開発者に最適です。
互換性・特徴
- Python
- Docling
- VLM
- ChromaDB
- Jina AI
- Groq
基本情報
| ライセンス | Apache-2.0 |
| Stars | 2 |
| カテゴリ | LLM |
| アクティビティ | low |