概要
このプロジェクト「ReceiptIQ」は、レシート画像から支出情報を自動で構造化し、自然言語で質問できるAIツールです。
PaliGemma 3Bをファインチューニングしてレシートから品目、小計、税金、合計などのデータをJSON形式で抽出し、LLaMA 3.3が抽出されたデータに基づいて質問に答えます。
これにより、ユーザーは長大なレシートを読み込むことなく、「飲み物代はいくら?」や「税金は?」といった疑問を瞬時に解決できます。
Streamlitを用いたWeb UIで手軽に利用でき、レシートの情報を効率的に管理したい個人や企業に最適です。
互換性・特徴
- Python
- Web UI
- LLM活用
- 画像処理
- API利用
- GPU利用
基本情報
| Stars | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
