概要
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。
オブジェクト検出モデルYOLOv11mと大規模ビジョン言語モデルGemma 3 27B-ITを比較し、それぞれの予測性能と計算効率を詳細に分析しています。
Gemma 3は高精度ですが高性能GPUが必要であり、YOLOv11mは高速処理が可能ですが精度に課題があります。
両モデルの長所を活かしたハイブリッド検出アーキテクチャも提案されており、環境監視におけるAI導入の実現可能性を示しています。
AI研究者、都市の環境保全に取り組む行政担当者、またはAIを活用した監視システム開発に関心のある開発者や学生が主な対象ユーザーです。
互換性・特徴
- Python
- CLI
- GPU必須
- AI/ML
- YOLO
- Gemma
基本情報
| Stars | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
GitHub: https://github.com/jaimejrs/residuos_yolov11m_gemma3
