概要
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。
DINOv3のビジョンエンコーダとLLM2Vecのテキストエンコーダ(Llama-3-8Bベース)をフリーズした状態で、それぞれのプロジェクションヘッドのみを訓練することで、効率的かつ高性能なモデルを構築しています。
これにより、大規模言語モデルの強力なセマンティック理解能力を衛星画像分析に応用し、特にゼロショット分類のようなタスクにおいて優れた性能を発揮します。
本ツールは、衛星画像の研究者や開発者、特に機械学習におけるビジョンと言語の融合や、少ないリソースで高精度なモデルを構築したいユーザーに適しています。
互換性・特徴
- Python
- CLI
- GPU必須
- LLM
- Hugging Face
- 研究プロジェクト
基本情報
| Stars | 16 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新のissue
- Hugging FaceでSATtxtをリリース (更新: 2026-03-01 / Release SATtxt on Hugging Face)
GitHub: https://github.com/ikhado/sattxt