概要
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。
自然言語によるクエリで対象を指定し、そのオブジェクトの数を特定し、インスタンスに結びついた点予測を返します。
このモデルは、一般的なシーンからリモートセンシング、病理組織学、細胞顕微鏡、農業、微生物学といった多岐にわたる分野に対応しており、科学研究者、画像分析の専門家、開発者などが広範囲なビジュアルデータセットでオブジェクトカウントを行う際に役立ちます。
CLOC(Cross-domain Large-scale Object Counting)データセットで訓練されており、高い精度と多ドメインでの汎化性能を誇ります。
Pythonベースで提供され、Hugging Faceでモデルとデモが公開されています。
互換性・特徴
- Python
- CLI
- Hugging Face
- GPU必須
- クロスドメイン対応
- 自然言語処理
基本情報
| ライセンス | Apache-2.0 |
| Stars | 25 |
| Forks | 2 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新のissue
- 特定の分野におけるsota(State-of-the-art)技術情報の欠落について (更新: 2026-06-03 / Missing sota)
- Hugging Face Platform における CLOC(コード行数カウント)データセットのリリースに関する要望 (更新: 2026-06-01 / Release CLOC dataset on Hugging Face)
