概要
GPIC(Giant Permissive Image Corpus)は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。
約28兆ピクセル、1億以上の訓練画像、20万の検証画像、100万のテスト画像から成り、最先端の視覚言語モデルによってキャプション付けされています。
全ての画像は研究および商用利用が許可されており、安全フィルタリングと重複排除が施され、Hugging Faceで提供されています。
生成モデリングのベンチマークプロトコルと参照ベースラインも提供されており、大規模な視覚生成モデリングに関するオープンでアクセスしやすい再現可能な研究を支援することを目的としています。
研究者や開発者が大規模な画像データセットを必要とする場合に最適です。
互換性・特徴
- Python
- GPU必須
- Hugging Face
- データセット
- 機械学習
- 画像生成
基本情報
| ライセンス | MIT |
| Stars | 44 |
| Forks | 1 |
| カテゴリ | 画像生成 |
| アクティビティ | low |
最新のissue
- 特定のデータサブセットでトレーニングされたモデルの公開 (更新: 2026-06-04 / Release models trained on subsets)
- CFG を含まない Table 3 の結果をリリースする (更新: 2026-06-01 / Release the results for Table 3 but without CFG)
GitHub: https://github.com/keshik6/gpic
