3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

gpic

★ 44 ⑂ 1 MIT 更新: 2026-06-04 GitHubで見る →

#GPU必須 #Hugging Face #Python #データセット #機械学習 #画像生成

概要

GPIC（Giant Permissive Image Corpus）は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。

約28兆ピクセル、1億以上の訓練画像、20万の検証画像、100万のテスト画像から成り、最先端の視覚言語モデルによってキャプション付けされています。

全ての画像は研究および商用利用が許可されており、安全フィルタリングと重複排除が施され、Hugging Faceで提供されています。

生成モデリングのベンチマークプロトコルと参照ベースラインも提供されており、大規模な視覚生成モデリングに関するオープンでアクセスしやすい再現可能な研究を支援することを目的としています。

研究者や開発者が大規模な画像データセットを必要とする場合に最適です。

互換性・特徴

Python
GPU必須
Hugging Face
データセット
機械学習
画像生成

基本情報

ライセンス	MIT
Stars	44
Forks	1
カテゴリ	画像生成
アクティビティ	low

最新のissue

特定のデータサブセットでトレーニングされたモデルの公開 (更新: 2026-06-04 / Release models trained on subsets)
CFG を含まない Table 3 の結果をリリースする (更新: 2026-06-01 / Release the results for Table 3 but without CFG)

GitHub: https://github.com/keshik6/gpic

← 全リポジトリ一覧へ