3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Danbooru-Dataset-Filter

★ 11 ⑂ 1 MIT 更新: 2026-04-14 GitHubで見る →

概要

Danbooru Dataset Filterは、AIトレーニング用データセットのキュレーションと準備を目的とした高性能GUIツールです。

PolarsエンジンとParquetストレージを活用し、数百万の画像を数秒で高速処理できるのが最大の特徴です。

LoRAやCheckpointなどのAIモデルを開発する研究者やトレーナー向けに設計されており、スコア、お気に入り、アスペクト比、SFW/NSFW評価、MD5重複排除などの多様なフィルタリング機能を備えています。

オートコンプリート付きのスマートタグ付けやリアルタイムのデータサイズ推定機能も持ち、視覚的なデータプレビューとモダンなダークテーマUIを通じて、高品質な学習データを効率的に選別・構築するための強力なサポートを提供します。

互換性・特徴

  • GUI
  • Python
  • AIトレーニングデータセット
  • データフィルタリング
  • 高速データ処理
  • Windows対応

基本情報

ライセンスMIT
Stars11
Forks1
カテゴリ画像生成
アクティビティlow

GitHub: https://github.com/ThetaCursed/Danbooru-Dataset-Filter