1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

MagikaDocumentFromPixel

★ 2 MIT 更新: 2026-04-27 GitHubで見る →

概要

このツールは、Magikaに触発された軽量な画像品質ゲートで、画像を「シャープ」、「ぼやけ」、「不確実」のいずれかにミリ秒単位でCPU上で分類します。

OCR、文書理解、顔認識、大規模マルチモーダルモデルなどの高コストな下流のビジョンモデルが、使用不可能な入力で無駄な計算を行うのを防ぐことを目的としています。

この検出器は、キャリブレーションされた確信度を提供し、人間によるアノテーションなしで訓練可能で、モバイル/エッジでの即時フィードバックや大規模データセットの品質管理にも適しています。

互換性・特徴

  • CPU対応
  • Python
  • 画像処理
  • AI/機械学習
  • CLI

基本情報

ライセンスMIT
Stars2
カテゴリマルチモーダル
アクティビティlow

GitHub: https://github.com/bradduy/MagikaDocumentFromPixel