3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

spark-evals

★ 33 ⑂ 1 更新: 2026-06-12 GitHubで見る →

概要

このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマーク結果を公開しています。

複数のベンチマーク項目(bfcl、bigcodebench、IfEvalCode、The Agent Co)における各モデルのパフォーマンスを「Overall」スコアとして集計し、リーダーボード形式で分かりやすく提示しています。

特に、FP8やNVFP4といった異なる量子化形式でのモデル性能比較が含まれており、モデルの選択や最適化を検討している開発者、研究者、AIエンジニアを想定ユーザーとしています。

互換性・特徴

  • GPU必須
  • ベンチマーク
  • 言語モデル
  • 量子化モデル
  • AI/機械学習
  • Python

基本情報

Stars33
Forks1
カテゴリLLM
アクティビティlow

GitHub: https://github.com/DanTup/spark-evals