概要
「Arena AI Model Elo History」は、主要AIラボ(OpenAI、Anthropic、Googleなど)のフラッグシップAIモデルの公開Eloレーティングを単一の連続的なタイムラインで可視化するツールです。
モデルのアップデート後に発生する「ナーフ」(検閲強化、性能劣化)の傾向を追跡し、一目で確認できるようにすることを目的としています。
データはHugging Faceの公式Arena AI Leaderboard Datasetから毎日自動で取得されます。
想定ユーザーは、AIモデルの性能変化や進化に関心のある研究者、開発者、一般ユーザーです。
互換性・特徴
- Web UI
- Python
- データ分析
- 自動化
- Hugging Face
基本情報
| ライセンス | MIT |
| Stars | 1 |
| カテゴリ | LLM |
| アクティビティ | low |
最新のissue
- 最も影響の大きい「Biggest offenders」の計算方法 (更新: 2026-05-14 / "Biggest offenders" calculation)
