概要
AI World Cupは、FIFAワールドカップ2026の試合予測における無料の大規模言語モデル(LLM)の性能を比較するための、公開された再現可能なベンチマークツールです。
このツールは、標準化されたプロンプトとサッカーデータを用いて複数のLLMからの予測を手動で収集し、自動採点とリーダーボード、予測の詳細をGitHub Pagesで公開するウェブサイトを通じて提供します。
有料LLMのAPIは使用せず、公平かつ透明性の高い比較を可能にし、開発者、研究者、AI愛好家がLLMの予測能力、特に不確実性の高いスポーツ予測における振る舞いを評価するのに役立ちます。
互換性・特徴
- Python
- Web UI
- CLI
- GitHub Pages
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | LLM |
| アクティビティ | low |
