概要
本ツールは、NVIDIA L40SなどのシングルGPU環境で再現可能なLLM推論ベンチマーク実験を行うための最小限の足場を提供します。
OpenAI互換サーバーを対象に、リクエストの詳細なログ記録、レイテンシ、スループット、エラー、環境メタデータの要約を通じて、ベンチマーク結果の信頼性と再現性を高めます。
ローカル環境の確認を行う実務者、監査可能な結果を求める研究者、変更を比較するメンテナー、ベンチマークの再現性を確認したい読者など、幅広いユーザーを想定しています。
互換性・特徴
- LLMベンチマーク
- OpenAI互換API
- GPU必須
- Python
- CLI
- 再現性重視
基本情報
| ライセンス | MIT |
| Stars | 1 |
| Forks | 1 |
| カテゴリ | LLM |
| アクティビティ | low |
最新のissue
- 早期テスター募集: 10分間のfake-serverスモークテスト (更新: 2026-06-04 / Call for early testers: 10-minute fake-server smoke run)
- ハードウェア要件: 初のL40S/vLLM実証バンドル (更新: 2026-06-02 / Hardware needed: first real L40S/vLLM evidence bundle)
最新リリース: v0.1.5 – maintainer proof packs and community entry hardening (2026-06-10)
GitHub: https://github.com/lijiaweiphilip-web/l40s-llm-bench
