概要
Ninja Harnessは、AIエージェントのプロダクション環境での信頼性、安全性、効率性を評価するための、トレースを重視した評価ハーネスです。
エージェントの最終回答だけでなく、ツール呼び出し、ハンドオフ、ガードレール、回復などの実行経路全体を詳細に分析します。
開発者向けに、エージェントが実運用に耐えうるかを検証し、認定グレードを付与します。
Python 3.11以上に対応し、CLIまたはWebベースのプレイグラウンドで利用可能です。
互換性・特徴
- Python
- CLI
- Web UI
- Pyodide
- エージェント評価
基本情報
| ライセンス | NOASSERTION |
| Stars | 1 |
| カテゴリ | AIエージェント |
| アクティビティ | low |
最新のissue
- 🚀 こちらから始めましょう — Ninja Harnessへようこそ (更新: 2026-05-21 / 🚀 Start here — welcome to Ninja Harness)
最新リリース: v0.8.0 (2026-05-22)