概要
QuantClawはOpenClaw向けのプラグアンドプレイ型タスクルーティング量子化プラグインです。
このツールは、着信する各リクエストを自動的に分類し、最適な精度層(4bit、8bit、16bit)にマッピングして適切なモデルにルーティングします。
ユーザーが手動で精度を選択することなく、品質、レイテンシ、コストのバランスを最適化できるのが特徴です。
特に、LLMの推論性能を向上させたい開発者や運用者にとって有用です。
互換性・特徴
- OpenClaw対応
- LLM
- 量子化
- ルーティング
- Python
- プラグイン
基本情報
| ライセンス | MIT |
| Stars | 114 |
| Forks | 1 |
| カテゴリ | AIエージェント |
| アクティビティ | mid |
