概要
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPythonライブラリです。
あらゆるAI/MLモデルからREST APIサーバーを簡単に構築でき、Dockerコンテナの自動生成を通じて環境管理とデプロイを簡素化します。
動的バッチ処理やモデル並列処理などの組み込み機能によりCPU/GPUの利用率を最大化し、高いカスタマイズ性で様々なMLフレームワークに対応します。
ローカルでの開発からDockerコンテナやBentoCloudによる本番環境へのデプロイまでをサポートし、AIモデルを効率的かつスケーラブルに提供したい開発者やMLエンジニアに最適なツールです。
互換性・特徴
- Python
- API
- Docker
- GPU対応
- CLI
- Web UI
基本情報
| ライセンス | Apache-2.0 |
| Stars | 8,686 |
| Forks | 978 |
| カテゴリ | マルチモーダル |
| アクティビティ | high |
最新のissue
- bug: request barging on sync @bentoml.api endpoints after traffic.timeout (更新: 2026-06-25)
- Security: 8 pending GHSA advisories awaiting maintainer triage (submitted 2026-05-26) (更新: 2026-06-24)
最新リリース: v1.4.39 (2026-05-07)
