概要
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキットです。
PyTorchをベースにしており、Pythonで利用可能です。
研究者や開発者が、高性能な音声処理システムを効率的に構築・評価できるよう設計されています。
Ubuntu、Windows、macOSといったクロスプラットフォーム環境やDockerでの利用が想定されています。
互換性・特徴
- Python
- PyTorch
- GPU必須
- Docker
- マルチプラットフォーム
基本情報
| ライセンス | Apache-2.0 |
| Stars | 9,863 |
| Forks | 2,409 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新リリース: ESPnet version 202604 – Patch v1 (2026-04-22)
GitHub: https://github.com/espnet/espnet
