概要
PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。
自己教師あり学習モデル、句読点付きSOTA/ストリーミングASR、テキストフロントエンド付きストリーミングTTS、話者照合、エンドツーエンド音声翻訳、キーワードスポッティングなど、最先端のモデルを提供します。
2022年にはNAACLでベストデモアワードを受賞しており、音声認識、音声合成、音声翻訳といった多様な音声AIタスクに取り組む開発者や研究者に最適な、使いやすいソリューションです。
互換性・特徴
- Python
- CLI
- Linux
- Windows
- macOS
- Hugging Face Spaces対応
基本情報
| ライセンス | Apache-2.0 |
| Stars | 12,597 |
| Forks | 1,954 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- 天数 BI-150S 環境で opencc-python-reimplemented のバージョンをダウングレードする必要がある (更新: 2026-04-17 / 天数 BI-150S 环境中需要降级 opencc-python-reimplemented 版本)
最新リリース: PaddleSpeech r1.5.0 (2025-03-05)
