1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

PaddleSpeech

★ 12.6k ⑂ 1,954 Apache-2.0 更新: 2026-05-07 GitHubで見る →

概要

PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。

自己教師あり学習モデル、句読点付きSOTA/ストリーミングASR、テキストフロントエンド付きストリーミングTTS、話者照合、エンドツーエンド音声翻訳、キーワードスポッティングなど、最先端のモデルを提供します。

2022年にはNAACLでベストデモアワードを受賞しており、音声認識、音声合成、音声翻訳といった多様な音声AIタスクに取り組む開発者や研究者に最適な、使いやすいソリューションです。

互換性・特徴

  • Python
  • CLI
  • Linux
  • Windows
  • macOS
  • Hugging Face Spaces対応

基本情報

ライセンスApache-2.0
Stars12,597
Forks1,954
カテゴリASR / 音声認識
アクティビティhigh

最新のissue

最新リリース: PaddleSpeech r1.5.0 (2025-03-05)

GitHub: https://github.com/PaddlePaddle/PaddleSpeech