3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

PaddleSpeech

★ 12.6k ⑂ 1,957 Apache-2.0 更新: 2026-06-21 GitHubで見る →

#CLI #Hugging Face Spaces対応 #Linux #macOS #Python #Windows

概要

PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。

自己教師あり学習モデル、句読点付きSOTA/ストリーミングASR、テキストフロントエンド付きストリーミングTTS、話者照合、エンドツーエンド音声翻訳、キーワードスポッティングなど、最先端のモデルを提供します。

2022年にはNAACLでベストデモアワードを受賞しており、音声認識、音声合成、音声翻訳といった多様な音声AIタスクに取り組む開発者や研究者に最適な、使いやすいソリューションです。

互換性・特徴

Python
CLI
Linux
Windows
macOS
Hugging Face Spaces対応

基本情報

ライセンス	Apache-2.0
Stars	12,635
Forks	1,957
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

[TTS] バグレポート: PaddleSpeech 1.5.0 TTS CPUでpaddlepaddle 2.6.2にてセグメンテーション違反が発生 (更新: 2026-06-15 / [TTS]Bug Report: PaddleSpeech 1.5.0 TTS CPU segfault on paddlepaddle 2.6.2)
議論：FunASR/SenseVoice と PaddleSpeech の連携可能性 (更新: 2026-05-31 / 讨论：FunASR/SenseVoice 与 PaddleSpeech 的协作可能性)
天数 BI-150S 環境で opencc-python-reimplemented のバージョンをダウングレードする必要がある (更新: 2026-04-17 / 天数 BI-150S 环境中需要降级 opencc-python-reimplemented 版本)

最新リリース: PaddleSpeech r1.5.0 (2025-03-05)

GitHub: https://github.com/PaddlePaddle/PaddleSpeech

← 全リポジトリ一覧へ