概要
Silero Modelsは、事前学習済みのテキスト読み上げ(TTS)モデルを開発者向けに提供するライブラリです。
このツールは、エンドツーエンドの自然な音声合成を、豊富なボイスライブラリと高速な処理で実現します。
特にロシア語においては、自動的なアクセントとホモグラフ(同形異義語)処理に対応しています。
PyTorch Hubやpipを通じて簡単に利用でき、Python環境でテキストを音声に変換する機能を迅速に導入したい開発者に適しています。
互換性・特徴
- Python
- PyTorch
- TTS
- CPU対応
- GPU対応
- 多言語対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 5,970 |
| Forks | 366 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- 「дорого」という単語が「дорово」と発音される (更新: 2026-06-02 / Word "дорого" pronounced as "дорово")
- 機能リクエスト – ロシア語のテキスト正規化 (更新: 2026-05-30 / Feature request – Russian Text Normalization)
- [ベラルーシ語] マイナーな問題 (更新: 2026-01-04 / [Belarusian] Minor issues)
- 機能リクエスト – 独自の言語の追加 (更新: 2025-11-25 / Feature request – добавление своих языков)
- テキスト読み上げ(TTS)機能のために中国語(汉语)のサポートを追加します (更新: 2025-10-30 / Adding the Chinese language 汉语 for TTS)
最新リリース: SAPI5 for Windows Release (2026-06-04)
