3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

silero-models

★ 6.0k ⑂ 366 NOASSERTION 更新: 2026-06-04 GitHubで見る →

#CPU対応 #GPU対応 #Python #PyTorch #TTS #多言語対応

概要

Silero Modelsは、事前学習済みのテキスト読み上げ（TTS）モデルを開発者向けに提供するライブラリです。

このツールは、エンドツーエンドの自然な音声合成を、豊富なボイスライブラリと高速な処理で実現します。

特にロシア語においては、自動的なアクセントとホモグラフ（同形異義語）処理に対応しています。

PyTorch Hubやpipを通じて簡単に利用でき、Python環境でテキストを音声に変換する機能を迅速に導入したい開発者に適しています。

互換性・特徴

Python
PyTorch
TTS
CPU対応
GPU対応
多言語対応

基本情報

ライセンス	NOASSERTION
Stars	5,970
Forks	366
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

「дорого」という単語が「дорово」と発音される (更新: 2026-06-02 / Word "дорого" pronounced as "дорово")
機能リクエスト – ロシア語のテキスト正規化 (更新: 2026-05-30 / Feature request – Russian Text Normalization)
[ベラルーシ語] マイナーな問題 (更新: 2026-01-04 / [Belarusian] Minor issues)
機能リクエスト – 独自の言語の追加 (更新: 2025-11-25 / Feature request – добавление своих языков)
テキスト読み上げ（TTS）機能のために中国語（汉语）のサポートを追加します (更新: 2025-10-30 / Adding the Chinese language 汉语 for TTS)

最新リリース: SAPI5 for Windows Release (2026-06-04)

GitHub: https://github.com/snakers4/silero-models

← 全リポジトリ一覧へ