3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

EmotiVoice

★ 8.5k ⑂ 755 Apache-2.0 更新: 2024-08-13 GitHubで見る →

#API #Docker対応 #GPU必須 #Macアプリ #TTS #Web UI #オープンソース #感情合成

概要

EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ（TTS）エンジンです。

英語と中国語に対応し、2000種類以上の豊富な音声で、喜び、興奮、悲しみ、怒りなど多様な感情表現を伴う音声合成が可能です。

直感的なWebインターフェースやバッチ生成用のスクリプトインターフェースに加え、HTTP APIやMac用アプリケーションも提供されており、個人データの音声クローン機能も備えています。

想定ユーザーは、感情豊かな音声コンテンツを生成したい開発者やクリエイター、多言語対応のTTSエンジンを探している企業など多岐にわたります。

Nvidia GPUを用いたDockerでの実行が推奨されています。

互換性・特徴

TTS
オープンソース
感情合成
Web UI
API
Docker対応
GPU必須
Macアプリ

基本情報

ライセンス	Apache-2.0
Stars	8,474
Forks	755
カテゴリ	音声生成 / TTS
アクティビティ	mid

最新のissue

トレーニングデータのラベル付けと音声認識のために、FunASRの統合を推奨します。 (更新: 2026-05-31 / 建议集成 FunASR 用于训练数据标注和语音识别)
Hhh (更新: 2026-05-17)
Nnn (更新: 2026-05-17)

GitHub: https://github.com/netease-youdao/EmotiVoice

← 全リポジトリ一覧へ