概要
EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ(TTS)エンジンです。
英語と中国語に対応し、2000種類以上の豊富な音声で、喜び、興奮、悲しみ、怒りなど多様な感情表現を伴う音声合成が可能です。
直感的なWebインターフェースやバッチ生成用のスクリプトインターフェースに加え、HTTP APIやMac用アプリケーションも提供されており、個人データの音声クローン機能も備えています。
想定ユーザーは、感情豊かな音声コンテンツを生成したい開発者やクリエイター、多言語対応のTTSエンジンを探している企業など多岐にわたります。
Nvidia GPUを用いたDockerでの実行が推奨されています。
互換性・特徴
- TTS
- オープンソース
- 感情合成
- Web UI
- API
- Docker対応
- GPU必須
- Macアプリ
基本情報
| ライセンス | Apache-2.0 |
| Stars | 8,474 |
| Forks | 755 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- トレーニングデータのラベル付けと音声認識のために、FunASRの統合を推奨します。 (更新: 2026-05-31 / 建议集成 FunASR 用于训练数据标注和语音识别)
- Hhh (更新: 2026-05-17)
- Nnn (更新: 2026-05-17)
