3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

EmotiVoice

★ 8.5k ⑂ 755 Apache-2.0 更新: 2024-08-13 GitHubで見る →

概要

EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ(TTS)エンジンです。

英語と中国語に対応し、2000種類以上の豊富な音声で、喜び、興奮、悲しみ、怒りなど多様な感情表現を伴う音声合成が可能です。

直感的なWebインターフェースやバッチ生成用のスクリプトインターフェースに加え、HTTP APIやMac用アプリケーションも提供されており、個人データの音声クローン機能も備えています。

想定ユーザーは、感情豊かな音声コンテンツを生成したい開発者やクリエイター、多言語対応のTTSエンジンを探している企業など多岐にわたります。

Nvidia GPUを用いたDockerでの実行が推奨されています。

互換性・特徴

  • TTS
  • オープンソース
  • 感情合成
  • Web UI
  • API
  • Docker対応
  • GPU必須
  • Macアプリ

基本情報

ライセンスApache-2.0
Stars8,474
Forks755
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

GitHub: https://github.com/netease-youdao/EmotiVoice