1,937 repos GH 1,822 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

dia

★ 19.3k ⑂ 1,683 Apache-2.0 更新: 2025-11-19 GitHubで見る →

概要

Diaは、Nari Labsが開発した1.6Bパラメータのテキスト読み上げ(TTS)モデルです。

このツールは、スクリプトから直接、非常にリアルな対話を生成できることを特徴とし、オーディオ入力に基づいて感情やトーンを制御することも可能です。

また、笑いや咳などの非言語的コミュニケーションも生成できます。

現在は英語のみに対応しており、Hugging Face Transformersを通じて利用できます。

リアルな対話型TTSモデルの研究開発を進めたい研究者や開発者が想定ユーザーで、高品質な音声合成による対話システム構築を目指す方に最適です。

互換性・特徴

  • TTSモデル
  • Hugging Face Transformers対応
  • Python
  • 英語のみ
  • Web UI

基本情報

ライセンスApache-2.0
Stars19,299
Forks1,683
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

GitHub: https://github.com/nari-labs/dia