3,358 repos GH 3,243 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

MOSS-TTS

★ 3.2k ⑂ 285 Apache-2.0 更新: 2026-06-04 GitHubで見る →

概要

MOSS-TTS Familyは、MOSI.AIとOpenMOSSチームが開発したオープンソースの音声およびサウンド生成モデル群です。

高忠実度と高表現力を特長とし、安定した長尺スピーチ、複数話者ダイアログ、音声/キャラクターデザイン、環境音エフェクト、リアルタイムストリーミングTTSといった複雑な現実世界シナリオに対応します。

最新のMOSS-SoundEffect-v2.0では48kHzのバイリンガルサウンドエフェクト生成が可能になり、MOSS-TTS-v1.5では多言語合成と音声クローン機能が強化されています。

また、軽量なMOSS-TTS-Nanoモデルは4CPUコアでストリーミング出力に対応。

API、Web UI、Hugging Faceモデルとして提供されており、高品質な音声・サウンドコンテンツを必要とする開発者、クリエイター、研究者など幅広いユーザーを想定しています。

互換性・特徴

  • Python
  • オープンソース
  • API
  • Web UI
  • 多言語対応
  • 音声生成

基本情報

ライセンスApache-2.0
Stars3,247
Forks285
カテゴリ音声生成 / TTS
アクティビティhigh

最新のissue

GitHub: https://github.com/OpenMOSS/MOSS-TTS