概要
このリポジトリは、オープンソースのText-to-Speech(TTS)、音声クローン、音楽生成モデルを厳選してまとめたリストです。
最新リリース日順にソートされており、各モデルの主要な特徴(音声クローニングの有無、ASR対応、対応言語、ストリーミング機能、ライセンスなど)を比較表で提供しています。
これにより、開発者、研究者、コンテンツクリエイターが、自身のプロジェクトに最適な音声技術や音楽生成モデルを効率的に見つけることができます。
多言語対応モデルやCPUで動作する軽量モデルなど、多様な利用シナリオに対応する情報が網羅されています。
互換性・特徴
- オープンソース
- Python
- 日本語対応
- リアルタイム対応
- CPU対応
基本情報
| ライセンス | MIT |
| Stars | 259 |
| Forks | 39 |
| カテゴリ | 音楽・音声生成 |
| アクティビティ | mid |
