概要
SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル(アラビア語と英語)テキスト音声変換モデルです。
150Mパラメータの効率的な設計とF5-TTS拡散アーキテクチャを基盤とし、高音質な音声合成、瞬時音声クローン、超低遅延を実現します。
特に、アラビア語の正確な発音を保証するタシュキール完全対応や、NeMoを用いたテキスト正規化が特徴です。
Apache 2.0ライセンスで商用利用も可能であり、研究者や高品質なアラビア語・英語音声合成を求める開発者、リアルタイムアプリケーションへの組み込みを検討しているユーザーに最適です。
互換性・特徴
- Python
- CLI
- Web UI
- GPU必須
- アラビア語対応
- 英語対応
基本情報
| ライセンス | MIT |
| Stars | 22 |
| Forks | 3 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
