概要
Leva-TTSは、リアルタイム会話エージェント向けに最適化された、プロダクション志向のレバント・アラビア語と英語のコードスイッチングText-to-Speech (TTS) パイプラインです。
Fine-tuned XTTS-v2をベースにしており、レバント・アラビア語の方言と英語間で自然な文内コードスイッチングを低遅延かつ低VRAMで実現します。
ストリーミング出力に対応し、FastAPIサーバーを介したWebSocketストリーミングも可能です。
10種類の話者(男女5名ずつ)をサポートし、スマートなテキスト処理機能も備えています。
リアルタイム音声エージェントや会話型AIシステムの開発者が主な想定ユーザーです。
互換性・特徴
- Python
- GPU必須
- リアルタイム対応
- ストリーミング対応
- Web UI
- CLI
基本情報
| ライセンス | Apache-2.0 |
| Stars | 5 |
| Forks | 1 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
