Leva-TTS

概要

Leva-TTSは、リアルタイム会話エージェント向けに最適化された、プロダクション志向のレバント・アラビア語と英語のコードスイッチングText-to-Speech (TTS) パイプラインです。

Fine-tuned XTTS-v2をベースにしており、レバント・アラビア語の方言と英語間で自然な文内コードスイッチングを低遅延かつ低VRAMで実現します。

ストリーミング出力に対応し、FastAPIサーバーを介したWebSocketストリーミングも可能です。

10種類の話者（男女5名ずつ）をサポートし、スマートなテキスト処理機能も備えています。

リアルタイム音声エージェントや会話型AIシステムの開発者が主な想定ユーザーです。

GitHub: https://github.com/MohammedAly22/Leva-TTS