概要
mlx-swift-dots-ttsは、rednote-hilabのdots.tts-soarモデルをAppleシリコン向けにMLXフレームワークへ移植したもので、連続自己回帰型TTSシステムです。
流動マッチング合成と音声クローン機能を持ち、Qwen2 ARバックボーン、流動マッチングDiT、BigVGAN/AudioVAEボコーダー、CAM++ x-ベクトル話者条件付けといった全パイプラインをPythonデーモンなしで実行できます。
主な特徴は、Appleシリコン上での高速な動作(特にM5 MaxでPyTorch-MPSよりも高速)、int4/int8量子化によるメモリ削減と処理速度向上です。
低遅延、低メモリでのゼロショット音声クローンを求める開発者や研究者が主なターゲットユーザーです。
互換性・特徴
- Apple Silicon
- MLX
- Swift
- TTS
- 音声クローン
- CLI
基本情報
| ライセンス | Apache-2.0 |
| Stars | 3 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
