概要
mlx-speechは、Apple Silicon Mac(M1以降)向けに特化した、純粋なMLXベースの音声技術ツールキットです。
クラウドやPyTorchに依存せず、デバイス上で高性能な音声合成(TTS)、音声クローン、対話生成、効果音生成、多言語自動音声認識(ASR)をローカルで実行します。
Fish S2 Pro、VibeVoice、LongCat、OpenMOSS、Step-Audio、Cohere ASRといった多様なモデルに対応し、感情タグ付きの音声クローンや音声編集などの高度な機能を提供します。
Python APIとCLIの両方で簡単に利用でき、AI開発者、研究者、コンテンツクリエイターなど、Apple Silicon環境でセキュアかつ高速な音声処理を求めるユーザーに最適です。
互換性・特徴
- Apple Silicon
- Python
- CLI
- Python API
- MLX
- GPU必須
基本情報
| ライセンス | MIT |
| Stars | 16 |
| Forks | 2 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
最新のissue
- Fish Audio S2 Proは、前処理済みreference_audioの受け渡しをサポートしますか? (更新: 2026-05-06 / Does using Fish Audio S2 Pro support passing preprocessed reference_audio?)
- 設定ファイルが見つからず、操作に支障が出ています。 (更新: 2026-04-16 / Config file not found)