概要
MLX-Audioは、AppleのMLXフレームワークを基盤とし、Apple Silicon (Mシリーズチップ) に最適化された高速で効率的な音声処理ライブラリです。
Text-to-Speech (TTS)、Speech-to-Text (STT)、Speech-to-Speech (STS) の機能を提供し、多言語対応、音声カスタマイズ、速度調整などが可能です。
対話型WebインターフェースやOpenAI互換のREST APIも備えており、3-bit、4-bit、6-bit、8-bitといった量子化にも対応しています。
また、iOS/macOS向けのSwiftパッケージも提供され、Appleプラットフォームでの音声アプリケーション開発者や、高効率な音声処理を求めるユーザーに最適です。
互換性・特徴
- Apple Silicon対応
- Python
- CLI
- Web UI
- OpenAI互換API
- Swift (iOS/macOS)
基本情報
| ライセンス | MIT |
| Stars | 7,381 |
| Forks | 639 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- すべてのモデルでTTSがクラッシュ (更新: 2026-06-17 / crash on TTS on every model)
最新リリース: v0.4.4 (2026-06-06)
