概要
macos-speech-serverは、macOS上で動作するローカルな音声認識(STT)および音声合成(TTS)サーバーです。
OpenAI互換のHTTP APIとHome AssistantのWyomingプロトコルをサポートしており、プライベートかつ高速な処理を実現します。
Apple SiliconのNeural EngineをFluidAudio経由で活用するため、クラウドサービスへのデータ送信やAPIキーは不要で、すべての処理がデバイス内で完結します。
一度モデルをダウンロードすれば、起動時に読み込まれ、同一ネットワーク内の他のデバイスからも利用可能です。
これにより、家庭内の音声処理を1台のMacでまかなうことができます。
開発者、Home Assistantユーザー、プライバシーを重視するmacOSユーザーに最適です。
互換性・特徴
- macOS対応
- OpenAI互換API
- Home Assistant対応
- STT
- TTS
- Apple Neural Engine
基本情報
| ライセンス | AGPL-3.0 |
| Stars | 28 |
| Forks | 12 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
最新のissue
- Wyoming: TTS音声が実際のロケールではなく言語「en」を報告する (更新: 2026-05-18 / Wyoming: all TTS voices report language "en" instead of actual locale)
- ビルドできません (更新: 2026-04-29 / Unable to build)
- Qwen3 TTSエンジンのサポート (更新: 2026-03-13 / Support Qwen3 TTS engine)