1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

mlx-speech

★ 16 ⑂ 2 MIT 更新: 2026-04-11 GitHubで見る →

概要

mlx-speechは、Apple Silicon Mac(M1以降)向けに特化した、純粋なMLXベースの音声技術ツールキットです。

クラウドやPyTorchに依存せず、デバイス上で高性能な音声合成(TTS)、音声クローン、対話生成、効果音生成、多言語自動音声認識(ASR)をローカルで実行します。

Fish S2 Pro、VibeVoice、LongCat、OpenMOSS、Step-Audio、Cohere ASRといった多様なモデルに対応し、感情タグ付きの音声クローンや音声編集などの高度な機能を提供します。

Python APIとCLIの両方で簡単に利用でき、AI開発者、研究者、コンテンツクリエイターなど、Apple Silicon環境でセキュアかつ高速な音声処理を求めるユーザーに最適です。

互換性・特徴

  • Apple Silicon
  • Python
  • CLI
  • Python API
  • MLX
  • GPU必須

基本情報

ライセンスMIT
Stars16
Forks2
カテゴリTTS / 音声
アクティビティlow

最新のissue

GitHub: https://github.com/appautomaton/mlx-speech