概要
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。
44.1kHzステレオ音源からボーカル成分を抽出し、差分計算でインスト版も作れます。
元のKim Vocal 2チェックポイントを忠実に移植しており、PyTorch版との高い出力一致も検証済みです。
`mlx-audio` を使うPython利用者や、SwiftからMLXモデルを扱いたい開発者、Mac上で音源分離を実装したいユーザー向けです。
互換性・特徴
- MLX
- Apple Silicon
- Python
- Swift
- 音源分離
- CLI
基本情報
| ライセンス | mit |
| Likes | 5 |
| Downloads | 168 |
| Pipeline | audio-to-audio |
| カテゴリ | 音楽・音声生成 |
| アクティビティ | low |
HuggingFace: https://huggingface.co/mlx-community/mel-roformer-kim-vocal-2-mlx