概要
Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニングツールです。
特に中国語(マンダリン)に対応し、複数のデータセットで検証済み。
PyTorchフレームワークを基盤としており、Windows、Linux、さらにはM1 macOS環境でも動作します。
既存のエンコーダーとボコーダーを再利用しつつ、新しくトレーニングしたシンセサイザーのみで簡単に高品質な音声生成を可能にします。
リモート呼び出しに対応したWebサーバー機能も備えており、音声合成技術に関心のある開発者、研究者、特に中国語コンテンツのクリエイターに適しています。
互換性・特徴
- Python
- PyTorch
- GPU必須
- Web UI
- マルチプラットフォーム
- 中国語対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 36,903 |
| Forks | 5,217 |
| カテゴリ | TTS / 音声 |
| アクティビティ | mid |
最新のissue
- We‘re HIRING! (更新: 2026-03-02)
- matplotlib.cm.get_cmapとの互換性問題 (Matplotlib 3.9.0と非互換の可能性) (更新: 2026-02-15 / Potential compatibility issues with matplotlib.cm.get_cmap (Incompatible with Matplotlib 3.9.0))
- data/ckpt/synthesizerディレクトリが存在しないのはなぜですか? (更新: 2026-01-20 / 为什么没有 data/ckpt/synthesizer 这个目录?)
- ParsingModel[Input]の検証エラー: root -> 语音解码模型 noneは許可されない値です (更新: 2025-09-16 / 1 validation error for ParsingModel[Input] root -> 语音解码模型 none is not an allowed value (type=type_error.none.not_allowed))
- VCTKの学習方法 (更新: 2025-05-11 / VCTK如何训练)
最新リリース: A previous version checkpoint (2021-11-07)
