1,334 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

MockingBird

★ 36.9k ⑂ 5,217 NOASSERTION 更新: 2026-03-03 GitHubで見る →

概要

Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニングツールです。

特に中国語(マンダリン)に対応し、複数のデータセットで検証済み。

PyTorchフレームワークを基盤としており、Windows、Linux、さらにはM1 macOS環境でも動作します。

既存のエンコーダーとボコーダーを再利用しつつ、新しくトレーニングしたシンセサイザーのみで簡単に高品質な音声生成を可能にします。

リモート呼び出しに対応したWebサーバー機能も備えており、音声合成技術に関心のある開発者、研究者、特に中国語コンテンツのクリエイターに適しています。

互換性・特徴

  • Python
  • PyTorch
  • GPU必須
  • Web UI
  • マルチプラットフォーム
  • 中国語対応

基本情報

ライセンスNOASSERTION
Stars36,903
Forks5,217
カテゴリTTS / 音声
アクティビティmid

最新のissue

最新リリース: A previous version checkpoint (2021-11-07)

GitHub: https://github.com/babysor/MockingBird