3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

MockingBird

★ 36.9k ⑂ 5,203 NOASSERTION 更新: 2026-03-03 GitHubで見る →

#GPU必須 #Python #PyTorch #Web UI #マルチプラットフォーム #中国語対応

概要

Babysor/MockingBirdは、わずか5秒で声をクローンし、リアルタイムで任意の音声を生成できる最先端の音声クローニングツールです。

特に中国語（マンダリン）に対応し、複数のデータセットで検証済み。

PyTorchフレームワークを基盤としており、Windows、Linux、さらにはM1 macOS環境でも動作します。

既存のエンコーダーとボコーダーを再利用しつつ、新しくトレーニングしたシンセサイザーのみで簡単に高品質な音声生成を可能にします。

リモート呼び出しに対応したWebサーバー機能も備えており、音声合成技術に関心のある開発者、研究者、特に中国語コンテンツのクリエイターに適しています。

互換性・特徴

Python
PyTorch
GPU必須
Web UI
マルチプラットフォーム
中国語対応

基本情報

ライセンス	NOASSERTION
Stars	36,908
Forks	5,203
カテゴリ	音声生成 / TTS
アクティビティ	mid

最新のissue

当社では現在、情熱を持って共に働く新しい才能を募集中です！ (更新: 2026-03-02 / We‘re HIRING!)
matplotlib.cm.get_cmapとの互換性問題 (Matplotlib 3.9.0と非互換の可能性) (更新: 2026-02-15 / Potential compatibility issues with matplotlib.cm.get_cmap (Incompatible with Matplotlib 3.9.0))
data/ckpt/synthesizerディレクトリが存在しないのはなぜですか？ (更新: 2026-01-20 / 为什么没有 data/ckpt/synthesizer 这个目录？)
ParsingModel[Input]の検証エラー: root -> 语音解码模型 noneは許可されない値です (更新: 2025-09-16 / 1 validation error for ParsingModel[Input] root -> 语音解码模型 none is not an allowed value (type=type_error.none.not_allowed))
VCTKの学習方法 (更新: 2025-05-11 / VCTK如何训练)

最新リリース: A previous version checkpoint (2021-11-07)

GitHub: https://github.com/babysor/MockingBird

← 全リポジトリ一覧へ