Timbre

概要

Timbreは、複数の話者が混在する音声録音（ポッドキャスト、インタビュー、ストリームなど）から、短い参照クリップを基に特定のターゲットスピーカーのクリーンな発話のみを抽出し、音声合成（TTS）トレーニングに適したword-safeなLJSpeech形式のデータセットを生成するツールです。

ボーカル分離、話者ダイアリゼーション、重複除去、ターゲット音声の検証、文字起こし、そしてTTSフレンドリーな音声クリップへの分割を自動で行います。

主に高品質な音声データセットを効率的に作成したいTTSモデル開発者や研究者を想定しています。

デスクトップアプリケーション（Timbre Studio）、Google Colab、またはコマンドラインインターフェース（CLI）を通じて利用可能です。

最新リリース: Timbre Studio studio-v0.2.0 (2026-06-13)

GitHub: https://github.com/Etherll/Timbre