概要
Timbreは、複数の話者が混在する音声録音(ポッドキャスト、インタビュー、ストリームなど)から、短い参照クリップを基に特定のターゲットスピーカーのクリーンな発話のみを抽出し、音声合成(TTS)トレーニングに適したword-safeなLJSpeech形式のデータセットを生成するツールです。
ボーカル分離、話者ダイアリゼーション、重複除去、ターゲット音声の検証、文字起こし、そしてTTSフレンドリーな音声クリップへの分割を自動で行います。
主に高品質な音声データセットを効率的に作成したいTTSモデル開発者や研究者を想定しています。
デスクトップアプリケーション(Timbre Studio)、Google Colab、またはコマンドラインインターフェース(CLI)を通じて利用可能です。
互換性・特徴
- Python
- GPU必須
- Tauri
- Colab対応
- CLI
- TTSデータセット生成
基本情報
| ライセンス | Apache-2.0 |
| Stars | 18 |
| Forks | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
最新リリース: Timbre Studio studio-v0.2.0 (2026-06-13)
