3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

Qwen3-TTS-EasyFinetuning

★ 102 ⑂ 19 Apache-2.0 更新: 2026-05-29 GitHubで見る →

#CLI #Docker #GPU必須 #Python #Web UI #多言語対応

概要

「Qwen3-TTS Easy Finetuning」は、Qwen3-TTSモデルのファインチューニングを簡素化し、高速かつ高品質な音声クローンと多言語音声合成を実現するための統合ワークスペースです。

Supervised Fine-Tuning (SFT)により、音色の安定性、表現力豊かな音声制御、およびアクセントのないクロスリンガル合成が可能になります。

本ツールは、自動オーディオ処理、ASR転写、データセットクリーニング、トークン化を含む一連のパイプラインを提供し、WebUIと堅牢なCLIの両方を通じてデータ準備からトレーニング、推論まで一貫したワークフローをサポートします。

Docker対応により環境構築も容易で、プロダクションレベルの高品質な音声合成を目指す開発者や研究者に最適なソリューションです。

互換性・特徴

Python
GPU必須
Web UI
CLI
Docker
多言語対応

基本情報

ライセンス	Apache-2.0
Stars	102
Forks	19
カテゴリ	音声生成 / TTS
アクティビティ	mid

最新のissue

微调之后推理是一片噪音 (更新: 2026-06-27)
50系显卡进行asr命令报错 (更新: 2026-06-27)
ファインチューニング中の予想される損失範囲は？ (更新: 2026-03-02 / What is the expected loss range during fine-tuning?)

最新リリース: Release v1.2.0 (2026-03-29)

GitHub: https://github.com/mozi1924/Qwen3-TTS-EasyFinetuning

← 全リポジトリ一覧へ