概要
このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供します。
一般的な24GBのコンシューマGPUでシングルスピーカーの音声クローン作成を可能にし、CosyVoiceの既存のトレーニングコードではサポートされていないPEFT統合、選択的レイヤーフリーズ、LoRA対応チェックポイント管理、過学習検出機能を実現します。
これにより、従来のフルSFTと比較して、訓練パラメータを234分の1、チェックポイントサイズを480分の1に削減し、学習速度を1.8倍に向上させつつ、VRAM使用量を47%削減するなど、大幅な効率化とリソース節約を実現します。
限られたGPUリソースでCosyVoiceの高品質な音声クローンを効率的に作成したい研究者や開発者に最適です。
互換性・特徴
- LoRA
- Python
- CLI
- GPU必須
- 音声合成
- PEFT
基本情報
| ライセンス | NOASSERTION |
| Stars | 10 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
最新のissue
- 推論(inference)の方法 (更新: 2026-04-27 / how to inference)
- LoraでvLLMを有効にする方法 (更新: 2026-04-07 / How to enable vLLM for Lora?)
最新リリース: v0.1.0 — CosyVoice3 LoRA fine-tuning with PEFT integration (2026-03-29)
GitHub: https://github.com/instavar/cosyvoice3-lora-finetuning