1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

cosyvoice3-lora-finetuning

★ 10 NOASSERTION 更新: 2026-03-29 GitHubで見る →

概要

このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供します。

一般的な24GBのコンシューマGPUでシングルスピーカーの音声クローン作成を可能にし、CosyVoiceの既存のトレーニングコードではサポートされていないPEFT統合、選択的レイヤーフリーズ、LoRA対応チェックポイント管理、過学習検出機能を実現します。

これにより、従来のフルSFTと比較して、訓練パラメータを234分の1、チェックポイントサイズを480分の1に削減し、学習速度を1.8倍に向上させつつ、VRAM使用量を47%削減するなど、大幅な効率化とリソース節約を実現します。

限られたGPUリソースでCosyVoiceの高品質な音声クローンを効率的に作成したい研究者や開発者に最適です。

互換性・特徴

  • LoRA
  • Python
  • CLI
  • GPU必須
  • 音声合成
  • PEFT

基本情報

ライセンスNOASSERTION
Stars10
カテゴリTTS / 音声
アクティビティlow

最新のissue

最新リリース: v0.1.0 — CosyVoice3 LoRA fine-tuning with PEFT integration (2026-03-29)

GitHub: https://github.com/instavar/cosyvoice3-lora-finetuning