3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

cosyvoice3-lora-finetuning

★ 10 NOASSERTION 更新: 2026-03-29 GitHubで見る →

#CLI #GPU必須 #LoRA #PEFT #Python #音声合成

概要

このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供します。

一般的な24GBのコンシューマGPUでシングルスピーカーの音声クローン作成を可能にし、CosyVoiceの既存のトレーニングコードではサポートされていないPEFT統合、選択的レイヤーフリーズ、LoRA対応チェックポイント管理、過学習検出機能を実現します。

これにより、従来のフルSFTと比較して、訓練パラメータを234分の1、チェックポイントサイズを480分の1に削減し、学習速度を1.8倍に向上させつつ、VRAM使用量を47%削減するなど、大幅な効率化とリソース節約を実現します。

限られたGPUリソースでCosyVoiceの高品質な音声クローンを効率的に作成したい研究者や開発者に最適です。

互換性・特徴

LoRA
Python
CLI
GPU必須
音声合成
PEFT

基本情報

ライセンス	NOASSERTION
Stars	10
カテゴリ	音声生成 / TTS
アクティビティ	low

最新のissue

推論（inference）の方法 (更新: 2026-04-27 / how to inference)
LoraでvLLMを有効にする方法 (更新: 2026-04-07 / How to enable vLLM for Lora?)

最新リリース: v0.1.0 — CosyVoice3 LoRA fine-tuning with PEFT integration (2026-03-29)

GitHub: https://github.com/instavar/cosyvoice3-lora-finetuning

← 全リポジトリ一覧へ