acestep-transcriber

概要

ACE-Step Transcriberは、ACE-Step v1.5の学習データ注釈に使われる多言語音声転写モデルです。

話し声だけでなく歌声にも対応し、歌詞の文字起こしに加えてVerseやChorusなどの楽曲構造も自動で注釈できます。

50以上の言語を扱え、音楽制作での歌詞抽出、音楽AI向けデータセット作成、字幕生成、楽曲分析に向いています。

Qwen2.5 Omni-7Bと同様の使い方を想定しており、音声と歌詞構造をまとめて扱いたい開発者や研究者向けのツールです。

HuggingFace: https://huggingface.co/ACE-Step/acestep-transcriber