概要
ACE-Step Transcriberは、ACE-Step v1.5の学習データ注釈に使われる多言語音声転写モデルです。
話し声だけでなく歌声にも対応し、歌詞の文字起こしに加えてVerseやChorusなどの楽曲構造も自動で注釈できます。
50以上の言語を扱え、音楽制作での歌詞抽出、音楽AI向けデータセット作成、字幕生成、楽曲分析に向いています。
Qwen2.5 Omni-7Bと同様の使い方を想定しており、音声と歌詞構造をまとめて扱いたい開発者や研究者向けのツールです。
互換性・特徴
- CLI
- Python
- transformers
- 多言語対応
- 音声文字起こし
- 歌声転写
基本情報
| ライセンス | mit |
| Likes | 56 |
| Downloads | 10,798 |
| Pipeline | audio-text-to-text |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
HuggingFace: https://huggingface.co/ACE-Step/acestep-transcriber