1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

acestep-transcriber

★ 56 mit 更新: 2026-02-03 HFで見る →

概要

ACE-Step Transcriberは、ACE-Step v1.5の学習データ注釈に使われる多言語音声転写モデルです。

話し声だけでなく歌声にも対応し、歌詞の文字起こしに加えてVerseやChorusなどの楽曲構造も自動で注釈できます。

50以上の言語を扱え、音楽制作での歌詞抽出、音楽AI向けデータセット作成、字幕生成、楽曲分析に向いています。

Qwen2.5 Omni-7Bと同様の使い方を想定しており、音声と歌詞構造をまとめて扱いたい開発者や研究者向けのツールです。

互換性・特徴

  • CLI
  • Python
  • transformers
  • 多言語対応
  • 音声文字起こし
  • 歌声転写

基本情報

ライセンスmit
Likes56
Downloads10,798
Pipelineaudio-text-to-text
カテゴリマルチモーダル
アクティビティlow

HuggingFace: https://huggingface.co/ACE-Step/acestep-transcriber