3,362 repos GH 3,247 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

unified-audio

★ 396 ⑂ 27 Apache-2.0 更新: 2026-05-07 GitHubで見る →

概要

QuarkAudioは、音声、音楽、一般的なオーディオイベントの処理と生成を統一するオープンソースプロジェクトです。

このツールは、明示的な指示なしに音声復元、話者抽出、音声分離、音声変換、言語クエリによるソース分離、オーディオ編集など多岐にわたるタスクを処理できる「プロンプトフリー」な単一モデルを提供します。

LLMスタイルの自己回帰生成と、WavLM/Hubert、H-Codecを組み合わせたエンドツーエンドのパイプラインを特徴とし、再現性のあるオーディオ研究を支援します。

次世代のオーディオAIアプリケーション開発を目指す研究者や開発者が想定ユーザーです。

互換性・特徴

  • オープンソース
  • オーディオ処理
  • オーディオ生成
  • AI
  • マルチタスク
  • Webデモ

基本情報

ライセンスApache-2.0
Stars396
Forks27
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

GitHub: https://github.com/alibaba/unified-audio