3,362 repos GH 3,247 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

unified-audio

★ 396 ⑂ 27 Apache-2.0 更新: 2026-05-07 GitHubで見る →

#AI #Webデモ #オーディオ処理 #オーディオ生成 #オープンソース #マルチタスク

概要

QuarkAudioは、音声、音楽、一般的なオーディオイベントの処理と生成を統一するオープンソースプロジェクトです。

このツールは、明示的な指示なしに音声復元、話者抽出、音声分離、音声変換、言語クエリによるソース分離、オーディオ編集など多岐にわたるタスクを処理できる「プロンプトフリー」な単一モデルを提供します。

LLMスタイルの自己回帰生成と、WavLM/Hubert、H-Codecを組み合わせたエンドツーエンドのパイプラインを特徴とし、再現性のあるオーディオ研究を支援します。

次世代のオーディオAIアプリケーション開発を目指す研究者や開発者が想定ユーザーです。

互換性・特徴

オープンソース
オーディオ処理
オーディオ生成
AI
マルチタスク
Webデモ

基本情報

ライセンス	Apache-2.0
Stars	396
Forks	27
カテゴリ	音声生成 / TTS
アクティビティ	mid

最新のissue

H-codec2.0に関する課題 (更新: 2026-05-29 / H-codec2.0)
このモデルの利用方法 (更新: 2026-02-12 / How to use this model?)
H-Codec 2.0モデルはダウンロードできますか？ (更新: 2026-02-04 / H-Codec 2.0模型可以下载吗？)
AIGCプラットフォームのコンテンツ管理フレームワーク構築について、類似の画像・動画管理プロジェクトの推薦を希望します。 (更新: 2026-01-16 / 同学你好，我是AIGC平台的后端研发，在搭建统一管理生成内容的框架，看到你们开源的这个和我们很契合，想问你司有没有类似的图片视频管理的开源或闭源项目可以推荐。)
Python環境設定に関するフィードバック (更新: 2026-01-06 / Feedback on setting up the Python environment)

GitHub: https://github.com/alibaba/unified-audio

← 全リポジトリ一覧へ