概要
QuarkAudioは、音声、音楽、一般的なオーディオイベントの処理と生成を統一するオープンソースプロジェクトです。
このツールは、明示的な指示なしに音声復元、話者抽出、音声分離、音声変換、言語クエリによるソース分離、オーディオ編集など多岐にわたるタスクを処理できる「プロンプトフリー」な単一モデルを提供します。
LLMスタイルの自己回帰生成と、WavLM/Hubert、H-Codecを組み合わせたエンドツーエンドのパイプラインを特徴とし、再現性のあるオーディオ研究を支援します。
次世代のオーディオAIアプリケーション開発を目指す研究者や開発者が想定ユーザーです。
互換性・特徴
- オープンソース
- オーディオ処理
- オーディオ生成
- AI
- マルチタスク
- Webデモ
基本情報
| ライセンス | Apache-2.0 |
| Stars | 396 |
| Forks | 27 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- H-codec2.0に関する課題 (更新: 2026-05-29 / H-codec2.0)
- このモデルの利用方法 (更新: 2026-02-12 / How to use this model?)
- H-Codec 2.0モデルはダウンロードできますか? (更新: 2026-02-04 / H-Codec 2.0模型可以下载吗?)
- AIGCプラットフォームのコンテンツ管理フレームワーク構築について、類似の画像・動画管理プロジェクトの推薦を希望します。 (更新: 2026-01-16 / 同学你好,我是AIGC平台的后端研发,在搭建统一管理生成内容的框架,看到你们开源的这个和我们很契合,想问你司有没有类似的图片视频管理的开源或闭源项目可以推荐。)
- Python環境設定に関するフィードバック (更新: 2026-01-06 / Feedback on setting up the Python environment)
