1,995 repos GH 1,880 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

audio-diffusion-pytorch

★ 2.1k ⑂ 178 MIT 更新: 2023-06-12 GitHubで見る →

概要

audio-diffusion-pytorchは、PyTorchで拡散モデルを用いてオーディオを生成するための多機能ライブラリです。

無条件およびテキスト条件付きのオーディオ生成、拡散オートエンコーディング、アップサンプリング、ボコーディングといった多様な機能をサポートしています。

提供されるモデルは波形ベースですが、U-Net、拡散モデル、サンプラーは汎用性が高く、他のオーディオ形式にも柔軟にカスタマイズできます。

事前学習済みモデルは含まれていないため、主に独自のカスタムモデルを構築したい研究者や開発者を想定しています。

互換性・特徴

  • Python
  • PyTorch
  • GPU推奨
  • オーディオ生成
  • 研究・開発向け

基本情報

ライセンスMIT
Stars2,102
Forks178
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

最新リリース: v0.1.3 (2023-02-26)

GitHub: https://github.com/archinetai/audio-diffusion-pytorch