3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

HiggsAudiov2TokenizerUnofficial

★ 6 ⑂ 2 更新: 2025-10-08 GitHubで見る →

概要

本ツールは、HuBERTのセマンティック特徴量を用いたHiggs Audio V2 Tokenizerの非公式PyTorch実装です。

960倍ダウンサンプリングと8層RVQによるセマンティック音響オーディオトークン化のための完全なトレーニングパイプラインを提供します。

公式実装にはないトレーニングコードが用意されており、Descript Audio Codecのアーキテクチャ要素も統合されています。

音声処理や機械学習、特にPyTorchでのオーディオトークン化モデル開発を行う研究者や開発者が、HubertモデルとCUDA対応GPUを用いてモデルのトレーニングや実験を行うことを想定しています。

互換性・特徴

  • Python
  • PyTorch
  • CLI
  • GPU必須

基本情報

Stars6
Forks2
カテゴリ音声生成 / TTS
アクティビティlow

GitHub: https://github.com/pujariaditya/HiggsAudiov2TokenizerUnofficial