3,501 repos GH 3,386 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

VTS

★ 32 ⑂ 3 MIT 更新: 2026-06-01 GitHubで見る →

概要

VTS(Voice To Sound)は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。

言葉では表現しにくい音のニュアンスを声で伝え、テキストで意図を補足することで、直感的かつ正確なサウンドデザインを可能にします。

サウンドデザイナーや開発者など、効果音の指定や生成に課題を持つユーザーを対象とし、約10.7億パラメータのlatent diffusionモデルを基盤に、高品質な効果音を提供します。

互換性・特徴

  • Python
  • CLI
  • GPU必須
  • Hugging Face

基本情報

ライセンスMIT
Stars32
Forks3
カテゴリ音声生成 / TTS
アクティビティlow

最新のissue

GitHub: https://github.com/thxxx/VTS