3,198 repos GH 3,083 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Neural-Zero-Shot-Voice-Cloning

★ 2 MIT 更新: 2026-06-11 GitHubで見る →

概要

本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音声を生成するTTS機能と、わずかな音声サンプルから声を複製するゼロショット音声クローニング機能を提供します。

PyTorchとFlaskを基盤とし、Coqui XTTS-v2とGlow-TTSモデルを統合。

Dockerによる完全なコンテナ化により、クラウド環境へのデプロイが容易で、CPUでも最適化された推論が可能です。

ユーザーインターフェースは、音声に反応するインタラクティブなWebGLとガラスモルフィズムデザインを採用し、未来的な視覚体験を提供します。

開発者や、音声合成・クローニング技術を求めるクリエイター、ビジネスユーザーに最適です。

デスクトップからモバイルまで、あらゆるデバイスでシームレスな体験を実現します。

互換性・特徴

  • Python
  • PyTorch
  • GPU必須
  • Web UI
  • Docker
  • Zero-Shot Voice Cloning

基本情報

ライセンスMIT
Stars2
カテゴリその他
アクティビティlow

GitHub: https://github.com/SiddhaK17/Neural-Zero-Shot-Voice-Cloning