概要
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。
Voice Cloning(音声クローン)、Voice Design(音声のカスタマイズ)、Auto Voice(最適な音声の自動選択)の3つの主要機能を提供し、開発者やタイ語コンテンツクリエイターが手軽に高品質なタイ語音声を生成できるように設計されています。
Hugging Faceのhotdogs/omnivoice-thaiモデルを基盤とし、タイ語音声データでファインチューニングされているため、タイ語に特化した高性能な音声合成が可能です。
Dockerによるデプロイもサポートされており、多様な環境での利用に適しています。
互換性・特徴
- Web UI
- REST API
- Python
- GPU必須
- Docker
- タイ語対応
基本情報
| Stars | 8 |
| Forks | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |