概要
LixAudioは、音声処理、音声認識(STT)、テキスト読み上げ(TTS)、セマンティック音声理解のためのモジュラーなPythonフレームワークです。
Faster-Whisperによる99言語対応の正確な音声認識、自然な音声合成、音声クローンによる音声変換(STS)などの機能を持ち、マルチモーダルオーディオアプリケーションの構築、デプロイ、実験を可能にします。
Flaskアプリケーションサーバーとモデルサーバーのデュアルサービスアーキテクチャにより、効率的なリソース管理と高速な推論を実現しており、開発者や企業が音声関連サービスを迅速に構築・提供することを想定しています。
互換性・特徴
- Python
- Web API
- STT
- TTS
- STS
- Docker
基本情報
| ライセンス | GPL-3.0 |
| Stars | 1 |
| Forks | 1 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
