概要
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Speech API互換の音声合成サーバーです。
参照音声からのボイスクローニング、OpenAIスタイルのレスポンス形式、長文テキストの自動チャンク処理といった特徴を持ち、wav、mp3などの多様な音声形式に対応しています。
API互換性により、既存のOpenAI TTSクライアント(Python SDKなど)から簡単に利用可能です。
主に、ローカル環境やDockerコンテナでIrodori-TTSの高品質な音声合成を手軽に利用したい開発者や研究者を想定しており、特にNVIDIA GPUを推奨しています。
互換性・特徴
- OpenAI API Compatible
- Text-to-Speech (TTS)
- Voice Cloning
- Python
- Docker
- GPU必須
基本情報
| ライセンス | MIT |
| Stars | 5 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |