omnivoice-server

概要

omnivoice-serverは、OmniVoiceテキスト読み上げモデルのOpenAI互換HTTPサーバーです。

OpenAIのTTSエンドポイントのドロップイン代替として機能し、音声デザイン（性別、年齢、ピッチ、アクセント、方言の制御）、参照オーディオからの音声クローン作成、リアルタイムストリーミング、クローンされた音声のプロファイル永続化などの高度な機能を提供します。

主に、OpenAI互換のAPIを通じてOmniVoice TTSをデプロイしたい開発者や、アプリケーションに高度な音声合成機能を統合したいユーザーを想定しています。

Pythonで実装されており、CLIからの操作も可能です。

最新リリース: v0.2.4 (2026-05-12)

GitHub: https://github.com/maemreyo/omnivoice-server