概要
GENIEは、オープンソースの音声合成プロジェクト「GPT-SoVITS」を基盤とした軽量推論エンジンです。
TTS推論、ONNXモデル変換、APIサーバー機能を統合し、特にCPU環境での優れたパフォーマンスと利便性を追求しています。
日本語、英語、中国語、韓国語に対応し、GPT-SoVITS V2/V2ProPlusモデルをサポート。
pipで簡単にインストールでき、初回実行時に必要なリソースを自動ダウンロードします。
既存のGPT-SoVITSモデルをCPUで高速かつ低リソースで運用したい開発者やユーザー、またはAPIを通じてサービスに組み込みたいユーザーに適しています。
互換性・特徴
- Python
- 日本語対応
- CLI
- CPU最適化
- API
基本情報
| ライセンス | MIT |
| Stars | 1,586 |
| Forks | 111 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- バグ:合成された音声が、時々オリジナルテキストではなく参照テキストで返される (更新: 2026-06-07 / bug: sythesization returns audio with reference text not the original text sometimes)
- [提案]: Dockerデプロイメントソリューションの提供 (更新: 2026-06-05 / [Suggestion]: Docker部署方案提供)
- 協力見積もり依頼 – サブスクリプション管理ツール「DolOffer」 (更新: 2026-06-01 / 请求合作报价-DolOffer一个订阅管理相关的工具)
- 生成されたテキストが短い場合(1-2文字)、ref_wavを直接再生 (更新: 2026-05-03 / 如果生成的文本较短(1-2个字符),则会直接返回并朗读ref_wav)
最新リリース: V2.0.2 整合包 (解压即用) (2025-12-12)
