概要
このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単にインストール・実行できるランチャーです。
音声デザインや音声クローン機能をサポートし、特にVRAMの少ないGPUを持つユーザー向けにVoxCPM-0.5B(約5GB VRAM)とVoxCPM2(約8GB VRAM)の2つの起動プロファイルを提供します。
ワンクリックでのインストール、Web UIとHTTP APIの統合、WAV音声を直接返すAPI、プロンプト履歴、音声ライブラリの保存、Hugging Faceダウンロードの最適化が主な特徴です。
言語はターゲットテキストと制御指示から自動推測されます。
想定ユーザーは、手軽に高性能な音声合成・クローン機能を導入したいPinokioユーザーや開発者です。
互換性・特徴
- Pinokio
- Web UI
- HTTP API
- GPU必須
- 音声合成
- 多言語対応
基本情報
| Stars | 1 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |