概要
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。
このツールは、テキストからWAV形式の音声を生成するWeb APIを提供し、チャンク化された音声合成、バックグラウンド処理、音声プリセット、GGUF/BF16モデル、およびOpenAI互換のオーディオAPIをサポートしています。
WindowsおよびLinux向けのランチャーが用意されており、GPUを必須とし、Q4 TTS GGUFモデルには最低4GBのGPUメモリを推奨します。
また、直感的な操作が可能なTkinterベースのGUIアプリケーション「Voxtral Playground」も付属しており、開発者だけでなく、高性能なテキスト読み上げ機能を自分のプロジェクトやデスクトップで手軽に利用したいクリエイターや個人ユーザーに適しています。
互換性・特徴
- Python
- Web API
- GUI
- CLI
- GPU必須
- テキスト読み上げ
基本情報
| Stars | 1 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |