概要
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。
リアルタイムディクテーション、3秒の音声クリップからゼロショットで声をクローンする機能、ビデオの文字起こし・翻訳・再音声化によるシネマティックビデオ吹き替えを提供します。
646言語に対応し、デスクトップで完全にローカル動作するため、APIキーは不要です。
音声のデザイン、ボーカル分離、話者ダイアライゼーション、バッチ処理、AIウォーターマークなどの高度な機能を備えています。
開発者や、プライバシーを重視し、クラウドサービスに依存しない高品質な音声合成・編集を求める個人ユーザーに最適です。
現在はベータ版です。
互換性・特徴
- macOS対応
- Windows対応
- Linux対応
- Docker対応
- Python
- Web UI
- GPU対応
- ローカル実行
- 日本語対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 512 |
| Forks | 40 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- [Bug] エクスポートされたWavファイルが破損しています (更新: 2026-05-11 / [Bug] Exported Wav file is corrupted)
- OmniVoice Studioのセットアップに失敗しました (更新: 2026-05-11 / OmniVoice Studio Setup failed)
- [Feature] TTSエンジンを追加 (更新: 2026-05-11 / [Feature] Add TTS Engine)
最新リリース: OmniVoice Studio v0.2.7 (2026-05-03)
