概要
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。
リアルタイムディクテーション、3秒の音声クリップからゼロショットで声をクローンする機能、ビデオの文字起こし・翻訳・再音声化によるシネマティックビデオ吹き替えを提供します。
646言語に対応し、デスクトップで完全にローカル動作するため、APIキーは不要です。
音声のデザイン、ボーカル分離、話者ダイアライゼーション、バッチ処理、AIウォーターマークなどの高度な機能を備えています。
開発者や、プライバシーを重視し、クラウドサービスに依存しない高品質な音声合成・編集を求める個人ユーザーに最適です。
現在はベータ版です。
互換性・特徴
- macOS対応
- Windows対応
- Linux対応
- Docker対応
- Python
- Web UI
- GPU対応
- ローカル実行
- 日本語対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 7,701 |
| Forks | 1,200 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- [Bug] Can’t reach the local OmniVoice backend — it may still be starting up, or it sto (更新: 2026-06-28)
- [Bug] 400 Bad Request: Unsupported instruct items found in AGITADO, GRITANDO: ‘AGITA (更新: 2026-06-28)
- [Bug] 500 Internal Server Error: no such column: consent_audio_path (更新: 2026-06-28)
- [Bug] Transcribe stream dropped before emitting any segments. Likely ASR backend faile (更新: 2026-06-28)
最新リリース: OmniVoice Studio v0.3.7 (2026-06-20)
