3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

OmniVoice-Studio

★ 7.7k ⑂ 1,200 NOASSERTION 更新: 2026-06-28 GitHubで見る →

#Docker対応 #GPU対応 #Linux対応 #macOS対応 #Python #Web UI #Windows対応 #ローカル実行 #日本語対応

概要

OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。

リアルタイムディクテーション、3秒の音声クリップからゼロショットで声をクローンする機能、ビデオの文字起こし・翻訳・再音声化によるシネマティックビデオ吹き替えを提供します。

646言語に対応し、デスクトップで完全にローカル動作するため、APIキーは不要です。

音声のデザイン、ボーカル分離、話者ダイアライゼーション、バッチ処理、AIウォーターマークなどの高度な機能を備えています。

開発者や、プライバシーを重視し、クラウドサービスに依存しない高品質な音声合成・編集を求める個人ユーザーに最適です。

現在はベータ版です。

互換性・特徴

macOS対応
Windows対応
Linux対応
Docker対応
Python
Web UI
GPU対応
ローカル実行
日本語対応

基本情報

ライセンス	NOASSERTION
Stars	7,701
Forks	1,200
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

[Bug] Can’t reach the local OmniVoice backend — it may still be starting up, or it sto (更新: 2026-06-28)
[Bug] 400 Bad Request: Unsupported instruct items found in AGITADO, GRITANDO: ‘AGITA (更新: 2026-06-28)
[Bug] 500 Internal Server Error: no such column: consent_audio_path (更新: 2026-06-28)
[Bug] Transcribe stream dropped before emitting any segments. Likely ASR backend faile (更新: 2026-06-28)

最新リリース: OmniVoice Studio v0.3.7 (2026-06-20)

GitHub: https://github.com/debpalash/OmniVoice-Studio

← 全リポジトリ一覧へ