422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

voicebox

★ 25.3k ⑂ 3,058 MIT 更新: 2026-04-26 GitHubで見る →

概要

Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。

数秒の音声サンプルから声をクローンし、7種類のTTSエンジンと23言語(日本語を含む)で音声を生成できます。

ローカル環境で動作するため、高度なプライバシー保護が特徴です。

グローバルホットキーを用いたディクテーション機能や、AIエージェントとの音声対話も可能で、音声入出力の全スタックを提供します。

開発者や、プライバシーを重視しつつAIとの豊かな音声体験を求めるユーザーに最適です。

互換性・特徴

  • AI
  • 音声合成
  • 音声クローン
  • ローカル実行
  • 日本語対応
  • API
  • デスクトップアプリ
  • GPU推奨

基本情報

ライセンスMIT
Stars25,263
Forks3,058
カテゴリASR / 音声認識
アクティビティhigh

最新のissue

最新リリース: v0.5.0 (2026-04-25)

GitHub: https://github.com/jamiepine/voicebox