docker-whisper-live

概要

hwdsl2/docker-whisper-liveは、faster-whisperを基盤とした自己ホスト型リアルタイム音声テキスト変換サーバーをDockerで実行するためのイメージです。

ライブオーディオ転写用のWebSocketストリーミングと、ファイル転写用のOpenAI互換REST APIを提供し、既存のOpenAI Whisper APIを利用するアプリケーションからの移行も容易です。

すべてのWhisperモデル、VAD、NVIDIA GPUアクセラレーション、オフラインモード、マルチアーキテクチャをサポートしており、音声データはユーザーのサーバーに留まるためプライバシーが保護されます。

ライブキャプションやオーディオストリームのリアルタイム転写を求める個人や開発者、また自己ホスト型AIスタックを構築したいユーザーに適しています。

GitHub: https://github.com/hwdsl2/docker-whisper-live