概要
hwdsl2/docker-whisper-liveは、faster-whisperを基盤とした自己ホスト型リアルタイム音声テキスト変換サーバーをDockerで実行するためのイメージです。
ライブオーディオ転写用のWebSocketストリーミングと、ファイル転写用のOpenAI互換REST APIを提供し、既存のOpenAI Whisper APIを利用するアプリケーションからの移行も容易です。
すべてのWhisperモデル、VAD、NVIDIA GPUアクセラレーション、オフラインモード、マルチアーキテクチャをサポートしており、音声データはユーザーのサーバーに留まるためプライバシーが保護されます。
ライブキャプションやオーディオストリームのリアルタイム転写を求める個人や開発者、また自己ホスト型AIスタックを構築したいユーザーに適しています。
互換性・特徴
- Docker
- リアルタイムSTT
- WebSocket
- REST API
- GPU対応
- 日本語対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 8 |
| Forks | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |