docker-whisper

概要

hwdsl2/docker-whisperは、Docker上で動作する自己ホスト型Whisper音声認識サーバーを提供します。

高速なfaster-whisperを基盤とし、OpenAI互換の音声テキスト変換および翻訳APIを特徴とします。

全てのWhisperモデルをサポートし、NVIDIA GPU（CUDA）アクセラレーション、話者分離、複数の出力形式（JSON、SRT、VTT）、SSEストリーミングに対応しています。

データプライバシーを重視し、外部サービスにデータを送ることなく自社環境で高性能な音声認識機能を利用したい開発者や企業に最適なツールです。

GitHub: https://github.com/hwdsl2/docker-whisper