概要
hwdsl2/docker-whisperは、Docker上で動作する自己ホスト型Whisper音声認識サーバーを提供します。
高速なfaster-whisperを基盤とし、OpenAI互換の音声テキスト変換および翻訳APIを特徴とします。
全てのWhisperモデルをサポートし、NVIDIA GPU(CUDA)アクセラレーション、話者分離、複数の出力形式(JSON、SRT、VTT)、SSEストリーミングに対応しています。
データプライバシーを重視し、外部サービスにデータを送ることなく自社環境で高性能な音声認識機能を利用したい開発者や企業に最適なツールです。
互換性・特徴
- Docker
- AI/ML
- 音声認識
- OpenAI API互換
- GPU対応
- 自己ホスト型
基本情報
| ライセンス | NOASSERTION |
| Stars | 34 |
| Forks | 4 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |