概要
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。
オリジナルのWhisperと比較して最大4倍高速で、メモリ使用量を抑えつつ、CPUおよびGPUでの8ビット量子化により効率をさらに向上させます。
FFmpegのシステムインストールが不要で、PyAVライブラリを介して音声がデコードされます。
大量の音声データを迅速かつ効率的に処理したい開発者や、限られたリソースでWhisperを利用したい研究者に最適なツールです。
互換性・特徴
- Whisperモデル
- 音声認識
- 高速化
- GPU対応
- CPU対応
- Python
基本情報
| ライセンス | MIT |
| Stars | 22,882 |
| Forks | 1,872 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- 多様なオーディオソースからのバッチ推論によるGPU利用率の向上 (更新: 2026-05-13 / Batch inference from a diverse list of audio sources for better GPU utilization)
- faster whisperはAMD GPUをサポートしていますか? (更新: 2026-05-08 / Does faster whisper support AMD GPU?)
- GPUモデルがアンロードされた際にWindowsプロセスがクラッシュする (更新: 2026-04-27 / Windows process crashes when the GPU model is unloaded)
- ライブラリlibcublas.so.12が見つかりません (更新: 2026-04-15 / Library libcublas.so.12 is not found)
最新リリース: faster-whisper 1.2.1 (2025-10-31)