概要
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。
オリジナルのWhisperと比較して最大4倍高速で、メモリ使用量を抑えつつ、CPUおよびGPUでの8ビット量子化により効率をさらに向上させます。
FFmpegのシステムインストールが不要で、PyAVライブラリを介して音声がデコードされます。
大量の音声データを迅速かつ効率的に処理したい開発者や、限られたリソースでWhisperを利用したい研究者に最適なツールです。
互換性・特徴
- Whisperモデル
- 音声認識
- 高速化
- GPU対応
- CPU対応
- Python
基本情報
| ライセンス | MIT |
| Stars | 23,902 |
| Forks | 1,954 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- Streaming support (更新: 2026-06-25)
- faster-whisper-large-v2モデルでword level timestamps有効時に特定のWindowsオーディオファイルでゼロ除算クラッシュ (更新: 2026-06-12 / Divide by zero crash on Windows for specific audio files when word level timestamps are enabled with faster-whisper-large-v2 model)
- WhisperModel使用時のシャットダウンでSemaphoreリーク警告 (更新: 2026-06-12 / Leaked semaphore warning on shutdown when using WhisperModel)
最新リリース: faster-whisper 1.2.1 (2025-10-31)
