概要
ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張機能です。
複数言語に対応し、プロンプトガイダンスや様々なWhisperモデルをサポートしています。
ComfyUI Manager経由で簡単にインストールでき、ComfyUIのワークフローとして利用できます。
字幕のフォントや色、位置調整、SRT形式での出力も可能で、動画コンテンツ制作者や研究者など、音声認識と動画編集を効率化したいComfyUIユーザーに最適です。
互換性・特徴
- ComfyUI対応
- Whisper対応
- GPU必須
- Python
- 日本語対応
- 動画編集
基本情報
| ライセンス | NOASSERTION |
| Stars | 233 |
| Forks | 38 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- PyTorch2.9およびCUDA 13では動作しません (更新: 2026-04-24 / Doesnt work with PyTorch2.9 and CUDA 13)
- フレーズの長さを制限する、そのプロンプトの目的は? (更新: 2026-04-18 / Limit phrases length, and for what is that prompt?)
- RuntimeError 101: Whisperの適用 (更新: 2026-04-06 / RuntimeError 101 Apply Whisper)
- [WinError 87] Windowsで’.’パスを使用するとadd_dll_directoryが失敗する (更新: 2026-02-23 / [WinError 87] add_dll_directory fails with ‘.’ path on Windows.)
