262 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ComfyUI-Whisper

★ 233 ⑂ 38 NOASSERTION 更新: 2026-01-02 GitHubで見る →

概要

ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張機能です。

複数言語に対応し、プロンプトガイダンスや様々なWhisperモデルをサポートしています。

ComfyUI Manager経由で簡単にインストールでき、ComfyUIのワークフローとして利用できます。

字幕のフォントや色、位置調整、SRT形式での出力も可能で、動画コンテンツ制作者や研究者など、音声認識と動画編集を効率化したいComfyUIユーザーに最適です。

互換性・特徴

  • ComfyUI対応
  • Whisper対応
  • GPU必須
  • Python
  • 日本語対応
  • 動画編集

基本情報

ライセンスNOASSERTION
Stars233
Forks38
カテゴリASR / 音声認識
アクティビティmid

最新のissue

GitHub: https://github.com/yuvraj108c/ComfyUI-Whisper