1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Whisper-Skill

★ 6 ⑂ 5 更新: 2026-05-11 GitHubで見る →

概要

whisper-skillは、OpenAI API不要でローカル完結する無料の音声文字変換ツールです。

99言語に対応し、Mac/Linux/Windowsで動作します。

主な特徴は、Superwhisperなどの有料サービスを代替するプッシュトゥトーク式の音声ディクテーション機能で、ホットキーを押しながら話すことで、あらゆるアプリのテキスト入力欄に自動で文字起こし結果を挿入できます。

また、CapCutのように動画(MP4)に直接字幕を埋め込む機能も備えています。

Claude CodeやCursor、ChatGPTなどのAIアシスタントと連携させ、Whisperに関する正確な情報提供を促す使い方も可能です。

AIアシスタントなしでも、セットアップウィザードが最適な環境設定を自動で行います。

音声入力による作業効率向上、動画への字幕追加、そして安全なローカルでの高品質な文字起こしを求めるユーザーに最適なツールです。

互換性・特徴

  • ローカル文字起こし
  • 音声ディクテーション
  • 字幕埋め込み
  • CLI
  • Python
  • AIアシスタント連携

基本情報

Stars6
Forks5
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/Mobiss11/Whisper-Skill