1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

carefulWhisper

★ 1 更新: 2026-05-16 GitHubで見る →

概要

carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バックエンドです。

グローバルホットキーによるディクテーションワークフローを特徴とし、マイク入力からのリアルタイム文字起こしや、ファイル/生データからのテキスト変換をサポートします。

認識されたテキストは、カーソル位置への自動貼り付けやクリップボード経由で出力され、堅牢なテキスト後処理(フィラー除去、数値フォーマット、Unicode修正など)が施されます。

主にデスクトップユーザー向けに設計されており、APIファーストのアプローチにより、開発者が音声入力機能をアプリケーションに統合する際にも活用できます。

音声入力を効率化し、高速な文字起こしを求めるユーザーに最適です。

互換性・特徴

  • CLI
  • Python
  • FastAPI
  • Speech-to-Text
  • デスクトップアプリケーション
  • API

基本情報

Stars1
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/ainan-ahmed/carefulWhisper