概要
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バックエンドです。
グローバルホットキーによるディクテーションワークフローを特徴とし、マイク入力からのリアルタイム文字起こしや、ファイル/生データからのテキスト変換をサポートします。
認識されたテキストは、カーソル位置への自動貼り付けやクリップボード経由で出力され、堅牢なテキスト後処理(フィラー除去、数値フォーマット、Unicode修正など)が施されます。
主にデスクトップユーザー向けに設計されており、APIファーストのアプローチにより、開発者が音声入力機能をアプリケーションに統合する際にも活用できます。
音声入力を効率化し、高速な文字起こしを求めるユーザーに最適です。
互換性・特徴
- CLI
- Python
- FastAPI
- Speech-to-Text
- デスクトップアプリケーション
- API
基本情報
| Stars | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |