概要
このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し、音声からテキストへの変換機能を提供します。
CMU Sphinx、Google Speech、Microsoft Azure Speech、OpenAI Whisper、Voskなど、広範なサービスをサポートしており、開発者は自分のPythonアプリケーションに柔軟かつ強力な音声認識能力を簡単に組み込むことができます。
特に、複数のバックエンドを切り替えて利用したいユーザーや、Pythonで手軽に音声認識を試したいユーザーに推奨されます。
互換性・特徴
- Python
- CLI
- オンライン
- オフライン
- API連携
基本情報
| ライセンス | BSD-3-Clause |
| Stars | 8,973 |
| Forks | 2,421 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | high |
最新のissue
- 機能: FunASRを認識バックエンドとして追加 (recognize_funasr) (更新: 2026-05-30 / Feature: Add FunASR as a recognition backend (recognize_funasr))
- すべての選択肢ではなく、最も信頼度の高い1つの代替案を返す方法 (更新: 2026-05-13 / How to return one alternative (with highest confidence) without returning all the options?)
- MacOS M1でPyAudioを使用できません。 (更新: 2026-03-25 / Cannot use PyAudio in MacOS M1.)
- AttributeError: ‘Recognizer’オブジェクトに’recognize_google’属性がありません (更新: 2026-03-25 / AttributeError: ‘Recognizer’ object has no attribute ‘recognize_google’)
最新リリース: 3.17.0 (2026-06-17)
