3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

speech_recognition

★ 9.0k ⑂ 2,421 BSD-3-Clause 更新: 2026-06-16 GitHubで見る →

#API連携 #CLI #Python #オフライン #オンライン

概要

このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し、音声からテキストへの変換機能を提供します。

CMU Sphinx、Google Speech、Microsoft Azure Speech、OpenAI Whisper、Voskなど、広範なサービスをサポートしており、開発者は自分のPythonアプリケーションに柔軟かつ強力な音声認識能力を簡単に組み込むことができます。

特に、複数のバックエンドを切り替えて利用したいユーザーや、Pythonで手軽に音声認識を試したいユーザーに推奨されます。

互換性・特徴

Python
CLI
オンライン
オフライン
API連携

基本情報

ライセンス	BSD-3-Clause
Stars	8,973
Forks	2,421
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

機能: FunASRを認識バックエンドとして追加 (recognize_funasr) (更新: 2026-05-30 / Feature: Add FunASR as a recognition backend (recognize_funasr))
すべての選択肢ではなく、最も信頼度の高い1つの代替案を返す方法 (更新: 2026-05-13 / How to return one alternative (with highest confidence) without returning all the options?)
MacOS M1でPyAudioを使用できません。 (更新: 2026-03-25 / Cannot use PyAudio in MacOS M1.)
AttributeError: ‘Recognizer’オブジェクトに’recognize_google’属性がありません (更新: 2026-03-25 / AttributeError: ‘Recognizer’ object has no attribute ‘recognize_google’)

最新リリース: 3.17.0 (2026-06-17)

GitHub: https://github.com/Uberi/speech_recognition

← 全リポジトリ一覧へ