3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

speech_recognition

★ 9.0k ⑂ 2,421 BSD-3-Clause 更新: 2026-06-16 GitHubで見る →

概要

このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し、音声からテキストへの変換機能を提供します。

CMU Sphinx、Google Speech、Microsoft Azure Speech、OpenAI Whisper、Voskなど、広範なサービスをサポートしており、開発者は自分のPythonアプリケーションに柔軟かつ強力な音声認識能力を簡単に組み込むことができます。

特に、複数のバックエンドを切り替えて利用したいユーザーや、Pythonで手軽に音声認識を試したいユーザーに推奨されます。

互換性・特徴

  • Python
  • CLI
  • オンライン
  • オフライン
  • API連携

基本情報

ライセンスBSD-3-Clause
Stars8,973
Forks2,421
カテゴリASR / 音声認識
アクティビティhigh

最新のissue

最新リリース: 3.17.0 (2026-06-17)

GitHub: https://github.com/Uberi/speech_recognition