3,137 repos GH 3,022 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

RealtimeSTT

★ 9.9k ⑂ 836 MIT 更新: 2026-06-09 GitHubで見る →

#CLI #Python #VAD #ウェイクワード #リアルタイム処理 #音声認識

概要

RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えたPython製音声認識ライブラリです。

アシスタント、ディクテーションツール、ブラウザストリーミングサーバー、プロトタイプなど、少量のコードで音声をテキストに変換したいアプリケーション向けに設計されています。

デフォルトで`faster_whisper`を使用し、`kroko_onnx`などの他のエンジンもサポートしており、効率的かつ低遅延での音声認識を実現します。

互換性・特徴

Python
CLI
リアルタイム処理
音声認識
VAD
ウェイクワード

基本情報

ライセンス	MIT
Stars	9,883
Forks	836
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

リアルタイム翻訳機能の実装について：実現可能性の検討 (更新: 2026-05-31 / Realtime translation possible?)
新機能：代替STTエンジンとしてFunASR/SenseVoiceを追加 (更新: 2026-05-31 / Feature: Add FunASR/SenseVoice as alternative STT engine)
Python 3.13+でのopenwakeword silent APIの互換性問題とドキュメントの課題 (更新: 2026-05-28 / openwakeword silent API incompatibility on Python 3.13+ and documentation issues)
モデルと互換性の問題 (更新: 2026-05-22 / Model and compatibility issues)
異常終了エラー (更新: 2026-05-20 / Aborted Error)

最新リリース: v1.0.2 (2026-05-31)

GitHub: https://github.com/KoljaB/RealtimeSTT

← 全リポジトリ一覧へ