3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

voice-input

★ 6 MIT 更新: 2026-06-06 GitHubで見る →

概要

本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。

ショートカットキーを押している間のみ音声を認識し、キーを離すと認識結果がカーソル位置に入力されます。

中国語と英語の混合入力、自動句読点、SenseVoiceによる高速な音声認識(RTF約0.02)が特徴です。

PySide6製のシステムトレイGUIを提供し、認識履歴やホットワード強化機能も備えています。

Linux/X11環境で最適な体験を提供しますが、WindowsおよびmacOS向けのネイティブインストールパッケージも提供されており、幅広いユーザーが利用可能です。

特にGPU加速を求める開発者向けに、ソースからのインストールもサポートされています。

互換性・特徴

  • Linux対応
  • Windows対応
  • macOS対応
  • Python
  • PySide6 GUI
  • GPU対応
  • 多言語対応

基本情報

ライセンスMIT
Stars6
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v0.3.7 (2026-06-06)

GitHub: https://github.com/fnidore/voice-input