概要
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。
ショートカットキーを押している間のみ音声を認識し、キーを離すと認識結果がカーソル位置に入力されます。
中国語と英語の混合入力、自動句読点、SenseVoiceによる高速な音声認識(RTF約0.02)が特徴です。
PySide6製のシステムトレイGUIを提供し、認識履歴やホットワード強化機能も備えています。
Linux/X11環境で最適な体験を提供しますが、WindowsおよびmacOS向けのネイティブインストールパッケージも提供されており、幅広いユーザーが利用可能です。
特にGPU加速を求める開発者向けに、ソースからのインストールもサポートされています。
互換性・特徴
- Linux対応
- Windows対応
- macOS対応
- Python
- PySide6 GUI
- GPU対応
- 多言語対応
基本情報
| ライセンス | MIT |
| Stars | 6 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
最新リリース: v0.3.7 (2026-06-06)
