概要
Voqiは、あらゆるウェブアプリケーションを37言語で音声操作可能にするオープンソースの音声制御レイヤーです。
数分の設定で、ユーザーはウェブアプリをハンズフリーで操作できるようになります。
ウィジェットを埋め込み、簡単なツールを定義するだけで、記録の作成、画面ナビゲーション、クエリ実行などが可能になります。
バックエンドやSaaSの契約は不要で、エージェントサーバーを自分で運用し、APIキー(OpenAI、Daily、Deepgram、Cartesiaなど)を持ち込む形式です。
主にデスクトップ環境での利用が想定されており、開発者や、既存のウェブサービスに音声操作機能を手軽に統合したい企業がターゲットです。
互換性・特徴
- 音声認識
- Webアプリ
- Python
- TypeScript
- オープンソース
- 37言語対応
基本情報
| ライセンス | Apache-2.0 |
| Stars | 10 |
| Forks | 4 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
