概要
Brahは、リアルタイムでユーザーのPC画面を認識し、コンピューターを操作するデスクトップ音声アシスタントです。
OpenAI Realtime APIを活用した低遅延の音声対話機能を持ち、スクリーンショット分析を通じて画面上の情報を理解し、マウスやキーボード操作、Webブラウザの自動化(Playwright)、OSレベルでの制御(nut.js)を実行します。
これにより、ハンズフリーでタスク管理やカレンダー操作、Web検索といった多様な作業をこなします。
従来の音声アシスタントが持つ「話す」機能に加え、「見て、行動する」ことで、会話を具体的なPC操作に繋げたいと考えるユーザー、または作業効率化を求めるユーザーを主なターゲットとしています。
プライバシーを重視し、データはローカルに保存され、テレメトリー機能はありません。
互換性・特徴
- デスクトップアプリケーション
- 音声AI
- PC操作自動化
- Webブラウザ自動化
- Node.js
- AI
基本情報
| ライセンス | MIT |
| Stars | 1 |
| Forks | 1 |
| カテゴリ | AIエージェント |
| アクティビティ | low |
最新のissue
- 外部ディスプレイ利用時に、画面キャプチャが空のthumbnailを返す (更新: 2026-05-29 / Screen capture returns empty thumbnail for granted external display)
- リアルタイム通話のSettingsにvoice pickerを追加する機能 (更新: 2026-05-29 / Add Settings voice picker for Realtime calls)
GitHub: https://github.com/KenKaiii/brah
