概要
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。
OpenAIのgpt-realtime-2を活用し、Claude Code、Hermes、OpenClawなどのエージェントがユーザーのスピーカーを通じて会話できるようにします。
これにより、エージェントはテキストだけでなく音声でも状況を報告できるようになり、他の作業中でもエージェントの進捗を把握できます。
複雑な音声合成APIの統合プロセスを簡素化し、オーディオの認証、転送、形式変換、システムプレイヤーでの再生、ヘッドレス環境でのフォールバックなどを一手に引き受けます。
エージェント開発者は、`bash speak.sh "テキスト"`という簡単なコマンドで、自身のAIエージェントに高度な音声対話機能を手軽に組み込めます。
互換性・特徴
- Python
- CLI
- WebSockets
- AIエージェント対応
- 音声合成
- マルチプラットフォーム
基本情報
| ライセンス | MIT |
| Stars | 5 |
| Forks | 1 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
