概要
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。
このツールは、ローカルLLM(Ollama/Qwen3)を活用し、ロボットがユーザーと自然にインタラクションできるよう設計されています。
GPU上で完全に動作し、Whisperによる音声認識、KokoroまたはMicrosoft Edgeによるテキスト読み上げ、WebRTCを介したオーディオ/ビデオ通信、MediaPipeによるハンドジェスチャー認識、YuNetによる顔追跡などの機能を統合しています。
10秒ごとに視覚-言語モデルがカメラの視覚情報をLLMに提供することで、ロボットは周囲の状況を理解し、状況に応じた応答や動作(頭のポーズ、表情豊かなアクション)が可能です。
開発者やReachy Miniロボットのユーザーが、ローカル環境で高度なAIエージェントを構築・運用するのに適しています。
互換性・特徴
- GPU必須
- Python
- Local LLM
- 音声認識
- 音声合成
- ロボット対応
基本情報
| ライセンス | Apache-2.0 |
| Stars | 2 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新リリース: v0.1.0 — first public release (2026-04-15)
