reachy-mini-agent

概要

reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。

このツールは、ローカルLLM（Ollama/Qwen3）を活用し、ロボットがユーザーと自然にインタラクションできるよう設計されています。

GPU上で完全に動作し、Whisperによる音声認識、KokoroまたはMicrosoft Edgeによるテキスト読み上げ、WebRTCを介したオーディオ/ビデオ通信、MediaPipeによるハンドジェスチャー認識、YuNetによる顔追跡などの機能を統合しています。

10秒ごとに視覚-言語モデルがカメラの視覚情報をLLMに提供することで、ロボットは周囲の状況を理解し、状況に応じた応答や動作（頭のポーズ、表情豊かなアクション）が可能です。

開発者やReachy Miniロボットのユーザーが、ローカル環境で高度なAIエージェントを構築・運用するのに適しています。

最新リリース: v0.1.0 — first public release (2026-04-15)

GitHub: https://github.com/thc1006/reachy-mini-agent