3,004 repos GH 2,889 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

reachy-mini-agent

★ 2 Apache-2.0 更新: 2026-06-01 GitHubで見る →

概要

reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。

このツールは、ローカルLLM(Ollama/Qwen3)を活用し、ロボットがユーザーと自然にインタラクションできるよう設計されています。

GPU上で完全に動作し、Whisperによる音声認識、KokoroまたはMicrosoft Edgeによるテキスト読み上げ、WebRTCを介したオーディオ/ビデオ通信、MediaPipeによるハンドジェスチャー認識、YuNetによる顔追跡などの機能を統合しています。

10秒ごとに視覚-言語モデルがカメラの視覚情報をLLMに提供することで、ロボットは周囲の状況を理解し、状況に応じた応答や動作(頭のポーズ、表情豊かなアクション)が可能です。

開発者やReachy Miniロボットのユーザーが、ローカル環境で高度なAIエージェントを構築・運用するのに適しています。

互換性・特徴

  • GPU必須
  • Python
  • Local LLM
  • 音声認識
  • 音声合成
  • ロボット対応

基本情報

ライセンスApache-2.0
Stars2
カテゴリマルチモーダル
アクティビティlow

最新リリース: v0.1.0 — first public release (2026-04-15)

GitHub: https://github.com/thc1006/reachy-mini-agent