概要
UAL(Understand Any Language)は、ESP32-S3を基盤としたIoT音声翻訳プロトタイプです。
距離センサーでユーザーを検知し、マイクで音声を取り込み、OpenRouterのクラウドAIを通じて音声認識(STT)、翻訳、音声合成(TTS)を行います。
翻訳された音声はI2Sスピーカーから再生され、ローカルのWebコントロールパネルやシリアルコマンドで設定・操作が可能です。
物理的なデバイスとして、リアルタイムでの多言語コミュニケーションを支援し、IoT分野での実用的な音声翻訳ソリューションを求めるユーザーに適しています。
互換性・特徴
- ESP32-S3
- IoT
- C++
- OpenRouter AI
- 音声翻訳
- Web UI
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
GitHub: https://github.com/mo-tunn/UAL
