概要
Volocalは、iOSデバイス上で完全にローカルに動作する音声AIアプリです。
STT(音声認識)からLLM(大規模言語モデル)による処理、TTS(音声合成)までの一連のプロセスを、クラウドやAPIキー、インターネット接続なしでリアルタイムに実行します。
主な特徴として、リアルタイム音声会話、発話途中での割り込み(barge-in)、ハードウェアエコーキャンセル、初回起動時の全モデル(約2.3GB)ダウンロードがあります。
iPhone 15などのAppleデバイスのNeural Engine、GPU、CPUを効率的に活用し、各コンポーネント間で負荷を分散させることで高いパフォーマンスを実現しています。
サーバーコストをかけずに音声AIを利用したいiOSユーザーが主な想定ユーザーです。
互換性・特徴
- iOS
- オフライン
- 音声AI
- STT
- LLM
- TTS
- CoreML
基本情報
| ライセンス | MIT |
| Stars | 71 |
| Forks | 5 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
