1,244 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

volocal

★ 71 ⑂ 5 MIT 更新: 2026-04-02 GitHubで見る →

概要

Volocalは、iOSデバイス上で完全にローカルに動作する音声AIアプリです。

STT(音声認識)からLLM(大規模言語モデル)による処理、TTS(音声合成)までの一連のプロセスを、クラウドやAPIキー、インターネット接続なしでリアルタイムに実行します。

主な特徴として、リアルタイム音声会話、発話途中での割り込み(barge-in)、ハードウェアエコーキャンセル、初回起動時の全モデル(約2.3GB)ダウンロードがあります。

iPhone 15などのAppleデバイスのNeural Engine、GPU、CPUを効率的に活用し、各コンポーネント間で負荷を分散させることで高いパフォーマンスを実現しています。

サーバーコストをかけずに音声AIを利用したいiOSユーザーが主な想定ユーザーです。

互換性・特徴

  • iOS
  • オフライン
  • 音声AI
  • STT
  • LLM
  • TTS
  • CoreML

基本情報

ライセンスMIT
Stars71
Forks5
カテゴリTTS / 音声
アクティビティlow

GitHub: https://github.com/fikrikarim/volocal