1,538 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

voice-snap

★ 5 NOASSERTION 更新: 2026-05-19 GitHubで見る →

概要

「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。

高速な音声認識にはfaster_whisperを、自然なテキスト読み上げにはElevenLabsのストリーミングAPIを利用しており、約500〜800msという短い往復遅延で快適な音声対話が可能です。

音声活動検出(VAD)により、不要な文字起こしを抑制し、よりクリアなコミュニケーションをサポートします。

開発者は、Whisperモデルの選択やカスタムの応答ハンドラ(LLM連携など)を組み込むことで、自身のニーズに合わせたAI音声アシスタントを柔軟に構築できます。

このツールは、Pythonで低遅延の音声対話システムを開発したいエンジニアや、AIを活用した新しい音声インターフェースを模索するユーザーに最適です。

互換性・特徴

  • Python
  • AI
  • 音声認識
  • 音声合成
  • 低遅延
  • ライブラリ

基本情報

ライセンスNOASSERTION
Stars5
カテゴリTTS / 音声
アクティビティlow

GitHub: https://github.com/2aronS/voice-snap