1,891 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

pi-listens

★ 2 MIT 更新: 2026-05-11 GitHubで見る →

概要

@p8n.ai/pi-listensは、音声認識(STT)と音声合成(TTS)機能を提供する、音声ファーストのPiパッケージです。

デフォルトでSarvam AIを統合し、ストリーミングSTTのSarvam SaarasとTTSのSarvam Bulbulを利用可能。

本ツールは、エージェントが音声で質問し、聞き取り、文字起こしを行う音声ファーストの対話ループを実現します。

Piの拡張ツールとして、インタラクティブなTUI、ヘッドレス/RPCでの利用に対応。

Piエージェントが利用する`voice_output`、`voice_input`、`voice_ask`などのツールを提供し、音声による指示入力や応答を可能にします。

想定ユーザーは、Pi環境でSarvam AIを活用し、音声インターフェースを介してAIエージェントと自然に対話したい開発者やエンドユーザーです。

利用にはSarvam AI APIキーに加え、SoXやFFmpegなどのローカルオーディオツールが必要です。

互換性・特徴

  • Pi対応
  • CLI
  • 音声認識 (STT)
  • 音声合成 (TTS)
  • Sarvam AI連携
  • WebSockets

基本情報

ライセンスMIT
Stars2
カテゴリ音声生成 / TTS
アクティビティlow

最新リリース: v0.3.1 (2026-05-11)

GitHub: https://github.com/p8n-ai/pi-listens