概要
@p8n.ai/pi-listensは、音声認識(STT)と音声合成(TTS)機能を提供する、音声ファーストのPiパッケージです。
デフォルトでSarvam AIを統合し、ストリーミングSTTのSarvam SaarasとTTSのSarvam Bulbulを利用可能。
本ツールは、エージェントが音声で質問し、聞き取り、文字起こしを行う音声ファーストの対話ループを実現します。
Piの拡張ツールとして、インタラクティブなTUI、ヘッドレス/RPCでの利用に対応。
Piエージェントが利用する`voice_output`、`voice_input`、`voice_ask`などのツールを提供し、音声による指示入力や応答を可能にします。
想定ユーザーは、Pi環境でSarvam AIを活用し、音声インターフェースを介してAIエージェントと自然に対話したい開発者やエンドユーザーです。
利用にはSarvam AI APIキーに加え、SoXやFFmpegなどのローカルオーディオツールが必要です。
互換性・特徴
- Pi対応
- CLI
- 音声認識 (STT)
- 音声合成 (TTS)
- Sarvam AI連携
- WebSockets
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
最新リリース: v0.3.1 (2026-05-11)