概要
Vocaは、WhatsAppなどの音声メッセージを、ChatGPT、Claude、Geminiといったあらゆる大規模言語モデル(LLM)で利用可能な、構造化された最適化されたプロンプトに変換するWebツールです。
ユーザーは、最長25MBまでの多様な音声ファイル(.ogg, .mp3, .m4aなど)をアップロードでき、システムはまずOpenAIのgpt-4o-mini-transcribeを用いて多言語対応の高精度な文字起こしを行い、その後gpt-5.4-miniが言語の癖を取り除き、タスクを明確にし、リッチなプロンプトとして構造化します。
生成されたプロンプトはMarkdownまたはJSON形式でエクスポート可能で、個人履歴として保存・管理できます。
このツールは、音声での思考を効率的にLLMプロンプトに落とし込みたいビジネスユーザーやコンテンツクリエイター、または日常的に音声メッセージを利用するユーザーに最適です。
セキュリティ機能も充実しており、プライバシー保護にも配慮されています。
互換性・特徴
- Web UI
- LLM連携
- 多言語対応
- TypeScript
- Next.js
- Cloud/SaaS
基本情報
| ライセンス | MIT |
| Stars | 5 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
