1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

prj-voca-ai

★ 5 MIT 更新: 2026-04-23 GitHubで見る →

概要

Vocaは、WhatsAppなどの音声メッセージを、ChatGPT、Claude、Geminiといったあらゆる大規模言語モデル(LLM)で利用可能な、構造化された最適化されたプロンプトに変換するWebツールです。

ユーザーは、最長25MBまでの多様な音声ファイル(.ogg, .mp3, .m4aなど)をアップロードでき、システムはまずOpenAIのgpt-4o-mini-transcribeを用いて多言語対応の高精度な文字起こしを行い、その後gpt-5.4-miniが言語の癖を取り除き、タスクを明確にし、リッチなプロンプトとして構造化します。

生成されたプロンプトはMarkdownまたはJSON形式でエクスポート可能で、個人履歴として保存・管理できます。

このツールは、音声での思考を効率的にLLMプロンプトに落とし込みたいビジネスユーザーやコンテンツクリエイター、または日常的に音声メッセージを利用するユーザーに最適です。

セキュリティ機能も充実しており、プライバシー保護にも配慮されています。

互換性・特徴

  • Web UI
  • LLM連携
  • 多言語対応
  • TypeScript
  • Next.js
  • Cloud/SaaS

基本情報

ライセンスMIT
Stars5
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/euvhmac/prj-voca-ai