概要
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。
ユーザーは「hello」というウェイクワードでアシスタントを起動し、音声でAIと自然な会話をしたり、DALL·E 3による画像生成を指示したりできます。
リアルタイムの音声認識とテキスト読み上げ機能により、完全にハンズフリーでの操作が可能です。
生成された画像は自動的にローカルに保存され、すぐに表示されます。
Pythonベースで、WindowsおよびmacOSに対応しており、簡単なセットアップで利用できるため、音声でAIアシスタントや画像生成を手軽に利用したいユーザーに最適です。
互換性・特徴
- Python
- CLI
- Windows対応
- macOS対応
- 音声認識
- OpenAI API利用
基本情報
| Stars | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |