655 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

VoiceGPT

★ 1 更新: 2026-05-12 GitHubで見る →

概要

VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。

ユーザーは「hello」というウェイクワードでアシスタントを起動し、音声でAIと自然な会話をしたり、DALL·E 3による画像生成を指示したりできます。

リアルタイムの音声認識とテキスト読み上げ機能により、完全にハンズフリーでの操作が可能です。

生成された画像は自動的にローカルに保存され、すぐに表示されます。

Pythonベースで、WindowsおよびmacOSに対応しており、簡単なセットアップで利用できるため、音声でAIアシスタントや画像生成を手軽に利用したいユーザーに最適です。

互換性・特徴

  • Python
  • CLI
  • Windows対応
  • macOS対応
  • 音声認識
  • OpenAI API利用

基本情報

Stars1
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/DagaVedant/VoiceGPT