3,729 repos GH 3,614 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Voice-RAG-Assistant

★ 1 更新: 2026-06-17 GitHubで見る →

概要

このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augmented Generation (RAG) アシスタントです。

ユーザーの音声入力をWhisperでテキストに変換し、埋め込み技術を用いて関連文書から情報を検索。

そのコンテキストとクエリをGroqまたはGoogle Generative AIに渡し、回答を生成します。

生成された回答はテキスト読み上げ機能で音声としてユーザーに返されます。

ドキュメントベースの質問応答、会話履歴管理、環境変数によるAPIキー管理などの機能を持ち、モジュール化されたスケーラブルなアーキテクチャが特徴です。

カスタム知識ベースからの情報に基づいて質問に答えることができるため、音声インターフェースを介したインテリジェントな情報検索システムを求める開発者やAI愛好家、あるいは特定のドキュメントセットから情報を引き出す必要があるビジネスユーザーに最適です。

互換性・特徴

  • Python
  • CLI
  • 音声認識/合成
  • RAG
  • LLM連携
  • AIアシスタント

基本情報

Stars1
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/ujjwal540/Voice-RAG-Assistant