概要
このツールは、オープンソース技術(Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど)を基にゼロから構築された音声AIアシスタントです。
ユーザーがマイクを通じて話しかけると、AIがその音声をテキストに変換し、内容を理解して応答を生成し、さらに生成されたテキストを音声に変換して返します。
完全に無料で利用でき、ChatGPTや有料ラッパーを使用せず、純粋なコードで実現されています。
手軽にAIとの会話体験を求める一般ユーザーや、オープンソースのAI技術スタックに関心のある開発者に最適で、Web UIを通じて簡単にアクセスできます。
互換性・特徴
- 音声AI
- AIチャット
- Web UI
- Python
- FastAPI
- Docker
- HuggingFace Spaces対応
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |