3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#音声認識 (104 repos)
「音声認識」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識 GitHub waveshare-esp32-s3-ai-home-assistant-voice
このリポジトリは、Waveshare ESP32-S3 AI Smart Speaker Development BoardをHome Assistantのローカル音声アシスタ…
★ 2 MIT 2026-05-30
ASR / 音声認識 GitHub whispyai
WhispyAIは、macOS向けのメニューバーユーティリティで、Appleの音声認識を使いテキストを口述筆記し、AIで洗練され…
★ 2 MIT 2026-06-07
ASR / 音声認識 GitHub Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 2 ⑂ 2 MIT 2026-05-24
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-16
LLM GitHub voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
ASR / 音声認識 GitHub openwritr-windows
OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…
★ 2 MIT 2026-06-12
ASR / 音声認識 GitHub macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-15
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
ASR / 音声認識 GitHub agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識 GitHub universal_caption
Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャ…
★ 2 2026-06-10
ASR / 音声認識 GitHub VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 2 MIT 2026-06-18
ASR / 音声認識 GitHub VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
音声生成 / TTS GitHub claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-10
ASR / 音声認識 GitHub perihelion
Perihelionは、VRChat向けに設計された音声認識(ASR)アプリケーションです。VRChatとOSCを介して連携し、ユーザー…
★ 1 2026-06-15
マルチモーダル GitHub gaze
このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…
★ 1 MIT 2026-06-17
LLM GitHub local-llm-2-2026
このツール「Local Llm 2 2026」は、Windowsユーザー向けにローカル環境で大規模言語モデル(LLM)を簡単に実行でき…
★ 1 2026-06-14
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub voice-input-dist
voice-input-distは、Windows PC向けのリアルタイム音声テキスト変換アプリです。ホットキー一つで音声入力を開始・…
★ 1 2026-06-16
ASR / 音声認識 GitHub Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-22
ASR / 音声認識 GitHub VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
ASR / 音声認識 GitHub dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
音声生成 / TTS GitHub MeteorVoice
MeteorVoiceは、AIを活用した音声ファーストの英会話コーチングツールです。ユーザーは様々なシナリオを選び、AIコー…
★ 1 ⑂ 1 MIT 2026-06-13