1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (144 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
one-key-input
One-Key Inputは、特定のキーを押しながら話すだけで、AIが文脈を理解して洗練されたテキストをカーソル位置に直接入…
★ 2 MIT 2026-05-22
ASR / 音声認識
GitHub
AirControl
AirControlは、Windows 10/11向けの革新的な空中ジェスチャーと音声制御システムです。MediaPipeによる手の動き認識…
★ 2 ⑂ 1 Apache-2.0 2026-05-18
ASR / 音声認識
GitHub
CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06
ASR / 音声認識
GitHub
easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。音声や動画をテキストに変換し…
★ 2 MIT 2026-05-18
ASR / 音声認識
GitHub
taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
ASR / 音声認識
GitHub
Gstrl
GstrlはmacOS 14+向けの画期的なユーティリティで、ジェスチャー、音声、AIエージェントを組み合わせた直感的な操作…
★ 2 ⑂ 1 MIT 2026-05-13
ASR / 音声認識
GitHub
agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 2 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識
GitHub
WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 2 MIT 2026-05-17
ASR / 音声認識
GitHub
docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-19
ASR / 音声認識
GitHub
Echo
GitHubPhobosが開発した「Ech👂 Voice Typing Assistant」は、高速でプライバシーを重視したプッシュトゥトーク方式…
★ 2 MIT 2026-05-13
ASR / 音声認識
GitHub
voice-sentiment-analysis
このAIベースの音声感情分析アプリケーションは、話された言葉をテキストに変換し、NLPモデルを用いてリアルタイムで…
★ 2 ⑂ 1 2026-04-21
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 1 MIT 2026-05-19
ASR / 音声認識
GitHub
visionreview-ai-showcase
VisionReview AIは、AIを活用した動画レビューおよび編集ワークフローシステムです。ビデオ編集者、コンテンツクリエ…
★ 1 2026-05-22
ASR / 音声認識
GitHub
TinyML-Offline-Voice-Control-ESP32
このプロジェクトは、TinyMLとESP32を用いた、適応型ノイズ耐性オフライン音声制御マイクロコントローラーシステムで…
★ 1 ⑂ 2 MIT 2026-05-18
ASR / 音声認識
GitHub
Murmur
Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…
★ 1 NOASSERTION 2026-05-21
ASR / 音声認識
GitHub
hotkeys
Hotkeysは、AIを活用してあらゆるアプリケーションでのテキスト編集作業を劇的に効率化するホットキーアプリです。選…
★ 1 2026-05-20
ASR / 音声認識
GitHub
openwakeword-trainer
このツールは、オープンソースのウェイクワードエンジン「openWakeWord」用のカスタムモデルを、DockerとGPUを活用し…
★ 1 2026-05-13
ASR / 音声認識
GitHub
Sara-the-ai-assistant
S.A.R.Aは、ローカルLLMとWhisper音声認識を活用し、完全に音声で操作可能なJARVIS風AIデスクトップアシスタントです…
★ 1 MIT 2026-05-18
ASR / 音声認識
GitHub
voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-20
ASR / 音声認識
GitHub
Elderly-Care-Companion
Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…
★ 1 2026-05-19
ASR / 音声認識
GitHub
VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 Apache-2.0 2026-05-13