3,714 repos GH 3,599 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (381 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識
GitHub
runningapp
RunTrack GPSは、SwiftUIとMVVMアーキテクチャで構築された、ネイティブiOS向けの軽量GPSランニングアプリです。ユー…
★ 2 2026-06-17
ASR / 音声認識
GitHub
hey-claude
「Hey Claude」は、ブラウザからハンズフリーでAnthropicのClaude Codeを音声操作できるツールです。ウェイクワード…
★ 2 MIT 2026-06-10
ASR / 音声認識
GitHub
agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識
GitHub
Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 2 ⑂ 2 MIT 2026-05-24
ASR / 音声認識
GitHub
TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-06-11
ASR / 音声認識
GitHub
YanXi-KCN
Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…
★ 2 2026-05-29
ASR / 音声認識
GitHub
VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 2 MIT 2026-06-18
ASR / 音声認識
GitHub
docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-22
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-09
ASR / 音声認識
GitHub
TypelessMLX
TypelessMLXは、Apple Silicon搭載Mac向けに設計された音声認識アプリケーションです。ユーザーの音声をローカルでテ…
★ 2 2026-06-14
ASR / 音声認識
GitHub
live-translation
Live Translationは、macOS上でシステムオーディオをリアルタイムでキャプション表示し、任意の言語へ翻訳して、半透…
★ 2 MIT 2026-06-19
ASR / 音声認識
GitHub
WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 2 MIT 2026-05-17
ASR / 音声認識
GitHub
obsidian-audio-capsule
このツールは、Obsidian向けの音声カプセルレコーダープラグインです。iOSのボイスメモに似たUIでノート内に音声を録…
★ 2 MIT 2026-06-02
ASR / 音声認識
GitHub
openwritr-windows
OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…
★ 2 MIT 2026-06-12
ASR / 音声認識
GitHub
voice-sentiment-analysis
このAIベースの音声感情分析アプリケーションは、話された言葉をテキストに変換し、NLPモデルを用いてリアルタイムで…
★ 2 ⑂ 1 2026-04-21
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-16
ASR / 音声認識
GitHub
aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 ⑂ 1 AGPL-3.0 2026-05-27
ASR / 音声認識
GitHub
callcapture
macOS向けのプライベートなローカルファーストの通話・会議録音ツール「CallCapture」は、Google Meet、Zoom、Teams…
★ 1 AGPL-3.0 2026-06-09
ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ASR / 音声認識
GitHub
diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-18