3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
ASR / 音声認識 (378 repos)
カテゴリ「ASR / 音声認識」のリポジトリ一覧
← 全カテゴリ
ASR / 音声認識 GitHub runningapp
RunTrack GPSは、SwiftUIとMVVMアーキテクチャで構築された、ネイティブiOS向けの軽量GPSランニングアプリです。ユー…
★ 2 2026-06-17
ASR / 音声認識 GitHub hey-claude
「Hey Claude」は、ブラウザからハンズフリーでAnthropicのClaude Codeを音声操作できるツールです。ウェイクワード…
★ 2 MIT 2026-06-10
ASR / 音声認識 GitHub Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 2 ⑂ 2 MIT 2026-05-24
ASR / 音声認識 GitHub TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-06-11
ASR / 音声認識 GitHub YanXi-KCN
Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…
★ 2 2026-05-29
ASR / 音声認識 GitHub VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 2 MIT 2026-06-18
ASR / 音声認識 GitHub live-translation
Live Translationは、macOS上でシステムオーディオをリアルタイムでキャプション表示し、任意の言語へ翻訳して、半透…
★ 2 MIT 2026-06-19
ASR / 音声認識 GitHub agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識 GitHub docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-22
ASR / 音声認識 GitHub parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-09
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-16
ASR / 音声認識 GitHub WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 2 MIT 2026-05-17
ASR / 音声認識 GitHub obsidian-audio-capsule
このツールは、Obsidian向けの音声カプセルレコーダープラグインです。iOSのボイスメモに似たUIでノート内に音声を録…
★ 2 MIT 2026-06-02
ASR / 音声認識 GitHub openwritr-windows
OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…
★ 2 MIT 2026-06-12
ASR / 音声認識 GitHub voice-sentiment-analysis
このAIベースの音声感情分析アプリケーションは、話された言葉をテキストに変換し、NLPモデルを用いてリアルタイムで…
★ 2 ⑂ 1 2026-04-21
ASR / 音声認識 GitHub shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 2 AGPL-3.0 2026-05-22
ASR / 音声認識 GitHub macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-15
ASR / 音声認識 GitHub dji-mic-command
このツール「DJI Mic Command」は、DJIワイヤレスマイク受信機の接続ボタンをmacOSの右Commandキーに変換するユーテ…
★ 1 MIT 2026-05-25
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
ASR / 音声認識 GitHub dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
ASR / 音声認識 GitHub ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
ASR / 音声認識 GitHub IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 1 MIT 2026-06-08