1,768 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
ASR / 音声認識 (158 repos)
カテゴリ「ASR / 音声認識」のリポジトリ一覧
← 全カテゴリ
ASR / 音声認識
GitHub WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 2 MIT 2026-05-17
ASR / 音声認識 GitHub voice-sentiment-analysis
このAIベースの音声感情分析アプリケーションは、話された言葉をテキストに変換し、NLPモデルを用いてリアルタイムで…
★ 2 ⑂ 1 2026-04-21
ASR / 音声認識 GitHub one-key-input
One-Key Inputは、特定のキーを押しながら話すだけで、AIが文脈を理解して洗練されたテキストをカーソル位置に直接入…
★ 2 MIT 2026-05-22
ASR / 音声認識
GitHub AirControl
AirControlは、Windows 10/11向けの革新的な空中ジェスチャーと音声制御システムです。MediaPipeによる手の動き認識…
★ 2 ⑂ 1 Apache-2.0 2026-05-18
ASR / 音声認識 GitHub CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06
ASR / 音声認識
GitHub taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
ASR / 音声認識
GitHub easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。音声や動画をテキストに変換し…
★ 2 MIT 2026-05-18
ASR / 音声認識 GitHub AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-05-21
ASR / 音声認識 GitHub agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識 GitHub LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 2 Apache-2.0 2026-05-15
ASR / 音声認識 GitHub voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識 GitHub Fast-Sub
Fast Subは、動画および音声ファイル用のローカルファーストの字幕ツールです。字幕の生成と翻訳を、ユーザーのデバ…
★ 2 MIT 2026-05-23
ASR / 音声認識
GitHub TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-05-23
ASR / 音声認識 GitHub docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-19
ASR / 音声認識
GitHub ZenTap
ZenTapは、macOS向けの小型オープンソース音声入力ツールです。フローティングウィンドウのクリック操作で音声入力を…
★ 2 MIT 2026-05-21
ASR / 音声認識
GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
ASR / 音声認識
GitHub claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-05-20
ASR / 音声認識
GitHub AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識
GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-16
ASR / 音声認識
GitHub shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 1 AGPL-3.0 2026-05-17
ASR / 音声認識
GitHub meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 1 2026-05-22
ASR / 音声認識 GitHub ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
ASR / 音声認識
GitHub open-studio
Open-studioは、デジタルクリエイターのコンテンツ制作ワークフローを効率化するためのオープンソースワークスペース…
★ 1 MIT 2026-05-24
ASR / 音声認識
GitHub liqaa-meet
liqaa-meetは、ユーザーが自分のハードウェア上でホストすることで、プライバシーとデータ主権を確保できるオープン…
★ 1 AGPL-3.0 2026-05-17