1,761 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (152 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
Echo
GitHubPhobosが開発した「Ech👂 Voice Typing Assistant」は、高速でプライバシーを重視したプッシュトゥトーク方式…
★ 2 MIT 2026-05-13
ASR / 音声認識
GitHub
AirControl
AirControlは、Windows 10/11向けの革新的な空中ジェスチャーと音声制御システムです。MediaPipeによる手の動き認識…
★ 2 ⑂ 1 Apache-2.0 2026-05-18
ASR / 音声認識
GitHub
CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06
ASR / 音声認識
GitHub
taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
ASR / 音声認識
GitHub
easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。音声や動画をテキストに変換し…
★ 2 MIT 2026-05-18
ASR / 音声認識
GitHub
Gstrl
GstrlはmacOS 14+向けの画期的なユーティリティで、ジェスチャー、音声、AIエージェントを組み合わせた直感的な操作…
★ 2 ⑂ 1 MIT 2026-05-13
ASR / 音声認識
GitHub
agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 2 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識
GitHub
docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-19
ASR / 音声認識
GitHub
ZenTap
ZenTapは、macOS向けの小型オープンソース音声入力ツールです。フローティングウィンドウのクリック操作で音声入力を…
★ 2 MIT 2026-05-21
ASR / 音声認識
GitHub
claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-05-20
ASR / 音声認識
GitHub
AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-16
ASR / 音声認識
GitHub
shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 1 AGPL-3.0 2026-05-17
ASR / 音声認識
GitHub
meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 1 2026-05-22
ASR / 音声認識
GitHub
ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
ASR / 音声認識
GitHub
open-studio
Open-studioは、デジタルクリエイターのコンテンツ制作ワークフローを効率化するためのオープンソースワークスペース…
★ 1 MIT 2026-05-13
ASR / 音声認識
GitHub
liqaa-meet
liqaa-meetは、ユーザーが自分のハードウェア上でホストすることで、プライバシーとデータ主権を確保できるオープン…
★ 1 AGPL-3.0 2026-05-17
ASR / 音声認識
GitHub
translarr
Translarrは、Sonarr、Radarr、Emby、Jellyfin、Plexといったarrスタックと連携するセルフホスト型のDockerコンテナ…
★ 1 MIT 2026-05-16
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 1 MIT 2026-05-19
ASR / 音声認識
GitHub
visionreview-ai-showcase
VisionReview AIは、AIを活用した動画レビューおよび編集ワークフローシステムです。ビデオ編集者、コンテンツクリエ…
★ 1 2026-05-22
ASR / 音声認識
GitHub
Murmur
Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…
★ 1 NOASSERTION 2026-05-21