3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (378 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
ASR / 音声認識
GitHub
bruno
macOS向けのミニマルなデスクトップコンパニオン「Bruno」は、画面を監視し、ユーザーがタスクから外れると音声で通…
★ 1 GPL-3.0 2026-06-14
ASR / 音声認識
GitHub
Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
ASR / 音声認識
GitHub
voxline
voxlineは、macOS向けのネイティブ音声入力アプリです。ホットキーを押しながら話すだけで、あなたの声を洗練された…
★ 1 Apache-2.0 2026-06-09
ASR / 音声認識
GitHub
claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識
GitHub
local-dictation
Apple Silicon搭載Mac向けに設計された、超低遅延かつ完全オンデバイスで動作する音声入力ツールです。ホットキーを…
★ 1 Apache-2.0 2026-06-04
ASR / 音声認識
GitHub
proto-android-native
PROTO Androidは、KotlinとJetpack Composeで開発された公式Androidメッセンジャークライアントです。チャット、音声…
★ 1 NOASSERTION 2026-05-31
ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
ASR / 音声認識
GitHub
stenographer
「stenographer」は、macOSネイティブの音声認識機能を活用したコマンドラインツールです。音声ファイルやライブマイ…
★ 1 2026-06-08
ASR / 音声認識
GitHub
jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
ASR / 音声認識
GitHub
voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-19
ASR / 音声認識
GitHub
english-vocal-medical-terminology-mini
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インター…
★ 1 NOASSERTION 2026-06-09
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-16
ASR / 音声認識
GitHub
aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 ⑂ 1 AGPL-3.0 2026-05-27
ASR / 音声認識
GitHub
callcapture
macOS向けのプライベートなローカルファーストの通話・会議録音ツール「CallCapture」は、Google Meet、Zoom、Teams…
★ 1 AGPL-3.0 2026-06-09
ASR / 音声認識
GitHub
mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ASR / 音声認識
GitHub
diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 ⑂ 1 Apache-2.0 2026-05-28
ASR / 音声認識
GitHub
AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
ASR / 音声認識
GitHub
liqaa-meet
liqaa-meetは、ユーザーが自分のハードウェア上でホストすることで、プライバシーとデータ主権を確保できるオープン…
★ 0 AGPL-3.0 2026-06-14