3,714 repos GH 3,599 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (381 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
livekit-starter
LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…
★ 1 MIT 2026-06-18
ASR / 音声認識
GitHub
stenographer
「stenographer」は、macOSネイティブの音声認識機能を活用したコマンドラインツールです。音声ファイルやライブマイ…
★ 1 2026-06-08
ASR / 音声認識
GitHub
jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
ASR / 音声認識
GitHub
Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
ASR / 音声認識
GitHub
VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
ASR / 音声認識
GitHub
english-vocal-medical-terminology-mini
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インター…
★ 1 NOASSERTION 2026-06-09
ASR / 音声認識
GitHub
aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 ⑂ 1 AGPL-3.0 2026-05-27
ASR / 音声認識
GitHub
callcapture
macOS向けのプライベートなローカルファーストの通話・会議録音ツール「CallCapture」は、Google Meet、Zoom、Teams…
★ 1 AGPL-3.0 2026-06-09
ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ASR / 音声認識
GitHub
diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-18
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
ASR / 音声認識
GitHub
AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-16
ASR / 音声認識
GitHub
dji-mic-command
このツール「DJI Mic Command」は、DJIワイヤレスマイク受信機の接続ボタンをmacOSの右Commandキーに変換するユーテ…
★ 1 MIT 2026-05-25
ASR / 音声認識
GitHub
Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識
GitHub
Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
ASR / 音声認識
GitHub
mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 1 MIT 2026-06-08
ASR / 音声認識
GitHub
openless
openlessは、macOSおよびWindowsで利用可能な音声入力ツールで、ホットキーを使って音声をAIが洗練したテキストに変…
★ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 1 MIT 2026-06-17
ASR / 音声認識
GitHub
zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-06-10