3,729 repos GH 3,614 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (383 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
awesome-oral-history-ai
このGitHubリポジトリは、ホロコーストの証言とオーラルヒストリーのAI/NLP研究に特化した、データセット、アーカイ…
★ 1 NOASSERTION 2026-06-16
ASR / 音声認識
GitHub
VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 ⑂ 1 Apache-2.0 2026-05-28
ASR / 音声認識
GitHub
whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
ASR / 音声認識
GitHub
memorised-them-all
「Memorised them All」は、Claudeユーザー向けのローカルで完結する知識グラフ生成ツールです。PDF、Officeドキュメ…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
realtime-voice-ai-platform
リアルタイム音声AI顧客サポートプラットフォームは、音声認識(STT)、音声合成(TTS)、マルチエージェントオーケ…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
voxline
voxlineは、macOS向けのネイティブ音声入力アプリです。ホットキーを押しながら話すだけで、あなたの声を洗練された…
★ 1 Apache-2.0 2026-06-09
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
StyleSense-AI
StyleSense-AIは、ワードローブの整理と日々のコーディネートを支援するAIツールです。写真から服の色、質感、生地を…
★ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
ASR / 音声認識
GitHub
slavex
「slaveX」は、3Dアパートにいるヒューマノイドに、音声やテキストで命令して自由に動かすことができるブラウザゲー…
★ 1 MIT 2026-06-11
ASR / 音声認識
GitHub
diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 MIT 2026-06-14
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-16
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
livekit-starter
LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…
★ 1 MIT 2026-06-17
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
ASR / 音声認識
GitHub
ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
ASR / 音声認識
GitHub
Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
ASR / 音声認識
GitHub
claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識
GitHub
AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-17