3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#音声認識 (104 repos)

「音声認識」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-16
ASR / 音声認識
GitHub
murmur
Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…
★ 6 MIT 2026-06-09
ASR / 音声認識
GitHub
VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 5 AGPL-3.0 2026-05-20
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 5 ⑂ 1 MIT 2026-06-04
ASR / 音声認識
GitHub
whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 5 NOASSERTION 2026-06-15
音声生成 / TTS
GitHub
voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ASR / 音声認識
GitHub
H-VibeRec
H-VibeRecは、macOSユーザー向けのローカルファーストなデスクトップアプリケーションです。会議の録音や音声ファイ…
★ 4 AGPL-3.0 2026-05-07
ASR / 音声認識
GitHub
BoltScribe
BoltScribeは、macOS向けの軽量な音声入力アプリケーションです。グローバルホットキーを使ってどこからでも音声の録…
★ 4 NOASSERTION 2026-06-17
ASR / 音声認識
GitHub
praxies
「Praxies」は、プライベートなローカルファーストのデスクトップビデオジャーナルアプリケーションです。ユーザーは…
★ 4 MIT 2026-05-13
ASR / 音声認識
GitHub
smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
マルチモーダル
GitHub
mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
ASR / 音声認識
GitHub
athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-16
LLM
GitHub
voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
ASR / 音声認識
GitHub
openwritr-windows
OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…
★ 2 MIT 2026-06-12
ASR / 音声認識
GitHub
macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-15
ASR / 音声認識
GitHub
VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 2 MIT 2026-06-18
ASR / 音声認識
GitHub
universal_caption
Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャ…
★ 2 2026-06-10
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-09