3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#音声認識 (104 repos)
「音声認識」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-16
ASR / 音声認識 GitHub murmur
Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…
★ 6 MIT 2026-06-09
ASR / 音声認識 GitHub VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 5 AGPL-3.0 2026-05-20
ComfyUI GitHub MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 5 ⑂ 1 MIT 2026-06-04
ASR / 音声認識 GitHub whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 5 NOASSERTION 2026-06-15
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ASR / 音声認識 GitHub H-VibeRec
H-VibeRecは、macOSユーザー向けのローカルファーストなデスクトップアプリケーションです。会議の録音や音声ファイ…
★ 4 AGPL-3.0 2026-05-07
ASR / 音声認識 GitHub BoltScribe
BoltScribeは、macOS向けの軽量な音声入力アプリケーションです。グローバルホットキーを使ってどこからでも音声の録…
★ 4 NOASSERTION 2026-06-17
ASR / 音声認識 GitHub praxies
「Praxies」は、プライベートなローカルファーストのデスクトップビデオジャーナルアプリケーションです。ユーザーは…
★ 4 MIT 2026-05-13
ASR / 音声認識 GitHub smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
ASR / 音声認識 GitHub scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ASR / 音声認識 GitHub tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
マルチモーダル GitHub mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
ASR / 音声認識 GitHub athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
ASR / 音声認識 GitHub LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-16
LLM GitHub voice-rag-agent
VoiceRAG Agentは、FastAPIを基盤としたローカル優先の音声対音声RAGアシスタントです。ユーザーは自身のドキュメン…
★ 2 MIT 2026-06-01
ASR / 音声認識 GitHub openwritr-windows
OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…
★ 2 MIT 2026-06-12
ASR / 音声認識 GitHub macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-15
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
ASR / 音声認識 GitHub VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 2 MIT 2026-06-18
ASR / 音声認識 GitHub universal_caption
Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャ…
★ 2 2026-06-10
ASR / 音声認識 GitHub parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-09