3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#音声認識 (104 repos)

「音声認識」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
voxrt-asr-android
このツールは、Androidデバイス向けに設計されたストリーミング音声認識ライブラリです。VoxRT独自のオンデバイス推…
★ 10 Apache-2.0 2026-06-04
ASR / 音声認識
GitHub
voxrt-asr-ios
VoxrtAsr for iOSは、オンデバイスで動作するストリーミング音声認識ライブラリです。独自開発のRust製推論ランタイ…
★ 8 ⑂ 1 Apache-2.0 2026-06-04
ASR / 音声認識
GitHub
freestyle
Freestyleは、macOS向けのオープンソースAI音声ディクテーションツールです。ユーザーはホットキーを長押しして話し…
★ 8 ⑂ 1 Apache-2.0 2026-05-24
ASR / 音声認識
GitHub
SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 8 ⑂ 1 2026-05-22
ASR / 音声認識
GitHub
nexo-whisper
Nexo Whisperは、macOS向けのネイティブアプリで、音声による文字起こしを100%ローカルで行います。ホットキーを押し…
★ 7 ⑂ 2 NOASSERTION 2026-05-31
ASR / 音声認識
GitHub
soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-16
ASR / 音声認識
GitHub
murmur
Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…
★ 6 MIT 2026-06-09
ASR / 音声認識
GitHub
whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 5 NOASSERTION 2026-06-15
音声生成 / TTS
GitHub
voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ASR / 音声認識
GitHub
VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 5 AGPL-3.0 2026-05-20
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 5 ⑂ 1 MIT 2026-06-04
ASR / 音声認識
GitHub
BoltScribe
BoltScribeは、macOS向けの軽量な音声入力アプリケーションです。グローバルホットキーを使ってどこからでも音声の録…
★ 4 NOASSERTION 2026-06-17
ASR / 音声認識
GitHub
H-VibeRec
H-VibeRecは、macOSユーザー向けのローカルファーストなデスクトップアプリケーションです。会議の録音や音声ファイ…
★ 4 AGPL-3.0 2026-05-07
ASR / 音声認識
GitHub
praxies
「Praxies」は、プライベートなローカルファーストのデスクトップビデオジャーナルアプリケーションです。ユーザーは…
★ 4 MIT 2026-05-13
マルチモーダル
GitHub
mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
ASR / 音声認識
GitHub
athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-09
ASR / 音声認識
GitHub
obsidian-audio-capsule
このツールは、Obsidian向けの音声カプセルレコーダープラグインです。iOSのボイスメモに似たUIでノート内に音声を録…
★ 2 MIT 2026-06-02
ASR / 音声認識
GitHub
Qvoice
Qvoiceは、macOS向けのローカル音声テキスト変換ツールです。Controlキーをダブルタップするだけで録音の開始、停止…
★ 2 ⑂ 1 MIT 2026-06-05