3,353 repos GH 3,238 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
ASR / 音声認識 (333 repos)
カテゴリ「ASR / 音声認識」のリポジトリ一覧
← 全カテゴリ
ComfyUI GitHub ComfyUI-Whisper
ComfyUI Whisperは、OpenAIのWhisperモデルを利用して音声の文字起こしや動画への字幕追加を可能にするComfyUIの拡張…
★ 242 ⑂ 39 NOASSERTION 2026-06-07
ASR / 音声認識 GitHub CrispASR
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ gg…
★ 239 ⑂ 32 MIT 2026-05-30
ASR / 音声認識 GitHub BiliSum
BiliSumは、Bilibili、YouTube、ローカル動画を対象としたAI動画要約・知識ベースツールです。動画コンテンツを検索…
★ 237 ⑂ 20 2026-05-30
ASR / 音声認識 GitHub opentypeless
OpenTypelessは、オープンソースのデスクトップAI音声入力ツールです。自然な発話で音声をテキストに変換し、AIが自…
★ 228 ⑂ 38 MIT 2026-05-23
ASR / 音声認識 GitHub SoulX-Transcriber
SoulX-Transcriberは、複数の話者が登場する対話シナリオにおいて、話者特定(ダイアライゼーション)、タイムスタン…
★ 225 ⑂ 10 Apache-2.0 2026-06-04
ASR / 音声認識 GitHub v2s
v2sは、macOS上で動作するライブバイリンガル字幕ツールです。会議、通話、ストリーム、ビデオなどの際に、マイク入…
★ 170 ⑂ 15 2026-05-30
ASR / 音声認識 GitHub ChordVox
ChordVox IMEは、あなたの声を最速のキーボードに変える、完全にローカルで動作するAI音声入力ツールです。アイデア…
★ 163 ⑂ 9 MIT 2026-05-31
ASR / 音声認識 GitHub openwhisp
Openwhispは、Mac上で完全にローカルに動作する音声認識・テキスト補完ツールです。Fnキーを押しながら話すことで、…
★ 152 ⑂ 26 2026-04-11
ASR / 音声認識 GitHub blitztext-app
Blitztext Appは、macOS向けの実験的なオープンソースのメニューバーアプリです。ホットキーで音声を録音し、テキス…
★ 136 ⑂ 47 MIT 2026-06-02
ASR / 音声認識 GitHub awesome-voice-typing
このプロジェクトは、オープンソースの音声テキスト化ツールと音声入力ツールの厳選されたリストです。Linux、macOS…
★ 123 ⑂ 17 MIT 2026-05-17
ASR / 音声認識 GitHub wispr
Wisprは、macOSユーザー向けのプライバシーを重視した音声書き起こしアプリケーションです。OpenAI WhisperとNVIDIA …
★ 122 ⑂ 17 Apache-2.0 2026-05-29
ASR / 音声認識 GitHub ai-course-notes
このプロジェクトは、AI/LLM関連の公開講義、インタビュー、技術記事を中国語でまとめた学習リソースです。合計303の…
★ 119 ⑂ 4 NOASSERTION 2026-05-25
ASR / 音声認識 GitHub claude-telegram-supercharged
このツールは、Anthropicの公式Claude Telegramプラグインを大幅に強化するドロップインアップグレードです。音声メ…
★ 105 ⑂ 13 Apache-2.0 2026-04-28
ASR / 音声認識 GitHub Doubao-ime-hammerspoon
このプロジェクトは、macOS上で「豆包入力法」の優れた無料音声入力機能を、メインの入力法として利用せずに便利に使…
★ 103 ⑂ 7 2026-04-04
ASR / 音声認識 GitHub murmur
Murmurは、macOS向けの無料オフライン音声テキスト変換ツールです。ホットキーを押している間だけ音声を録音し、離す…
★ 103 ⑂ 8 MIT 2026-04-11
ASR / 音声認識 GitHub subforge
SubForgeは、動画字幕制作を再現性のあるAIパイプラインに変えるために設計されたRust製のコマンドラインインターフ…
★ 86 ⑂ 8 MIT 2026-06-01
ASR / 音声認識 GitHub HearoPilot-App
HearoPilotは、Androidデバイス上で動作するオンデバイスAI会議アシスタントです。リアルタイムの音声文字起こしとLL…
★ 83 ⑂ 29 Apache-2.0 2026-04-09
ASR / 音声認識 GitHub claude-code-auto-video-edit
「claude-code-auto-video-edit」は、Claude Codeのコマンドとして機能し、口播やチュートリアル動画のAロール粗編集…
★ 82 ⑂ 9 MIT 2026-04-06
ASR / 音声認識 GitHub subarr
subarrは、BazarrやSubgenなどの*arrサブタイトルスタックを連携・管理する品質レイヤーです。メディアライブラリ全…
★ 82 MIT 2026-06-10
ASR / 音声認識 GitHub trx
「crafter/trx」は、Whisperを活用してオーディオやビデオを書き起こすためのエージェントファーストなCLIツールです…
★ 82 ⑂ 14 MIT 2026-04-07
ASR / 音声認識 GitHub mediascribe
MediaScribeは、音声、ビデオ、テキストの文字起こしと、LLMを活用した要約を提供するコマンドラインツールです。そ…
★ 80 ⑂ 1 MIT 2026-04-16
ASR / 音声認識 GitHub diarize
diarizeは、音声ファイルから「誰がいつ話したか」を自動的に識別するPython製のスピーカーダイアリゼーションツール…
★ 78 ⑂ 6 Apache-2.0 2026-05-06
ASR / 音声認識 GitHub AriaType
AriaTypeは、デスクトップ向けの音声入力ツールで、話した内容をカーソルがある場所に直接テキストとして挿入します…
★ 75 ⑂ 5 AGPL-3.0 2026-06-01
ASR / 音声認識 GitHub Aria
AriaはWindows向けのAI音声入力ツールで、Qwen3-ASRを基盤とし、全ての音声処理をローカルで完結します。特徴として…
★ 71 ⑂ 12 Apache-2.0 2026-04-17