3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#音声認識 (104 repos)

「音声認識」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 25.1k ⑂ 1.4k NOASSERTION 2026-06-09
ASR / 音声認識
GitHub
Handy
Handyは、完全にオフラインで動作する無料のオープンソース音声認識デスクトップアプリケーションです。プライバシー…
★ 24.4k ⑂ 2.1k MIT 2026-06-20
ASR / 音声認識
GitHub
faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.8k ⑂ 1.9k MIT 2025-11-19
ASR / 音声認識
GitHub
FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 18.4k ⑂ 1.9k MIT 2026-06-21
ASR / 音声認識
GitHub
kaldi
Kaldiは、音声認識技術の開発と研究のための包括的なオープンソースツールキットです。UNIX系OS、Windows、Linuxとい…
★ 15.4k ⑂ 5.4k NOASSERTION 2025-09-22
音声生成 / TTS
GitHub
voice-pro
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…
★ 11.0k ⑂ 1.6k GPL-3.0 2025-12-05
画像生成
GitHub
runanywhere-sdks
RunAnywhereは、LLM(大規模言語モデル)、音声認識、音声合成、ボイスアシスタントといったAI機能をデバイス上で完…
★ 10.3k ⑂ 359 NOASSERTION 2026-06-22
ASR / 音声認識
GitHub
RTranslator
RTranslatorは、Androidデバイス向けに設計されたほぼオープンソースの無料リアルタイム翻訳アプリです。このアプリ…
★ 10.1k ⑂ 932 Apache-2.0 2026-06-09
ASR / 音声認識
GitHub
RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 840 MIT 2026-06-12
ASR / 音声認識
GitHub
annyang
annyangは、ウェブサイトを音声コマンドで制御できるようにする軽量なJavaScript音声認識ライブラリです。わずか2KB…
★ 6.8k ⑂ 1.0k MIT 2026-06-11
ASR / 音声認識
GitHub
argmax-oss-swift
Argmax Open-Source SDK Swiftは、Apple Siliconデバイス上で動作する高性能なオープンソースAI推論フレームワーク群…
★ 6.2k ⑂ 572 MIT 2026-06-10
ASR / 音声認識
GitHub
whisper-diarization
このツールは、OpenAI Whisperの自動音声認識(ASR)機能と高度な話者分離(Speaker Diarization)技術を統合したパ…
★ 5.6k ⑂ 503 BSD-2-Clause 2026-02-23
ASR / 音声認識
GitHub
minutes
Minutesは、会議やボイスメモといった人間の会話を記録し、AIが検索・活用できるオープンソースのプライバシー重視ツ…
★ 1.3k ⑂ 134 MIT 2026-06-20
ASR / 音声認識
GitHub
muesli
MuesliはmacOS 14.2以降に対応した、ローカルで完結する音声入力および会議文字起こしアプリケーションです。Apple S…
★ 587 ⑂ 59 MIT 2026-06-16
ASR / 音声認識
GitHub
freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 375 ⑂ 51 MIT 2026-06-16
ASR / 音声認識
GitHub
fcitx5-vinput
fcitx5-vinputは、LinuxのインプットメソッドであるFcitx5向けの多機能な音声入力ツールです。ローカルのオフライン…
★ 276 ⑂ 25 GPL-3.0 2026-06-16
ASR / 音声認識
GitHub
SoulX-Transcriber
SoulX-Transcriberは、複数の話者が登場する対話シナリオにおいて、話者特定(ダイアライゼーション)、タイムスタン…
★ 252 ⑂ 12 Apache-2.0 2026-06-04
ComfyUI
GitHub
ComfyUI-Mana-Nodes
ComfyUI-Mana-Nodesは、ComfyUI環境向けに開発されたカスタムノードの集合体です。フォントアニメーション、自動音声…
★ 247 ⑂ 19 MIT 2024-05-29
音声生成 / TTS
GitHub
cc-beeper
CC-Beeperは、AIコーディングアシスタント「Claude Code」専用のmacOSデスクトップウィジェットです。Claude Codeの…
★ 172 ⑂ 15 NOASSERTION 2026-04-12
ASR / 音声認識
GitHub
ChordVox
ChordVox IMEは、あなたの声を最速のキーボードに変える、完全にローカルで動作するAI音声入力ツールです。アイデア…
★ 166 ⑂ 8 MIT 2026-06-13
ASR / 音声認識
GitHub
blitztext-app
Blitztext Appは、macOS向けの実験的なオープンソースのメニューバーアプリです。ホットキーで音声を録音し、テキス…
★ 154 ⑂ 62 MIT 2026-06-02
音声生成 / TTS
GitHub
ai-avatar-bot
「AI仮想人ウィジェット」は、Live2Dキャラクターを任意のウェブサイトに簡単に埋め込むことができる音声AIアシスタ…
★ 152 ⑂ 48 NOASSERTION 2026-06-11
ASR / 音声認識
GitHub
openwhisp
Openwhispは、Mac上で完全にローカルに動作する音声認識・テキスト補完ツールです。Fnキーを押しながら話すことで、…
★ 152 ⑂ 26 2026-04-11