1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (144 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 49.6k ⑂ 5.5k MIT 2026-05-11
ASR / 音声認識
GitHub
voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 25.3k ⑂ 3.1k MIT 2026-04-26
ASR / 音声認識
GitHub
llamafile
llamafileは、大規模言語モデル(LLM)を単一の実行可能ファイルとして配布・実行できる革新的なツールです。llama.c…
★ 24.4k ⑂ 1.4k NOASSERTION 2026-05-04
ASR / 音声認識
GitHub
whisperX
WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離(Diarization)機能…
★ 21.9k ⑂ 2.3k BSD-2-Clause 2026-04-04
ASR / 音声認識
GitHub
Handy
Handyは、完全にオフラインで動作する無料のオープンソース音声認識デスクトップアプリケーションです。プライバシー…
★ 21.8k ⑂ 1.8k MIT 2026-05-13
ASR / 音声認識
GitHub
buzz
Buzzは、OpenAIのWhisperを搭載し、個人用コンピューター上で音声の文字起こしと翻訳をオフラインで実行できる高機能…
★ 19.2k ⑂ 1.4k MIT 2026-05-04
ASR / 音声認識
GitHub
screenpipe
Screenpipeは、AIにユーザーのデジタル体験を学習させるためのオープンソースツールです。PC上でのあらゆる活動(画…
★ 18.8k ⑂ 1.7k NOASSERTION 2026-05-19
ASR / 音声認識
GitHub
pyvideotrans
pyVideoTransは、動画を多言語に翻訳し、吹き替えと字幕を埋め込むための強力なオープンソースツールです。音声認識…
★ 17.5k ⑂ 2.2k GPL-3.0 2026-05-22
ASR / 音声認識
GitHub
leon
Leonは、ツール、コンテキスト、メモリ、エージェント実行を中心に構築されたオープンソースの個人AIアシスタントで…
★ 17.2k ⑂ 1.4k MIT 2026-05-16
ASR / 音声認識
GitHub
FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 16.1k ⑂ 1.7k MIT 2026-03-17
ASR / 音声認識
GitHub
PaddleSpeech
PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。自己教師あ…
★ 12.6k ⑂ 2.0k Apache-2.0 2026-05-07
ASR / 音声認識
GitHub
meetily
Meetilyは、プライバシーを最優先したAI会議アシスタントです。Parakeet/Whisperによる高速なライブ文字起こし、話者…
★ 12.2k ⑂ 1.2k MIT 2026-05-21
ASR / 音声認識
GitHub
youtube-shorts-pipeline
AIAI Hubは、GitHub上のAI関連オープンソースソフトウェアを自動的に発見、要約、分類し、WordPressサイトにカタログ…
★ 2.0k ⑂ 493 2026-05-01
ASR / 音声認識
GitHub
minutes
Minutesは、会議やボイスメモといった人間の会話を記録し、AIが検索・活用できるオープンソースのプライバシー重視ツ…
★ 1.2k ⑂ 123 MIT 2026-05-13
ASR / 音声認識
GitHub
typewhisper-mac
TypeWhisper for Macは、macOSユーザー向けの高性能なローカル音声認識およびAIテキスト処理ツールです。WhisperKit…
★ 1.1k ⑂ 72 GPL-3.0 2026-05-12
ASR / 音声認識
GitHub
nightingale
Nightingaleは、AIを活用したカラオケアプリで、ユーザーの音楽ライブラリ内のあらゆる曲をカラオケとして楽しめます…
★ 1.1k ⑂ 75 GPL-3.0 2026-05-11
ASR / 音声認識
GitHub
TypeNo
TypeNoはmacOS向けの無料・オープンソースでプライバシーを重視した音声入力ツールです。声を録音し、ローカルで文字…
★ 867 ⑂ 71 GPL-3.0 2026-03-28
ASR / 音声認識
GitHub
voxt
Voxtは、macOS向けの音声入力&翻訳メニューバーアプリです。ユーザーが話した内容をリアルタイムで高精度にテキスト…
★ 613 ⑂ 46 NOASSERTION 2026-05-15
ASR / 音声認識
GitHub
OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 512 ⑂ 40 NOASSERTION 2026-05-11
ASR / 音声認識
GitHub
banini-tracker
「banini-tracker」は、投資の「逆指標」として知られる「巴逆逆(8zz)」のFacebook投稿を追跡し、AIが逆指標分析を…
★ 274 ⑂ 45 AGPL-3.0 2026-04-25
ASR / 音声認識
GitHub
parakeet.cpp
parakeet.cppは、NVIDIAのParakeet音声認識モデルを超高速でC++に実装し、デバイス上での推論を可能にするライブラリ…
★ 271 ⑂ 12 MIT 2026-05-04
ASR / 音声認識
GitHub
LiveTranslate
LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…
★ 269 ⑂ 19 MIT 2026-05-10
ASR / 音声認識
GitHub
petal
Petalは、macOS向けのネイティブメニューバーアプリで、高速かつローカルファーストな音声書き起こしを提供します。…
★ 241 ⑂ 7 MIT 2026-05-12
ASR / 音声認識
GitHub
input0
Input0は、macOSユーザー向けの音声入力ツールです。ホットキーを押して話すだけで録音を開始し、キーを離すとローカ…
★ 236 ⑂ 12 NOASSERTION 2026-05-10