1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
ASR / 音声認識 (144 repos)
カテゴリ「ASR / 音声認識」のリポジトリ一覧
← 全カテゴリ
ASR / 音声認識 GitHub claude-code-auto-video-edit
「claude-code-auto-video-edit」は、Claude Codeのコマンドとして機能し、口播やチュートリアル動画のAロール粗編集…
★ 75 ⑂ 9 MIT 2026-04-06
ASR / 音声認識
HF wav2vec2-large-xlsr-53-russian
このリポジトリは、Jonatas Grosman氏が開発したロシア語音声認識用のWav2Vec2-large-xlsr-53モデルを提供します。Hu…
❤ 74 ↓ 4.1M apache-2.0 2022-12-14
ASR / 音声認識 GitHub mediascribe
MediaScribeは、音声、ビデオ、テキストの文字起こしと、LLMを活用した要約を提供するコマンドラインツールです。そ…
★ 67 ⑂ 1 MIT 2026-04-16
ASR / 音声認識 GitHub ArcSub
ArcSubは、クラウドサービスとローカルのOpenVINOモデルの両方を活用するエンドツーエンドの字幕翻訳ワークステーシ…
★ 52 ⑂ 12 MIT 2026-05-13
ASR / 音声認識
GitHub speech-android
soniqo/speech-androidは、Androidデバイス向けのオンデバイス音声SDKです。ONNX RuntimeとQualcomm NNAPIアクセラレ…
★ 49 ⑂ 3 Apache-2.0 2026-05-13
ASR / 音声認識 GitHub ora
Oraは、macOS向けのリアルタイムローカル音声翻訳アプリケーションです。Apple Silicon Mac上で動作し、全ての処理を…
★ 35 ⑂ 4 MIT 2026-05-07
ASR / 音声認識
GitHub docker-whisper
hwdsl2/docker-whisperは、Docker上で動作する自己ホスト型Whisper音声認識サーバーを提供します。高速なfaster-whis…
★ 34 ⑂ 4 NOASSERTION 2026-05-16
ASR / 音声認識
GitHub ai-video-editing-skill
このAIエージェントスキルは、旅行で撮影した大量の動画素材から、自動的にVlogを生成します。ユーザーは素材フォル…
★ 33 ⑂ 4 MIT 2026-04-27
ASR / 音声認識 GitHub word-teacher
このツールは、AIを活用して英語の口語練習を効率的に行うためのWebアプリケーションです。AIとの対話、文章の音読練…
★ 32 ⑂ 2 MIT 2026-03-27
ASR / 音声認識 GitHub FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 32 ⑂ 3 2026-05-13
ASR / 音声認識 GitHub echoic
Echoicは、AIを活用した発話練習ツールです。任意の音声ファイルをインポートし、文章ごとに発話練習を行い、音素レ…
★ 31 ⑂ 4 MIT 2026-05-04
ASR / 音声認識 GitHub dictly
Dictlyは、macOS向けの無料オープンソースのメニューバー音声入力アプリです。Apple Silicon搭載Macで、グローバルホ…
★ 28 ⑂ 2 MIT 2026-05-15
ASR / 音声認識
GitHub TypelessMLX
このTypelessMLXは、macOS向けの音声文字変換(ディクテーション)アプリケーションです。Apple Silicon向けに最適化…
★ 28 ⑂ 2 2026-04-26
ASR / 音声認識
GitHub MioVRC_Translator
VRChat向けデスクトップリアルタイム翻訳ツール「Mio RealTime Translator」は、VRChatでの国際交流を支援します。主…
★ 24 ⑂ 1 MIT 2026-05-17
ASR / 音声認識 GitHub franken_whisper
franken_whisperは、Rust製の先進的な自動音声認識(ASR)オーケストレーションスタックです。whisper.cpp、insanely…
★ 24 ⑂ 3 NOASSERTION 2026-05-19
ASR / 音声認識
GitHub ariontalk
ArionTalkは、ウェブページに音声AIエージェントを追加するツールです。ユーザーがウェブページと自然な会話をできる…
★ 23 MIT 2026-04-30
ASR / 音声認識
GitHub multi-modal-agent-ts
このツールは、TypeScriptで書かれたマルチモーダルAIエージェントで、画像、音声、テキストを組み合わせて処理でき…
★ 21 ⑂ 1 2026-04-17
ASR / 音声認識
GitHub axon
AXONは、チャットボットではなく、生物学的にインスパイアされた学習型AIシステムです。セッション間で永続的な記憶…
★ 21 MIT 2026-05-08
ASR / 音声認識 GitHub Pixel-Pets
Pixel Petsは、M5Stackハードウェア上で動作するオープンソースのバーチャルペットエコシステムです。Muffin(LLM搭…
★ 20 NOASSERTION 2026-05-11
ASR / 音声認識 GitHub openquack
OpenQuackはmacOS向けの音声文字変換メニューバーアプリです。ホットキーを押して話すだけで、話した内容がカーソル…
★ 19 ⑂ 4 MIT 2026-05-16
ASR / 音声認識
GitHub shorts-saver-bot
「YouTube Shorts Bot」は、YouTubeショート動画のURLを処理し、AI(LLMとオプションのVision機能)を活用して動画か…
★ 19 ⑂ 10 MIT 2026-05-14
ASR / 音声認識 GitHub codex-asr
「codex-asr」は、Codex DesktopやChatGPTにログイン済みのローカルアカウントを再利用して、一度限りの音声認識(AS…
★ 18 ⑂ 3 MIT 2026-05-06
ASR / 音声認識 GitHub watch-video-skill
このスキルは、Claude AIに動画を「視聴」させ、タイム同期された文字起こしと自動スケーリングされた静止画を組み合…
★ 16 ⑂ 1 MIT 2026-04-30
ASR / 音声認識 GitHub TypeLate
TypeLateは、macOSとWindows向けに開発された無料かつオープンソースの音声テキスト変換ツールです。ホットキー一つ…
★ 16 ⑂ 1 MIT 2026-05-18