1,910 repos GH 1,795 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
ASR / 音声認識 (176 repos)
カテゴリ「ASR / 音声認識」のリポジトリ一覧
← 全カテゴリ
ASR / 音声認識
GitHub AirControl
AirControlは、Windows 10/11向けの革新的な空中ジェスチャーと音声制御システムです。MediaPipeによる手の動き認識…
★ 2 ⑂ 1 Apache-2.0 2026-05-18
ASR / 音声認識 GitHub CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06
ASR / 音声認識
GitHub taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
ASR / 音声認識 GitHub AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-05-21
ASR / 音声認識
GitHub ANARCHY
ANARCHYは、完全にローカル環境で動作するオフライン優先のAIシェルです。OllamaやGGUFモデルを利用し、クラウドやAP…
★ 2 MIT 2026-05-25
ASR / 音声認識 GitHub agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
ASR / 音声認識 GitHub voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識 GitHub voxline
voxlineは、macOS向けのネイティブ音声入力アプリです。ホットキーを押しながら話すだけで、あなたの声を洗練された…
★ 1 Apache-2.0 2026-05-22
ASR / 音声認識
GitHub perihelion
Perihelionは、VRChat向けに設計された音声認識(ASR)アプリケーションです。VRChatとOSCを介して連携し、ユーザー…
★ 1 2026-05-17
ASR / 音声認識
GitHub The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-05-19
ASR / 音声認識
GitHub TypelessMLX
TypelessMLXは、Apple Silicon搭載Mac向けに設計された音声認識アプリケーションです。ユーザーの音声をローカルでテ…
★ 1 2026-05-24
ASR / 音声認識
GitHub VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
ASR / 音声認識
GitHub noisekit
noisekitは、自動音声認識(ASR)システムのロバスト性ベンチマークのために、ノイズ層別化された音声データセットを…
★ 1 MIT 2026-05-22
ASR / 音声認識 GitHub BoltScribe
BoltScribeは、macOS向けの軽量な音声入力アプリケーションです。グローバルホットキーを使ってどこからでも音声の録…
★ 1 NOASSERTION 2026-05-22
ASR / 音声認識
GitHub voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
ASR / 音声認識
GitHub WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 1 MIT 2026-05-17
ASR / 音声認識
GitHub claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-05-24
ASR / 音声認識
GitHub AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識
GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-23
ASR / 音声認識
GitHub shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 1 AGPL-3.0 2026-05-22
ASR / 音声認識
GitHub meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 1 2026-05-24
ASR / 音声認識 GitHub Voxbee
Vox Beeは、Windows向けの無料オープンソース音声入力ソフトウェアです。whisper.cppを基盤とし、高速なローカル音声…
★ 1 GPL-3.0 2026-05-22
ASR / 音声認識 GitHub ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
ASR / 音声認識
GitHub open-studio
Open-studioは、デジタルクリエイターのコンテンツ制作ワークフローを効率化するためのオープンソースワークスペース…
★ 1 MIT 2026-05-24