3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (333 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
translarr
Translarrは、Sonarr、Radarr、Emby、Jellyfin、Plexといったarrスタックと連携するセルフホスト型のDockerコンテナ…
★ 1 MIT 2026-05-27
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 1 MIT 2026-05-19
ASR / 音声認識
GitHub
macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 1 MIT 2026-06-08
ASR / 音声認識
GitHub
open-studio
Open-studioは、デジタルクリエイターのコンテンツ制作ワークフローを効率化するためのオープンソースワークスペース…
★ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
ASR / 音声認識
GitHub
visionreview-ai-showcase
VisionReview AIは、AIを活用した動画レビューおよび編集ワークフローシステムです。ビデオ編集者、コンテンツクリエ…
★ 1 2026-05-25
ASR / 音声認識
GitHub
Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識
GitHub
Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
ASR / 音声認識
GitHub
openless
openlessは、macOSおよびWindowsで利用可能な音声入力ツールで、ホットキーを使って音声をAIが洗練したテキストに変…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-05-05
ASR / 音声認識
GitHub
VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
ASR / 音声認識
GitHub
tiktok-extractor
このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…
★ 1 MIT 2026-05-24
ASR / 音声認識
GitHub
hotkeys
Hotkeysは、AIを活用してあらゆるアプリケーションでのテキスト編集作業を劇的に効率化するホットキーアプリです。選…
★ 1 NOASSERTION 2026-06-02
ASR / 音声認識
GitHub
parleq-speech
Parleqは、macOS向けのオープンソースで音声入力によるテキスト作成ツールです。グローバルホットキーで起動し、話し…
★ 1 Apache-2.0 2026-06-02
ASR / 音声認識
GitHub
resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-05-25
ASR / 音声認識
GitHub
memorised-them-all
「Memorised them All」は、Claudeユーザー向けのローカルで完結する知識グラフ生成ツールです。PDF、Officeドキュメ…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
realtime-voice-ai-platform
リアルタイム音声AI顧客サポートプラットフォームは、音声認識(STT)、音声合成(TTS)、マルチエージェントオーケ…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
slavex
「slaveX」は、3Dアパートにいるヒューマノイドに、音声やテキストで命令して自由に動かすことができるブラウザゲー…
★ 1 MIT 2026-06-11
ASR / 音声認識
GitHub
AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
ASR / 音声認識
GitHub
TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
ASR / 音声認識
GitHub
easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。音声や動画をテキストに変換し…
★ 1 MIT 2026-05-31
ASR / 音声認識
GitHub
voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
ASR / 音声認識
GitHub
ai-voice-assistant-nlp
このプロジェクトはPythonと自然言語処理(NLP)を活用したAI音声アシスタントです。音声コマンドを理解し、ウェブ検…
★ 1 2026-05-25