3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
ASR / 音声認識 (333 repos)
カテゴリ「ASR / 音声認識」のリポジトリ一覧
← 全カテゴリ
ASR / 音声認識 GitHub scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ASR / 音声認識 GitHub YouTube-Clipper
YouTube Clipperは、YouTube動画の特定のシークバー範囲をAlt+ドラッグで選択するだけで、その箇所の音声、Whisperに…
★ 3 MIT 2026-05-25
ASR / 音声認識 GitHub whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 3 NOASSERTION 2026-06-01
ASR / 音声認識 GitHub pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
ASR / 音声認識 GitHub silent-notetaker
「Silent Notetaker」は、ブラウザ内で完結するプライベートなAI会議メモ作成ツールです。音声を外部サーバーに送信…
★ 3 NOASSERTION 2026-06-07
ASR / 音声認識 GitHub claude-eyes
「claude-eyes」は、Claude Codeに動画理解能力を付与するツールです。`/claude-eyes:see`スキルは、URLまたはローカ…
★ 3 NOASSERTION 2026-06-02
ASR / 音声認識 GitHub doza-assist
doza-assistは、インタビュー映像のラフカットを自動生成するツールです。ユーザーの過去の編集プロジェクトを分析し…
★ 3 MIT 2026-06-02
ASR / 音声認識 GitHub crisp-caption
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプシ…
★ 3 ⑂ 2 Apache-2.0 2026-05-24
ASR / 音声認識 GitHub SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 3 AGPL-3.0 2026-06-02
ASR / 音声認識 GitHub ANARCHY
ANARCHYは、クラウドやテレメトリーに依存しない、完全ローカルかつオフラインファーストのWindows向けAIアシスタン…
★ 3 MIT 2026-06-03
ASR / 音声認識 GitHub voicelog
voicelogは、セルフホスト型のTelegramボイスジャーナルです。プライベートなTelegramボットに音声メッセージやテキ…
★ 3 MIT 2026-06-09
ASR / 音声認識 GitHub tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
ASR / 音声認識 GitHub Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-08
ASR / 音声認識 GitHub Gstrl
GstrlはmacOS 14+向けの画期的なユーティリティで、ジェスチャー、音声、AIエージェントを組み合わせた直感的な操作…
★ 3 ⑂ 1 MIT 2026-05-20
ASR / 音声認識 GitHub astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
ASR / 音声認識 GitHub aftertalk
Aftertalkは、iPhone上で完全にオフラインで動作する会議記録アプリです。ネットワーク接続が一切不要で、会議の録音…
★ 3 MIT 2026-05-01
ASR / 音声認識 GitHub vocium
Vociumは、WindowsおよびmacOSで動作するデスクトップAI音声入力ツールです。ユーザーはショートカットキーを押して…
★ 3 MIT 2026-05-21
ASR / 音声認識 GitHub Edu_Omni_MyMind
EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…
★ 3 MIT 2026-06-11
ASR / 音声認識 GitHub LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識 GitHub social-media-scraper-skill
このツールは、Instagram、TikTok、X (Twitter)、YouTubeといった主要ソーシャルメディアプラットフォームから、投稿…
★ 3 2026-06-09
ASR / 音声認識 GitHub MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
ASR / 音声認識 GitHub scribe
Scribeは、macOS向けの小型で特化したプッシュトゥトーク音声入力ユーティリティです。メニューバーに常駐し、Fnキー…
★ 3 MIT 2026-04-29
ASR / 音声認識 GitHub Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 3 ⑂ 1 MIT 2026-05-24
ASR / 音声認識 GitHub docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-22