3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (333 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ASR / 音声認識
GitHub
YouTube-Clipper
YouTube Clipperは、YouTube動画の特定のシークバー範囲をAlt+ドラッグで選択するだけで、その箇所の音声、Whisperに…
★ 3 MIT 2026-05-25
ASR / 音声認識
GitHub
whisper-install
hwdsl2/whisper-installは、Whisperの音声認識・翻訳APIサーバーをUbuntu, Debian, AlmaLinux, Rocky Linux, CentOS,…
★ 3 NOASSERTION 2026-06-01
ASR / 音声認識
GitHub
pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
ASR / 音声認識
GitHub
silent-notetaker
「Silent Notetaker」は、ブラウザ内で完結するプライベートなAI会議メモ作成ツールです。音声を外部サーバーに送信…
★ 3 NOASSERTION 2026-06-07
ASR / 音声認識
GitHub
claude-eyes
「claude-eyes」は、Claude Codeに動画理解能力を付与するツールです。`/claude-eyes:see`スキルは、URLまたはローカ…
★ 3 NOASSERTION 2026-06-02
ASR / 音声認識
GitHub
crisp-caption
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプシ…
★ 3 ⑂ 2 Apache-2.0 2026-05-24
ASR / 音声認識
GitHub
SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 3 AGPL-3.0 2026-06-02
ASR / 音声認識
GitHub
ANARCHY
ANARCHYは、クラウドやテレメトリーに依存しない、完全ローカルかつオフラインファーストのWindows向けAIアシスタン…
★ 3 MIT 2026-06-03
ASR / 音声認識
GitHub
voicelog
voicelogは、セルフホスト型のTelegramボイスジャーナルです。プライベートなTelegramボットに音声メッセージやテキ…
★ 3 MIT 2026-06-09
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
ASR / 音声認識
GitHub
Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-08
ASR / 音声認識
GitHub
Gstrl
GstrlはmacOS 14+向けの画期的なユーティリティで、ジェスチャー、音声、AIエージェントを組み合わせた直感的な操作…
★ 3 ⑂ 1 MIT 2026-05-20
ASR / 音声認識
GitHub
astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
ASR / 音声認識
GitHub
aftertalk
Aftertalkは、iPhone上で完全にオフラインで動作する会議記録アプリです。ネットワーク接続が一切不要で、会議の録音…
★ 3 MIT 2026-05-01
ASR / 音声認識
GitHub
vocium
Vociumは、WindowsおよびmacOSで動作するデスクトップAI音声入力ツールです。ユーザーはショートカットキーを押して…
★ 3 MIT 2026-05-21
ASR / 音声認識
GitHub
Edu_Omni_MyMind
EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…
★ 3 MIT 2026-06-11
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
social-media-scraper-skill
このツールは、Instagram、TikTok、X (Twitter)、YouTubeといった主要ソーシャルメディアプラットフォームから、投稿…
★ 3 2026-06-09
ASR / 音声認識
GitHub
MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
ASR / 音声認識
GitHub
scribe
Scribeは、macOS向けの小型で特化したプッシュトゥトーク音声入力ユーティリティです。メニューバーに常駐し、Fnキー…
★ 3 MIT 2026-04-29
ASR / 音声認識
GitHub
Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 3 ⑂ 1 MIT 2026-05-24
ASR / 音声認識
GitHub
docs
LinguaVoxは、Chrome拡張機能として提供されるAI音声入力・翻訳ツールです。ユーザーは母国語で話すだけで、OpenAI W…
★ 2 MIT 2026-05-22