3,729 repos GH 3,614 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識 (383 repos)

カテゴリ「ASR / 音声認識」のリポジトリ一覧

← 全カテゴリ

ASR / 音声認識
GitHub
crisp-caption
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプシ…
★ 3 ⑂ 2 Apache-2.0 2026-05-24
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
ASR / 音声認識
GitHub
harry-ai
Harryは、macOS向けに設計された音声のみのAIアシスタントです。映画「JARVIS / FRIDAY」のような体験を提供し、洗練…
★ 3 MIT 2026-05-26
ASR / 音声認識
GitHub
Sirious
Siriousは、macOS上でローカルの音声コマンドのトランスクリプトを分類し、ルーティングする早期開発段階のアプリケ…
★ 3 NOASSERTION 2026-06-17
ASR / 音声認識
GitHub
doublage
「Doublage(ドゥブラージュ)」は、任意の動画の好きなシーンをオンラインで友達と一緒に吹き替えできる革新的なツ…
★ 3 MIT 2026-06-12
ASR / 音声認識
GitHub
astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
ASR / 音声認識
GitHub
vocium
Vociumは、WindowsおよびmacOSで動作するデスクトップAI音声入力ツールです。ユーザーはショートカットキーを押して…
★ 3 MIT 2026-05-21
ASR / 音声認識
GitHub
aftertalk
Aftertalkは、iPhone上で完全にオフラインで動作する会議記録アプリです。ネットワーク接続が一切不要で、会議の録音…
★ 3 MIT 2026-05-01
ASR / 音声認識
GitHub
OmniVid
OmniVidは、YouTube、Bilibili、抖音、TikTokを含む1800以上の動画プラットフォームに対応した万能動画ダウンロード…
★ 3 2026-06-16
ASR / 音声認識
GitHub
jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
ASR / 音声認識
GitHub
Gstrl
GstrlはmacOS 14+向けの画期的なユーティリティで、ジェスチャー、音声、AIエージェントを組み合わせた直感的な操作…
★ 3 ⑂ 1 MIT 2026-05-20
ASR / 音声認識
GitHub
MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
ASR / 音声認識
GitHub
streamscribe
streamscribeは、クラウドやAPIキーに依存せず、通常のCPUで動作するリアルタイム放送転写・分析ツールです。複数の…
★ 3 2026-06-11
ASR / 音声認識
GitHub
social-media-scraper-skill
このツールは、Instagram、TikTok、X (Twitter)、YouTubeといった主要ソーシャルメディアプラットフォームから、投稿…
★ 3 2026-06-16
ASR / 音声認識
GitHub
douyin-living
「Douyin Live AI Clipper」は、抖音(Douyin)ライブ配信を自動で録画し、AIがハイライトシーンを自動で切り出すシ…
★ 3 MIT 2026-06-04
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
scribe
Scribeは、macOS向けの小型で特化したプッシュトゥトーク音声入力ユーティリティです。メニューバーに常駐し、Fnキー…
★ 3 MIT 2026-04-29
ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
ASR / 音声認識
GitHub
smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
ASR / 音声認識
GitHub
VoxPulse
VoxPulseは、オフラインで動作し、100%プライバシーを保証する軽量なカスタムウェイクワード検出フレームワークです…
★ 3 MIT 2026-06-15
ASR / 音声認識
GitHub
WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 2 MIT 2026-05-17
ASR / 音声認識
GitHub
obsidian-audio-capsule
このツールは、Obsidian向けの音声カプセルレコーダープラグインです。iOSのボイスメモに似たUIでノート内に音声を録…
★ 2 MIT 2026-06-02
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-09