3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

universal_caption

★ 2 更新: 2026-06-10 GitHubで見る →

概要

Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャプションを提供するChrome拡張機能です。

Chromeの`tabCapture` APIでタブの音声を捕捉し、Web Audio APIを通じてPCMフレームを抽出し、Groq Whisper APIで瞬時に文字起こしを行います。

生成されたキャプションは、フローティングオーバーレイとしてWebページに直接表示されます。

`chrome.alarms`によるセッション維持機能も備えており、長時間の利用でも途切れることなく字幕を生成し続けます。

動画視聴やオンライン会議など、ブラウザベースのコンテンツでリアルタイム字幕を必要とするユーザーに最適です。

互換性・特徴

  • Chrome拡張機能
  • Groq Whisper API
  • リアルタイム処理
  • 音声認識
  • Web UI
  • JavaScript

基本情報

Stars2
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/LIMOUS007/universal_caption