3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

youtube-caption-tool

★ 4 更新: 2026-05-10 GitHubで見る →

概要

「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。

主な特徴は、YouTubeが提供する字幕を優先的に利用するため、コストをかけずに数秒で正確な文字起こしが可能です。

字幕がない動画に対しては、火山エンジン/豆包(Doubao)の高品質なASR(自動音声認識)技術を利用し、特に中国語音声認識で優れた精度を発揮します。

話者分離機能も備わっており、ポッドキャストやインタビューなど複数人の対談内容もSpeaker 1/Speaker 2のように自動で識別・表示します。

出力形式はMarkdown、TXT、Wordに対応しており、長い動画コンテンツのノート作成や知識整理に最適です。

現在はmacOS専用で、プライバシーを重視し、外部サービスに動画URLをアップロードしたくないユーザーに特に推奨されます。

互換性・特徴

  • CLI
  • Python
  • Web UI
  • macOS
  • 日本語対応
  • 中国語対応

基本情報

Stars4
カテゴリASR / 音声認識
アクティビティlow

GitHub: https://github.com/qianlicaoemma-hub/youtube-caption-tool