概要
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。
主な特徴は、YouTubeが提供する字幕を優先的に利用するため、コストをかけずに数秒で正確な文字起こしが可能です。
字幕がない動画に対しては、火山エンジン/豆包(Doubao)の高品質なASR(自動音声認識)技術を利用し、特に中国語音声認識で優れた精度を発揮します。
話者分離機能も備わっており、ポッドキャストやインタビューなど複数人の対談内容もSpeaker 1/Speaker 2のように自動で識別・表示します。
出力形式はMarkdown、TXT、Wordに対応しており、長い動画コンテンツのノート作成や知識整理に最適です。
現在はmacOS専用で、プライバシーを重視し、外部サービスに動画URLをアップロードしたくないユーザーに特に推奨されます。
互換性・特徴
- CLI
- Python
- Web UI
- macOS
- 日本語対応
- 中国語対応
基本情報
| Stars | 4 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
GitHub: https://github.com/qianlicaoemma-hub/youtube-caption-tool
