概要
MediaScribeは、音声、ビデオ、テキストの文字起こしと、LLMを活用した要約を提供するコマンドラインツールです。
その主な特徴は、まず文字起こし、次に要約という段階的なワークフローを再利用できる点にあります。
ローカルおよびクラウドの多様なASRプロバイダーをサポートし、ビデオ処理では字幕を優先しつつ、ASRフォールバックや音声抽出にも対応します。
出力にはソースのメタデータが保持され、文字起こしと要約のロジックは他のPythonスクリプトで再利用可能なスタンドアロンサービスとして抽象化されています。
メディアコンテンツの効率的な分析を求める開発者や研究者に適しています。
互換性・特徴
- CLI
- Python
- ASR
- LLM
- ローカル対応
- クラウド対応
基本情報
| ライセンス | MIT |
| Stars | 67 |
| Forks | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
最新リリース: v0.1.1 (2026-04-16)
