1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

mediascribe

★ 67 ⑂ 1 MIT 更新: 2026-04-16 GitHubで見る →

概要

MediaScribeは、音声、ビデオ、テキストの文字起こしと、LLMを活用した要約を提供するコマンドラインツールです。

その主な特徴は、まず文字起こし、次に要約という段階的なワークフローを再利用できる点にあります。

ローカルおよびクラウドの多様なASRプロバイダーをサポートし、ビデオ処理では字幕を優先しつつ、ASRフォールバックや音声抽出にも対応します。

出力にはソースのメタデータが保持され、文字起こしと要約のロジックは他のPythonスクリプトで再利用可能なスタンドアロンサービスとして抽象化されています。

メディアコンテンツの効率的な分析を求める開発者や研究者に適しています。

互換性・特徴

  • CLI
  • Python
  • ASR
  • LLM
  • ローカル対応
  • クラウド対応

基本情報

ライセンスMIT
Stars67
Forks1
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v0.1.1 (2026-04-16)

GitHub: https://github.com/denven/mediascribe