1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

narrateflow

★ 1 ⑂ 1 Apache-2.0 更新: 2026-05-19 GitHubで見る →

概要

NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション付き動画に変換するマルチモーダルパイプラインです。

既存動画からキーフレームを抽出し、視覚言語モデルがナレーション原稿を作成、段落ごとに音声を生成し、動画タイムラインと同期させて最終動画を合成します。

動画コンテンツにナレーションを加えたいコンテンツクリエイターや教育関係者、またはプレゼンテーション資料などを動画形式で共有したいビジネスユーザーに最適です。

PythonとCLIで動作し、FFmpegやGemini APIを活用して効率的な動画制作を支援します。

互換性・特徴

  • Python
  • CLI
  • GPU推奨
  • Gemini API
  • FFmpeg

基本情報

ライセンスApache-2.0
Stars1
Forks1
カテゴリTTS / 音声
アクティビティlow

最新のissue

GitHub: https://github.com/xing-yiren/narrateflow