3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

narrateflow

★ 1 ⑂ 1 Apache-2.0 更新: 2026-06-14 GitHubで見る →

#CLI #FFmpeg #Gemini API #GPU推奨 #Python

概要

NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション付き動画に変換するマルチモーダルパイプラインです。

既存動画からキーフレームを抽出し、視覚言語モデルがナレーション原稿を作成、段落ごとに音声を生成し、動画タイムラインと同期させて最終動画を合成します。

動画コンテンツにナレーションを加えたいコンテンツクリエイターや教育関係者、またはプレゼンテーション資料などを動画形式で共有したいビジネスユーザーに最適です。

PythonとCLIで動作し、FFmpegやGemini APIを活用して効率的な動画制作を支援します。

互換性・特徴

Python
CLI
GPU推奨
Gemini API
FFmpeg

基本情報

ライセンス	Apache-2.0
Stars	1
Forks	1
カテゴリ	音声生成 / TTS
アクティビティ	low

最新のissue

新機能の実装または既存機能の改善に関するタスク (更新: 2026-04-28 / [Feature])

GitHub: https://github.com/xing-yiren/narrateflow

← 全リポジトリ一覧へ