概要
NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション付き動画に変換するマルチモーダルパイプラインです。
既存動画からキーフレームを抽出し、視覚言語モデルがナレーション原稿を作成、段落ごとに音声を生成し、動画タイムラインと同期させて最終動画を合成します。
動画コンテンツにナレーションを加えたいコンテンツクリエイターや教育関係者、またはプレゼンテーション資料などを動画形式で共有したいビジネスユーザーに最適です。
PythonとCLIで動作し、FFmpegやGemini APIを活用して効率的な動画制作を支援します。
互換性・特徴
- Python
- CLI
- GPU推奨
- Gemini API
- FFmpeg
基本情報
| ライセンス | Apache-2.0 |
| Stars | 1 |
| Forks | 1 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
最新のissue
- [Feature] (更新: 2026-04-28)