概要
TokenFlowは、事前学習済みのテキストから画像への拡散モデルを利用し、追加のトレーニングやファインチューニングなしで一貫性のあるビデオ編集を可能にするフレームワークです。
拡散特徴空間の一貫性を強制することで、編集されたビデオの構造と動きを保持しつつ、高品質なテキスト駆動型ビデオ編集を実現します。
既存の画像編集技術と組み合わせて使用でき、ビデオ編集者やAI研究者が、既存のモデルを活用して動画の内容を柔軟に、かつ連続性を持って変更したい場合に特に有用です。
互換性・特徴
- Python
- PyTorch
- CLI
- ビデオ編集
- AI/機械学習
- Hugging Face Spaces
基本情報
| ライセンス | MIT |
| Stars | 1,709 |
| Forks | 140 |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
最新のissue
- 出力が入力ファイルと同じなのはなぜですか? (更新: 2025-07-12 / Output is same as input file, why?)
- ControlNetの利用方法 (更新: 2025-03-11 / ControlNet Usage)
- sample_loopの前にadd_noiseを行う理由 (更新: 2025-02-25 / Why add_noise before sample_loop)
- 🔥 素晴らしい!TokenFlowはStable Video Diffusionをサポートできますか? (更新: 2025-02-12 / 🔥 Amazing Work! Could TokenFlow Support Stable Video Diffusion?)
- ‘NN field compute & warp’のコードは何ですか? (更新: 2025-02-12 / What is the code of ‘NN field compute & warp’ ?)
