概要
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集における拡散トランスフォーマーの計算コスト(O(S²)) を大幅に削減する最新のオープンソース動画編集モデルです。
高価なフルセルフアテンションを回避し、最も関連性の高いソースビデオトークンのみを効率的に選択します。
RTX 4090でFlashAttention-2より2.8倍高速であり、約10万組のビデオペアでわずか80ステップの軽量なファインチューニングで利用できます。
Python CLI経由で利用し、Hugging Faceモデルも提供され、研究者や開発者、効率的な動画編集を求めるユーザーに適しています。
互換性・特徴
- GPU必須
- CLI
- Python
- Hugging Face
- 動画編集
- 高速処理
基本情報
| Stars | 24 |
| カテゴリ | 動画生成 |
| アクティビティ | low |
GitHub: https://github.com/xie-lab-ml/Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
