概要
Berniniは、動画の生成と編集を統一的に行うためのフレームワークです。
MLLM(マルチモーダル大規模言語モデル)ベースのセマンティックプランナーとDiT(Diffusion Transformer)ベースのレンダラーを組み合わせており、特に動画編集の分野では、主要な商用モデルと比較してもトップクラスの性能を誇ります。
このツールは、NVIDIA H100のような高性能なCUDA GPU環境とPythonを使用できる開発者や研究者を対象としており、高度な動画コンテンツ作成や編集作業に貢献します。
モデルはHuggingFaceを通じて提供されています。
互換性・特徴
- GPU必須
- Python
- HuggingFace
- CUDA
基本情報
| ライセンス | Apache-2.0 |
| Stars | 116 |
| Forks | 8 |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
最新のissue
- Windows 11 + RTX 6000 pro 98GBVRAM の環境でインストールすることは可能でしょうか? (更新: 2026-06-02 / Can be installed in windows 11 + RTX 6000 pro 98GBVRAM?)
- MLLM plannerは、プロジェクト内のどのディレクトリに配置されていますか? (更新: 2026-06-01 / Where is the MLLM planner?)
