概要
LTX-2.3は、Lightricksが公開する音声と映像を同時生成できるDiTベースのオープンウェイト基盤モデルです。
画像から動画、テキストから動画、動画変換に加え、音声付き生成や音声関連タスクにも対応し、同期したオーディオ付き映像をローカル実行しやすい点が特徴です。
ComfyUIノード利用やPyTorchコードベースでの推論・学習に対応し、LoRA再現や追加学習も可能なため、映像生成を試したい開発者、研究者、制作者向けの高度なモデルです。
互換性・特徴
- ComfyUI対応
- GPU必須
- Python
- PyTorch
- ローカル実行
- 音声付き動画生成
基本情報
| ライセンス | other |
| Likes | 1,138 |
| Downloads | 1,701,576 |
| Pipeline | image-to-video |
| カテゴリ | 動画生成 |
| アクティビティ | high |
HuggingFace: https://huggingface.co/Lightricks/LTX-2.3
