概要
「zai-org/CogVideo」は、テキストや画像から動画を生成する最先端のツールです。
CogVideoXシリーズは、テキストからの動画生成、既存動画の継続、画像からの動画生成の3つの主要タスクに対応しており、特に高解像度の10秒動画生成や任意の解像度での画像からの動画生成が可能です。
低スペックGPU(GTX 1080TIやRTX 3060など)でも動作するよう最適化されており、幅広いユーザーが利用できます。
GLM-4などの大規模モデルを活用したプロンプト最適化が動画品質に大きく影響します。
また、ファインチューニングや推論のためのCogKitフレームワークも提供され、動画生成技術の研究者や開発者、クリエイターに適しています。
互換性・特徴
- Python
- GPU必須
- CLI
- Diffusers対応
- Lora対応
- Hugging Face対応
基本情報
| ライセンス | Apache-2.0 |
| Stars | 12,717 |
| Forks | 1,288 |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
最新のissue
- 📣 [機能更新] ✨ REAL DDIM Inversion ✨ がCogVideoXで利用可能に! (更新: 2026-03-18 / 📣 [Feature Update] ✨ REAL DDIM Inversion ✨ is now possible on CogVideoX!)
最新リリース: CogVideoX-1.0 (2024-11-08)
