概要
Wan2.1は、最先端のビデオ生成技術を提供するオープンな大規模ビデオ基盤モデルスイートです。
テキストからビデオ、画像からビデオ、ビデオ編集、テキストから画像、ビデオからオーディオといった多様なタスクに対応し、特に消費者向けGPUでの動作(T2V-1.3Bモデルは8.19 GB VRAM)をサポートしている点が大きな特徴です。
また、中国語と英語の視覚的テキスト生成能力を持ち、高性能なWan-VAEを搭載しています。
ビデオ作成チームや計算資源が限られた学術チームが、高品質なビデオコンテンツを効率的に生成できるツールとして設計されています。
互換性・特徴
- Text-to-Video
- Image-to-Video
- Diffusers対応
- GPU必須
- Python
- CLI
基本情報
| ライセンス | apache-2.0 |
| Likes | 124 |
| Downloads | 150,819 |
| Pipeline | text-to-video |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/Wan-AI/Wan2.1-T2V-1.3B-Diffusers
