262 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Wan2.1-T2V-1.3B-Diffusers

★ 124 apache-2.0 更新: 2025-04-04 GitHubで見る →

概要

Wan2.1は、最先端のビデオ生成技術を提供するオープンな大規模ビデオ基盤モデルスイートです。

テキストからビデオ、画像からビデオ、ビデオ編集、テキストから画像、ビデオからオーディオといった多様なタスクに対応し、特に消費者向けGPUでの動作(T2V-1.3Bモデルは8.19 GB VRAM)をサポートしている点が大きな特徴です。

また、中国語と英語の視覚的テキスト生成能力を持ち、高性能なWan-VAEを搭載しています。

ビデオ作成チームや計算資源が限られた学術チームが、高品質なビデオコンテンツを効率的に生成できるツールとして設計されています。

互換性・特徴

  • Text-to-Video
  • Image-to-Video
  • Diffusers対応
  • GPU必須
  • Python
  • CLI

基本情報

ライセンスapache-2.0
Likes124
Downloads150,819
Pipelinetext-to-video
カテゴリ動画生成
アクティビティmid

HuggingFace: https://huggingface.co/Wan-AI/Wan2.1-T2V-1.3B-Diffusers