概要
Text2Video-Zeroは、既存のText-to-Image拡散モデルを活用し、テキストプロンプトから動画をゼロショット生成するツールです。
テキストだけでなく、ポーズやエッジによる条件付け、指示に基づいた動画編集(Video Instruct-Pix2Pix)も可能です。
Hugging Face Spacesでデモが公開されており、Stable DiffusionのあらゆるベースモデルやDreamboothモデルに対応。
任意の動画長や深度制御、そして低VRAM(7GB未満)での動作も実現しています。
GPU必須で、AIによる動画生成や編集に関心のある開発者やユーザーに最適なツールです。
互換性・特徴
- GPU必須
- Python
- Hugging Face Spaces
- CLI
- Web UI
基本情報
| ライセンス | NOASSERTION |
| Stars | 4,246 |
| Forks | 387 |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
最新のissue
- Colab環境で発生する既知の問題、または新機能の提案に関する検討 (更新: 2026-01-27 / Colab)
- TypeError: TiffWriter.write()関数が予期せぬキーワード引数 ‘fps’ を受け取りました (更新: 2025-05-03 / TypeError: TiffWriter.write() got an unexpected keyword argument ‘fps’)
- 生成されたビデオフレーム内にNaN (非数) 値が出現する問題について (更新: 2024-09-03 / NaN values appearing in generated video frames)
- AttributeError: ‘str’ オブジェクトに ‘read’ 属性が存在しないエラー (更新: 2024-08-26 / AttributeError: ‘str’ object has no attribute ‘read’)
GitHub: https://github.com/Picsart-AI-Research/Text2Video-Zero
