概要
OmniShowは、ByteDanceが開発した人間とオブジェクトのインタラクションビデオ生成(HOIVG)のための統合モデルです。
テキスト、参照画像、音声、ポーズなど多様なマルチモーダル入力を条件として、高品質なビデオを生成します。
単一モデルで複数の生成タスク(R2V, RA2V, RP2V, RAP2V)を柔軟にこなし、オーディオ駆動アバターやオブジェクト交換などの幅広いアプリケーションに応用可能です。
独自の条件付け技術と学習手法を採用しており、HOIVG評価のための専用ベンチマーク「HOIVG-Bench」も提供します。
HOIVGの研究者やAIビデオ生成開発者、クリエイターを主な想定ユーザーとしています。
互換性・特徴
- Python
- GPU必須
- 研究プロジェクト
- GitHub
基本情報
| Stars | 357 |
| Forks | 15 |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
最新のissue
- このモデルはパラメータ確定を含め全てオープンソースになりますか? happyhorseのように騙すような真似はしませんよね。 (更新: 2026-05-06 / 这个模型确定包括参数确定会全部开源么?不会跟happyhorse一样耍猴的吧)
