Ảnh đối tượng 1 được hợp nhất với ảnh đối tượng 2
Ảnh đối tượng 3 sẽ được chuyển đổi từ ảnh thành video bằng một prompt đơn giản, phù hợp với cảnh hành động
Độ phân giải mặc định: 768. Để có chất lượng tốt hơn trong dưới 10 phút, hãy dùng 832
Đầu ra bao gồm hình ảnh và video!