Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Superficie de respuesta
Dado los niveles x1, , xk de k factores 1, , k , una variable respuesta Y y una función f ,
generalmente del tipo polinomial, que relaciona la media de la variable respuesta con los niveles de los
factores mediante:
E Y x1, , xk f x1, , xk
De modo que la variable respuesta puede ser expresada mediante el siguiente modelo:
Y
Y f x1, , xk
La relación f x1, , xk existente entre η y los niveles de los k factores puede representarse a través
de una hipersuperficie (subconjunto de un espacio euclídeano (k+1)-dimensional) a la que llamaremos
superficie de respuesta
Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de respuesta
tridimensional consiste en representar la gráfica de contornos de la superficie, en la que se trazan las
denominadas líneas de contorno, que son curvas correspondientes a valores constantes de la respuesta
sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por los niveles x1 y x2 de los factores).
Geométricamente, cada línea de contorno es una proyección sobre el plano X1X2 de una sección de la
superficie de respuesta al intersecar con un plano paralelo al X1X2. La gráfica de contornos resulta útil
para estudiar los niveles de los factores en los que se da un cambio en la forma o altura de la superficie
de respuesta.
La existencia de gráficas de contorno no está limitada a 3 dimensiones a pesar de que en el caso en que
haya más de 3 factores de influencia no es posible la representación geométrica. No obstante, el hecho
de poder representar gráficas de contorno para problemas en que haya 2 o 3 factores permite visualizar
más fácilmente la situación general.
Fig. N° 1: Superficie de respuesta tridimensional que representa la producción esperada de almendra (η)
en función de las cantidades de fertilizante A (X1) y fertilizante B (X2)
Fig. N° 3: Gráfica de contorno de la superficie de respuesta con líneas de contorno correspondiente a los
valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9
Al planificar el experimento que permitirá llevar a cabo el estudio acerca del efecto de los factores sobre
la variable respuesta, el primer paso es la elección de los factores que se usarán en este experimento.
Una vez determinado, el siguiente paso es seleccionar los rangos de los valores de cada factor que se
considerarán, pero aunque en el experimento es posible explorar la región correspondiente al espacio
completo de los factores de influencia o región operativa, lo más frecuente consiste en explorar
únicamente una región de interés limitada, la región experimental, contenida en la región general. De
este modo, durante la ejecución del experimento, sólo se utilizarán niveles de los factores
correspondientes a valores que caigan en esta región, a menos que se descubran, durante el conjunto
inicial del experimento, que pueda ser necesario explorar niveles que estén mas allá de los límites de la
región considerada.
y 0 1x1 k xk (1)
Si se encuentra que existe curvatura en el sitema, entonces debe usarse un polinomio de orden superior,
tal como el modelo de segundo orden
k k
y 0 i xi ii xi2 i j ij xi x j (2)
i 1 i 1
En casi todos los problemas de metodología de superficie de respuesta usa uno de estos modelos, o
ambos. Desde luego, es probable que un modelo polinomial sea una aproximación razonable de las
variables independientes, pero para una región relativamente pequeña suelen funcionar bastante bien.
El método de los mínimos cuadrados, se usa para estimar los parámetros de los polinomios de
aproximación. Después se realiza el análisis de la superficie de respuesta utilizando la superficie
ajustada. Los parámetros del modelo pueden ser estimarse de manera más eficiente cuando se emplean
los diseños experimentos adecuados para la recolección de datos, a estos diseño se le denominan diseños
de superficie de respuesta.
Para este modelo de superficie de respuesta de primer orden, los contornos de ŷ son una serie de líneas
rectas paralelas como se muestra en la siguiente figura:
Ejemplo N° 1: Un ingeniero químico está interesado en determinar las condiciones de operación que maximizan
el rendimiento de un proceso. Hay dos variables de control que influyen Tiempo de reacción y temperatura de
reacción, el punto de operación actual es 35 minutos y 155ºF que da un rendimiento del 40% aproximadamente.
Se hace un diseño experimental variando el tiempo (30 a 40 minutos) y la temperatura (150 a 160ºF). Por
simplicidad se codifican las variables en el intervalo (-1, 1). Si las variables codificadas son X1 y X2 y las
variables naturales son 1 y 2 se tiene:
1 35
x1
5
155
x2 2
5
Variables Variables
del Proceso codificadas Rendimiento
Corrida Tiempo (min.) Temp.(ºF) X1 X2 Y
1 30 150 -1 -1 39.3
2 30 160 -1 1 40.0
3 40 150 1 -1 40.9
4 40 160 1 1 41.5
5 35 155 0 0 40.3
6 35 155 0 0 40.5
7 35 155 0 0 40.7
8 35 155 0 0 40.2
9 35 155 0 0 40.6
Los cinco puntos centrales se usan como réplicas para verificar la adecuación del modelo de primer orden (con
Pure error).
> proceso<-read.table("proceso1.txt",T)
> library(rsm)
> proc1<-coded.data(proceso, x1 ~ (Tiempo - 35)/5, x2 ~ (Temp - 155)/5)
> as.data.frame(proc1)
x1 x2 Y
1 -1 -1 39.3
2 -1 1 40.0
3 1 -1 40.9
4 1 1 41.5
5 0 0 40.3
6 0 0 40.5
7 0 0 40.7
8 0 0 40.2
9 0 0 40.6
> proc.rsm<-rsm(Y~FO(x1,x2),data=proc1)
> summary(proc.rsm)
Call:
rsm(formula = Y ~ FO(x1, x2), data = proc1)
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
FO(x1, x2) 2 2.82500 1.41250 47.8213 0.0002057
Residuals 6 0.17722 0.02954
Lack of fit 2 0.00522 0.00261 0.0607 0.9419341
Pure error 4 0.17200 0.04300
> mod2<-lm(Y~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc1)
> summary(aov(mod2))
Df Sum Sq Mean Sq F value Pr(>F)
I(x1) 1 2.4025 2.4025 55.872 0.00171 **
I(x2) 1 0.4225 0.4225 9.826 0.03503 *
I(x1^2) 1 0.0027 0.0027 0.063 0.81374
I(x1):I(x2) 1 0.0025 0.0025 0.058 0.82132
Residuals 4 0.1720 0.0430
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
ab b a (1) ab b a (1)
2 2
4 4
41.5 40 40.9 39.3 41.5 40 40.9 39.3
2 2
=
4 4
=2.4025 0.4225
=2.825
SCReg 2.825
CM Reg 1.4125
GLReg 2
Para calcular el cuadrado medio del error puro se calcula de la manera siguiente:
SCError puro yi y
2
Puntos Centrales
5
yi 40.46
2
i 1
0.1720
SC AB
4 4
= 0.00.25
SC AB 0.0025
CM AB 0.0025
GLAB 1
nF nC YF YC
2
nF nC
4 5 0.035
2
45
0.00272
SCResiduos 0.17722
CM Residuos 0.02954
GLResiduos 6
Para probar sobre la contribución lineal delos factores se considera el siguiente modelo de regresión:
y 0 1x1 2 x2
H 0 : 1 2 0 contra H1 : 1 0 y/o 2 0
CM Reg 1.4125
FcReg 47.81652
CM Residuos 0.02954
> Fcr<-1.4125/0.02954
> Fcr
[1] 47.81652
> pvalue<-1-pf(Fcr,2,6)
> pvalue
[1] 0.0002057543
Se rechaza H 0 , al menos uno de los factores tiempo de reacción y temperatura de reacción contribuyen
a un nivel de significación del 1% sobre el rendimiento del proceso.
Para probar sobre la contribución de la interacción de los factores tiempo de reacción y temperatura de
reacción y el efecto de curvatura se considera el siguiente modelo:
2
Y 0 1x1 2 x2 12 x1x2 ii xi2
i 1
Sobre el efecto de interacción:
CM AB 0.0025
FcAB 0.058
CM Error puro 0.043
> Fcab<-0.0025/0.043
> Fcab
[1] 0.05813953
> pvalue<-1-pf(Fcab,1,4)
> pvalue
[1] 0.8213164
Sobre la curvatura
2 2
H 0 : ii 0 contra H1 : ii 0
i 1 i 1
a) Se elige el tamaño de paso de una de las variables del proceso x j . La variable que tiene el
coeficiente en valor absoluto más alto. En este caso se elige x1 1 .
ˆi
b) El tamaño del paso para las otras variables es xi ....i 1, 2,.., k ; para..i j
ˆ j / x j
En este caso
ˆ2 0.325
x2 0.42
ˆ1 / x1 (0.775) /1.0
Para convertir los tamaños de los pasos codificados ( x1 1 y x2 0.42 ) a las unidades naturales de
tiempo y temperatura se tiene:
1
x1
5
2
x2
5
1 x1 (5) 1* 5 5mi.
2 x2 (5) 0.42 * 5 2º F
Se observa que el punto décimo representa el valor máximo de la trayectoria de experimentación por lo
que ahora se tomará como nuevo punto central (0,0) el punto (85, 175) y la región de experimentación
para 1 es (80,90) y para 2 es (170,180), con las variables codificadas X1 y X2 como sigue:
1 85
x1
5
175
x2 2
5
90
80
70
60
50
40
0 1 2 3 4 5 6 7 8 9 10 11 12 Pasos
Fig. N°4: Gráfica de rendimiento contra pasos en la trayectoria de ascenso más pronunciado
Variables Variables
del Proceso codificadas Rendimiento
Corrida Tiempo (min.) Temp.(ºF) X1 X2 Y1
1 80 170 -1 -1 76.5
2 80 180 -1 1 77.0
3 90 170 1 -1 78.0
4 90 180 1 1 79.5
5 85 175 0 0 79.9
6 85 175 0 0 80.3
7 85 175 0 0 80.0
8 85 175 0 0 79.7
9 85 175 0 0 79.8
> proceso2<-read.table("proceso2.txt",T)
> library(rsm)
> proc2<-coded.data(proceso2, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)
> mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc2)
> summary(mod3)
Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc2)
Residuals:
1 2 3 4 5 6 7
0.000e+00 -6.939e-18 -7.254e-18 4.889e-18 -4.000e-02 3.600e-01 6.000e-02
8 9
-2.400e-01 -1.400e-01
> summary(aov(mod3))
Df Sum Sq Mean Sq F value Pr(>F)
I(x1) 1 4.000 4.000 75.472 0.000966 ***
I(x2) 1 1.000 1.000 18.868 0.012217 *
I(x1^2) 1 10.658 10.658 201.094 0.000144 ***
I(x1):I(x2) 1 0.250 0.250 4.717 0.095611 .
Residuals 4 0.212 0.053
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Para verificar la interacción de los factores tiempo de reacción y temperatura de reacción y el efecto de
curvatura pura contribuye sobre el rendimiento del proceso se considera el siguiente modelo:
2
Y 0 1x1 2 x2 12 x1x2 ii xi2
i 1
Sobre el efecto de interacción:
Sobre la curvatura
2 2
H 0 : ii 0 contra H1 : ii 0
i 1 i 1
Se puede concluir que el efecto de la curvatura contribuye significativamente a un nivel del 0.1% sobre
el rendimiento del proceso.
k k
y 0 i xi ii xi2 i j ij xi x j (3)
i 1 i 1
Es adecuado. En esta sección se indicará como usar este modelo ajustado para encontrar el conjunto
óptimo de condiciones de operación para las x, así como para caracterizar la naturaleza de la superficie
de respuesta.
Suponga que quieren encontrarse los niveles de x1, , xk que optimizan la respuesta predicha. Este
punto, en caso de existir, será el conjunto de las x1, , xk para que las derivadas parciales
yˆ x1 yˆ xk 0 . A este punto, por ejemplo x1,s , x2,s , , xk ,s , se le llama punto estacionario. El
punto estacionario podría representar: 1) un punto de respuesta máxima, 2) un punto de respuesta
mínima, o 3) un punto silla.
Fig. N° 5: Superficie de respuesta y gráfico de contorno que ilustra una superficie con un máximo
Fig. N° 6: Superficie de respuesta y gráfico de contorno que ilustra una superficie con un mínimo
Fig. N° 7: Superficie de respuesta y gráfico de contorno que ilustra una superficie con un punto silla (o
minimax).
La gráfica de contorno desempeña un papel muy importante en el estudio de la superficie de respuesta.
Mediante la generación de gráficas de contornos utilizando software de computadora para el análisis de
superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la superficie y
localizar el óptimo con precisión razonable.
Es posible obtener una solución matemática general para la localización del punto estacionario. Al
escribir el modelo de segundo orden en notación matricial, se tiene
donde
x1 ˆ1 ˆ11 , ˆ12 2, , ˆ1k 2
x
ˆ ˆ22 , , ˆ2 k 2
x 2 b 2 B
k ˆ kk
ˆ
k
x
simétrica
Es decir, b es un vector k 1 de los coeficientes de regresión estimados de primer orden y B es una
matriz de la simétrica k k cuyos elementos de la diagonal principal son los coeficientes cuadráticos
puros estimados ˆ
ii y cuyos elementos fuera de la diagonal son la mitad de los coeficientes
cuadráticos mixtos estimados ˆij , i j . La derivada de ŷ con respecto a los elementos del vector x
igualada con 0 es
yˆ
b 2Bx 0
x
1
x s B-1b (5)
2
Luego, la respuesta predicha se obtiene al sustituir este valor en la ecuación dada para ŷ :
1 1 1
yˆ s ˆ0 xsb xs Bx s ˆ0 bB 1b bB 1 B B 1b
2 2 2
1 1 1
ˆ0 bB 1 b ˆ0 xsb
2 2 2
1
yˆ s ˆ0 xsb (6)
2
Caracterización de la superficie de respuesta
Donde las wi son las variables independientes transformadas y las i son constantes. A esta
ecuación se le llama forma canónica del modelo. Además, las i son solo los eigemvalores o raíces
características de la matriz B .
Ejemplo N° 2
Con los datos del ejemplo del proceso químico no posible ajustar un modelo de segundo orden en
términos de las variables x1 y x2 , por esta razón el experimentador decide aumentar este diseño con
puntos suficientes para ajustar un modelo de segundo orden. Obtiene cuatro observaciones en ( x1 0 ,
x2 1.414 ) y ( x1 1.414 , x2 0 ). El experimento completo se muestra en la siguiente tabla:
Variables Variables
del Proceso codificadas Rendimiento
Corrida Tiempo (min.) Temp.(ºF) X1 X2 Y2
1 80 170 -1 -1 76.5
2 80 180 -1 1 77.0
3 90 170 1 -1 78.0
4 90 180 1 1 79.5
5 85 175 0 0 79.9
6 85 175 0 0 80.3
7 85 175 0 0 80.0
8 85 175 0 0 79.7
9 85 175 0 0 79.8
10 92.07 175 1.414 0 78.4
11 77.93 175 -1.414 0 75.6
12 85 182.07 0 1.414 78.5
13 85 167.93 0 -1.414 77.0
El diseño del experimento se ilustra en la Fig. N° 9. A este diseño se le llama diseño central compuesto
(o DCC), el cual se estudiará con mayor detalle más adelante.
Fig. N° 9: Diseño Central Compuesto en las variables codificadas del ejemplo
> proceso3<-read.table("proceso3.txt",T)
> library(rsm)
> proc3<-coded.data(proceso3, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)
> proc3
Tiempo Temp Y1
1 80.00 170.00 76.5
2 80.00 180.00 77.0
3 90.00 170.00 78.0
4 90.00 180.00 79.5
5 85.00 175.00 79.9
6 85.00 175.00 80.3
7 85.00 175.00 80.0
8 85.00 175.00 79.7
9 85.00 175.00 79.8
10 92.07 175.00 78.4
11 77.93 175.00 75.6
12 85.00 182.07 78.5
13 85.00 167.93 77.0
Data are stored in coded form using these coding formulas ...
x1 ~ (Tiempo - 85)/5
x2 ~ (Temp - 175)/5
> proc3.rsm<-rsm(Y1~SO(x1,x2),data=proc3)
> summary(proc3.rsm)
Call:
rsm(formula = Y1 ~ SO(x1, x2), data = proc3)
Response: Y1
Df Sum Sq Mean Sq F value Pr(>F)
FO(x1, x2) 2 10.0430 5.0215 70.8143 2.267e-05
TWI(x1, x2) 1 0.2500 0.2500 3.5256 0.1025
PQ(x1, x2) 2 17.9537 8.9769 126.5944 3.194e-06
Residuals 7 0.4964 0.0709
Lack of fit 3 0.2844 0.0948 1.7885 0.2886
Pure error 4 0.2120 0.0530
Eigenanalysis:
$values
[1] -0.9634986 -1.4142867
$vectors
[,1] [,2]
x1 -0.2897174 -0.9571122
x2 -0.9571122 0.2897174 [1] -0.9634986 -1.4142867
$vectors
[,1] [,2]
x1 -0.2897174 -0.9571122
x2 -0.9571122 0.2897174
H 0 : 1 2 0
H1 : 1 0 y/o 2 0 H1 : 12 0
La prueba resultó muy altamente significativa, se puede afirmar que al menos uno de los factores x1 y/o
x2 influye linealmente a la variable respuesta y.
H 0 : 11 22 0
H1 : 11 0 y/o 22 0
La prueba resultón muy altamente significativa, se puede afirmar que al menos unos de los factores x1
y/o x2 tenga un efecto cuadrático sobre la variable respuesta y.
H 0 : 12 0
H1 : 12 0
A un nivel de significación del 10% no se ha encontrado que haya un efecto de interacción entre x1 y x2
que influya sobre la variable respuesta y.
A un nivel de significación del 10% no se ha encontrado suficiente evidencia para afirmar que existe
falta de ajuste
> mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc3)
> summary(mod3)
Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc3)
Residuals:
Min 1Q Median 3Q Max
-0.23995 -0.18089 -0.03995 0.17758 0.36005
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 79.93995 0.11909 671.264 < 2e-16 ***
I(x1) 0.99505 0.09415 10.568 1.48e-05 ***
I(x2) 0.51520 0.09415 5.472 0.000934 ***
I(x1^2) -1.37645 0.10098 -13.630 2.69e-06 ***
I(x2^2) -1.00134 0.10098 -9.916 2.26e-05 ***
I(x1):I(x2) 0.25000 0.13315 1.878 0.102519
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
A pesar que el efecto de interacción no influya significativamente a un nivel del 10%, pero como el
pvalue está muy cerca de este nivel se considera en la ecuación de regresión estimada. Por lo tanto, la
ecuación de regresión estimada queda como:
yˆ 79.93995 0.99505x1 0.51520 x2 1.3764 x12 1.00134 x22 0.25x1x2
La localización del punto estacionario también podría encontrarse utilizando la solución general dada en
la ecuación (5). Observe que
1
1 1.376 0.125 0.995 1 0.73508299 0.09179358 0.995
xs
2 0.125 1.001 0.515 2 0.09179358 1.01046373 0.515
0.3893406
xs
0.3058617
1 85 2 175
0.3893406= , luego 1 86.9467 y 2 176.5293
y 0.3058617
5 5
> x1<-seq(-1,1,0.1)
> x2<-seq(-1,1,0.1)
> model<-function(x,y){79.93995+0.99505*x+0.5152*y-1.3764*x^2-
1.00134*y^2+0.25*x*y}
> z<-outer(x1,x2,model)
> contour(x1,x2,z,nlevels=7)
1.0
79
.5
77.5
0.5
80
0.0
-0.5
79.5
79
77 78
-1.0
77
.5
78.5 78.5
79
z
78
1.0
77
0.5
-1.0 0.0
-0.5 x2
0.0 -0.5
x1
0.5
1.0-1.0
Fig Nº 10: Gráfica de contorno y superficie de respuesta de la variable respuesta rendimiento
Este valor está muy cerca del punto estacionario que se encontró por examen visual de la gráfica de
contorno presentada en la figura 10 a). Al utilizar la ecuación (6), la respuesta predicha en el punto
estacionario puede encontrarse que
1 1 0.995
yˆ s ˆ0 xs b 79.93995 0.3893406 0.3058617 80.48
2 2 0.515
El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada de un diseño
experimental.
Un diseño es el conjunto específico de combinaciones de los niveles de las k variables que se utilizará al
llevar a cabo el experimento.
Diseños factoriales 2k
En este diseño los k factores se codifican a los niveles estandarizados 1. El diseño no permite la
estimación del error experimental a menos que se repitan los experimentos, para lograr esto se aumenta
el diseño con observaciones en el centro. La adición de los puntos centrales no tiene influencia sobre las
ˆ para i I , pero la estimación de es el promedio general de todas las observaciones.
i 0
Fracciones de la serie 2k
En programas experimentales se tienen dos razones para no llevar a cabo las 2k combinaciones de un
arreglo factorial completo:
1. A medida que el número k de factores incrementa crece rápidamente el número de
combinaciones de niveles, haciéndose muy grande.
2. Sólo los primeros k+1 términos del modelo definen la ecuación de un hiperplano. Los restantes
2k – (k+1) términos, consistentes en productos cruzados son una medida de la distorsión del
hiperplano.
Como el nombre de este diseño lo indica es una fracción de un diseño 2k. La fracción ½ se denota
como 2k-1 y contiene la mitad de las combinaciones de un 2k mientras que la fracción ¼ se denota como
2-1-2 y contiene la cuarta parte de las combinaciones de un 2k. Las fracciones deben tener suficientes
puntos para estimar los k+1 coeficientes.
Cabe señalar que al usar un diseño 2k-1 no podemos medir la posible falta de ajuste del modelo, a menos
que se cuente con una estimación de la varianza del error haciendo réplicas del punto central; además, si
el término xixjxl realmente existe sesga la estimación del efecto principal asociado con xk.
Diseño simplex
En este diseño los puntos se localizan en los vértices de una figura regular, ésta tiene k+1 vértices y está
en k dimensiones. Para k=2 la figura geométrica es un triángulo equilátero y para k=3 es un tetraedro.
Como el número de puntos es igual al número de coeficientes del modelo se recomienda adicionar
réplicas en el punto central para que sea posible obtener la varianza del error y/o llevar a cabo la prueba
de falta de ajuste.
Diseños de Plakett-Burman
Características
Son diseños factoriales fraccionados de 2 niveles de resolución III, que se utilizan frecuentemente para
estudiar efectos principales.
Este modelo no tiene completa la confusión de los efectos, en su lugar cada efecto principal se confunde
parcialmente con todas las interacciones
Puesto que estos diseños no pueden representarse como cubos, en ocasiones se les llama diseños no
geométricos.
Un diseño experimental para ajustar un modelo de segundo orden debe tener al menos tres niveles de
cada factor (-1, 0, +1). Así como en el diseño de primer orden se desea la ortogonalidad, en éste se desea
que sea un diseño rotable. Se dice que un diseño es rotable cuando la varianza de la respuesta predicha
en algún punto es función sólo de la distancia del punto al centro y no es una función de la dirección.
Este diseño consiste en un factorial o factorial fraccionado 2k, donde los factores son codificados de tal
manera que el centro sea (0,0,...,0), aumentado por 2k puntos axiales (,0, 0,..., 0), (0, ,0,..., 0),
(0, 0, y nc puntos centrales (0,0,...,0). De acuerdo a Montgomery [6] 1991 este
diseño es probablemente el más usado.
Este diseño se convierte en rotable mediante la elección de , ésta se calcula de la siguiente manera
(Montgomery [6] 1991):
nf
1
4
Otra propiedad útil del diseño es que puede “crecer” a partir de un diseño 2k de primer orden, agregando
puntos axiales y quizá algunos puntos centrales (Montgomery [6] (1991)). Con la elección del número
de puntos centrales (n0), el diseño puede hacerse ortogonal o se puede transformar en uno de precisión
uniforme.
En un diseño de precisión, la varianza de la respuesta predicha en el origen es igual a la predicha a una
distancia unitaria del origen. Este proporciona mayor protección que el ortogonal contra el sesgo de los
coeficientes, debido a la presencia de términos de tercer y mayor orden.
Existen algunos diseños de dos factores especiales e interesantes que son una alternativa a los diseños
compuestos centrales. Éstos diseños son los de la clase equiradial que inicia con el pentágono que tiene
5 puntos igualmente espaciados sobre un círculo; este tipo de diseños requiere de corridas centrales ya
que son diseños que se encuentran en una esfera común además de ser rotables. La matriz diseño para
los diseños equiradiales se obtienen a partir de:
2 u 2 u
cos , sen , u 0, 1, 2, , n1 1 (*)
n1 n1
donde ρ es el radio del diseño, n1 es el número de puntos sobre la esfera (pentágono, hexágono, etc.).
Además de los n1 puntos generados a partir de (*), se adicionan nc corridas centrales al diseño. La
elección de ρ determina la naturaleza de la escala. (Myers 1995)
Para k=2, el diseño se obtiene combinando n1 5 puntos igualmente espaciados sobre una
circunferencia con nc 1 puntos en su centro. El pentágono y el hexágono son útiles en este caso. Para
k=3, los únicos arreglos que cuentan con puntos suficientes para estimar todos los parámetros son el
icosaedro y el dodecaedro.
Según Montgomery [6] (1991), este diseño es ocasionalmente útil en problemas con dos o tres variables.
Ejemplo:
El hexágono es un caso especial, útil e interesante; es decir, seis puntos equidistantes en un círculo. Así,
n f 6 , estableciendo 0 y 1 , se tiene la siguiente combinaciones tratamiento para k=2 y nc 3
x1 x2
1 0
0.5 0.75
-0.5 0.75
-1 0
-0.5 - 0.75
0.5 - 0.75
0 0
0 0
0 0
Aquí se puede observar que x1 tiene 5 niveles y x2 tiene tres niveles para esta rotación en particular la
siguiente figura muestra el diseño:
3 2
4 7, 8, 9 1
5 6
Diseño Box-Behnken.
El diseño Box – Behnken es un diseño cuadrático independiente que no posee un diseño factorial o una
factorial fraccional. Estos diseños son giratorios (o casi giratorios) pero ellos poseen capacidad limitada
de bloqueo ortogonal comparado con el Diseño Compuesto Central.
Diferente al CCD, los diseños Box – Behnken usan solo 3 niveles para cada factor. Las combinaciones
de los niveles de los factores están en los puntos centrales del eje del espacio de diseño y en el centro.
Por ejemplo, el Diseño Box – Behnken para tres factores envuelve tres bloques, en cada uno de ellos 2
factores son variados a través de las 4 posibles altas y bajas combinaciones. Es además necesario incluir
puntos centrales, donde todos los factores están in sus valores centrales. En consecuencia, estos diseños
no contienen puntos en el vértice de la región experimental.
El número de experimentos requeridos (N) es definido por la expresión N=2k (k-1) + CO, donde k es el
número de factores y CO es el número de puntos centrales.
Ejemplo: la siguiente tabla muestra el diseño de Box Behnken para tres variables. Se puede observar en
la figura Nª 11 que este diseño es esférico con todo los puntos localizado en una esfera de radio 2 ,
Además, el diseño de Box Behnken no contiene ningún punto en los vértices de la región cúbica creada
por los límites inferior y superior de cada variable. Esto podría ser una ventaja cuando los puntos de los
vértices del cubo representan combinaciones de los niveles de los factores cuya prueba es
prohibitivamente costosa o imposible debido a restricciones físicas del proceso.
corrida x1 x2 x3
1 -1 -1 0
2 -1 1 0
3 1 -1 0
4 1 1 0
5 -1 0 -1
6 -1 0 1
7 1 0 -1
8 1 0 1
9 0 -1 -1
10 0 -1 1
11 0 1 -1
12 0 1 1
13 0 0 0
14 0 0 0
15 0 0 0
Fig.Nº 10: Representación del diseño de Box Behnken para tres variables
Ejemplo N° 2
Se desea establecer las mejores condiciones de secado de oca el cual permita la retención máxima de
vitamina C en el producto final, si se considera que la vitamina C es uno de lps compuestos químicos
más fácilmente destruidos por factores como:
Se utilizó un diseño de Box Behnken con tres puntos centrales, a continuación se dan las combinaciones
de tratamientos y los resultados obtenidos del experimento:
Temperatura Velocidad Bisulfito Vitamina C
45 1 0.25 10
60 1 0 8.5
60 1 0.5 9
45 2.5 0.5 12.8
45 4 0.25 13
60 4 0.5 15
60 2.5 0.25 12.1
60 2.5 0.25 12
75 4 0.25 7.2
45 2.5 0 11
60 2.5 0.25 12.3
75 2.5 0 8
75 2.5 0.5 8.4
75 1 0.25 6.1
60 4 0 12.8
> vita<-read.table("vitaminaC.txt",T)
> library(rsm)
> vita1<-coded.data(vita,x1~(Temperatura-60)/15,x2~(Velocidad-
2.5)/1.5,x3~(Bisulfito-0.25)/0.25)
> vita.rsm<-rsm(VitaminaC~SO(x1,x2,x3),data=vita1)
> summary(vita.rsm)
Call:
rsm(formula = VitaminaC ~ SO(x1, x2, x3), data = vita1)
Response: VitaminaC
Df Sum Sq Mean Sq F value Pr(>F)
FO(x1, x2, x3) 3 65.473 21.8242 19.6821 0.003371
TWI(x1, x2, x3) 3 2.115 0.7050 0.6358 0.623483
PQ(x1, x2, x3) 3 19.626 6.5419 5.8998 0.042568
Residuals 5 5.544 1.1088
Lack of fit 3 5.498 1.8325 78.5357 0.012599
Pure error 2 0.047 0.0233
Eigenanalysis:
$values
[1] 0.1488236 -0.9063402 -2.2174833
$vectors
[,1] [,2] [,3]
x1 0.09594741 0.1488053 0.98420074
x2 -0.22015455 -0.9611025 0.16677529
x3 -0.97073481 0.2326779 0.05945514
y 0 1x1 2 x2 3 x3 11x12 22 x22 33 x32 12 x1x2 13 x1x3 23 x2 x3
H 0 : 1 2 3 0
H1 : al menos un i 0, para i 1, 2, 3
La prueba resultó altamente significativa (a un nivel del 1%), al menos un factor, temperatura del aire
del secado, velocidad del aire y concentración de bisulfito influye linealmente sobre la producción de
vitamina C.
La prueba resultó significativa (a un nivel del 5%), al menos un factor, temperatura del aire del secado,
velocidad del aire y concentración de Bisulfito tiene un efecto cuadrático sobre la producción de
vitamina C.
Residuals vs Fitted 2
Normal Q-Q
Standardized residuals
6 6
1
1
Residuals
0
-1
-1
2 2
-2
-2
9 9
6 8 10 12 -1 0 1
1.5
2
Standardized residuals
9
6 0.5
6
1
2
1.0
0
-1
0.5
2
0.5
-2
Cook's distance
0.0
9 1
> ri<-rstandard(mod)
> shapiro.test(ri)
> library(car)
> ncvTest(mod)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 0.003673617 Df = 1 p = 0.9516695
En los cuatros gráficos se puede observar que posiblemente cumple con los supuestos de normalidad, ya
que en el gráfico de probabilidad normal todos los residuos estandarizados están muy cerca de la recta
que contiene los cuantiles de la distribución normal, esto puede ser verificado por la prueba de Shapiro
Wild, en la cual no se ha encontrado suficiente evidencia a un nivel de significación del 10% para
rechazar la hipótesis de que los errores tiene una distribución normal. También¸ posiblemente cumpla
con los supuestos de homogeneidad de variancia, ya que si observamos el 3er gráfico el lowes de los
valores predichos sobre la raíz cuadrada del valor absoluto de los residuales estandarizados no tiene una
tendencia sistemática, esto puede ser verificado mediante la prueba de Breusch y Pagan de que a un
nivel de significación del 10% para rechazar la hipótesis de que los errores tiene variancia constante.
Además, de acuerdo al cuarto gráfico, la observación N° 9 es un valor extremo. Por último, según ell
Lowes del primer gráfico de los valores predichos sobre los residuos al parecer falta un ajuste de una
tendencia cúbica de algún factor sobre la producción de vitamina C.
> ei<-residuals(mod)
> x1<-vita1$x1
> x2<-vita1$x2
> x3<-vita1$x3
> plot(x1,ei)
> abline(h=0,lty=2)
> plot(x2,ei)
> abline(h=0,lty=2)
> plot(x3,ei)
> abline(h=0,lty=2)
1.0
1.0
0.0
0.0
ei
ei
-2.0 -1.0
-2.0 -1.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0
x1 x2
1.0
0.0
ei
-2.0 -1.0
x3
Aparentemente ninguno de los factores: temperatura del aire del secado, velocidad del aire y
concentración de bisulfito influye bajo un polinomio cúbico sobre la producción de vitamina C.
Posiblemente, la influencia se debe a un factor no considerado en este estudio.