Está en la página 1de 37

Metodología de Superficie de Respuesta

Introducción a la metodología de respuesta


En este capítulo se discutirá la metodología de superficie de respuesta su representación gráfica, el
procedimiento a seguir hasta encontrar el óptimo y los diseños experimentales que se pueden utilizar.

La metodología de superficie de respuesta puede definirse como un conjunto técnicas estadísticas


utilizadas para modelar y analizar un proceso en donde una variable respuesta es influenciada por otras
variables o factores. El propósito inicial de estas técnicas es diseñar un experimento que proporcione
valores razonables de la variable respuesta y, a continuación, determinar el modelo matemático que
mejor se ajusta a los datos obtenidos. El objetivo final es establecer los valores de los factores que
optimizan el valor de la variable respuesta.

Superficie de respuesta

Dado los niveles x1, , xk de k factores 1, , k , una variable respuesta Y y una función f ,
generalmente del tipo polinomial, que relaciona la media de la variable respuesta con los niveles de los
factores mediante:

  E Y x1, , xk   f  x1, , xk 

De modo que la variable respuesta puede ser expresada mediante el siguiente modelo:

Y   
Y  f  x1, , xk   

donde ε es el error observado en la respuesta.

La relación   f  x1, , xk  existente entre η y los niveles de los k factores puede representarse a través
de una hipersuperficie (subconjunto de un espacio euclídeano (k+1)-dimensional) a la que llamaremos
superficie de respuesta

Gráfica de Superficie de Respuesta y de Contorno

Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de respuesta
tridimensional consiste en representar la gráfica de contornos de la superficie, en la que se trazan las
denominadas líneas de contorno, que son curvas correspondientes a valores constantes de la respuesta
sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por los niveles x1 y x2 de los factores).
Geométricamente, cada línea de contorno es una proyección sobre el plano X1X2 de una sección de la
superficie de respuesta al intersecar con un plano paralelo al X1X2. La gráfica de contornos resulta útil
para estudiar los niveles de los factores en los que se da un cambio en la forma o altura de la superficie
de respuesta.
La existencia de gráficas de contorno no está limitada a 3 dimensiones a pesar de que en el caso en que
haya más de 3 factores de influencia no es posible la representación geométrica. No obstante, el hecho
de poder representar gráficas de contorno para problemas en que haya 2 o 3 factores permite visualizar
más fácilmente la situación general.

Ejemplo N° 1: Un agricultor desea maximizar su producción de almendras (medida en Kg./Ha) en


función de las cantidades (medidas en Kg./Ha) de dos tipos de fertilizantes: A y B, que utiliza. Una
superficie de respuesta para la producción de almendra viene dada por la siguiente gráfica

Fig. N° 1: Superficie de respuesta tridimensional que representa la producción esperada de almendra (η)
en función de las cantidades de fertilizante A (X1) y fertilizante B (X2)

Para realizar la gráfica de contornos correspondiente se secciona la superficie de respuesta usando


planos paralelos al X1X2 en ciertos valores de respuesta considerados, por ejemplo
Fig. N° 2: Sección de la superficie de respuesta por planos paralelos al plano X1 X2 en los valores
esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9
Cada línea de contorno representa un número infinito de combinaciones de las cantidades de los dos
fertilizantes, para las producciones de almendras esperadas consideradas. La producción máxima, que es
de 14.12 Kg./Ha. se localiza en el centro de la elipse más pequeña y corresponde a los niveles X1=170.06
del fertilizante A y X2=246.65 del fertilizante B.

Fig. N° 3: Gráfica de contorno de la superficie de respuesta con líneas de contorno correspondiente a los
valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9

La gráfica de contornos correspondiente a la superficie de respuesta del ejemplo considerado indicaría


que tiene la forma de lomo o colina.

Al planificar el experimento que permitirá llevar a cabo el estudio acerca del efecto de los factores sobre
la variable respuesta, el primer paso es la elección de los factores que se usarán en este experimento.
Una vez determinado, el siguiente paso es seleccionar los rangos de los valores de cada factor que se
considerarán, pero aunque en el experimento es posible explorar la región correspondiente al espacio
completo de los factores de influencia o región operativa, lo más frecuente consiste en explorar
únicamente una región de interés limitada, la región experimental, contenida en la región general. De
este modo, durante la ejecución del experimento, sólo se utilizarán niveles de los factores
correspondientes a valores que caigan en esta región, a menos que se descubran, durante el conjunto
inicial del experimento, que pueda ser necesario explorar niveles que estén mas allá de los límites de la
región considerada.

Superficie de respuestas polinómicas. Modelos de primer y segundo orden

El objetivo principal de la metodología de superficie de respuesta es determinar aproximadamente una


función f., con tal objetivo se propone generalmente un modelo polinómico con k factores 1, , k .
Luego, comúnmente se emplea un polinomio de orden inferior en alguna región de las variables
independientes. Si la respuesta está bien modelada por una función lineal de las variables
independientes, entonces la función de aproximación es el modelo de primer orden

y  0  1x1   k xk   (1)

Si se encuentra que existe curvatura en el sitema, entonces debe usarse un polinomio de orden superior,
tal como el modelo de segundo orden
k k
y  0   i xi   ii xi2   i j ij xi x j   (2)
i 1 i 1

En casi todos los problemas de metodología de superficie de respuesta usa uno de estos modelos, o
ambos. Desde luego, es probable que un modelo polinomial sea una aproximación razonable de las
variables independientes, pero para una región relativamente pequeña suelen funcionar bastante bien.

El método de los mínimos cuadrados, se usa para estimar los parámetros de los polinomios de
aproximación. Después se realiza el análisis de la superficie de respuesta utilizando la superficie
ajustada. Los parámetros del modelo pueden ser estimarse de manera más eficiente cuando se emplean
los diseños experimentos adecuados para la recolección de datos, a estos diseño se le denominan diseños
de superficie de respuesta.

La metodología de superficie de respuesta es un procedimiento secuencial. Por ejemplo, cuando se está


en un punto de la superficie que está apartado del óptimo, sobretodo cuando la superficie presenta una
curvatura moderada como el caso dado en la Fig. N° 3, en caso el modelo de primer orden es adecuado y
el objetivo en este caso es llevar al experimentador de manera rápida y eficiente por la trayectoria del
mejoramiento hasta la vencidad general del óptimo. Una vez que se ha encontrado la región del óptimo
se puede emplearse modelo mas elaborado como el de segundo orden y llevarse a cabo para localizar el
óptimo.

Fig. N° 3: El carácter secuencial de la Metodología de superficie de respuesta


Método de ascenso mas pronunciado
El método de ascenso rápido es un procedimiento para moverse secuencialmente por la trayectoria de
ascenso rápido, o sea, en la dirección del máximo incremento de la respuesta. Por supuesto, si lo que se
busca es la minimización, entonces se utiliza el método de descenso rápido. El modelo ajustado de
primer orden es:
k
yˆ  0   ˆi xi
i 1

Para este modelo de superficie de respuesta de primer orden, los contornos de ŷ son una serie de líneas
rectas paralelas como se muestra en la siguiente figura:

Fig. N° 4: Superficie de respuesta de primer orden y trayectoria de ascenso rápido

La dirección de ascenso rápido es la dirección en la cual ŷ se incrementa más rápido, esta


dirección es normal a los contornos de la superficie de respuesta ajustada y se toma como trayectoria
de ascenso rápido, la línea que pasa al centro de la región de interés y normal a los contornos de la
superficie ajustada. De esta forma, los pasos a lo largo de la trayectoria son proporcionales a los
 
coeficientes de regresión ˆ . El experimentador determina la cantidad real de movimiento a lo largo
i

de esta trayectoria en base a su conocimiento del proceso u otras consideraciones prácticas.

Los experimentos se realizan a lo largo de la trayectoria de ascenso rápido hasta que ya no


se observa incremento en la respuesta o hasta que la región de la respuesta deseada se alcanza.
Entonces se usa un nuevo modelo de primer orden, se determina la dirección de una nueva trayectoria de
ascenso rápido y de ser necesario, se realizan experimentos adicionales en esa dirección hasta que el
experimentador sienta que está cerca del óptimo.

Ejemplo N° 1: Un ingeniero químico está interesado en determinar las condiciones de operación que maximizan
el rendimiento de un proceso. Hay dos variables de control que influyen Tiempo de reacción y temperatura de
reacción, el punto de operación actual es 35 minutos y 155ºF que da un rendimiento del 40% aproximadamente.
Se hace un diseño experimental variando el tiempo (30 a 40 minutos) y la temperatura (150 a 160ºF). Por
simplicidad se codifican las variables en el intervalo (-1, 1). Si las variables codificadas son X1 y X2 y las
variables naturales son 1 y 2 se tiene:
1  35
x1 
5
  155
x2  2
5

El arreglo y los datos experimentales son:

Variables Variables
del Proceso codificadas Rendimiento
Corrida Tiempo (min.) Temp.(ºF) X1 X2 Y
1 30 150 -1 -1 39.3
2 30 160 -1 1 40.0
3 40 150 1 -1 40.9
4 40 160 1 1 41.5
5 35 155 0 0 40.3
6 35 155 0 0 40.5
7 35 155 0 0 40.7
8 35 155 0 0 40.2
9 35 155 0 0 40.6

Los cinco puntos centrales se usan como réplicas para verificar la adecuación del modelo de primer orden (con
Pure error).

> proceso<-read.table("proceso1.txt",T)
> library(rsm)
> proc1<-coded.data(proceso, x1 ~ (Tiempo - 35)/5, x2 ~ (Temp - 155)/5)
> as.data.frame(proc1)
x1 x2 Y
1 -1 -1 39.3
2 -1 1 40.0
3 1 -1 40.9
4 1 1 41.5
5 0 0 40.3
6 0 0 40.5
7 0 0 40.7
8 0 0 40.2
9 0 0 40.6

> proc.rsm<-rsm(Y~FO(x1,x2),data=proc1)
> summary(proc.rsm)

Call:
rsm(formula = Y ~ FO(x1, x2), data = proc1)

Estimate Std. Error t value Pr(>|t|)


(Intercept) 40.444444 0.057288 705.9869 5.451e-16 ***
x1 0.775000 0.085932 9.0188 0.000104 ***
x2 0.325000 0.085932 3.7821 0.009158 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Analysis of Variance Table

Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
FO(x1, x2) 2 2.82500 1.41250 47.8213 0.0002057
Residuals 6 0.17722 0.02954
Lack of fit 2 0.00522 0.00261 0.0607 0.9419341
Pure error 4 0.17200 0.04300

Direction of steepest ascent (at radius 1):


x1 x2
0.9221944 0.3867267

Corresponding increment in original units:


Tiempo Temp
4.610972 1.933633

> mod2<-lm(Y~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc1)
> summary(aov(mod2))
Df Sum Sq Mean Sq F value Pr(>F)
I(x1) 1 2.4025 2.4025 55.872 0.00171 **
I(x2) 1 0.4225 0.4225 9.826 0.03503 *
I(x1^2) 1 0.0027 0.0027 0.063 0.81374
I(x1):I(x2) 1 0.0025 0.0025 0.058 0.82132
Residuals 4 0.1720 0.0430
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Calculo de los estimados de los coeficientes de regresión:

b0  ˆ0  Y  39.3+40.0+40.9+41.5+40.3+40.5+40.7+40.2+40.6  40.44


9
ab  b  a  (1) 41.5-40+40.9-39.3
b1  ˆ1    0.775
2k 22
ab  b  a  (1) 41.5  40  40.9  39.3
b2  ˆ2    0.325
2k 22

Luego la ecuación de regresión estimada está dado por:

yˆ  40.44 0.775x1  0.325x2

La suma de cuadrado de regresión se calcula mediante la siguiente fórmula:


SCReg  SCFO x1 , x2   SCA  SCB

 ab  b  a  (1)  ab  b  a  (1)
2 2

 
4 4
 41.5  40  40.9  39.3   41.5  40  40.9  39.3
2 2

=
4 4
=2.4025  0.4225
=2.825

SCReg 2.825
CM Reg    1.4125
GLReg 2

Para calcular el cuadrado medio del error puro se calcula de la manera siguiente:

SCError puro    yi  y 
2

Puntos Centrales
5
   yi  40.46 
2

i 1

 0.1720

SCError puro 0.172


CM Error puro    0.043
GLError puro 4

Para calcular la suma de cuadrado de la interacción AB:

 ab  a  b  1   41.5  40.0  40.9  39.3


2 2

SC AB  
4 4
= 0.00.25

SC AB 0.0025
CM AB    0.0025
GLAB 1

Para calcular la suma de cuadrados de falta de ajuste o curvatura se utiliza el siguiente


procedimiento:
SCFalta de ajuste  SCCurvatura pura

nF nC YF  YC 
2


nF  nC
 4  5 0.035
2


45
 0.00272

SCCurvatura pura 0.0027


CM Curvatura pura    0.0027
GLCurvatura pura 1

La suma de cuadrado de los residuos:

SCResiduos  SCFalta de ajuste  SC AB  SCError puro


 0.1720  0.0025  0.0272
 0.17722

SCResiduos 0.17722
CM Residuos    0.02954
GLResiduos 6

Para probar sobre la contribución lineal delos factores se considera el siguiente modelo de regresión:

y  0  1x1  2 x2  

Luego se prueba la siguiente hipótesis:

H 0 : 1  2  0 contra H1 : 1  0 y/o 2  0

CM Reg 1.4125
FcReg    47.81652
CM Residuos 0.02954

> Fcr<-1.4125/0.02954
> Fcr
[1] 47.81652
> pvalue<-1-pf(Fcr,2,6)
> pvalue
[1] 0.0002057543

Se rechaza H 0 , al menos uno de los factores tiempo de reacción y temperatura de reacción contribuyen
a un nivel de significación del 1% sobre el rendimiento del proceso.
Para probar sobre la contribución de la interacción de los factores tiempo de reacción y temperatura de
reacción y el efecto de curvatura se considera el siguiente modelo:

2
Y  0  1x1   2 x2  12 x1x2   ii xi2  
i 1
Sobre el efecto de interacción:

H 0 : 12  0 contra H1 : 12  0

CM AB 0.0025
FcAB    0.058
CM Error puro 0.043
> Fcab<-0.0025/0.043
> Fcab
[1] 0.05813953
> pvalue<-1-pf(Fcab,1,4)
> pvalue
[1] 0.8213164

Se acepta H 0 , a un nivel de significación del 10% no se ha encontrado evidencia estadística suficiente


para afirmar que de la interacción de los factores tiempo de reacción y temperatura de reacción contribuya
sobre el rendimiento del proceso.

Sobre la curvatura

2 2
H 0 :  ii  0 contra H1 :  ii  0
i 1 i 1

CM Curvatura pura 0.00272


FcCurvatura    0.063
CM Error puro 0.043
> Fccurv<-0.00272/0.043
> Fccurv
[1] 0.06325581
> pvalue<-1-pf(Fccurv,1,4)
> pvalue
[1] 0.8138149

Se acepta H 0 , a un nivel de significación del 10% no se ha encontrado evidencia estadística suficiente


para afirmar que la suma de los efectos cuadráticos de los factores tiempo de reacción y temperatura de
reacción contribuya sobre el rendimiento del proceso.

Para la trayectoria de ascenso más rápido, se siguen los pasos siguientes:

a) Se elige el tamaño de paso de una de las variables del proceso x j . La variable que tiene el
coeficiente en valor absoluto más alto. En este caso se elige x1  1 .
ˆi
b) El tamaño del paso para las otras variables es xi  ....i  1, 2,.., k ;   para..i  j
ˆ j / x j
En este caso
ˆ2 0.325
x2    0.42
ˆ1 / x1 (0.775) /1.0

Para convertir los tamaños de los pasos codificados ( x1  1 y x2  0.42 ) a las unidades naturales de
tiempo y temperatura se tiene:
1
x1 
5
 2
x2 
5
1  x1 (5) 1* 5  5mi.
 2  x2 (5) 0.42 * 5  2º F

Tomando el punto correspondiente a (0,0) se realizan experimentos individuales adicionales,


incrementando las variables en los pasos indicados arriba resultando en:

Variables Codificadas Variables naturales Respuesta


Pasos X1 X2 1 2 y
Origen 0 0 35 155
 1 0.42 5 2
Orig.+ 1 0.42 40 157 41.0
Orig.+2 2 0.84 45 159 42.9
Orig.+3 3 1.26 50 161 47.1
Orig.+4 4 1.68 55 163 49.7
Orig.+5 5 2.10 60 165 53.8
Orig.+6 6 2.52 65 169 59.9
Orig.+7 7 2.94 70 171 65.0
Orig.+8 8 3.36 75 173 70.4
Orig.+9 9 3.78 80 175 77.6
Orig.+10 10 4.20 85 177 80.3
Orig.+11 11 4.62 90 179 76.2
Orig.+12 12 5.04 95 181 75.1

Se observa que el punto décimo representa el valor máximo de la trayectoria de experimentación por lo
que ahora se tomará como nuevo punto central (0,0) el punto (85, 175) y la región de experimentación
para 1 es (80,90) y para 2 es (170,180), con las variables codificadas X1 y X2 como sigue:
1  85
x1 
5
  175
x2  2
5

90

80

70

60

50

40
0 1 2 3 4 5 6 7 8 9 10 11 12 Pasos

Fig. N°4: Gráfica de rendimiento contra pasos en la trayectoria de ascenso más pronunciado

Haciendo nuevos experimentos alrededor del nuevo punto (0,0) se tiene:

Variables Variables
del Proceso codificadas Rendimiento
Corrida Tiempo (min.) Temp.(ºF) X1 X2 Y1
1 80 170 -1 -1 76.5
2 80 180 -1 1 77.0
3 90 170 1 -1 78.0
4 90 180 1 1 79.5
5 85 175 0 0 79.9
6 85 175 0 0 80.3
7 85 175 0 0 80.0
8 85 175 0 0 79.7
9 85 175 0 0 79.8

> proceso2<-read.table("proceso2.txt",T)
> library(rsm)
> proc2<-coded.data(proceso2, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)
> mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc2)
> summary(mod3)
Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc2)

Residuals:
1 2 3 4 5 6 7
0.000e+00 -6.939e-18 -7.254e-18 4.889e-18 -4.000e-02 3.600e-01 6.000e-02
8 9
-2.400e-01 -1.400e-01

Coefficients: (1 not defined because of singularities)


Estimate Std. Error t value Pr(>|t|)
(Intercept) 79.9400 0.1030 776.446 1.65e-11 ***
I(x1) 1.0000 0.1151 8.687 0.000966 ***
I(x2) 0.5000 0.1151 4.344 0.012217 *
I(x1^2) -2.1900 0.1544 -14.181 0.000144 ***
I(x2^2) NA NA NA NA
I(x1):I(x2) 0.2500 0.1151 2.172 0.095611 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2302 on 4 degrees of freedom


Multiple R-squared: 0.9868, Adjusted R-squared: 0.9737
F-statistic: 75.04 on 4 and 4 DF, p-value: 0.0005143

El ajuste del modelo de primer orden está dado por:

yˆ  79.94  1.00 x1  0.50 x2

A continuación se presenta el análisis de variancia de este modelo incluyendo las verificaciones de la


interacción y del término cuadrático puro.

> summary(aov(mod3))
Df Sum Sq Mean Sq F value Pr(>F)
I(x1) 1 4.000 4.000 75.472 0.000966 ***
I(x2) 1 1.000 1.000 18.868 0.012217 *
I(x1^2) 1 10.658 10.658 201.094 0.000144 ***
I(x1):I(x2) 1 0.250 0.250 4.717 0.095611 .
Residuals 4 0.212 0.053
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Para verificar la interacción de los factores tiempo de reacción y temperatura de reacción y el efecto de
curvatura pura contribuye sobre el rendimiento del proceso se considera el siguiente modelo:

2
Y  0  1x1   2 x2  12 x1x2   ii xi2  
i 1
Sobre el efecto de interacción:

H 0 : 12  0 contra H1 : 12  0

Como el Fc = 4.717 y el pvalue =0.095611


La interacción de los factores tiempo de reacción y temperatura de reacción contribuye sobre el rendimiento del
proceso a un nivel de significación del 10%.

Sobre la curvatura

2 2
H 0 :  ii  0 contra H1 :  ii  0
i 1 i 1

Debido a que Fc = 201.094 y el pvalue = 0.000144

Se puede concluir que el efecto de la curvatura contribuye significativamente a un nivel del 0.1% sobre
el rendimiento del proceso.

Análisis de una superficie de respuesta de segundo orden


En la mayoría de los casos, el modelo de segundo orden:

k k
y  0   i xi   ii xi2   i j ij xi x j   (3)
i 1 i 1

Es adecuado. En esta sección se indicará como usar este modelo ajustado para encontrar el conjunto
óptimo de condiciones de operación para las x, así como para caracterizar la naturaleza de la superficie
de respuesta.

Localización del punto estacionario

Suponga que quieren encontrarse los niveles de x1, , xk que optimizan la respuesta predicha. Este
punto, en caso de existir, será el conjunto de las x1, , xk para que las derivadas parciales
yˆ x1   yˆ xk  0 . A este punto, por ejemplo x1,s , x2,s , , xk ,s , se le llama punto estacionario. El
punto estacionario podría representar: 1) un punto de respuesta máxima, 2) un punto de respuesta
mínima, o 3) un punto silla.
Fig. N° 5: Superficie de respuesta y gráfico de contorno que ilustra una superficie con un máximo
Fig. N° 6: Superficie de respuesta y gráfico de contorno que ilustra una superficie con un mínimo
Fig. N° 7: Superficie de respuesta y gráfico de contorno que ilustra una superficie con un punto silla (o
minimax).
La gráfica de contorno desempeña un papel muy importante en el estudio de la superficie de respuesta.
Mediante la generación de gráficas de contornos utilizando software de computadora para el análisis de
superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la superficie y
localizar el óptimo con precisión razonable.

Es posible obtener una solución matemática general para la localización del punto estacionario. Al
escribir el modelo de segundo orden en notación matricial, se tiene

ŷ  ˆ0  xb  xBx (4)

donde
 x1   ˆ1   ˆ11 , ˆ12 2, , ˆ1k 2 
x     
 ˆ   ˆ22 , , ˆ2 k 2 
x 2 b 2 B 
 
     
 k  ˆ    kk 
ˆ
 k 
x
 simétrica

Es decir, b es un vector  k 1 de los coeficientes de regresión estimados de primer orden y B es una
matriz de la simétrica  k  k  cuyos elementos de la diagonal principal son los coeficientes cuadráticos
puros estimados  ˆ 
ii y cuyos elementos fuera de la diagonal son la mitad de los coeficientes

 
cuadráticos mixtos estimados ˆij , i  j . La derivada de ŷ con respecto a los elementos del vector x
igualada con 0 es

yˆ
 b  2Bx  0
x

El punto estacionario es la solución de la ecuación, o

1
x s   B-1b (5)
2

Luego, la respuesta predicha se obtiene al sustituir este valor en la ecuación dada para ŷ :
1  1   1 
yˆ s  ˆ0  xsb  xs Bx s  ˆ0  bB 1b    bB 1  B   B 1b 
2  2   2 
1 1  1
 ˆ0    bB 1  b  ˆ0  xsb
2 2  2

1
yˆ s  ˆ0  xsb (6)
2
Caracterización de la superficie de respuesta

Una vez que se ha encontrado el punto estacionario, generalmente es necesario caracterizar la


superficie de respuesta en la vecindad inmediata de este punto. Por caracterizar se entiende determinar si
el punto estacionario es un punto de una respuesta máxima, mínima o un punto silla. Por lo general
también se desea estudiar la sensibilidad relativa de la respuesta a las variables x1, x2 , , xk .
Como ya se señaló, la forma más directa de hacer esto es examinando una gráfica de contorno
del modelo ajustado. Si sólo hay dos o tres variables en el proceso (las x), la construcción e
interpretación de esta gráfica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un
número relativamente reducido de variables, un análisis más formal, llamado análisis canónico, puede
ser útil.
Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen
en el punto estacionario x, y después hacer la rotación de los ejes de este sistema hasta que sean
paralelos a los ejes principales de la superficie de respuesta ajustada. Esta transformación se ilustra la
Fig. N° 8. Puede demostrarse que se obtiene así el modelo ajustado.

yˆ  yˆ s  1w12  2 w22   k wk2 (7)

Donde las wi  son las variables independientes transformadas y las i  son constantes. A esta
ecuación se le llama forma canónica del modelo. Además, las i  son solo los eigemvalores o raíces
características de la matriz B .

Fig. N° 8: Forma canónica del modelo de segundo orden

La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y


de los signos y magnitudes de las i  . Primero suponga que el punto estacionario está dentro de la
región de exploración para ajustar el modelo de segundo orden. Si todas las i  son positivas, x s es un
punto de respuesta mínima; si todas las i  son positivas, x s es un punto de respuesta máxima; y si las
i  tienen signos diferentes, x s es un punto silla. Además, la superficie presenta una inclinación mayor
en la dirección wi para la que x s es un máximo. Por ejemplo, la Fig. N° 9 describe un sistema para el
que x s es un máximo ( 1 y 2 son negativas) con 1  2 .

Ejemplo N° 2
Con los datos del ejemplo del proceso químico no posible ajustar un modelo de segundo orden en
términos de las variables x1 y x2 , por esta razón el experimentador decide aumentar este diseño con
puntos suficientes para ajustar un modelo de segundo orden. Obtiene cuatro observaciones en ( x1  0 ,
x2  1.414 ) y ( x1  1.414 , x2  0 ). El experimento completo se muestra en la siguiente tabla:

Variables Variables
del Proceso codificadas Rendimiento
Corrida Tiempo (min.) Temp.(ºF) X1 X2 Y2
1 80 170 -1 -1 76.5
2 80 180 -1 1 77.0
3 90 170 1 -1 78.0
4 90 180 1 1 79.5
5 85 175 0 0 79.9
6 85 175 0 0 80.3
7 85 175 0 0 80.0
8 85 175 0 0 79.7
9 85 175 0 0 79.8
10 92.07 175 1.414 0 78.4
11 77.93 175 -1.414 0 75.6
12 85 182.07 0 1.414 78.5
13 85 167.93 0 -1.414 77.0

El diseño del experimento se ilustra en la Fig. N° 9. A este diseño se le llama diseño central compuesto
(o DCC), el cual se estudiará con mayor detalle más adelante.
Fig. N° 9: Diseño Central Compuesto en las variables codificadas del ejemplo

Para realizar el análisis se asume el siguiente modelo:

y  0  1 x1  2 x2  11 x12  22 x22  12 x1 x2  

> proceso3<-read.table("proceso3.txt",T)
> library(rsm)
> proc3<-coded.data(proceso3, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)

> proc3
Tiempo Temp Y1
1 80.00 170.00 76.5
2 80.00 180.00 77.0
3 90.00 170.00 78.0
4 90.00 180.00 79.5
5 85.00 175.00 79.9
6 85.00 175.00 80.3
7 85.00 175.00 80.0
8 85.00 175.00 79.7
9 85.00 175.00 79.8
10 92.07 175.00 78.4
11 77.93 175.00 75.6
12 85.00 182.07 78.5
13 85.00 167.93 77.0

Data are stored in coded form using these coding formulas ...
x1 ~ (Tiempo - 85)/5
x2 ~ (Temp - 175)/5

> proc3.rsm<-rsm(Y1~SO(x1,x2),data=proc3)
> summary(proc3.rsm)
Call:
rsm(formula = Y1 ~ SO(x1, x2), data = proc3)

Estimate Std. Error t value Pr(>|t|)


(Intercept) 79.939955 0.119089 671.2644 < 2.2e-16 ***
x1 0.995050 0.094155 10.5682 1.484e-05 ***
x2 0.515203 0.094155 5.4719 0.000934 ***
x1:x2 0.250000 0.133145 1.8777 0.102519
x1^2 -1.376449 0.100984 -13.6303 2.693e-06 ***
x2^2 -1.001336 0.100984 -9.9158 2.262e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Analysis of Variance Table

Response: Y1
Df Sum Sq Mean Sq F value Pr(>F)
FO(x1, x2) 2 10.0430 5.0215 70.8143 2.267e-05
TWI(x1, x2) 1 0.2500 0.2500 3.5256 0.1025
PQ(x1, x2) 2 17.9537 8.9769 126.5944 3.194e-06
Residuals 7 0.4964 0.0709
Lack of fit 3 0.2844 0.0948 1.7885 0.2886
Pure error 4 0.2120 0.0530

Stationary point of response surface:


x1 x2
0.3892304 0.3058466

Stationary point in original units:


Tiempo Temp
86.94615 176.52923

Eigenanalysis:
$values
[1] -0.9634986 -1.4142867

$vectors
[,1] [,2]
x1 -0.2897174 -0.9571122
x2 -0.9571122 0.2897174 [1] -0.9634986 -1.4142867

$vectors
[,1] [,2]
x1 -0.2897174 -0.9571122
x2 -0.9571122 0.2897174

H 0 : 1  2  0
H1 : 1  0 y/o 2  0 H1 : 12  0

La prueba resultó muy altamente significativa, se puede afirmar que al menos uno de los factores x1 y/o
x2 influye linealmente a la variable respuesta y.
H 0 : 11  22  0
H1 : 11  0 y/o 22  0

La prueba resultón muy altamente significativa, se puede afirmar que al menos unos de los factores x1
y/o x2 tenga un efecto cuadrático sobre la variable respuesta y.

H 0 : 12  0
H1 : 12  0

A un nivel de significación del 10% no se ha encontrado que haya un efecto de interacción entre x1 y x2
que influya sobre la variable respuesta y.

H 0 : No hay falta de ajuste


H1 : Falta incluir otros efectos, tales como efectos cúbicos.

A un nivel de significación del 10% no se ha encontrado suficiente evidencia para afirmar que existe
falta de ajuste

> mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc3)
> summary(mod3)

Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc3)

Residuals:
Min 1Q Median 3Q Max
-0.23995 -0.18089 -0.03995 0.17758 0.36005

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 79.93995 0.11909 671.264 < 2e-16 ***
I(x1) 0.99505 0.09415 10.568 1.48e-05 ***
I(x2) 0.51520 0.09415 5.472 0.000934 ***
I(x1^2) -1.37645 0.10098 -13.630 2.69e-06 ***
I(x2^2) -1.00134 0.10098 -9.916 2.26e-05 ***
I(x1):I(x2) 0.25000 0.13315 1.878 0.102519
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2663 on 7 degrees of freedom


Multiple R-squared: 0.9827, Adjusted R-squared: 0.9704
F-statistic: 79.67 on 5 and 7 DF, p-value: 5.147e-06

A pesar que el efecto de interacción no influya significativamente a un nivel del 10%, pero como el
pvalue está muy cerca de este nivel se considera en la ecuación de regresión estimada. Por lo tanto, la
ecuación de regresión estimada queda como:
yˆ  79.93995  0.99505x1  0.51520 x2  1.3764 x12  1.00134 x22  0.25x1x2

La localización del punto estacionario también podría encontrarse utilizando la solución general dada en
la ecuación (5). Observe que

0.995  1.376 0.1250 


b  , B 
0.515  0.1250 1.001

1
1  1.376 0.125  0.995 1  0.73508299 0.09179358  0.995
xs     
2  0.125 1.001 0.515 2  0.09179358 1.01046373  0.515
0.3893406 
xs   
0.3058617 

Es decir x1,s  0.3893406 y xs ,2  0.3058617 , en término de las variables naturales, se tiene:

1  85 2  175
0.3893406= , luego 1  86.9467 y 2  176.5293
y 0.3058617 
5 5
> x1<-seq(-1,1,0.1)
> x2<-seq(-1,1,0.1)
> model<-function(x,y){79.93995+0.99505*x+0.5152*y-1.3764*x^2-
1.00134*y^2+0.25*x*y}
> z<-outer(x1,x2,model)
> contour(x1,x2,z,nlevels=7)
1.0

79
.5
77.5
0.5

80
0.0
-0.5

79.5

79

77 78
-1.0

77

.5
78.5 78.5

-1.0 -0.5 0.0 0.5 1.0

> persp(x1,x2,z,theta=30,phi=30, expand=1,ticktype="detailed")


80

79
z

78

1.0
77
0.5
-1.0 0.0
-0.5 x2
0.0 -0.5
x1
0.5
1.0-1.0
Fig Nº 10: Gráfica de contorno y superficie de respuesta de la variable respuesta rendimiento
Este valor está muy cerca del punto estacionario que se encontró por examen visual de la gráfica de
contorno presentada en la figura 10 a). Al utilizar la ecuación (6), la respuesta predicha en el punto
estacionario puede encontrarse que
1 1 0.995
yˆ s  ˆ0  xs b  79.93995   0.3893406 0.3058617    80.48
2 2 0.515

Diseños experimentales para ajustar superficies de respuesta.

El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada de un diseño
experimental.
Un diseño es el conjunto específico de combinaciones de los niveles de las k variables que se utilizará al
llevar a cabo el experimento.

2.7.1 Diseños para ajustar modelos de primer orden.


Una clase única de diseños que minimizan la varianza de los coeficientes de regresión ˆi   son los
diseños ortogonales de primer orden. Por ortogonal se entiende que los elementos fuera de la diagonal
de la matriz  xx  son iguales a cero, lo cual implica que los productos cruzados de las columnas de la
matriz x es igual a cero.

En esta clase de diseños ortogonales de primer orden se incluyen:


1. Diseños factoriales 2k
2. Fracciones de la serie 2k
3. Diseños simplex
4. Diseños Placket-Burman

Diseños factoriales 2k
En este diseño los k factores se codifican a los niveles estandarizados 1. El diseño no permite la
estimación del error experimental a menos que se repitan los experimentos, para lograr esto se aumenta
el diseño con observaciones en el centro. La adición de los puntos centrales no tiene influencia sobre las
 
ˆ para i  I , pero la estimación de  es el promedio general de todas las observaciones.
i 0

Fracciones de la serie 2k
En programas experimentales se tienen dos razones para no llevar a cabo las 2k combinaciones de un
arreglo factorial completo:
1. A medida que el número k de factores incrementa crece rápidamente el número de
combinaciones de niveles, haciéndose muy grande.
2. Sólo los primeros k+1 términos del modelo definen la ecuación de un hiperplano. Los restantes
2k – (k+1) términos, consistentes en productos cruzados son una medida de la distorsión del
hiperplano.
Como el nombre de este diseño lo indica es una fracción de un diseño 2k. La fracción ½ se denota
como 2k-1 y contiene la mitad de las combinaciones de un 2k mientras que la fracción ¼ se denota como
2-1-2 y contiene la cuarta parte de las combinaciones de un 2k. Las fracciones deben tener suficientes
puntos para estimar los k+1 coeficientes.

Cabe señalar que al usar un diseño 2k-1 no podemos medir la posible falta de ajuste del modelo, a menos
que se cuente con una estimación de la varianza del error haciendo réplicas del punto central; además, si
el término xixjxl realmente existe sesga la estimación del efecto principal asociado con xk.

Diseño simplex

En este diseño los puntos se localizan en los vértices de una figura regular, ésta tiene k+1 vértices y está
en k dimensiones. Para k=2 la figura geométrica es un triángulo equilátero y para k=3 es un tetraedro.

Como el número de puntos es igual al número de coeficientes del modelo se recomienda adicionar
réplicas en el punto central para que sea posible obtener la varianza del error y/o llevar a cabo la prueba
de falta de ajuste.

Diseños de Plakett-Burman

Características

Son diseños factoriales fraccionados de 2 niveles de resolución III, que se utilizan frecuentemente para
estudiar efectos principales.

Este modelo no tiene completa la confusión de los efectos, en su lugar cada efecto principal se confunde
parcialmente con todas las interacciones

Sirven para estudiar k=N-1 variables en N corridas, donde N es un múltiplo de 4.

Puesto que estos diseños no pueden representarse como cubos, en ocasiones se les llama diseños no
geométricos.

Tabla 2.7 Comparación de los diseños ortogonales de primer orden

DISEÑO N° DE PUNTOS VENTAJA DESVENTAJA


Factoriales 2k n=2k Requiere observaciones
en el centro
La estimación de  0 es
el promedio general de
todas las observaciones.
Fracciones de la Serie n= 1 2 de 2k Contiene menos Requiere observaciones
2k n= 1 4 de 2k combinaciones que un en el centro
2k Si el término xixjxl existe
sesga la estimación del
efecto principal
asociado con xk.
simplex n=k+1
Plackett-Burman n=k+1, n es un múltiplo Los coeficientes se
de 4. estiman con máxima
precisión.

Diseños para ajustar modelos de segundo orden.

Un diseño experimental para ajustar un modelo de segundo orden debe tener al menos tres niveles de
cada factor (-1, 0, +1). Así como en el diseño de primer orden se desea la ortogonalidad, en éste se desea
que sea un diseño rotable. Se dice que un diseño es rotable cuando la varianza de la respuesta predicha
en algún punto es función sólo de la distancia del punto al centro y no es una función de la dirección.

La rotabilidad es una propiedad importante, dado que la finalidad de la Metodología de Superficies de


Respuesta es optimizar y desconocemos la localización del óptimo, tiene sentido utilizar un diseño que
proporcione estimaciones precisas en todas direcciones.

Dentro de los diseños rotables de segundo orden se incluyen:

1. Diseño central compuesto


2. Diseño equirradial
3. Diseños Box-Behnken

Diseño central compuesto

Este diseño consiste en un factorial o factorial fraccionado 2k, donde los factores son codificados de tal
manera que el centro sea (0,0,...,0), aumentado por 2k puntos axiales (,0, 0,..., 0), (0, ,0,..., 0),
(0, 0, y nc puntos centrales (0,0,...,0). De acuerdo a Montgomery [6] 1991 este
diseño es probablemente el más usado.

Este diseño se convierte en rotable mediante la elección de , ésta se calcula de la siguiente manera
(Montgomery [6] 1991):

  nf 
1
4

Donde f es el número de puntos en la porción factorial del diseño.

Otra propiedad útil del diseño es que puede “crecer” a partir de un diseño 2k de primer orden, agregando
puntos axiales y quizá algunos puntos centrales (Montgomery [6] (1991)). Con la elección del número
de puntos centrales (n0), el diseño puede hacerse ortogonal o se puede transformar en uno de precisión
uniforme.
En un diseño de precisión, la varianza de la respuesta predicha en el origen es igual a la predicha a una
distancia unitaria del origen. Este proporciona mayor protección que el ortogonal contra el sesgo de los
coeficientes, debido a la presencia de términos de tercer y mayor orden.

Existen algunos diseños de dos factores especiales e interesantes que son una alternativa a los diseños
compuestos centrales. Éstos diseños son los de la clase equiradial que inicia con el pentágono que tiene
5 puntos igualmente espaciados sobre un círculo; este tipo de diseños requiere de corridas centrales ya
que son diseños que se encuentran en una esfera común además de ser rotables. La matriz diseño para
los diseños equiradiales se obtienen a partir de:


  2 u   2 u  

  cos    , sen     , u  0, 1, 2, , n1  1 (*)

  n1   n1  
donde ρ es el radio del diseño, n1 es el número de puntos sobre la esfera (pentágono, hexágono, etc.).
Además de los n1 puntos generados a partir de (*), se adicionan nc corridas centrales al diseño. La
elección de ρ determina la naturaleza de la escala. (Myers 1995)

Para k=2, el diseño se obtiene combinando n1  5 puntos igualmente espaciados sobre una
circunferencia con nc  1 puntos en su centro. El pentágono y el hexágono son útiles en este caso. Para
k=3, los únicos arreglos que cuentan con puntos suficientes para estimar todos los parámetros son el
icosaedro y el dodecaedro.

Según Montgomery [6] (1991), este diseño es ocasionalmente útil en problemas con dos o tres variables.

Ejemplo:

El hexágono es un caso especial, útil e interesante; es decir, seis puntos equidistantes en un círculo. Así,
n f  6 , estableciendo   0 y   1 , se tiene la siguiente combinaciones tratamiento para k=2 y nc  3

x1 x2
1 0
0.5 0.75
-0.5 0.75
-1 0
-0.5 - 0.75
0.5 - 0.75
0 0
0 0
0 0
Aquí se puede observar que x1 tiene 5 niveles y x2 tiene tres niveles para esta rotación en particular la
siguiente figura muestra el diseño:

3 2

4 7, 8, 9 1

5 6

Diseño Box-Behnken.

El diseño Box – Behnken es un diseño cuadrático independiente que no posee un diseño factorial o una
factorial fraccional. Estos diseños son giratorios (o casi giratorios) pero ellos poseen capacidad limitada
de bloqueo ortogonal comparado con el Diseño Compuesto Central.

Diferente al CCD, los diseños Box – Behnken usan solo 3 niveles para cada factor. Las combinaciones
de los niveles de los factores están en los puntos centrales del eje del espacio de diseño y en el centro.
Por ejemplo, el Diseño Box – Behnken para tres factores envuelve tres bloques, en cada uno de ellos 2
factores son variados a través de las 4 posibles altas y bajas combinaciones. Es además necesario incluir
puntos centrales, donde todos los factores están in sus valores centrales. En consecuencia, estos diseños
no contienen puntos en el vértice de la región experimental.

El número de experimentos requeridos (N) es definido por la expresión N=2k (k-1) + CO, donde k es el
número de factores y CO es el número de puntos centrales.
Ejemplo: la siguiente tabla muestra el diseño de Box Behnken para tres variables. Se puede observar en
la figura Nª 11 que este diseño es esférico con todo los puntos localizado en una esfera de radio 2 ,
Además, el diseño de Box Behnken no contiene ningún punto en los vértices de la región cúbica creada
por los límites inferior y superior de cada variable. Esto podría ser una ventaja cuando los puntos de los
vértices del cubo representan combinaciones de los niveles de los factores cuya prueba es
prohibitivamente costosa o imposible debido a restricciones físicas del proceso.

Diseño de Box Behnken para tres variables

corrida x1 x2 x3
1 -1 -1 0
2 -1 1 0
3 1 -1 0
4 1 1 0
5 -1 0 -1
6 -1 0 1
7 1 0 -1
8 1 0 1
9 0 -1 -1
10 0 -1 1
11 0 1 -1
12 0 1 1
13 0 0 0
14 0 0 0
15 0 0 0

Fig.Nº 10: Representación del diseño de Box Behnken para tres variables

Ejemplo N° 2

Se desea establecer las mejores condiciones de secado de oca el cual permita la retención máxima de
vitamina C en el producto final, si se considera que la vitamina C es uno de lps compuestos químicos
más fácilmente destruidos por factores como:

- Temperatura del aire de secado: 45 y 75° C


- Velocidad del aire de secado: 1 y 4 m/s.
- Concentración de bisulfito: 0 y 0.5 %

Se utilizó un diseño de Box Behnken con tres puntos centrales, a continuación se dan las combinaciones
de tratamientos y los resultados obtenidos del experimento:
Temperatura Velocidad Bisulfito Vitamina C
45 1 0.25 10
60 1 0 8.5
60 1 0.5 9
45 2.5 0.5 12.8
45 4 0.25 13
60 4 0.5 15
60 2.5 0.25 12.1
60 2.5 0.25 12
75 4 0.25 7.2
45 2.5 0 11
60 2.5 0.25 12.3
75 2.5 0 8
75 2.5 0.5 8.4
75 1 0.25 6.1
60 4 0 12.8

> vita<-read.table("vitaminaC.txt",T)
> library(rsm)
> vita1<-coded.data(vita,x1~(Temperatura-60)/15,x2~(Velocidad-
2.5)/1.5,x3~(Bisulfito-0.25)/0.25)
> vita.rsm<-rsm(VitaminaC~SO(x1,x2,x3),data=vita1)
> summary(vita.rsm)

Call:
rsm(formula = VitaminaC ~ SO(x1, x2, x3), data = vita1)

Estimate Std. Error t value Pr(>|t|)


(Intercept) 12.133333 0.607957 19.9576 5.837e-06 ***
x1 -2.137500 0.372296 -5.7414 0.002246 **
x2 1.800000 0.372296 4.8349 0.004736 **
x3 0.612500 0.372296 1.6452 0.160849
x1:x2 -0.475000 0.526506 -0.9022 0.408320
x1:x3 -0.350000 0.526506 -0.6648 0.535631
x2:x3 0.425000 0.526506 0.8072 0.456213
x1^2 -2.166667 0.548005 -3.9537 0.010810 *
x2^2 -0.891667 0.548005 -1.6271 0.164641
x3^2 0.083333 0.548005 0.1521 0.885080
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Multiple R-squared: 0.9402, Adjusted R-squared: 0.8326


F-statistic: 8.739 on 9 and 5 DF, p-value: 0.01397

Analysis of Variance Table

Response: VitaminaC
Df Sum Sq Mean Sq F value Pr(>F)
FO(x1, x2, x3) 3 65.473 21.8242 19.6821 0.003371
TWI(x1, x2, x3) 3 2.115 0.7050 0.6358 0.623483
PQ(x1, x2, x3) 3 19.626 6.5419 5.8998 0.042568
Residuals 5 5.544 1.1088
Lack of fit 3 5.498 1.8325 78.5357 0.012599
Pure error 2 0.047 0.0233

Stationary point of response surface:


x1 x2 x3
-0.16306909 0.05930893 -4.16868288

Stationary point in original units:


Temperatura Velocidad Bisulfito
57.5539636 2.5889634 -0.7921707

Eigenanalysis:
$values
[1] 0.1488236 -0.9063402 -2.2174833

$vectors
[,1] [,2] [,3]
x1 0.09594741 0.1488053 0.98420074
x2 -0.22015455 -0.9611025 0.16677529
x3 -0.97073481 0.2326779 0.05945514

Para realizar el análisis se considera el siguiente modelo:

y  0  1x1  2 x2  3 x3  11x12  22 x22  33 x32  12 x1x2  13 x1x3  23 x2 x3  

H 0 : 1  2  3  0
H1 : al menos un i  0, para i  1, 2, 3
La prueba resultó altamente significativa (a un nivel del 1%), al menos un factor, temperatura del aire
del secado, velocidad del aire y concentración de bisulfito influye linealmente sobre la producción de
vitamina C.

H 0 : 11  22  33  0


H1 : al menos un ii  0, para i  1, 2, 3

La prueba resultó significativa (a un nivel del 5%), al menos un factor, temperatura del aire del secado,
velocidad del aire y concentración de Bisulfito tiene un efecto cuadrático sobre la producción de
vitamina C.

H 0 : 12  13  23  0


H1 : al menos un ij  0, donde i  j y para i, j  1, 2, 3
La prueba resultó no significativa a un nivel del 10%, ningún efecto de interacción dos a dos entre los
factores, temperatura del aire del secado, Velocidad del aire y concentración de Bisulfito influye sobre
la producción de vitamina C.

H 0 : No hay falta de ajuste


H1 : Falta incluir otros efectos, tales como efectos cúbicos.
A un nivel de significación del 5% se ha encontrado suficiente evidencia para afirmar que existe falta de
ajuste.
> mod<-lm(VitaminaC~I(x1)+I(x2)+I(x1^2), data=vita1)
> anva<-aov(mod)
> summary(anva)
Df Sum Sq Mean Sq F value Pr(>F)
I(x1) 1 36.55 36.55 29.39 0.00021 ***
I(x2) 1 25.92 25.92 20.84 0.00081 ***
I(x1^2) 1 16.60 16.60 13.35 0.00380 **
Residuals 11 13.68 1.24
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> par(mfrow=c(2,2))
> plot(mod)

Residuals vs Fitted 2
Normal Q-Q
Standardized residuals

6 6
1

1
Residuals

0
-1

-1

2 2
-2

-2

9 9

6 8 10 12 -1 0 1

Fitted values Theoretical Quantiles

Scale-Location Residuals vs Leverage


Standardized residuals

1.5

2
Standardized residuals

9
6 0.5
6
1

2
1.0

0
-1
0.5

2
0.5
-2

Cook's distance
0.0

9 1

6 8 10 12 0.0 0.1 0.2 0.3

Fitted values Leverage

> ri<-rstandard(mod)
> shapiro.test(ri)

Shapiro-Wilk normality test


data: ri
W = 0.9572, p-value = 0.6446

> library(car)
> ncvTest(mod)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 0.003673617 Df = 1 p = 0.9516695

En los cuatros gráficos se puede observar que posiblemente cumple con los supuestos de normalidad, ya
que en el gráfico de probabilidad normal todos los residuos estandarizados están muy cerca de la recta
que contiene los cuantiles de la distribución normal, esto puede ser verificado por la prueba de Shapiro
Wild, en la cual no se ha encontrado suficiente evidencia a un nivel de significación del 10% para
rechazar la hipótesis de que los errores tiene una distribución normal. También¸ posiblemente cumpla
con los supuestos de homogeneidad de variancia, ya que si observamos el 3er gráfico el lowes de los
valores predichos sobre la raíz cuadrada del valor absoluto de los residuales estandarizados no tiene una
tendencia sistemática, esto puede ser verificado mediante la prueba de Breusch y Pagan de que a un
nivel de significación del 10% para rechazar la hipótesis de que los errores tiene variancia constante.
Además, de acuerdo al cuarto gráfico, la observación N° 9 es un valor extremo. Por último, según ell
Lowes del primer gráfico de los valores predichos sobre los residuos al parecer falta un ajuste de una
tendencia cúbica de algún factor sobre la producción de vitamina C.

> ei<-residuals(mod)
> x1<-vita1$x1
> x2<-vita1$x2
> x3<-vita1$x3
> plot(x1,ei)
> abline(h=0,lty=2)
> plot(x2,ei)
> abline(h=0,lty=2)
> plot(x3,ei)
> abline(h=0,lty=2)
1.0

1.0
0.0

0.0
ei

ei
-2.0 -1.0

-2.0 -1.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0

x1 x2
1.0
0.0
ei

-2.0 -1.0

-1.0 -0.5 0.0 0.5 1.0

x3

Aparentemente ninguno de los factores: temperatura del aire del secado, velocidad del aire y
concentración de bisulfito influye bajo un polinomio cúbico sobre la producción de vitamina C.
Posiblemente, la influencia se debe a un factor no considerado en este estudio.

También podría gustarte