Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso Dise o Experimentos
Curso Dise o Experimentos
=
2
1 1
) ( j
c
j
ij
r
i
X X SCE =
= =
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 19 de 98
5. Cuadrados medios (Suma Cuadrados/ Grados libertad)
CMT = Cuadrado medio total = SCT / (n-1) = 19.4
CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9
CME = Cuadrado medio del error = SCE/ gle.= 16.9
6. Estadstico de prueba Fc y estadstico F crtico de alfa
Fc = CMTR / CME= 1.946745562
Clculo de F con Excel
=DISTR.F.INV(ALFA, GL. TR, GL. ERR) =DISTR.F.INV(0.05, 2, 11) = 3.982297957
1.0
0.8
0.6
0.4
0.2
0.0
X
D
e
n
s
i
d
a
d
3.98
0.05
0
Grfica de distribucin
F, df1=2, df2=11
Como F
c
es menor a F
+
=
20 30
40 52
B1 B2
A1
A2
Factor B
Factor A
20 30
40 52
B1 B2
A1
A2
Factor B
Factor A
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 45 de 98
En otras palabras incrementar el factor A del nivel 1 al 2 produce un cambio en la
respuesta promedio de 21 unidades. Similarmente, el efecto principal de B es:
11
2
40 20
2
52 30
B =
+
+
=
Si los factores tienen ms de dos niveles, el procedimiento anterior debe ser modificado
ya que las diferencias entre las respuestas promedio pueden expresarse de muchas
formas.
En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los
niveles de un factor no es la misma en todos los niveles de los otros factores. Cuando
esto ocurre existe una interaccin entre los factores. Por ejemplo, considrense los datos
de la Tabla 2.
Tabla 2. Un experimento factorial con interaccin
En el primer nivel del factor B, el efecto de A es:
A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interaccin entre los factores A y B porque el efecto de
A depende del nivel elegido de B.
Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra una grfica de la
respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del
factor B. Se observa que las rectas B
1
y B
2
son, aproximadamente, paralelas. Esto indica
20 40
50 12
B1 B2
A1
A2
Factor B
Factor A
20 40
50 12
B1 B2
A1
A2
Factor B
Factor A
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 46 de 98
que no hay interaccin entre los factores. De manera similar, en la Fig. 2 se presenta una
grfica de la respuesta de los datos de la Tabla 2.
Figura 1 Un experimento factorial sin interacciones
En este caso se ve que las rectas B
1
y B
2
no son paralelas. Esto muestra que existe una
interaccin entre A y B. Sin embargo, no debe ser la nica tcnica para analizar los datos,
porque su interpretacin es subjetiva y su apariencia, a menudo, es engaosa.
Figura 2 Un experimento factorial con interacciones
Hay que notar que cuando una interaccin es grande los correspondientes efectos
principales tienen poco significado prctico. Una estimacin del efecto principal de A de
los datos de la Tabla 2 es:
10
20
30
40
50
60
A1
A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a
Factor A
10
20
30
40
50
60
A1
A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a
Factor A
10
20
30
40
50
60
A1
A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a
Factor A
10
20
30
40
50
60
A1
A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a
Factor A
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 47 de 98
1
2
40 20
2
12 50
A =
+
+
=
El cual resulta ser muy pequeo corrindose el riesgo de concluir que no existe un efecto
debido a A. Sin embargo, cuando se examin el efecto de A en niveles diferentes de B se
concluy que ste no era el caso. El factor A tiene un efecto, pero depende del nivel del
factor B. En otras palabras, es ms til conocer la interaccin AB que el efecto principal.
Una interaccin significativa oculta a menudo el significado de los efectos principales.
Ventajas de los diseos factoriales
as ventajas de los diseos factoriales pueden ilustrarse fcilmente. Supongamos que se
tienen dos factores, A y B, cada uno con dos niveles. Estos niveles se representan
mediante A
1
, A
2
, B
1
y B
1
. La informacin acerca de ambos factores puede obtenerse
variando un factor a la vez como aparece en la tabla 3. El efecto de variar el factor A est
dada por A
2
B
1
-A
1
B
2
. A causa de que existe error experimental, es conveniente realizar,
por ejemplo, dos observaciones de cada combinacin de tratamientos y hacer una
estimacin de los efectos de los factores usando las respuestas promedio. Por lo tanto, se
requiere un total de seis observaciones.
L
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 48 de 98
Tabla 3 El mtodo de un factor a la vez
Los diseos factoriales poseen algunas ventajas.
Son ms eficientes que los experimentos de un factor a la vez.
Los diseos factoriales son necesarios cuando alguna interaccin puede estar
presente, para evitar hacer conclusiones engaosas.
Los diseos factoriales permiten estimar los efectos de un factor en diversos
niveles de los otros factores, produciendo conclusiones que son vlidas sobre toda
la extensin de las condiciones experimentales.
4.2 Diseo factorial de dos niveles (2
K
)
l primer diseo de la serie 2
2
es aquel en el que solo dos factores, A y B, cada uno con
dos niveles. Este diseo se conoce como diseo factorial 2
2
. Arbitrariamente, los niveles
del factor pueden llamarse bajo y alto.
Ejemplo 1 Considrese una investigacin llevada a cabo para estudiar el efecto que tiene
la concentracin de un reactivo y la presencia de un catalizador sobre el tiempo de
reaccin de un proceso qumico. Sea la concentracin del reactivo el factor A con dos
niveles de inters, 15% y 20%. El catalizador constituye el factor B; el nivel alto o superior
denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un
solo saco. El experimento se realiza (replica o repite) tres veces, y los datos son como
sigue:
E
A1B1 A1B2
A2B1 12
B1 B2
A1
A2
Factor B
Factor A
A1B1 A1B2
A2B1 12
B1 B2
A1
A2
Factor B
Factor A
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 49 de 98
En la figura 3 siguiente se presentan grficamente las combinaciones de tratamiento para
este diseo, el efecto de un factor se denota por la letra latina minscula. De este modo,
A se refiere al efecto del factor A, y B se refiere al efecto del factor B, y AB se
refiere a la interaccin entre AB. En el diseo 2
2
los niveles bajo y alto de A y B se
denotan por - y + respectivamente, en los ejes A y B. As en el eje B representa el
nivel bajo de catalizador mientras que + denota el nivel alto.
Las cuatro combinaciones de tratamientos en el diseo pueden representarse por letras
minsculas, cono se muestra en la figura 3. En esta figura se aprecia que el nivel superior
de cualquier factor de una combinacin de tratamientos est representado por la
presencia de la letra minscula correspondiente, mientras que la ausencia de esta ultima
representa el nivel inferior del factor.
Combinacin de
tratamientos
Replica
I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A alta, B alta 31 30 29 90
Alto (2 sacos) +
bajo (1 saco) -
-
bajo (15%)
+
alto (20%)
Concentracion de reactivo A
C
a
n
t
i
d
a
d
d
e
c
a
t
a
l
i
z
a
d
o
r
B
b = 60(18+19+23) ab = 90(31+30+19)
(1) = 80(28+25+27) a = 100(36+32+32)
Figura 1: Combinaciones de tratamiento en el diseo factoriall
Alto (2 sacos) +
bajo (1 saco) -
-
bajo (15%)
+
alto (20%)
Concentracion de reactivo A
C
a
n
t
i
d
a
d
d
e
c
a
t
a
l
i
z
a
d
o
r
B
b = 60(18+19+23) ab = 90(31+30+19)
(1) = 80(28+25+27) a = 100(36+32+32)
Figura 1: Combinaciones de tratamiento en el diseo factoriall
Fig. 3
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 50 de 98
As
a representa la combinacin de tratamientos, en la que A se encuentra en el nivel
superior y B en el nivel inferior;
b representa aquella en la que A se halla en el nivel inferior y B en el superior, y
ab representa a ambos factores en el nivel superior.
Por convencin (1) se usa para representar a ambos factores en el nivel inferior.
El efecto promedio de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel de ese factor, promediado sobre los niveles del
otro factor.
Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab tambin se usan para
representar los totales de las n replicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que el
nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:
| | | | { } | | (1) b a ab
2n
1
(1) a b ab
2n
1
A = + =
El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto
es, {b-(1)}/n, y de su efecto en el nivel superior de A (que es igual a [ab-a]/n obtenindose:
| | | | { } | | (1) a - b ab
2n
1
(1) b a ab
2n
1
B + = + =
El efecto de la interaccin AB se define como la diferencia promedio entre el efecto de A
en el nivel superior de B y su efecto en el nivel inferior de B, as:
| | | | { } | | (b) a (1) ab
2n
1
(1) a b ab
2n
1
AB + = =
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 51 de 98
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el
nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y
A+
, puesto que es la
respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra
en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o Y
A
). Esto
es,
+ = A Y A Y A
2n
(1) b
2n
a ab +
+
=
| | (1) b a ab
2n
1
+ =
Este es exactamente el mismo resultado, el efecto de B se encuentra como la diferencia
entre el promedio de las dos combinaciones de tratamientos en la parte superior del
cuadrado ( Y B+
) y el promedio de las dos combinaciones de tratamientos en la parte
inferior ( Y
B-
), o
+ = B Y B Y B
2n
(1) a
2n
b ab +
+
=
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 52 de 98
| | (1) a b ab
2n
1
+ =
Finalmente el efecto de interaccin AB es el promedio de las combinaciones de
tratamientos en la diagonal de derecha a izquierda del cuadrado |ab y (1)| menos el
promedio de las combinaciones de tratamientos en la diagonal de izquierda a derecha (a y
b), o
2n
b a
2n
(1) ab
AB
+
+
=
| | b a (1) ab
2n
1
+ =
Con los datos que aparecen en la figura 1, las estimaciones de los efectos promedio son:
( ) 8.33 80 60 100 90
2(3)
1
A = + =
( ) 5.00 80 100 60 90
2(3)
1
B = + =
( ) 1.67 60 100 80 90
2(3)
1
AB = + =
El efecto de A (concentracin de reactivo) es positivo; esto sugiere que al elevar A del
nivel bajo (15%) al nivel alto (25%) incrementar el rendimiento. El efecto de B
(catalizador) es negativo; esto sugiere que elevar la cantidad del catalizador agregada al
proceso reducir el rendimiento. Al parecer, el efecto de interacciones es pequeo
comparado con los dos efectos principales.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 53 de 98
En muchos experimentos que implican diseos 2
K
se examina la magnitud y la direccin
de los efectos de los factores para determinar cuales variables es probable que sean
importantes. Por lo general puede emplearse el anlisis de varianza para confirmar esta
interpretacin. En el diseo 2
k
existen algunos mtodos rpidos especiales para realizar
los clculos del anlisis de varianza.
Consideremos la suma de cuadrados para A, B y AB. Obsrvese la primera ecuacin que
se utiliza un contraste para estimar A; esto es,
(1) b a ab ContrasteA + =
Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera ecuacin,
puede apreciarse que tambin se utilizan contraste para estimar B y AB. Adems, estos
tres contrastes son ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuacin:
( ) =
a
a
2
ci n
2
a
1
ciyi. SSc
.
Esta ecuacin establece que la suma de cuadrados de contraste es igual al contraste
elevado al cuadrado entre el producto del nmero de las observaciones de cada total del
contraste por la suma de cuadrados de los coeficientes del mismo. En consecuencia, se
obtiene que las sumas de cuadrados de A, B y AB sean:
| |
| |
| |
4 * n
2
b a (1) ab
SS
4 * n
2
(1) a b ab
SS
4 * n
2
(1) b a ab
SS
AB
B
A
+
=
+
=
+
=
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 54 de 98
Con los datos de la figura 3, las sumas de cuadrados se pueden calcular aplicando las
ecuaciones anteriores, obtenindose:
8.33
4(3)
2
10
SS
75.00
4(3)
2
30
SS
208.33
4(3)
2
50
SS
AB
B
A
= =
=
=
= =
La suma total de cuadrados se determina de la manera usual mediante:
=
=
=
=
2
1 i
2
1 j
n
1 k
4n
...
2
Y
ijk
2
Y SST
En general SS
T
tiene 4n 1 grados de libertad. La suma de cuadrados del error, con 4(n-
1) G.L. se puede calcular en la forma usual, por diferencia, mediante.
323.00 9075.00 9398.00
4(3)
2
Y 2
1 i
2
1 j
3
1 k
2
ijk
Y
E
SS = =
=
=
=
=
AB
SS
B
SS
A
SS
T
SS
E
SS =
31.34 8.33 75.00 208.33 323.00 = =
El anlisis de varianza completo se presenta en la tabla siguiente. Ambos efectos
principales son significativos al 1%.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 55 de 98
A menudo se es conveniente escribir las combinaciones de tratamientos en el orden (1),
a, b, y ab. Este orden se conoce como orden estndar. Cuando se utiliza es posible
apreciar que los coeficientes de los contrastes usados para estimar los efectos son
Efectos (1) a b Ab
A:
B:
AB:
-1
-1
+1
+1
-1
-1
-1
+1
-1
+1
+1
+1
Tabla ANOVA para los datos del ejemplo 1 es la siguiente:
Fuente de
variacin SS G.L. MS Fo
A
B
AB
Error
Total
208.33
75.00
8.33
31.34
323.00
1
1
1
8
11
208.33
75.00
8.33
3.92
53.15
a
19.13
a
2.13
a
significativo al 1%
Signos algebraicos para calcular los efectos en un diseo 2
2
Combinacin
De
Tratamientos
Efecto Factorial
I A B AB
(1)
a
b
ab
+ - - +
+ + - -
+ - + -
+ + + +
Observe que los coeficientes de los contrastes usados para estimar la interaccin son
iguales al producto de los coeficientes correspondientes a los dos efectos principales. Los
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 56 de 98
coeficientes de los contrastes siempre son +1 o 1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos para determinar el
signo apropiado de cada combinacin de tratamientos. En el encabezado de las columnas
de tabla y se encuentran los efectos principales (A y B), la interaccin AB, e I, que
representa el total el total o el promedio de todo el experimento. Se observa que la
columna encabezada por I se compone de solo de signos positivos. Los renglones
corresponden a las combinaciones de tratamientos.
Para encontrar un contraste con el fin de estimar cualquier efecto, simplemente se
multiplican los signos de la columna apropiada de la tabla por la correspondiente
combinacin de tratamientos, y se suma. Por ejemplo, el contraste para estimar A es (1)
+ a b + ab, lo cual concuerda con la ecuacin.
| | | | { } | | (1) b a ab
2n
1
(1) a b ab
2n
1
A = + =
Los tipos ms sencillos de diseos factoriales implican slo dos factores o conjuntos de
tratamientos. Haya a niveles del factor A y b niveles del factor B, dispuestos en un
diseo factorial; esto es, cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 57 de 98
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES
5.1 Concepto de replicacin fraccionada
Conforme el nmero de factores del experimento crece, el nmero de casillas o
condiciones experimentales (y por lo tanto el nmero de lecturas o pruebas
necesarias), crece exponencialmente en un experimento factorial. El nmero de
efectos a evaluar (interacciones principalmente) crece exponencialmente tambin. El
nmero de efectos y casillas vara con el nmero de factores en una relacin como se
muestra en la tabla siguiente para un experimento factorial 2
k
.
As por ejemplo cuando se tienen siete factores, existen 128 posibles condiciones
experimentales, lo que implica que al hacer una replicacin por celda de todo el
experimento requiere un total de 128 observaciones. Si se decide tomar dos replicas por
celda, entonces serian necesarias 256 observaciones, lo cual es una cantidad excesiva de
pruebas para fines prcticos.
Por otro lado, se necesitan 128 observaciones para un experimento con 7 factores por
que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en 128
observaciones) de estos efectos 7 son los factores principales, 21 interacciones de 2
factores, 35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k factores tomados r
en r es:
No. De No. De Efectos
factores casillas principales 1 3 4 5 6 7 8
4 16 4 6 4 1
5 32 5 10 10 5 1
6 64 6 15 20 15 6 1
7 128 7 21 35 35 27 7 1
8 256 8 28 58 70 56 28 8 1
Interacciones entre factores de
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 58 de 98
| | r)! (k r!
K!
El concepto de replicacin fraccionada parte de las siguientes hiptesis:
1. Las interacciones de tres o ms factores son sumamente raras en la prctica, por
lo que en general se pueden suponer como no existentes.
2. En un experimento de varios factores lo ms probable es que solo algunos de ellos
sean relevantes para la variable de respuesta.
3. La mayor parte del efecto se debe a los factores principales y algunas
interacciones de dos factores.
Lo anterior implica que por ejemplo para siete factores son necesarios probablemente
solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores), y
esto equivale a solo 29 unidades de informacin y no 128 como en el experimento
original. Esto quiere decir que no es necesario el correr una replicacin completa de todo
el experimento cuando el nmero de factores crece, sino solamente algunas casillas o
condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se dice que se tiene una
replicacin fraccionada del experimento.
Las preguntas que surgen son:
1. Cuntas y cuales casillas probar?
2. Cmo analizar los resultados?
3. Qu informacin se pierde?
El responder a estas preguntas es uno de los objetivos de la replicacin fraccionaria.
5.2 Fraccin un medio del diseo 2
k
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 59 de 98
onsidrese el caso en el que se estudian tres factores de dos niveles cada uno, pero en
el que los experimentadores no pueden costear las 2
3
= 8 combinaciones de tratamientos,
sin embargo, si se puede costear 4 observaciones. Esto sugiere una fraccin un medio,
de un diseo 2
3
. la fraccin un medio del diseo 2
3
se conoce tambin como un diseo 2
3-
1
porque tiene 2
3-1
= 4 combinaciones de tratamiento.
En la tabla 1 aparecen signos positivos y negativos del diseo 2
3
. Supngase que para
componer la fraccin un medio, se seleccionan las combinaciones de tratamientos se usa
indistintamente la notacin convencional (a,b,c,...) y la de signos positivos y negativos. La
equivalencia de las dos notaciones se muestra a continuacin.
C
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 60 de 98
Notacin 1 Notacin 2
a + - -
b - + -
c - - +
abc + + +
Combinacin de
Tratamientos
Efecto factorial
I
A
B
C
AB
AC
BC
ABC
a + + - - - - + +
b + - + - - + - +
c + - - + + - - +
abc + + + + + + + +
ab + + + - + - - -
ac + + - + - + - -
bc + - + + - - + -
(1) + - - - + + + -
Tabla 1 Signos positivos para el diseo 2
3
Ntese que el diseo 2
3-1
se forma al seleccionar solo las combinaciones de tratamientos
que producen un signo positivo sobre la columna ABC. Por esto ABC se denomina
generador de una fraccin particular. Adems, la columna identidad I siempre es positiva,
por lo cual:
I = ABC
Se denominara relacin definitoria de nuestro diseo, en general, la relacin definitoria de
un factorial fraccionario siempre es el conjunto de todas las columnas que son iguales a la
columna identidad I.
c
abc
b
a
C
B
A
(a) Fraccin principal I = ABC
ab
bc
(1)
ac
(b) Fraccin alterna I = -ABC
c
abc
b
a
c
abc
b
a
C
B
A
C
B
A
(a) Fraccin principal I = ABC
ab
bc
(1)
ac
(b) Fraccin alterna I = -ABC
ab
bc
(1)
ac
(b) Fraccin alterna I = -ABC
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 61 de 98
Las combinaciones de tratamientos del diseo 2
3-1
producen 3 G.L. que pueden usase
para estimar los efectos principales. En la tabla 1 se muestra que las combinaciones
lineales de las observaciones que se utilizan para estimar los efectos principales A, B, y C
son:
abc) c b a 1/2( L
abc) c b a 1/2( L
abc) c b 1/2(a L
abc) c b a 1/2( L
abc) c b a 1/2( L
abc) c b 1/2(a L
AB
AC
BC
C
B
A
+ + =
+ + =
+ =
+ + =
+ + =
+ =
Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es imposible distinguir
entre A y BC, entre B y AC y entre C y AB. De hecho, es posible mostrar que cuando se
estima A, B y C, en realidad, lo que s esta haciendo es estimar A + BC, CB + AC y C +
AB, respectivamente. Dos o ms efectos que tienen esta propiedad se conoce como alias.
En este ejemplo, A y BC, B y AC y C y AB son alias. Esto se indica empleando la
notacin:
AB C L
AC B L
BC, A L
C
B
A
+
+
+
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 62 de 98
La estructura de los alias de este diseo pueden determinarse fcilmente con la relacin I
= ABC, multiplicando cualquier efecto por la relacin que define al diseo, modulo 2, da
como resultado los alias de dicho efecto. En el ejemplo anterior, los alias son:
A*I = A*ABC = A
2
BC
O dado que el cuadrado de cualquier columna es simplemente la identidad I.
A = BC
De modo similar, se encuentra que los alias de B y C son:
B*I = B*ABC = AB
2
C = AC
C*I = C*ABC = ABC
2
= AB
Esta fraccin un medio o semifraccin, con I = +ABC, suele llamarse fraccin principal.
Ahora supngase que se eligi la otra mitad de la rplica. Esta se compone de las
combinaciones de tratamientos de la tabla 1 que tiene signo negativo asociado con ABC.
Esta fraccin un medio o alterna que consta de las siguientes corridas:
Notacin 1 Notacin 2
(1) - - -
ab + + -
ac + - +
abc - + +
La relacin definitoria de este diseo es:
I = -ABC
Usando la fraccin alterna, las combinaciones lineales de las observaciones, LA, LB y
LC, son:
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 63 de 98
AB C L'
AC B L'
BC A L'
C
B
A
Por lo tanto, en realidad se est estimando A BC, B AC y C AB al estimar A, B y C
con esta fraccin. En la prctica, no importa cual de las dos fracciones se utilice.
Generalmente la fraccin asociada con I = +ABC se denomina fraccin principal. Ambas
fracciones pertenecen a la misma familia; en otras palabras, estas dos fracciones forman
el diseo 2
3
completo.
5.3 Resolucin del diseo
l diseo anterior 2
3-1
se conoce como diseo de resolucin III. En tal diseo los alias de
los efectos principales son interacciones de dos factores. Un diseo es resolucin R si
ningn efecto de p factores es alias de otro efecto que tenga menos R p factores.
Usualmente, se emplea el numeral romano como subndice para indicar la resolucin del
diseo. As, la fraccin un medio del diseo 2
3
definido por la relacin I = ABC (o bien I = -
ABC) constituye un diseo
1 3
III
2
.
Los diseos de resolucin III, IV y V son de importancia primordial. A continuacin, se
presenta la definicin de estos diseos junto con un ejemplo.
1. Diseo con resolucin III: stos son diseos en los que ningn efecto principal es
alias de otro, pero si lo son de las interacciones de dos factores; a su vez, estas
ltimas son alias entre s. El diseo 2
3-1
de la tabla 4.1 es de resolucin III.
2. Diseo con resolucin IV: En estos diseo ningn efecto principal es alias de otro
efecto principal, o bien, de alguna interaccin de dos factores. Las interacciones de
dos factores son alias entre s. Un diseo 2
4-1
con I = ABCD es de resolucin IV (
1 4
IV
2
).
E
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 64 de 98
3. Diseos resolucin V: Estos son diseos en los que ningn efecto principal o
interaccin de dos factores es alias de ningn efecto principal o interacciones entre
dos factores, un diseo 2
5-1
con I = ABCDE es de resolucin V (
1 5
V
2
).
En general, la resolucin de un diseo factorial fraccionario de dos niveles es igual al
mnimo nmero de letras de cualquier palabra de la relacin que define al diseo. En
consecuencia, los diseos anteriores, a menudo, se conocen como diseos de 3, 4 y 5
letras, respectivamente. Por lo general se deben usar diseos fraccionarios con la mayor
resolucin posible congruentes con el fraccionamiento requerido. A mayor resolucin, las
suposiciones relativas a las interacciones que deben despreciarse con el propsito de
hacer una interpretacin nica de los datos son menos restrictivas.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 65 de 98
6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS
6.1 Diseo factorial completo de 2 factores
Un ingeniero decide probar los tres materiales de la cubierta, nico factor controlable a
tres niveles de temperatura (15, 70 y 125 F) consistentes en el entorno de uso final del
producto. Se prueban cuatro bateras a cada combinacin de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.
En la tabla 1 se presentan el experimento y los datos resultantes de duracin observada
de las bateras.
En este problema, el ingeniero desea contestar las siguientes preguntas:
1. Qu efecto tienen el tipo de material y la temperatura sobre la duracin de la batera?
2. Existe una eleccin del material que d por resultado una duracin uniformemente
larga sin importar la temperatura?
Tipo de material
Temperatura F
15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
3 150 188 126 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60
Tabla 1. Duracin en horas para el ejemplo del diseo de una batera
Esta ltima pregunta reviste particular importancia. Existe la posibilidad de hallar un
material que no sea muy afectado por la temperatura. De ser as, el ingeniero puede
hacer que la batera sea robusta a la variacin de temperatura en el campo. ste es un
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 66 de 98
ejemplo del uso del diseo experimental estadstico para el diseo de un producto robusto
(o consistente), un importante problema de ingeniera.
Este diseo es un ejemplo especfico del caso general de un diseo con dos factores
(bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor
A se encuentra en el i-simo nivel (i -1, 2,..., n). En general, los datos observados se
vern como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio,
de modo que ste es un diseo completamente aleatorizado.
Tabla 2. Disposicin general para un diseo bifactorial
Las observaciones pueden describirse mediante el modelo estadstico lineal:
( )
=
=
=
+ + + + =
n 1,2,. . . , k
b 1,2,. . . , j
a 1,2,. . . , i
ijk ij j i Yijk
En donde es el efecto medio general, ti es el efecto del i-simo nivel del factor rengln
A, |j es el efecto del j-simo nivel del factor columna B, (t|)ij es el efecto de la interaccin
entre ti y |j, cijk es el componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como desviaciones de la
media general, por lo tanto.
=
=
= =
a
1 i
b
1 j
0 j 0; i Se supone que los efectos de interaccin
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 67 de 98
son fijos y que se definen d manera que:
( ) 0 ij
a
1 i
=
=
. Hay un total de abn
observaciones porque se realizan n rplicas.
En un diseo factorial de dos factores, tanto los factores (o tratamientos) de rengln como
de columna tienen la misma importancia, especficamente el inters consiste en probar
hiptesis acerca de la igualdad de los efectos de tratamiento de rengln, es decir:
0 i una menos al : H
0 a ... 2 : Ho
1
1
=
= = =
Y de la igualdad de los efectos de tratamiento de columna:
0 j una menos al : H1
0 b ... 2 1 : Ho
=
= = =
Tambin es interesante determinar s los tratamientos de rengln y columna
interaccionan. En otras palabras, resulta conveniente probar:
0 ()i una menos al : H1
j i, toda para 0 ()i : Ho
=
=
A continuacin, se muestra cmo pueden probarse estas hiptesis usando un anlisis de
variancia bifactorial o bidireccional (de dos factores o en dos sentidos).
6.2 Anlisis Estadstico del Modelo de Efectos Fijos
ea Yi..; el total de las observaciones bajo el i-simo nivel del factor A; Y.j. El total de las
observaciones bajo el j-simo nivel del factor B, Yij. El total de las observaciones de la ij-
sima celda, e Y... el total general de todas las observaciones. Se definen
... Y y ij. Y y .j. Y i..; Y
como los promedios de rengln, columna, celda y general,
respectivamente, matemticamente:
S
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 68 de 98
=
=
=
= =
=
=
=
=
=
=
=
=
= =
= =
=
=
=
a
1 i
b
1 j
n
1 k
abn
Y...
... Y Yijk Y...
b 1,2,..., j
a 1,2,..., i
;
n
Y...
ij. Y
n
1 k
Yijk Yij.
a
1 i
b 1,2,..., j ;
n
1 k
an
Y.j.
.j. Y Yijk Y.j.
a 1,2,..., i ;
bn
Yi..
i.. Y
b
1 j
n
1 k
Yijk Yi..
La suma total de cuadrados corregida puede expresarse mediante:
( )
( ) ( ) ( )
( )
( )
( ) ( ) ( )
( )
=
=
=
+
=
=
+ +
=
+
=
=
=
=
=
=
=
=
+ + + +
=
=
=
(
(
a
1 i
b
1 j
n
1 k
2
ij. Y - Yijk
2
a
1 i
b
1 j
. . . Y . j. Y i. . Y ij. Y n
2
b
1 j
. . . Y . j. Y an
2
a
1 i
. . . Y i. . Y bn
a
1 i
b
1 j
n
1 k
2
. . . Y Yijk
a
1 i
a
1 i
b
1 j
n
1 k
2
ij. Y Yijk
. . . Y . j Y . . . Y ij. Y . . . Y . j. Y . . . Y i. . Y
b
1 j
n
1 k
2
. . . Y Yijk
Dado que los seis productos cruzados del segundo miembro de la ecuacin anterior son
iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una
suma de cuadrados debida a los renglones o al factor A (SS
A
) en una suma de
cuadrados debida a las "columnas" o al factor B (SS
B
), en una suma de cuadrados
debida a la interaccin entre A y B (SSA
B
), y en una suma de cuadrados debida al error
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 69 de 98
(SS
E
): Analizando el ltimo trmino del miembro derecho de la Ecuacin anterior es
posible observar que es necesario tener al menos dos rplicas (n > 2) para poder
obtenerla suma de cuadrados del error.
Simblicamente, la Ecuacin anterior puede expresarse mediante:
E AB B A T SS SS SS SS SS + + + =
Los grados de libertad asociados a cada suma de cuadrados son:
Efecto Grados de libertad
A a-1
B b-1
Interaccin AB (a-1)(b-1)
Error ab(n-1)
Total abn-1
Esta descomposicin del total de abn -1 grados de libertad para las sumas de cuadrados
se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles,
respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Los grados de libertad de la interaccin simplemente corresponden a los grados de
libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los
dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de
cada una de las ab celdas hay n -1 grados de libertad entre las n rplicas, por lo tanto,
hay ab(n -1) grados de libertad del error.
Se observa que la suma de los grados de libertad de los trminos del miembro derecho de
la ecuacin anterior es igual al total de los grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad produce una media de
cuadrados.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 70 de 98
Por lo tanto, para probar el significado de ambos efectos principales, as como de su
interaccin, simplemente deben dividirse las medias de cuadrados correspondientes entre
la media de cuadrados del error. Valores grandes de estas razones implican que los datos
no concuerdan con las hiptesis nulas.
Si se considera que el modelo estadstico es adecuado y que los trminos del error cijk
son independientes con distribuciones normales con variancia constante o
2
, entonces las
razones de las medias de cuadrados MS
A
/MS
E
, MS
B
/MS
E
y MS
AB
/MS
E
tienen distribucin
F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n
-1) grados de libertad en el denominador. Las regiones crticas corresponden al extremo
superior de la distribucin F. Usualmente la prueba se presenta en una tabla de anlisis
de variancia como la que aparece en la tabla 2.
Fuente de
Variacin SS G.L. MS
Fo
Tratamientos A SS
A
a - 1
1 a
SS
MS
A
A
=
E
A
MS
MS
Tratamientos B SS
B
b - 1
1 b
SS
MS
B
B
=
E
B
MS
MS
Interaccin SS
AB
(a - 1)(b - 1)
1) 1)(b (a
SS
MS
AB
AB
=
E
AB
MS
MS
Error SS
E
ab(n-1)
1) ab(n
SS
MS
E
B
=
Total SS
T
abn - 1
Tabla 2 ANOVA para el modelo bifactorial de efectos fijos
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 71 de 98
Es posible obtener las frmulas para calcular las sumas de cuadrados de la ecuacin
anterior. La suma total de cuadrados se calcula en forma usual mediante:
=
=
=
=
a
1 i
b
1 j
n
1 k
abn
...
2
Y
ijk
2
Y T SS
Las sumas de cuadrados para los efectos principales son:
=
=
=
=
b
1 j
abn
...
2
Y
an
.j.
2
Y
B
a
1 i
abn
...
2
Y
bn
i..
2
Y
A
SS
SS
Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados
entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los
"subtotales":
=
=
=
a
1 i
b
1 j
abn
...
2
Y
n
ij.
2
Y
es SSsubtotal
Esta suma de cuadrados contiene a la SS
A
y SS
B
. Por lo tanto, la segunda etapa consiste
en calcular SS
AB
mediante:
B A subtotales AB SS SS SS SS =
La SS
E
se calcula por diferencia:
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 72 de 98
Subtotales T E
: bien o
B A AB T E
SS SS SS
SS SS SS SS SS
=
=
Ejemplo: Ms sobre el experimento de diseo de una batera. En la tabla 3 se presenta la
duracin efectiva (en horas) observada en el ejemplo de diseo de una batera descrito en
la anterior Los totales de rengln y de columna se indican en los mrgenes de la tabla; los
nmeros subrayados son los totales de celda.
Tipo
de
Mat.
Temperatura (F)
15
70
125
Yi..
1 130 155
134. 75
4 539 =
34 40
229
20 70
230 998
74 180 80 75 82 58
2 150 188
623
136 122
479
25 70
198 1300
159 126 106 115 58 45
3 138 110
576
174 120
583
96 104
342 1501
168 160 150 139 82 60
Y.j.= 1738 1291 770 Y...=
3799
Tabla 3. Duracin (en horas) para el experimento de diseo de una batera
Las sumas de cuadrados se calculan a continuacin:
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 73 de 98
77,646. 97
36
2
3799
2
60 . . .
2
74
2
155
2
130
a
1 i
b
1 j
n
1 k
abn
. . .
2
Y
ijk
2
Y SST
= + + + +
=
=
=
=
=
9,613.78 39,118.72
10,683.72
36
2
3799
4
2
342 ...
2
229
2
539
abn
...
2
Y a
1 i
b
1 j
n
ij.
2
Y
ion SSinteracc
39,118.72
36
2
3799
(3)(49
2
770
2
1291
2
1738
b
1 j
abn
...
2
Y
an
.j.
2
Y
ura SStemperat
10,683.72
36
2
3799
(3)(4)
2
1501
2
1300
2
998
a
1 i
abn
...
2
Y
bn
i..
2
Y
SSmaterial
=
+ + +
=
=
=
=
=
+ +
=
= =
=
+ +
=
= =
18,230. 75
9,613. 78 39,118. 72 10,638. 72 77,646. 97 SS
SS SS SS SS SS
E
n interaccio a temperatur material T E
= =
=
El anlisis de variancia aparece en la tabla 4. Se concluye que existe una interaccin
significativa entre el tipo de material y la temperatura porque F
0.05,4.27
= 2.73. Adems,
tambin son significativos los efectos principales del tipo de material y de la temperatura,
porque F
O.O5.2.27
= 3.35.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 74 de 98
Fuente de variacin SS G.L. MS Fo
Tipo de material 10,683.72 2 5,341.86 7.91
Temperatura 39,118.72 2 19,558.36 28.97
Interaccin 9,613.78 4 2,403.44 3.56
Error 18,230.75 27 675.21
Total 77,646.97 35
Tabla 4. ANOVA para los datos de la duracin de la batera
Como auxiliar en la interpretacin de los resultados de este experimento resulta til la
construccin de una grfica de las respuestas promedio de cada combinacin de
tratamiento. Esta grfica se muestra en la figura 1.
Figura 1. Grfica de respuesta vs temperatura
Material tipo 2
25
50
75
100
125
150
D
u
r
a
c
i
o
n
p
r
o
m
e
d
i
o
Temperatura
15 70 125
175
. ij Y
Material tipo 1
Material tipo 3
Material tipo 2
25
50
75
100
125
150
D
u
r
a
c
i
o
n
p
r
o
m
e
d
i
o
Temperatura
15 70 125
175
. ij Y
Material tipo 1
Material tipo 3
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 75 de 98
El hecho de que las rectas no sean paralelas indica una interaccin significativa. En
general, a menor temperatura mayor duracin, independientemente del tipo de material.
Al variar la temperatura de baja a intermedia, la duracin aumenta con el material tipo 3,
mientras que disminuye con los materiales tipo 1 y 2,
Cuando la temperatura vara de intermedia a alta, la duracin disminuye con los
materiales tipo 2 y 3, mientras que con el tipo 1 esencialmente permanece sin cambio. Al
parecer, el material tipo 3 da los mejores resultados si lo que se desea es menor perdida
de duracin efectiva al cambiar la temperatura.
Para comprobar si el modelo es adecuado, se analizan los residuos que tengan un
comportamiento aleatorio y normal.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 76 de 98
7. DISEO DE EXPERIMENTOS TAGUCHI
7.1 Introduccin
La parte fundamental de la metodologa ideada por el matemtico japons G. Taguchi es
la optimizacin de productos y procesos, a fin de asegurar productos robustos, de alta
calidad y bajo costo.
La metodologa Taguchi consta de tres etapas:
a) Diseo del sistema
b) Diseo de parmetros
c) Diseo de tolerancias
De estas tres etapas, la ms importante es el diseo de parmetros cuyos objetivos son:
a) Identificar qu factores afectan la caracterstica de calidad en cuanto a su magnitud y
en cuanto a su variabilidad.
b) Definir los niveles ptimos en que debe fijarse cada parmetro o factor, a fin de
optimizar la operacin del producto y hacerlo lo ms robusto posible.
c) Identificar factores que no afectan substancialmente la caracterstica de calidad a fin
de liberar el control de estos factores y ahorrar costos de pruebas.
Para lograr lo anterior se ha manejado una serie de herramientas estadsticas conocida
como diseo de experimentos, tratadas anteriormente.
Taguchi ha propuesto una alternativa no del todo diferente que se que conoce como:
Arreglos Ortogonales y las Grficas Lineales.
La herramienta utilizada normalmente son diseos Factoriales fraccionados, sin embargo
cuando el nmero de factores se ve incrementado, las posibles interacciones aumentan,
as como la complicaciones para identificar cules son las condiciones especficas a
experimentar.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 77 de 98
Un arreglo ortogonal se puede comparar con una replicacin factorial fraccionada, de
manera que conserva el concepto de ortogonalidad y contrastes. Un experimento factorial
fraccionado es tambin un arreglo ortogonal .
Taguchi desarroll una serie de arreglos particulares que denomin:
La (b)
C
Donde:
a = Representa el nmero de pruebas o condiciones experimentales que se tomarn.
Esto es el nmero de renglones o lneas en el arreglo.
b = Representa los diferentes niveles a los que se tomar cada factor.
c = Es el nmero de efectos independientes que se pueden analizar, esto es el nmero
de columnas.
7.2 Arreglos ortogonales para experimentos a dos niveles
En esta seccin, se analiza qu son, cmo se usan y cules son los arreglos ortogonales
ms importantes para experimentos en los que cada factor toma dos niveles.
Un arreglo ortogonal es una tabla de nmeros. Como ejemplo de un arreglo ortogonal
tenemos el siguiente:
De acuerdo con la notacin empleada por Taguchi al arreglo mostrado como ejemplo,
se le llama un arreglo L4, por tener cuatro renglones.
En general, para un arreglo a dos niveles, el nmero de columnas (efectos o factores) que
se pueden analizar, es igual al nmero de renglones menos 1.
F A C T O R E S (c)
No. (a) A B C Resultado
1 1 1 1 Y1
2 1 2 2 Y2
3 2 1 1 Y3
4 2 2 1 Y4
1 , 2 = Niveles de los Factores (b)
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 78 de 98
Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos
niveles, los ms utilizados y difundidos segn el nmero de factores a analizar son:
No. de factores a
analizar
Arreglo a
utilizar
No. de condiciones a probar
Entre 1 y 3 L4 4
Entre 4 y 7 L8 8
Entre 8 y 11 L12 12
Entre 12 y 15 L16 16
Entre 16 y 31 L32 32
Entre 32 y 63 L64 64
El arreglo ortogonal ms popular es el arreglo L8, que se muestra a continuacin junto
con sus grficas lineales:
L8 Col.1 Col.
2
Col.
3
Col.
4
Col.
5
Col.
6
Col.
7
Exp. No.
1 1 1 1 1 1 1 1
2 1 1 1 2 2 2 2
3 1 2 2 1 1 2 2
4 1 2 2 2 2 1 1
5 2 1 2 1 2 1 2
6 2 1 2 2 1 2 1
7 2 2 1 1 2 2 1
8 2 2 1 2 1 1 2
Matriz o tabla
de
interacciones
Columnas 1 2 3 4 5 6 7
1 (1) 3 2 5 4 7 6
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 79 de 98
2 (2) 1 6 7 4 5
3 (3) 7 6 5 4
4 (4) 1 2 3
5 (5) 1 2
6 (1) 6
7 (7)
1 3 2
3 5
1
.7 5 4
6
2 6 4
(a)
(b) 7
Grficas lineales
Los pasos para un diseo de experimentos de parmetros en el caso de menor es
mejor son:
7.3 Caso menor es mejor
1. Seleccionar una caracterstica de calidad de salida a ser optimizada.
2. Seleccionar factores de control y sus niveles, identificando sus posibles interacciones.
3. Seleccionar los factores de ruido y sus niveles; si son demasiados combinarlos en dos o
tres factores combinados.
4. Seleccionar los arreglos interno y externo adecuados; asignar los factores de control al
arreglo interno y los factores de ruido al arreglo externo.
5. Realizar los experimentos.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 80 de 98
6. Realizar anlisis estadstico con base en S/N para identificar los niveles de los factores de
control ptimos Algunas veces ayuda realizar un estudio de la interaccin entre factores
de control y de ruido.
7. Realizar anlisis estadstico con base en las medias para identificar los niveles de los
factores de control ptimos que ajustan a la respuesta promedio en el nivel deseado. Si
hay conflicto entre los niveles de los factores para maximizar la relacin S/N y ajustar la
media, dar prioridad a los que sirven para maximizar la relacin S/N.
8. Predecir el desempeo de salida ptimo con base en una combinacin ptima de niveles
de factores de control y realiza un experimento confirmatorio.
Ejemplo: Disminucin de la contaminacin
Optimizacin de un mtodo de purificacin para drenajes contaminados con metales.
Las aguas residuales que contienen iones metlicos es muy riesgoso por su toxicidad y
no biodegradable. Se propone utilizar xidos de hierro hidratados con un pH adecuado
para remover los metales dainos. La caracterstica de salida es la concentracin
remanente de metales en mg/L, con una respuesta menor es mejor.
Los factores de control son los siguientes:
Factores de control Nivel 1 Nivel 2 Nivel 3
A Contaminacin de FeII 2 7 15
B Temperatura C 25 50 75
C
Tiempo de aejamiento
h 1 2 3
D pH 8 10 12
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 81 de 98
El factor de ruido introducido artificialmente es permanganato de potasio.
Factores de ruido Nivel 1 Nivel 2 Nivel 3
N Conc. De KMnO4 0.00375 0.0375 0.075
Se asume que no hay interacciones por lo que se puede utilizar un arreglo L9, realizando
los experimentos se obtienen los datos siguientes con dos rplicas en cada nivel del factor
de ruido:
L9 Col.1 Col.
2
Col.
3
Col.
4 N1 N1 N2 N2 N3 N3
Exp.
No.
A B C D Rep.
1
Rep.
2
Rep.
1
Rep.
2 Rep. 1 Rep. 2
Y
promedio S/N
1 1 1 1 1 2.24 0.59 5.29 1.75 155.04 166.27 55.20 -39.36
2 1 2 2 2 1.75 5.07 1.05 0.41 0.38 0.48 1.52 -7.05
3 1 3 3 3 5.32 0.65 0.4 1.07 0.51 0.36 1.39 -7.05
4 2 1 2 3 0.37 0.32 0.34 0.68 4.31 0.65 1.11 -5.19
5 2 2 3 1 7.2 0.49 0.48 0.44 0.8 0.88 1.72 -9.54
6 2 3 1 2 39.17 27.05 46.54 25.77 138.08 165.61 73.70 -39.34
7 3 1 3 2 0.57 1.26 0.61 0.7 0.91 1.42 0.91 0.28
8 3 2 1 3 3.88 7.85 22.74 36.33 92.8 120.33 47.32 -36.20
9 3 3 2 1 15.42 25.52 35.27 48.61 67.56 72.73 44.19 -33.79
|
.
|
\
|
=
=
n
i
i
y
n
N S
1
2
1
log 10 /
Las sumas de cuadrados son las siguientes:
Para el arreglo L9 con nueve respuestas Y1 a Y9 se tiene:
La suma de cuadrados del factor A es:
A1 = Y1 + Y2 + Y3
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 82 de 98
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9
9
) .... (
3
2
9 2 1
3
3
2
2
2
1
Y Y Y
CF
CF
A A A
SSA
+ + +
=
+ +
=
La suma de cuadrados del factor B es:
B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
9
) .... (
3
2
9 2 1
3
3
2
2
2
1
Y Y Y
CF
CF
B B B
SSB
+ + +
=
+ +
=
De la misma forma se calculan las sumas de cuadrados para los factores C y D:
La suma de cuadrados total es:
SST = SSA + SSB + SSC + SSD
Haciendo los clculos en Minitab se obtiene:
Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ... versus A, B, C, D
Linear Model Analysis: SN ratios versus A, B, C, D
Estimated Model Coefficients for SN ratios
Term Coef
Constant -19.6915
A 1 1.8735
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 83 de 98
A 2 1.6687
B 1 4.9386
B 2 2.0970
C 1 -18.6078
C 2 4.3499
D 1 -7.8678
D 2 4.3221
S = *
Analysis of Variance for SN ratios
Source DF Seq SS Adj SS Adj MS F P Porcentaje de contribucin
A 2 56.52 56.52 28.261 * * 2.49%
B 2 234.86 234.86 117.428 * * 10.32%
C 2 1705.37 1705.37 852.685 * * 74.91%
D 2 279.46 279.46 139.732 * * 12.28%
Residual Error 0 * * *
Total 8 2276.21
Linear Model Analysis: Means versus A, B, C, D
Estimated Model Coefficients for Means
Term Coef
Constant 25.2281
A 1 -5.8598
A 2 0.2819
B 1 -6.1548
B 2 -8.3748
C 1 33.5124
C 2 -9.6215
D 1 8.4707
D 2 0.1513
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 84 de 98
S = *
Analysis of Variance for Means
Source DF Seq SS Adj SS Adj MS F P
A 2 196.59 196.59 98.30 * *
B 2 957.39 957.39 478.69 * *
C 2 5359.29 5359.29 2679.65 * *
D 2 438.35 438.35 219.17 * *
Residual Error 0 * * *
Total 8 6951.62
Response Table for Signal to Noise Ratios
Smaller is better
Level A B C D
1 -17.818 -14.753 -38.299 -27.559
2 -18.023 -17.595 -15.342 -15.369
3 -23.234 -26.727 -5.434 -16.146
Delta 5.416 11.974 32.866 12.190
Rank 4 3 1 2
Response Table for Means
Level A B C D
1 19.368 19.073 58.741 33.699
2 25.510 16.853 15.607 25.379
3 30.806 39.758 1.337 16.606
Delta 11.438 22.904 57.403 17.093
Rank 4 2 1 3
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 85 de 98
Las grficas factoriales son las siguientes:
Los niveles seleccionados son A en 1, B en 1, C en 3 y D en 2
La respuesta estimada es:
Predicted values
S/N Ratio Mean
5.70044 -10.5261
Factor levels for predictions
A B C D
M
e
a
n
o
f
S
N
r
a
t
i
o
s
3 2 1
-10
-20
-30
-40
3 2 1
3 2 1
-10
-20
-30
-40
3 2 1
A B
C D
Main Effects Plot (data means) for SN ratios
Signal-to-noise: Smaller is better
M
e
a
n
o
f
M
e
a
n
s
3 2 1
60
45
30
15
0
3 2 1
3 2 1
60
45
30
15
0
3 2 1
A B
C D
Main Effects Plot (data means) for Means
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 86 de 98
1 1 3 2
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 87 de 98
8. REGRESIN Y CORRELACIN LINEAL
8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o
respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.
Y * *
** * * * *
* * *
*
* b1 * *
* *
* * *
*
* *
*
*
*
*
b0
Correlacin positiva Correlacin negativa
X
Sin
correlacin
La ecuacin de la recta es la siguiente:
estimada regresin de Modelo X b b Y
muestra la de datos en base Con e X b b Y
poblacin la en base Con X Y
. . . ...... ..........
. . . . . . . ..........
. . . . .........
1 0
*
1 0
1 0
+ =
+ + =
+ + = c | |
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 88 de 98
El trmino de error es la diferencia entre los valores reales observados Yi y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 89 de 98
Y
*
*
X
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin
poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn patrn definido.
El coeficiente de Correlacin r desarrollado por Carl Pearson es un indicador de la fuerza
de la relacin entre las variables X y Y, puede asumir valores entre -1 y 1 para correlacin
negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra que la variable
presin tiene una correlacin positiva con el rendimiento de una caldera, se deben buscar
soluciones al problema mediante acciones asociadas con la variable presin; de lo
contrario, sera necesario buscar la solucin por otro lado.
Se identifican tres medidas de desviacin como sigue:
*
) ( Re Yi Yi siduo Error = =
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 90 de 98
Y
Yest = 4.4 + 1.08
X
Yi =
23 *
Desviacin no
explicada
Error = (Yi - Yest)
= 1.32
Variacin
total
(Yi-
media)=5.13
Desviacin
explicada
(Yest-Ymedia) =
3.81
Ymedia =17.87
X = 16 X
8.2 Ejemplo manual
Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est
relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de
tiempo tomados para n = 25 servicios se muestran a continuacin:
X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X)^2 (Yi-Y)^2 Yest Error
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 91 de 98
2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447 220.0926
Sxy Sxx Syy = SST SSE
X
promedio Y Promedio
Sxy Sxx Syy
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a
+ bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se
EX EY
E(Xi-X)*(Yi-Y) E(Xi-X)^2 E(Yi-Y)^2
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 92 de 98
minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
Las ecuaciones para el clculo manual son las siguientes:
XX
XY
S
S
X Xi
Y Yi X Xi
b =
= =
2
1 1
) (
) )( (
| = 2.902704421
X Y
n
X Y
b
i i
|
|
|
1
0 0
=
= =
= 5.114515575
Las sumas de cuadrados son:
= =
2
) ( Y Y SST
i
6,105.9447
= + = =
2 2
)) * 1 ( ( )
(
i i i i
X b bo Y Y Y SSE 220.0926
= = SSE SST SSR 5,885.8521
El coeficiente de determinacin r
2
y el coeficiente de correlacin r se calculan a
continuacin:
SST
SSR
SST
SSE SST
SST
SSE
r =
= =
) (
1
2
= 0.9639
El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada
por la regresin.
2
r r = = 0.9816
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 93 de 98
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r
es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente),
y r = 0 indicara correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica
para afirmar que el tiempo de atencin esta relacionado con el nmero de servicios
atendidos.
8.3 Uso de Excel
1. En el men Herramientas seleccione la opcin Anlisis de datos. Datos de
ejemplo 6.
2. Seleccione la opcin Regresin.
3. Seleccione el rango de entrada, estos corresponden a los datos numricos de la
tabla.
4. Seleccione Resumen de estadsticas.
5. En opciones de salida seleccione en Rango de salida, una celda de la hoja de
clculo que este en blanco (a partir de esta celda sern insertados los resultados).
Resumen
Estadsticas de la regresin
Coeficiente de
correlacin mltiple
0.98181177
8
Coeficiente de
determinacin R^2
0.96395436
8
R^2 ajustado
0.96238716
7
Error tpico
3.09341962
7
Observaciones 25
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 94 de 98
ANLISIS DE VARIANZA Suma de
Promedio
de
Grados de
libertad Cuadrados cuadrados F
Valor crtico
de F
Regresin 1
5885.85206
9
5885.85206
9
615.080089
8
4.24118E-
18
Residuos 23
220.092634
8
9.56924499
2
Total 24
6105.94470
4
Coeficiente
s Error tpico Estadstico t
Probabilida
d Inferior 95%
Intercepcin
5.11451557
5
1.14580412
7
4.46369100
4
0.00017721
5
2.74423916
1
XServicios
2.90270442
1
0.11704071
9
24.8008082
5
4.24118E-
18
2.66058724
9
En la grfica observamos que al aumentar el nmero de servicios el tiempo de atencin
aumenta.
X Servicios Curva de regresin ajustada
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
0 5 10 15 20 25
X Servicios
Y
T
i
e
m
p
o
Y Tiempo
Pronstico Y Tiempo
Lineal (Pronstico Y
Tiempo)
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 95 de 98
8.4 Uso de Minitab
Para determinar la funcin de regresin y correlacin en Minitab se siguen los pasos
siguientes (despus de cargar los datos correspondientes a X y a Y en las columnas C1 y
C2):
Stat >Regresin ... Indicar la columna de Respuestas Y y la de predictores X y
aceptar con OK. Observar el valor del coeficiente de correlacin y de
determinacin.
Para obtener la lnea de mejor ajuste de la regresin, se procede como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y y la de predictores X,
seleccionar si se quiere ajustar con los datos con una lnea, una funcin cuadrtica
o cbica y aceptar con OK. Observar el mayor valor del coeficiente de correlacin
que indica el mejor ajuste.
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals
para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals
La grfica de residuos debe apegarse a la recta y tener siempre un valor P value
>0.05.
Regression Analysis: Y Tiempo versus X Servicios
The regression equation is
Y Tiempo = 5.115 + 2.903 X Servicios
X Servicios
Y
T
i
e
m
p
o
20 15 10 5 0
70
60
50
40
30
20
10
0
S 3.09342
R-Sq 96.4%
R-Sq(adj) 96.2%
Regression
95% CI
95% PI
Fitted Line Plot
Y Tiempo = 5.115 + 2.903 X Servicios
ESTADSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNNDEZ
Pgina 96 de 98
S = 3.09342 R-Sq = 96.4% R-Sq(adj) = 96.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 5885.85 5885.85 615.08 0.000
Error 23 220.09 9.57
Total 24 6105.94
La regresin tiene una r^2 de 96.4% y la influencia de una variable X en Y es significativo.
Los intervalos de confianza para la media y el intervalo de prediccin para un punto
especfico X son los siguientes:
tSyi est Y Yx para IP
SCx
X Xi
n
Se Syi
=
+ + =
*
2
. .
) ( 1
1
tSy est Y para IC
SCx
X Xi
n
Se Sy
x y
=
+ =
*
!
2
. .
) ( 1