Documentos de Académico
Documentos de Profesional
Documentos de Cultura
117
puesto. Kruskal y Wallis [68] han desarrollado este procedimiento. La prueba de Kruskal-Wallis se usa
para probar la hiptesis nula de que los a tratamientos son idnticos contra la hiptesis alternativa de que
algunos de los tratamientos generan observaciones que son mayores que otras. Debido a que el procedimiento est diseado para ser sensible al probar las diferencias en las medias, en ocasiones es conveniente
considerar la prueba de Kruskal-Wallis como una prueba de la igualdad de las medias de los tratamientos.
La prueba de Kruskal-Wallis es una alternativa no paramtrica del anlisis de varianza usual.
Para realizar la prueba de Kruskal-Wallis, primero se hace la clasificacin en rangos de lasYij observaciones en orden ascendente y cada observacin se reemplaza con su rango, por ejemplo Rij' asignndole a
la observacin menor el rango 1. En el caso de empates (observaciones que tienen el mismo valor), se
asigna el rango promedio a cada una de las observaciones empatadas. SeaR.la suma de los rangos del tratamiento i-simo. El estadstico de. prueba es
(3-57)
donde ni es el nmero de observaciones del tratamiento i-simo, N es el nmero total de observaciones y
S2
= -l-[I~
N-1
R~ _ N(N+1)2]
12
N(N +1)
R2
f:t
_i.
"
(3-58)
i=l j=l
-3(N+1)
(3-59)
Cuando el nmero de empates es moderado, habr pequeas diferencias entre las ecuaciones 3-57 y 3-59,
Ypuede usarse la forma ms simple (ecuacin 3-59). Si las ni son razonablemente grandes, por ejemplo
n ;::: 5, H se distribuye aproximadamente como X;-l bajo la hiptesis nula. Por lo tanto, si
H> Xa,a-l
2
la hiptesis nula se
r~chaza.
EJEMPLO 3".12
En la tabla 3-14 se muestran los datos del ejemplo 3-1 y sus rangos correspondientes. Puesto que hay un
nmero bastante grande de empates, la ecuacin 3-57 se usa como el estadstico de prueba. Por la ecuacin 3-58 se encuentra
S2
= -l-[I~
N-1
R~ _ N(N+1)2]
4
=l j=l
= ~[5497.79- 25(26)2]
24
= 53.03
118
CAPTULO 3
Tabla 3-14 Datos y rangos para el experimento de la resistencia a la tensin del ejemplo 3-1
Peso porcentual del algodn
15
Ylj
7
7
15
11
9
R.
25
20
Rlj
2.0
2.0
12.5
7.0
4.0
27.5
Y2
R2
12
17
12
18
18
9.5
14.0
9.5
16.5
16.5
66.0
Y3j
14
18
18
19
19
30
R 3j
Y4j
11.0
16.5
16.5
20.5
20.5
85.0
19
25
22
19
23
35
R4j
20.5
25.0
23.0
20.5
24.0
113.0
YSj
R Sj
7
10
11
15
11
2.0
5.0
7.0
12.5
7.0
33.5
y el estadstico de prueba es
H
= -1 [a Ri~
S2
N(N+1)2]
L-ni ------'---''-4
i=l
= _1_[5245.0- 25(26)2]
53.03
= 19.25
Puesto que H > X~.01,4' 4 = 13.28, se rechazara la hiptesis nula y se concluira que los tratamientos difieren. (El valor PparaH = 19.25 esP = 0.0002.) Se trata de la misma conclusin obtenida por el anlisis de
varianza usual con la prueba F.
3~10.2
Al procedimiento utilizado en la seccin anterior de reemplazar las observaciones con sus rangos se le llama la transformacin de rangos. Es una tcnica muy poderosa y til. Si se aplicara la prueba F comn a
los rangos en lugar de a los datos originales, se obtendra
H/(a-1)
Fa
= -(N---1------'-H)-/(--'-N---a-)
(3-60)
como el estadstico de prueba (ver Conover [20], p. 337). Observe que cuando el estadstico H de Kruskal-Wallis se incrementa o decrementa, Fa tambin se incrementa o decrementa, por lo que la prueba de
Kruskal-Wallis es equivalente a aplicar el anlisis de varianza comn a los rangos.
La transformacin de rangos tiene una amplia aplicabilidad en los problemas de diseo experimental
para los que no existe ninguna alternativa no paramtrica para el anlisis de varianza. Esto incluye muchos de los diseos de captulos subsecuentes de este libro. Si los datos estn en rangos y se aplica la pruebaF comn, el resultado es un procedimiento aproximado que tiene buenas propiedades estadsticas (ver
Conover e lInan [30a, bD. Cuando existe preocupacin acerca del supuesto de normalidad o por el efecto
de puntos atpicos o valores"absurdos", se recomienda que el anlisis de varianza comn se realice tanto
en los datos originales como en los rangos. Cuando ambos procedimientos producen resultados similares,
probablemente los supuestos del anlisis de varianza se satisfacen razonablemente, y el anlisis estndar
es satisfactorio. Cuando los dos procedimientos difieren, deber darse preferencia a la transformacin de
rangos, ya que es menos posible que sea distorsionada por una condicin de no normalidad o la presencia
de observaciones inusuales. En tales casos, tal vez el experimentador quiera investigar el uso de transfor-
)1
.il
3-11 PROBLEMAS
119
maciones para la faIta de normalidad y examinar los datos y el procedimiento experimental a fin de determinar si hay puntos atpicos y por qu han ocurrido.
3~11
3-1.
PROBLEMAS
Se estudia la resistencia a la tensin del cemento portland. Pueden usarse econmicamente cuatro diferentes
tcnicas de mezclado. Se han colectado los siguientes datos:
Tcnica de mezclado
1
2
3
4
3129
3200
2800
2600
3000
3300
2900
2700
2865
2975
2985
2600
2890
3150
3050
2765
a) Probar la hiptesis de que las tcnicas de mezclado afectan la resistencia del cemento. Utilizar a = 0.05.
b) Construir una representacin grfica como se describi en la seccin 3-5.3 para comparar las resistencias
a la tensin promedio de las cuatro tcnicas de mezclado. A qu conclusiones se llega?
e) Usar el mtodo LSD de Fisher con a = 0.05 para hacer comparaciones entre pares de medias.
d) Construir una grfica de probabilidad normal de los residuales. Qu conclusiones se sacaran acerca de
la validez .del supuesto de normalidad?
e) Graficar los residuales contra la resistencia a la tensin predicha. Comentar la grfica.
/) Hacer un diagrama de dispersin de los resultados como ayuda para la interpretacin de los resultados
de este experimento.
3-2. a) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba del rango mltiple de Duncan con a
= 0.05. Hay alguna diferencia en las conclusiones?
b) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba de Tukey con a = 0.05. Se llega a las
.mismas conclusiones con la prueba de Tukey que las obtenidas con el procedimiento grfico y/o con la
prueba del rango mltiple de Duncan?
e) Explicar la diferencia entre los procedimientos de Duncan y de Tukey.
3-3. Considere nuevamente el problema 3-1. Encontrar un intervalo de confianza de 95 % para la resistencia a la
tensin media del cemento portland que produce cada una de las cuatro tcnicas de mezclado. Encontrar
tambin un intervalo de confianza de 95% para la diferencia en las medias de las tcnicas 1 y 3. Sirve esto de
ayuda para interpretar los resultados del experimento?
3-4. Se llev a cabo un experimento a fin de determinar si cuatro temperaturas de coccin especficas afectan la
densidad de cierto tipo de ladrillo. El experimento produjo los siguientes datos:
Temperatura
100
125
150
175
Densidad
21.8
21.7
21.9
21.9
21.9
21.4
21.8
21.7
21.7
21.5
21.8
21.8
21.6
21.4
21.6
21.4
21.7
21.5
120
3-5.
3-6.
CAPTULO 3
Resolver de nuevo el inciso d del problema 3-4 utilizando el mtodo LSD de Fisher. A qu conclusiones se
llega? Explicar en detalle cmo se modific la tcnica para tomar en cuenta los tamaos de las muestras desiguales.
Un fabricante de televisores est interesado en el efecto de cuatro tipos diferentes de recubrimientos para cinescopias de color sobre la conductividad de un cinescopio. Se obtienen los siguientes datos de la conductividad:
Tipo de recubrimiento
1
2
3
4
143
152
134
129
Conductividad
141
150
149
137
132
136
127
132
146
143
127
129
Resistencia a la compresin
Nivel de varillado
10
15
20
25
1530
1610
1560
1500
1530
1650
1730
1490
1440
1500
1530
1510
a) Hay alguna diferencia en la resistencia a la compresin debida al nivel de varillado? Utilizar a = 0.05.
b) Encontrar el valor P para el estadstico F del inciso a.
3-9.
e) Analizar los residuales de este experimento. Qu conclusiones pueden sacarse acerca de los supuestos
fundamentales del modelo?
d) Construir una representacin grfica para comparar las medias de los tratamientos, como se describi
en la seccin 3-5.3.
En un artculo de Environment Intematianal (vol. 18, no. 4) se describe un experimento en el que se investig
la cantidad de radn liberado en las duchas. Se us agua enriquecida con radn en el experimento, y se probaron seis dimetros diferentes de los orificios de las regaderas. Los datos del experimento se muestran en la ..~
siguiente tabla:
"
3-:PROBLEMAS
Dimetro de
los orificios
80
75
74
67
62
60
0.37
0.51
0.71
1.02
1.40
1.99
121
85"
79
77:
74
69'
66
3-10.
Tipo de circuito
1
2
3
Tiempo de respuesta
9
20
6
12
21
5
10
23
8
8
17
16
15
30
7
a) Probar la hiptesis de que los tres tipos de circuitostienen'd mismo tiempo de respuesta. Utilizar
a = 0.01.
b) Usar la prueba de Tukey para comparar pares de medias de los tratamientos. 'Utilizar a= 0.01.
e) Usar el procedimiento grfico de la seccin3-5.3 para comparar las medias de los tratamientos. Qu
conclusiones pueden sacarse? Cmo se comparan con las conclusiones del inciso b?
d) Construir un conjunto de contrastes ortogonales, suponiendo que al principio del experimento se sospechaba que el tiempo de respuesta del circuito tipo 2 era diferente del de los otros dos.
e) Si el lector fuera el ingeniero de diseo y quisiera minimizar el tiempo de respuesta, qu tipo de circuito
seleccionara?
f) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza bsico?
3-11. Se estudia la vida efectiva de los fluidos aislantes en una carga acelerada de 35 kV. Se han obtenido datos de
una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes:
Tipo de fluido
1
2
3
4
17.6
16.9
21.4
19.3
18.9
15.3
23.6
21.1
20.1
19.5
20.5
18.3
21.6
20.3
22.3
19.8
122
CAPTULO 3
b)
3-12.
3-13.
19
80
47
95
8
80
50
97
a) La cantidad de ruido presente es la misma para los cuatro diseos? Utilizar a = 0.05.
b) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza?
e) Qu diseo del circuito se seleccionara para usarlo? El ruido bajo es mejor.
Se pide a cuatro qumicos que determinen el porcentaje de alcohol metlico en cierto compuesto qumico.
Cada qumico hace tres determinaciones, y los resultados son los siguientes:
Qumico
1
2
3
4
3-14.
Ruido observado
19
30
56
73
25
35
83
78
20
61
26
46
Marca 1
Semanas de vida
Marca 2
100
96
92
96
92
76
80
75
84
82
Marca 3
108
100
96
98
100
3-11 PROBLEMAS
123
Qu marca seleccionara el lector para usarla? Si el fabricante reemplazara sin cargo cualquier batera
que dure menos de 85 semanas, qu porcentaje esperara reemplazar la compaa?
Se estn investigando cuatro catalizadores que pueden afectar la concentracin de un componente en una
mezcla lquida de tres componentes. Se obtienen las-siguientes concentraciones:
d)
3-15.
Catalizador
1
58.2
57.2
58.4
55.8
54.9
56.3
54.5
57.0
55.3
50.1
54.2
55.4
52.9
49.9
50.0
51.7
3-16.
e) Construir la estimacin de un intervalo de confianza de 99% para la respuesta media del catalizador 1.
Se llev a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se probaron cuatro
muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla. Los tiempos de falla (en minutos) se muestran abajo:
Material
1
2
3
4
5
3-17.
157
2
1256
7040
5
194
4
5276
5307
29
178
18
4355
10,050
2
Mtodo
1
2
3
Conteo
31
62
53
10
40
27
21
24
120
4
30
97
1
35
68
a) Todos los mtodos tienen el mismo efecto sobre el conteo promedio de partculas?
b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los
e)
124
3-18.
3-19.
3-20.
3-21.
3-22.
3-23.
3-24.
3-25.
3-26.
3-27.
3-28.
3-29.
3-30.
Considere la prueba de la igualdad de las medias de dos poblaciones normales, donde las varianzas son desconocidas pero se suponen iguales. El procedimiento de prueba apropiado es la prueba t agrupada o combinada. Demostrar que la prueba t combinada es equivalente al anlisis de varianza de un solo factor.
Demostrar que la varianza de la combinacin lineal ~:=CiYi. es a2~:=nici2.
En un experimento con efectos fijos, suponga que hay n observaciones para cada uno de cuatro tratamientos.
Sean (42, Qi, Q; los componentes con un solo grado de libertad de los contrastes ortogonales. Demostrar que
S STratamientos = Q2 + Qi + Q;.
Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el
problema 3-14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varianzas con
el examen de las grficas de los residuales?
Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface
en el problema 3-14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varianzas con el examen de las grficas de los residuales?
Referirse al problema 3-10. Si quiere detectarse una diferencia mxima en los tiempos de respuesta promedio de 10 milisegundos con una probabilidad de al menos 0.90, qu tamao de la muestra deber usarse?
Cmo se obtendra una estimacin preliminar de a2 ?
Referirse al problema 3-14.
a) Si quiere detectarse una diferencia mxima en la vida de las bateras de 10 horas con una probabilidad de
al menos 0.90, qu tamao de la muestra deber usarse? Comentar cmo se obtendra una estimacin
preliminar de a2 para responder esta pregunta.
b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviacin estndar de una observacin se incremente en 25%, qu tamao de la muestra deber usarse si quiere detectarse esto con
una probabilidad de al menos 0.90?
Considere el experimento del problema 3-14. Si quiere construirse un intervalo de confianza de 95% para la
diferencia en las vidas medias de dos bateras que tenga una precisin de 2 semanas, cuntas bateras de
cada marca deben probarse?
Suponga que cuatro poblaciones normales tienen medias,u = 50,,u2 = 60,,u3 = 50 y,u4 = 60. Cuntas observaciones debern hacerse en cada poblacin para que la probabilidad de rechazar la hiptesis nula de la
igualdad de las medias poblacionales sea al menos 0.90? Suponer que a = 0.05 y que una estimacin razonable de la varianza de error es a2 = 25.
Referirse al problema 3-26.
a) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental
fuera a2 = 36?
b) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental
fuera a2 = 49?
e) Puede sacarse alguna conclusin acerca de la sensibilidad de la respuesta dada en esta situacin
particular acerca de cmo afecta la estimacin de a la decisin referente al tamao de la muestra?
d) Puede hacerse alguna recomendacin acerca de cmo debera usarse este enfoque general para elegir n
en la prctica?
Referirse al experimento de la fundicin de aluminio descrito en la seccin 3-8. Verificar que los mtodos
para controlar la proporcin de almina no afectan el voltaje promedio de la celda. Construir una grfica de
probabilidad normal de los residuales. Graficar los residuales contra los valores predichos. Existe algn indicio de que se violan algunos de los supuestos fundamentales?
Referirse al experimento de la fundicin de aluminio de la seccin 3-8. Verificar el anlisis de varianza del
ruido del crisol que se resume en la tabla 3-13. Examinar las grficas de los residuales usuales y comentar la
validez del experimento.
Se investigaron cuatro diferentes velocidades de alimentacin en un experimento con unamquina CNC que
produce una pieza que se usa en la unidad de potencia auxiliar de un avin. El ingeniero de manufactura a
cargo del experimento sabe que una dimensin crtica de la pieza de inters puede ser afectada por la velocidad de alimentacin. Sin embargo, la experiencia previa indica que es probable que slo estn presentes
3-11 PROBLEMAS
125
efectos de dispersin. Es decir, al cambiarse la velocidad de alimentacin no se afecta la dimensin promedio, pero podra afectarse la variabilidad dimensional. El ingeniero realiza cinco corridas de produccin con
cada velocidad de alimentacin y obtiene la desviacin estndar de la dimensin crtica (en 10-3 mm). Los datos se muestran abajo. Suponer que todas las corridas se hicieron en orden aleatorio.
Velocidad de alimentacin
(pulgadas/minuto)
10
12
14
16
Corrida de produccin
1
0.09
0.06
0.11
0.19
2
0.10
0.09
0.08
0.13
3
0.13
0.12
0.08
0.15
4
0.08
0.07
0.05
0.20
5
0.07
0.12
0.06
0.11
a) La velocidad de alimentacin tiene algn efecto sobre la desviacin estndar de esta dimensin crtica?
b) Usar los residuales de este experimento para investigar la adecuacin del modelo. Hay algn problema
3-31.
3-32.
3-33.
3-34.
3-35.
Bloques aleatorizados,
cuadrados latinos y diseos
relacionados
4~ 1
En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resultados. En general, un factor perturbador puede definirse como un factor del diseo que probablemente
tenga un efecto sobre la respuesta, pero en el que no existe un inters especfico. En ocasiones un factor
perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso
puede tener niveles variables mientras se est realizando el experimento. La aleatorizacin es la tcnica
de diseo que se utiliza para protegerse contra estos factores perturbadores "que estn al acecho". En
otros casos, el factor perturbador es conocido pero no controlable. Si por lo menos puede observarse el
valor que asume el factor perturbador en cada corrida del experimento, es posible hacer la compensacin
correspondiente en el anlisis estadstico mediante el uso del anlisis de covarianza, una tcnica que se
revisar en el captulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, puede usarse una tcnica de diseo llamada formacin de bloques para eliminar de manera sistemtica su
efecto sobre las comparaciones estadsticas entre los tratamientos. La formacin de bloques es una tcnica de diseo en extremo importante que se utiliza ampliamente en la experimentacin industrial, y es la
materia de este captulo.
Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes producen o
no lecturas diferentes en una mquina para probar la dureza. Un experimento como ste podra ser parte
de un estudio de la aptitud en la calibracin de los instrumentos. La mquina funciona presionando la
punta en un ejemplar de prueba de metal, y por la profundidad de la depresin resultante puede determinarse la dureza del ejemplar. El experimentador ha decidido obtener cuatro observaciones para cada
punta. Hay un solo factor---'-el tipo de punta-, y un diseo completamente aleatorizado de un solo factor
consistira en asignar al azar cada una de las 4 X 4 = 16 corridas a una unidad experimental, es decir, a un
ejemplar de prueba de metal, y observar qu resulta de la lectura de la dureza. Por lo tanto, se necesitaran 16 ejemplares de prueba de metal en este experimento, uno por cada corrida del diseo.
Existe un problema potencialmente serio con un experimento por completo aleatorizado en esta situacin de diseo. Si los ejemplares de prueba de metal difieren ligeramente en sus durezas, como podra
126