Está en la página 1de 46

Diseño de experimentos de un factor

Estadística Inferencial II

Emigdio Z.Flores López

Instituto Tecnológico de Tijuana

2022
1. Experimentos de un solo factor
ANOVA de un sentido
Intervalos de confianza

Contenido
2. Comparaciones apareadas en los experimentos de un
solo factor
Método de Bonferroni
Método de Tukey-Kramer
EXPERIMENTOS DE UN SOLO FACTOR
Ejemplo

Experimentos de un solo factor


El artículo “An Investigation of the CaCO3-CaF2-K2SiO3-SiO2-Fe Flux System Using the
Submerged Arc Welding Process on HSLA-l00 and AISI-1081 Steels” (G. Fredrickson, tesis de
maestría, Escuela de Minas de Colorado, 1992) describe un experimento en el que se
prepararon flujos de soldadura con diferentes composiciones químicas. Se hicieron varias
soldaduras utilizando cada flujo sobre metal con base de acero AISI-1018. La siguiente tabla
presenta los resultados de las mediciones de la dureza, en la escala de Brinell, de cinco
soldaduras que usan cada uno de los cuatro flujos.

Flujo Valores de la muestra Media muestral Desviación estándar muestral


A 250 264 256 260 239 253.8 9.7570
B 263 254 267 265 267 263.2 5.4037
C 257 279 269 273 277 271.0 8.7178
D 253 258 262 264 273 262.0 7.4498

Tabla 1: Dureza de Brinell de soldaduras que utilizan cuatro flujos diferentes

2022 © Emigdio Z.Flores López 4 / 40


Ejemplo (cont...)

Experimentos de un solo factor


Figura 1: Diagramas de puntos para cada muestra en la tabla anterior. Cada media muestral está marcada
con una “X”. Las medias muestrales son un poco diferentes, pero los valores de muestra se traslapan
considerablemente.

2022 © Emigdio Z.Flores López 5 / 40


Experimentos de un solo factor

Experimentos de un solo factor


En general, un experimento factorial implica varias variables. Una de éstas es la variable
respuesta, que en ocasiones se llama variable de salida o variable dependiente. Las otras se
denominan factores. La pregunta indicada por un experimento factorial es si la variación de los
niveles de los factores produce una diferencia en la media de la variable respuesta.
En el experimento anterior, la dureza es la respuesta, y hay un factor: tipo de flujo. Debido a
que sólo hay un factor, éste es un experimento de un solo factor. Hay cuatro valores diferentes
para el factor tipo de flujo en este experimento. Estos valores diferentes se denominan niveles
del factor y también tratamientos.
Por último, los objetos con los que se realizaron dichas mediciones se llaman unidades
experimentales. Las unidades asignadas a un tratamiento dado se llaman réplicas. En el
experimento anterior, las soldaduras son las unidades experimentales, y hay cinco réplicas para
cada tratamiento.

2022 © Emigdio Z.Flores López 6 / 40


Experimentos completamente aleatorios

Experimentos de un solo factor


Un experimento factorial en el cual las unidades experimentales son asignadas a los
tratamientos en forma aleatoria, con todas las asignaciones posibles siendo igualmente
probables, se llama experimento completamente aleatorio.

2022 © Emigdio Z.Flores López 7 / 40


Análisis de varianza de un sentido

Experimentos de un solo factor


ANOVA de un sentido
Se tienen I muestras, cada una proveniente de un tratamiento diferente. Las medias del
tratamiento se denotan por
µ1 , . . . , µI
Los tamaños de muestra se denotan por

J1 , . . . , JI

El número total en todas las muestras combinadas se denota por N.

N = J1 + J2 + · · · + JI

Las hipótesis que se desea probar son

H0 : µ1 = · · · = µI contra H1 : dos o mas de las µi son diferentes

2022 © Emigdio Z.Flores López 8 / 40


Análisis de varianza de un sentido

Experimentos de un solo factor


ANOVA de un sentido
Si había solamente dos muestras, se podría utilizar la prueba t de dos muestras para probar la
hipótesis nula. Debido a que hay más de dos muestras, se utiliza un método conocido como
análisis de varianza de un sentido (ANOVA, por sus siglas en inglés).
Debido a que hay varias muestras, se usa un subíndice doble para denotar las observaciones.
Específicamente, sea Xij la j-ésima observación en la i-ésima muestra. La media de la i-ésima
muestra se denota por Xi. .
∑Ji
X
j=1 ij
Xi. = (1)
Ji
La gran media muestral, denotada por X.. , es el promedio de todos los elementos que se
muestrean tomados en conjunto:
∑I
i=1 Ji Xi
X.. = (2)
N

2022 © Emigdio Z.Flores López 9 / 40


Ejemplo

Experimentos de un solo factor


ANOVA de un sentido
Respecto a los datos en la tabla 1, determine I, J1 , . . . , JI , N, X23 , X3. , X.. .

2022 © Emigdio Z.Flores López 10 / 40


Ejemplo

Experimentos de un solo factor


ANOVA de un sentido
Respecto a los datos en la tabla 1, determine I, J1 , . . . , JI , N, X23 , X3. , X.. .

Solución
Hay cuatro muestras, por lo que I = 4. Cada muestra contiene cinco observaciones, así
J1 = J2 = J3 = J4 = 5. El número total de observaciones es N = 20. La cantidad X23 es la tercera
observación en la segunda muestra, que es 267. La cantidad X3 . es la media muestral de la
tercera muestra. Este valor es X3. = 271.0. Por último, con la ecuación (2) se calcula la gran
media muestral X.. .

(5)(253.8) + (5)(263.2) + (5)(271.0) + (5)(262.0)


X.. =
20
= 262.5

2022 © Emigdio Z.Flores López 10 / 40


Análisis de varianza de un sentido

Experimentos de un solo factor


ANOVA de un sentido
Figura 2: La variación de las medias muestrales alrededor de la gran muestra puede atribuirse tanto a la
incertidumbre aleatoria como a las diferencias entre las medias del tratamiento. La variación dentro de una
muestra particular alrededor de su propia media muestral sólo es atribuible a la incertidumbre aleatoria.

2022 © Emigdio Z.Flores López 11 / 40


Análisis de varianza de un sentido

Experimentos de un solo factor


ANOVA de un sentido
La variación de las medias muestrales alrededor de la gran media muestral se mide por una
cantidad que se llama suma total de cuadrados del tratamiento (SSTr, por sus siglas en
inglés), que está dada por

I
SSTr = Ji (Xi. − X.. )2 (3)
i=1

Para determinar si la SSTr es suficientemente grande para rechazar H0 , se compara con otra
suma de cuadrados, que se llama suma de los cuadrados del error (SSE, por sus siglas en
inglés).
La SSE está dada por
I ∑
∑ Ji

SSE = (Xij − Xi. )2 (4)


i=1 j=1

Las cantidades Xij − Xi. se llaman residuos, por lo que la SSE representa la suma de los
cuadrados de los residuos.

2022 © Emigdio Z.Flores López 12 / 40


Supuestos para el ANOVA de un sentido

Experimentos de un solo factor


ANOVA de un sentido
Las pruebas de hipótesis usuales del ANOVA de un sentido son válidas en las condiciones
siguientes:

1. Las poblaciones en tratamiento deben ser normales.


2. Las poblaciones en tratamiento deben tener todas la misma varianza, que se denota por σ 2 .

2022 © Emigdio Z.Flores López 13 / 40


Análisis de varianza de un sentido

Experimentos de un solo factor


ANOVA de un sentido
La prueba F para el ANOVA de un sentido
Para probar H0 : µ1 = · · · = µI contra H0 : dos o más de las µi son diferentes:
∑I ∑I 2 2
1. Calcule SSTr = i=1 Ji (Xi. − X.. )2 = i=1 Ji Xi. − NX.. .
∑I ∑Ji ∑I ∑Ji ∑I 2 ∑I
2. Calcule SSE = i=1 j=1
(Xij − Xi. )2 = i=1 j=1
X2ij − i=1 Ji Xi. = i=1 (Ji − 1)s2i .
3. Calcule MSTr = SSTr
I−1
y MSE = SSE
N−I
.
MSTr
4. Calcule el estadístico de prueba: F = MSE
.
5. Encuentre el P-valor consultando la tabla F con I − 1 y N − I grados de libertad.

2022 © Emigdio Z.Flores López 14 / 40


Ejemplo

Experimentos de un solo factor


ANOVA de un sentido
Para los datos en la tabla 1, calcule la MSTr, la MSE y F. Determine el P-valor para probar la
hipótesis nula de que todas las medias son iguales. ¿Qué concluye?

2022 © Emigdio Z.Flores López 15 / 40


Ejemplo

Experimentos de un solo factor


ANOVA de un sentido
Para los datos en la tabla 1, calcule la MSTr, la MSE y F. Determine el P-valor para probar la
hipótesis nula de que todas las medias son iguales. ¿Qué concluye?

Solución
SSTr = 743.4 y SSE = 1023.6. Se tienen I = 4 muestras y N = 20 observaciones en todas las
muestras tomadas en conjunto. Entonces

743.4 1023.6
MSTr = = 247.8 MSE = = 63.975
4−1 20 − 4
El valor del estadístico de prueba F es, por tanto,

247.8
F= = 3.8734
63.975

2022 © Emigdio Z.Flores López 15 / 40


Solución (cont...)

Experimentos de un solo factor


ANOVA de un sentido
Para encontrar el P-valor se consulta la tabla F. Los grados de libertad son 4 − 1 = 3 para el
numerador y 20 − 4 = 16 para el denominador. Bajo H0 , F tiene una distribución F3,16 .
Observando la tabla F debajo de 3 y 16 grados de libertad, se encuentra que el punto superior
al 5 % es 3.24, y que el punto superior al 1 % es 5.29. Por tanto, el P-valor se encuentra entre
0.01 y 0.05; un paquete de software da un valor exacto de 0.029 con dos dígitos significativos).
Es razonable concluir que las medias poblacionales no son todas iguales, y, por consiguiente, la
composición del flujo afecta la dureza.

Figura 3: El valor observado del estadístico de prueba es 3.87. El punto superior al 5 % de la distribución
F3,16 es 3.24. El punto superior al 1 % de la distribución F3,16 es 5.29. Por tanto, el P-valor se encuentra entre
0.01 y 0.05. Un paquete de software da un valor de 0.029.

2022 © Emigdio Z.Flores López 16 / 40


Intervalos de confianza para medias de tratamiento

Experimentos de un solo factor


Intervalos de confianza
Un intervalo de confianza de nivel 100(1 − α) para µi está dado por

MSE
Xi. ± tN−I,α/2 (5)
Ji

2022 © Emigdio Z.Flores López 17 / 40


Ejemplo

Experimentos de un solo factor


Intervalos de confianza
Determine un intervalo de confianza del 95 % para la media de la dureza de soldaduras
producidas con el flujo A.

2022 © Emigdio Z.Flores López 18 / 40


Ejemplo

Experimentos de un solo factor


Intervalos de confianza
Determine un intervalo de confianza del 95 % para la media de la dureza de soldaduras
producidas con el flujo A.

Solución
De la tabla anterior, X1. = 253.8. El valor de la MSE se calculó en el ejemplo anterior de 63.975.
Hay I = 4 tratamientos, J1 = 5 observaciones para el flujo A, y N = 20 observaciones en
conjunto. De la tabla t de Student se obtiene t16,.025 = 2.120. Por tanto, el intervalo de
confianza del 95 % es √
63.975
253.8 ± 2.120 = 253.8 ± 7.6
5

2022 © Emigdio Z.Flores López 18 / 40


La tabla ANOVA

Experimentos de un solo factor


Intervalos de confianza
Los resultados de un análisis de varianza generalmente se resumen en una tabla de análisis de
varianza (ANOVA).
El siguiente resultado de MINITAB muestra el análisis de varianza para los datos de soldaduras

One-way ANOVA: A, B, C, D
Source DF SS MS F P
Factor 3 743.40 247.800 3.87 0.029
Error 16 1023.60 63.975
Total 19 1767.00
S = 7.998 R-Sq = 42.07% R-Sq(adj) = 31.21%

Individual 95% CIs For Mean Based on


Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
A 5 253.80 9.76 (-------*------)
B 5 263.20 5.40 (------*-------)
C 5 271.00 8.72 (-------*-------)
D 5 262.00 7.45 (-------*-------)
----+---------+---------+---------+-----
250 260 270 280
Pooled StDev = 8.00

2022 © Emigdio Z.Flores López 19 / 40


La tabla ANOVA

Experimentos de un solo factor


Intervalos de confianza
En la tabla ANOVA, la columna “DF” presenta el número de grados de libertad tanto para el
tratamiento (“Factor”) como para la suma de los cuadrados del error (“Error”). La columna “SS”
presenta la SSTr (en el renglón “Factor”) y la SSE (en el renglón “Error”). El renglón “Total”
contiene la suma total de los cuadrados, que es la suma de SSTr y SSE. La columna “MS”
presenta las medias cuadráticas MSTr y MSE. La columna “F” presenta el estadístico F para
probar la hipótesis nula de que todas las medias poblacionales son iguales. Por último, la
columna “P” representa el P-valor para la prueba F. Debajo de la tabla ANOVA, el valor “S” es la
estimación combinada de la desviación estándar del error σ , que se calcula al tomar la raíz
cuadrada de la MSE. La cantidad “R-sq” es R2 , el coeficiente de determinación, que es igual al
cociente SSTr/TSS.

2022 © Emigdio Z.Flores López 20 / 40


Diseños balanceados contra no balanceados

Experimentos de un solo factor


Intervalos de confianza
Cuando se asignan números iguales de unidades a cada tratamiento, se dice que el diseño está
balanceado.

• Con un diseño balanceado el efecto de las variancias desiguales generalmente no es


grande.
• Con un diseño desbalanceado el efecto de las variancias desiguales puede ser importante.
• Entre más desbalanceado sea el diseño, mayor será el efecto de las variancias desiguales.

2022 © Emigdio Z.Flores López 21 / 40


La identidad del análisis de la varianza

Experimentos de un solo factor


Intervalos de confianza
Tanto en la regresión lineal como en el análisis de varianza, una cantidad que se llama la suma
total de los cuadrados se obtiene al restar la gran media muestral de cada observación,
elevando al cuadrado estas desviaciones, y después sumándolas. Una identidad del análisis de
varianza es una ecuación que expresa la suma total de cuadrados como una suma de las otras
sumas de los cuadrados.
La suma total de los cuadrados para el ANOVA en un sentido está dada por


I ∑
Ji

SST = (Xij − X.. )2 (6)


i=1 j=1

o
SST = SSTr + SSE (7)

2022 © Emigdio Z.Flores López 22 / 40


Modelos de efectos aleatorios

Experimentos de un solo factor


Intervalos de confianza
En muchos experimentos factoriales los tratamientos los elige deliberadamente el
experimentador. Se dice que estos experimentos siguen un modelo de efectos fijos. En
algunos casos, los tratamientos se eligen en forma aleatoria de una población de tratamientos
posibles. En estos casos se dice que los experimentos siguen un modelo de efectos aleatorios.

2022 © Emigdio Z.Flores López 23 / 40


Ejercicio 1

Experimentos de un solo factor


Intervalos de confianza
Uno de los factores que determina el grado del riesgo que un pesticida plantea a la salud
humana es la tasa con la que lo absorbe la piel después del contacto. Una pregunta
importante es si la cantidad en la piel aumenta con la duración del contacto, o si sólo aumenta
durante un tiempo corto antes de estabilizarse. Para investigar esto último se aplicaron
cantidades medidas de cierto pesticida a 20 muestras de piel de rata. Se analizaron cuatro
pieles en cada uno de los intervalos de 1, 2, 4, 10 y 24 horas. Las cantidades de compuestos
químicos (en µg) que estaban en la piel están dadas en la tabla siguiente.

Duración Cantidades absorbidas


1 1.7 1.5 1.2 1.5
2 1.8 1.6 1.8 1.9
4 1.9 1.7 2.1 2.0
10 2.3 1.9 1.7 1.5
24 2.1 2.2 2.5 2.3

a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.


b) ¿Puede concluir que la cantidad en la piel varía con el tiempo?

2022 © Emigdio Z.Flores López 24 / 40


Ejercicio 2

Experimentos de un solo factor


Intervalos de confianza
La eliminación de nitrógeno de amoniaco es un aspecto importante del tratamiento de
filtraciones en basureros. Durante varios días se registró la tasa de eliminación (en % por día)
para cada uno de los diferentes métodos de tratamiento. Los resultados se presentan en la
tabla siguiente. (Basado en el artículo “Removal of Ammoniacal Nitrogen from Landfill
Leachate by Irrigation onto Vegetated Treatment Planes”, S. Tyrrel, P. Leeds-Harrison y K.
Harrison, en Water Research, 2002:291-299.)

Tratamiento Tasa de eliminación


A 5.21 4.65
B 5.59 2.69 7.57 5.16
C 6.24 5.94 6.41
D 6.85 9.18 4.94
E 4.04 3.29 4.52 3.75

a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.


b) ¿Puede concluir que los métodos de tratamiento difieren en sus tasas de eliminación?

2022 © Emigdio Z.Flores López 25 / 40


COMPARACIONES APAREADAS EN LOS EXPERIMENTOS
DE UN SOLO FACTOR
Comparaciones apareadas en los experimentos de un solo factor

Comparaciones apareadas en los experimentos de un solo factor


En un ANOVA de un sentido se utiliza una prueba F para probar la hipótesis nula de que todas
las medias de tratamiento son iguales. Si ésta es rechazada se puede concluir que las medias
de tratamiento no son todas iguales. Pero esta prueba no indica cuáles son diferentes del resto.
A veces un experimentador considera dos tratamientos específicos, i y j, y quiere estudiar la
diferencia µi − µj . En este caso el método de la diferencia significativa mínima de Fisher (DSM)
es adecuado y puede usarse para construir intervalos de confianza para µi − µj o para probar la
hipótesis nula que µi − µj = 0.

2022 © Emigdio Z.Flores López 27 / 40


El método de la diferencia significativa mínima de Fisher

Comparaciones apareadas en los experimentos de un solo factor


El intervalo de confianza de la diferencia significativa mínima de Fisher, al nivel 100(1 − α) %, para la
diferencia µi − µj es
√ ( )
1 1
Xi. − Xj. ± tN−I,α/2 MSE + (8)
Ji Jj
Para probar la hipótesis nula H0 : µi − µj = 0, el estadístico de prueba es

Xi. − Xj.
√ ( ) (9)
1 1
MSE Ji
+ Jj

Si H0 es verdadera, este estadístico tiene una distribución t Student con N − I grados de libertad.
Específicamente, si √ ( )
1 1
|Xi. − Xj. | > tN−I,α/2 MSE + (10)
Ji Jj
Entonces H0 es rechazada al nivel α.

2022 © Emigdio Z.Flores López 28 / 40


Ejemplo

Comparaciones apareadas en los experimentos de un solo factor


En el experimento de las soldaduras analizado anteriormente se midió la dureza para cinco
soldaduras de cada uno de cuatro flujos A, B, C y D. La media muestral de los valores de la
dureza fueron XA. = 253.8, XB. = 263.2, XC. = 271.0 y XD. = 262.0. La tabla ANOVA se muestra
en el siguiente cuadro.

One-way ANOVA: A, B, C, D
Source DF SS MS F P
Factor 3 743.40 247.800 3.87 0.029
Error 16 1023.60 63.975
Total 19 1767.00
S = 7.998 R-Sq = 42.07% R-Sq(adj) = 31.21%

2022 © Emigdio Z.Flores López 29 / 40


Ejemplo (cont...)

Comparaciones apareadas en los experimentos de un solo factor


Antes de realizar el experimento se midieron los contenidos de carbono de los flujos. El flujo B
tenía el contenido de carbono más bajo (2.67 % por peso), y el flujo C tenía el más alto (5.05 %
por peso). Por tanto, el experimentador está particularmente interesado en comparar las
durezas obtenidas con estos dos flujos. Determine un intervalo de confianza del 95 % para la
diferencia de las medias de durezas entre soldaduras producidas con los flujos B y C. ¿Se puede
concluir que las dos medias son diferentes?

2022 © Emigdio Z.Flores López 30 / 40


Ejemplo (cont...)

Comparaciones apareadas en los experimentos de un solo factor


Antes de realizar el experimento se midieron los contenidos de carbono de los flujos. El flujo B
tenía el contenido de carbono más bajo (2.67 % por peso), y el flujo C tenía el más alto (5.05 %
por peso). Por tanto, el experimentador está particularmente interesado en comparar las
durezas obtenidas con estos dos flujos. Determine un intervalo de confianza del 95 % para la
diferencia de las medias de durezas entre soldaduras producidas con los flujos B y C. ¿Se puede
concluir que las dos medias son diferentes?

Solución
Se utiliza la expresión (8). Las medias muestrales son 271.0 y 263.2 para los flujos C y B,
respectivamente. El producto anterior de MINITAB da la cantidad MSE de 63.975. Ambos
tamaños muestrales son iguales a 5. Hay I = 4 niveles y N = 20 observaciones en total. Para un
intervalo de confianza de 95 % se consulta la tabla t para determinar √el valor t16,.025 = 2.120.
Por tanto, el intervalo de confianza de 95 % es 271.0 − 263.2 ± 2.120 63.975(1/5 + 1/5) o
(−2.92, 18.52).

2022 © Emigdio Z.Flores López 30 / 40


El método de la diferencia significativa mínima de Fisher

Comparaciones apareadas en los experimentos de un solo factor


Solución (cont...)
Para realizar una prueba de hipótesis nula con el fin de que las dos medias de tratamiento
sean iguales, se calcula el valor del estadístico de prueba (expresión 9) y se obtiene

271.0 − 263.2
√ = 1.54
63.975(1/5 + 1/5)

Al consultar la tabla t con N − I = 16 grados de libertad, se encuentra que P está entre


2(0.05) = 0.10 y 2(0.10) = 0.20 (observe que ésta es una prueba de dos colas). No se puede
concluir que las medias del tratamiento difieren.
Si se desea realizar una prueba de nivel fijo a un nivel α = 0.05 como una alternativa para
calcular el P-valor, el valor crítico t es t16,.025 = 2
√.120. El lado izquierdo de la desigualdad es
|271.0 − 263.2| = 7.8. El lado derecho es 2.120 63.975(1/5 + 1/5) = 10.72. Dado que 7.8 no
es mayor que 10.72, no se rechaza H0 al nivel 5 %.

2022 © Emigdio Z.Flores López 31 / 40


El método de Bonferroni de comparaciones múltiples

Comparaciones apareadas en los experimentos de un solo factor


Método de Bonferroni
Se supone que se están considerando C diferencias de la forma µi − µj . Los intervalos de
confianza simultáneos de Bonferroni, al nivel 100(1α) %, para las C diferencias µi − µj son
√ ( )
1 1
Xi. − Xj. ± tN−I,α/(2C) MSE + (11)
Ji Jj

Se tiene una confianza del 100(1 − α) % de que los intervalos de confianza de Bonferroni
contengan el valor verdadero de la diferencia µi µj para todos los pares C que se están
considerando.
Con el fin de probar las C hipótesis nulas de la forma H0 : µi − µj = 0, los estadísticos de
prueba son
Xi. − Xj.
√ ( ) (12)
1 1
MSE Ji
+ Jj

2022 © Emigdio Z.Flores López 32 / 40


El método de Bonferroni de comparaciones múltiples

Comparaciones apareadas en los experimentos de un solo factor


Método de Bonferroni
Determine el P-valor para cada prueba consultando la tabla t de Student con N − 1 grados de
libertad, y multiplique el P-valor encontrado por C.
Específicamente, si √ ( )
1 1
|Xi. − Xj. | > tN−I,α/(2C) MSE + (13)
Ji Jj

entonces H0 es rechazada con un nivel de α.

2022 © Emigdio Z.Flores López 33 / 40


Ejemplo

Comparaciones apareadas en los experimentos de un solo factor


Método de Bonferroni
Con los datos de soldaduras analizados en el ejemplo anterior utilice el método de Bonferroni
para determinar cuáles pares de flujos, si los hay, se puede concluir que difieren en su efecto
de dureza, a un nivel del 5 %.

2022 © Emigdio Z.Flores López 34 / 40


Ejemplo

Comparaciones apareadas en los experimentos de un solo factor


Método de Bonferroni
Con los datos de soldaduras analizados en el ejemplo anterior utilice el método de Bonferroni
para determinar cuáles pares de flujos, si los hay, se puede concluir que difieren en su efecto
de dureza, a un nivel del 5 %.

Solución
Hay I = 4 niveles, con J = 5 observaciones en cada nivel, de un total de N = 20 observaciones.
Con cuatro niveles, hay un total de C = (4)(3)/2 = 6 pares de medias que comparar.
Para probar al nivel α = 5 %, se calcula α/(2C) = 0.004167. El valor crítico de t es t16,.004167 .
Este valor no está en la tabla; se encuentra entre t16,.005 = 2.921 y t16,.001 = 3.686. Mediante
software se calcula t16,.004167 = 3.0083. Sin el respectivo software se podría aproximar este
valor en forma
√ aproximada por interpolación.
√ Ahora MSE= 63.975, por lo que
tN−I,α/(2C) MSE(1/Ji + 1/Jj ) = 3.0083 63.975(1/5 + 1/5) = 15.22.

2022 © Emigdio Z.Flores López 34 / 40


El método de Bonferroni de comparaciones múltiples

Comparaciones apareadas en los experimentos de un solo factor


Método de Bonferroni
Solución (cont...)
Las cuatro medias muestrales son:
Flujo A B C D
Medida de la dureza 253.8 263.2 271.0 262.0
Hay solamente un par de las medias muestrales, 271.0 y 253.8, cuya diferencia es mayor a
15.22. Por tanto, se concluye que las soldaduras producidas con el flujo A tienen una media de
dureza diferente que las generadas con el flujo C. Ninguna de las otras diferencias son
importantes con un nivel de 5 %.

2022 © Emigdio Z.Flores López 35 / 40


El método de Tukey-Kramer de comparaciones múltiples

Comparaciones apareadas en los experimentos de un solo factor


Método de Tukey-Kramer
Los intervalos de confianza simultáneos de Tukey-Kramer de nivel 100(1 − α) % para todas las
diferencias µi − µj son
√ ( )
MSE 1 1
Xi. − Xj. ± qI,N−I,α + (14)
2 Ji Jj

Ahora se tiene una confianza del 100(1 − α) % para los intervalos de confianza de
Tukey-Kramer de que contengan el valor verdadero de la diferencia µi − µj para cada i y j.
Con el fin de probar todas las hipótesis nulas simultáneas H0 : µi − µj = 0, los estadísticos de
prueba son
Xi. − Xj.
√ ( ) (15)
MSE 1 1
2 Ji
+ Jj

2022 © Emigdio Z.Flores López 36 / 40


El método de Tukey-Kramer de comparaciones múltiples

Comparaciones apareadas en los experimentos de un solo factor


Método de Tukey-Kramer
El P-valor para cada prueba se encuentra al consultar la tabla de la distribución de rango
studentizado con I y N − I grados de libertad.
Para cada par de niveles i y j para los cuales
√ ( )
MSE 1 1
|Xi. − Xj. | > qI,N−I,α + (16)
2 Ji Jj

la hipótesis nula H0 : µi − µj = 0 se rechaza con un nivel de α.

2022 © Emigdio Z.Flores López 37 / 40


Ejemplo

Comparaciones apareadas en los experimentos de un solo factor


Método de Tukey-Kramer
Para los datos de las soldaduras en la tabla 1, ¿cuáles pares de flujos, si hay, se puede concluir, con un nivel
de 5 %, que difieren en su efecto en la dureza?

2022 © Emigdio Z.Flores López 38 / 40


Ejemplo

Comparaciones apareadas en los experimentos de un solo factor


Método de Tukey-Kramer
Para los datos de las soldaduras en la tabla 1, ¿cuáles pares de flujos, si hay, se puede concluir, con un nivel
de 5 %, que difieren en su efecto en la dureza?

Solución
Hay I = 4 niveles, con J = 5 observaciones en cada nivel, para un total de N = 20 observaciones en total. Con
el propósito de probar con un nivel de α = 0.05, se consulta la tabla de rango studentizado encontrando
q4,16,.05 = 4.05. √ √
El valor de MSE es 63.975. Por tanto, qI,N−I,α MSE/J = 4.05 63.975/5 = 14.49. Las cuatro medias
muestrales son:
Flujo A B C D
Medida de la dureza 253.8 263.2 271.0 262.0

Hay solamente un par de medias muestrales, 271.0 y 253.8, cuya diferencia es mayor a 14.49. Por tanto, se
concluye que las soldaduras producidas con el flujo A tienen una media de dureza diferente que las
soldaduras producidas con el flujo C. Ninguna de las otras diferencias son importantes con un nivel de 5 %.

2022 © Emigdio Z.Flores López 38 / 40


Ejercicio 3

Comparaciones apareadas en los experimentos de un solo factor


Método de Tukey-Kramer
El artículo “Organic Recycling for Soil Quality Conservation in a Sub-Tropical Plateau Region”
(K. Chakrabarti, B. Sarkar y cols., en J. Agronomy and Crop Science, 2000:137-142) describe un
experimento en el que se trataron muestras de suelo con seis tratamientos diferentes, con dos
réplicas por tratamiento, y se registró la actividad de fosfato ácido (en µmol de p-nitrofenol
liberado por gramo de tierra seca por hora). Una tabla ANOVA para un ANOVA de un sentido se
presenta en el cuadro siguiente.

One-way ANOVA: Treatments A, B, C, D, E, F


Source DF SS MS F P
Treatment 5 1.18547 0.23709 46.64 0.000
Error 6 0.03050 0.00508
Total 11 1.21597

2022 © Emigdio Z.Flores López 39 / 40


Ejercicio 3 (cont...)

Comparaciones apareadas en los experimentos de un solo factor


Método de Tukey-Kramer
Las medias del tratamiento fueron

Tratamiento A B C D E F
Media 0.99 1.99 1.405 1.63 1.395 1.22

a) ¿Puede concluir que hay diferencias en la actividad de fosfato ácido entre los tratamientos?
b) Utilice el método de Tukey-Kramer para determinar cuáles pares de medias de
tratamiento, si los hay, son diferentes a un nivel de 5 %.
c) Utilice el método de Bonferroni para determinar cuáles pares de medias de tratamiento, si
los hay, son diferentes con un nivel de 5 %.
d) ¿Cuál método es más poderoso en este caso: el método de Tukey-Kramer o el de
Bonferroni?
e) El experimentador observa que el tratamiento A tenía la media muestral más pequeña,
mientras que la media del tratamiento B era mayor. De los métodos de Fisher de DSM, de
Bonferroni y del de Tukey-Kramer, ¿cuál, si hay alguno, se puede utilizar para probar que la
hipótesis de estas dos medias de tratamiento son iguales?

2022 © Emigdio Z.Flores López 40 / 40

También podría gustarte