Está en la página 1de 9

PRUEBAS DE DIFERENCIA DE MEDIAS O DE COMPARACIONES MLTIPLES Cuando se rechaza la hiptesis nula de no diferencia de ms de dos medias ( H0: 1 = 2 = = k) en un anlisis de varianza

anza surge la pregunta acerca de cules pares de medias son diferentes, puesto que el rechazo de una hiptesis nula con cuatro tratamientos (H0: 1 = 2 = 3 = 4), podra deberse a uno o varios de los seis pares de diferencias que se pueden tener, esto es: 1 2 o 1 3 o 1 4 o 2 3 o 2 4 o 3 4 Existen varios procedimientos para determinar cules son los pares de medias que son diferentes. El primero de estos procedimientos, y el ms utilizado en el pasado, es el de la Diferencia Significativa Mnima ( DSM) de Fisher publicada en 1935 en su libro The Design of Experiments. Este procedimiento es una extensin de la prueba t de Student para el caso de comparacin de dos medias con varianza ponderada. Otros procedimientos ms recientemente usados para el mismo propsito son: la prueba de Student-NeumanKeuls, la prueba de Diferencia Significativa Honesta de Tukey ( DSH), la prueba del Rango mltiple de Duncan, la prueba de Dunnett y la prueba de Scheff, entre otras. Vase Steel and Torrie y Federer. Para ilustrar mejor las diferentes pruebas se tomar el siguiente ejemplo: Ejemplo 1: Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno para el control de desechos de fabricacin, pero quisiera determinar cul es la situacin de las otras tres. Para el efecto se toman cinco muestras de los lquidos residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente tabla. Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa. Planta A B C D contaminantes 1.65 1.70 1.40 2.10 1.72 1.85 1.75 1.95 1.50 1.46 1.38 1.65 1.35 2.05 1.65 1.88 1.60 1.80 1.55 2.00 ni 5 5 5 5 7.84 8.86 7.73 9.58 1.568 1.772 1.546 1.916

Total: N = 20 Antes de realizar el anlisis de varianza se debe trazar el diagrama de cajas mltiple para determinar si existen casos extraordinarios y si se cumple el supuesto de varianzas iguales:

Figura 1 Diagrama de caja para los datos del ejemplo 1

Los clculos se muestran en la siguiente tabla de ANDEVA. Tabla de ANDEVA para los datos de contaminacin. Fuente Trat. "Plantas" Error 20 4=16 20 1=19 Total Conclusin: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa (al 5%) entre las cantidades medias de contaminantes para las diferentes plantas. g.l. 4 1=3 Suma de cuadrados Cuadrados medios Fcalculada Ftablas

PRUEBA DE DIFERENCIA SIGNIFICATIVA MNIMA (DSM) DE FISHER Cuando el anlisis de varianza indica la existencia de una diferencia significativa se desea conocer cul de los pares de medias causa la diferencia. Cuando las muestras son de igual tamao la Diferencia Significativa Mnima (DSM) de Fisher nos ayuda a localizar esta fuente. La Diferencia Significativa Mnima (DSM) se define como la diferencia mnima que podra existir entre dos medias de muestras significativamente diferentes. Para obtener la frmula para la DSM, se usa la prueba t de

Student para la diferencia entre dos medias cuando las varianzas no son diferentes cuyo estadstico de contraste es:

Adems, si se considera ni = nj = n, entonces Si este valor calculado es mayor que el valor terico (de tablas) decimos que la diferencia entre significativa. As, la DSM puede considerarse como la menor de las diferencias , es decir,
1

es

Donde

, por lo tanto, se tiene:

[13.6] Ejemplo 2: Calcule la DSM de Fisher para los datos del ejemplo 1

Los valores absolutos de las diferencias entre tabla.

del ejemplo 1 se muestran en la siguiente

Tabla Valores absolutos de las diferencias entre

del ejemplo 1

0.204

0.022 0.226

0.348 0.144

0.370

Como se puede observar, las diferencias que exceden (DSM) estn entre las medias por lo tanto, slo difieren las medias 4 de 1 y de 3.

,y

Es importante tener presente que la prueba DSM slo se debe emplear cuando el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo tamao no se debe usar DSM.

PRUEBA DE DIFERENCIA SIGNIFICATIVA HONESTA (DSH) DE TUKEY La prueba de Diferencia Significativa Honesta (DSH) de Tukey , al igual que la DSM, slo se debe usar despus que se ha rechazado la hiptesis nula en el anlisis de varianza y cuando todos los tamaos de muestra son iguales; pero a diferencia de la DSM emplea el valor . En lugar de . Este valor q se obtiene de la tabla T-8, para el nivel de significancia , el nmero de tratamientos K y los grados de libertad del error, entonces:

[13.7] Ejemplo 3: Para los datos del ejemplo 1 y = 0.05,

Los valores absolutos de las diferencias entre tabla.

del ejemplo 1 se muestran en la siguiente

Valores absolutos de las diferencias entre

del ejemplo 1

0.204

0.022 0.226

0.348 0.144 0.370

Como se puede observar, las diferencias que exceden ( DSH) estn entre las medias por lo tanto, slo difieren las medias 4 de 1 y de 3.

,y

Es importante tener presente que la prueba DSH slo se debe emplear cuando el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo tamao no se debe usar DSH. PRUEBA DEL RANGO MLTIPLE DE DUNCAN La Prueba del Rango mltiple Duncan es otra prueba para determinar la diferencia entre pares de medias despus que se ha rechazado la hiptesis nula en el anlisis de varianza. Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos" (Duncan los llama rangos significativos mnimos) dados por la frmula:

[13.8] donde p toma valores entre 2 y K (K es el nmero de tratamientos), d se obtiene de la tabla T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva. Ejemplo 4: Se realiz un experimento para determinar la cantidad (en gramos) de grasa absorbida por 48 donas (doughnuts) usando ocho tipos diferentes de grasas (aceites y mantecas). Las medias para los ocho tratamientos se muestran a continuacin:

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error de 141.6, los grados de libertad del error son 48 8 =40. Seleccionando = 0.05 para este ejemplo, los rangos de Duncan son:

Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para = 0.05, 2 p 8 y 40 grados de libertad. El siguiente paso es ordenar las medias en orden creciente para establecer los "rangos".

El rango entre las medias mxima y mnima se compara con D8, esto es, diferencia significativa entre las grasas 4 y 7.

, entonces existe

El prximo paso es comparar subconjuntos de siete medias con el rango D7.

, entonces

, entonces Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en conjuntos de seis medias.

, entonces

, entonces

, entonces Nuevamente stos exceden D6, entonces stos se subdividen en subconjuntos de cinco medias

, entonces

, entonces

, entonces

, entonces Como las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261 que fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con D4; por lo tanto,

, entonces Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan con D4 porque ya fueron declarados no significativos en los conjuntos de cinco medias. Por lo tanto, el proceso termina.

Los resultados se muestran grficamente en la siguiente figura, donde las medias que estn debajo de una lnea no son significativamente diferentes.

El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor que las 8 y 7 y las dems grasas no son significativamente diferentes en relacin con la cantidad absorbida. PRUEBA DE DUNNETT En muchos experimentos uno de los tratamientos es el control, y el investigador est interesado en comparar cada una de las otras K 1 medias de los tratamientos contra el control, por lo tanto, existen K 1 comparaciones. Un procedimiento para realizar estas comparaciones es la prueba de Dunnett (desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces se desea probar las hiptesis

El procedimiento de Dunnett es una modificacin de la prueba t. Para cada hiptesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hiptesis nula se realiza con una probabilidad de error tipo I, si

donde la constante se busca en la tabla T-10. Observe que f es el nmero de grados de libertad del error y es el nivel de significacin asociado con todos las K 1 pruebas y utilizado en el anlisis de varianza. Ejemplo 5: En el ejemplo 1, la compaa desea comparar todas las otras plantas con la planta A que es la que cumple con los requisitos (control), por lo tanto, la prueba de Dunnett sera ms adecuada que la de Fisher o la de Tukey para este caso.

En consecuencia, la nica planta que difiere significativamente de la planta A es la D. PRUEBA DE SCHEFF Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de usar la tabla T-8 para obtener valores "studentizados" q utiliza la tabla F de Fisher (T-7) para obtener el factor

donde K es el nmero de tratamientos y el nivel de significacin.

Este factor

se multiplica por el error estndar de la diferencia entre dos medias

para obtener la cantidad:

[13.9] que se comparar con las diferencias entre los pares de medias de los tratamientos. Ejemplo 6: Usando los datos del ejemplo 4, se tiene:

Si la diferencia entre cualquier par de medias excede este valor se dice que hay diferencia significativa entre las medias comparadas. Las diferencias entre las ocho medias se muestran en la siguiente tabla.

Tabla Valores absolutos de las diferencias entre

del ejemplo 4

13

20

23

24

6 2

10 6 4

17 13 11 7

20 16 14 10 3

21 17 15 11 4 1

En este ejemplo todas las diferencias entre los pares de medias son menores que 27.3, por lo que no hay diferencia significativa entre los pares de grasas. NOTA: Todas las pruebas estudiadas para comparar pares de medias requieren que todos los tratamientos tengan el mismo nmero de observaciones n. Algunos autores, entre ellos Snedecor y Cochran, han recomendado usar la media armnica nh entre los tamaos de muestra nj cuando el nmero de observaciones no es el mismo. Aparentemente esta aproximacin no altera el error de Tipo I.