Está en la página 1de 10

Comparación de medias

Introducción
Cuando se desea comprobar si los valores de una característica que es posible
cuantificar (como podría ser la edad o la cifra de tensión arterial, entre otras)
difieren al agruparlas en dos o más grupos (por ejemplo según género, o por
diagnóstico de hipertensión arterial) hablaremos de comparación de medias. La
comparación de medias en un sentido más general, abarca la comparación de
los valores de una variable continua según los valores de una variable (o factor)
que se puede resumir en dos o más categorías (como el ejemplo expuesto
previamente) y que englobaríamos dentro de las pruebas para datos
independientes, así como la comparación de los valores de una variable continua
evaluada en dos o más momentos en el tiempo (por ejemplo comparar si hay
diferencias entre la medición de la presión arterial realizada por la mañana o por
la noche) y que englobaríamos dentro de las pruebas para datos apareados.
El procedimiento comparar medias nos permite la aplicación de distintos
estadísticos inferenciales apropiados para contrastar hipótesis relativas a la
diferencia existente entre dos o más medias, o relativas a la posibilidad de que
una muestra pertenezca a una población que presenta una media determinada.
Para acceder a este procedimiento debemos seleccionar en el menú Estadísticos
la opción comparar medias. Tras ello se nos presenta un nuevo menú en el cual
se nos presentan las distintas opciones de este procedimiento.

La primera de ellas, Medias, nos permite, por una parte, obtener distintos
estadísticos descriptivos de los dos grupos que deseamos comparar y, por otra,
nos permite realizar comparaciones de dos o más grupos. Podría considerarse
que este programa presenta en forma resumida el resto de los estadísticos que
pueden obtenerse con el procedimiento comparar medias.
Posteriormente se nos presentan tres variantes de la prueba "t" de Student que
nos permiten verificar la pertenencia de una muestra a una población, comparar
las medias de dos grupos independientes y comparar las medias en el caso
particular de grupos relacionados. Finalmente es posible llevar a cabo un análisis
de la varianza unifactorial con la finalidad de comparar k medias. Hay que tener
en cuenta que si estamos interesados en llevar a cabo un análisis de la varianza
con más de un factor debemos ejecutar el procedimiento Modelo lineal general.
PRUEBA DE DIFERENCIA SIGNIFICATIVA MÍNIMA (DSM).

Cuando el análisis de varianza indica la existencia de una diferencia significativa


se desea conocer cuál de los pares de medias causa la diferencia. Cuando las
muestras son de igual tamaño la Diferencia Significativa Mínima (DSM) de Fisher
nos ayuda a localizar esta fuente.

La Diferencia Significativa Mínima (DSM) se define como la diferencia mínima


que podría existir entre dos medias de muestras significativamente diferentes.
Para obtener la fórmula para la DSM, se usa la prueba t de Student para la
diferencia entre dos medias cuando las varianzas no son diferentes cuyo
estadístico de contraste es:

Además, si se considera ni = nj = n, entonces

Si este valor calculado es mayor que el valor teórico (de tablas) decimos que la
diferencia entre m 1 y m 2 es significativa. Así, la DSM puede considerarse
como la menor de las diferencias , es decir,

donde y , por lo tanto, se tiene:


PRUEBA DE DUNNETT

En muchos experimentos uno de los tratamientos es el control, y el investigador


está interesado en comparar cada una de las otras K- 1 medias de los
tratamientos contra el control, por lo tanto, existen K- 1 comparaciones. Un
procedimiento para realizar estas comparaciones es la prueba de Dunnett
(desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces
se desea probar las hipótesis

El procedimiento de Dunnett es una modificación de la prueba t. Para cada


hipótesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hipótesis nula se realiza con una probabilidad de error tipo I, a si

donde la constante se busca en la tabla T-10. Observe que f es el


número de grados de libertad del error y a es el nivel de significación asociado
con todos las K- 1 pruebas y utilizado en el análisis de varianza.

PRUEBA DE SCHEFFÉ

Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de


usar la tabla T-8 para obtener valores "studentizados" q utiliza la tabla F de
Fisher (T-7) para obtener el factor

donde K es el número de tratamientos y a el nivel de significación.

Este factor se multiplica por el error estándar de la

diferencia entre dos medias para obtener la cantidad:


que se comparará con las diferencias entre los pares de medias de los
tratamientos.

PRUEBA DE STUDENT-NEWMAN-KEULS (SNK)


La prueba con el comparador Student-Newman-Keuls (SNK) es similar
en metodología a la de Duncan, pero con un nivel de rigurosidad intermedio con
respecto a Duncan y Tukey, es decir, ni tan exigente como Tukey, ni tan flexible
como Duncan.
Este procedimiento es más conservativo que el de Duncan en el número de
diferencias que declara significativa. Por lo tanto, en situaciones en las cuales no
es necesario ser tan conservativo se sugiere el uso de esta metodología
probabilidades más relajado, digamos un 10% a un más alto.

EJEMPLOS DE LOS DIFERENTES MÉTODOS

Ejemplo 1: Una empresa tiene cuatro plantas y sabe que la planta A satisface
los requisitos impuestos por el gobierno para el control de desechos de
fabricación, pero quisiera determinar cuál es la situación de las otras tres. Para
el efecto se toman cinco muestras de los líquidos residuales de cada una de las
plantas y se determina la cantidad de contaminantes. Los resultados del
experimento aparecen en la siguiente tabla.

Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa.

Planta contaminantes ni

A 1.65 1.72 1.50 1.35 1.60 5 7.84 1.568

B 1.70 1.85 1.46 2.05 1.80 5 8.86 1.772

C 1.40 1.75 1.38 1.65 1.55 5 7.73 1.546

D 2.10 1.95 1.65 1.88 2.00 5 9.58 1.916

Total: N = 20

Antes de realizar el análisis de varianza se debe trazar el diagrama de cajas


múltiple para determinar si existen casos extraordinarios y si se cumple el
supuesto de varianzas iguales:
Figura 1 Diagrama de caja para los datos del ejemplo 1

Los cálculos se muestran en la siguiente tabla de ANDEVA.

Tabla de ANDEVA para los datos de contaminación.

Fuente g.l. Suma de cuadrados Cuadrados Fcalculada Ftablas


medios

Trat. 4
1=3
"Plantas"

Error

20
4=16

20
1=19
Total

Conclusión: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay
diferencia significativa (al 5%) entre las cantidades medias de contaminantes
para las diferentes plantas.

Ejemplo 2: Calcule la DSM de Fisher para los datos del ejemplo 1


Los valores absolutos de las diferencias entre del ejemplo 1 se
muestran en la siguiente tabla.

Tabla Valores absolutos de las diferencias entre del


ejemplo 1

- 0.204 0.022 0.348

- - 0.226 0.144

- - - 0.370

Como se puede observar, las diferencias que exceden (DSM) están entre las
medias ,y , por lo tanto, sólo difieren las medias  4 de  1 y de
 3.

Es importante tener presente que la prueba DSM sólo se debe emplear cuando
el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo
tamaño no se debe usar DSM.

Ejemplo 3: Para los datos del ejemplo 1 y  = 0.05,

Los valores absolutos de las diferencias entre del ejemplo 1 se


muestran en la siguiente tabla.

Valores absolutos de las diferencias entre del ejemplo 1

- 0.204 0.022 0.348

- - 0.226 0.144

- - - 0.370
Como se puede observar, las diferencias que exceden (DSH) están entre las
medias, y , por lo tanto, sólo difieren las medias  4 de 
1y de  3.

Ejemplo 4: Se realizó un experimento para determinar la cantidad (en gramos)


de grasa absorbida por 48 donas (doughnuts) usando ocho tipos diferentes de
grasas (aceites y mantecas). Las medias para los ocho tratamientos se muestran
a continuación:

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio


del error de 141.6, los grados de libertad del error son 48 - 8 =40.

Seleccionando  = 0.05 para este ejemplo, los rangos de Duncan son:

Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para
 = 0.05, 2  p  8 y 40 grados de libertad.

El siguiente paso es ordenar las medias en orden creciente para establecer los
"rangos".

El rango entre las medias máxima y mínima se compara con D8, esto es,
, entonces existe diferencia significativa entre las grasas 4 y 7.

El próximo paso es comparar subconjuntos de siete medias con el rango D7.

, entonces

, entonces
Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en
conjuntos de seis medias.

, entonces

, entonces

, entonces

Nuevamente éstos exceden D6, entonces éstos se subdividen en subconjuntos


de cinco medias

, entonces

, entonces

, entonces

, entonces

Como las medias para las grasas 3, 2, 6 y 1 están incluidos en el conjunto 43261
que fue no significativo, los rangos de las medias en el subconjunto 3261 no se
comparan con D4; solamente los rangos de las medias en el subconjunto 2615
se comparan con D4; por lo tanto,

, entonces

Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan


con D4 porque ya fueron declarados no significativos en los conjuntos de cinco
medias. Por lo tanto, el proceso termina.

Los resultados se muestran gráficamente en la siguiente figura, donde las


medias que están debajo de una línea no son significativamente diferentes.

El investigador puede concluir que las cantidades absorbidas usando las grasas
4 y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es
significativamente mayor que las 8 y 7 y las demás grasas no son
significativamente diferentes en relación con la cantidad absorbida.
Ejemplo 5: En el ejemplo 1, la compañía desea comparar todas las otras plantas
con la planta A que es la que cumple con los requisitos (control), por lo tanto, la
prueba de Dunnett sería más adecuada que la de Fisher o la de Tukey para este
caso.

En consecuencia, la única planta que difiere significativamente de la planta A es


la D.

Ejemplo 6: Usando los datos del ejemplo 4, se tiene:

Si la diferencia entre cualquier par de medias excede este valor se dice que hay
diferencia significativa entre las medias comparadas. Las diferencias entre las
ocho medias se muestran en la siguiente tabla.
Tabla Valores absolutos de las diferencias entre del ejemplo
4

- 3 7 9 13 20 23 24

- - 4 6 10 17 20 21

- - - 2 6 13 16 17

- - - - 4 11 14 15

- - - - - 7 10 11

- - - - - - 3 4

- - - - - - - 1

- - - - - - - -

En este ejemplo todas las diferencias entre los pares de medias son menores
que 27.3, por lo que no hay diferencia significativa entre los pares de grasas.

BIBLIOGRAFÍA

 Portilla, M., Eraso, S, Galé, C., García, I., Moler, J. y Blanca, M. (2006).
Manual práctico del paquete estadístico SPSS para Windows (3ª edición
revisada). Universidad Pública de Navarra: Navarra.
 Lizasoain, L., Joaristi, L. (2003). Gestión y análisis de datos con SPSS.
Versión 11. Thomson: Madrid.

También podría gustarte