Comparación de Medias

Comparación de medias
Introducción
Cuando se desea comprobar si los valores de una característica que es posible
cuantificar (como podría ser la edad o la cifra de tensión arterial, entre otras)
difieren al agruparlas en dos o más grupos (por ejemplo según género, o por
diagnóstico de hipertensión arterial) hablaremos de comparación de medias. La
comparación de medias en un sentido más general, abarca la comparación de
los valores de una variable continua según los valores de una variable (o factor)
que se puede resumir en dos o más categorías (como el ejemplo expuesto
previamente) y que englobaríamos dentro de las pruebas para datos
independientes, así como la comparación de los valores de una variable continua
evaluada en dos o más momentos en el tiempo (por ejemplo comparar si hay
diferencias entre la medición de la presión arterial realizada por la mañana o por
la noche) y que englobaríamos dentro de las pruebas para datos apareados.
El procedimiento comparar medias nos permite la aplicación de distintos
estadísticos inferenciales apropiados para contrastar hipótesis relativas a la
diferencia existente entre dos o más medias, o relativas a la posibilidad de que
una muestra pertenezca a una población que presenta una media determinada.
Para acceder a este procedimiento debemos seleccionar en el menú Estadísticos
la opción comparar medias. Tras ello se nos presenta un nuevo menú en el cual
se nos presentan las distintas opciones de este procedimiento.
La primera de ellas, Medias, nos permite, por una parte, obtener distintos
estadísticos descriptivos de los dos grupos que deseamos comparar y, por otra,
nos permite realizar comparaciones de dos o más grupos. Podría considerarse
que este programa presenta en forma resumida el resto de los estadísticos que
pueden obtenerse con el procedimiento comparar medias.
Posteriormente se nos presentan tres variantes de la prueba "t" de Student que
nos permiten verificar la pertenencia de una muestra a una población, comparar
las medias de dos grupos independientes y comparar las medias en el caso
particular de grupos relacionados. Finalmente es posible llevar a cabo un análisis
de la varianza unifactorial con la finalidad de comparar k medias. Hay que tener
en cuenta que si estamos interesados en llevar a cabo un análisis de la varianza
con más de un factor debemos ejecutar el procedimiento Modelo lineal general.
PRUEBA DE DIFERENCIA SIGNIFICATIVA MÍNIMA (DSM).
Cuando el análisis de varianza indica la existencia de una diferencia significativa

se desea conocer cuál de los pares de medias causa la diferencia. Cuando las
muestras son de igual tamaño la Diferencia Significativa Mínima (DSM) de Fisher
nos ayuda a localizar esta fuente.
La Diferencia Significativa Mínima (DSM) se define como la diferencia mínima

que podría existir entre dos medias de muestras significativamente diferentes.
Para obtener la fórmula para la DSM, se usa la prueba t de Student para la
diferencia entre dos medias cuando las varianzas no son diferentes cuyo
estadístico de contraste es:
Además, si se considera ni = nj = n, entonces
Si este valor calculado es mayor que el valor teórico (de tablas) decimos que la
diferencia entre m 1 y m 2 es significativa. Así, la DSM puede considerarse
como la menor de las diferencias , es decir,
donde y , por lo tanto, se tiene:

PRUEBA DE DUNNETT
En muchos experimentos uno de los tratamientos es el control, y el investigador

está interesado en comparar cada una de las otras K- 1 medias de los
tratamientos contra el control, por lo tanto, existen K- 1 comparaciones. Un
procedimiento para realizar estas comparaciones es la prueba de Dunnett
(desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces
se desea probar las hipótesis
El procedimiento de Dunnett es una modificación de la prueba t. Para cada

hipótesis se calcula el valor absoluto de la diferencia de medias observadas
El rechazo de la hipótesis nula se realiza con una probabilidad de error tipo I, a si
donde la constante se busca en la tabla T-10. Observe que f es el

número de grados de libertad del error y a es el nivel de significación asociado
con todos las K- 1 pruebas y utilizado en el análisis de varianza.
PRUEBA DE SCHEFFÉ
Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de

usar la tabla T-8 para obtener valores "studentizados" q utiliza la tabla F de
Fisher (T-7) para obtener el factor
donde K es el número de tratamientos y a el nivel de significación.
Este factor se multiplica por el error estándar de la
diferencia entre dos medias para obtener la cantidad:

que se comparará con las diferencias entre los pares de medias de los
tratamientos.
PRUEBA DE STUDENT-NEWMAN-KEULS (SNK)

La prueba con el comparador Student-Newman-Keuls (SNK) es similar
en metodología a la de Duncan, pero con un nivel de rigurosidad intermedio con
respecto a Duncan y Tukey, es decir, ni tan exigente como Tukey, ni tan flexible
como Duncan.
Este procedimiento es más conservativo que el de Duncan en el número de
diferencias que declara significativa. Por lo tanto, en situaciones en las cuales no
es necesario ser tan conservativo se sugiere el uso de esta metodología
probabilidades más relajado, digamos un 10% a un más alto.
EJEMPLOS DE LOS DIFERENTES MÉTODOS
Ejemplo 1: Una empresa tiene cuatro plantas y sabe que la planta A satisface
los requisitos impuestos por el gobierno para el control de desechos de
fabricación, pero quisiera determinar cuál es la situación de las otras tres. Para
el efecto se toman cinco muestras de los líquidos residuales de cada una de las
plantas y se determina la cantidad de contaminantes. Los resultados del
experimento aparecen en la siguiente tabla.
Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa.
Planta contaminantes ni
A 1.65 1.72 1.50 1.35 1.60 5 7.84 1.568
B 1.70 1.85 1.46 2.05 1.80 5 8.86 1.772
C 1.40 1.75 1.38 1.65 1.55 5 7.73 1.546
D 2.10 1.95 1.65 1.88 2.00 5 9.58 1.916
Total: N = 20
Antes de realizar el análisis de varianza se debe trazar el diagrama de cajas

múltiple para determinar si existen casos extraordinarios y si se cumple el
supuesto de varianzas iguales:
Figura 1 Diagrama de caja para los datos del ejemplo 1
Los cálculos se muestran en la siguiente tabla de ANDEVA.
Tabla de ANDEVA para los datos de contaminación.
Fuente g.l. Suma de cuadrados Cuadrados Fcalculada Ftablas

medios
Trat. 4
1=3
"Plantas"
Error
20
4=16
20
1=19
Total
Conclusión: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay
diferencia significativa (al 5%) entre las cantidades medias de contaminantes
para las diferentes plantas.
Ejemplo 2: Calcule la DSM de Fisher para los datos del ejemplo 1

Los valores absolutos de las diferencias entre del ejemplo 1 se
muestran en la siguiente tabla.
Tabla Valores absolutos de las diferencias entre del

ejemplo 1
- 0.204 0.022 0.348
- - 0.226 0.144
- - - 0.370
Como se puede observar, las diferencias que exceden (DSM) están entre las
medias ,y , por lo tanto, sólo difieren las medias  4 de  1 y de
 3.
Es importante tener presente que la prueba DSM sólo se debe emplear cuando
el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo
tamaño no se debe usar DSM.
Ejemplo 3: Para los datos del ejemplo 1 y  = 0.05,
Los valores absolutos de las diferencias entre del ejemplo 1 se

muestran en la siguiente tabla.
Valores absolutos de las diferencias entre del ejemplo 1
- 0.204 0.022 0.348
- - 0.226 0.144
- - - 0.370
Como se puede observar, las diferencias que exceden (DSH) están entre las
medias, y , por lo tanto, sólo difieren las medias  4 de 
1y de  3.
Ejemplo 4: Se realizó un experimento para determinar la cantidad (en gramos)

de grasa absorbida por 48 donas (doughnuts) usando ocho tipos diferentes de
grasas (aceites y mantecas). Las medias para los ocho tratamientos se muestran
a continuación:
Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio

del error de 141.6, los grados de libertad del error son 48 - 8 =40.
Seleccionando  = 0.05 para este ejemplo, los rangos de Duncan son:
Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para
 = 0.05, 2  p  8 y 40 grados de libertad.
El siguiente paso es ordenar las medias en orden creciente para establecer los
"rangos".
El rango entre las medias máxima y mínima se compara con D8, esto es,
, entonces existe diferencia significativa entre las grasas 4 y 7.
El próximo paso es comparar subconjuntos de siete medias con el rango D7.
, entonces
, entonces
Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en
conjuntos de seis medias.
, entonces
, entonces
, entonces
Nuevamente éstos exceden D6, entonces éstos se subdividen en subconjuntos

de cinco medias
, entonces
, entonces
, entonces
, entonces
Como las medias para las grasas 3, 2, 6 y 1 están incluidos en el conjunto 43261
que fue no significativo, los rangos de las medias en el subconjunto 3261 no se
comparan con D4; solamente los rangos de las medias en el subconjunto 2615
se comparan con D4; por lo tanto,
, entonces
Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan

con D4 porque ya fueron declarados no significativos en los conjuntos de cinco
medias. Por lo tanto, el proceso termina.
Los resultados se muestran gráficamente en la siguiente figura, donde las

medias que están debajo de una línea no son significativamente diferentes.
El investigador puede concluir que las cantidades absorbidas usando las grasas
4 y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es
significativamente mayor que las 8 y 7 y las demás grasas no son
significativamente diferentes en relación con la cantidad absorbida.
Ejemplo 5: En el ejemplo 1, la compañía desea comparar todas las otras plantas
con la planta A que es la que cumple con los requisitos (control), por lo tanto, la
prueba de Dunnett sería más adecuada que la de Fisher o la de Tukey para este
caso.
En consecuencia, la única planta que difiere significativamente de la planta A es

la D.
Ejemplo 6: Usando los datos del ejemplo 4, se tiene:
Si la diferencia entre cualquier par de medias excede este valor se dice que hay
diferencia significativa entre las medias comparadas. Las diferencias entre las
ocho medias se muestran en la siguiente tabla.
Tabla Valores absolutos de las diferencias entre del ejemplo
4
- 3 7 9 13 20 23 24
- - 4 6 10 17 20 21
- - - 2 6 13 16 17
- - - - 4 11 14 15
- - - - - 7 10 11
- - - - - - 3 4
- - - - - - - 1
- - - - - - - -
En este ejemplo todas las diferencias entre los pares de medias son menores
que 27.3, por lo que no hay diferencia significativa entre los pares de grasas.
BIBLIOGRAFÍA
 Portilla, M., Eraso, S, Galé, C., García, I., Moler, J. y Blanca, M. (2006).
Manual práctico del paquete estadístico SPSS para Windows (3ª edición
revisada). Universidad Pública de Navarra: Navarra.
 Lizasoain, L., Joaristi, L. (2003). Gestión y análisis de datos con SPSS.
Versión 11. Thomson: Madrid.

Comparación de Medias

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Comparación de Medias

Cargado por

Copyright:

Formatos disponibles

Comparación de medias

Cuando el análisis de varianza indica la existencia de una diferencia significativa

La Diferencia Significativa Mínima (DSM) se define como la diferencia mínima

Además, si se considera ni = nj = n, entonces

donde y , por lo tanto, se tiene:

En muchos experimentos uno de los tratamientos es el control, y el investigador

El procedimiento de Dunnett es una modificación de la prueba t. Para cada

El rechazo de la hipótesis nula se realiza con una probabilidad de error tipo I, a si

donde la constante se busca en la tabla T-10. Observe que f es el

Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de

donde K es el número de tratamientos y a el nivel de significación.

Este factor se multiplica por el error estándar de la

diferencia entre dos medias para obtener la cantidad:

PRUEBA DE STUDENT-NEWMAN-KEULS (SNK)

EJEMPLOS DE LOS DIFERENTES MÉTODOS

Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa.

A 1.65 1.72 1.50 1.35 1.60 5 7.84 1.568

B 1.70 1.85 1.46 2.05 1.80 5 8.86 1.772

C 1.40 1.75 1.38 1.65 1.55 5 7.73 1.546

D 2.10 1.95 1.65 1.88 2.00 5 9.58 1.916

Antes de realizar el análisis de varianza se debe trazar el diagrama de cajas

Los cálculos se muestran en la siguiente tabla de ANDEVA.

Tabla de ANDEVA para los datos de contaminación.

Fuente g.l. Suma de cuadrados Cuadrados Fcalculada Ftablas

Ejemplo 2: Calcule la DSM de Fisher para los datos del ejemplo 1

Tabla Valores absolutos de las diferencias entre del

- 0.204 0.022 0.348

Ejemplo 3: Para los datos del ejemplo 1 y  = 0.05,

Los valores absolutos de las diferencias entre del ejemplo 1 se

Valores absolutos de las diferencias entre del ejemplo 1

- 0.204 0.022 0.348

Ejemplo 4: Se realizó un experimento para determinar la cantidad (en gramos)

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio

Seleccionando  = 0.05 para este ejemplo, los rangos de Duncan son:

El próximo paso es comparar subconjuntos de siete medias con el rango D7.

Nuevamente éstos exceden D6, entonces éstos se subdividen en subconjuntos

Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan

Los resultados se muestran gráficamente en la siguiente figura, donde las

En consecuencia, la única planta que difiere significativamente de la planta A es

Ejemplo 6: Usando los datos del ejemplo 4, se tiene:

También podría gustarte