Está en la página 1de 9

Contraste de

hipótesis en
el ANOVA

Herramientas
Matemáticas V -
Estadística II

1
Contraste de hipótesis en el
Análisis de varianza (ANOVA)
El estadístico de prueba tiene distribución F y se construye con base en los
datos de la muestra de la siguiente manera:

La distribución, que corresponde a un cociente de varianzas, tiene asociados


grados de libertad del numerador iguales a los de los CME, que son c-1, y
grados de libertad en el denominador iguales a los de los CMD, que son n-c.

La zona de rechazo en las pruebas ANOVA se establece determinando un


valor crítico en la distribución F con los grados de libertad mencionados, de
manera que resulte por encima de este valor una probabilidad igual al nivel
de significación elegido. En este caso la zona de rechazo también se ubica en
los valores elevados de la distribución. Este hecho se corresponde con la
relación mencionada previamente de los cuadrados medios dentro y entre
como estimadores de la varianza.

En términos intuitivos, puede observarse que un valor elevado del


Zona de rechazo estadístico muestral proviene de una situación en la cual los CME son más
elevados (predominantes en cuanto a la fuente de variación de los datos).
En virtud de la lógica
de análisis de ANOVA, En tal situación, la variabilidad de los datos se asocia principalmente con el
siempre la zona de grupo al cual pertenece el individuo y, en consecuencia, resulta sospechosa
rechazo se ubica en el la hipótesis de igualdad de todas las medias poblacionales de los grupos.
extremo superior de la
distribución. Los
El valor crítico de la prueba, en el ejemplo, de una distribución F, con 2
valores altos del
estadístico F permiten grados de libertad en el numerador y 6 grados de libertad en el
rechazar la hipótesis denominador, con una significación de 0,05, es de 5,14.
nula.
La regla de decisión queda determinada de la siguiente manera:

 Si el estadístico muestral F es mayor o igual a 5,14, se rechaza la hipótesis


nula (y, en consecuencia, no puede afirmarse que las medias de todos los
grupos son iguales).

2
 Si el estadístico muestral F es menor a 5,14, no se rechaza la hipótesis
nula (y, en consecuencia, no disponemos de evidencia para descartar que
las medias de todos los grupos sean iguales).

El siguiente gráfico muestra dónde se ubica la zona de rechazo en las


pruebas ANOVA.

Figura 1:

Fuente: elaboración propia a base de https://goo.gl/Ai6sm8

Toda la información requerida para un ANOVA se sintetiza en una tabla


ANOVA. Para el ejemplo, la siguiente tabla ANOVA nos permite llevar a cabo
la prueba:

Tabla 1: Tabla de ANOVA

3
El valor de estadístico muestral F es 32,71, superior al valor crítico. Por lo
tanto, con base en la evidencia obtenida, podemos afirmar que al menos una
de las zonas donde están implantadas las sucursales del supermercado
posee una frecuencia promedio de compra de los clientes distinta al resto.

Prueba de Tukey Comparaciones post hoc


Kramer

El procedimiento de El hecho de rechazar la hipótesis nula de un ANOVA no nos dice nada acerca
Tukey Kramer para de las diferencias de las medias entre sí, sino que solo nos permite asegurar
las comparaciones que tal diferencia es significativa en al menos una de las medias
múltiples se consideradas.
encuentra
desarrollado en el Nos preguntamos en el ejemplo: ¿cuál o cuáles de las sucursales difieren
punto 11.4.5 del significativamente en cuanto a sus frecuencias promedio de compra? Para
texto de Berenson y poder identificar cuál o cuáles medias difieren, se realizan pruebas como el
Levine (1996). test de Tukey, que posibilitan su detección.

Dado que estas pruebas se realizan una vez que ha sido rechazada la
hipótesis nula del ANOVA, a posteriori, se denominan post hoc.

Para llevar a cabo esta prueba, se sigue el siguiente procedimiento:

1) En primer lugar, se calculan las diferencias de a pares de todos los grupos:

Para todo

Es decir, para todas las medias de diferentes grupos.

En total serán necesarias:

Comparaciones de medias de a pares.

4
2) En segundo lugar, se debe obtener el alcance crítico con la siguiente
fórmula:

Si los tamaños de las muestras de cada grupo son diferentes, debe calcularse
Tabla de valores Q el ac para cada par de medias de muestra.
Dispones de una
El valor de Q se obtiene de la tabla correspondiente a la tabla de Tukey
tabla de valores Q en
Kramer.
los anexos del
módulo, al igual que
3) Finalmente, se comparan las diferencias obtenidas en (1) con el ac que le
al final del texto de
bibliografía básica.
corresponde. Si la diferencia obtenida excede al ac, pueden considerarse
distintas las medias respectivas.

Supuestos del ANOVA

Para poder realizar la prueba ANOVA, debe verificarse el cumplimiento de


los supuestos que garantizan la validez.

1) Aleatoriedad o independencia de errores: es imprescindible garantizar la


aleatoriedad en la asignación de los casos a los diferentes niveles del
tratamiento, ya que, de lo contrario, no será posible arribar a
conclusiones correctas acerca del efecto del nivel del tratamiento o grupo
al cual está asignado el caso sobre la variable dependiente. Este aspecto
debe ser garantizado desde el propio diseño del estudio experimental del
cual provenga la muestra de análisis.

2) Normalidad: la segunda condición que debe cumplirse se relaciona con


la distribución de los datos de cada uno de los grupos. Los datos deben
distribuirse de manera normal en torno de la media de cada grupo. En
general, la prueba ANOVA es robusta (en el sentido de resistir aun si no
se cumple de manera estricta esta propiedad), siempre que las
distribuciones no sean demasiado sesgadas.

3) Homogeneidad de varianzas: las varianzas de todos los grupos deben ser


iguales. Este supuesto es crítico y puede verificarse su cumplimiento a
través de un test de Levene de igualdad de varianzas. Si las muestras

5
tienen igual tamaño, no se verá afectado el resultado del ANOVA por la
falta de cumplimiento de este supuesto.

Ejercicios

Resolver los siguientes ejercicios con las técnicas aprendidas.


Anexo de
ejercitación
1) Supongamos que tenemos un fármaco que se administra a 3 grupos de
personas, a las cuales se les realiza cierta medición del efecto causado:
Además de estos
ejercicios, Tabla 2:
encontrarás en el
anexo del módulo
una guía de
ejercicios y sus
respectivas
soluciones. Te
recomendamos que
realices toda la
ejercitación posible Fuente: elaboración propia.
para identificar con
claridad las En este caso los factores que influyen en las observaciones son tres: que la
situaciones en las persona padezca la gripe, que tenga apendicitis o que esté sana.
que se aplica cada
prueba estudiada.
 Plantea las hipótesis del problema.
 Utiliza una significación de 0,05.
 Escribe una conclusión.

2) Se aplican 4 tratamientos distintos a 4 grupos de 5 pacientes y se


obtienen los resultados de la tabla que se adjunta. Queremos saber si se
puede concluir con que todos los tratamientos tienen el mismo efecto.

Tabla 3:

6
Fuente: elaboración propia.

 Plantea las hipótesis del problema.


 Utiliza una significación de 0,05.
 Escribe una conclusión.

3) La tabla siguiente presenta la distribución de frecuencia del número de


defectos encontrados en el análisis de los últimos 200 artículos
producidos en un proceso de producción. Usando un nivel de confianza
del 5 % se desea verificar mediante una prueba chi cuadrado si dichos
valores proceden de una distribución de Poisson con una media de 3,5
defectos por artículo.

Tabla 4:

Fuente: elaboración propia.

4) Se realizó una encuesta para caracterizar a los lectores de diarios en


ciudades pequeñas, en áreas rurales y en granjas. La respuesta acerca de
si leían o no algún diario resultó en la siguiente tabla:

Tabla 5:

Fuente: elaboración propia.

 Con α = 0,05: ¿brindan los datos evidencia suficiente para indicar que las
proporciones de lectores difieren entre los distintos grupos de
comunidades?
 Encuentra el valor p para la prueba.

5) Se realizó un estudio de las decisiones de tres administradores de carteras


de acciones para comparar las ganancias obtenidas. ¿Proporcionan los

7
datos suficiente evidencia para indicar que hay diferencias en las compras
exitosas entre los administradores (α = 0,05)?

Tabla 6:

Fuente: elaboración propia.

6) Ante la sospecha de que el hábito de fumar de una embarazada puede


influir en el peso de su hijo al nacer, se tomaron dos muestras, una de
fumadoras y otra de no fumadoras, y se clasificó a sus hijos en tres
categorías en función de su peso en relación con los percentiles P10 y P90
de la población. El resultado se expresa en la tabla siguiente:

Tabla 7:

Fuente: elaboración propia.

¿Hay una evidencia significativa a favor de la sospecha, teniendo en cuenta


los resultados de la muestra?

8
Referencias
Berenson, M. L. y Levine, D. M. (1996). Estadística para administración y
economía (6.a ed.). México D. F., MX: Prentice Hall Hispanoamericana.

También podría gustarte