Está en la página 1de 7

Análisis de varianza

Análisis de varianza de un factor


Se supone que hay k poblaciones distintas (llamadas tratamientos o categorías),
las cuales se hallan normalmente distribuidas con medias μ1, μ2, . . ., μk y que
poseen, todas, la misma varianza. Tomemos, para estas poblaciones, muestras
aleatorias independientes de tamaños n1, n2, . . ., nk, respectivamente.

Utilizaremos el símbolo y para designar los valores muestrales actuales y le


pondremos dos subíndices, de manera que yij designaría la observación i-ésima
en la población j-ésima.

Entonces, el procedimiento para contrastar la hipótesis de igualdad de medias


en este contexto se denomina análisis de varianza de un factor.

Sumas de cuadrados y teorema de descomposición


Ahora bien, el contraste de igualdad de medias está basado en la comparación
de dos tipos de variabilidad de los miembros de la muestra:

1. La primera es la variabilidad en torno a las medias individuales muestrales de


los k grupos de observaciones denominada variabilidad dentro de los grupos.
2. La segunda es la variabilidad entre las medias de los k grupos. ´Esta se
denomina variabilidad entre grupos.

Estimaciones insesgadas de la varianza poblacional


Nuestro contraste de igualdad de medias está basado en el supuesto de que las
k poblaciones tienen una varianza común. Si la hipótesis nula de igualdad de
medias fuese cierta, cada una de las sumas de cuadrados, SSE y SSA, podría
utilizarse como base para una estimación de la varianza poblacional común.
Pero, para obtener estas estimaciones, deberemos dividir la suma de los
cuadrados por un número apropiado de grados de libertad, como se muestra en
el siguiente teorema:
Teorema de contraste para el análisis de varianza
Si la hipótesis nula fuese cierta, estaríamos ahora en posesión de dos
estimaciones insesgadas de la misma cantidad, la varianza poblacional común.
Sería razonable esperar que estas dos estimaciones estuviesen muy cercanas
la una de la otra. A mayor discrepancia entre ambas, permaneciendo todo lo
demás igual, mayor sería nuestra sospecha de que la hipótesis nula no es cierta.

Los cálculos necesarios para llevar a cabo este contraste se pueden resumir en
una tabla de análisis de varianza de un factor (tabla de ANOVA), como la
siguiente:

Ejercicio 1. La siguiente tabla muestra los porcentajes (en microgramos) de una


droga para tres grupos de enfermos mentales. Deseamos saber si se puede
concluir, con base en estos datos, que los valores medios no son iguales en
todos los tres grupos. Utilice α = 0, 05 y suponga que las poblaciones en
cuestión son normales con las mismas varianzas.
SOLUCIÓN:
Sea μi el porcentaje promedio (poblacional) de la droga aplicada a los enfermos
mentales del grupo i, donde i = I, II, III. En este ejemplo, la hipótesis nula a
contrastar sería que las 3 medias poblacionales son iguales, es decir,

H0: μ1 = μ2 = μ3, versus H1: Al menos dos medias son diferentes.

Vamos a completar el siguiente cuadro

Luego, hallamos las sumas de cuadrados:

Suma de cuadrados total:


Suma de cuadrados de tratamientos:

Por consiguiente,

SSE = SST − SSA = 0, 6786 − 0, 3544 = 0, 3242.

Ahora, hallamos los valores de las estimaciones insesgadas de σ2:

Así que, para un nivel del 5%, Fα = F0,05 = 3, 42 con ν1 = k−1 = 2 y ν2 = N −k =


23 grados de libertad. Además, debido a que F = 12, 57 es mayor que F α = 3,
42, entonces, se rechaza la hipótesis nula. Esto quiere decir que por lo menos
dos niveles medios de la droga no son iguales en los tres tipos de enfermos
mentales. Para este ejercicio, la tabla de ANOVA es la siguiente:

Ejercicio 2. Los siguientes datos resultaron de un experimento que compara los


grados de manchas en un tejido con tres mezclas diferentes de un ´acido. Utilice
un nivel de significancia del 1% para determinar si el promedio real de grado de
manchas es idéntico para las tres mezclas. Suponga que las poblaciones en
cuestión son normales con las mismas varianzas.
Vamos a completar el siguiente cuadro

Luego, hallamos las sumas de cuadrados:

Suma de cuadrados total:

Suma de cuadrados de tratamientos:

Por consiguiente,

SSE = SST − SSA = 0, 71093 − 0, 043253 = 0, 66768.


Ahora, hallamos los valores de las estimaciones insesgadas de σ2:

De modo que, para un nivel del 1%, Fα = F0,01 = 6, 93 con ν1 = k − 1 = 2 y ν2 =


N − k = 12 grados de libertad. Y como F = 0, 38 es menor que Fα = 6, 93,
entonces, no se rechaza la hipótesis nula. Esto quiere decir que al parecer las
mezclas no son distinguibles respecto al grado de manchas. Para este ejercicio,
la tabla de ANOVA es la siguiente:

También podría gustarte