Está en la página 1de 7

Análisis de varianza un factor

Supuestos y formulación de las hipótesis


Se supone que hay k poblaciones distintas (llamadas TRATAMIENTOS O
CATEGORÍAS), las cuales se hallan normalmente distribuidos con medias
μ1 , μ 2 , μ3 , … , μ k y que poseen todas, la misma varianza. Tomemos, para estas
poblaciones, muestras aleatorias independientes de tamaño n1 , n2 , n3 , … , n k
respectivamente.
Utilizaremos el símbolo y para designar los valores muestrales actuales y le
pondremos dos subíndices, de manera que y ij designará la observación i-
ésima en la población j-ésima.
Con las anotaciones anteriores y con el fin de organizar nuestro estudio,
supongamos que los datos muestrales se pueden representar como se
muestra en la siguiente tabla

Población Población Población … Población


1 2 3 … k
y 11 y 12 y 13 … y1 k
y 21 y 22 y 23 … y2k
Muestra . . . . .
s . . . . .
. . . . .
yn 1 1 yn 1 2 yn 1 3 … yn 1 k Total
Tamaño n1 n2 n3 … nk N
Sumas T1 T2 T3 … Tk T
Medias ý 1 ý 2 ý 3 … ý k ý

Donde
y ij es la i – ésima observación del tratamiento j

n j es el tamaño de la j ésima muestra

N=n1+ n2 +…+n k es la sumade todoslos tamaño de muestras

T j= y1 j+ y 2 j +…+ y nj j
es la suma de las observaciones de la j ésima muestra .

T =T 1+T 2 +…+T k es la suma de todaslas observaciones

Tj
ý j= es la media de las observaciones de la j ésima muestra .
nj
T
ý= es la media de todaslas observaciones
N

Suma de cuadrados y teorema de descomposición

El contraste de igualdad de medias está basado en la comparación de dos


tipos de variabilidad de los miembros de la muestra:
1. La primera es la variabilidad en torno entorno a las medias
individuales muestrales de los k grupos de observaciones denominada
variabilidad dentro de los grupos.
2. La segunda es la variabilidad entre las medias de los k grupos. Ésta se
denomina variabilidad entre grupos.
Teorema: Supongamos que tenemos muestras aleatorias independientes de
n1 , n2 , n3 , … , n k observaciones de k poblaciones. Sean entonces, y ij
la i – ésima observación muestral en el j ésimo grupo ; ý 1 , ý 2 , … ý k las medias muestrales
de los k grupos y ý la media muestral global. Definimos a partir de lo anterior
las siguientes sumas de cuadrados.

Suma de cuadrados total


k nj k ni
2 2 T2
SST =∑ ∑ ( y ij − ý ) =∑ ∑ y ij −
j =1 i=1 j=1 i=1 N

Suma de los cuadrados entre grupos (o tratamientos)


k k
T 2j T 2
SSA=∑ ( ý j − ý )2=∑ −
j =1 j=1 nj N
Suma de cuadrados dentro de los grupos (o del error)

k nj
SSE=∑ ∑ ( y ij − ý j )2
j=1 i=1

Entonces siempre se cumple que


SST =SSE+ SSA

Teorema: Supongamos que tenemos muestras aleatorias independientes de


n1 , n2 , n3 , … , n k observaciones de k poblaciones con varianzas iguales σ 2. Sea N
el tamaño muestral total, de manera que N=n1+ n2 +…+n k sean SSA y SSE
Suma de cuadrados entre y dentro de los grupos respectivamente. Entonces
dos estimaciones para σ 2 son las siguientes.

Cuadrado medio entre los grupos (o del tratamiento)

SSA
MSA=
K−1

Cuadrado medio dentro de los grupos (o del tratamiento)

SSE
MSE=
N −K

Teorema: (contraste de hipótesis para el análisis de varianza de un factor)


Supongamos que tenemos muestras aleatorias independientes de
n1 , n2 , n3 , … , n k observaciones de k poblaciones. Sea N el tamaño muestral total
de manera que:
N=n1+ n2 +…+n k

Si representamos las medias poblacionales por μ1 , μ 2 , μ3 , … , μ k, entonces la


hipótesis nula a contrastar será que las k medias poblacionales son iguales,
decir
H 0 :μ 1=μ2=μ3 =…=μ k

H 1 : Al menos dos medias son diferentes

Dado esto, si las distribuciones poblacionales son normales con las mismas
varianzas, entonces el estadístico de prueba:
MSA
F=
MSE

Tiene distribución Fisher con v1 =k−1 y v 2=N−K y la hipótesis nula se


rechaza al nivel de significancia F> F α

Tabla de Anova de un factor

Fuente de Suma de Grados de Cuadrado Razón F


variación cuadrados libertad medio
Tratamientos SSA k −1 SSA MSA
MSA= F=
(entre grupos) K−1 MSE

Tratamientos SSE N−k SSE


MSE=
(dentro de N −K
grupos)
Total SST N−1

Ejemplo
La siguiente tabla muestra los porcentajes (en microgramos) de una droga
para tres grupos de enfermos mentales. Deseamos saber si se puede concluir
con base en estos datos, que los valores medios no son iguales en todos los
tres grupos. Utilice un α =0,05 y suponga que las poblaciones son normales
con las mismas varianzas.
Grupo I Grupo II Grupo III
0,66 0,65 0,93
0,63 0,60 0,99
0,65 0,69 0,96
0,69 0,73 0,74
0,44 0,52 0,81
0.63 0,85 0,93
0,61 0,81 0,63
0,42 0,68
0,59 0,99
0,46 Total
Tamaño n1 =¿ n2 =¿ n3 =¿ N=¿
Sumas T 1=¿ T 2=¿ T 3=¿ T=
ý 1=¿ ý 2=¿ ý 3=¿ ý =

Solución
Sea μi el porcentaje promedio (poblacional) de la droga aplicada a los
enfermos mentales del grupo i donde i=I, II, III
H 0 :μ 1=μ2=μ3

H 1 : Al menos dos medias son diferentes

Luego hallamos la suma de cuadrados


k ni
2 T2
SST =∑ ∑ y ij − =¿
j =1 i=1 N
k
T 2j T 2
SSA=∑ − =¿
j =1 n j N

SSE=SST −SSA=¿

Luego se calculan las estimaciones de los cuadrados medios


Cuadrado medio entre los grupos (o del tratamiento)
SSA
MSA=
K−1

Cuadrado medio dentro de los grupos (o del tratamiento)


SSE
MSE=
N −K

Conclusión:

Ejercicio en clase

1. Los siguientes datos resultaron de un experimento que compara los


grados de manchas en un tejido con tres mezclas diferentes de un
ácido. Utilice un nivel de significancia del 1% para determinar si el
promedio real de grado de manchas es idéntico para las tres mezclas.
Suponga que las poblaciones en cuestión son normales con las mismas
varianzas.

Mezcla Mezcla Mezcla


I II III
0,56 0,72 0,62
1,12 0,69 1,08
0,90 0,87 1,07
1,07 0,78 0,99
0,94 0,91 0,33

2. Para indagar si la media del tiempo que se necesita para mezclar un


lote de materiales es igual en máquinas de tres marcas, una compañía
obtuvo los tiempos (en minutos) necesarios para la mezcla.
A partir de ellos investigue si las medias poblacionales de los tiempos
para mezclar un lote de material son distintos al usar máquinas de tres
marcas. Suponga que las poblaciones en cuestión son normales, con
las mismas varianzas y use un nivel de significancia del 5%
Marca 1 20 19 23
Marca 2 28 26 31
Marca 3 20 26 24

También podría gustarte