Está en la página 1de 6

Análisis de la varianza

Guía de ejercicios

Prof. Alejandro Nasif Salum

1. Para estudiar el ritmo de avance de los/as alumnos/as de tres carreras


de la UBA (que para evitar sesgos en el análisis los/as investigadores/as
denominaron simplemente A, B y C), se tomaron estudiantes al azar
de cada una de ellas con al menos dos años de antigüedad y se contó
la cantidad de materias aprobadas durante los dos primeros años. La
cantidad de materias aprobadas en ese tiempo para n1 = 6 estudiantes
de la carrera A, n2 = 5 estudiantes de la carrera B y n3 = 6 estudiantes
de la carrera C, se muestran en la siguiente tabla.

A 12 8 9 11 8 7
B 11 6 10 11 8 -
C 14 11 13 12 15 10

a) Si se supone que la cantidad de materias para la j-ésima ob-


servación de la i-ésima carrera es una variable aleatoria Xi,j ∼
N (µi , σ 2 ), independiente de las demás observaciones, contrastar
la hipótesis de que la cantidad esperada de materias aprobadas en
los dos primeros años es igual para las tres carreras, es decir,

H0 : µ1 = µ2 = µ3

contra la hipótesis alternativa de que esto no es cierto. Responder


para un α de 10 %, 5 % y 1 % (se sugiere calcular el p-valor).
b) ¿Qué cuestionamiento se le puede hacer al supuesto de normalidad
en este caso?

2. Si se concluyera para el ejercicio anterior que no vale el supuesto de


normalidad, ¿qué test se podría aplicar y cuál sería la conclusión (α =
0,05)?

3. Se cuenta con los siguientes datos de 4 muestras aleatorias indepen-


dientes entre sí.

1
2
P P P
Grupo ni Xi,j
j Xi,j
j j R(Xi,j )
A 25 263,1 2866 1393
B 30 332,2 3781 1887
C 35 467,8 6355 3270
D 30 240,2 2008 710

Contrastar la hipótesis

H0 : µA = µB = µC = µD

contra la alternativa de que existe un par de medias distintas al menos,


con α = 5 % y

a) suponiendo que cada muestra proviene de una distribución normal;


b) sin suponer distribución normal;

¿Qué otros supuestos son necesarios en cada caso?

4. En un estudio regional sobre ingresos y gastos de las familias se evaluó la


proporción del ingreso anual aplicada al consumo en grupos familiares
de 10 países latinoamericanos. Parte de la información se resume en
una tabla de ANOVA de la cual varios datos fueron accidentalmente
borrados, a saber:

SC GL CM Ftest p
Entre
Dentro 0,076 − −
Total 10,3 109 − − −

Completar la tabla y concluir con nivel α = 0,05 si es sostenible la


hipótesis de que las propensiones a consumir son iguales en todos los
países estudiados.

5. Para estudiar la facturación semanal (en miles de pesos) de una cadena


de almacenes en una ciudad de la Costa Atlántica, y teniendo en cuenta
las posibles variaciones estacionales, se observaron para cada una de tres
sucursales las facturaciones de cuatro semanas al azar, de las cuales una
corresponde a la temporada de «primavera», otra a la temporada de
«verano», otra al «otoño» y la cuarta al «invierno», en cada caso. Se
obtuvieron así las doce observaciones que se muestran a continuación.

2
I II III
P 14,4 21,2 9,8
V 15,1 21,5 10,2
O 14,8 22,0 8,9
I 13,6 23,4 11,2

Contrastar (α = 0, 05) la hipótesis de que las facturaciones semanales


promedio son iguales para las tres sucursales, explicitando los supuestos
realizados.

6. En un estudio sobre consumos con tarjeta de crédito se estudia el saldo


a pagar de los resúmenes mensuales de 36 clientes de tarjetas. Los clien-
tes se clasifican por empresa («Master Card», «American Express» y
«Visa») y por categoría («Black», «Platinum», «Gold» y «Plus»). Para
cada una de las doce posibles combinaciones se eligieron tres resúmenes
al azar y se obtuvieron los siguientes resultados:

Master American Visa


9.5 19.8 11.7
Black 8.4 15.1 9.8
11.8 12.5 10.9
9.1 17.9 10.6
Platinum 12.7 18.4 10.7
11.1 16.1 13.5
7.4 16.5 5.1
Gold 11.7 12.2 9.0
7.3 13.6 5.8
3.5 6.7 5.3
Plus 7.6 6.4 2.7
7.1 7.2 5.8

a) Contrastar (α = 0, 05) la hipótesis de que los saldos a pagar pro-


medio de las tres empresas son iguales, explicitando los supuestos
realizados.
b) Contrastar (α = 0, 05) la hipótesis de que los saldos a pagar pro-
medio de las cuatro categorías son iguales, explicitando los su-
puestos realizados.
c) Analizar gráficamente la existencia o no de efectos cruzados (es
decir, si es razonable suponer un modelo aditivo).

3
d ) Contrastar (α = 0, 05) la hipótesis de que no existen efectos cruza-
dos entre empresa y categoría y comparar con el análisis del ítem
anterior.

7. (*) El modelo de ANOVA de un solo factor con K categorías puede


expresarse diciendo que los valores observados
xi,j , 1 ≤ i ≤ K, 1 ≤ j ≤ Ni
se pueden considerar como realizaciones de las variables aleatorias Xi,j
que definimos como
Xi,j = α0 + αi + ei,j ,
donde para que el modelo esté bien determinado, agregamos la condi-
ción
XK
αi = 0,
i=1

y donde cada ei,j es una variable aleatoria no observable (que en el


modelo clásico tiene distribución N (0, σ 2 ), y todas estas variables alea-
torias son independientes entre sí).
Por ejemplo, si K = 2, N1 = 3 y N2 = 2, tenemos N = N1 + N2 = 5
variables a observar y
X1,1 = α0 + α1 + e1,1 ,
X1,2 = α0 + α1 + e1,2 ,
X1,3 = α0 + α1 + e1,3 ,
X2,1 = α0 + α2 + e2,1 ,
X2,2 = α0 + α2 + e2,2 .

Definimos el vector de parámetros α = (α0 , α1 , . . . , αK ), que estimare-


mos con
α̂ = (α̂0 , α̂1 , . . . , α̂K ).

Definimos también los residuos


êi,j = Xi,j − α̂0 − α̂i ,
y a partir de ellos resulta natural definir el estimador de mínimos cua-
drados de α —que notamos α̂M C — como el vector α̂ que minimiza
X Ni
K X Ni
K X
X
S(α̂) = ê2i,j = (Xi,j − α̂0 − α̂i )2 ,
i=1 j=1 i=1 j=1

4
sujeto a la restricción
K
X
α̂i = 0.
i=1

Volviendo al ejemplo dado más arriba, tendríamos que minimizar en


α̂0 , α̂1 y α̂2 la función

S(α̂0 , α̂1 , α̂2 ) = (X1,1 − α̂0 − α̂1 )2 +(X1,2 − α̂0 − α̂1 )2 +(X1,3 − α̂0 − α̂1 )2 +

+(X2,1 − α̂0 − α̂2 )2 + (X2,2 − α̂0 − α̂2 )2


sujeta a la condición
α̂1 + α̂2 = 0.

a) Hallar el estimador de mínimos cuadrados de α = (α0 , α1 , α2 )


para el ejemplo dado usando el método de los multiplicadores de
Lagrange.
b) Hallar las condiciones de primer orden del problema de minimiza-
ción con restricciones en el caso general (en base al método de los
multiplicadores de Lagrange), y verificar que dichas condiciones
se cumplen si
K Ni
1 XX ¯
α̂0 = Xi,j = X̄ ..
N i=1 j=1
y
Ni
1 X ¯ = X̄ − X̄
¯ ,
α̂i = Xi,j − X̄ .. i. .. 1 ≤ i ≤ K.
Ni j=1

c) Verificar que esto coincide con las conclusiones del caso particular
del punto a).

8. (*) Alternativamente, el modelo de ANOVA unifactorial puede expre-


sarse como
Xi,j = αi + ei,j ,
con las mismas definiciones que en el ejercicio anterior pero sin esta-
blecer ninguna restricción adicional.

a) Hallar los estimadores de mínimos cuadrados de los parámetros


αi si los residuos se definen como

êi,j = Xi,j − α̂i .

5
b) Hallar los estimadores de máxima verosimilitud de αi y de σ 2
bajo el supuesto de que ei,j ∼ N (0, σ 2 ). (Observación: el supuesto
implica que Xi,j ∼ N (αi , σ 2 ).)

También podría gustarte