Está en la página 1de 7

C3.

7
Utilice los datos del archivo MEAP93.RAW para responder esta pregunta.

i) Estime el modelo (visto en el ejemplo 2.12):

y dé los resultados en la forma usual, incluyendo el tamaño de la muestra y


la R-cuadrada. ¿Son los signos de los coeficientes de pendiente los que usted
esperaba? Explique.

Figura 1: regresión math10=logexpend+lnchprg


Elaborado por autor

El tamaño de la muestra es de 408 estudiantes. El modelo tiene significancia global y las


variables lexpend y lnchprg explican un 17.59% a math10. Todos los betas tienen
significancia individual al 5%.

El signo de lnchprg no lo esperaba negativo, a priori, se esperaba que la relación entre el


porcentaje de estudiantes beneficiados con el desayuno escolar (lnchprg) y el porcentaje
de estudiantes que aprueban el examen de matemáticas (math10) sea positiva.

De igual manera, esperaba que el signo de lexpend sea positivo. En este caso si se cumple.
Es de esperar que, a mayor gasto (lexpend), mayor el porcentaje de estudiantes que
aprueban el examen (math10).
ii) ¿Qué piensa del intercepto estimado en el inciso i)? en particular, ¿tiene
sentido igualar a cero las dos variables explicativas? [Sugerencia: recuerde
que log(1)=0.]

El intercepto es -20.36. Si tiene sentido, porque indica que si no se gasta en los estudiantes
y no hay desayuno escolar, el porcentaje de estudiantes que aprueban disminuye en
20.36%.

iii) Ahora corra la regresión simple de math10 sobre log(expend) y compare


el coeficiente de pendiente con la estimación obtenida en el inciso i). ¿Es ahora
el efecto estimado de los gastos por estudiante mayor o menor que en el inciso
i)?

Figura 2: regresión math10=logexpend


Elaborado por autor

El coeficiente de pendiente en este caso es 11.16 contra 6.23 del inciso i) subió
considerablemente. Es mayor ahora el efecto de los gastos por estudiante sobre math10.

iv) Determine la correlación entre lexpend = log(expend) y lnchprg. ¿Le


parece razonable el signo?
Figura 3: correlación lexpend lnchprg
Elaborado por autor

Es incoherente este signo, porque a mayor gasto se espera que haya mayor porcentaje de
estudiantes beneficiados, debería ser positivo.

v) Use el inciso iv) para explicar sus hallazgos del inciso iii).

En el inciso iii) el valor de la pendiente subió al eliminarse la variable lnchprg. Esto se


debe a que se quita la relación negativa de lnchprg tiene sobre math10.

C3.8 Utilice la base de datos DISCRIM.RAW para responder esta pregunta. Hay
datos sobre los precios de diversos artículos de restaurantes de comida rápida
situados en zonas con distinto código postal, así como características de la población
residente en dicho código, pertenecientes a Nueva Jersey y Pennsylvania. La idea es
ver si los restaurantes de comida rápida tienen precios más altos en áreas con mayor
concentración de población afroestadounidense.

i) Determine los valores promedio, en la muestra, de prpblck (proporción


de afroestadounidenses) y de income (ingreso familiar medio), junto con
sus desviaciones estándar. ¿Cuáles son las unidades de prpblck y de
income?

Figura 4: estadísticas prpblck e income


Elaborado por autor
prpblck media: 0.1134864
desviación estándar: 0.1824165

income media: 47053.78


desviación estándar: 13179.29

ii) Considere un modelo para explicar el precio de las bebidas refrescantes,


psoda, en términos de la proporción de población afroestadounidense y
de ingreso medio:

Estime este modelo mediante MCO y dé los resultados en forma de


ecuación incluyendo el tamaño de la muestra y la R-cuadrada (No use
notación científica al dar las estimaciones). Interprete el coeficiente de
prpblck. ¿Considera que es grande desde el punto de vista económico?

Figura 5: regresión psoda=prpblck + income


Elaborado por autor

𝑃𝑠𝑜𝑑𝑎 = 0.9563 + 0.1149882 𝑝𝑟𝑝𝑏𝑙𝑐𝑘 + 0.0000016 𝑖𝑛𝑐𝑜𝑚𝑒 + 𝜇


Muestra= 401
R-cuadrado ajustado= 0.0642
El coeficiente de prpblck es de 0.115 aproximadamente, lo cual indica que si la
proporción de afroestadounidenses aumenta en 1, el precio de las bebidas refrescantes
aumenta en 11 centavos, el aumento de precio es muy alto.

iii) Compare la estimación del inciso ii) con la estimación mediante regresión
simple de psoda sobre prpblck. ¿Es el efecto de la discriminación mayor
o menor cuando se controla el ingreso?

Figura 6: psoda=prpblck
Elaborado por autor

En este caso la afectación disminuye a 0.0649 es casi la mitad del resultado del inciso ii),
el resultado es mejor, hay menos discriminación si no se toma en cuenta el ingreso.

iv) Un modelo con una elasticidad constante del precio respecto al ingreso
puede ser más apropiado. Proporcione las estimaciones del modelo.

Si prpblck aumenta en .20 (20 puntos porcentuales), ¿cuál es el cambio


porcentual estimado para psoda? (Sugerencia: la respuesta es 2.xx, usted
tiene que dar las “xx”.)
Figura 7: lpsoda = prpblck + lincome
Elaborado por autor

log( 𝑃𝑠𝑜𝑑𝑎) = −0.793768 + 0.121583 𝑝𝑟𝑝𝑏𝑙𝑐𝑘 + 0.07655114 log(𝑖𝑛𝑐𝑜𝑚𝑒) + 𝜇


Si prpblack aumenta en 0.2 lpsoda aumenta en:
0.2 (0.121583)*100= 2.43%

v) Agregue ahora la variable prppov (proporción de personas en pobreza) a

la regresión del inciso iv). ¿Qué pasa con ?

Figura 8: regresión lpsoda = prpblck + lincome + prppov


Elaborado por autor

El β de prpblck disminuye a 0.0728072, es decir, ahora, si la proporción de


afroestadounidenses aumenta en 1, el precio aumenta en 7.28%. Ahora el aumento es
menor.
vi) Encuentre la correlación entre log(income) y prppov. ¿Es
aproximadamente lo que esperaba?

Figura 9: correlación lincome prppov


Elaborado por autor

Si es lo que esperaba, porque si aumenta el ingreso es de esperarse que la proporción de


personas pobres disminuya. Entonces, si es de esperar que sea un signo negativo y que su
coeficiente sea alto.

vii) Evalúe la afirmación siguiente: “como log(income) y prppov están


fuertemente correlacionadas, no tiene caso que estén en la misma
regresión”.

Como log (income) y prppov están fuertemente correlacionadas es de esperar que exista
autocorrelación, multicolinealidad, que no haya endogeneidad en el modelo y por ende,
este no sea el adecuado.