Está en la página 1de 6

Econometrı́a 1 - Evaluación 1 - Pauta de resolución

Ingenierı́a Comercial, FAE - UDP

Profesor: Marcela Perticara

Martes, 18 de Abril de 2023

Ejercicio 1 (25 puntos). Para estudiar la capacidad respiratoria de niños se recogen datos
de 654 niños de entre 6 y 10 años. La variable de interés es la fuerza de exhalación (FE),
una medida de cuánto aire alguien puede expulsar de sus pulmones. La variable explicativa
es la edad de los niños que está medida en años cumplidos (los niños menores de 12 meses,
tienen un cero en esta varible). Se estima el siguiente modelo F Ei = β0 + β1 edadi + ui ,
obteniéndose estos resultados.

----------------------------
FE
----------------------------
Edad .222041***
(.0075185)
Constante .4316481***
(.0778954)
----------------------------
Observaciones 654
R-cuadrado 0.57
----------------------------
Errores estándares entre paréntesis
* p<0.05, ** p<0.01, *** p<0.001

a) Interprete el coeficiente para la Constante. Comente su signo y su magnitud.


Respuesta: La constante en este modelo representa el valor esperado para la variable
dependiente para un niño con edad igual a cero (menor a un año). En este caso, el
valor estimado para la constante es 0.43. Esto se interpreta como que, todo el resto
constante, mis estimaciones predice que un niño menor a un año tendrá una fuerza de
exhalación promedio igual a 0.43 unidades.

1
b) Interprete el coeficiente de la variable edad. Comente su signo y magnitud. [Ayuda:
puede hablar en genérico de ”unidades de fuerza de exhalación”]
Respuesta: La pendiente en este modelo nos indica, todo el resto constante, cómo
cambiará la fuerza de exhalación con la edad. El coeficiente es positivo: la fuerza de
exhalación aumenta con la edad. ¿En cuánto? Todo el resto constante, según nuestras
estimaciones, cada año de edad aumentará la fuerza de exhalación en 0.22 unidades.

c) Usando un nivel de significancia del 5%, realice un test de significancia sobre el


coeficiente de la variable edad. ¿Qué concluye?
Respuesta. Notar que entre paréntesis se dan los errores estándares (lo dice al pie de la
tabla). El estadı́stico t estará dado por t = β̂1 /es(β̂1 ). En este caso es .4316481/.0778954=5.541381134
El valor observado del estadı́stico es mayor que el valor crı́tico para un nivel de
significancia del 5% (test de dos colas): 1.96. Entonces se rechaza la hipótesis nula
que el coeficiente es cero. La variable edad es una variable significativa. Muchos de
ustedes hicieron el test, pero no interpretaron, no pusieron la conclusión. O me dice
”se rechaza la hipótesis nula”, pero ni siquiera la plantean.

d) Un colega suyo estima un modelo alternativo, log(F Ei ) = γ0 + γ1 edadi + ui , y obtiene


los siguientes resultados

----------------------------
FE
----------------------------
Edad .0870833***
(.0028091)
Constante .050596***
(.029104)
----------------------------
Observaciones 654
R-cuadrado 0.59
----------------------------
Errores estándares entre paréntesis
* p<0.05, ** p<0.01, *** p<0.001

Interprete el coeficiente estimado para la variable edad en este nuevo modelo.


Respuesta: La pendiente en este modelo nos indica, todo el resto constante, en qué
porcentaje aproximadamente cambiará la fuerza de exhalación cuando la edad aumente
en una unidad. El coeficiente es positivo: la fuerza de exhalación aumenta con la edad.
¿En cuánto? Todo el resto constante, nuestra estimación indica que con cada año
de edad aumentará la fuerza de exhalación en aproximadamente en 8.7%. El cálculo
exacto es
(e0.0870833 − 1) ∗ 100 = 9.1%

2
e) Note que en ambas estimaciones el R2 está en torno a 0.6. Inteprete esta medida
para ambos modelos. ¿Puede comparar las estimaciones encontradas en los apartados
(a) y (c) usando esta medida? Si no puede compararlas explique la razón; si puede
compararlas, realice la comparación.
Respuesta: tal como discutimos en clase, el R2 mide la fracción de la varianza de la
variable dependiente que es explicada por la varianza de la variable explicativa o por
el modelo. En nuestro caso si el R2 de cada uno de los modelos es aproximadamente
0.6, esto significa que la variable edad explica el 60% de la varianza total de la variable
FE, lo que es un ajuste más que razonable. El modelo semi-logaritmico tiene un R2
ligeramente mayor, pero es importante notar que no podemos decir qeu tiene mejor
ajuste, por que por que la variable dependiente entre ambos modelos es distinta, y
entonces estamos calculando el R2 basado en medidas distintas. SAbemos incluso que
la la SCT del modelo logaritmico es menor, ya qeu la funcion logaritmo comprime el
rango de varianción de las variables. Esto es, cada R2 se calcula sobre una suma de
cuadrados totales distinta.

Ejercicio 2 (20 puntos). Responda si cada una de las siguientes afirmaciones es Verdadera,
Falsa o Incierta y justifique su respuesta.

a) (5 puntos) En cualquier modelo de regresión simple que tiene la variable dependiente


expresadas en logaritmos, el coeficiente de la variable explicativa se interpreta como
una elasticidad.
Respuesta: Falso, ya que depende de las unidades de medida de la variable explicativa
también. Para que el coeficiente de la variable explicativa exprese una elasticidad,
ambas variables deben estar expresadas en logaritmos. Es importante recalcar que
muchos de ustedes hablan de ”modelo elástico”, o ”modelo semieslástico”; no sé de
dónde salieron estos conceptos..... En el modelo log-log el coeficiente de la variable
explicativa refleja la elasticidad de y con respecto a x. Pero ni el modelo es elástico ni
la viable explicativa es elástica o refleja la elasticidad, como algunos sostienen.

b) Juan estima la demanda por telefonı́a fija, en base a una muestra de 50 mil hogares.
Obtiene un R-cuadrado de 0.05, por lo que concluye que su modelo no es bueno.
Respuesta: Verdadero si pensamos en la capacidad predictiva del modelo. Juan tiene
razón por cuanto el R2 de esta regresión es muy bajo. El modelo explica sólo el 5% de
la varianza total de la variable dependiente. Podemos concluir entonces, que nuestra
única variable no es un buen predictor de la demanda por telefonı́a fija. Pero, notar,
sin embargo, que esto no significa que nuestro estimador no es un buen estimador del
efecto causal; sólo que hay una alta fracción de la varianza de la variable dependiente
que no es explicada por la variable explicativa, sino por otros factores. La viable x
puede ser una variable relevante, y su coeficiente puede estar estimando correctamenten
el efecto causal de x sobre y.

3
c) En el Modelo de Regresión Lineal Simple el estimador de Mı́nimos Cuadrados Ordinarios
(MCO) de la pendiente (β1 ) tendrá mayor varianza mientras mayor sea la varianza de
la variable explicativa.
Respuesta: Falso. La varianza del estimador de la pendiente en el modelo de regresión
2 σ2
está dada por V (β̂1 |xi ) = PN σ(x −x̄)2 = (N −1)S 2. Entonces, la varianza de β̂1 será
i=1 i i
PN
(x −x̄)2
menor mientras mayor sea la varianza de la variable explicativa (Si2 = i=1 i
(N −1)
).
Error de muchos, es pensar que estabamos preguntando lo mismo que preguntamos en
un ejercicio de un examen anterior, cuando preguntábamos qué pasaba con la V ar(β̂1 )
cuando la varianza de y aumentaba o algo similar.

d) Se ha estimado por Mı́nimos Cuadrados Ordinarios el modelo Yi = β0 + β1 xi + ui . Se


mide la bondad de ajuste del modelo y se encuentra un valor para el R2 igual a -0.2.
Su colega le dice que esto no es posible, por que el R2 nunca puede ser negativo.
Respuesta: Verdadero. El R2 está entre cero y uno siempre, si estamos usando un
modelo de regresión lineal, estamos usando MCO para estimar los parámetros del
modelo y el modelo tenga una ordenada al origen. Todo esto está especificado en el
enunciado y se cumple en nuestro ejemplo; entonces, tiene que ser un error. Si hemos
estimado este modelo lineal por MCO y hemos incluido una ordenada al origen, el
R2 nunca puede ser negativo. Este investigador ha incurrido en algún error cuando
estimó el R2 o tal vez las estimaciones no se obtuvieron usando M CO o el modelo
no tiene constante. Muchos argumentaron que esto NUNCA podı́a ser, sin explicar
mucho más por que el R2 nunca podı́a ser negativo. En estos casos puse puntaje
parcial, pero no completo. Si me definı́an mal el R2 , consideraba mal la pregunta.
Varios estudiantes confunden variable explicada con variable explicativa, y proveen
definiciones incorrectas del R2 .

Ejercicio 3 (20 puntos). Se está haciendo un estudio sobre el nexo que hay entre el
desempeño en la PAES y el ranking de notas en la enseñanza secundaria. A continuación se
presentan las primeras ocho observaciones de una base de datos que contiene los resultados
obtennidos en la Prueba de Acceso a la Educación Superior (PAES) y el Ranking para 1500
estudiantes que tomaron la PAES en el año 2022.

Estudiante PAES Ranking


1 850 6.5
2 640 5.8
3 610 5.6
4 560 5.9
5 450 6.2
6 630 6.1
7 570 6.4
8 780 5.3

4
La variables Ranking representa el promedio de notas de enseñanza media, el cual es
medido en una escala de notas de 4.0 a 7.0. PAES representa la Prueba de Acceso a la
Educación Superior, la cual es medida de 100 a 1.000 puntos.

a) (2 puntos) Escriba el modelo que permita estudiar el efecto que tiene el Ranking
sobre la PAES.
Respuesta: El modelo a estimar será P AESi = β0 + β1 Rankingi + ϵi . Notar que si
escriben que el modelo estimado es P AESi = β0 + β1 Rankingi , está mal por que falta
ˆ i = β̂0 + βˆ1 Rankingi , lo consideré bien, aunque no es lo
el residuo. Si escriben P AES
que pido.

b) (8 puntos) Su colega estima el modelo usando los 1500 datos y obtiene un coeficiente
estimado para la variable ranking igual a -35.28. El valor del intercepto estimado es
847.05. Interprete ambos coeficientes.
Respuesta: En este caso, estamos estimando un efecto del ranking sobre la PAES
y estamos encontrando un efecto negativo, lo que es contraintuitivo. Todo el resto
constante, entonces, nuestro modelo predice que un aumento en el ranking de un punto
reducirá el puntaje en la prueba PAES en 35.28 puntos. No tiene mucho sentido. La
ordenada al origen es el valor de la prueba PAES para un estudiante que tiene ranking
cero, lo que no tiene mucho sentido. Pero como le pido interpretarlo, me deberı́an
decir que todo el resto constante mi estimación predice que la P AES experada de un
estudiante con cero raking será 847.05. Aquı́ hay muchos errores, algunos seguramente
por nerviosismo, otros por que no se comprende los contenidos. Nuevamente me dicen
que P AES es la variable explicativa, cuando claramnete se están refiriendo a la variable
explicada. Cuando interpretan β0 , me dicen que nos da el valor esperado para P AES
cuando β1 = 0, cuando deberı́an decir que es para cuando ranking = 0.

c) (5 puntos) Para el coeficiente de la variable ranking su colega le reporta un error


estándar estimado igual a 126.3026. Usando un nivel de significancia del 5% evalúe la
significancia de éste coeficiente. ¿Qué concluye?
Respuesta: La hipótesis nula es que el coeficiente de ranking es cero, versus la alternativa
que es distinto de cero. El estadı́stico t estará dado por t = β̂1 /es(β̂1 ). En este caso
es -35.28/126.3026=-0.279329167. El valor observado del estadı́stico cae en zona de
no rechazo por que está entre -1.96 y 1.96 los valores crı́ticos para un test de dos
colas y un nivel de significancia del 5%. Entonces no puede rechazarse la hipótesis
nula que el coeficiente es cero. La variable ranking no es una variable significativa.
Esto es consistente con lo que encontraremos en el punto d cuando calculemos un R2
extremadamente bajo.

5
d) (5 puntos) Usted no está muy convencido sobre la bondad de ajuste del modelo. Su
colega le pide calcular el R2 . Para ésto le informa que la Suma de Cuadrados Residual
obtenida es igual a 110549.787, mientras que la suma de cuadrados explicada es igual
a 1437.71307. Calcule e interprete el R2 del modelo estimado.
Respuesta: Notemos que el coeficiente de determinación o R2 se calcula como:

SCE SCR
R2 = =1− .
ST C ST C

Con ST C = N 2
total de cuadrados); SCE = N 2
P P
i=1 (yi − ȳ) (sumaP i=1 (ŷi − ȳ) (suma
de cuadrados explicada); SCR = N 2
i=1 ûi (suma de cuadrados residual)

Sabemos además que ST C = SCE+SCR, y entonces SCT = 110549.787+1437.71307 =


111987.50. Entonces
1437.71307
R2 = 111987.50
= 0.012838157
Efectivamente la variable ranking en este caso no explica una gran proporción de la
varianza total de la variable dependiente PAES. La varianza de la variable ranking
explica sólo el 1.2% de la varianza total de la variable PAES. Es importante notar,
que muchos alumnos no definen o interpretan correctamente el R2 o ni siquiera lo
intentan. Dejan planteado su cálculo y no explican nada mal o lo hacen de una manera
incorrecta. En estos casos se asignó puntaje parcial.

También podría gustarte