Prueba 1 2023 Semestre 1 Sección MP

Econometrı́a 1 - Evaluación 1 - Pauta de resolución
Ingenierı́a Comercial, FAE - UDP
Profesor: Marcela Perticara
Martes, 18 de Abril de 2023
Ejercicio 1 (25 puntos). Para estudiar la capacidad respiratoria de niños se recogen datos
de 654 niños de entre 6 y 10 años. La variable de interés es la fuerza de exhalación (FE),
una medida de cuánto aire alguien puede expulsar de sus pulmones. La variable explicativa
es la edad de los niños que está medida en años cumplidos (los niños menores de 12 meses,
tienen un cero en esta varible). Se estima el siguiente modelo F Ei = β0 + β1 edadi + ui ,
obteniéndose estos resultados.
----------------------------
FE
----------------------------
Edad .222041***
(.0075185)
Constante .4316481***
(.0778954)
----------------------------
Observaciones 654
R-cuadrado 0.57
----------------------------
Errores estándares entre paréntesis
* p<0.05, ** p<0.01, *** p<0.001
a) Interprete el coeficiente para la Constante. Comente su signo y su magnitud.

Respuesta: La constante en este modelo representa el valor esperado para la variable
dependiente para un niño con edad igual a cero (menor a un año). En este caso, el
valor estimado para la constante es 0.43. Esto se interpreta como que, todo el resto
constante, mis estimaciones predice que un niño menor a un año tendrá una fuerza de
exhalación promedio igual a 0.43 unidades.
1
b) Interprete el coeficiente de la variable edad. Comente su signo y magnitud. [Ayuda:
puede hablar en genérico de ”unidades de fuerza de exhalación”]
Respuesta: La pendiente en este modelo nos indica, todo el resto constante, cómo
cambiará la fuerza de exhalación con la edad. El coeficiente es positivo: la fuerza de
exhalación aumenta con la edad. ¿En cuánto? Todo el resto constante, según nuestras
estimaciones, cada año de edad aumentará la fuerza de exhalación en 0.22 unidades.
c) Usando un nivel de significancia del 5%, realice un test de significancia sobre el

coeficiente de la variable edad. ¿Qué concluye?
Respuesta. Notar que entre paréntesis se dan los errores estándares (lo dice al pie de la
tabla). El estadı́stico t estará dado por t = β̂1 /es(β̂1 ). En este caso es .4316481/.0778954=5.541381134
El valor observado del estadı́stico es mayor que el valor crı́tico para un nivel de
significancia del 5% (test de dos colas): 1.96. Entonces se rechaza la hipótesis nula
que el coeficiente es cero. La variable edad es una variable significativa. Muchos de
ustedes hicieron el test, pero no interpretaron, no pusieron la conclusión. O me dice
”se rechaza la hipótesis nula”, pero ni siquiera la plantean.
d) Un colega suyo estima un modelo alternativo, log(F Ei ) = γ0 + γ1 edadi + ui , y obtiene

los siguientes resultados
----------------------------
FE
----------------------------
Edad .0870833***
(.0028091)
Constante .050596***
(.029104)
----------------------------
Observaciones 654
R-cuadrado 0.59
----------------------------
Errores estándares entre paréntesis
* p<0.05, ** p<0.01, *** p<0.001
Interprete el coeficiente estimado para la variable edad en este nuevo modelo.

Respuesta: La pendiente en este modelo nos indica, todo el resto constante, en qué
porcentaje aproximadamente cambiará la fuerza de exhalación cuando la edad aumente
en una unidad. El coeficiente es positivo: la fuerza de exhalación aumenta con la edad.
¿En cuánto? Todo el resto constante, nuestra estimación indica que con cada año
de edad aumentará la fuerza de exhalación en aproximadamente en 8.7%. El cálculo
exacto es
(e0.0870833 − 1) ∗ 100 = 9.1%
2
e) Note que en ambas estimaciones el R2 está en torno a 0.6. Inteprete esta medida
para ambos modelos. ¿Puede comparar las estimaciones encontradas en los apartados
(a) y (c) usando esta medida? Si no puede compararlas explique la razón; si puede
compararlas, realice la comparación.
Respuesta: tal como discutimos en clase, el R2 mide la fracción de la varianza de la
variable dependiente que es explicada por la varianza de la variable explicativa o por
el modelo. En nuestro caso si el R2 de cada uno de los modelos es aproximadamente
0.6, esto significa que la variable edad explica el 60% de la varianza total de la variable
FE, lo que es un ajuste más que razonable. El modelo semi-logaritmico tiene un R2
ligeramente mayor, pero es importante notar que no podemos decir qeu tiene mejor
ajuste, por que por que la variable dependiente entre ambos modelos es distinta, y
entonces estamos calculando el R2 basado en medidas distintas. SAbemos incluso que
la la SCT del modelo logaritmico es menor, ya qeu la funcion logaritmo comprime el
rango de varianción de las variables. Esto es, cada R2 se calcula sobre una suma de
cuadrados totales distinta.
Ejercicio 2 (20 puntos). Responda si cada una de las siguientes afirmaciones es Verdadera,
Falsa o Incierta y justifique su respuesta.
a) (5 puntos) En cualquier modelo de regresión simple que tiene la variable dependiente

expresadas en logaritmos, el coeficiente de la variable explicativa se interpreta como
una elasticidad.
Respuesta: Falso, ya que depende de las unidades de medida de la variable explicativa
también. Para que el coeficiente de la variable explicativa exprese una elasticidad,
ambas variables deben estar expresadas en logaritmos. Es importante recalcar que
muchos de ustedes hablan de ”modelo elástico”, o ”modelo semieslástico”; no sé de
dónde salieron estos conceptos..... En el modelo log-log el coeficiente de la variable
explicativa refleja la elasticidad de y con respecto a x. Pero ni el modelo es elástico ni
la viable explicativa es elástica o refleja la elasticidad, como algunos sostienen.
b) Juan estima la demanda por telefonı́a fija, en base a una muestra de 50 mil hogares.
Obtiene un R-cuadrado de 0.05, por lo que concluye que su modelo no es bueno.
Respuesta: Verdadero si pensamos en la capacidad predictiva del modelo. Juan tiene
razón por cuanto el R2 de esta regresión es muy bajo. El modelo explica sólo el 5% de
la varianza total de la variable dependiente. Podemos concluir entonces, que nuestra
única variable no es un buen predictor de la demanda por telefonı́a fija. Pero, notar,
sin embargo, que esto no significa que nuestro estimador no es un buen estimador del
efecto causal; sólo que hay una alta fracción de la varianza de la variable dependiente
que no es explicada por la variable explicativa, sino por otros factores. La viable x
puede ser una variable relevante, y su coeficiente puede estar estimando correctamenten
el efecto causal de x sobre y.
3
c) En el Modelo de Regresión Lineal Simple el estimador de Mı́nimos Cuadrados Ordinarios
(MCO) de la pendiente (β1 ) tendrá mayor varianza mientras mayor sea la varianza de
la variable explicativa.
Respuesta: Falso. La varianza del estimador de la pendiente en el modelo de regresión
2 σ2
está dada por V (β̂1 |xi ) = PN σ(x −x̄)2 = (N −1)S 2. Entonces, la varianza de β̂1 será
i=1 i i
PN
(x −x̄)2
menor mientras mayor sea la varianza de la variable explicativa (Si2 = i=1 i
(N −1)
).
Error de muchos, es pensar que estabamos preguntando lo mismo que preguntamos en
un ejercicio de un examen anterior, cuando preguntábamos qué pasaba con la V ar(β̂1 )
cuando la varianza de y aumentaba o algo similar.
d) Se ha estimado por Mı́nimos Cuadrados Ordinarios el modelo Yi = β0 + β1 xi + ui . Se

mide la bondad de ajuste del modelo y se encuentra un valor para el R2 igual a -0.2.
Su colega le dice que esto no es posible, por que el R2 nunca puede ser negativo.
Respuesta: Verdadero. El R2 está entre cero y uno siempre, si estamos usando un
modelo de regresión lineal, estamos usando MCO para estimar los parámetros del
modelo y el modelo tenga una ordenada al origen. Todo esto está especificado en el
enunciado y se cumple en nuestro ejemplo; entonces, tiene que ser un error. Si hemos
estimado este modelo lineal por MCO y hemos incluido una ordenada al origen, el
R2 nunca puede ser negativo. Este investigador ha incurrido en algún error cuando
estimó el R2 o tal vez las estimaciones no se obtuvieron usando M CO o el modelo
no tiene constante. Muchos argumentaron que esto NUNCA podı́a ser, sin explicar
mucho más por que el R2 nunca podı́a ser negativo. En estos casos puse puntaje
parcial, pero no completo. Si me definı́an mal el R2 , consideraba mal la pregunta.
Varios estudiantes confunden variable explicada con variable explicativa, y proveen
definiciones incorrectas del R2 .
Ejercicio 3 (20 puntos). Se está haciendo un estudio sobre el nexo que hay entre el
desempeño en la PAES y el ranking de notas en la enseñanza secundaria. A continuación se
presentan las primeras ocho observaciones de una base de datos que contiene los resultados
obtennidos en la Prueba de Acceso a la Educación Superior (PAES) y el Ranking para 1500
estudiantes que tomaron la PAES en el año 2022.
Estudiante PAES Ranking

1 850 6.5
2 640 5.8
3 610 5.6
4 560 5.9
5 450 6.2
6 630 6.1
7 570 6.4
8 780 5.3
4
La variables Ranking representa el promedio de notas de enseñanza media, el cual es
medido en una escala de notas de 4.0 a 7.0. PAES representa la Prueba de Acceso a la
Educación Superior, la cual es medida de 100 a 1.000 puntos.
a) (2 puntos) Escriba el modelo que permita estudiar el efecto que tiene el Ranking
sobre la PAES.
Respuesta: El modelo a estimar será P AESi = β0 + β1 Rankingi + ϵi . Notar que si
escriben que el modelo estimado es P AESi = β0 + β1 Rankingi , está mal por que falta
ˆ i = β̂0 + βˆ1 Rankingi , lo consideré bien, aunque no es lo
el residuo. Si escriben P AES
que pido.
b) (8 puntos) Su colega estima el modelo usando los 1500 datos y obtiene un coeficiente
estimado para la variable ranking igual a -35.28. El valor del intercepto estimado es
847.05. Interprete ambos coeficientes.
Respuesta: En este caso, estamos estimando un efecto del ranking sobre la PAES
y estamos encontrando un efecto negativo, lo que es contraintuitivo. Todo el resto
constante, entonces, nuestro modelo predice que un aumento en el ranking de un punto
reducirá el puntaje en la prueba PAES en 35.28 puntos. No tiene mucho sentido. La
ordenada al origen es el valor de la prueba PAES para un estudiante que tiene ranking
cero, lo que no tiene mucho sentido. Pero como le pido interpretarlo, me deberı́an
decir que todo el resto constante mi estimación predice que la P AES experada de un
estudiante con cero raking será 847.05. Aquı́ hay muchos errores, algunos seguramente
por nerviosismo, otros por que no se comprende los contenidos. Nuevamente me dicen
que P AES es la variable explicativa, cuando claramnete se están refiriendo a la variable
explicada. Cuando interpretan β0 , me dicen que nos da el valor esperado para P AES
cuando β1 = 0, cuando deberı́an decir que es para cuando ranking = 0.
c) (5 puntos) Para el coeficiente de la variable ranking su colega le reporta un error

estándar estimado igual a 126.3026. Usando un nivel de significancia del 5% evalúe la
significancia de éste coeficiente. ¿Qué concluye?
Respuesta: La hipótesis nula es que el coeficiente de ranking es cero, versus la alternativa
que es distinto de cero. El estadı́stico t estará dado por t = β̂1 /es(β̂1 ). En este caso
es -35.28/126.3026=-0.279329167. El valor observado del estadı́stico cae en zona de
no rechazo por que está entre -1.96 y 1.96 los valores crı́ticos para un test de dos
colas y un nivel de significancia del 5%. Entonces no puede rechazarse la hipótesis
nula que el coeficiente es cero. La variable ranking no es una variable significativa.
Esto es consistente con lo que encontraremos en el punto d cuando calculemos un R2
extremadamente bajo.
5
d) (5 puntos) Usted no está muy convencido sobre la bondad de ajuste del modelo. Su
colega le pide calcular el R2 . Para ésto le informa que la Suma de Cuadrados Residual
obtenida es igual a 110549.787, mientras que la suma de cuadrados explicada es igual
a 1437.71307. Calcule e interprete el R2 del modelo estimado.
Respuesta: Notemos que el coeficiente de determinación o R2 se calcula como:
SCE SCR
R2 = =1− .
ST C ST C
Con ST C = N 2
total de cuadrados); SCE = N 2
P P
i=1 (yi − ȳ) (sumaP i=1 (ŷi − ȳ) (suma
de cuadrados explicada); SCR = N 2
i=1 ûi (suma de cuadrados residual)
Sabemos además que ST C = SCE+SCR, y entonces SCT = 110549.787+1437.71307 =

111987.50. Entonces
1437.71307
R2 = 111987.50
= 0.012838157
Efectivamente la variable ranking en este caso no explica una gran proporción de la
varianza total de la variable dependiente PAES. La varianza de la variable ranking
explica sólo el 1.2% de la varianza total de la variable PAES. Es importante notar,
que muchos alumnos no definen o interpretan correctamente el R2 o ni siquiera lo
intentan. Dejan planteado su cálculo y no explican nada mal o lo hacen de una manera
incorrecta. En estos casos se asignó puntaje parcial.

Prueba 1 2023 Semestre 1 Sección MP

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Prueba 1 2023 Semestre 1 Sección MP

Cargado por

Copyright:

Formatos disponibles

Econometrı́a 1 - Evaluación 1 - Pauta de resolución

Ingenierı́a Comercial, FAE - UDP

Profesor: Marcela Perticara

Martes, 18 de Abril de 2023

a) Interprete el coeficiente para la Constante. Comente su signo y su magnitud.

c) Usando un nivel de significancia del 5%, realice un test de significancia sobre el

d) Un colega suyo estima un modelo alternativo, log(F Ei ) = γ0 + γ1 edadi + ui , y obtiene

Interprete el coeficiente estimado para la variable edad en este nuevo modelo.

a) (5 puntos) En cualquier modelo de regresión simple que tiene la variable dependiente

d) Se ha estimado por Mı́nimos Cuadrados Ordinarios el modelo Yi = β0 + β1 xi + ui . Se

Estudiante PAES Ranking

c) (5 puntos) Para el coeficiente de la variable ranking su colega le reporta un error

Sabemos además que ST C = SCE+SCR, y entonces SCT = 110549.787+1437.71307 =

También podría gustarte