Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Prueba 1 2023 Semestre 1 Sección MP
Prueba 1 2023 Semestre 1 Sección MP
Ejercicio 1 (25 puntos). Para estudiar la capacidad respiratoria de niños se recogen datos
de 654 niños de entre 6 y 10 años. La variable de interés es la fuerza de exhalación (FE),
una medida de cuánto aire alguien puede expulsar de sus pulmones. La variable explicativa
es la edad de los niños que está medida en años cumplidos (los niños menores de 12 meses,
tienen un cero en esta varible). Se estima el siguiente modelo F Ei = β0 + β1 edadi + ui ,
obteniéndose estos resultados.
----------------------------
FE
----------------------------
Edad .222041***
(.0075185)
Constante .4316481***
(.0778954)
----------------------------
Observaciones 654
R-cuadrado 0.57
----------------------------
Errores estándares entre paréntesis
* p<0.05, ** p<0.01, *** p<0.001
1
b) Interprete el coeficiente de la variable edad. Comente su signo y magnitud. [Ayuda:
puede hablar en genérico de ”unidades de fuerza de exhalación”]
Respuesta: La pendiente en este modelo nos indica, todo el resto constante, cómo
cambiará la fuerza de exhalación con la edad. El coeficiente es positivo: la fuerza de
exhalación aumenta con la edad. ¿En cuánto? Todo el resto constante, según nuestras
estimaciones, cada año de edad aumentará la fuerza de exhalación en 0.22 unidades.
----------------------------
FE
----------------------------
Edad .0870833***
(.0028091)
Constante .050596***
(.029104)
----------------------------
Observaciones 654
R-cuadrado 0.59
----------------------------
Errores estándares entre paréntesis
* p<0.05, ** p<0.01, *** p<0.001
2
e) Note que en ambas estimaciones el R2 está en torno a 0.6. Inteprete esta medida
para ambos modelos. ¿Puede comparar las estimaciones encontradas en los apartados
(a) y (c) usando esta medida? Si no puede compararlas explique la razón; si puede
compararlas, realice la comparación.
Respuesta: tal como discutimos en clase, el R2 mide la fracción de la varianza de la
variable dependiente que es explicada por la varianza de la variable explicativa o por
el modelo. En nuestro caso si el R2 de cada uno de los modelos es aproximadamente
0.6, esto significa que la variable edad explica el 60% de la varianza total de la variable
FE, lo que es un ajuste más que razonable. El modelo semi-logaritmico tiene un R2
ligeramente mayor, pero es importante notar que no podemos decir qeu tiene mejor
ajuste, por que por que la variable dependiente entre ambos modelos es distinta, y
entonces estamos calculando el R2 basado en medidas distintas. SAbemos incluso que
la la SCT del modelo logaritmico es menor, ya qeu la funcion logaritmo comprime el
rango de varianción de las variables. Esto es, cada R2 se calcula sobre una suma de
cuadrados totales distinta.
Ejercicio 2 (20 puntos). Responda si cada una de las siguientes afirmaciones es Verdadera,
Falsa o Incierta y justifique su respuesta.
b) Juan estima la demanda por telefonı́a fija, en base a una muestra de 50 mil hogares.
Obtiene un R-cuadrado de 0.05, por lo que concluye que su modelo no es bueno.
Respuesta: Verdadero si pensamos en la capacidad predictiva del modelo. Juan tiene
razón por cuanto el R2 de esta regresión es muy bajo. El modelo explica sólo el 5% de
la varianza total de la variable dependiente. Podemos concluir entonces, que nuestra
única variable no es un buen predictor de la demanda por telefonı́a fija. Pero, notar,
sin embargo, que esto no significa que nuestro estimador no es un buen estimador del
efecto causal; sólo que hay una alta fracción de la varianza de la variable dependiente
que no es explicada por la variable explicativa, sino por otros factores. La viable x
puede ser una variable relevante, y su coeficiente puede estar estimando correctamenten
el efecto causal de x sobre y.
3
c) En el Modelo de Regresión Lineal Simple el estimador de Mı́nimos Cuadrados Ordinarios
(MCO) de la pendiente (β1 ) tendrá mayor varianza mientras mayor sea la varianza de
la variable explicativa.
Respuesta: Falso. La varianza del estimador de la pendiente en el modelo de regresión
2 σ2
está dada por V (β̂1 |xi ) = PN σ(x −x̄)2 = (N −1)S 2. Entonces, la varianza de β̂1 será
i=1 i i
PN
(x −x̄)2
menor mientras mayor sea la varianza de la variable explicativa (Si2 = i=1 i
(N −1)
).
Error de muchos, es pensar que estabamos preguntando lo mismo que preguntamos en
un ejercicio de un examen anterior, cuando preguntábamos qué pasaba con la V ar(β̂1 )
cuando la varianza de y aumentaba o algo similar.
Ejercicio 3 (20 puntos). Se está haciendo un estudio sobre el nexo que hay entre el
desempeño en la PAES y el ranking de notas en la enseñanza secundaria. A continuación se
presentan las primeras ocho observaciones de una base de datos que contiene los resultados
obtennidos en la Prueba de Acceso a la Educación Superior (PAES) y el Ranking para 1500
estudiantes que tomaron la PAES en el año 2022.
4
La variables Ranking representa el promedio de notas de enseñanza media, el cual es
medido en una escala de notas de 4.0 a 7.0. PAES representa la Prueba de Acceso a la
Educación Superior, la cual es medida de 100 a 1.000 puntos.
a) (2 puntos) Escriba el modelo que permita estudiar el efecto que tiene el Ranking
sobre la PAES.
Respuesta: El modelo a estimar será P AESi = β0 + β1 Rankingi + ϵi . Notar que si
escriben que el modelo estimado es P AESi = β0 + β1 Rankingi , está mal por que falta
ˆ i = β̂0 + βˆ1 Rankingi , lo consideré bien, aunque no es lo
el residuo. Si escriben P AES
que pido.
b) (8 puntos) Su colega estima el modelo usando los 1500 datos y obtiene un coeficiente
estimado para la variable ranking igual a -35.28. El valor del intercepto estimado es
847.05. Interprete ambos coeficientes.
Respuesta: En este caso, estamos estimando un efecto del ranking sobre la PAES
y estamos encontrando un efecto negativo, lo que es contraintuitivo. Todo el resto
constante, entonces, nuestro modelo predice que un aumento en el ranking de un punto
reducirá el puntaje en la prueba PAES en 35.28 puntos. No tiene mucho sentido. La
ordenada al origen es el valor de la prueba PAES para un estudiante que tiene ranking
cero, lo que no tiene mucho sentido. Pero como le pido interpretarlo, me deberı́an
decir que todo el resto constante mi estimación predice que la P AES experada de un
estudiante con cero raking será 847.05. Aquı́ hay muchos errores, algunos seguramente
por nerviosismo, otros por que no se comprende los contenidos. Nuevamente me dicen
que P AES es la variable explicativa, cuando claramnete se están refiriendo a la variable
explicada. Cuando interpretan β0 , me dicen que nos da el valor esperado para P AES
cuando β1 = 0, cuando deberı́an decir que es para cuando ranking = 0.
5
d) (5 puntos) Usted no está muy convencido sobre la bondad de ajuste del modelo. Su
colega le pide calcular el R2 . Para ésto le informa que la Suma de Cuadrados Residual
obtenida es igual a 110549.787, mientras que la suma de cuadrados explicada es igual
a 1437.71307. Calcule e interprete el R2 del modelo estimado.
Respuesta: Notemos que el coeficiente de determinación o R2 se calcula como:
SCE SCR
R2 = =1− .
ST C ST C
Con ST C = N 2
total de cuadrados); SCE = N 2
P P
i=1 (yi − ȳ) (sumaP i=1 (ŷi − ȳ) (suma
de cuadrados explicada); SCR = N 2
i=1 ûi (suma de cuadrados residual)