Está en la página 1de 5

UNIVERSIDAD DIEGO PORTALES

INGENIERÍA CIVIL INDUSTRIAL 25 de abril de 2017

SOLEMNE 1

Profesores: Paula Fariña


Virna Gutiérrez
Tiempo: 90 minutos

Pregunta 1. Preguntas cortas (40 puntos).

1. Comente: La razón de que la media de 𝛽̂ sea igual a 𝛽 se debe al supuesto de que 𝐸(𝜀) = 0.
Efectivamente,
𝐸(𝛽̂ ) = (𝑋′𝑋)−1 𝑋′𝐸(𝑋𝛽 + 𝜖)
Si 𝐸(𝑋𝛽 + 𝜖) = 𝑋𝛽 (es decir 𝐸(𝜖) = 0)
Se tiene que 𝐸(𝛽̂ ) = (𝑋′𝑋)−1 𝑋 ′ 𝑋𝛽 = 𝛽
2. Suponga que quiere desarrollar un modelo que explique los créditos hipotecarios en función
de la tasa de interés. ¿Sería mejor tomar la muestra en un periodo de tasas fluctuantes o
durante uno de tasas estables? Justifique.
Se necesita que haya variabilidad en las tasas de interés para poder captar todo el efecto. Se
prefiere entonces un periodo de tasas fluctuantes.
3. Al incorporar una nueva variable explicativa al modelo, se pierde información contenida en
las otras variables explicativas. Por lo tanto, la pérdida de información debería reflejarse en
una pérdida de ajuste del modelo. Comente.
Si el ajuste se mide en el R2 se observará siempre un mejor ajuste en un modelo con una
v.explicativa adicional; pero si se mide en términos de R2 ajustado es no necesariamente ya
que penaliza por la cantidad de variables explicativas.
4. El R2 de un modelo log-log puede compararse con el de un modelo log-lin, pero no con el de
un modelo lin-log. Comente.
Verdadero, el R2 solo se puede comparar cuando la variable dependiente es la misma.

Pregunta 2. Demostración (30 puntos)


Considere el siguiente modelo de regresión lineal simple: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝜇𝑖 , con i= 1,2,…,12 y
𝜇𝑖 ~𝑖𝑖𝑑(0, 𝜎 2 ).
Se define el siguiente estimador para la pendiente:
𝑌̅𝐴 − 𝑌̅𝐵
𝛽̃2 =
𝑋̅𝐴 − 𝑋̅𝐵
Donde 𝑋̅𝐴 e 𝑌̅𝐴 corresponden al promedio muestral de las primeras seis observaciones de las
variables X e Y, y 𝑋̅𝐵 e 𝑌̅𝐵 corresponden al promedio muestral de las últimas seis observaciones.
a) ¿Es este estimador insesgado?
𝑌̅𝐴 − 𝑌̅𝐵 𝐸(𝑌̅𝐴 ) − 𝐸(𝑌̅𝐵 ) 𝑋̅𝐴 − 𝑋̅𝐵
𝐸(𝛽̂2 ) = 𝐸 [ ]= = 𝛽2 = 𝛽2
𝑋̅𝐴 − 𝑋̅𝐵 𝑋̅𝐴 − 𝑋̅𝐵 𝑋̅𝐴 − 𝑋̅𝐵
Sí, es insesgado.
b) Calcule la varianza
1
𝑉(𝛽̂2 ) = 𝑉(𝑌̅𝐴 − 𝑌̅𝐵 ) =
(𝑋̅𝐴 − 𝑋̅𝐵 )2
1 𝜎2
[ ]
(𝑋̅𝐴 − 𝑋̅𝐵 )2 3

c) Si 𝑋̅𝐴 = 60 e 𝑌̅𝐴 =115, 𝑋̅𝐵 = 80 e 𝑌̅𝐵 =85 y además ∑(𝑋𝑖 − 𝑋̅)2 = 2250. Establezca en qué
porcentaje es superior la varianza del estimador propuesto respecto a la varianza del
estimador de MCO.
𝜎2
𝑉(𝛽̂2 ) =
1200
𝜎2
𝑉(𝛽̂2𝑀𝐶𝑂 ) =
2250
La Varianza es un 87,5% más grande.

Pregunta 3. Ejercicio (40 puntos).

Se desea determinar las variables que afectan las notas de los estudiantes de pregrado de primer
año de la carrera de Ingeniería Plan Común. Para ello estima las regresiones presentadas en la
tabla, donde pregrado es el promedio de calificaciones de la universidad que se mide sobre una
escala de siete puntos. Percentil es el percentil en la clase de cuarto medio al momento de
graduarse (por ejemplo, 5 significa el 5% superior de la clase). PSU son los puntajes combinados
en matemáticas y lenguaje en la prueba de ingreso a la Universidad y Tothrs es la cantidad de
horas totales semanales que dedica al estudio.
.
Tabla: Estimaciones de MCO
(1) (2) (3) (4) (5)
Ln(Pregrado) Ln(Pregrado) Ln(Pregrado) Pregrado Pregrado
Intercepto -1,297 -2,01 -0,251 -3,504 3,267
(0,109) (0,109) (0,110) (0,470) (0,073)
Ln(Percentil) - -0,50 -0,05 -0,234 -
(0,002) (0,002) (0,008)
Ln(PSU) 0,408 0,263 0,261 1,215 -
(0,016) (0,015) (0,015) (0,066)
Ln(Tothrs) - - 0,025 0,087 -
(0,003) (0,011)
Tothrs - 0,01 - - 0,02
(0,001) (0,001)
Percentil - - - - -0,013
(0,001)
PSU - - - - 0,01
(0,002)
N 4137 4137 4137 4137 4137
R2 0,139 0,261 0,281 0,31 0,283
Desviaciones estándar en paréntesis.

a) (10 pts) Indique las matrices 𝑋 ′ 𝑋, 𝑋´𝑌 𝑦 𝛽̂ según el modelo (4).


𝑋′𝑋

𝑛 ∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙) ∑ 𝐿𝑛(𝑃𝑆𝑈) ∑ 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠)

∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙) ∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙)2 ∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙) × 𝐿𝑛(𝑃𝑆𝑈) ∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙) × 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠)


=
∑ 𝐿𝑛(𝑃𝑆𝑈) ∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙) × 𝐿𝑛(𝑃𝑆𝑈) ∑ 𝐿𝑛(𝑃𝑆𝑈)2 ∑ 𝐿𝑛(𝑃𝑆𝑈) × 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠)

[ ∑ 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠) ∑ 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙) × 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠) ∑ 𝐿𝑛(𝑃𝑆𝑈) × 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠) ∑ 𝐿𝑛(𝑇𝑜𝑡ℎ𝑟𝑠)2 ]

∑ 𝑃𝑟𝑒𝑔𝑟𝑎𝑑𝑜

∑ 𝑃𝑟𝑒𝑔𝑟𝑎𝑑𝑜 × 𝐿𝑛(𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙)
𝑋′𝑌 =
∑ 𝑃𝑟𝑒𝑔𝑟𝑎𝑑𝑜 × 𝐿𝑛(𝑃𝑆𝑈)

[ ∑ 𝑃𝑟𝑒𝑔𝑟𝑎𝑑𝑜 × 𝐿𝑛(𝑡𝑜𝑡ℎ𝑟𝑠) ]

b) (5 pts) El modelo (1) tiene un R2 = 0,139. Interprételo.


El modelo explica un 13,9% de las notas de pregrado.
c) (10 pts) ¿Cómo se interpreta el coeficiente de la PSU en los modelos (3) y (5), respectivamente?
Son estos efectos significativos al 5%?
Modelo (3): por cada aumento de 1% en el puntaje PSU, la nota aumenta en promedio 0,261
%, ceteris paribus.
Tc = 0,261/0,015 = 17,4 > 2t , es significativo
Modelo (5): por cada punto adicional en el puntaje PSU, la nota aumenta en promedio 0,01
puntos, ceteris paribus.
Tc = 0,01/0,002 = 5 > 2t , es significativo

d) (5 pts) ¿Cómo puede interpretar el coeficiente de tothrs en (2)? Es significativo al 5% la variable


para el modelo?
Por cada hora adicional a la semana que dedica un estudiante al estudio, su nota aumenta en
promedio 1%, ceteris paribus.
Tc = 0,01/0,001 = 10 > 2t , es significativo

e) (10 pts) Según el criterio de R2 es posible comprar todos los modelos? ¿De ser así, cuál modelo
presenta un mejor ajuste? De no poder compararse, ¿qué se necesitaría hacer?
Según el criterio R2 no podríamos comparar todos los modelos, solo los que tienen igual
variable dependientes, es decir 1 al 3 y 4 vs 5. Además, en un modelo de regresión múltiple
se debe usar el R2 ajustado.
Formulario:
Estimadores MICO, regresión simple

ˆ1  Y  ˆ2 X
 X i Yi  nXY
  ̂ 2
 X i  nX 2
2

2
 Xi 2
Var( ˆ1 )   2 Var( ˆ 2 ) 
n x i 2  (X i  X )
2

 uˆ
2
i
 ˆ 2
n2
Estimadores MICO, expresión matricial
ˆ   X X 1 ( X Y )
ˆ ' ˆ
Vˆar(ˆ )  ( X ' X ) 1
nK
ˆ ' ˆ
ˆ 2 
nK
ˆ ' ˆ (Yˆ  Y )' (Yˆ  Y )
R2  1 
(Y  Y )' (Y  Y ) (Y  Y )' (Y  Y )
n 1
Rc2  1  (1  R 2 )
nk
IC(B)

ˆ j  tn/ k2 Dˆ S (ˆ j )

Test de significancia individual

ˆ j  b j
t ~ t ( nk )
ˆ S ( ˆ )
D j

También podría gustarte