Está en la página 1de 49



 


X ∼ N (μ, σ2 )     " 
 
  

 4 6  X  
 
1 (x − μ)2
φ(x) = √ exp −
σ 2π σ2


{Zi : i = 1, 2, . . . , n} 

 Zi ∼ N (0, 1)   
n

V = Zi2 ∼ χ2n
i=1


Z ∼ N (0, 1)% V ∼ χ2n $ Z $ V 

  %   
Z
t=  ∼ tn
V /n


V1 ∼ χ2n $ V2 ∼ χ2n $ V1 $ V2 

  %   
1 2

V1 /n1
∼ Fn1 ,n2
V2 /n2

  !"
P r(B|A)P r(A)
P r(A|B) =
P r(B)

#$%

cov(x, y) = σxy = E[(x − E(x))(y − E(y))]


cov(x, y)
corr(x, y) = ρ(x, y) =
σx σy
n n 2
(ŷi − ȳ)2 û
2
R = n i=1
= 1 − n i=1 i 2
i=1 (yi − ȳ) i=1 (yi − ȳ)
2

&   $ %' (&)

β̂0 = ȳ − β̂1 x̄
n
(x − x̄)(yi − ȳ)
β̂1 = n i
i=1

i=1 (xi − x̄)


2
 n
σ2 x2
var(β̂0 ) = n i=1 i 2
n i=1 (xi − x̄)




σ2
var(β̂1 ) = n
(xi − x̄)2
i=1
n
i=1 ui 2
σ2 =
n−2

/
Nombre:

Parte I (24 puntos)


Cuando corresponda, comente las siguientes armaciones indicando si son Verdaderas, Fal-
sas o Inciertas. Justique sus respuestas.

1. (6 puntos) Un p-valor grande es evidencia fuerte en contra de la hipótesis nula H0 : β1 = 0. Comente.


R: Falso. Un p-valor grande implica que el α critico que nos deja indiferente entre rechazar o no
rechazar (aceptar) H0 es grande. Por tanto, cualquier α menor a este α critico grande nos hace no
rechazar la H0 . Asi, para un rango amplio de α elegidos por el investigador se dara que no se rechaza
H0 . En consecuencia un p-valor grande es evidencia fuerte a favor de H0 .

2. (6 puntos) Una regresión de los residuos del modelo estimado por MCO (û) sobre las mismas variables
explicativas utilizadas para obtener dichos residuos (los X ), debe entregar un R2 que siempre es igual
a cero. Comente.
R: Verdadero, sabemos que por construcción el estimador MCO cumple con que u´X = 0, lo que
se obtiene de la condición de primer orden. por lo cual u es ortogonal a cada una de las variables
explicativas, o su covarianza es igual a cero. De esta forma, tomando como variable dependiente (a
explicar) u y variables explicativas las mismas X utilizadas para obtener u, el R² tiene que ser cero,
ya que no podremos explicar en nada el comportamiento de u a través de X.

4
Nombre:

3. (6 puntos) A partir de lo explicado en clases, demuestre que si en el Modelo de Regresión Simple (MRS)
yi = β0 +β1 xi +ui i = 1, 2, ....N se nos dice que E(u/X) = c siendo c una constante cualquiera mayor
que 0, entonces ello no afectará al coeciente de la pendiente, pero sí al intercepto. En este caso, ¾el
valor del intercepto es mayor o menor que si se nos dice que E(u/X) = 0? Graque.
R:

E(yi /X) = β0 + β1 xi + E(ui /X) // +E(u/X) − E(u/X)


E(yi /X) = β0 + E(u/X) + β1 xi + E(ui /X) − E(u/X)
E(yi /X) = β0 + c + β1 xi + c − c
E(yi /X) = β0 + c + β1 xi
Por lo tanto, la pendiente sigue siendo β1 pero el intercepto aumenta a β0 + c (dado que c > 0).

E(y/X)=B0+c+B1x

E(y/X)=B0+B1x+E(u/X)
B0+c

B0

4. (6 puntos) Basándonos en el supuesto A visto en clases (linealidad en los parámetros), podemos concluir
que uno de los problemas del estimador MCO es que sólo permite estimar relaciones lineales entre la
variable dependiente y las variables explicativas. Comente.
R: Falso, a pesar de que el estimador MCO requiere que el modelo sea lineal en parámetros, las variables
explicativas no necesariamente tienen que ser lineales, entonces por ejemplo es estimable por medio de
MCO un modelo de la forma:

y = β0 + β1 edad + β2 edad2 + u
Este modelo es lineal en los parámetros pero permite estimar un efecto no lineal de edad sobre Y, el
efecto marginal de edad sobre Y es:
ϑY
ϑedad = β1 + 2β2 edad
El cual no es constante sino que depende de la edad (no lineal).

5
Nombre:

Parte II (21 puntos)


5. Se extraen dos muestras aleatorias de una población de una variable X que es i.i.d. (independientes e
idénticamente distribuidas), con una distribución normal con media µ y varianza σ 2 . La primera P
mues-
X
tra tiene n1 observaciones y la media muestral de la variable obtenida aleatoriamente
P
es X 1 = n1 i .
Xi
La segunda muestra tiene n2 observaciones, y la media muestral es X 2 = n2 .

Se proponen dos estimadores de la media poblacional µ:


X1 + X2
µ̂1 =
2
n1 X 1 + n2 X 2
µ̂2 =
n1 + n2
(a) (4 puntos) Compare los dos estimadores en base a sus propiedades de insesgamiento.
R: Considerando que:
 Pn1 
i=1 Xi
E(X 1 ) = E
n1
Pn1
i=1 E[Xi]
=
n
Pn1 1
i=1 µ
=
n1
n1 µ
=
n1
= µ
E(X 2 ) = µ

y luego tomando valor esperado de los estimadores propuestos:

E[X 1 ] + E[X 2 ]
E[µ̂1 ] =
2
µ+µ
=
2
= µ
n1 E[X 1 ] + n2 E[X 2 ]
E[µ̂2 ] =
n1 + n2
n1 µ + n2 µ
=
n1 + n2
= µ

Ambos son estimadores insesgado de µ.

(b) (5 puntos) Compare los dos estimadores en base a sus propiedades de eciencia (en base a sus
varianzas).
R:
 Pn1 
i=1 Xi
V (X 1 ) = V
n1

6
Nombre:

 
n1 n1 Xn1
1  X X
= · V (Xi ) +2 cov(Xi , Xj )

n21 i=1
| {z }
i=1 j=1
| {z }
σ2 0
2
σ
=
n1
De manera análoga se tiene que:

σ2
V (X 2 ) =
n2
Utilizando esto podemos calcular la varianza de los estimadores propuestos:
 
X1 + X2
V (µ̂1 ) = V
2
V (X 1 ) + V (X 2 )
=
4
σ2 σ2
n1 + n2
=
4
σ2 1

1
= +
4 n1 n2

 
n1 X 1 + n2 X 2
V (µ̂2 ) = V
n1 + n2
n21 V (X 1 ) + n22 V (X 2 )
=
(n1 + n2 )2
n1 σ 2 + n2 σ 2
=
(n1 + n2 )2
σ2
=
n1 + n2

(c) (6 puntos) Asuma que n1 = 10 y n2 = 20, ¾cuál estimador tiene menor Error Cuadrático Medio?
¾cambia su respuesta si n1 = 20 y n2 = 10? Justique sus respuestas.

R: h i
σ2 1 1 σ2 1 1 σ2 3
   
ECM (µˆ1 ) = 4 · n1 + n2 = 4 · 10 + 20 = 4 · 20 = 0.0375σ 2
σ2 σ2
ECM (µˆ2 ) = n1 +n2 = 30 = 0.0333σ 2
Lo anterior nos lleva a que:

ECM (µˆ1 > ECM (µˆ2


Resultado que se hmantieneisi es que n1 = 20 y n2 = 10, ya que
2 2 2
σ 1 1 σ 1 1 σ 3
   
ECM (µˆ1 ) = 4 · n1 + n2 = 4 · 20 + 10 = 4 · 20 = 0.0375σ 2
σ2 σ2
ECM (µˆ2 ) = n1 +n2 = 30 = 0.0333σ 2

7
Nombre:

Parte III (30 puntos)

6. La siguiente gura muestra los resultados de la estimación de un modelo de regresión lineal, donde la
variable dependiente es el número de meses que la persona estuvo cesante entre los años 2004 y 2006
(ces_0406), y las variables explicativas son la escolaridad de la persona medida en años (esc_06) y la
edad de la persona medida en años (edad_06).

En base a la tabla anterior, conteste las siguientes preguntas:

(a) (4 puntos) ¾Cuál es el número de meses de cesantía esperado para una persona de 25 años de edad
con educación universitaria completa (16 años de escolaridad)? Justique su respuesta. (Nota:
aproxime los coecientes y sus resultados a dos decimales).
R:
El número de meses se obtiene reemplazando los datos entregados en el modelo de regresión, lo
que nos da un total de 4.02 meses de cesantía para el individuo descrito.
y /esc06 = 16, edad06 = 25) = 9.86 − 0.24 ∗ 16 − 0.08 ∗ 25 = 4.02
(b

(b) (3 puntos) ¾Cuál es el cambio esperado en el número de meses de cesantía asociado a un aumento
de la escolaridad de una persona desde educación básica completa (8 años) a educación media
completa (12 años)? Justique su respuesta.
R: El cambio asociado es de una reducción de 0.96 meses (es decir, casi un mes de cesantia), ya
que viene dado por:

(Cesanta|esc = 12, edad) = 9.86 − 0.24 · 12 − 0.08edad


(Cesanta|esc = 8, edad) = 9.86 − 0.24 · 8 − 0.08edad
→ ∆Cesanta = −0.24 ∗ 4 = −0.96

(c) (6 puntos) ¾Qué le sucedería a cada uno de los coecientes estimados si la variable dependiente
ces_0406 estuviera medida en años y no en meses (por ejemplo, en vez de ces_0406 =4 meses
fuera ces_0406 =4/12 años? ¾cuáles varían? ¾ninguno? ¾todos? ¾en cuánto? Justique su
respuesta.
R:

9
Nombre:

cov(X,Y ) σY
V ar(X) = ρ(X, Y )∗ σX y que β0 = Y − β1 X .
β
Según lo visto en clases, sabemos que en el MRS c1 = c c
Esto ya nos ayuda para el caso del MRM de la pregunta, en el sentido de darnos cuenta que al
cambiar Y de meses a años, eso implica que σy disminuye a 1/12 de su valor anterior. Dado
que es lo unico que cambia, entonces los βb bajarán a 1/12 de su valor anterior. El intercepto
β
c0 también disminuye a 1/12 de su valor anterior ya que tanto Y como los βb bajarán a 1/12
(también se puede argumentar que β
c0 mide la media de Y cuando todos los X son cero, por lo que
necesariamente tiene que bajar a 1/12 de su valor original si es que Y baja a 1/12.
Nota de corrección: alguien podría utilizar la ecuación 3.22 de Wooldridge, que presenta la fórmula
P
exacta de los β
b en el caso del MRM, por ejemplo: β c1 = Prc i1 yi
2 en donde rc
i1 es el residuo de
r
c i1

una regresión entre X1 y el resto de las variables explicativas. Esta fórmula también es útil para
darse cuenta que los Y disminuirán a 1/12 de su valor original, pero los rc
ij no cambiarán a
consecuencia del cambio en la unidad de medida de Y, por lo que los β bajarán a
b 1/12 de su valor
original.

(d) (6 puntos)Asuma que un investigadordecide correr una regresión entre ces_0406 y esc_06 solamente
(es decir, omite edad_06 de la regresión).Suponiendo que la correlación entre edad y escolaridades
negativa,¾cómo espera que cambie el coeciente que acompañaa esc_06 en esta nueva regresión del
investigador?¾será mayor,menor o igual al coeciente de esc_06 mostradoen la gura?Justique su
respuesta.
R:
Sabemos que el coeciente estimado en la regresiónentre ces_0406 y esc_06 es igual a:
β
f1 = β
c1 + β
c2δe1
Entonces dado que existe una correlaciónentre edad y escolaridadnegativatendremos que δe1 será
negativo.Además,de la gura sabemos que β
c2 < 0, por lo que β c2δe1 > 0, luego el parámetroasociadoa
escolaridaden la nueva regresiónserá mayor (es decir , β1 > β1 ), en efecto:
f c
β
f1 = β
c1 + β
c2δe1
β1 = −0.24 − 0.08δe1
f
De donde es claro que dado el supuesto que δe1 es negativo,el nuevo parámetroestimado será mayor

(menos negativo).

(e) (4 puntos)¾Cual es valor del estadísticot de la variableesc_06 que apareceen blanco en la gura?(Nota:
Aproximelos coecientes y sus resultadosa dos decimales).¾El coeciente de esc_06 es
signicativamentedistintode cero? Justique.
R:
El valor del estadístico es -12 aproximando cada valor a dos decimales, se obtiene de la manera
usual:
β̂ −0.24
t= = = −12
sd(β̂) 0.02
Elcoeciente estimado es signicativamentedistinto de cero pues su valor p es menor a 0.05,es decir,la
probabilidad de que el estadísticoverdaderosea mayor al estimado es menor a 5%.

10
Nombre:

Parte I (40 puntos)


Cuando orresponda, omente las siguientes arma iones indi ando si son verdaderas, falsas
o in iertas. Justique sus respuestas.

1. (7 puntos) En un Modelo de Regresión Simple, uando la pendiente estimada es βˆ1 = 0, enton es el


R2 de la regresion es igual a 0.

R: Verdadero.
P Si βˆ1 = 0, enton es tendremos que yˆi = c
β0 + c β1 x = y, por lo que la
c0 = y − c
β1 xi = β
SEC = (ybi − y) = 0 (ya que ybi es igual a y para todo i). En onse uen ia, R2 = SEC
2
ST C = 0
NOTA DE CORRECCION: El analisis gra o ompleto y detallado tambien es valido omo respuesta.

2. (7 puntos) Un intervalo de onanza al 95% se debe interpretar di iendo que existe un 95% de proba-
bilidad que el parámetro pobla ional  aiga dentro del intervalo.

R: Falso. El intervalo de onanza es aleatorio (ya que varía según las distintas muestras) pero no
el parámetro pobla ional. Por lo tanto, la orre ta interpreta ión es que la probabilidad de que un
intervalo de onanza ualquiera ( onstruido de la misma manera en muestras repetidas) ontenga el
parámetro pobla ional es de un 95%.

3. (7 puntos) La Ley de las Esperanzas Iteradas indi a que si primero al ulamos la esperanza de una
variable Y ondi ional en X, y luego tomamos el valor esperado de esa expresión, enton es obtendremos
la esperanza de Y.

R: Verdadero, la ley de las esperanzas iteradas indi a que Ey (Ex (Y /X)) = Ey (Y ). Es de ir, si primero
al ulamos la esperanza de una variable Y ondi ional en X (Ex (Y /X), y luego tomamos el valor
esperado de esa expresión respe to de y (Ey (Ex (Y /X))), enton es obtendremos la esperanza de Y
(Ey (Y )).

4. (7 puntos) Una persona A mide 175 m y reside en una iudad donde la estatura media es de 160 m y
la desvia ión típi a es de 20 m. Otra persona B mide 180 m y vive en una iudad donde la estatura
media es de 170 m y la desvia ión típi a es de 15 m. ¾Cuál de las dos será más alta respe to a sus
on iudadanos? Muestre sus al ulos.

R:

4
Nombre:

Parte III (40 puntos)


6. (40 puntos) El siguiente Modelo de Regresion Simple (MRS) rela iona el numero de igarillos fumados
por semana (cigsi ) on los años de edu a ion de ada persona, medidos omo diferen ia respe to a los
años de edu a ion promedio (educi − educ).

cigsi = α1 (educi − educ) + ui = 1, 2.....N

donde E(ui /X) = 0. El modelo se asume sin onstante (α0 ).

(a) (8 puntos) Derive el estimador de Mínimos Cuadrados Ordinarios (MCO) de α1 (es de ir, αˆ1 ).
(Ayuda: utili e método de minimiza ión de Cál ulo (derivadas), similar a lo he ho en lases).

R: P
M in c1 (educi − educ))2
(cigsi − α
αc1
P
−2 (cigsi − α c1 (educi − educ))(educi − educ) = 0
P P
(cigsi (educi − educ)) = αc1 (educi − educ)2
P
((educi −educ)cigsi )
c1 =
α P
(educi −educ)2

(b) (6 puntos) Compare el estimador en ontrado en (a), αˆ1 , on el estimador de MCO del modelo

estandar (cigsi = β0 + β1 educi + ui i= 1, 2.....N ), el ual es β̂1 = cov(x,y)


var(x) . ¾son iguales αˆ1 y
β̂1 ? ¾son diferentes? ¾por que? Explique y muestre sus al ulos.

R: P P
cov(x,y) cov(educi ,cigsi ) [ (educi −educ)(cigsi −cigs)]/(n−1) (educi −educ)cigsi
β̂1 = = = P c1
=α = P
var(x) var(educi ) [ (educi −educ)2 ]/(n−1) (educi −educ)2
P
P
en donde la penultima
P igualdad surge del
P he ho que (educi − educ)(cigsiP− cigs) = (educi −
educ)cigsi − cigs (educi − educ) = (educi − educ)cigsi − cigs ∗ 0 = (educi − educ)cigsi
(tru o del mono y leon)
Por lo tanto, αˆ1 y β̂1 son iguales.

( ) (8 puntos) Demuestre que αˆ1 es un estimador insesgado de α1 . Indique laramente los supuestos
utilizados para ello.

R: P P
c1 =
α ((educi −educ)cigsi )
P
(educi −educ)2
(Spto 4: (educi − educ)2 > 0)
P
c1 =
α ((educi −educ)(α1 (educi −educ)+ui ))
P
(educi −educ)2
(Spto 1: linealidad en los parametros)
P P
(educi −educ)2
c1 = α1P(educ
α 2
+ P
(educi −educ)ui
(educi −educ)2
i −educ)
P
c1 = α1 + P(educ
α i −educ)ui
(educi −educ)2
hP i
α1 /X) = α1 + E P(educ
E(c i −educ)ui
(educi −educ)2
X
P
(educi −educ)E(ui /X)
E(c
α1 /X) = α1 + P
(educi −educ)2
P
E(c (educi −educ)∗0
α1 /X) = α1 + P(educ −educ)2
i
(Spto 3: E(ui /X) = 0)
E(c
α1 /X) = α1
(Spto 2: muestro aleatorio, presente en toda la demostra ion)

6
Nombre:

(d) (4 puntos) La siguiente tabla muestra la estima ion de αˆ1 por MCO utilizando datos de una
muestra aleatoria de 807 personas.

reg cigs educ_edprom, nocons

Source | SS df MS Number of obs = 807


-------------+------------------------------ F( 1, 806) = 1.37
Model | 359.817151 1 359.817151 Prob > F = 0.2428
Residual | 212286.183 806 263.382361 R-squared = 0.0017
-------------+------------------------------ Adj R-squared = 0.0005
Total | 212646 807 263.501859 Root MSE = 16.229

------------------------------------------------------------------------------
cigs | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ_edprom | -.2185521 .1869853 -1.17 0.243 -.5855877 .1484835
------------------------------------------------------------------------------
Explique omo se interpreta el oe iente estimado.

R: El oe iente indi a que un aumento en un año de edu a ion por sobre el promedio (o en un
año de edu a ion), disminuye el onsumo promedio en 0,218 igarrillos a la semana.

(e) (4 puntos) Suponga que reestima el modelo rees alando la variable cigs de modo que ahora cigs2
orresponde a la antidad de igarillos fumados por mes (cigs2 = cigs ∗ 4). ¾Cuál seria el valor del
oe iente estimado en esta nueva regresión? Justique utilizando la fórmula de los estimadores
MCO.

R:
σ σcigs∗4
c1 nuevo = ρ(educ, cigs) σcigs2
α educ
= ρ(educ, cigs) σeduc c1 original ∗ 4 ≈ −0.218 ∗ 4 = −0.872

(f ) (5 puntos) ¾Cómo ambiaria el R- uadrado del modelo reestimado en (e)? ¾subiria? ¾bajaria?
¾no ambiaria? Justique.

R:
El R2 no ambiaria, ya que Rnuevo
2
= 1 − SCR
SCRoriginal 2
ST Cnuevo = 1 − ST Coriginal = Roriginal
nuevo

esto se debe a que tanto ubi omo cigs2 aumentan en la misma propor ion (ambos se multipli an
por 4), por lo que SCR y ST C tambien aumentan en la misma propor ion y por lo tanto su razon
sigue siendo la misma ( SCR
ST Cnuevo = ST Coriginal ):
nuevo SCRoriginal

[ = cigs2 − α
ubi nuevo = cigs2 − cigs2 c1 nuevo (educi − educ) = 4(cigs − α
c1 original (educi − educ)) =
4ubioriginal

(g) (5 puntos) ¾Cómo ambiarian los valores ajustados (o predi hos) del numero de igarrillos fuman-
dos en el modelo reestimado en (e)? Justique.

R:
c1nuevo (educi − educ) = 4c
ybi nuevo = α α1original (educi − educ) = 4ybi original
Los valores ajustados o predi hos se multipli arian por 4.

7


 * ( ')


 
   

 
 


   



  
 







) 4 "  6 3     >   9.


 
 4>96 yi = β0 + β1 xi + ui i = 1, 2.....N %
5
(" 
 
  " $ 
 (" 5
   E(yi /xi ) $ yi
 E(yi /xi)    

  yi    
 
 yi    


 

   
E(yi /xi ) = β0 + β1 xi    
  E(ui /x) = 0,  
         
  

 
1 xi   
            
yi = β0 + β

) 4 "  6 
"  
   >8: β1 
B
 %     
    B  .  %
"
   "$ 
  "$

  β1 % 
    "   
")    %
  ("   . )
   
  

     

      
      

β1  
   
   
     
    
     
       !
  β1  "  
   β1 = β1       E(β1 ) = β1 
    

         #$         
 
  
 
              
/) 4 "  6 " . (" " C   1   " .
. )  "     
 .
0
   ) 
" 1    "
  . %    1 

 4 
% 
 
 ("  1   " . 6  +C    )   
 ("    
  "
C  

   " D  

E) 
" 1  .
   
  "  " 


    % F"   

 ("  1  
     "
  . G
>"  " " )

Xi :       
   %  i
   Xi = 1) Xi = 0)
Yi :       
    
   %  i
   Yi = 1) Yi = 0)
&   

 P r(Xi = 1/Yi = 1)    
P r(Xi = 1/Yi = 1) ∗ P r(Yi = 1) = P r(Yi = 1/Xi = 1) ∗ P r(Xi = 1)
P r(Yi =1/Xi =1)∗P r(Xi =1)
P r(Xi = 1/Yi = 1) = P r(Yi =1)
' (   
P r(Yi = 1) = P r(Yi = 1/X = 1) ∗ P r(Xi = 1) + P r(Yi = 1/X = 0) ∗ P r(Xi = 0),    
P r(Yi =1/Xi =1)∗P r(Xi =1)
P r(Xi = 1/Yi = 1) = P r(Yi =1/X=1)∗P r(Xi =1)+P r(Yi =1/X=0)∗P r(Xi =0)
0.8∗0.01
P r(Xi = 1/Yi = 1) = 0.8∗0.01+0.1∗0.99 ≈ 0.075
)       *     +,-
2) 4H "  6        
     "  " 4Dt )  " 
  
  

 4Pt )%   "
      
   I
   ) -   "



2



."
    Dt = γ0 + γ1 LnPt + ωt ) F8  "     " (" 
 
 

 
      
  γ1 G 35
(")
 .      γ1 = ϑLnP
ϑD
 
 
     ϑLnD
t
t ϑLnP  #  
t
t
 ϑD = D =⇒ ϑDt = ϑLnDt ∗ Dt    
ϑLnD
t
t 1
t
ϑDt
γ1 = ϑLnPt = ϑLnD t ∗Dt
ϑLnPt = ϑLnDt
ϑLnPt ∗ Dt
 
 ϑLnDt γ1
ϑLnPt = Dt

,


 *** (+ ')


7) 42 "  6   
 yi 
  
."
    
 
y i = β0 + u i i = 1, 2, ....N 46
  β0  "   B
  $ ui    
% (" 

  
 
 


"
  
 0 $ 
  σ2 .

.% "
 
.   (" yi   
    
 (xi ) $ "     
>

 8"   :

 4>8:6   
 
."
   
yi = α
0 + α
1 xi 46
  α0 $ α1    
   >8:    46)
46 4 "  6 " . (" "  >8:   
  
    46) ;"  (" 
 
  β0 
."   
 "  y.

#   /
 
 Mβin SCR = (yi −  β0 )2
0
0 ] :−2 (yi − β
[β 0 ) = 0 =⇒ nβ
0 = ny =⇒ β
0 = y
#   3
0 = y − β
β 1 x    
 β1 = 0 =⇒ β0 = y
&8'# . 58 558&  
            
 % 
   
46 4, "  6 F8"     R2     
     6G F ("G

#   /
R2 94  R2 = ρ(yi , yi )  yi = β0 = y    i     ρ(yi , y) = 0
#   3  
R2 = 0   R2 = SEC (y −y) =  (y−y) = 0     y 0 = y    i
2 2

ST C = i = β
i
(y −y) 2
(y −y) 2
i i

46 4, "  6 ;"  (" 


β0  "  
 
 .   β0 )

    
0 = y =
β yi
= (β0 +ui )
= nβ0
+ ui
= β0 + ui
n n n n n
#
      
0 ) = E(β0 ) + E( ui )
E(β n
0 ) = β0 + 1 (E(ui ))
E(β n
0 ) = β0
E(β   E(ui) = 0      :  ; <
4 6 4, "  6 ;"  (" V ar(β0 ) = σn 2

 
 V ar(β0 ) = V ar(β0 + nu ) = n1 (V ar(ui )) = n1 nσ2 = σn   ui 


i
2 2
2


uj       
    
        




46 4 "  6 3 


  "    
  α0 $ α1     46) F3   
  α0
 .  
 . G 
  . % F"  

   .G

α
0 = y− α
1 x
(x
i −x)(yi 2−y)
α
1 = (xi −x)
"  

 α0             α1   
i −x)(yi 2−y)
(x
α
1 = (xi −x)

α
1 =  (xi −x)(yi )
(xi −x)2 
  0 

α
1 = (xi −x)(β0 +ui )
(xi −x)2   yi      
 
β (x i −x) (xi −x)u2i
α
1 = 0
(xi −x)2 + (xi −x)
 
α
1 =  (x i
 
−x)u
(xi −x)2
i
(xi
− x) = 0
#
   




E(
α1 /x) = (x
 −x)E(u /x)
i
(x −x) i
= 0   E(ui /x) = 0    :  ; <
i
2

#
   

  α0  
E(
α0 /x) = E(y/x) − E(
α1 x/x)
E(
α0 /x) = E(y/X) − xE(α1 /x)
α0 /x) = E(y/X)     
E(  E(α1 /x) = 0
#
   )               

    
Ex (E(
α0 /x)) = Ex (E(y/X))
α0 ) = E(y)    
E(    y = β0      
E( 0 ) = β0   
α0 ) = E(β        

"      α0        β0 
46 4, "  6 F=1 ("J 

  
   α0  
 
  (" β0 G F "  α0
    
  (" 
β0 G
n
 V ar(β0 ) = σn V ar( α0 ) = n  (x −x̄)  
   !        

2 2
2 σ x i=1 i
n 2
i
  ; <   !  
i=1


α0 )     (x −x̄) = 1  

"      V ar(β0 ) = V ar(
n 2
x i=1 i
n 2
i
    i=1

(xi − x̄)2 = x2i − 2x xi + x2


 
(xi − x̄)2 = x2i − 2nx2 + nx2
 
(xi − x̄)2 = x2i − nx2
 
"     (xi − x̄)2    x2i   x = 0, 

 V ar(β0 ) = V ar(
α0 )
 
=     V ar(β0 ) ≤ V ar(
α0 )   (xi − x̄) ≤ xi  
 α
2 2
0     
    β0 )


+


 ( ) '
+ 75 /  8 
    B   C.D  
/

  0  %
 C.D  /


 0   / /
  E
1F   
 + 9 

 
 B

   &   

+  
B0   /  +
  
   
                    
        
     
      
 ! 
        "    
   
    
  #$$   
    
        
   

   "
+ 75 /  8 )
1
      

 
  /

  3   
 
 
7/  +  / 8 "   
 7


 + 


8    
+
6/  7X = 08 $ /  7X = 18 ,



 7Y = 08 +. + +.2



 7Y = 18 +4 +. +4-
, +C4 +5 +
 
1
 
  3  "    
 0  G     / + H9    /


  0  


I  
B0   /  +
:
78 P r(Y = 1|X = 1) = P r(Y =1,X=1)
P r(X=1) = 0.05/0.06 = 0.83

2


2+ 75 /  8   
1
  '   :1
 
/ 7':8 Yi = β0 +β1Xi +Ui i = 1, 2, ...N &
  J /    /   3  
   

7 K
 8 " L /    / 3 
  
   

    
  & H9   
1
   


 0  
   
  J  
    K
     I 78 )  



/& 78 ) 
  
  + 6%/
0      / / &

  

 "
 1
  
     / + 7"     M K
 8+
:  0   β1 = ρ(x, y) ∗ σ " 0  
σ
y
x
β0 = y − β1 x& /   

78 
J 
   K
        ynuevo = yantiguo /1000 " /   ynuevo =
y antiguo /1000 " σnuevo = σantiguo /1000  0 
/
 0   β1 nuevo = β 1
antiguo /1000+  
 & β0 nuevo = y nuevo − β1
nuevo x = (y − 1 x)/1000 = β
β 0
antiguo /1000 + ) 0 
/
 0  

/  (    (
 0  
/ 
1
+
78  0  yi nuevo = β0 nuevo +β1 nuevo xi = β0 antiguo /1000+(β1antiguo /1000)∗xi = yiantiguo /1000
" 0  ynuevo = yantiguo /1000& /      0  ui nuevo = yantiguo /1000 − yiantiguo /1000 =
i antiguo /1000+ ) 0 
/
 0   
  
   (    (
 0  
u

 
1
 +
;, $6 9;::699;  ; =, 9; $69: ) $:699; J '! ,$ $6)
9'=;& 6 696:  6L)99; ' 9;')6,+

4


 (( * '
4+ 7 /  8 6
1
     
  
      /
   /  7AP ) " 
    (
3 (AH)&    
  / 1  & 

      
  
= 19.6 + 0.73AP
AH R2 = 0.45 SCR = 2.0
78 72 /  8  / 
1
B   B
  0  /  AP.
: % "     
 
"       
   
 
AP )      &' (AH)    $()
"
78 72 /  8  / 
1
B   R2 
+
: * R2 "  $+ "   + !            &' (AH)
/    %/
  /  

      /  7AP 8+
78 72 /  8 H9    /

 /     (
3  " /  
     /

 -+5 / 1  I  
B0   /  +
 (AH/AP
= 70.06) = 19.6 + 0.73 ∗ 70.06 = 70.7438

7 8 72 /  8 H9    
      AH I  
B0   /  +

 %   R2 = 1 − SCR
ST C   V ar(AH) = n−1    
2
(y −y)
i
n−1 = ST C

ST C ⇒ 0.45 = 1 − ST C ⇒ ST C = 0.55 = 3.63     V ar(AH) =


R2 = 1 − SCR 2 2 ST C
n−1 =
3.63
109 = 0.033361

.


 (((  '


.+ 72 /  8   " $
1&   
    
& 0
  
1        
(   
 (H)    B    
 (F )& /     1 
  
 
1
 
 
Fi = β0 + β1 Hi + Ui i = 1, 2, ....N 78
6   Hi    
    Ui+ 
1& /     B  

 &  /  
        
   & "  Fi  Hi& /    
 
/+ 


  Fi &     /    Ḧi & 0  /   
 
    (   




 i "  (   
 /
     7 
& Ḧi = Hi − H 8+ 

  Hi &
    /     F̈i & 0  /   
 
     B  


 i " 
 B  /
     7 
& F̈i = Fi − F 8+
78 7 /  8   /   0   3  Fi " Ḧi /  
    Fi = α0 + α1 Ḧi + vi .
6    /
   α1 & 0  1   /    
   β1     
β1
 /
  
     78+ $
 α
 
  0 " α 1 
     9  "
/ 
α1     
 
 1   β1 .
   2
M in vi 2 = (Fi − α 1 H¨i )
0 − α
α
0 ,
α1
 
α0 ] : ϑ = 0 =⇒
[ (Fi − α 1 Ḧi ) = 0 =⇒ α
0 − α 1 Ḧ
0 = F − α
ϑα
0
  
α1 ] : ϑ
[ = 0 =⇒ (Fi − α 1 Ḧi )Ḧi = 0 =⇒ [Fi − (F − α
0 − α 1 Ḧi )H¨i ] = 0
1 Ḧ) − α
ϑα
1

    ,- . /     α1 = ((FḦ −F )Ḧ
−Ḧ)Ḧ
-    0  Ḧi  
i i

i i
 
& &  Ḧ = nḦ = 0 α1 = (F−F
i )(H −H)
(H −H)
) i i
2
i
 

     ,- . #     α0 = F − 
(Fi −F )Ḧi
(Ḧi −Ḧ)Ḧi

1 *.2-%3

,
 

 "   α1      

α1 /Ḧi ) = E  (Fi −F )Ḧi /Ḧi = E  Fi Ḧi /Ḧi = E
E( (β0 +β1 Hi +Ui )Ḧi
 / Ḧ i =
(Ḧi −Ḧ)Ḧi (Ḧi −Ḧ)Ḧi (Ḧi −Ḧ)Ḧi
   

E  β0 Ḧi + β1 Ḧi +  Ui Ḧi /Ḧi    
     "    
2

(Ḧi −Ḧ)Ḧi (Ḧi −Ḧ)Ḧi (Ḧi −Ḧ)Ḧi


  
 (Hi − H) = nH − nH = 0   "    "  β1   (Ḧ −ḦḦ)Ḧ
2
Ḧi = i
=
i i
 
= 1   Ḧ = nḦi = 0
            
2

 i
Ḧ Ḧi
 
 
E β1 +  Ui Ḧi
/Ḧi = β1 +
(Ḧi −Ḧ)Ḧi
  E(Ui /H¨i) = 0 ∨Ḧi .   
E(Ui /H¨i )Ḧi
(Ḧi −Ḧ)Ḧi
= β1
Hi      Ui 
   
 Ḧi 4    Ui 
1 *.2-%3

5


78 7 /  8 $
1 /   0   3  F̈i " Hi /  
    F̈i = γ0 + γ1 Hi + εi.
6    /
   γ1 & 0  1 $
1 /    
   β1     
 
 
β1
 /
  
     78+ $
 γ0 " γ1 
     9  "
/ 
γ1     
 
 1   β1 .
  
M in εi 2 = (F̈i − γ0 − γ1 Hi )2
γ
 0 ,
γ1
 
α0 ] : ϑ = 0 =⇒
[ (F̈i − γ0 − γ1 Hi ) = 0 =⇒ γ0 = F̈ − γ1 H
ϑγ0
  
α1 ] : ϑ = 0 =⇒
[ (F̈i − γ0 − γ1 Hi )Hi = 0 =⇒ [F̈i − (F̈ − γ1 H) − γ1 Hi )Hi ] = 0
ϑγ1

    ,- . /     γ1 = (H
(F̈ −F̈ )H
−H)H
i
i
i
i


     ,- . #     γ0 = F̈ − (H
(F̈ −F̈ )H
−H)H
H i
i
i
i
1 *.2-%3

,
 

 "   γ1 

 ¨ 
E(γ1 /Hi ) = E (F̈ −F̈ )Hi
 i
(Hi −H)Hi
/Hi = E   F̈i = nF̈ = 0 * 

Fi Hi
(Hi −H)Hi
/Hi i

 0  F̈i   Ḧi  


      5 6   5 6    
 
  


 γ1  7

 1
 α 

F̈ H
E (H −H)H /Hi = E (H
i i (F −F )(H −H)
−H)(H −H)
i
/Hi = E (
i
α1 /Hi ) = E α 1 /Ḧi = β1
    8
         
i i i i

-



" 
 9

&



   " 


 γ1  &

:   α1 :
F̈i Hi (Fi −F )(Hi −H)
E 
(Hi −H)Hi
/Hi = E 
(Hi −H)Hi
/Hi = E (F i )(Hi −H)
(Hi −H)Hi
/Hi =


  
(β0 +β1 Hi +Ui )(Hi −H) β0 (Hi −H) β1 (Hi −H)Hi U (H −H)
E 
(Hi −H)Hi
/H i = E 
(Hi −H)Hi
+ 
(Hi −H)Hi
+  i i
(Hi −H)Hi
/H i

  
     "      (Hi − H) = nH − nH ;$    "
 

 "  β1  

 

  
E β1 + 
Ui (Hi −H)
(Hi −H)Hi
/Hi = β1 + E(Ui /Hi )(Hi −H)

(Hi −H)Hi
= β1   E(Ui /Hi) = 0 ∨Hi .  
 Hi      Ui
1 *.2-%3
78 75 /  8 HA  /   β0      78I HA  /   α0      8I H

  I 6%/
0   / " 
 +
 β0
      
        9     
&     "        E(Fi /Hi = 0) = β0 1)
3
α0
      
        9     
&     "  
      E(Fi /Ḧi = 0) = E(Fi /Hi = H) = α0 1)

3
7 8 74 /  8 

 0   /      
   β1 H0         &
       $
1I 6%/
0   / " 
 +
 ,                " :    
          < " ,    0          0 
F̈i   Ḧi       5 6   5 6     α
1 = γ1 

-

  ¨ 
(F̈ −F̈ )Hi Fi Hi (F −F )(Hi −H)
γ1 =  i
(Hi −H)Hi
= 
(Hi −H)Hi
=  i
(Hi −H)(Hi −H)

1
.-2= < ,- ,,>?. @              4   
 
      "  4         "      '
       4
 A

>


 !  "
* 48 !  6    !  
   70    !  
  !# ,!  
  !

 !  
) 
   7&2  &  !  

     0* B !  C&
 !
 
(
C
  2D& ,!  
 
           /
 7  E* ! 
C,! # !

     F 
 
   *
 H0 : μ = 6, HA = μ < 6
   
   
α = 5%          

  
 
 
        ! "    # 
Z = 4/X−6

64
= 1     $  %           %    & '  H0 
 $ %  
       # (   "

    
 # 
 
    
#    #
    
 (
* 48 !  6 3 !  
!  &  0D   
 
    &  2D 
  /   # 
2D 
   # /   *   ( !       B

     & B!  


  ,!  ( 
G /   E
 P r(OC/P C) = P r(OC,P
P (P C)
C)
0.40 = 40 = 0.375  
     !)    
 (   
= 0.15 15

# 
*!
.* 48 !  6 H$
  

  ! 
 I 35
,!       !   
 
  * 
!  ! 5

 & !  !

 !
  & /   ,! ! *  
  
 *
 +  

 

     $ %       # X, Y 
 
 
ρ(x, y) = 0)     " %  & $
 ,
  

   
   - 
(        
     
'  X   Y,   %  Y  X  
 (        X) $ 

 Y ) 
      

  

 

%    

 
      .  #   %  X  Y 
 
   % 
& $
    # Z %    #    #  ' 
 X  Y
 Y  X.
0* 48 !  6 
 !  !!   =   '(
 
&    
 (  
 
  =$9  β1
(
C ,!   
  =$9  β1 

        β1 *
$ 

 
 C
    &   

* ! 
C,! !  ! *
 /   0     
" ' 
 %        
        
1+.  β1 β̂1 ) 

       β1     E(βˆ1 ) = β1 , $

   
   
     βˆ1    
# 
   23 
2* 48 !  6 :  
(!
     =   '(
 
 4='6 yi = β0 + β1 xi + ui
 i = 1, 2, ...N & !  !   !!    !    ,!
  4 


6  !!    !  * 4$     &  
& !  !     !
 
   5

  & !     C6*
!!   ='
46 46
E(ui /xi ) = 0 E(ui ) = 0
E(ui /xi ) = 0 E(yi /xi ) = β0 + β1 xi
cov(ui , uj /xi ) = 0, i = j cov(yi , yj /xi) = 0, i = j
cov(ui , xi ) = 0 E(ui /xi ) = 0

.



4  4   E(ui/Xi) = 0 → Ex {Eu (ui /Xi)} = E(ui) = 0 
   #     

  *
4 5 4   E(ui /Xi) = 0 →E(yi /Xi) = E(β0 + β1 xi + ui /x)
=β0 + β1 xi + E(ui /xi ) = β0 + β1 xi 
  ,! E(ui /xi ) = 0
4 ) 4   cov(ui , uj /xi) = 0 = E[ui − E(ui /xi)][uj − E(uj /xj )] = E(uiuj /xi)
JE[(yi − E(yi /xi ))(yj − E(yj /xj ))/xi , xj ] = cov(yi , yj /Xi) = 0
4      E(ui /xi) = 0 → cov(u, xi ) = 0& ,!
  
  
  ! !! 
 ! ,! !  
  
 
*  

 
      
  
& #
,!
)# !  
  
 
 4cov(u, xi ) = 06   

  
  ,! 5


  
  
 4E(ui /xi ) = 06 # ,! !  5

  
   
   

 *

0


 !! # "
7* 42 !  6 $
 
(!
  (
    ! / 4   6 
   5 
! !   3 F 4examen), #  ! / 4   6 
   ! 
 4pba1)*
% &     
   
examen
 i = β̂0 + β̂1 pba1i i = 1, 2, ....n

 


    
 
  
     !"
 #  $ """ $ """ %
&   ! ! 
'(#  ) ) $  ) * )$ '+  ! *!
 ,- '+  ! !**
. /#  $" $"$  )*" ""$ ' /  0  !


  1  / 0 / %&/ 2*3 1  4/5#6


  $  $) )  ! ! " !"!!!! *$ !
7   $ )!*! " !! $ * ! !! $ " ! " $)!*


3       
&    
(!
  (!  

46 4. !  6 B$!   


      ! /  5  
   ! !    ! 
  ! /   ! E
46 4. !  6 B$!   ! /     5  !  !
  ,! !   !  
 ! 
E
! ( ,!  
        ! /   !     ,!   

  #   4


     ! / 
6*
46 40 !  6 B$!     C
   
    !     !  (
 E
! 
C,! !

   !    
  =$9*
4 6 42 !  6 B$!    
  
     !  (
 E ! 
C,! !

 
 !    
  =$9*
46 42 !  6 B$ 
  '!   
      
 E B !E B/E B 

E ! 
C,!*
46 42 !  6 B$ 
   /!   4 
) 6  ! /  5    
 
 E ! 
C,!*

2


K/  ' ! 


 ) 
  β1 = 0.437  %  
 %    
 (    #  
 
  


  
 (   
  
 
!) 
  -  
   
 ( 
 
  
 
) 
    
 (    #  
 
! 
 

# ) 
  Y pba1=0 = β0 = 31.21  
 (   
   )5

  
      
 (    #  # β1 
     ,
  
%    ,

   #  $   
 

"  62 β1      ! $  

  &   "  ) 
7
   8,     3 

cov(x, y) σy
β1 = = corr(x, y) ∗
var(x) σx

9  %  σx  &  !   
 $
 : & #   

 β1  !  
 $ 

  
       β0
#
 
    
     # # 
β0 = y − β1 x

9#    


  β1  !   : "
  x !   : &  -  
 
β0
# 

  
   R2
# #    
     %     


8   
     ,
    # 

 y %           #
   x 
7
   8,   R2    %  
 yi  y  yi
&

#  yi  

 "   %  β0    $ β1 xi  



 :
variación exp licada yi − y)2
Σ(
R2 = =
variación total Σ(yi − y)2

8  
  ;    


       &  yi
#

yi = β0 + β1 xi

β0
#    β1 
 
!    xi 
$ 
!     
%  yi  

 
 #     i.

7


 !!! # "


8*   ) ,! L  5
   
   M&  
 ,!  
    

!    
 

Yi = αXi + εi = 1, 2.....N

  E(εi /X) = 0
46 4 !  6 :
   
   =F
 $!   9

 4=$96  α 4 
& α̂6*
4#!  !

 G   



  $! 4 
  6&

   ))    6*
.;6 9 +. ++<. -=;6 6 > ?
 & #
    "
  
 
1 4  
     Yi = α0 + α1 Xi + εi  @  
    (      
   
' 
$    
 
" ' 

  
 



   % 
#
 
 ( % 

 &'   %  
   & 

   8           1+.  1 4  
 
 2
 -  

 
 2 
α̂  1+. & $ %  
'  ε̂i
  α̂    

M inα̂ ε̂i = (Yi − α̂Xi )  0
 
  
 
 
2

[−2(Yi − α̂Xi )Xi ] = 0
 
Yi Xi = α̂ Xi2
9(


  α̂  " % 
Yi Xi
α̂ = 
X2
i

46 4 !  6 :!  ,! α̂  !  


 
 (   α 4 
& ,! E(α̂/X) = α6*
   
 E(α̂/X) = E( YXX /X) = E( (αX
i
2
i  +ε )X /X) = α + E( ε X /X) = α +
X
i
2
i i
X
i X
2
E(ε /X )
X
i i i
2
i

# % 
 

 
X   #  
'  
        9 
i i i i

%  E(εi /Xi) = 0     i, 

 α + XE(εX /X ) = α + XX 0 = α
i i
2
i
i i
i
2

8


 !$ # "
>* 4 !  6 -
(!
  

  ! / 
 =$3  -!   !   ! 
 0 <
 & (N   
 4(
 !

  ! (
 
! !  
   6*
- !   
   (!   !
   46 ,!  
    (
 !


4= 6 # 46 ,!  
    (
 
! !  
   4<6*  ! /
=$3 #

 ! # (   
/  !*
! / 
 =$3 -! 0 <
 (N :  

"! ! / =$3 
 :

 3  
=!

 4= 6 >.02 0> 2*>

! !  
   4<6 2221 78 1*.
46 40 !  6 5
   ! 

!
 &  !# !
    C   !
12D   
  =$3  (!  !   (
 !

 * :/ 5   

   
  &
 F   
 4    
 ! 6*
 <+ X ± c ∗ √σn = 248 ± 1.96 ∗ √ 5.8 = [247.9599, 248.0401]
80345
.;6 9 +. ++<. 5 
  
   √     # $       
 % 
A ) 
  
     B 
'  5.8/ 80345.
46 4. !  6 B$ 
  !   
 E 35
,!*
  
   
  
 %  
AC   # #   %  
  
   
  
3
'

"    # 
 
 
.;6 9 +. ++<.   
     %  D
AC   # #  % 
μ 7 
      2  
  D   
  $ %  μ  3(    %  :

 <+
: 
 <+ $  %        <+
46 42 !  6 -
 
  
 =$3    (!  1 !  &
   


 
(
C
*  
  & ! !     F 
  !# ,!   !(
 ,!
 !
  ! (
 <

 ( ! # (   
/  ! ,!

 !
  ! (
 = * B3   !     

 ! E B ,!GE
   $  
  
 $ %      ,
       4<1+

 #  "  
 E  
    %     

" -4?   " 

 $  "   
' ( 
   %      

" 1   # % 
 "   ,
$ %    '
#  
 %     
 %   


"
-4? 

  

 
  
  $  %     
 %   



" 1    %     
  -4? & #
#


 ( 4<1+  


   

" -4?
4 6 42 !  6     
  # !
   & ! !    F
!(
 C
 
(!
   Y1i  ! / =$3  
  !  i     ,! 
 
! (
 < # Y0i  ! / =$3  
  !  i     ,! 
  ! (

= *  Di = 1
 !  i 
  ! (
 < # Di = 0

  ! (
 = *


     !&   ( 
 
       
  =$3
  (! 4E(Yi /Di = 1) − E(Yi /Di = 0)6  46  8    
  

  !
(
 <      ,! 
  
  ! (
 < # 46  " 
 ,
*
 E(Y1i /Di = 1) − E(Y0i /Di = 0) = [E(Y1i /Di = 1) − E(Y0i /Di = 1)] + [E(Y0i /Di = 1) −
E(Y0i /Di = 0)]

>


9
   [ 7
   ] 
  8          

" -4?      
        %  8  
 

-4? $ 
"
 [ 7
   ] 
  "   ,

46 4. !  6 BA!G
(    ,!  (   (  
     E B ,!GE ! 
C,!
!

    ! C
  6*
' 3    &    ,!   (  
  

&  
& ,!  

 =$3    !
   <  !  
  
  4 
&  

   !
<6 E(Y0i /Di = 1) 4,!     6    ,!  
  =$3  
 !
   =  !  
  
  E(Y0i /Di = 0) 4,!    6* 3   
 ,!   !
   <   F    !
   #
 
 
 # 
   # 
  
/  *

1
1 Aplicación de fórmulas (25 puntos)
Supongamos el modelo lineal simple:
Yi = β0 + β1 Xi + εi

donde
E[εi |X] = 0

E[εi ] = 0

V ar[εi |X] = σ 2

Cov[εi , εj |X] = 0, ∀j 6= i

(a) (10 puntos) Demuestre que el estimador de la varianza del modelo lineal tradicional,
N
1 X 2
σ̂ 2 = ε̂
N − 2 i=1 i

puede expresarse como:


N N
!
1 X X
σ̂ 2 = (Y i − Ȳ )2 − β̂12 (Xi − X̄)2
N −2 i=1 i=1

Respuesta: Partamos por escribir los residuos como la diferencia entre el valor observado y el valor
predicho
N
1 X
σ̂ 2 = (Yi − β̂0 − β̂1 Xi )2
N − 2 i=1

reemplazando la fórmula para β̂0 y agrupando obtenemos


N
1 X
σ̂ 2 = (Yi − Ȳ + β̂1 X̄ − β̂1 Xi )2
N − 2 i=1
N
1 X    2
= Yi − Ȳ − β̂1 Xi − X̄
N − 2 i=1

desarrollando el cuadrado de binomio


N
1 X 
σ̂ 2 = [Yi − Ȳ ]2 − 2β̂1 [Yi − Ȳ ][Xi − X̄] + β̂12 [Xi − X̄]2
N − 2 i=1
(N N N
)
1 X X X
= (Yi − Ȳ ) − 2βˆ1
2
(Yi − Ȳ )(Xi − X̄) + β̂1 2
(Xi − X̄)2
N − 2 i=1 i=1 i=1

ahora usamos que PN


i=1 (Yi − Ȳ )(Xi − X̄)
β̂1 = PN 2
i=1 (Xi − X̄)
lo que implica que
N
X N
X
β̂1 (Xi − X̄)2 = (Yi − Ȳ )(Xi − X̄)
i=1 i=1

3
reemplazando esta expresión en la expresión para σ̂ 2 obtenemos
N N N
!
2 1 X
2
X X
σ̂ = (Yi − Ȳ ) − 2β̂12 (Xi − X̄) + 2
β̂12 (Xi − X̄)2
N −2 i=1 i=1 i=1
N N
!
1 X
2 2
X
= (Yi − Ȳ ) − β̂1 (Xi − X̄)2
N −2 i=1 i=1

(b) (15 puntos) A partir de los siguientes datos para un modelo de regresión lineal simple ŷi = β̂0 + β̂1 xi ,
calcule β̂1 , σ̂ 2 y var(β̂1 ):
N = 5
X
yi = 75
X
xi = 5
X
xi yi = 77.5
X
yi2 = 1175
X
x2i = 5.5

Las siguientes fórmulas (además de la que acaba de demostrar en la parte (1)) pueden resultarle útiles:
X X
(yi − ȳ)2 = yi2 − N ȳ 2
X X
(xi − x̄)2 = x2i − N x̄2
X X
(xi − x̄)(yi − ȳ) = xi yi − N x̄ȳ

Respuesta:
77.5 − 5 ∗ 55 ∗ 75
P P
(xi − x̄)(yi − ȳ) xi yi − N x̄ȳ 5 2.5
β̂1 = = =  = =5
x2i − N x̄2 5 2
P P
(xi − x̄)2 5.5 − 5 ∗ 5 0.5

N N
!
2 1 X
2
X
σ̂ = (Y i − Ȳ ) − β̂12 (Xi − X̄) 2
N −2 i=1 i=1

1 X 2   1  37.5
σ̂ 2 = yi − N ȳ 2 − 25 ∗ 0.5 = 1175 − 5 ∗ 152 − 25 ∗ 0.5 =

= 12.5
3 3 3
σ̂ 2 12.5
var(β̂1 ) = Pn 2
= = 25
i=1 (xi − x̄) 0.5

4
2 Leyendo una regresión (25 puntos)
La siguiente tabla muestra los resultados de estimar una regresión del salario mensual (medido en Euros)
contra la estatura (medida como desviación del promedio, medida en centímetros) de una muestra de traba-
jadores en Alemania. Formalmente, el modelo estimado es:
ŷi = β̂0 + β̂1 (xi − x̄)

donde x̄ es la estatura promedio en la muestra que, en este caso, es 174 centímetros.


Source | SS df MS Number of obs = 62
-------------+------------------------------ F( 1, 61) = 303.74
Model | 634416480 1 634416480 Prob > F = 0.0000
Residual | 5.2009e+09 62 2088705.23 R-squared = 0.1087
-------------+------------------------------ Adj R-squared = 0.1084
Total | 5.8353e+09 61 2342550.19 Root MSE = 1445.2

------------------------------------------------------------------------------
salario | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
daltura | 55 3.50 15.71 0.000 48.00 62.00
_cons | 2431 28.95 83.97 0.000 2371.10 2490.90
------------------------------------------------------------------------------

Conteste las siguientes preguntas:


(a) (5 puntos) Interprete el valor del estimador para el intercepto β̂0 .
Respuesta: El intercepto corresponde en el valor esperado (predicho) del ingreso de un individuo que
tiene estatura igual al promedio, es decir (xi − x̄) = 0, luego, corresponde al salario del individuo que
mide 174 cm. En este caso, 2431 euros mensuales.
(b) (5 puntos) Interprete el valor del estimador β̂1 .
Respuesta: La pendiente corresponde al incremento en el valor esperado (predicho) del ingreso de un
individuo por cada centímetro adicional de estatura. Esto quiere decir que, en valor esperado, el salario
del trabajador aumenta en 55 euros mensuales por cada centímetro de estatura del trabajador.
(c) (5 puntos) ¾Qué fracción de la varianza total en el salario es explicada por la varianza en la altura?
Respuesta: 10.87%. Esto lo sabemos mirando el coeciente de determinación R2 que en este caso es
0.1087
(d) (5 puntos) ¾Qué salario predice este modelo para un individuo que mide 180 centímetros?
Respuesta: Un individuo que mide 180 centímetros tiene 6 centímetros más que el trabajador prome-
dio. Luego, el modelo predice
E[y|(xi − x̄) = 6] = 2, 431 + 55 · 6
= 2, 431 + 330
= 2, 761

el salario predicho para este individuo es 2,761 euros mensuales.


(e) (5 puntos) Jürgen Müller es un trabajador alemán de 41 años que vive en Frankfurt y mide 184
centímetros. El salario de Jürgen es de 2,800 euros mensuales. ¾Cuál es el residuo asociado a Jürgen
de acuerdo a los estimadores obtenidos?

5
Respuesta: Jürgen tiene 10 centímetros por encima del promedio, por ello el modelo predice un salario
de
E[y|(xi − x̄) = 10] = 2, 431 + 55 · 10
= 2, 431 + 550
= 2, 981

el residuo de esta predicción es


ûi = yi − ŷi
= 2, 800 − E[y|(xi − x̄) = 10]
= 2, 800 − 2, 981
= −181

6
(b) (12 puntos) La siguiente tabla muestra la distribución de probabilidad conjunta de la situación laboral
(empleado v/s desempleado) y la educación (universitario v/s no universitario) en una economía.

Empleado (X = 0) Desempleado (X = 1) Total


No universitario (Y = 0) 0.04 0.59
Universitario (Y = 1) 0.39
Total 1.00

(a) (5 puntos) Complete la tabla.


(b) (2 puntos) ¾Cuál es la tasa de desempleo de la economia [Pr(X = 1)]?.
(c) (3 puntos) Compute E(Y ).
(d) (2 puntos) Se eligió aleatoriamente un trabajador y se descubrió que éste estaba desempleado. ¾Cuál
es la probabilidad de que sea universitario?
Respuestas

Empleado (X = 0) Desempleado (X = 1) Total


(a) No universitario (Y = 0) 0.55 0.04 0.59
Universitario (Y = 1) 0.39 0.02 0.41
Total 0.94 0.06 1.00
(b) Pr(X = 1)=0.06
(c) E(Y ) = 1 ∗ 0.41 + 0 ∗ 0.59 = 0.41
(d) P r(Y = 1|X = 1) = P r(Y =1,X=1)
P r(X=1) = 0.02/0.06 = 0.3̄

8
4 (25 puntos)
Comente las siguientes armaciones, indicando si son falsas, verdaderas o inciertas. Justique
sus respuestas.
(a) (5 puntos) Mientras más pequeño es el p-valor, menor es la probabilidad de rechazar la hipótesis nula.
Comente y graque.
R: Falso. Mientras más pequeño es el p-valor, mayor es la probabilidad de rechazar la hipótesis nula,
ya que existe más evidencia en contra de la hipótesis nula. Esto se debe a que el p-valor indica el valor
del error tipo I tal que el estadistico observado es justo igual al valor crítico (p − valor = α∗ en el
gráco). Por tal motivo, se rechazará la hipótesis nula para cualquier valor de α > α∗ . Entonces si
el p-valor es bajo, existen más valores de α que permiten rechazar la hipótesis nula. [4 puntos por la
explicación, 1 por el gráco].

p-valor=alpha*

(b) (5 puntos) Si se cumplen los supuestos del Modelo de Regresión Simple, entonces la insesgadez del
estimador MCO de β1 signica que el estimador MCO de β1 coincide con el verdadero valor de β1 .
Comente.
R: Falso. La propiedad de insesgadez indica que el valor esperado en muestras repetidas del estimador
MCO de β1 (β̂1 ) coincide con el verdadero valor de β1 , y no un valor en particular tomado por βˆ1
calculado en base a una muestra especíca.

(c) (5 puntos) En el modelo de regresión simple, si se cumple que E(u|X) = 0, entonces será cierto que la
cov(X, u) = 0, pero no necesariamente se cumplirá que cov(X, û) = 0. Comente.

R: Falso. Si E(u|X) = 0, entonces será cierto que la cov(X, u) = 0. Sin embargo, independiente de si
E(u|X) = 0 o no, siempre se cumplirá que la cov(X, û) = 0. Esto se debe a que la igualdad cov(X, û) =
0 proviene de una de las condiciones de primer orden de minimización de MCO. Esta condición indica
que Σ(Yi − βˆ0 − βˆ1 Xi )Xi = 0, la cual se puede expresar como Σûi Xi = 0, que justamente corresponde
al numerador de la covarianza entre X y u, cov(X, û).

(d) (5 puntos) Si al estimar un modelo lineal simple se obtiene ajuste perfecto (es decir, todos los valores
observados de y están exactamente sobre la recta β̂0 + β̂1 x entonces y sólo entonces será cierto que
. Comente.
PN

i=1 i = 0

Respuesta: Falso . Siempre es cierto que los residuos de mínimos cuadrados ordinarios suman cero.
Esto es así porque (1) el modelo incorpora un intercepto que garantiza que los residuos tengan promedio
cero, o alternativamente (2) N ûi = 0 corresponde a una de las condiciones de primer orden de
P
i=1 P
minimización de los MCO, esto es N i=1 (yi − β0 − β̂1 xi ) = 0. [NOTA DE CORRECCIÓN: tanto (1)
ˆ
como (2) son explicaciones válidas, basta sólo una de ellas para obtener todo el puntaje].

9
(e) (5 puntos) El supuesto de homoscedasticidad y no autocorrelación condicional (var(ui |X) = σ 2 ∀i,
cov(ui , uj |X) = 0 ∀i 6= j ) es necesario para que los estimadores de MCO del modelo lineal simple
sean insesgados. Comente.
Respuesta: Falso . El único supuesto distribucional necesario para que los estimadores sean insesga-
dos es el de media condicional nula: E[u|X] = 0.

10
Econometrı́a para la Gestión
Profesor: Ignacio Finot
Ayudante: Ibrahim Dughman Núñez
Control 2
Primer Semestre 2022

Nombre: PAUTA

Instrucciones Generales
Lea cuidadosamente las preguntas antes comenzar a responder
Responda de forma ordenada, con letra clara y lo preguntado, respuestas
sin un enfoque claro o ilegibles tendrán una penalización en la corrección.
Póngale nombre a todas las hojas.
Pruebas con lápiz borrable no tienen derecho a recorrección.
Utilice su propia calculadora. No se permite pedir calculadora de los compañeros.
En caso de copia, se sancionará de acuerdo a lo estipulado en el programa del curso,
además de informara dirección para que tome las sanciones correspondientes.

1
Empı́rico. (40 puntos)
Terminada la universidad, usted encuentra trabajo en la prestigiosa compañı́a Norte-
americana de autos “Cornejo & Siervo Ltda”, las y los ingenieros de esta compañı́a están
elaborando un nuevo modelo que saldrá al mercado en breve, sin embargo, no están seguros
de que elementos priorizar para aumentar su precio. Para esto, su jefa tiene que escoger entre
la eficiencia del auto (medida como millas por galón de combustible), el origen del auto (si
se fabricará en el extranjero o no) y el tamaño de la maleta (medida en pies cúbicos). Escu-
chando el problema, usted cae en cuenta que es necesario realizar una recomendación basada
en evidencia empı́rica, y para esto, podrı́a utilizar datos acerca de autos que contengan estas
variables y estimar una regresión utilizando el modelo:
log(P recio) = β0 + β1 mpg + β2 extranjero + β3 maleta + u (1)

Donde log(precio) corresponde al logaritmo natural del valor en dólares de un auto, mpg
son las millas por galón, extranjero es una variable binaria sobre si el auto se fabricó en el
extranjero y maleta es el tamaño de la maleta en pies cúbicos.
Con la certeza de que su modelo es el correcto, usted va con su jefa y plantea la posibilidad
de realizar un análisis de regresión para comprobar cuál es el efecto en el precio de aumentar
marginalmente estos factores. Esta queda sorprendida de su idea y dice que estarı́a de acuerdo
en realizar el análisis, sin embargo, la empresa no posee algún programa capaz de entregar
dichos resultados. A lo cual usted responde: “Estimada, si conseguimos algunos valores, yo
haré el resto”. Confiando en sus habilidades, usted solicita los siguientes resultados:
   
1, 1627 −0, 03 −0, 0325 −0, 0368 551, 9728
 −0, 03 0, 001 −0, 002 0, 0007 
(X 0 X)−1 =  ] ;[ X 0 Y = 11467, 9732
 
−0, 0325 −0, 002 0, 1101 0, 0033   137, 6223 
−0, 0368 0, 0007 0, 0033 0, 0015 7710, 2041

σ̂ 2 = 0, 104; SRC = 6, 248; SEC = 3, 28; n = 64


Las siguientes preguntas resumen los resultados e indicaciones que usted le entrega a su
jefa, Aproxime sus resultados a 4 decimales, ejemplo: si su resultado es 1,23456,
entonces utilice para sus cálculos 1,2346

2
a) Rellene la siguiente tabla con los resultados que se encuentran borrados. Para efectos
de la prueba t plantee el estadı́stico t de un test de significancia individual (test de que
el parámetro es igual a 0) . Para efectos del Valor-P señale cuál de los siguientes niveles
de significancia serı́a el mı́nimo que se podrı́a escoger para poder rechazar la hipótesis
nula: 1 %, 2 %, 5 %, 10 %, 20 %. (Sea ordenado en sus cálculos y explique claramente
de donde obtiene sus resultados, respuestas sin desarrollo no serán consideradas en la
evaluación).[20 puntos]

A continuación se presentan los valores finales, tener en consideración que estos


pueden variar levemente producto de la aproximación de decimales. Asignar
puntaje de acuerdo al siguiente criterio:
• Tabla ANOVA 3 puntos
• Columna de betas 4 puntos
• Columna de error std 4 puntos
• Columna de t 2 puntos
• Columna de p valor 2 puntos
• Columna de IC 2 puntos
• Columna de bondad de ajuste: 3 puntos

Para la resolución el procedimiento es el siguiente: Para la tabla ANOVA:


1. Anotar todos los valores entregados en el enunciado sobre SRC (o SCR) y SEC (o
SCE)
2. Luego, considerando que en este modelo se estiman 4 parámetros considerar que (k
=4) y resolver para los grados de libertad de acuerdo al formulario.
3. Luego obtener los valores para SCM dividiendo la primera con la segunda columna
Para la columna de bondad de ajuste:

3
1. Anotar el valor para N
2. Luego, considerando la taba ANOVA, reemplazar el estadı́stico F (los grados de
libertad son los asociados a SCE para el numerador y para SCR para el numerador;
el valor del estadı́stico es la división de la SCM)
3. Luego utilizar las definiciones de de la tabla ANOVA junto con el formulario para
el R2 y el R̄2

Para la columna de los beta:


1. computar el valor para β̂ mediante la expresión β̂ = (X 0 X)−1 (X 0 Y ). (recordar que
la matriz es simétrica por lo tanto los componentes de la matriz triangular inferior
se replican en la superior cómo un espejo y que la multiplicación matricial es de
filas por columnas)
2.     
1, 1627 −0, 03 −0, 0325 −0, 0368 551, 9728 9, 5313
 −0, 03 0, 001 −0, 002 0, 0007 
 11467, 9732 =  0, 0307 
   

−0, 0325 −0, 002 0, 1101 0, 0033   137, 6223  −0, 2792
−0, 0368 0, 0007 0, 0033 0, 0015 7710, 2041 −0, 2656

3. NOTA DE CORRECCIÓN: Ojo que el orden importa, en la tabla la


constante es lo último que se muestra, sin embargo la en la matriz co-
rresponde al primer elemento, por lo que es necesario ordenar bien los
resultados, con todo, si hay un error de esta ı́ndole la penalización debe
ser baja (más 1 punto).
Para la columna de los errores estándar: :

1. Recordar que necesitamos estimar el valor para V ar[β̂|X] = σ 2 (X 0 X)−1 con σ̂ 2 (X 0 X)−1
2.  
1, 1627 −0, 03 −0, 0325 −0, 0368
 −0, 03 0, 001 −0, 002 0, 0007 
V ar[β̂|X] = 0,104 ∗ 
−0, 0325 −0, 002 0, 1101

0, 0033 
−0, 0368 0, 0007 0, 0033 0, 0015
 
0, 1209 −0, 0031 −0, 0034 −0, 0038
−0, 0031 0, 0001 −0, 0002 0, 0001 
=−0, 0034 −0, 0002 0, 0115

0, 0003 
−0, 0038 0, 0001 0, 0003 0, 0002

3. NOTA DE CORRECCIÓN: Recordar que esta es una matriz de varian-


zas y covarianzas, donde las varianzas se encuentran en la diagonal de la
matriz por lo que es suficientes que se calculen los valores de la diagonal,
no ası́ de las covarianzas asociadas.
4. Luego obtener los errores estándar obteniendo la raı́z cuadrada de la diagonal.

4
5. q 
V ar[β̂0 |X] √   
q  0, 1209 0, 3477
 V ar[β̂1 |X] √0, 0001  0, 01 
 
 = √
  0, 0115 = 0, 1072
q   


 V ar[β̂2 |X]
q  0, 0002 0, 0141
V ar[β̂3 |X]

Para la columna del estadı́stico t:


1. Sabemos que el estadı́stico t bajo un test de hipótesis de que el parámetro pobla-
cional es igual a 0 corresponde a la división del parámetro estimado con su error
estándar, por lo que solo hay que dividir las dos columnas anteriores.
Para la columna del p valor:
1. Debido a que no podemos calcular un Valor-p exacto, se solicita señalar cuál de los
siguientes niveles de significancia serı́a el mı́nimo que se podrı́a escoger para poder
rechazar la hipótesis nula: 1 %, 2 %, 5 %, 10 %, 20 %.
2. Considerando que en este caso que tendremos 60 grados de libertad (n-k), tenemos
que buscar en la tabla cuáles son los valores de significancia mı́nimos tal que se
pueda rechazar H0 , esto es, necesitamos una α tal que |t| >valor crı́tico.
3. Si miramos la tabla, en la columna con 60 grados de libertad tenemos que los valores
crı́ticos a dos colas para 1 %, 2 %, 5 %, 10 %, 20 % serı́an 2.66, 2.39, 2, 1.671, 1.296
respectivamente. Por lo que tenemos que contrastar los valores del estadı́stio t con
estos números. Por ejemplo: para el caso del parámetro asociado a extranjero, el
valor absoluto de t se encuentra en 2.605, Si observamos los valores crı́ticos vemos
que este podrı́a ser rechazado con un α de 2 % (valor critico de 2.39), pero no con
un α de 1 % (valor critico de 2.66) por lo que el mı́nimo α que permite rechazar H0
en un test a 2 colas serı́a un 2 % -el proceso es el mismo para el resto, pero dado
que todos los números son todos mayores a 2.66, todos podrı́an rechazarce a un α
de 1 % )
4. Considerando la columna de estadı́sticos t:
 
27, 47123
 3, 07 
t=  −2, 6045 

−18, 8369

5. Entonces la columna de valores-P aproximados para poder rechazar H0 serán:


 
1%
1 %
= 
2 %
1%

Para la columna de los IC:

5
1. Considerando los valores de las 3 primeras columnas, para obtener este valor es
necesario aplicar la siguiente fórmula: β̂k ± tα/2 ∗ ee(β̂k ), considerando que es un IC
al 95 % de confianza, tenemos que el t5 %,60 = 2
b) Realice una prueba F para significancia general de esta regresión.[10 puntos]

• H0 : β1 = β2 = β3 = 0
• H1 : al menos 1 coeficiente de pendiente es distinto de 0
3,28/3
• F = 6,25/60 = 10,5 (este valor se encuentra en la tabla calculada en el ejercicio
anterior)
• el valor crı́tico Fα (3, 60) = 2, 76, por lo que F > Fα (3, 60) =⇒ 10,5 > 2,76 y por
tanto se rechaza H0
c) En consideración con sus resultados anteriores (y siempre tomando en cuenta que el
objetivo es aumentar el precio del producto), ¿Cuál serı́a el orden de prioridades que
le entregarı́a a su jefa para que diseñen el vehı́culo?. Para esto interprete cada uno
de los parámetros estimados, señale que deberı́a hacer con cada una de estas variables
para aumentar el precio y luego evalúe cual serı́a la alternativa más importante para
lograr un resultado.(Sea cuidadoso en elaborar una respuesta que siga una argumenta-
ción sólida en base a la evidencia obtenida y tomando en cuenta la interpretación de
los resultados).[10 puntos]
R: Aquı́ hay que considerar 2 elementos, la magnitud del parámetro estimado y su signi-
ficancia estadı́stica. Considerando que la variable está en log-nivel. Para cada pendiente
tenemos que:

• β̂1 : en promedio (y manteniendo el resto constante), un aumento de la eficiencia


en una milla por galón aumenta el costo del automóvil en 3.07 % y este valor es
estadı́sticamente muy significativo. Por lo que para aumentar el costo del vehı́culo
debiese aumentar la eficiencia del vehı́culo (tener un motor más grande por ejemplo)
• β̂2 : en promedio (y manteniendo el resto constante), vehı́culos que son fabricados
en el extranjero cuestan un 27,92 % menos, por lo que habrı́a que, para aumentar su
precio, debiese escoger su producción en el paı́s. Sin embargo este valor es estadı́sti-
camente significativo al 2 % (pero no al 1 %) por lo que no serı́a necesariamente tan
certero para influir en el precio cómo las millas por galón.
• β̂3 : en promedio (y manteniendo el resto constante), un aumento del tamaño de
1 metro cúbico en la maleta, disminuye el costo del auto en 26 %, este valor es
altamente signiificativo y tiene un orden de magnitud muy elevado, por lo que esta
serı́a la principal alternativa para modificar el precio del auto.
• NOTA DE CORRECCIÓN: 6 puntos por hablar de cada pendiente por separado
y 3 por hablar de la significancia estadı́stica. Entregar un punto si es que habla de
estimaciones muestrales (utiliza los ”gorros”para los betas).

6
Teórico. (30 puntos)
El siguiente modelo poblacional estudia los determinantes del crimen en las diferentes
regiones de Chile:
delitosi = β0 + β1 habsi + β2 cabsi + ui (2)
Donde delitosi es el número de delitos (en miles de delitos) en la región i, habsi es el número
de habitantes (en miles de personas) de la región i, cabsi es el número de carabineros (en
miles) asignados a la región i y ui es un término de error no observado.
Considerando que el modelo cumple con los supuestos planteados en el curso y se sabe que
en Chile existen 16 regiones, responda:
a) Plantee el modelo anterior matricialmente de la forma Y=XB+U. Para esto, indique la
dimensión de las matrices y vectores X,Y,B y U (sea claro sobre cual es el contenido de
las matrices).[ 4 puntos] El Modelo matricial se encuentra dado por Y = Xβ + U con:
delitos1 1 habs1 cabs1 u1
     
 
 delitos2  1 habs2 cabs2  β0 u 
Y = .  ; X = .  ; β = β1  ; U =  .2 
 ..   ..   .. 
β2
delitos16 1 habs16 cabs16 u16
Donde la matriz Y es 16x1; X es 16x3; β es 3x1 y U es 16x1

7
b) Obtenga el estimador β̂ por MCO de manera matricial, para esto plantee el proble-
ma de minimización y señale que supuestos son necesarios para poder obtener dicho
estimador.[10 puntos]

8
c) Muestre que el estimador obtenido en el inciso b) es insesgado. Señale los supuestos que
permiten establecer la insesgadez .[8 puntos]

9
d) Muestre que la varianza condicional de β̂ está dada por V ar(β̂|X) = σ 2 (X 0 X)−1 .[8
puntos]

10
11
Formulario
Sea un modelo poblacional de interés a estimar:

Yi = β1 + β2 X2i + β3 X3i + ... + βk Xki + ui

β̂ = (X 0 X)−1 (X 0 y) V ar[β̂|X] = σ 2 (X 0 X)−1 σ̂ 2 = SCR


n−k

En un modelo de regresión simple: En un modelo de regresión múltiple:


2 σ̂ 2
V ar(βˆ1 |X) = P σ̂
(xi −x̄)2
V ar(βˆj |X) = P
(xj −x̄j )2 ∗(1−Rj2 )
Pn Pn
SCR = i û2 = U T U ; SCT= i (yi − ȳ)2 ;
Pn PK Pn
SCE= i (ŷi − ȳ)2 = k=2 (β̂k i=1 (Yi − Ȳ )(Xki − X̄k ))
SEC SRC SCR/(n−k) n−1
R2 = ST C
=1− ST C
; R̄2 = 1 − SCT /(n−1)
= 1 − (1 − R2 )( n−k )

Definiciones escalares:

V ar(z) = E((z − E(z))2 ) cov(z, x) = E((z − E(z))(x − E(x)))

Matriz de Varianzas y Covarianzas:

V ar(Z) = E((Z − E(Z))(Z − E(Z))T )

Test de Hipótesis:
β̂−β SCE/gl SCE/(k−1) R2 /(k−1)
t= ee(β̂)
; F = SCR/gl
= SCR/(n−k)
= (1−R2 )/(n−k)
;

Predicción Media (MRLS):


(X −X̄)2
1 
V ar(Ŷ0 ) = σ 2 + P 0 2 ; IC: Ŷ0 − tα/2 ∗ ee(Ŷ0 ) ≤ E(Y0 |X) ≤ Ŷ0 + tα/2 ∗ ee(Ŷ0 )
n i (Xi −X̄)

Predicción Individual (MRLS):


 1 (X −X̄)2 
V ar(Y0 − Ŷ0 ) = σ 2 1 + + P 0 2
n i (Xi −X̄)

IC: Ŷ0 − tα/2 ∗ ee(Y0 − Ŷ0 ) ≤ (Y0 |X) ≤ Ŷ0 + tα/2 ∗ ee(Y0 − Ŷ0 )

ANOVA:

Fuente de Variación gl SC SCM


Debido a la regresión k-1 SCE SCE/(k-1)
Debido a los residuos n-k SCR SCR/(n-k)
Total SCT n-1 -

12
13
14

También podría gustarte