Está en la página 1de 9

Ejercicios Resueltos (de examen)

Román Salmerón Gómez

1. Modelo lineal uniecuacional múltiple


1. Usando los siguientes datos, consumo nacional (Ct ) y renta nacional (Rt ) en España pa-
ra el periodo 1995-2005 a precios corrientes (109 euros), obtenga las estimaciones por
MCO, ası́ como las sumas de cuadrados total, explicada y residual, y el coeficiente de
determinación, para el modelo de regresión Ct = β1 + β2 Rt + ut .

Año Ct Rt
1995 349 388
1996 368 408
1997 388 433
1998 414 465
1999 444 498
2000 484 538
2001 518 574
2002 550 614
2003 586 656
2004 635 699
2005 686 748

A partir de la información muestral se tiene que:


   
t 11 6021 t 5422
X X= , X C= ,
6021 3443083 3104015

por lo que la estimación del modelo por MCO se obtiene a partir de:
     
−1 t 2′ 1234 −0′ 00371 5422 −12′ 8761
b
β= X X t
X C= · = .
−0′ 00371 0′ 00000678 3104015 0′ 924

bt = −12′8761 + 0′ 924Rt .
Por tanto, el modelo estimado queda: C
La suma de cuadrados explicada se obtiene a partir de la expresión:
 2
2 5422
SCE = βbt · X t C − n · C = 2798415′824 − 11 · = 125862′7334,
11

mientras que la de los residuos:

et e 182′ 1756
SCR = = = 20′ 2417,
n−k 11 − 2

1
donde se ha usado que:
     
349 345′ 6509 3′ 3491
 368   364′ 1317   3′ 8683 
     
 388   387′ 2327   0′ 7673 
     
 414   416′ 8019   −2′ 8019 
     
 444   447′ 2952   −3′ 2952 
     
e=C −C =
b
 484 −
  484′ 2567 =
  −0′ 2567 ,

 518   517′ 5221   0′ 4779 
     
 550   554′ 4837   −4′ 4837 
     
 586   593′ 2933   −7′ 2933 
     
 635   633′ 0270   1′ 9730 
686 678′ 3049 7′ 6951

y por tanto, et e = 182′ 1756.


Por otro lado, la suma de cuadrados totales será SCT = SCE + SCR = 125862′7334 + 182′ 1756 =
126044′909.
Finalmente, el coeficiente de determinación es:
SCE 125862′7334
R2 = = = 0′ 998554.
SCT 126044′909

2. Para el modelo Yt = β1 + β2 vt + β3 wt + ut se tienen los siguientes datos:

n = 12, SCT = 104′ 9167,


 ′   
−1 0 6477 −0′ 041 −0′ 0639 91
X tX =  −0′ 041 0′ 0071 −0′ 0011  , X t Y =  699  .
−0 0639 −0′ 0011 0′ 0152

448
Se pide:
a) Ajustar el modelo por el método de MCO y calcular el coeficiente de determinación.
b) Contraste de significación para β2 + β3 = 1.
c) Intervalo de predicción para E[Y ] sabiendo que v0 = 2′ 5 y w0 = −0′ 3.
La estimación del modelo por MCO se obtiene a partir de:
 ′     ′ 
 0 6477 −0′ 041 −0′ 0639 91 1 6545
βb = X t X
−1
X t Y =  −0′ 041 0′ 0071 −0′ 0011  ·  699  =  0′ 7391  .
−0 0639 −0′ 0011 0′ 0152

448 0′ 2258

Por tanto, el modelo estimado queda: Ybt = 1′ 6545 + 0′ 7391vt + 0′ 2258wt .


Para calcular el coeficiente de determinación tendremos en cuenta que:
2
SCE = βbt · X t Y − n · Y = 768′3488 − 690′ 083 = 78′ 2654,

donde se ha usado que:


 
91
βbt · X t Y = (1′ 6545 0′ 7391 0′ 2258) ·  699  = 768′ 3488,
448
y
X 91 2
Yt = 91 → Y = = 7′ 583 → Y = 57′ 5069.
12

2
Además, como SCT = 104′ 9167, el coeficiente de determinación será:

SCE 78′ 26547


R2 = = = 0′ 7459.
SCT 104′ 9167
Es decir, el ajuste realizado explica aproximadamente un 74’59 % de la variabilidad de Y .
Para el contraste de significación de la restricción H0 : β2 + β3 = 1, tendremos en cuenta que se rechaza
la hipótesis nula si:
 t h i−1  
Rβb − r · R (X t X) Rt · Rβb − r
−1

Fexp = > Fq,n−k (1 − α).


b2
q·σ

De la restricción β2 + β3 = 1 se obtiene que R = (0 1 1), r = 1 y q = 1, por lo que:


 ′ 
1 6545
Rβb − r = (0 1 1) ·  0′ 7391  − 1 = −0′ 0351,
0′ 2258

   
−1 0′ 6477 −0′ 041 −0′ 0639 0
R · X tX · Rt = (0 1 1) ·  −0′ 041 0′ 0071 −0′ 0011  ·  1 
−0′ 0639 −0′ 0011 0′ 0152 1
 
0
= (−0′ 1049 0′ 006 0′ 0141) ·  1  = 0′ 0201.
1

Y como:
SCR SCT − SCE 104′ 9167 − 78′ 2654 26′ 6512
b2 =
σ = = = = 2′ 962,
n−k n−k 12 − 3 9
se tiene que:
0′ 03512 0′ 0012
Fexp = = ′ = 0′ 0207 6> 5′ 117 = F1,9 (0′ 95),
2′ 962
· 0 0201
′ 0 0595
por lo que no se rechaza la hipótesis nula.
Finalmente, el intervalo de predicción para E[Y ] es:
 q
α
xt0 βb ± tn−k 1 − b · xt0 · (X t X)−1 · x0 .
·σ
2

Como:
xt0 βb = 1′ 6445 + 0′ 7391 · 2′ 5 + 0′ 2258 · (−0′ 3) = 3′ 43451,
   
−1 0′ 6477 −0′ 041 −0′ 0639 1
xt0 · X t X · x0 = (1 2′ 5 − 0′ 3) ·  −0′ 041 0′ 0071 −0′ 0011  ·  2′ 5 
−0 0639 −0′ 0011 0′ 0152

−0′ 3
 
1
= (0′ 56437 − 0′ 02292 − 0′ 07121) ·  2′ 5  = 0′ 528433,
−0′ 3

el intervalo de confianza al 95 % es:

3′ 43451 ± 2′ 2622 · 1′ 721 · 0′ 727 = (0′ 60451, 6′ 26451).

3
3. En un estudio de los determinantes de la inversión se usaron 20 datos anuales, correspon-
dientes a las siguientes variables: inversión anual en billones de pesetas (Y ), tipo de interés
en porcentaje (X1 ) y variación anual de PIB en billones de pesetas (X2 ). Se dispone de la
siguiente información:
P P P
P X1t = 100 P X2t = 24 P Yt = 5
X1t Yt = −255 X2t Yt = 146 X1t X2t = 100
P 2 P 2 P 2
X1t = 680 X2t = 48′ 8 Yt − Y = 1200

Se pide:
a) Obtenga las estimaciones por MCO del modelo Yt = α + βX1t + δX2t + u2 .
b) Contraste la significación global del modelo a partir del porcentaje de evolución tem-
poral de la inversión que puede explicarse por la influencia lineal del tipo de interés y
la variación anual del PIB.
c) Contraste la hipótesis nula: 
β1 = 1
.
β2 = 2
A partir de la información proporcionada en el enunciado se tiene que:
   
20 100 24 5
X t X =  100 680 100  , X t Y =  −255  .

24 100 48 8 146

Luego las estimaciones por MCO de los coeficientes del modelo serán:
 ′     
 0 3623 −0′ 0388 −0′ 0988 5 −2′ 725
βb = X t X
−1
X t Y =  −0′ 0388 0′ 0063 0′ 0063  ·  −255  =  −0′ 875  .
′ ′
−0 0988 0 0063 0′ 0562 146 6′ 125

Por tanto, el modelo estimado queda: Ybt = −2′ 725 − 0′ 875X1t + 6′ 125X2t .
Para el modelo sea significativo a partir del coeficiente de determinación se ha de verificar que:
k−1
n−k · Fk−1,n−k (1 − α)
R2 > k−1
2
= Rsig .
1 + n−k · Fk−1,n−k (1 − α)

Puesto que: 

5
βbt · X t Y = (−2′ 725 − 0′ 875 6′ 125) ·  −255  = 1103′7,
146
y
X 5
Yt = 5 → Y = = 0′ 25 → n · Y = 1′ 25,
20
es claro que SCE = βbt · X t Y − n · Y = 1103′ 7 − 1′ 25 = 1102′ 45. Y como el enunciado nos proporciona
P 2
que SCT = Yt − Y = 1200, se obtiene que:

1102′45
R2 = = 0′ 9187.
1200

Por otro lado:


2
2 · 3′ 59
17 0′ 4224
Rsig = 2 = ′ = 0′ 2969.
1 + · 3 59
17
′ 1 4224

4
Por tanto, como R2 > Rsig
2
, podemos afirmar que el modelo es significativo.
Finalmente, para contrastar la hipótesis

β1 = 1
H0 : ,
β2 = 2

se tiene que    
0 1 0 1
R= , r= , q = 2.
0 0 1 2

En tal caso:
 
  −2′ 725        
0 1 0 1 −0′ 875 1 −1′ 875
Rβb − r = ·  −0′ 875  − = − = ,
0 0 1 2 6′ 125 2 4′ 125
6′ 125

   
  0′ 3623 −0′ 0388 −0′ 0988 0 0
−1 0 1 0
R · X tX · Rt = ·  −0′ 0388 0′ 0063 0′ 0063  ·  1 0 
0 0 1
−0′ 0988 0′ 0063 0′ 0562 0 1
 ′ ′

−0 0063 0 0063
= .
0′ 0063 0′ 0562

Por otro lado:


97′ 55
b2 =
SCR = SCT − SCE = 1200 − 1102′ 45 = 97′ 55 → σ = 5′ 7382,
17
y entonces:
   
178′7702 −20′ 0401 −1′ 875
(−1′ 875 4′ 125) · ·
−20′ 0401 20′ 0401 4′ 125 1279′5
Fexp = = = 111′ 4897.
2 · 5′ 7382 11′ 4764

Como Fexp > 3′ 59 = F2,17 (0′ 95), se rechaza la hipótesis nula.


4. Se desea estudiar la influencia que sobre la demanda de carne de vacuno ha tenido el
precio de la carne de cerdo (X1 ) y de la ternera (X2 ). Para ello se han tomado datos
anuales desde 1979 a 2001 (ambos inclusive), obteniéndose los siguientes resultados:

Ybt = 2′ 1 + 0′ 7X1t − 1′ 5X2t , R2 = 0′ 9, SCE = 126.

¿Se podrı́a afirmar, para un nivel de confianza del 95 %, que los precios no influyen sobre
la demanda de ternera?
Para saber si los precios de la carne de cerdo y de ternera influyen en la demanda de la carne estudia-
remos la significación conjunta del modelo. Puesto que:
R2
k−1 0′ 9/2 0′ 45
Fexp = 1−R2
= = = 90 > 3′ 49 = F2,20 (0′ 95) = Fk−1,n−k (1 − α),
n−k
0′ 1/20 0′ 005

concluimos que se rechaza la hipótesis nula de que todos los coeficientes de las variables explicativas
son nulos de forma simultánea, por lo que los precios de la carne influyen sobre la demanda.

5
5. Para estimar el modelo Yt = β1 + β2 X2t + β3 X3t + ut se ha obtenido una muestra de la cual
ha resultado:
   
14 7 14 10
X t X =  7 4′ 5 7  , X tY =  6 , Y t Y = 14.
14 7 15 12

Se pide:
a) Estimar los coeficientes del modelo por MCO.
b) Estudiar la significación del modelo.
c) Contrastar la hipótesis β2 + 1 = β3 .
d) Calcular el intervalo de predicción al 95 % para Y sabiendo que X2 = 5 y X3 = 7.
Las estimaciones por MCO de los coeficientes del modelo serán:
 ′     
 1 3214 −0′ 5 −1 10 −1′ 7857
βb = X t X
−1
X t Y =  −0′ 5 1 0 · 6 = 1 .
−1 0 1 12 2

Por tanto, el modelo estimado queda: Ybt = −1′ 7857 + X2t + 2X3t .
Para estudiar la significación global del modelo recurriremos al contraste ANOVA, de manera que el
modelo será significativo si

SCE/k − 1
Fexp = > Fk−1,n−k (1 − α).
SCR/n − k

Teniendo en cuenta que:


 
10
βbt · X t Y = (−1′ 7857 1 2) ·  6  = 12′ 1429,
12

y1
X 10
Yt = 10 → Y = = 0′ 7143,
14
2 2
se tiene que SCE = βbt · X t Y − n · Y = 12′ 1429 − 14 · 0′71432 = 4′ 9998. Además, SCT = Y t Y − n · Y =
14 − 14 · 0′ 71432 = 6′ 8569. Por tanto, SCR = SCT − SCE = 1′ 8571.
Con todo ello:
4′ 9998/2
Fexp = = 14′ 8074 > 3′ 98 = F2,1 (0′ 95).
1′ 8571/11
Esto es, el modelo es significativo.
Para contrastar la hipótesis H0 : β2 + 1 = β3 , tendremos que tener en cuenta que R = (0 1 − 1), r = −1
y q = 1. En tal caso:  
−1′ 7857
Rβb − r = (0 1 − 1) ·  1  + 1 = 0,
2
lo cual conduce a que Fexp = 0 6> 4′ 84 = F1,11 (0′ 95) = Fq,n−k (1 − α). Por tanto, no se rechaza la
hipótesis nula.
1 El primer elemento de la matriz X t X indica que n = 14.

6
Finalmente, el intervalo de predicción para Y es:
 q
α
xt0 βb ± tn−k 1 −
−1
·σb · 1 + xt0 · (X t X) · x0 .
2
Como:  
−1′ 7857
xt0 βb = (1 5 7) ·  1  = 17′ 2143,
2
SCR 1′ 8571
b2 =
σ = = 0′ 1688 → σ
b = 0′ 4109,
n−k 11
   
−1 1′ 3214 −0′ 5 −1 1
xt0 · X t X · x0 = (1 5 7) ·  −0′ 5 1 0 · 5 
−1 0 1 7
 
1
= (−8′ 1786 4′ 5 6) ·  5  = 56′ 3214,
7

el intervalo de confianza al 95 % es:

17′ 2143 ± 2′ 201 · 0′ 4109 · 7′ 5711 = (10′ 3671, 24′ 0615).

6. Al objeto de determinar si existen o no diferencias en las calificaciones obtenidas por hom-


bres y mujeres en una determinada asignatura, a partir de 20 observaciones se estimó el
modelo:
notat = β0 + β1 notamediaBU Pt + β2 generot + ut ,
donde la variable genero toma el valor 1 si se trata de una mujer y 0 para un varón. Los
resultados de la estimación fueron los siguientes:

dt
nota = 25 + 0’75 notamediaBU Pt + 20’5 generot R2 = 0’72
(4’5) (7’1) (2’3)

¿Puede decirse que los resultados de unos y otros son distintos?


Teniendo en cuenta que la nota esperada para un varón y una mujer son, respectivamente:

E [notat /generot = 0] = β0 + β1 notamediaBU Pt ,

E [notat /generot = 1] = β0 + β1 notamediaBU Pt + β2 ,


se tiene que, para una misma nota media en BUP, la diferencia esperada entre la nota de una mujer y
un hombre viene determinada por

E [notat /generot = 1] − E [notat /generot = 0] = β2 .

Como el contraste de significación individual para dicho parámetro es significativo:



20 5
texp = ′ = 8′ 913 > 2′ 0003 = t60 (0′ 975),
23
se tiene que dicho parámetro es distinto de cero. Por tanto, puede afirmarse que los resultados de unos
y otros son distintos.
Además, como la estimación de dicho parámetro es positiva, la nota esperada para una mujer es mayor
que la de un hombre (siempre y cuando tengan la misma nota media en BUP).

7
7. Con información muestral relativa a 14 observaciones, se pretende estimar el modelo de
regresión:
Yt = β0 + β1 X1t + β2 X2t + β3 X3t + ut ,
a partir de:
   
14 248
 85 631   1622 
X tX = 
 532 3126 20666
,
 X tY =  
 9202  .
2094 13132 78683 317950 37592
Se pide:
a) Calcular las estimaciones de los parámetros del modelo por MCO.
 
b) Estimar V ar βb .
c) ¿Influyen las variaciones de X2t en la variable dependiente?
d) Calcular el coeficiente de determinación corregido.
e) Calcular un intervalo de confianza del 95 % para la varianza del término de perturba-
ción.
f ) Contrastar la significación global del modelo al 95 %.
Las estimaciones de los parámetros del modelo son:
−1 t
βb = X t X X Y
 ′
  
20 164 0′ 015065 −0′ 23145 −0′ 7617 248
 0′ 015065 0′ 013204 0′ 001194 −0′ 00094   1622 
=   −0′ 23145 0′ 001194 0′ 003635 0′ 000575
·
  9202 

−0′ 7617 −0′ 00094 0′ 000575 0′ 000401 37592


 
32′ 891
 0′ 80371 
=  
 −0′ 3982  .
−0′ 03713

Por otro lado, teniendo en cuenta (por construcción del vector X t Y ) que:
X 248
Yt = 248 → Y = = 17′ 714,
14
y que:
βbt · X t Y = 4552′552,
se tiene que SCE = βbt · X t Y − n · Y = 4552′552 − 14 · 17′ 7142 = 159′ 551.
Entonces, puesto que en el enunciado se nos indica que SCT = 226′ 86, es inmediato que SCR =
SCT − SCE = 67′ 308 y, por tanto:
SCR 67′ 308
b2 =
σ = = 6′ 7308.
n−k 14 − 4
 
Luego, la estimación de V ar βb corresponde a:
 
1′ 3575 0′ 00101 −0′ 0155 −0′ 00512
   0′ 00101
d −1 0′ 000888 0′ 00008 −0′ 000063 
V ar βb = σ
b2 · X t X =
 −0 0155
.
′ ′
0 00008 0′ 00024 0′ 000038 
−0′ 00512 −0′ 000063 0′ 000038 0′ 000027

8
A partir de ambas estimaciones podremos determinar si las variaciones de X2t influyen en Yt :

−0′ 3982

texp = √ = 25′ 704 > 2′ 228 = t10 (0′ 975).
0′ 00024
Evidentemente se rechaza que β2 = 0, por lo que X2t influye en la variable dependiente.
Para calcular el coeficiente de determinación corregido tendremos en cuenta la siguiente expresión:
2  n−1
R = 1 − 1 − R2 · .
n−k

159′ 551
Puesto que R2 = 226′ 86 = 0′ 7033 es claro que:

2 13
R = 1 − (1 − 0′ 7033) · = 0′ 6143.
10
Podemos observar que al eliminar la influencia de las variables explicativas el coeficiente de determina-
ción ha disminuido alrededor del 9 %.
El intervalo de confianza para σ 2 es:
!  
b2 (n − k) · σ
(n − k) · σ b2 10 · 6′ 7308 10 · 6′ 7308
, = , = (3′ 286, 20′73).
χ2n−k,1− α χ2n−k, α 20′ 483 3′ 247
2 2

Finalmente, para contrastar la significación conjunta del modelo construiremos la tabla ANOVA:

Fuente Variación Suma de Cuadrados Grados de Libertad Medias


Explicada 159’551 3 53’1836
Residual 67’308 10 6’7308
Total 226’86 7’9015

Como Fexp = 7′ 9015 > 3′ 71 = F3,10 (0′ 95), se rechaza la hipótesis nula de que todos los coeficientes son
nulos de forma simultánea, por tanto, el modelo es significativo en su conjunto.

2. Multicolinealidad
1. Dadas las siguientes matrices:
     
1 4 13 1 −5 3 1 −2 3′ 0001
X =  1 1 4 , X =  1 3 44  , X= 1 −3 4 ,
1 5 16 1 0 6 1 5 −3′ 9999

analice en cada caso la posible existencia de multicolinealidad.


En el caso de la primera matriz, puesto que la tercera columna se obtiene sumando a la primera el triple
de la segunda, estamos ante un claro ejemplo de multicolinealidad perfecta (su determinante es cero),
mientras que las columnas de la segunda matriz son linealmente independientes (determinante igual a
-181), por lo que no hay multicolinealidad en este caso. Finalmente, en la tercera matriz se muestra
un caso de multicolinealidad aproximada, ya que la primera fila menos la tercera es aproximadamente
igual a la segunda (determinante igual a 0’0007).
Xt
2. Si en el modelo Yt = α + βXt + δZt + ut se cumple que = λ constante. ¿Qué parámetros
Zt
se pueden estimar?

También podría gustarte