Está en la página 1de 7

Universidad Nacional Mayor de San Marcos

Facultad de Ciencias Económicas


Escuela Profesional de Economía
Curso: Econometría I Ciclo: 2018-I
Profesor: Alfonso L. Ayala Loro
Aula: 214-D

Examen Parcial 2 - Solución

1. Usted está estudiando el rendimiento por galón de una muestra de autos con la siguientes
variables, en una muestra de 392 autos, donde:

Mpg = millas por galón


Cyl = número de cilindros
Eng = desplazamientos del motor en pulgadas cubicas
Wgt = peso del carro en libras

Plantea que el rendimiento está relacionado con estas variables, tal que:

mpg = b0 + b1*cyl + b2*eng + b3*wgt + u

Obtiene lo siguiente:

reg mpg cyl eng wgt

Source | SS df MS Number of obs = 392


-------------+------------------------------ F( 3, 388) = 300.76
Model | 16656.4443 3 5552.1481 Prob > F = 0.0000
Residual | 7162.54916 388 18.4601782 R-squared = 0.6993
-------------+------------------------------ Adj R-squared = 0.6970
Total | 23818.9935 391 60.9181419 Root MSE = 4.2965

------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cyl | -.2677968 .4130673 -0.65 0.517 -1.079927 .5443336
eng | -.012674 .0082501 -1.54 0.125 -.0288944 .0035465
wgt | -.0057079 .0007139 -8.00 0.000 -.0071115 -.0043043
_cons | 44.37096 1.480685 29.97 0.000 41.45979 47.28213
------------------------------------------------------------------------------

Sin embargo si estima el modelo:


mpg = b0 + b1*cyl + u

Obtiene:
reg mpg cyl

Source | SS df MS Number of obs = 392


-------------+------------------------------ F( 1, 390) = 596.56
Model | 14403.0831 1 14403.0831 Prob > F = 0.0000
Residual | 9415.91039 390 24.14336 R-squared = 0.6047
-------------+------------------------------ Adj R-squared = 0.6037
Total | 23818.9935 391 60.9181419 Root MSE = 4.9136

------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cyl | -3.558078 .1456755 -24.42 0.000 -3.844486 -3.271671
_cons | 42.91551 .8348668 51.40 0.000 41.2741 44.55691
------------------------------------------------------------------------------

Usted calcula la matriz de correlaciones de las variables exógenas del primer modelo:

1
corr cyl eng wgt
(obs=392)

| cyl eng wgt


-------------+---------------------------
cyl | 1.0000
eng | 0.9508 1.0000
wgt | 0.8975 0.9330 1.0000

vif

Variable | VIF 1/VIF


-------------+----------------------
eng | 15.79 0.063345
cyl | 10.52 0.095098
wgt | 7.79 0.128391
-------------+----------------------
Mean VIF | 11.36

a. Comente que efectos de la multicolinealidad se han presentado. (1p)


Existe multicolinealidad, indicios: el estimador cyl cambia de -3.55 a -0.26. Un auto
con más cilindros debe tener mayor precio, sin embargo el signo contrario encontrado es
altamente negativo (-3.55), y llega a (-0.26). La variable se hace no significativa
individualmente en la regresión completa (t = -0.65).
Los factores de inflación de varianza de 2 variables (eng y cyl) son mayores a 10.
Las correlaciones entre variables es alta corr(cyl,eng) = 0.95 y corr(cyl, wgt) = 0.8975.

b. Pruebe si existe multicolinealidad con el test Farrar Glauber. (3 p)


X2 = -[n – 1 – 1/(6(2k + 5)] * log(det|corr|)
2
Si x tiene una distribución con v grados de libertad, donde v = k(k-1) / 2

X2 = -[ 392 – 1 – 1/(6(2(3) + 5)] * ln(det| corr| ) = -[ 392 – 1 – 1/(6(11)] *


ln(det| corr| ) = -[ 391 – 1/66] * ln(det| corr| ) = -[ 391 – 1/66] * ln(det| corr| ) = -
390.9848*ln(0.0123) = -390.9848*-4.3963 = 1718.90.
H0 : X son ortogonales, Ha : Xs no son ortogonales (hay multicolinealidad)
X2 tabla (3) = 7.81
X empírico > X2 tabla, hay multicolinealidad

2. Está estudiando el efecto de la educación en el ingreso de los hogares

Ingreso del hogar = b0 + b1*educación del padre + u


Obteniendo:

reg faminc he

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 1, 426) = 61.30
Model | 1.0455e+11 1 1.0455e+11 Prob > F = 0.0000
Residual | 7.2654e+11 426 1.7055e+09 R-squared = 0.1258
-------------+------------------------------ Adj R-squared = 0.1237
Total | 8.3109e+11 427 1.9463e+09 Root MSE = 41297

------------------------------------------------------------------------------
faminc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
he | 5155.483 658.4574 7.83 0.000 3861.254 6449.713
_cons | 26191.27 8541.108 3.07 0.002 9403.309 42979.23
------------------------------------------------------------------------------

Luego ingresa información de la educación de la madre en el modelo:

Ingreso del hogar = b0 + b1*educación del padre + b2*educación de la madre + u

2
Obteniendo:

reg faminc he we

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 2, 425) = 40.87
Model | 1.3405e+11 2 6.7027e+10 Prob > F = 0.0000
Residual | 6.9703e+11 425 1.6401e+09 R-squared = 0.1613
-------------+------------------------------ Adj R-squared = 0.1574
Total | 8.3109e+11 427 1.9463e+09 Root MSE = 40498

------------------------------------------------------------------------------
faminc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
he | 3131.509 802.908 3.90 0.000 1553.344 4709.674
we | 4522.641 1066.327 4.24 0.000 2426.711 6618.572
_cons | -5533.629 11229.53 -0.49 0.622 -27605.97 16538.71
------------------------------------------------------------------------------

a. Comente si existen signos del problema de variable omitida. (2p)

Si se elimina la variable we se incurre en sesgo de variable omitida porque esta variable


es significativa individualmente. Además, desde el punto de vista teórico esta variable es
importante en cuanto a su influencia en faminc. R2 varía fuertemente entre regresiones.

b. Plantee la prueba F para afirmar o descartar que existe el problema de variable


omitida (2 p).
697030000000−726540000000
1 29,510,000,0000
𝐹= 697030000000 = = 17.99
1,640,070,588
425

F(1,oo) = 3.84
F empírico > F tabla, los estimadores si son relevantes (diferentes de 0), se deben incluir
en el modelo.

c. Se estimó un test RESET, obteniéndose:

estat ovtest

Ramsey RESET test using powers of the fitted values of faminc


Ho: model has no omitted variables
F(3, 422) = 2.49
Prob > F = 0.0596

Comente que evidencia de mala especificación tiene (o no) según los resultados del test
anterior (3 p).

Partimos de la H0 : el modelo no tiene variables omitidas (correcta especificación), versus Ha


: el modelo tiene variables omitidas.

F tabla(3,oo) = 2.60

F empírico < F tabla, se acepta la H0, no hay variables omitidas.

d. Ahora de agrega la variable kl6, el número de niños/as menores de 6 años en el hogar


(se supone que a mayor número de niños que necesitan cuidado menor el tiempo
disponible para laborar). Y estima:

Ingreso del hogar = b0 + b1*educación del padre + b2*educación de la madre +


b3*kl6 + u

3
. reg faminc he we kl6

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 3, 424) = 30.43
Model | 1.4725e+11 3 4.9082e+10 Prob > F = 0.0000
Residual | 6.8384e+11 424 1.6128e+09 R-squared = 0.1772
-------------+------------------------------ Adj R-squared = 0.1714
Total | 8.3109e+11 427 1.9463e+09 Root MSE = 40160

------------------------------------------------------------------------------
faminc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
he | 3211.526 796.7026 4.03 0.000 1645.547 4777.504
we | 4776.907 1061.164 4.50 0.000 2691.111 6862.704
kl6 | -14310.92 5003.928 -2.86 0.004 -24146.52 -4475.326
_cons | -7755.33 11162.93 -0.69 0.488 -29696.91 14186.25
------------------------------------------------------------------------------

Además usted tiene el grafico de dispersión entre las variables.

5 10 15 0 1 2
400000
Family
income in 200000
2006
dollars
0
15
Husband
educational
10 attainment,
in years
5

15
Wife
educational
attainment, 10
in years
5
2
Number of
children less
1 than 6 years
old in
household
0
0 200000 400000 5 10 15

Y plantea el test Reset:

estat ovtest

Ramsey RESET test using powers of the fitted values of faminc


Ho: model has no omitted variables
F(3, 421) = 2.15
Prob > F = 0.0931

Comente los resultados de esta modificación, se queda con este último modelo?
Sustente. (2 p)

Incluir kl6 mejora los resultados del modelo (sube t de he y we), aumenta R2, si bien he y
we están positivamente correlacionadas, el efecto de la multicolinealidad es bajo.
F tabla(3,oo) = 2.37
F empírico < F tabla, se acepta la H0, no hay variables omitidas.

4
3. Suponga que lo ha contratado una empresa que le quiere hacer competencia a la vivienda
universitaria y está estudiando el precio de viviendas cerca de la universidad, en una
muestra donde:
Price = precio de la vivienda en miles de soles
Utown = variable binaria 1 si está cerca, 0 si está lejos
Sqft = pies cuadrados de la vivienda
Age = antigüedad de la vivienda
Pool = 1 si tiene piscina, 0 si no tiene.
Fplace = si tiene chimenea, 0 si no

Y obtiene los siguientes resultados:

reg price utown sqft utownsqft age pool fplace

Source | SS df MS Number of obs = 1000


-------------+------------------------------ F( 6, 993) = 1113.18
Model | 1548261.72 6 258043.619 Prob > F = 0.0000
Residual | 230184.426 993 231.807075 R-squared = 0.8706
-------------+------------------------------ Adj R-squared = 0.8698
Total | 1778446.14 999 1780.22637 Root MSE = 15.225

------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
utown | 27.45295 8.422582 3.26 0.001 10.92485 43.98105
sqft | 7.612177 .2451765 31.05 0.000 7.131053 8.0933
utownsqft | 1.299405 .3320478 3.91 0.000 .6478091 1.951001
age | -.1900864 .0512046 -3.71 0.000 -.2905681 -.0896048
pool | 4.377163 1.196692 3.66 0.000 2.028828 6.725498
fplace | 1.649176 .9719568 1.70 0.090 -.2581495 3.556501
_cons | 24.49999 6.191721 3.96 0.000 12.34963 36.65035
------------------------------------------------------------------------------

a) Interprete los coeficientes de utown, pool y fireplace. (1 p)

Si la vivienda está cerca la vivienda cuesta 27,452 soles más; pool si la vivienda tiene piscina
la casa cuenta 4377 soles más; fireplace si la vivienda tiene chimenea la vivienda 1649 soles
más.

b) Piensa que el término de interacción utown*sqft no es relevante y calcula nuevamente


el modelo, obteniendo:

reg price utown sqft age pool fplace

Source | SS df MS Number of obs = 1000


-------------+------------------------------ F( 5, 994) = 1313.84
Model | 1544711.83 5 308942.365 Prob > F = 0.0000
Residual | 233734.314 994 235.145185 R-squared = 0.8686
-------------+------------------------------ Adj R-squared = 0.8679
Total | 1778446.14 999 1780.22637 Root MSE = 15.334

------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
utown | 60.19623 .9715313 61.96 0.000 58.28975 62.10272
sqft | 8.318325 .1671728 49.76 0.000 7.990273 8.646377
age | -.192991 .0515666 -3.74 0.000 -.2941828 -.0917992
pool | 4.35257 1.205261 3.61 0.000 1.987422 6.717717
fplace | 1.39881 .976807 1.43 0.152 -.5180307 3.315651
_cons | 6.91188 4.289365 1.61 0.107 -1.505371 15.32913
------------------------------------------------------------------------------

Según lo visto en clases, es correcto hacer eso? (Hint: realice la prueba F) (2p)

5
233734.3−230184.4
1 3549.89
𝐹= 233734.3 = = 15.09
235.14
993

F(1,993) = 3.84
F empírico > F tabla, el estimador si es relevante (diferente de 0), se debe incluir en el
modelo.

Ahora observa la estabilidad de parámetros, según la prueba cusum cuadrado a los


coeficientes, tenemos:
CUSUM squared

1
CUSUM squared

9 1000
t

Comente los resultados de esta prueba. ( 1 p)

Los parámetros son estables.

4. Tiene una muestra de 74 tipos de escuelas: TECH técnicas, WORKER de trabajo


especializado, VOC vocacionales, y estima una función de costos

COST = b1 + b2 TECH + b3* WORKER + b4* VOC + b5*N + u

reg COST N TECH WORKER VOC

Source | SS df MS Number of obs = 74


---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
COST | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TECH | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
WORKER | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
VOC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------

Si la restricción restringida considerando solo el número de alumnos es:

reg COST N
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000

6
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
------------------------------------------------------------------------------
COST | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 339.0432 49.55144 6.842 0.000 240.2642 437.8222
_cons | 23953.3 27167.96 0.882 0.381 -30205.04 78111.65
------------------------------------------------------------------------------

Indique mediante una prueba F porque la primera regresión es mejor que la segunda.
(3p)
541,380,000,000−891,600,000,000
3 116,740,000,000
𝐹= 541,380,000,000
= = 14.87
7846,086,956.5
69

F(3,69) = 2.76
F empírico > F tabla, los estimadores si son relevantes (diferentes de 0), se deben incluir
en el modelo.

Good luck!

28/06/2018

También podría gustarte