Está en la página 1de 14

Universidad

del Valle
Facultad de Ciencias Sociales y Económicas
Programa Académico Economía
Econometría I (2017_02)
Taller N° 2 (Preparación Parcial N° 2)

En este taller se proponen algunas preguntas, basadas en algunos de los temas que se vieron en
la segunda parte del curso de Econometría I. El hecho de que no se consulte aquí por uno de los
temas vistos en clase, no lo exonera de poder ser preguntado en el parcial.

1. Explique la importancia del análisis de inferencia estadística.


2. Explique, incluso analíticamente, la necesidad de que los errores presenten una
distribución normal.
3. Explique y construya los intervalos de confianza para los 𝛽 y para 𝜎 # .
4. Explique las distintas pruebas de hipótesis: ¿Por qué se hacen? ¿Cómo se hacen? ¿Cómo
se resuelven?
5. Presente, bajo el enfoque matricial, las siguientes pruebas de hipótesis:
a. Significancia individual para cada parámetro del modelo
b. Significancia global de un modelo econométrico con 5 variables explicativas.
c. 𝛽$ + 3𝛽' = 0
d. 𝛽# + 2𝛽+ = 10
e. 𝛽$ + 𝛽# = 0
6. Demuestre el estadístico F para pruebas de significancia global o conjunta.
7. Explique, incluso analíticamente, en qué consiste el Método de Mínimos Cuadrados
Restringidos.
8. Discuta la importancia de la selección del nivel de significancia estadística.
9. Explique en que consiste el problema de predicción.
10. Explique, para el caso del análisis de regresión múltiple:
§ Su importancia. Piense en ejemplos.
§ Condiciones que deben cumplirse.
§ Por qué se habla de coeficientes de regresión parcial.
§ La diferencia entre el R2 y el R2 ajustado.
§ Cuándo se pueden comparar modelos y elegir el mejor a partir del coeficiente de
determinación.
11. Dado el modelo de regresión lineal múltiple, general:

𝑌. = 𝛽$ + 𝛽# 𝑋#. + 𝛽0 𝑋0. + ⋯ + 𝛽2 𝑋2. + 𝑈.


§ Construya las matrices y deduzca la expresión matricial.
§ Construya la matriz 𝑉𝑎𝑟 – 𝐶𝑜𝑣 (𝑼).
§ Realice la estimación por máxima verosimilitud de 𝛽 y 𝜎 # .
12. Demuestre las propiedades de muestra finita y las propiedades asintóticas de los
estimadores MCO. Explique la importancia de las anteriores propiedades.
13. Para los siguientes casos particulares del modelo de regresión múltiple, determine los
elementos de las matrices (𝑋 ? 𝑋)@$ y 𝑋’𝑌:
§ Modelo con una variable explicativa.
§ Modelo con dos variables explicativas.
§ Modelo ingenuo.

1

§ Modelo a través del origen.
14. Para los anteriores modelos, deduzca y construya la matriz 𝑉𝑎𝑟 – 𝐶𝑜𝑣 (𝛽).
15. Para el caso en el que el supuesto de perturbaciones esféricas no se cumple, explique,
incluso analíticamente, cómo puede corregirse este problema.
16. Explique en qué consisten las siguientes pruebas:
a. Breusch – Pagan
b. White
c. Goldfeld – Quant
d. Durbin – Watson
e. Breusch – Godfrey
f. Box – Pierce
17. Explique, para el caso de la serie de residuales, qué es un proceso:
a. Autorregresivo
b. Medias Móviles
c. ARMA
d. Gráficamente, ¿cómo se detectan las anteriores estructuras?
18. Para cada una de las siguientes salidas:
§ Escriba el modelo econométrico estimado.
§ Ofrezca una breve descripción teórica de la relación estimada.
§ Interprete los resultados: coeficientes, significancia estadística de los estimadores y
ajuste del modelo.
§ Explique la validez de los resultados interpretados.

Las variables son: crímenes violentos por cada 100 mil habitantes (crime), porcentaje de la
población que vive en las áreas metropolitanas (pctmetro), porcentaje de la población que es
blanca (pctwhite), porcentaje de la población con educación secundaria o más (pcths), porcentaje
de población que vive bajo la línea de pobreza (poverty) y porcentaje de la población que vive
solo (single).

Modelo 1

Source | SS df MS Number of obs = 51


-------------+------------------------------ F( 3, 47) = 82.16
Model | 8170480.21 3 2723493.4 Prob > F = 0.0000
Residual | 1557994.53 47 33148.8199 R-squared = 0.8399
-------------+------------------------------ Adj R-squared = 0.8296
Total | 9728474.75 50 194569.495 Root MSE = 182.07

------------------------------------------------------------------------------
crime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
pctmetro | 7.828935 1.254699 6.24 0.000 5.304806 10.35306
poverty | 17.68024 6.94093 2.55 0.014 3.716893 31.6436
single | 132.4081 15.50322 8.54 0.000 101.2196 163.5965
_cons | -1666.436 147.852 -11.27 0.000 -1963.876 -1368.996
------------------------------------------------------------------------------

2

Kernel density estimate

1.00
.0005 .001 .0015 .002 .0025

0.75
Normal F[(r1-m)/s]
Density

0.50
0.25
0

-600 -400 -200 0 200 400


Residuals

0.00
Kernel density estimate
Normal density
0.00 0.25 0.50 0.75 1.00
kernel = epanechnikov, bandwidth = 64.7519 Empirical P[i] = i/(N+1)
400

400
200

200
Residuals

Residuals
0

0
-200

-200
-400

-400
-600

-600

-400 -200 0 200 400 0 500 1000 1500 2000 2500


Inverse Normal Fitted values

Cameron & Trivedi's decomposition of IM-test

---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
Heteroskedasticity | 26.80 9 0.0015
Skewness | 8.48 3 0.0370
Kurtosis | 1.21 1 0.2716
---------------------+-----------------------------
Total | 36.49 13 0.0005
---------------------------------------------------

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of crime

chi2(1) = 12.86
Prob > chi2 = 0.0003

White's general test statistic : 26.79818 Chi-sq( 9) P-value = .0015

3

. linktest

Source | SS df MS Number of obs = 51


-------------+------------------------------ F( 2, 48) = 158.73
Model | 8450702.81 2 4225351.41 Prob > F = 0.0000
Residual | 1277771.93 48 26620.2486 R-squared = 0.8687
-------------+------------------------------ Adj R-squared = 0.8632
Total | 9728474.75 50 194569.495 Root MSE = 163.16

------------------------------------------------------------------------------
crime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_hat | .6251487 .128866 4.85 0.000 .3660463 .8842511
_hatsq | .0001881 .000058 3.24 0.002 .0000715 .0003046
_cons | 128.9669 57.66857 2.24 0.030 13.0165 244.9174
------------------------------------------------------------------------------

Ramsey RESET test using powers of the fitted values of crime


Ho: model has no omitted variables
F(3, 44) = 6.45
Prob > F = 0.0010

Modelo 2
Source | SS df MS Number of obs = 51
-------------+------------------------------ F( 2, 48) = 34.72
Model | 5752498.67 2 2876249.34 Prob > F = 0.0000
Residual | 3975976.07 48 82832.8349 R-squared = 0.5913
-------------+------------------------------ Adj R-squared = 0.5743
Total | 9728474.75 50 194569.495 Root MSE = 287.81

------------------------------------------------------------------------------
crime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
pctmetro | 11.59141 1.857111 6.24 0.000 7.857438 15.32538
poverty | 52.38643 8.895002 5.89 0.000 34.50183 70.27103
_cons | -915.2731 187.8704 -4.87 0.000 -1293.012 -537.5345
------------------------------------------------------------------------------
1.00

Kernel density estimate


.002

0.75
.0015

Normal F[(r2-m)/s]
Density
.001

0.50
.0005

0.25
0

-500 0 500 1000 1500


Residuals
0.00

Kernel density estimate


Normal density 0.00 0.25 0.50 0.75 1.00
kernel = epanechnikov, bandwidth = 94.6548 Empirical P[i] = i/(N+1)

4

1500

1500
1000

1000
Residuals

Residuals
500

500
0

0
-500

-500
-500 0 500 0 500 1000 1500 2000
Inverse Normal Fitted values

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z


-------------+--------------------------------------------------
r2 | 51 0.84082 7.604 4.331 0.00001

Cameron & Trivedi's decomposition of IM-test

---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
Heteroskedasticity | 31.05 5 0.0000
Skewness | 11.41 2 0.0033
Kurtosis | 1.28 1 0.2577
---------------------+-----------------------------
Total | 43.75 8 0.0000
---------------------------------------------------

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of crime

chi2(1) = 33.01
Prob > chi2 = 0.0000

White's general test statistic : 31.051 Chi-sq( 5) P-value = 9.2e-06

. linktest

Source | SS df MS Number of obs = 51


-------------+------------------------------ F( 2, 48) = 71.69
Model | 7288569.12 2 3644284.56 Prob > F = 0.0000
Residual | 2439905.63 48 50831.3673 R-squared = 0.7492
-------------+------------------------------ Adj R-squared = 0.7387
Total | 9728474.75 50 194569.495 Root MSE = 225.46

------------------------------------------------------------------------------
crime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_hat | -.2816666 .2513868 -1.12 0.268 -.7871137 .2237804
_hatsq | .0009772 .0001778 5.50 0.000 .0006198 .0013347
_cons | 308.2067 86.36478 3.57 0.001 134.5586 481.8547
------------------------------------------------------------------------------

5

Ramsey RESET test using powers of the fitted values of crime
Ho: model has no omitted variables
F(3, 45) = 17.55
Prob > F = 0.0000

Variable | VIF 1/VIF


-------------+----------------------
pctmetro | 1.00 0.996335
poverty | 1.00 0.996335
-------------+----------------------
Mean VIF | 1.00

Modelo 3

Source | SS df MS Number of obs = 51


-------------+------------------------------ F( 3, 47) = 42.67
Model | 17.3680756 3 5.78935852 Prob > F = 0.0000
Residual | 6.37641011 47 .1356683 R-squared = 0.7315
-------------+------------------------------ Adj R-squared = 0.7143
Total | 23.7444857 50 .474889713 Root MSE = .36833

------------------------------------------------------------------------------
logcrime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
pctmetro | .0176736 .0025383 6.96 0.000 .0125672 .02278
poverty | .0377406 .0140418 2.69 0.010 .0094921 .0659891
single | .1254237 .0313637 4.00 0.000 .0623281 .1885193
_cons | 3.053792 .2991109 10.21 0.000 2.452059 3.655526
------------------------------------------------------------------------------

Kernel density estimate


1.00
1

0.75
Normal F[(r3-m)/s]
Density
.5

0.50
0.25
0

-1 -.5 0 .5 1
Residuals
0.00

Kernel density estimate


Normal density
0.00 0.25 0.50 0.75 1.00
kernel = epanechnikov, bandwidth = 0.1464 Empirical P[i] = i/(N+1)

6

1

1
.5

.5
Residuals

Residuals
0

0
-.5

-.5
-1

-1
-1 -.5 0 .5 1 5 6 7 8 9
Inverse Normal Fitted values

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z


-------------+--------------------------------------------------
r3 | 51 0.96589 1.629 1.042 0.14867

Cameron & Trivedi's decomposition of IM-test

---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
Heteroskedasticity | 23.17 9 0.0058
Skewness | 4.30 3 0.2313
Kurtosis | 2.22 1 0.1361
---------------------+-----------------------------
Total | 29.68 13 0.0052
---------------------------------------------------

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of logcrime

chi2(1) = 1.87
Prob > chi2 = 0.1712

White's general test statistic : 23.16585 Chi-sq( 9) P-value = .0058

Source | SS df MS Number of obs = 51


-------------+------------------------------ F( 2, 48) = 77.37
Model | 18.1226683 2 9.06133415 Prob > F = 0.0000
Residual | 5.62181737 48 .117121195 R-squared = 0.7632
-------------+------------------------------ Adj R-squared = 0.7534
Total | 23.7444857 50 .474889713 Root MSE = .34223

------------------------------------------------------------------------------
logcrime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_hat | 3.159849 .8548647 3.70 0.001 1.441028 4.878669
_hatsq | -.1660976 .0654371 -2.54 0.014 -.2976677 -.0345274
_cons | -6.95005 2.785495 -2.50 0.016 -12.55066 -1.349436
------------------------------------------------------------------------------

7

Ramsey RESET test using powers of the fitted values of logcrime
Ho: model has no omitted variables
F(3, 44) = 3.20
Prob > F = 0.0325

Variable | VIF 1/VIF


-------------+----------------------
single | 1.63 0.612873
poverty | 1.53 0.654829
pctmetro | 1.14 0.873510
-------------+----------------------
Mean VIF | 1.43

19. Escoja cuál modelo es el mejor, según la siguiente información. Explique el por qué de su
elección.
. estimates table Modelo1 Modelo2 Modelo3, stats(N ll r2_a aic bic) star(.05 .01 .001)

--------------------------------------------------------------
Variable | Modelo1 Modelo2 Modelo3
-------------+------------------------------------------------
pctmetro | 7.8289349*** 11.591411*** .01767358***
poverty | 17.680244* 52.386428*** .03774059**
single | 132.40805*** .12542373***
_cons | -1666.4359*** -915.27314*** 3.0537923***
-------------+------------------------------------------------
N | 51 51 51
ll | -335.70652 -359.59672 -19.345746
r2_a | .82962992 .57427635 .7143162
aic | 679.41303 725.19345 46.691491
bic | 687.14034 730.98892 54.418794
--------------------------------------------------------------
legend: * p<.05; ** p<.01; *** p<.001

20. Interprete los resultados de las siguientes salidas:

Las variables son: años desde 1920 a 1941 (yr), consumo anual en millones de dólares (consump),
inversión anual en millones de dólares (investment), gasto gubernamental anual en millones de
dólares (govt).

Source | SS df MS Number of obs = 22


-------------+------------------------------ F( 2, 19) = 15.18
Model | 697.3906 2 348.6953 Prob > F = 0.0001
Residual | 436.384278 19 22.9675936 R-squared = 0.6151
-------------+------------------------------ Adj R-squared = 0.5746
Total | 1133.77488 21 53.9892799 Root MSE = 4.7925

------------------------------------------------------------------------------
consump | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
invest | .8090358 .3008994 2.69 0.015 .1792461 1.438825
govt | 2.054679 .4398081 4.67 0.000 1.13415 2.975208
_cons | 42.64354 2.317636 18.40 0.000 37.79267 47.49441
------------------------------------------------------------------------------

8

10
Kernel density estimate

.08

5
.06
Density

Residuals
.04

0
.02

-5
0

-10 -5 0 5 10
Residuals

Kernel density estimate

-10
Normal density
40 50 60 70 80
kernel = epanechnikov, bandwidth = 2.0476 Fitted values
1.00
0.50
Autocorrelations of rcosump

0.00
-0.50
-1.00

0 5 10 15
Lag
Bartlett's formula for MA(q) 95% confidence bands

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z


-------------+--------------------------------------------------
rcosump | 22 0.96506 0.885 -0.248 0.59778

Breusch-Godfrey LM test for autocorrelation


---------------------------------------------------------------------------
lags(p) | chi2 df Prob > chi2
-------------+-------------------------------------------------------------
1 | 12.309 1 0.0005
---------------------------------------------------------------------------
H0: no serial correlation

Durbin's alternative test for autocorrelation


---------------------------------------------------------------------------
lags(p) | chi2 df Prob > chi2
-------------+-------------------------------------------------------------
1 | 22.863 1 0.0000
---------------------------------------------------------------------------
H0: no serial correlation

9

Durbin-Watson d-statistic( 3, 22) = .4281544

. wntestq rcosump

Portmanteau test for white noise


---------------------------------------
Portmanteau (Q) statistic = 18.2893
Prob > chi2(9) = 0.0320

Cumby-Huizinga test with H0: errors nonautocorrelated at order 1


Test statistic: 12.309004
Under H0, Chi-sq(1) with p-value: .00045

21. Usted ha sido contratado por el Ministerio del Trabajo para realizar un análisis sobre el
comportamiento de los salarios que perciben los colombianos.
a. Discuta los problemas de información – piense en un escenario real – que puede enfrentar
en esta misión (¡¡si decide aceptarla!!). Máximo: 10 renglones.

Asuma que, después de plantear los posibles inconvenientes en la información, le hacen


entrega de una muestra de datos con las siguientes variables:

§ Antig: Número de años en el empleo actual


§ Salario: Ingreso laboral
o en el último empleo
§ Sexo: Toma valor 1 si es hombre; toma
§ Educ: Número de años de educación
valor 0 para otro caso.
§ Exper: Número de años de experiencia
laboral § Casado: Toma valor 1 si es casado (unión
libre); toma valor 0 para otro caso.

b. Plantee un modelo para explicar el comportamiento del ingreso laboral en función de, al
menos, cuatro (4) variables de las que se encuentran en la base de datos, explicando por
qué la inclusión de cada una. Máximo: 10 renglones.
c. Explique bajo qué condiciones, su modelo puede ser estimado y totalmente válido, a la
hora de interpretar los resultados. Máximo: 20 renglones.
d. Interprete dos de los coeficientes del modelo que propone, explicando el valor que se
espera arrojé en la estimación.

22. Dadas las siguientes salidas


a. Complete la información para cada una de ellas.
b. Escriba el modelo estimado e interprete dos de los coeficientes calculados, incluyendo
su significancia estadística.

10

c. Calcule e interprete los intervalos de confianza para dos de los coeficientes calculados,
con un nivel de confianza del 5%. Utilice todos los decimales.
d. Determine y explique cuál es el mejor modelo.

23. Dada la forma matricial del modelo de regresión lineal 𝑌 = 𝑋𝛽 + 𝑈 donde suponemos que
𝐸 𝑈 = 0 y 𝐸 𝑈𝑈′ = 𝜎 # Ω siendo

𝜆$ 0 … 0
0 𝜆# … 0
Ω=
⋮ ⋮ ⋱ 0
0 0 0 𝜆$

Para el caso del modelo a través del origen y en cada una de las siguientes situaciones, calcule el
estimador de Mínimos Cuadrados Generalizados, su varianza y muestre que a través de este método,
se corrige el problema de perturbaciones no esféricas.

a. (0.5) 𝜆. = 𝑋.
b. (0.5) 𝜆. = 𝑋.#

24. Con la siguiente expresión se puede estimar el nivel de producto alcanzado, en algún periodo,
dada la combinación de capital, 𝐾, y trabajo, 𝐿.
M M
𝑌K = 𝛼𝐿K N 𝐾K O ℮QR con 0 < 𝛽# + 𝛽0 < 1 y 𝑈~𝑁𝐼𝐷 0, 𝜎 # [2]

Usted, como investigador, haciendo uso de la expresión [2], ha obtenido las siguientes
estimaciones mínimo cuadráticas para, incluyendo el estadístico de Durbin – Watson, 𝐷𝑊, y
para un 𝑡 = 1,2,3, … , 20.

𝑌K∗ = 𝛼 ∗ + 𝛽# 𝐿∗K + 𝛽0 𝐾K∗ + 𝑈K

𝛼 ∗ = 0.05 𝛽# = 0.72 𝛽0 = 0.21

𝑒𝑒 𝛽# = 0.12 𝑒𝑒 𝛽0 = 0.10

𝐷𝑊 = 1.02 𝑅# = 0.98

11

A partir de los resultados anteriores:

a. (0.5) Su estimación, ¿presenta algún problema de perturbaciones no esféricas? Explique y


argumente su respuesta.
b. (0.5) Muestre la significancia estadística del capital, como factor de producción, en la
generación del nivel de producto 𝑡c,c#';$e = 2.567 .
c. (1.0) Demuestre el método con el que verificaría la hipótesis de rendimientos constantes a
escala.

25. (0.5) Demuestre, a través de un estadístico t – student, la importancia de que al Modelo Clásico
de Regresión Lineal se le adicione el supuesto de normalidad de las perturbaciones.

26. Dada la siguiente información:

§ Price: Precio en cientos de dólares de un vehículo


§ mpg: Kilometraje del vehículo
§ weight: Peso del vehículo (en libras)
§ length: Longitud del vehículo (en pulgadas)

Modelo 1: 𝑃𝑟𝑖𝑐𝑒. = 𝛼c + 𝛼$ 𝑚𝑝𝑔. + 𝛼# 𝑤𝑒𝑖𝑔ℎ𝑡. + 𝛼0 𝑙𝑒𝑛𝑔𝑡ℎ. + 𝑈.

Modelo 2:

𝑙𝑜𝑔 𝑃𝑟𝑖𝑐𝑒 . = 𝛽c + 𝛽$ 𝑙𝑜𝑔 𝑚𝑝𝑔 . + 𝛽# 𝑙𝑜𝑔 𝑤𝑒𝑖𝑔ℎ𝑡 . + 𝛽0 𝑙𝑜𝑔 𝑙𝑒𝑛𝑔𝑡ℎ . + 𝑈.

----------------------------------------------
Variable | Modelo1 Modelo2
-------------+--------------------------------
mpg | -86.789284
weight | 4.3647979***
length | -104.86817*
lmpg | -.6912728*
lweight | .61270746
llength | -1.041306
_cons | 14542.434* 11.287797**
-------------+--------------------------------
N | 74 74
r2_a | .32983543 .28633484
aic | 1366.7032 50.366416
bic | 1375.9195 59.582676
----------------------------------------------
legend: * p<.05; ** p<.01; *** p<.001

12

Pruebas para el Modelo 2

1.00
Kernel density estimate

.0002
.0001 .00015

0.75
Normal F[(rmodelo1-m)/s]
Density

0.50
.00005

0.25
0

-5000 0 5000 10000


Residuals

0.00
Kernel density estimate
Normal density
0.00 0.25 0.50 0.75 1.00
kernel = epanechnikov, bandwidth = 864.9203 Empirical P[i] = i/(N+1)

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z


-----------------+--------------------------------------------------
residmodelo1 | 74 0.95325 3.011 2.404 0.00810

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of price

chi2(1) = 16.21
Prob > chi2 = 0.0001

Y de acuerdo con los resultados reportados anteriormente, escoja o complete la respuesta


que considere correcta.

a. (0.3) Si la longitud del vehículo aumenta en una unidad, el precio del mismo
disminuirá en:
a.1 104.1%
a.2 4.1%
a.3 0.04%

b. (0.3) Para los residuales del Modelo 1 se _____________________ la hipótesis de


normalidad.

c. (0.3) Si el peso del vehículo aumenta en una unidad, el precio reportará un


incremento de:
c.1 43.6 unidades, aproximadamente.
c.2 0.61%, aproximadamente.
c.3 43.6%, aproximadamente.

d. (0.3) Entre las dos estimaciones realizadas, el ______________________ es el peor


modelo estimado.

13

e. (0.3) Para los residuales del Modelo 2 ________________________ el supuesto de
perturbaciones esféricas.

14