Está en la página 1de 19

Taller Stata 3

Econometría 2

Integrantes:
Valeria García Ortiz
Anlly Lorena Ibarra

Universidad autónoma latinoamericana


Facultad de economía
Medellín
2021
1.Use los datos en trafico.dta para este ejercicio. Estos datos mensuales, sobre los accidentes de
tránsito en California entre los años 1981 y 1989, que se utilizaron para la tarea anterior, puede
encontrar los datos en la página del curso y la descripción de las variables aparece en la tarea
anterior

i) Genere la variable ltotacct como el logaritmo natural de la variable totacc (ltotacct=ln(totacc)).


Mediante la regresión estándar de Dickey-Fuller, pruebe si ltotacct tiene una raíz unitaria. ¿Puede
rechazar una raíz unitaria al nivel de 2?5%?
Source SS df MS Number of obs = 107
F(1, 105) = 10.96
Model .046128146 1 .046128146 Prob > F = 0.0013
Residual .441952568 105 .004209072 R-squared = 0.0945
Adj R-squared = 0.0859
Total .488080714 106 .004604535 Root MSE = .06488

ltotacct_D1 Coef. Std. Err. t P>|t| [95% Conf. Interval]

ltotacct_L1 -.1923296 .0580973 -3.31 0.001 -.3075259 -.0771333


_cons 2.051337 .6192484 3.31 0.001 .823482 3.279192

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -3.310 -3.508 -2.890 -2.580

MacKinnon approximate p-value for Z(t) = 0.0144

H 0=hay raiz unitaria

H a=no hay raiz unitaria

Regla de decisión: rechazamos si: t-estadístico < Valor Crítico

Con un Test-Statistic de -3.310, rechazamos la hipótesis nula H} rsub {0} ,¿con un valor crítico
de -3.12 y un nivel de significancia al 2,5%, ya que -3.310<-3.12. Concluimos que la variable Itotacc
no tiene raíz unitaria.

Con un nivel de significancia del 5%, también podemos rechazar la hipótesis nula “ H 0”, ya que
-3.31<-2.86.
ii) Ahora agregue dos cambios rezagados a la prueba del inciso i) y calcule la prueba de Dickey-
Fuller aumentada. ¿Qué concluye?

Augmented Dickey-Fuller test for unit root Number of obs = 105

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -1.501 -3.508 -2.890 -2.580

MacKinnon approximate p-value for Z(t) = 0.5328

Con un test Statistic de -1.502, y los respectivos valores críticos, además agregándole dos rezagos
a nuestra prueba, no podemos rechazar la hipótesis nula “ H 0”, a ningún nivel de significancia. Por
lo tanto, podemos afirmar que la serie tiene raíz unitaria.

iii) Agregue una tendencia temporal lineal a la regresión DF aumentada del inciso ii). Ahora ¿qué
sucede?
Augmented Dickey-Fuller test for unit root Number of obs = 105

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -3.666 -4.038 -3.449 -3.149

MacKinnon approximate p-value for Z(t) = 0.0247

Para este caso, el Test Statistic nos da -3.666, y el valor crítico al 5% es de -3.449, por lo tanto,
rechazamos la hipótesis nula “ H 0”, puesto que -3.666<-3.449. Podemos concluir que al añadirle al
modelo dos rezagos y agregándole una tendencia temporal a la regresión, eliminamos el problema
de raíz unitaria.

v) Dados los resultados del inciso i) a iii), ¿qué diría que es la mejor caracterización de ltotacct: un
proceso I(1) o un proceso I(0) acerca de una tendencia temporal lineal?
Augmented Dickey-Fuller test for unit root Number of obs = 105

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -4.744 -3.508 -2.890 -2.580

MacKinnon approximate p-value for Z(t) = 0.0001

El Test Statistic es de -4.744, y es menor que todos los valores críticos que nos arrojó la prueba.
Podemos concluir que, sin importar el nivel de significancia, rechazamos la hipótesis nula. Por lo
tanto, no hay presencia de raíz unitaria.
Augmented Dickey-Fuller test for unit root Number of obs = 105

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -5.288 -4.038 -3.449 -3.149

Cuando incluimos la tendencia temporal, se continúa rechazando la hipótesis nula “ H 0 . teniendo


en cuenta los tres niveles de significancia que nos arrojó la prueba (DF aumentada). Concluimos
que no hay presencia de raíz unitaria en nuestra serie de tiempo.

2. Para el siguiente ejercicio use los datos de fecundidad.dta que hemos utilizado en tareas
anteriores. La descripción de los datos puede encontrarla en la tarea 1

i) Corra una regresión de la tasa de fecundidad total gfr en función de las exenciones tributarias pe
y una tendencia temporal lineal. Luego corra la misma regresión con las variables en diferencias y
la tendencia temporal. ¿Qué tan diferentes son los resultados? ¿Confiaría usted en los coeficientes
de las variables a niveles?
. reg gfr pe tendencial

Source SS df MS Number of obs = 72


F( 2, 69) = 34.53
Model 13929.0853 2 6964.54264 Prob > F = 0.0000
Residual 13918.8101 69 201.721886 R-squared = 0.5002
Adj R-squared = 0.4857
Total 27847.8954 71 392.223879 Root MSE = 14.203

gfr Coef. Std. Err. t P>|t| [95% Conf. Interval]

pe .186662 .0346265 5.39 0.000 .1175841 .2557399


tendencial -.9051881 .1089923 -8.31 0.000 -1.122622 -.6877543
_cons 109.9302 3.47526 31.63 0.000 102.9972 116.8631

Augmented Dickey-Fuller test for unit root Number of obs = 70

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -2.425 -3.552 -2.914 -2.592

MacKinnon approximate p-value for Z(t) = 0.1348

H 0=Si hay raiz unitaria

H a=No hay raiz unitari

Al realizar la prueba de Dickey-Fuller Aumentada, observamos que el modelo presenta el


problema de raíz unitaria, no rechazamos la hipótesis nula, para ninguno de los valores críticos
que nos arrojó el test. Por lo que se puede considerar poca evidencia de cointegración en entre gfr
y pe, aun con tendencias separadas, indicando probabilidad de problema de regresión espuria.
Como observamos los coeficientes nos están dando significativos, pero como analizaremos en la
próxima regresión, nos da que ninguno de los coeficientes es estadísticamente significativo.
. reg d1.gfr d1.pe tendencial

Source SS df MS Number of obs = 71


F( 2, 68) = 1.16
Model 42.0144941 2 21.0072471 Prob > F = 0.3185
Residual 1227.56788 68 18.0524688 R-squared = 0.0331
Adj R-squared = 0.0047
Total 1269.58238 70 18.1368911 Root MSE = 4.2488

D.gfr Coef. Std. Err. t P>|t| [95% Conf. Interval]

pe
D1. -.0441285 .0289463 -1.52 0.132 -.1018899 .0136329

tendencial -.007633 .0249413 -0.31 0.761 -.0574026 .0421367


_cons -.5006447 1.057064 -0.47 0.637 -2.609983 1.608694

Podemos decir que su primera diferencia tiene como ventaja convertir un proceso integrado de
series de tiempo en un proceso débilmente dependiente. Los resultados a niveles parecen
confiables, siendo lógico pensar que las personas tendrán más hijos si reciben como beneficio una
exención tributaria. Por último, podemos concluir que los coeficientes de estas variables no son
estadísticamente significativos.

ii) Pruebe que la serie gfr es I(1), para hacerlo utilice un test DF aumentado con tendencia
temporal, con un rezago.
. dfuller gfr, lags(1) trend

Augmented Dickey-Fuller test for unit root Number of obs = 70

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -1.474 -4.106 -3.480 -3.168

MacKinnon approximate p-value for Z(t) = 0.8378

No se rechaza H0 bajo ningún nivel de significancia, por lo tanto, gfr presenta raíz unitaria, siendo
así la serie gfr I (1).

La serie es I (1) ,el coeficiente de gfrL1 (ϴ) no es significativo, por lo que se asume que es cero, por
tanto, no se puede rechazar la hipótesis nula, de que ϴ= 0, que implica la existencia de raíz
unitaria. Por otro lado, la prueba automática de DF nos dice que el estadístico de prueba es -1.474,
el cual es menor a los valores críticos en valor absoluto, como, por ejemplo; menor al -3.41 al 5%
de significancia, no se puede rechazar la hipótesis nula Ho: ϴ= 0 →Hay Raíz unitaria.
Podemos concluir que, la serie gfr es I (1). Es importante tener presente los procesos de raíz
unitaria, estos son integrados de orden uno, o I (1). Lo que significa que la primera diferencia del
proceso es débilmente dependiente (y a menudo estacionaria). Una serie de tiempo I (1) a
menudo se considera un proceso estacionario en diferencias.

iii) Pruebe que la serie pe es I(1), , para hacerlo utilice un test DF aumentado con tendencia
temporal, con un rezago.
. dfuller pe, lags(1) trend

Augmented Dickey-Fuller test for unit root Number of obs = 70

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -1.471 -4.106 -3.480 -3.168

MacKinnon approximate p-value for Z(t) = 0.8388

No se rechaza H0 bajo ningún nivel de significancia, por lo tanto, “pe” presenta raíz unitaria, siendo
así la serie pe I (1).

La serie pe es I (1), el coeficiente de peL1 (ϴ) no es significativo, por lo que se asume que es cero,
por lo tanto, no se puede rechazar la hipótesis nula, de que ϴ= 0, que implica la existencia de raíz
unitaria. La prueba aumentada de DF nos dice que el estadístico de prueba es -1.471, menor a
todos los valores críticos en valor absoluto, por lo cual no se puede rechazar la Ho: ϴ= 0 → Raíz
unitaria. En conclusión, la serie pe es I (1).

iv) Haga un test de co-integración que permita controlar por una tendencia temporal lineal y
comente el resultado del test. Cuáles son las implicaciones en cada posible resultado del test.

Se obtiene que pe I (1)


. dfuller pe

Dickey-Fuller test for unit root Number of obs = 71

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -1.646 -3.551 -2.913 -2.592

MacKinnon approximate p-value for Z(t) = 0.4593

Se obtiene que gfr I (1)


. dfuller gfr

Dickey-Fuller test for unit root Number of obs = 71

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -0.857 -3.551 -2.913 -2.592

MacKinnon approximate p-value for Z(t) = 0.8019

. reg gfr pe

Source SS df MS Number of obs = 72


F( 1, 70) = 0.04
Model 15.5100386 1 15.5100386 Prob > F = 0.8440
Residual 27832.3854 70 397.605505 R-squared = 0.0006
Adj R-squared = -0.0137
Total 27847.8954 71 392.223879 Root MSE = 19.94

gfr Coef. Std. Err. t P>|t| [95% Conf. Interval]

pe -.007095 .035923 -0.20 0.844 -.0787411 .0645511


_cons 96.34429 4.304734 22.38 0.000 87.75877 104.9298

Combinación lineal gfrt −βpe t


Dickey-Fuller test for unit root Number of obs = 71

Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value

Z(t) -0.817 -3.551 -2.913 -2.592

MacKinnon approximate p-value for Z(t) = 0.8140

La combinación lineal entre gfr y pe es I (1), por lo tanto, estas no están co-integradas; puede que
una regresión de grft en pet sea espuria y no posea resultados significativos, así no hay una
relación entre gfr y pe en el largo plazo.

Haciendo un test de DF ampliado con tendencia, el cual permite controlar por una tendencia
temporal lineal, nos damos cuenta de que no hay cointegración entre las variables, puesto que el
valor del estadístico de prueba es menor (en valor absoluto) que los valores críticos, por ende, no
se puede rechazar la hipótesis nula de no cointegración. Se concluye que no existe una relación
estable a largo plazo entre las variables, es decir una combinación lineal entre estas variables nos
da como resultado una serie I (1).

3. Para el siguiente ejercicio use los datos mroz.dta que encontrará en la página del curso. La
descripción de los datos es la siguiente:
i) Estime un modelo Logit de la probabilidad de participar en el mercado laboral incluyendo las
variables explicativas exper, exper2, nwifeinc, age, kidslt6 y kidsge6

Podemos decir que solo “exper, expersq, age y kidslt6” son estadísticamente significativas, siendo
la de mayor valor o impacto positivo en la PEA en orden descendente la variable exper seguida de
kidslt6, expersq y age.

ii) Estime los efectos marginales e interprete las magnitudes y significancia

Teniendo en cuenta el punto anterior las únicas variables que no son significativas para la PEA son
los ingresos no laborales (nwifeinc) y número de hijos entre 6 y 18 (kidsge6) por el contrario las
demás variables arrojaron resultados significativos del 99% .

 Exper: la experiencia laboral para un individuo trae consigo un aumento en un


5,29% la probabilidad de que haga parte de la PEA.
 Expersq: para un año adicional en la (experiencia laboral^2) disminuye un 0.082%
la probabilidad de pertenecer a la PEA. El resultado anterior nos deja inferir que a
partir de unos años este coeficiente ya no genera probabilidades positivas de
pertenecer a la PEA sino todo lo contrario llega un punto donde la experiencia ya
no aumenta esa probabilidad no aumenta, sino que disminuye y esto lo podemos
asociar a un exceso capacitación.
 Age: para la variable edad un aumento en un año genera una disminución de un
2,32% de un individuo a pertenecer a la PEA, esto puede deberse a que entre más
edad las personas tienen menores capacidades físicas para generar producción.
 kidslt6: para aquellos que tienen hijos menores de 6 años la probabilidad de
pertenecer a la PEA disminuye en un 32,1% debido a la responsabilidad de tener
un hijo menor de 6 años y trabajar.
iii) Haga un test para evaluar la significancia conjunta de las variables que describen la presencia
de niños en el hogar

( 1) [inlf]kidslt6 = 0
( 2) [inlf]kidsge6 = 0

chi2( 2) = 47.17
Prob > chi2 = 0.0000

Por medio de la prueba de significancia conjunta de las variables que describen la presencia de
niños en el hogar, esta no muestra que son estadística y conjuntamente significativas, pues su
probabilidad es menor al 5%. Por lo tanto, a un nivel de significancia menor al 1%, no hay
significancia conjunta en las variables de presencia de niños en el hogar.

3. Como la fecundidad afecta la oferta laboral? Usando el archivo fertility.dta que se encuentra en
la página del curso, resuelva el siguiente problema. Encuentre a continuación una descripción de
las variables incluidas en el archivo.
a. Regrese la variable weeksm1 como función del indicador morekids usando OLS. Interprete los
resultados. (coeficientes, significancia)

Problema de endogeneidad (cov(x,u)diferente de cero). Fertilidad y mano de obra se determinan


conjuntamente, variable fertilidad no puede ser dependiente y exógena al mismo tiempo, los
padres de hijos que tienen el mismo sexo es probable que continúen teniendo hijos, y dado que la
asignación de sexo es aleatoria, lo convierte en un instrumento válido. Una variable ficticia para
determinar si el sexo del segundo hijo coincide con el sexo del primero.
Este es el caso de Simultaneidad, bastante habitual en la medida que realizaciones de distintas
variables económicas estén relacionadas entre sí. Esto supone que la ecuación de la variable
dependiente en que estamos interesados forma parte de un sistema de ecuaciones simultáneas

b. Explique porque la estimación OlS del punto anterior es inapropiada para encontrar el efecto
causal de la fecundidad (morekids) sobre la oferta laboral weeksm1.

Para comprender cómo funciona la regresión VI, imaginemos que la variación de X tiene dos
partes: una parte que, por alguna razón, está correlacionada con u (esta es la parte que causa los
problemas) y una segunda parte que está correlacionada con u. Si se dispone de información que
permita aislar la segunda parte de X, podríamos centrarnos en esas variaciones de X que no están
correlacionadas con u y despreocuparnos de las variaciones de X que sesgan las estimaciones
MCO. Morekinds está correlacionada con el error, por lo que una forma de aislar el efecto de
Morekinds sobre weeksm1 es a través de un instrumento (Samesex)

c. La data contiene la variable samesex, la cual es igual a uno si los primeros dos hijos tienen el
mismo sexo o igual a cero en cualquier otro caso. ¿Son las parejas cuyos primeros dos hijos son del
mismo sexo más propensos a tener otro hijo? Comente sobre la magnitud y la significancia de este
efecto.

Primera etapa
d. Explique porque samesex es un instrumento válido para la regresión por IV de la regresión que
explica weeksm1 en función de morekids. Explique en su respuesta si el instrumento es o no un
instrumento débil (usando un test estadístico formal)

La variable es estadísticamente significativa, en la primera etapa, regresión del numeral c, se valida


el valor t de la variable, por lo que se procede a realizar la regresión de weeksm1 sobre los valores
predichos de morekids por samesex.

e. Estime la regresión del punto 1 por variables instrumentales usando la variable samesex como
instrumento. Compare los resultados de esta regresión con los del punto uno. ¿Qué signo tiene el
sesgo de endogeneidad de la regresión por OLS?
La inclusión de controles (agem1 black hispan othrace) reduce el coeficiente, no obstante, la
dirección y magnitud sigue siendo significativa, la introducción de controles puede conducir a
estimaciones más precisas.

El método de IV atribuye cualquier efecto de samesex sobre weeksm1, al efecto de samesex en


morekids. La estimación de IV explota la fertilidad como consecuencia de la composición del sexo
entre hermanos y confirma las estimaciones de OLS, que muestran que los niños conducen a una
reducción de la oferta de mano de obra femenina.

4. En el archivo seatbelts.dta, que está colgado en la página del curso encontrará un archivo de
datos panel. Información longitudinal (en el tiempo) para un conjunto de observaciones. En este
caso es un panel de Estados en Norte América, donde se tiene información sobre leyes de tránsito
y accidentes para el periodo comprendido entre 1997 y 1983
a)Estime el efecto del uso del cinturón de seguridad sobre accidentes, para esto regrese
Fatalityrate como función de sb_useage, speed65, speed70, ba08, drinkage21, ln(income), and
age. Note que tienen que generar la variable ln(income), nombrela Lincome. Sugiere esta
regresión que el uso de cinturón de seguridad reduce los accidentes
no, por el contrario, los aumenta, ya que un aumento en la Tasa de uso del cinturón de
seguridad aumenta .0040684 al Número de muertes por millón de millas de carretera
b. Ahora incluya efectos fijos por estado y vuelva a estimar la regresión del punto a. De una
interpretación global de que capturan estos efectos fijos. Cambian las conclusiones del punto a
después de incluir los efectos fijos. (Nota en la tabla de presentación omita los coeficientes de los
efectos fijos de otra forma la tabla quedaría muy grande)
R/ al incluir los efectos fijos se puede observar que el uso del cinturón de seguridad
reduce la tasa de muertes por millón de millas en la carretera, caso contrario a la
regresión anterior, en general todas las variables son significativas al 5 por ciento
menos speed65 y drinkage21, las variables que reducen la fatalidad son ba08, Lincome
y sb_useage
c. Además de los efectos fijos por estado, ahora adicionalmente, incluya efectos fijos de tiempo y
vuelva a estimar la regresión del punto a. De una interpretación global de que capturan estos
efectos fijos. Cambian las conclusiones del punto a después de incluir los efectos fijos. (Nota en la
tabla de presentación omita los coeficientes de los efectos fijos de otra forma la tabla quedaría
muy grande).
R/ no, el uso del cinturón sigue reduciendo la fatalidad en accidentes, por otro lado, en
general las variables son significativas al 5% menos Lincome y Speed65 este resultado
es más realista ya que el ingreso no debería afectar la fatalidad de accidentes, La edad
afecta la fatalidad positivamente, La edad para beber reduce la fatalidad, El límite de
velocidad a 70 aumenta la fatalidad el Límite legal para sobriedad 0.08% alcohol en la
sangre reduce la fatalidad de accidentes Y el uso de cinturón la reduce.
d. Cuál de las tres especificaciones es más confiable y porque?

el modelo más confiable seria el que incluye los efectos fijos de año y estado, ya que los
resultados son más consistentes con lo que deberían ser en la realidad, por ejemplo, el
ingreso no debería ser significativo, y las variables uso de cinturón, edad para beber y el
límite de sobriedad deberían reducir la fatalidad de accidentes.
e) el modelo más confiable seria el que incluye los efectos fijos de año y estado, ya que los
resultados son más consistentes con lo que deberían ser en la realidad, por ejemplo, el
ingreso no debería ser significativo, y las variables uso de cinturón, edad para beber y el
límite de sobriedad deberían reducir la fatalidad de accidentes.
la variable primary que es el uso obligatorio de cinturón no reduce la fatalidad en los
accidentes, por el contrario, secondary que es la recomendación del uso del cinturón de
seguridad si reduce la fatalidad en accidentes, finalmente, estas variables no son
significativas para explicar la fatalidad en accidentes.

También podría gustarte