Está en la página 1de 10

⋆,⋆⋆

PANEL DATA MODELS HOMEWORK # 1

Raúl Andrés López Romeroa,1,∗


a Universidad Externado de Colombia
Bogotá D.C, Colombia

Punto 1

1. Consider the following Cobb-Douglass production function in a pooled panel data model (vale 1.0; 0.5
c/u)
β2 β3 µit
Yit = β1 X2it X3it e (1)
Where: Y : production, X2 : labor input, X3 : capital input

Written in log form, the equation becomes:

lnYit = β0 + β2 lnX2it + β3 lnX3it + µit (2)


Where β0 = lnβ1
Suppose to the regression equation above a restriction is imposed. The restricted regression equation
is given below:
Yit X3it
ln = β0 + β3 ln + µit (3)
X2it X2it
Yit X3it
Where X2it : output per labor and X2it : capital per labor.

a) What is the restriction imposed and why? Please show details.

RESPUESTA: La restricción se determina en este caso para poder examinar una característica
propia de la función Cobb-Douglas es decir que información puede proporcionar: β2 y β3 en la
ecuación 1 y ademas proporciona información sobre los rendimientos a escala, es decir, la respuesta
de la salida a una proporción de cambio de las entradas.
• Si la suma es 1, entonces, hay rendimientos constantes a escala, es decir, duplicar las entradas
duplicará la salida, triplicar la entrada triplicará la salida, y así sucesivamente.
• Si la suma es menor que 1, hay rendimientos decrecientes a escala: duplicar las entradas dará
menos del doble de salida.
• Si la suma es mayor que 1, hay rendimientos crecientes a escala: duplicar las entradas dará
más doble de la salida.
Con la restricción se espera poder realizar pruebas para saber si hay rendimientos constantes a
escala (cambio proporcional en la salida para un cambio proporcional en la entrada), la teoría

⋆ Documento presentado para la materia modelos de panel de datos


⋆⋆ Homework #1
∗ Correo electrónico: raul.lopez04@est.uexternado.edu.co
1 Economista de la Universidad de Nariño, Estudiante de la Maestría en Economía de la Universidad Externado de Co-

lombia.

Panel Data 20 de junio de 2019


económica sugiere que β2 + β3 = 1. Esta es una forma de restricción de igualdad lineal lo anterior
se usa para examinar la validez de la ecuación 2. Para lo cual se puede realizar una prueba F
para poder validar dicha información.

b) The Cobb-Douglas production function for the Chilean economy (1955-1974) is calculated and
the following two regression equations are estimated:
lnYit = −1,65 + 0,34lnX2it + 0,85lnX3it
SSRur = 0,013

Yit X3it
ln = −0,50 + 1,02ln
X2it X2it
SSRr = 0,0166
Use F − test to test the restriction in part a at the significance level of 0,05. That is, whether
the Mexican economy had constant return to scale. Do not forget to write the null hypothesis
and decision. Explain your decision in economic terms as well.

RESPUESTA: Como se estableció en la parte 1 se tienen dos ecuaciones, la ecuación 2 la cual


establece una relación lineal de la función Cobb-Douglas, por otra parte se tiene la ecuación 3 la
cual muestra esa función con la restricción de Rendimientos Constantes a Escala, para este caso
se pretende mediante la prueba F saber si esta economía tiene rendimientos constantes a escala
para el periodo descrito, es decir se plantea lo siguiente: Saber si las ecuaciones 2 y 3 son iguales,
si lo son, entonces la economía tiene rendimientos constantes a escala, de lo contrario estas dos
ecuaciones no son iguales y no tendría dichos rendimientos.

(SSRr − SSRur )/m


F = (4)
SRRur /(n − k)
En donde SSRr es la suma residual de cuadrados del modelo restringido de la ecuación 3 y SSRur
es la suma residual de cuadrados del modelo no restringido mostrado en la ecuación 2, m denota
el número de restricciones, una restricción para este caso, n es el número de observaciones que
de 1955 a 1974 son 20 años, y k es el número de parámetros de la ecuación sin restricciones, es
decir, la mostrada en la ecuación 2 (β0, β2, β3), reemplazando los valores se tiene.
(0,0166 − 0,013)/1
F =
0,013/(20 − 3)
(0,0166 − 0,013)
F =
0,013/(17)
0,0036
F = ≈ 4,71
0,00076471
El valor de F(1,17) es:
1
F17 ≈ 4,45
Ahora la H0 : plantea que las ecuaciones son iguales, por lo tanto la economía tiene rendimientos
constantes a escala y H1 : plantea que no son iguales, es decir, la economía no tiene rendimientos
constantes a escala.

Fcal (4,71) > Fest (4,45)


pr(4,71|H0 ) > pr(4,45|H0 )
pr(4,71|H0 ) > 5 %
2
Por lo anterior, se rechaza la H0 en favor de H1 , es decir, para el periodo de tiempo planteado
dentro de las regresiones dicha economía no presenta Rendimientos Constantes a Escala. Por lo
tanto se recomienda usar el modelo con la ecuación sin restricción, la cual esta planteada en la
ecuación 2.

Hypothesis testing (vale 0.6; 0.3 c/u)

We have the following estimated equation from a pooled cross section data of two periods (1995 and
2001):

log(wage) = β0 + β1 Educ + β2 Exper + β3 T enure + β4 M arried+


(5)
β5 South + β6 U rban + δ0 d01 + µ

c
log(wage) = 0,284 + 0,092Educ + 0,041Exper + 0,022T enure + 0,116M arried
(0,11) (0,006) (0,003) (0,002) (0,039)

−0,142South + 0,26U rban + 0,10d01


(0,025) (0,027) (0,015)
2
n = 935 R = 0,232

Where Married, South, and Urban are dummy variables that account for whether the person
is married or not, whether the person is from the South or not, and whether the person lives in urban
area or not, respectively. d01 is a dummy variable for the year 2001. (the standard errors are in parenthesis).

a) Test whether return to education is positive at the 1 % significance level. Write first the null and
alternative hypotheses

RESPUESTA: La respuesta puede plantearse si en la población el rendimiento de education controlando


por las demás variables es cero contra la alternativa de que este rendimiento es positivo, por lo tanto se
plantea como: H0 : βEduc = 0 versus H1 : βEduc > 0.

Para este caso se tienen (927 − 8) grados de libertad, y se usarán los valores críticos de la distribución
normal estándar, en este caso el valor critico para 5 % es de: 1.646499 y al 1 % es de: 3.09904722 y dentro
del mismo se calcula el estadístico t para β̂Educ
0,092
tEduc = ≈ 15,333
0,006
Como tEduc > tc1 % se puede concluir que β̂Educ es estadísticamente mayor que cero a un nivel de
significancia 1 %

b) Test whether return to experience is greater than 0.03 at the 1 % level of significance. Write first the
null and alternative hypotheses

RESPUESTA: La respuesta puede plantearse de la misma forma que en a) si en la población el


rendimiento de experience controlando por las demás variables es 0.03 contra la alternativa de que este
rendimiento es mayor que 0.03, por lo tanto se plantea como: H0 : βExper = 0,03 versus H1 : βExper > 0,03.

2 Valor calculado mediante la función invttail en Stata

3
Para este caso se tienen (927 − 8) grados de libertad, y se usarán los valores críticos de la distribución
normal estándar, en este caso el valor critico para 5 % es de: 1.646499 y al 1 % es de: 3.09904723 y dentro
del mismo se calcula el estadístico t para β̂Exper
0,041 − 0,03
tExper = ≈ 3,67
0,003
Como tExper > tc1 % se puede concluir que β̂Exper es estadísticamente mayor que 0,03 a un nivel de
significancia 1 %

c) How would you interpret the estimated coefficient δ0 ? Don’t forget to correct the coefficient for log
estimation (see Wooldridge, 2013).

RESPUESTA: Para este caso δ0 es el rendimiento del año 2001, y como se tiene que la información de dos
periodos, uno del año 1995 y otro del año 2001, se podría decir que el salario de una persona en 2001 es en
promedio (y dejando las demás variables constantes) 10 % (δ0 = 0,10 ∗ 100) más alto que el que recibieron
las personas en el año 1995.

Exercise on pooled cross-section data

The data is taken from FERTIL1 for the even years from 1972 to 1984. Please drop the year 1984 to
answer the following questions. We have the following equation:

kids = β0 + β1 educ + β2 age + β3 age2 + β4 black + β5 northcen + β6 smcity


(6)
+δ1 y74 + δ2 y76 + δ3 y78 + δ4 y80 + δ5 y82 + µ

Where:
kids: Number of kids born to a woman.
educ: Years of mother’s education.
age: Mother’s age.
black: Whether the mother is African American (1: Yes, 0: otherwise). The control group is white.
northcen: Whether the mother lives in north-centre at age 16 (1: Yes, 0: otherwise). The control group is
south.
smcity: Whether the mother lives in a small city (type of residence at age 16) (1: Yes, 0: otherwise).
y74 to y82: Dummy variables for years from 1974 to 1982 (even years).

a) Estimate the equation and put the output given in Stata (u other program) here (table). Assume the
is not heteroskedasticity in the error term. How would you interpret the result of β1 ?

RESPUESTA: el resultado de la estimación se muestra en la tabla 1.

3 Valor calculado mediante la función invttail en Stata

4
Cuadro 1: Determinantes de la fertilidad en las mujeres
(1) (2) (3)
Number of kids born Number of kids born Number of kids born
Years of mother’s education -0.126∗∗∗ -0.128∗∗∗ -0.118∗∗∗
(0.0179) (0.0183) (0.0192)
Age in years 0.565∗∗∗ 0.532∗∗∗ 0.524∗∗∗
(0.138) (0.138) (0.138)
Age in years (squared) -0.00614∗∗∗ -0.00580∗∗∗ -0.00572∗∗∗
(0.00157) (0.00156) (0.00156)
Mother is Afrian American 1.021∗∗∗ 1.076∗∗∗ 2.378∗∗
(0.171) (0.174) (0.761)
Mother lives in north-centre at age 16 0.235∗ 0.363∗∗ 0.365∗∗
(0.101) (0.121) (0.121)
Mother lives in small city at age 16 0.227 0.212 0.214
(0.141) (0.160) (0.160)
Dummy for year 1974 0.543∗∗∗ 0.268 0.280
(0.147) (0.173) (0.173)
Dummy for year 1976 0.181 -0.0974 -0.0851
(0.154) (0.179) (0.179)
Dummy for year 1978 0.213 -0.0687 -0.0610
(0.156) (0.182) (0.182)
Dummy for year 1980 0.195 -0.0713 -0.0669
(0.157) (0.183) (0.183)
Dummy for year 1982 -0.254 -0.522∗∗ -0.517∗∗
(0.145) (0.172) (0.172)
Dummy for year 1984 -0.545∗∗ -0.544∗∗
(0.175) (0.174)
Years of schooling of African American woman -0.103
(0.0586)
Constant -8.729∗∗ -7.742∗ -7.694∗
(3.043) (3.052) (3.049)
Observations 1129 1129 1129
R2 0.116 0.130 0.132
Adjusted R2 0.108 0.116 0.118
Standard errors in parentheses
∗ p < 0,05, ∗∗ p < 0,01, ∗∗∗ p < 0,001

Como se observa en la ecuación 6 el β1 esta asociado a la variable explicativa educ como resultado de la
tabla 1 se observa que β̂educ = −0,126 es decir si se mantiene los demás factores constantes, entonces en
promedio un año más de educación disminuye en 0.126 hijos, es decir, de cada 100 mujeres con un año
mas de educación tendrían aproximadamente 13 hijos menos que las que no tengan ese año de estudio de más.

b) Controlling for others observable factors, what has happened to fertility from 1976 to 1982?

RESPUESTA: Controlando por otros factores se observa que hay un descenso en la fertilidad desde el año
1976 hasta el año 1982, si bien el cambio no es tan significativo (siendo solo significativo el del año 1982) y
como se controla por educación y otros factores determinantes, estas binarias de año explican situaciones
particulares que pasaron esos años y que no están dentro de las demás variables explicativas.

5
c) Based on the results from β2 and β3 , what would be the turning point in the quadratic of age? How
would you interpret the result of this turning point?

RESPUESTA: Para poder calcular el valor pedido se usará la siguiente formula:



β̂
∗ 1
X =
2βˆ2
En donde X ∗ es el punto de cambio a calcular, β1 es el parámetro asociado a age y β2 es el parámetro
asociado a age2 , para determinar el punto de cambio se usará los datos del cuadro 1 (1) para lo cual se
tendría:


0,565


X =
2 ∗ −0,00614

0,565

X = ≈ 46
0,01228

Es decir el cambio se da a los 46 años, lo que significa y con el signo de age2 determina que a partir de
los 46 años la relación con la cantidad de hijos es inversa, es decir a mas años a partir de los 46 años es
menor la cantidad de hijos. Lo anterior se puede observar en la figura 1 en donde se observa el cambio
aproximadamente en los 46 años.

Figura 1: Turning point in age

d) How would you interpret β4 and β5 ?

RESPUESTA: Para este caso el β4 corresponde a black lo cual es si la madre es Afroamericana o no,
corresponde a una variable dummy en la cual si se cumple esta condición toma el valor de 1 y si no toma el
valor de 0, es decir si la persona no es Afroamericana, el resultado de la estimación se muestra en el cuadro
1 (1) la cual corresponde a la estimación de la ecuación 6 para este caso se tiene que el valor del β asociado
6
es de 1.021, con una confianza del 99 % se puede decir que si una mujer es Afroamericana tiene en promedio
(y dejando las demás variables constantes) 1 hijo más que las personas que no son Afrodescendientes.

Para el caso del β5 que está asociado a si la madre vivió en el centro norte de la ciudad a los 16 años,
se tiene que para este el valor del β es de 0.235 es decir que en promedio en comparación con el grupo de
control que es si una persona vivió en el sur, como se observa comparado con estos las mujeres que vivieron
en el centro norte de la ciudad tuvieron 0.235 hijos más es decir 100 mujeres que tienen esa condición
tendrán aproximadamente 24 hijos.

d) If we interact educ and black, whats is the estimated coefficient? How would uou interpreted that
coefficient?

RESPUESTA: Como la variable educ es el número de años de educación de la madre y black es una
variable binaria que toma el valor de 1 si la mujer es Afroamericana, entonces la interacción de las dos
dará como resultado los años de educación pero solo de las mujeres que cumplen con dicha condición, los
resultados de dicha interacción se evidencian en el cuadro 1 (3)4 .

El β asociado a esta nueva variable tiene un valor de -0.103 lo que quiere decir que en promedio por cada
año de educación de una mujer Afroamericana disminuye el número de hijos en 0.103, lo que es lo mismo si
100 mujeres Afroamericanas aumentan en un año su educación, estas tendrán en promedio 10 hijos menos.

Exercise on t-period panel data

We have data on the likelihood of traveling to Colombia from 29 countries of origin from 2007 to 2010. We
also have the determinant of international tourism demand based on microeconomic theories of tourism. We
have the following model equation for international tourism demand based on Theil (1969, 1992)

logPcst = α + β1 logIN COM Est + θ1 logP RICEct + θ2 logP V IOLEN CEct + θ3 logT RADEct
(7)
+γ1 logDIST AN CEcs + ecst

Where: Pcst is the mean likelihood of travelling from country s to country c (Colombia) amongst a set of
alternatives in time t IN COM Est accounts for the average overseas tourists’ income, which is approached
by their countries’ per capita income. P RICEct is the relative price of tourism in country c adjusted with the
exchange rate. P V IOLEN CEct is the relative number of politically motivated violent incidents in country
c. T RADEct is the relative trade between tourists country of origin and destination c.. There are 29 coun-
tries chosen for this study (s) where tourists travel from to Colombia. The study years are from 2007 to 2010.

a) Set the panel database using the command xtset. Also, graph the probability of traveling to
Colombia for the analyzed years. Use the option “Panel-data line plots”5 in “Graphs” in Stata. What
do you find in this graph? Tourists from what countries are more likely and less likely to travel to Colombia?

RESPUESTA: Como se observa en la figura 2 se tiene los subgraficos de los 29 países y su probabilidad
de viajar a Colombia, para este caso se observa que los países con la menor distancia geográfica, los cuales
son países vecinos, la mayor probabilidad la tiene Ecuador, seguido de Venezuela, Panamá y Perú.
La segunda linea sería la de países que están distantes pero que hacen parte del mismo continente como
Costa Rica, República Dominicana, Chile y Argentina.

4 Se incluye la variable de 1984 por tener peso estadístico en el modelo presentado en el cuadro 1 (2)
5 Para poder realizar un analisis más adecuado y poder mostrar una figura más comprensible se cambia la opción de line
por la de área.

7
Por ultimo los que menor probabilidad de viajar a Colombia son: Austria, Japón, Alemania, Reino Unido y
Suecia, es decir los más distantes geográficamente y culturalmente.

Figura 2: Probabilidad de viajar a Colombia por país de origen

b) Run a pooled panel data model. Paste the output table here. How would you interpret the betas
estimates?

RESPUESTA: Los resultados de la estimación de la ecuación 7 se presenta en el cuadro 2 (1) en ella se


observa que la constante, el comercio relativo entre Colombia y el país j y la distancia a Colombia desde el
país j son significativas, y lo son al 99 %.
Ademas se evidencian relaciones negativas entre el número de incidentes violentos y la distancia, por cada
nuevo incidente la probabilidad baja pero en poca medida en lo relacionado con los incidentes violentos, y
es casi de un punto porcentual cuando aumenta la distancia geográfica.
Para los casos de ingresos de países de ultramar y para el precio relativo del turismo en Colombia se
encuentra una relación positiva pero no significativa estadisticamente, lo que lleva a pensar que pueden
estar estos resultados errados y estén arrastrando factores invariantes en el tiempo, junto con otros test se
podría llegar a la conclusión de que este modelo podría ser dinámico.

8
Cuadro 2: Probabilidad de viajar a Colombia por países
(1) (2)
Log Probability of travelling to Col D.Log Probability of travelling to Col
Log Overseas tourist’s income 0.161
(0.134)
Log Relative price of tourism in Col 0.169
(0.118)
Log Relative number of PMV in Col -0.0149
(0.0801)
Log Relative trade between Col and country j 0.650∗∗∗
(0.103)
Log Distance to Col from country j -0.943∗∗∗
(0.176)
D.Log Overseas tourist’s income -1.683∗∗∗
(0.461)
D.Log Relative price of tourism in Col -0.163
(0.170)
D.Log Relative number of PMV in Col -0.0134
(0.0442)
D.Log Relative trade between Col and country j 0.105
(0.0661)
oD.Log Distance to Col from country j 0
(.)
Constant 5.775∗∗∗ 0.0403
(1.440) (0.0250)
Observations 116 87
R2 0.849 0.179
Adjusted R2 0.842 0.139
Standard errors in parentheses
∗ p < 0,05, ∗∗ p < 0,01, ∗∗∗ p < 0,001

c) Test for cross-sectional dependence in panel-data models to identify whether there are cross-section
correlation between countries (Use the command xtcd first for lnprobi, and then for the other variables)
What did you find? Explain.

RESPUESTA: De acuerdo con la prueba de Pesaran, la cual se muestra en el cuadro 3, las secciones
transversales de todas las variables están altamente correlacionadas, y todas rechazan la hipótesis de no
tener CSD 6 . Esto proporciona razones para realizar pruebas y estimaciones teniendo en cuenta esta CSD,
mostrando que quizá la mejor opción sería tener un modelo dinámico de panel de datos.

6 Croos Sectional Dependence

9
Cuadro 3: Dependencia transversal en datos de panel.
Variable Average correlation coefficients & Pesaran (2004) CD test
CD Test p−value corr abs(corr)
Log Probability of travelling to Col 9.83 0.000 0.244 0.508
Log Overseas tourist’s income 11.58 0.000 0.287 0.607
Log Relative price of tourism in Col 23.84 0.000 0.591 0.754
Log Relative number of PMV in Col 33.04 0.000 0.820 0.823
Log Relative trade between Col and country j 12.53 0.000 0.311 0.550
Log Distance to Col from country j . . . .
Notes: Under the null hypothesis of cross-section independence CD N(0,1)
These are the results of the xtcd Stata routine.

d) Run a pooled panel data model in first difference to eliminate time invariant country characteristics
and paste the table. What did you find? How would you interpret the results? What do you comment
between this result and the former in a?

RESPUESTA: Como se observa en el cuadro 2 (2) se realiza la estimación en primeras diferencias para
poder quitar los efectos invariantes en el tiempo, lo primero que se encuentra es que la única variable
invariante en el tiempo es la distancia, y no es de extrañar ya que las distancias geográficas no cambian de
un periodo a otro, por lo tanto el programa de estimación omite dichos valores.
Se encuentra que al quitarse la distancia y si existe una diferencia entre países y sus efectos diferenciados
ante ese cambio en el ingreso disminuye la probabilidad de viajar a Colombia en un 1.6 % este resultado es el
único estadisticamente significativo al 99 % lo que lleva a pensar que ante aumentos e ingresos las personas
de estos países prefieren otros destinos.
Así también se encuentran resultados cambiantes con respecto a los resultados del cuadro 2 (1) mostrados en
la parte a) debido a el cambio de signos y la significancia estadística, en el primero se tiene que si aumenta
el precio relativo del turismo en Colombia la probabilidad disminuye, lo cual es más cercano a la realidad
que decir que si aumenta ese precio relativo aumenta la probabilidad, con respecto a el comercio relativo
entre Colombia y los países en cuestión se tiene que deja de ser significativo estadisticamente e igualmente
baja la probabilidad, ahora es menor a lo presentado anteriormente.

10

También podría gustarte