Está en la página 1de 27

Advanced Data Panel

Carlos Ramos

Trimestre Noviembre- Enero 19/20

1 / 27
Introducción

Los dos métodos más utilizados para datos de panel con variables no
observables son el método de efectos fijos y el método de efectos
aleatorios.
El método de efectos fijos se utiliza cuando uno está solamente
interesado en analizar el impacto de variables que varían en el tiempo.
Por el otro lado, el método de efectos aleatorios se utiliza cuando la
variación de las observaciones de la muestra son aleatorios y no
correlacionados con la variable independiente. -En otras palabras,
utilizamos efectos aleatorios cuando creemos que las variables no
observables no están correlacionadas conlas demás variables
independiente.

2 / 27
Efectos Fijos

Section 1

Efectos Fijos

3 / 27
Efectos Fijos

Efectos Fijos

Cuando utilizamos efectos fijos, asumimos que alguna característica


del ente observado puede impactar o sesgar la variable dependiente o
independientes.
Es decir, se asume que existe correlación entre el término de error de
un individuo y las variables independientes es no-cero.
Al igual que el método de primeras diferencias, el método de efectos
fijos elimino estas características invariantes en el tiempo.
Por otro lado, también asumimos que las características invariantes en
el tiempo no están correlacionadas entre individuos. Si esto no se
cumple, es muchas veces mejor utilizar el método de efectos
aleatorios.

4 / 27
Efectos Fijos

Efectos Fijos

El modelo de efectos fijos está dado por:

Yit = β1 Xit + αi + uit


donde:
αi es el intercepto específico a cada individuo.
Yit es la variable dependiente del individuo i en el período t.
Xit representa las variables independientes
β1 es representa el efecto de las variables independientes en la
variable dependiente.
y uit es el término de error.
De cuál otra manera podríamos representar los diferentes interceptos?

5 / 27
Efectos Fijos

Efectos Fijos

Si tomamos averages a través del tiempo, para cada individuo i


obtenemos el modelo:

Ȳi = β1 X̄i + αi + ūi


donde ȳi = T1 Tt=1 yit , etc.
P

Al igual que en el modelo de primeras diferencias, ahora tenemos 2


ecuaciones donde los efectos no observables aparecen. De qué manera
podemos utilizar esto?

6 / 27
Efectos Fijos

Efectos Fijos

Tomando diferencias entre las ecuaciones, obtenemos el modelo:

yit − ȳi = β1 (xit − x̄i ) + uit − ūi , ∀T


En inglés otro nombre para este estimador es el estimador
“within”(Dentro) ya que al utilizar un MCO agrupado en esta
regresión, se utiliza la variación en el tiempo de las variablse
dependiente e independientes dentro de cada corte transversal.
Si por el otro lado, utilizamos el MCO agrupado en nuestro modelo de
medias, obtenemos un estimador “between”, ya que sólo se explota la
variación entre los individuos de la muestra, sin variación en el tiempo.

7 / 27
Efectos Fijos

Supuestos Estimador Efectos Fijos


Para asegurar que el estimador de primeras diferencias es no sesgado
y consistente, debemos de tener que las siguientes condiciones se
cumplan:
La muestra de la población transversal es aleatoria.
Existe variación idiosincrática en el tiempo de las variables
independiente xit (Para algunas o todas las observaciones) y las
variables explicatorias no tienen una relación lineal perfecta.
E[uit |Xi , ai ] = 0, donde Xi es una matriz que contiene todas las
variables independientes en todos los períodos de tiempo, para una
observación en el corte transversal. (Exogeneidad estricta condicional
en los no observables).
Además, para asegurar que los errores estándares y las pruebas
estadíticas son asimptoticamente válidas, debemos de asumir
homocedasticidad de los errores diferenciados y que no sean
serialmente correlacionados:
Homocedasticidad: V ar[uit |Xi ] = σ 2 para todo t.
No corelación serial: Cov[uit , uis |Xi , ai ] = 0, para t 6= s.
Bajo estos el estimador de Efectos Fijos es BLUE. 8 / 27
Efectos Fijos

Ejemplo 14.1

rm(list=ls())
library(wooldridge)
library(plm)

data("jtrain")

s.lm.1<-plm(lscrap ~ d88 + d89 + grant + grant_1,


data = jtrain,
index= c("fcode", "year"),
model = "within",
effect = "individual"
)

9 / 27
Efectos Fijos

Ejemplo 14.1 Regresión

Dependent variable:
lscrap
d88 −0.080 (0.109)
d89 −0.247∗ (0.133)
grant −0.252∗ (0.151)
grant_1 −0.422∗∗ (0.210)
Observations 162
R2 0.201
Adjusted R2 −0.237
F Statistic 6.543∗∗∗ (df = 4; 104)

Note: p<0.1; ∗∗ p<0.05; ∗∗∗ p<0.01

10 / 27
Efectos Fijos

Ejemplo 14.2

data("wagepan")

plm.1 <- plm(lwage ~ married + union + d81 + d82 +


d83 +d84 + d85 + d86 + d87 +I(d81*educ) +
I(d82*educ) + I(d83*educ)+I(d84*educ)+
(d85*educ)+I(d86*educ)+I(d87*educ),
data=wagepan,
model="within",
effect="individual",
index=c("nr", "year"))

11 / 27
Efectos Fijos

Ejemplo 14.2 Regresión

Dependent variable:
lwage
married 0.055∗∗∗ (0.018)
union 0.083∗∗∗ (0.019)
d81 −0.022 (0.146)
d82 −0.006 (0.146)
d83 0.010 (0.146)
d84 0.084 (0.146)
d85 0.050 (0.146)
d86 0.066 (0.146)
d87 0.090 (0.146)
I(d81 ∗educ) 0.012 (0.012)
I(d82 ∗educ) 0.015 (0.012)
I(d83 ∗educ) 0.017 (0.012)
I(d84 ∗educ) 0.017 (0.012)
I(d86 ∗educ) 0.027∗∗ (0.012)
I(d87 ∗educ) 0.030∗∗ (0.012)
d85:educ 0.024∗ (0.012)
Observations 4,360
R2 0.171
Adjusted R2 0.049
F Statistic 48.907∗∗∗ (df = 16; 3799)

Note: p<0.1; ∗∗ p<0.05; ∗∗∗ p<0.01

12 / 27
Efectos Fijos

Efectos Fijos o Primeras Diferencias? N grande, T pequeño

Cuando tenemos una base de datos de panel con 3 o más períodos,


surgen diferencias entre el estimador de primeras diferencias y el de
efectos fijos.
Bajo los supuestos mostrados anteriormente, el estimador de efectos
fijos es BLUE y por tanto más eficiente que el de primeras diferencias
(este último es no sesgado bajo estos supuestos).
Muchas veces tenemos que los factores no observables pueden ser
serialmente correlacionados. Por ejemplo, uit puede serguir un
proceso de camino aleatorio.
En este caso, 4uit no es serialmente correlacionado y por tanto el
estimador de primeras diferencias es más eficiente.
Por otro lado, puede que exista correlación serial de los errores, pero
menor que la que veríamos en un proceso de camino aleatorio. En
este caso, es mejor utilizar efectos fijos.

13 / 27
Efectos Fijos

Efectos Fijos o Primeras Diferencias? N pequeño, T grande

En el caso que tengamos una base de datos de panel con muchas


observaciones en el tiempo, debemos de tener cuidado que nuestro
proceso temporal no sea de raíz unitaria. En este caso, el método de
efectos fijos nos puede dar una regresión espuria.
Por el otro lado, el método de Primeras Diferencias eliminaría este
problema (o por lo menos nos daría un proceso de poca dependencia),
y por tanto nos daría los resultados que buscamos.
En ambos casos, lo mejor es estimar la regresión utilizando los 2
modelos presentados, y así poder verificar si existen problemas en
nuestra regresión.

14 / 27
Efectos Fijos

Ejemplo 14.3

plm.2<-plm(lscrap ~ d88 + d89 + grant +


grant_1 + lsales + lemploy,
data = jtrain,
model = "within",
effect = "individual",
index = c("fcode", "year"))

15 / 27
Efectos Fijos

Ejemplo 14.3 Regresión

Dependent variable:
lscrap
d88 −0.004 (0.120)
d89 −0.132 (0.154)
grant −0.297∗ (0.157)
grant_1 −0.536∗∗ (0.224)
lsales −0.087 (0.260)
lemploy −0.076 (0.350)
Observations 148
R2 0.213
Adjusted R2 −0.271
F Statistic 4.106∗∗∗ (df = 6; 91)

Note: p<0.1; ∗∗ p<0.05; ∗∗∗ p<0.01

16 / 27
Efectos Aleatorios

Section 2

Efectos Aleatorios

17 / 27
Efectos Aleatorios

Efectos Aleatorios

El modelo de efectos aleatorios está dado por:

Yit = β0 + β1 Xit + ai + uit

donde:
β0 es el intercepto común
αi es el intercepto específico a cada individuo (con media 0).
Yit es la variable dependiente del individuo i en el período t.
Xit representa las variables independientes
β1 es representa el efecto de las variables independientes en la
variable dependiente.
y uit es el término de error.

18 / 27
Efectos Aleatorios

Efectos Aleatorios

Ahora suponemos que los efectos no variantes en el tiempo no están


correlacionados con las variables independientes ∀T .
Por tanto, utilizando una transformación para eliminar estos efectos
de nuestra regresión es ineficiente.
Específicamente, nuestro modelo es de efectos aleatorios cuando
asumimos que:

Cov(xitj , ai ) = 0∀T, j = 1, ..., k

E(ai |Xi ) = β0

19 / 27
Efectos Aleatorios

Efectos Aleatorios

Por tanto, bajo este supuesto, tenemos que podemos estimar βj


utilizando un corte transversal de nuestra base de dato. Por supuesto,
haciendo esto perdemos mucha información disponible en la base de
datos de panel.
Más aún, no podemos utilizar un MCO agrupado, ya que el error
compuesto ai + uit estará serialmente correlacionado.

σa2
Corr(ai + uit , ai + uis ) = , t 6= s
(σa2 + σu2 )

El problema de errores serialmente correlacionados se puede resolver


utilizando minimos cuadrados generalizados, con tal de que nuestra
base de datos de panel sea de N grande y T pequeña.

20 / 27
Efectos Aleatorios

Efectos Aleatorios

Utilizando la siguiente transformación:

σa2 1
θ =1−[ 2 2
] 2 ∈ [0, 1]
(T σa + σu )

Lo cual nos permite correr la regresión:

yit − θȳi = β0 (1 − θ) + β1 (Xit − θX̄i ) + (νit − θν̄i )

Donde νit = ai + uit es el error compuesto.

21 / 27
Efectos Aleatorios

Efectos Aleatorios

El hecho que solamente estemos restando la media, ponderada con


una constante que depende de las varianzas de nuestras variables no
observables y el error, nos permite incluir variables constantes en el
tiempo que sí son observables (al contrario del modelo de efectos
fijos). Por qué?
Para poder estimar la constante θ, requerimos de estimados un
estimador consistente de σa y σu .
Estos estimados pueden ser obtenidos haciendo una regresión inicial,
utilizando un MCO agrupado o una regresión de efectos fijos.

22 / 27
Efectos Aleatorios

Ejemplo 14.4
# OLS
lm.1 <- lm(lwage ~ educ+black+hisp+exper+expersq+
married+union+d81+d82+d83+d84+d85+d86+d87,
data = wagepan)
#Random Effects
plm.re <- plm(lwage ~ educ+black+hisp+exper+expersq+
married+union+d81+d82+d83+d84+d85+d86+d87,
data = wagepan,
model = "random",
index = c("nr", "year"))
#Fixed Effects
plm.fe <- plm(lwage ~ expersq+married+union+
d81+d82+d83+d84+d85+d86+d87,
data = wagepan,
effect = "individual",
model = "within",
23 / 27
Efectos Aleatorios

Ejemplo 14.4 Regresión

Pooled.OLS Random.Effects Fixed.Effects


educ 0.09 0.09
black -0.14 -0.14
hisp 0.02 0.02
exper 0.07 0.11
expersq -0.00 -0.00 0.09
married 0.11 0.06 -0.14
union 0.18 0.11 0.02

24 / 27
Efectos Aleatorios o Efectos Fijos

Section 3

Efectos Aleatorios o Efectos Fijos

25 / 27
Efectos Aleatorios o Efectos Fijos

Efectos Aleatorios o Efectos Fijos

Muchas veces, efectos fijos es preferible a efectos aleatorios, ya que es


robusto cuando tenemos que las variables no observables están
correlacionadas con las variables independientes de interés.
En casos en donde la variable independiente de interés es una variable
constante en el tiempo, preferiremos utilizar el modelo de efectos
aleatorios, con el entendimiento de que estamos asumiendo que no
existe correlación entre las variables no observables y las variables
independientes de interés.
En estos casos, debemos de incluir tantos controles constantes en el
tiempo como sea posible, para que el supuesto posiblemente se
cumpla.

26 / 27
Efectos Aleatorios o Efectos Fijos

La Prueba de Hausman

Una manera más formal de elegir entre los dos métodos, es utilizando
la prueba de Hausman.
La prueba de Hausman es una prueba de Chi-cuadrado la cual tiene
como hipótesis nula que ambos estimadores son consistentes, y por
tanto el estimador de Efectos Aleatorios es preferible, al ser más
eficiente.
Si la prueba es rechazada, entonces procedemos a utilizar el estimador
de efectos fijos.
La prueba de Hausman se puede correr a través del comando
phtest(plm.re, plm.fe), donde plm.re es el modelo de efectos
aleatorios y plm.fe es el modelo de efectos fijos.

27 / 27

También podría gustarte