Está en la página 1de 62

Escuela Superior Politécnica del Litoral

Facultad de Ciencias Sociales y Humanı́sticas

Econometria II
Modelos de Datos de Panel
Objetivos de la clase

I Estudiar a nivel introductorio el uso de Datos de Panel


I Entender las ventajas del uso de Datos de Panel
I Estudiar el Modelo de Efectos Fijos
I Entender la inferencia en el modelo de efectos fijos usando conglomerados
“clusters”
Datos de Panel

I Un conjunto de datos de panel contiene observaciones de varias unidades (paı́ses,


provincias, escuelas, hogares, empresas, etc) y cada unidad es observada por dos o
más periodos
I En este tipo de datos, necesitamos que el número de unidades (N) sea grande
mientras que el número de periodos sea relativamente pequeño (T)
I De hecho vamos a suponer que N tiende al infinito y que T es fijo.
I ¿Ejemplos de datos de panel?
Datos de Panel

I Notación: Pizarrón
Datos de Panel

I Decimos que el conjunto de datos de panel es balanceado si no existen


observaciones perdidas
I Si al menos una observación correspondiente a una unidad y un periodo está
perdida, entonces tenemos un conjunto de datos de panel desbalanceado
I El tratamiento de esta clase se enfocará en datos de panel balanceados
I Los métodos que aprenderemos en general se pueden usar con datos de panel
desbalanceados con ciertos ajustes
Datos de Panel - ventajas

I ¿Por qué es conveniente usar datos de panel?


Datos de Panel - ventajas

I ¿Por qué es conveniente usar datos de panel?


I La principal razón es la eliminar o reducir de sesgo de variable omitida
I ¿Cómo?
Datos de Panel - ventajas

I ¿Por qué es conveniente usar datos de panel?


I La principal razón es la eliminar o reducir de sesgo de variable omitida
I ¿Cómo?
I Con datos de panel podemos “controlar” por factores que no cambian en el
tiempo y que pueden estar correlacionados con nuestros regresores
I Estos factores pueden ser no observables, pero el uso de datos de panel nos
permite resolver el problema
I La idea es que si las variables omitidas no cambian en el tiempo, entonces los
cambios en Y no pueden ser causados por las variables omitidas
Datos de Panel – Ejemplo

I Ejemplo del libro


I Muertes de accidentes de tráfico e impuestos a las bebidas alcohólicas en EE.UU.
I Unidad de observación: un año en un estado de EE.UU.
I 48 estados con información disponible – N=48
I 7 años (1982,...,1988) – T=7
I Panel balanceado. Número total de observaciones = 7*48= 336
Datos de Panel – Ejemplo

I Variables:
I Accidentes trágicos de tránsito (tasa de muertes causadas por accidentes de
tránsito por cada 10,000 habitantes en cada estado por cada año)
I Impuestos a la cerveza a nivel estatal y por cada año (variable de interés)
I Otros controles (edad legal para manejar, leyes acerca de conducción bajo el
efecto del alcohol, etc)
I Note que estos controles pueden variar entre estados y entre años
Datos de Panel – Ejemplo

I Asumamos que únicamente tenemos información para un año (1982)


I Recordar que queremos estimar el efecto causal de impuestos a la cerveza en la
tasa de accidentes de tránsito mortales
I ¿Qué modelo podemos usar?
I Un MCO serı́a un buen inicio
I Yi = β0 + β1 ImpuestoCervezai + ui
Datos de Panel – Ejemplo
Datos de Panel – Ejemplo

I Los resultados implican que existe una relación positiva entre impuestos a la
cerveza y muertes por accidentes de tránsito
I ¿Podrı́a esta estimación estar sesgada?
I ¿Qué factores podrı́an causar el sesgo?
Datos de Panel – Ejemplo

I Los resultados implican que existe una relación positiva entre impuestos a la
cerveza y muertes por accidentes de tránsito
I ¿Podrı́a esta estimación estar sesgada?
I ¿Qué factores podrı́an causar el sesgo?
I 1. Calidad de los autos (potencialmente observable)
I 2. Calidad de las vı́as (potencialmente observable)
I 3. “Cultura” acerca de beber y conducir (no observable )
I Asumamos que observamos 1 y 2, pero no 3
Datos de Panel – Ejemplo

I ¿Por qué omitir (3) podrı́a causar sesgo de variable omitida?


Datos de Panel – Ejemplo

I ¿Por qué omitir (3) podrı́a causar sesgo de variable omitida?


I a. Seguramente la cultura hacia conducir bajo los efectos de alcohol determina las
muertes por accidentes de tránsito
I b. Este tema cultural seguramente está correlacionado con los impuestos al
alcohol
I ¿En qué estados se espera que hayan impuestos más altos? Los que beben menos
o más?
I Seguramente tememos un sesgo positivo (estimamos un efecto a la derecha de la
lı́nea real)
I Si las dos condiciones se cumplen, entonces el modelo MCO será sesgado e
inconsistente
Datos de Panel – Ejemplo

I Un modelo de datos de panel nos puede ayudar a eliminar este sesgo


I ¿Cómo?
Datos de Panel – Ejemplo

I Un modelo de datos de panel nos puede ayudar a eliminar este sesgo


I ¿Cómo?
I Supongamos que tenemos dos años de información disponible, 1982 y 1988
I El modelo cambia
I Yit = β0 + β1 ImpuestoCervezait + β2 Zi + uit
I Zi es la variable omitida “cultural”
I Note que esta variable no cambia en el tiempo, por eso no tienen subı́ndice t
Datos de Panel – Ejemplo

I Idea: Cualquier cambio en la tasa de muertes por accidentes de tránsito no puede


ser atribuido a Zi , ya que por definición Zi no cambia
I Pizarrón
Datos de Panel – Ejemplo
Datos de Panel – Ejemplo

I Qué hacer si tenemos más de dos perı́odos


I Es preferible usar la mayor cantidad de información
I Nos permite usar más variación y obtener mayor precisión
I Yit = β0 + β1 ImpuestoCervezait + β2 Zi + uit
I Podemos escribir este modelo de dos maneras útiles equivalentes que eliminan el
sesgo de variable omitida
I Regresión incluyendo “efectos fijos”
I Regresión con N-1 variables binarias
I Las dos maneras representan el modelo de datos de panel con efectos fijos
I Pizarrón
Datos de Panel – Efectos fijos

I Regresión incluyendo “efectos fijos”


I Supongamos que tenemos tres estados, Texas, California y New York.
I Pizarrón
I Note que no hemos asumido que αi no esta correlacionada con Xit
Datos de Panel – Efectos fijos
Datos de Panel – Efectos fijos

I Los diferentes interceptos pueden ser representados usando variables binarias


I Asuma que tenemos sólo tres estados
I Yit = β0 + γCA DCAi + γTX DTXi + β1 ImpuestoCervezait + uit
I DCA = 1 si el estado es California y cero de otro modo
I DTX = 1 si el estado es Texas y cero de otro modo
I ¿Por qué no incluimos a New York?
Datos de Panel – Efectos fijos

I En resumen tenemos dos maneras de representar el modelo de efectos fijos


I 1. N-1 Regresores binarios
I Yit = β0 + γ2 D2i + ... + γN DNi + β1 ImpuestoCervezait + uit
I Incluyendo efectos fijos:
I Yit = αi + β1 ImpuestoCervezait + uit
I αi es llamado el efecto fijo del estado, o el efecto fijo (constante) de ser el estado i
Datos de Panel – Efectos fijos (Estimación)

I En la práctica hay tres maneras de estimar el modelo de efectos fijos


I 1. Incluyendo N-1 regresores binarios
I 2. Regresión “Entity demeaned” (Sustrayendo la media de cada unidad)
I 3. Primera diferencia (solo con T=2)
I Estos métodos producen estimaciones idénticas
I El segundo método es el que paquetes estadı́sticos como STATA usan
Datos de Panel – Estimación “Dentro de”

I Yit = αi + β1 Xit + uit


I Pizarrón
I Ỹit = β1 X̃it + ũit
I Estimamos esta ecuación por OLS, POLS para ser precisos
I ¿Qué supuestos necesitamos para realizar esto?
I Detalles adelante
Datos de Panel – Interpretación

I Yit = αi + β1 Xit + uit


I Nos dice: Los estados que tiene altos impuestos a la cerveza tienen menos
accidentes, controlando por caracterı́sticas estáticas de los estados
I Ỹit = β1 X̃it + ũit
I Nos dice: Los estados que experimentan impuestos a la cerveza inusualmente
altos (mayores al promedio del estado), tienen tasas accidentes unualmente bajos
(menores al promedio del estados)
I Los dos modelos son equivalentes, pero el segundo tiene una interpretación más
fácil
Datos de Panel – Efectos temporales fijos
I ¿Qué sucede si la variable omitida cambia a través del tiempo pero no entre
unidades?
I Cambios tecnológicos (autos más seguros)
I Esto produce interceptos que cambian a través del tiempo
I Si St recoge el efecto combinados de estos factores que cambian en el tiempo
pero no entre unidades
I Yit = β0 + β1 Xit + β2 St + uit
I Al igual que el modelo de efectos fijos, este modelo puede ser representado con
T-1 variables binarias o con efectos fijos temporales
I De igual manera la estimación puede realizarse sustrayendo la media del periodo t
(Period - demeaned)
I Pizarrón
Efectos fijos por unidad y periodo

I Yit = β1 Xit + αi + λt + uit


I Se puede estimar con estimación“within” e incluyendo T-1 Efecto fijos temporales
(fácil de hacer en STATA)
I estimación sustrayendo promedio temporal e incluyendo N-1 Efecto fijos
I Incluyendo T-1 efectos temporales fijos y N-1 efectos fijos (computacionalemente
muy caro )
I Sustrayendo la media temporal y por unidad
Datos de Panel

I Si la variable omitida cambia a través del tiempo y entre unidades


I ¿Podemos resolver el problema con un modelo de datos de panel?
Datos de Panel

I Si la variable omitida cambia a través del tiempo y entre unidades


I ¿Podemos resolver el problema con un modelo de datos de panel?
I Grados de libertad
Datos de Panel – Supuestos

I Los supuestos son una extensión de los supuestos MCO


I Para mantener la notación simple usaremos el modelo de efectos fijos
I Es decir, no usaremos el modelo con efectos temporales fijos
I Yit = αi + β1 Xit + uit
Datos de Panel – Supuestos

I 1. Exogeneidad. E (uit |Xi1 , Xi2 , ..., XiT , αi ) = 0


I 2. (Xi1 , Xi2 , ..., XiT , ui1 , ui2 , ..., uiT ) son i.i.d.
I 3. Observaciones extremas son poco probables (Xit , uit ) tienen cuatro momentos
diferentes de cero
I 4. No hay multicolinealidad perfecta
Datos de Panel – Supuestos

I Note que en el supuesto 1 no estamos asumiendo que el efecto fijo αi es


independiente de uit
I El supuesto dice que uit tiene media cero condicional en αi y la historia completa
de X para cada unidad
I En nuestro ejemplo:
I Si un estado tiene una tasa de accidentes particularmente alta (shock) en un año,
este shock no afecta el impuesto a la cerveza posteriormente
Datos de Panel – Supuestos

I ¿Por qué el supuesto 1 implica que podemos estimar la ecuación transformada


(within) por OLS?
I Ỹit = +β1 X̃it + ũit
I ¿Usando de esta ecuación, que supuesto de exogeneidad necesitamos?
Datos de Panel – Supuestos

I ¿Por qué el supuesto 1 implica que podemos estimar la ecuación transformada


(within) por OLS?
I Ỹit = +β1 X̃it + ũit
I ¿Usando de esta ecuación, que supuesto de exogeneidad necesitamos?
I E (X̃it0 ũit ) = 0
I Note que el supuesto 1 implica que este supuesto se cumpla
I El supuesto 1 implica que uit no este correlacionado con Xis para todo s y todo t
Datos de Panel – Supuestos

I De hecho, bajo el supuesto 1:


I E (ũit |Xi ) = E (uit |Xi ) - E (ūit |Xi ) =0
I Lo que implica que:
I E (ũit |X̃i1 , X̃i2 , ..., X̃iT ) = 0
I Debido a que cada X̃it es función de Xi = Xi1 , ..., XiT
I Esto implica que nuestro estimador de β̂1 no es solo consistente, pero también
insesgado
Datos de Panel – Supuestos

I El segundo supuesto se cumple si las unidades son elegidas aleatoriamente


I Este supuesto NO requiere que las observaciones sean i.i.d a través del tiempo
para la misma entidad
I Si un estado tiene un alto impuesto a la cerveza, es probable que tenga un alto
impuesto el siguiente año
I Es decir, se permite que exista correlación serial
I Los supuestos 3 y 4 son los mismos que estudiamos para datos de sección cruzada
I Bajo estos supuestos los estimadores de este modelo son consistentes y
normalmente distribuidos cuando N es grande (asintóticamente normal )
Datos de Panel – Errores Estándar

I Nótese que no hemos asumido homocedasticidad y que hemos permitido la


posibilidad de autocorrelación de los errores
I Debido a la autocorrelación, la estimación de errores estándar robustos a
heterocedasticidad no es suficiente
I Necesitamos estimar errores estándar robustos a heterocedasticidad y
autocorrelación
I Un tipo de errores estándar que cumple con esas caracterı́sticas son errores
estándar agrupados (clustered standard errors)
I Otra opción es modelar la autocorrelación (efectos aleatorios)
I Esto implica tener más supuestos que posiblemente no se cumplen – Más de este
tema adelante
Datos de Panel – Errores Estándar Agrupados

I El nombre se da porque esta estimación permite que los errores pertenecientes a


una unidad sean arbitrariamente correlacionados dentro de un agregado,
conglomeración o cluster
I Sin embargo, seguimos asumiendo que los errores no están correlacionados entre
los grupos
I En el contexto de datos de panel un conglomerado es un unidad
I Esta manera de estimar errores estándar es consistente con el supuesto 2.
I Este tipo de estimación es válida si existe o no heterocedasticidad y exista o no
autocorrelación
Datos de Panel – Errores Estándar Agrupados

I Tomar en cuenta que queremos estimar errores estándar correctamente


I Es decir, estimar los errores estándar que nos permitan rechazar hipótesis nulas a
una tasa correcta
I Paper importante: Bertrand, Duflo, Mullainathan (2004 QJE)
I Usó información de encuestas (CPS) de ingresos de mujeres agregados a nivel de
estado/año en EE.UU.
I Aleatoriamente seleccionó un año entre 1979 y 1999
I Aleatoriamente asignó una “Ley Placebo” a 25 estados
I Al estimar errores estándar no se lo hizo de manera agrupada
Datos de Panel – Errores Estándar Agrupados

I Los resultados de un modelo de Efectos fijos encontró un efecto significativo al


5%, 45% de las veces!
I Claramente existı́a un problema
I ¿Cuál?
Datos de Panel – Errores Estándar Agrupados

I Los resultados de un modelo de Efectos fijos encontró un efecto significativo al


5%, 45% de las veces!
I Claramente existı́a un problema
I ¿Cuál?
I Los errores estándar eran muy pequeños
I El agrupar los errores estándar al nivel del estado produjo las tasas correctas de
rechazo
Datos de Panel – Errores Estándar Agrupados

I Estimación formal de errores estándar agrupados


I Pizarrón
Datos de Panel – Errores Estándar Agrupados

I Representación gráfica de la matriz de varianza - covarianza


I Pizarrón
I Si usamos errores estándar robustos a heterecedasticidad, todos lo elementos
fuera de la diagonal son cero
I Asumir homocedasticidad implica que todos los elementos de la diagonal son
iguales
I Usar efectos aleatorios implica que imponemos una estructura especı́fica a cada
bloque en la matriz
I Implica además que esa estructura sea la misma para cada bloque
Datos de Panel – MCO Agrupado

I Partiendo del modelo que hemos usado


I Yit = αi + β1 Xit + uit
I Si asumimos que el efecto fijo αi no está correlacionado con Xit
I Entonces no existe problema de endogeneidad
I Podemos estimar el modelos por MCO aplicado al panel sin ninguna
transformación
I Ese modelo se conoce como Pooled OLS o POLS
Datos de Panel – Efectos Aleatorios

I Este modelo coloca αi en el error


I Asumimos
I E (uit |Xi1 , Xi2 , ..., XiT , αi ) = 0
I A igual que antes
I Y adicionalmente:
I E (αi |Xi ) = E (αi ) = 0
I Recuerde que no asumimos este en el modelo de efectos fijos
I Si asumimos que αi es independiente de Xi el anterior supuesto se cumple
Datos de Panel – Efectos Aleatorios

I ¿Qué tan realista es el supuesto anterior?


I En el ejemplo de accidentes de tránsito e impuestos al alcohol
I El supuesto implica que cualquier variable no observable que varı́e entre unidades,
pero sea invariable en el tiempo, será independiente de Xi
I Este es un supuesto bastante restrictivo, y no nos permite eliminar este tipo de
heterogeneidad
I Yit = β1 Xit + eit
I Con eit = uit + αi
Datos de Panel – Efectos Aleatorios

I Lo cual implica
I E (eit |Xi ) = 0
I Lo cual implica exogeneidad estricta
I Note que este modelo reconoce la existencia de αi
I Pero asume que es independiente de Xi
I La ventaja del modelo de efectos aleatorios sobre POLS es que permite una
estimación eficiente
Datos de Panel – Efectos Aleatorios

I Eficiente en el sentido de varianza mı́nima


I Al aplicar un FGLS al panel
I Recordar que necesitamos para usar FGLS
I Debemos estimar una matriz de varianza covarianza y usarla para estimar el
modelo generalizado
I Esto requiere supuestos adicionales acerca de la estructura de está matriz
I Necesitamos asumir que la misma es función de parámetros estimables
Datos de Panel – Efectos Aleatorios

I Un modelo de efectos aleatorios tradicional asume:


I E (uit2 |Xi , αi ) = σu2
I Una forma de homocedasticidad o varianza constante
I E (uit ∗ uis |Xi , αi ) = 0
I No correlación serial
I Note que estos supuestos son acerca de uit no acerca de eit
I Además, asumimos E (αi2 |Xi ) = σα2
I ¿Alguien lleva la cuenta de cuántos supuestos adicionales necesitamos?
Datos de Panel – Efectos Aleatorios

I Derivación de la matriz de varianza-covarianza: Ω


I Pizarrón
Datos de Panel – Efectos Aleatorios

I Derivación de la matriz de varianza-covarianza: Ω


I Pizarrón
I Necesitamos una estimación consistente de σα2 y σu2
I Un primer paso suele ser estimar un primer modelo con POLS
I Y usar los coeficientes para estimar los componentes de Ω
I La matriz Ω podrı́a ser estimada usando errores robustos agrupados
I Esto implica que necesitamos menos supuestos, pero la justificación de usar
efectos aleatorios al ser eficientes se desvanece
Datos de Panel – Efectos Aleatorios o Fijos

I Si el efecto fijo αi es independiente de Xit , entonces el modelo de efectos


aleatorios es consistente y eficiente
I En ese caso preferimos usar efectos aleatorios
I Si tal supuesto no se cumple, efectos fijos es preferible
I La manera conservadora será usar efectos fijos estimando errores estándar
agrupados
I Es recomendable también incluir efectos temporales fijos
I Se debe ser transparente y reportar todas las especificaciones usadas y entender
los supuestos que usamos
Datos de Panel – Efectos Aleatorios o Fijos

I Una prueba que se suele usar para decidir que modelo usar es la de Hausman
I La prueba hace una comparación entre las estimaciones de efectos fijos y
aleatorios
I Esta prueba asume exogeneidad estricta
I La prueba puede únicamente hacer comparaciones entre coeficientes de regresores
que varı́an en el tiempo y entre unidades
Datos de Panel – Efectos Aleatorios o Fijos

I La idea de la prueba es que si αi esta correlacionada con Xit , entonces el modelos


de efectos fijos será consistente
I Pero el de efectos aleatorios no lo será
I Una diferencia estadı́stica significativa entre las estimaciones de los dos modelos
es interpretada como evidencia en contra del modelo de efectos aleatorios
I La innovación de la prueba es encontrar que la varianza asintótica de las
diferencias de los estimadores es igual a la diferencia de las varianzas asintóticas
de los mismos
I Prueba en el pizarrón
Datos de Panel – Efectos Aleatorios o Fijos

I Una de las ventajas de usar efectos aleatorios es que ofrece estimaciones


eficientes, si los supuestos se cumplen
I Si el modelos de efectos fijos es muy impreciso, entonces la prueba de Hausman
tendrá poco poder
I Los errores estándar serán muy altos, y será difı́cil rechazar la H0
I Si efectos fijos es preciso, entonces la prueba de Hausman tendrá un mejor poder
I Pero la motivación para usar efectos aleatorios (precisión) pierde relevancia
Datos de Panel – Presencia de Efectos Fijos

I Hasta ahora hemos asumido que los efectos fijos existen


I Además, en el modelo de efectos fijos asumimos que los mismos podı́an estar
correlacionados con Xi
I ¿Qué sucede si αi no existe?
I ¿Qué modelo usar?
I POLS
I Podemos probar la existencia αi usando la prueba de Breusch Pagan (1980) o
variaciones a la misma
Datos de Panel – Presencia de Efectos Fijos

I Breusch Pagan (1980)


I Si mantenemos el supuesto de que E (αi2 |Xi ) = σα2
I Entonces, probar la existencia de αi es equivalente a H0: σα2 = 0
I Si estimamos σα2 como lo hicimos en el modelo de efectos aleatorios,entonces
podemos realizar esta prueba
Datos de Panel

I Cuando T=2, los estimadores del modelo de efectos fijos (within) son
equivalentes a los estimadores del modelo de primera diferencia
I Pizarrón
Datos de Panel

I Además, de la prueba de Hausman o sus extensiones, la decisión de qué modelo


usar debe estar basada en que tan justificables son los supuestos que estamos
usando
I No debe estar basada en qué modelo es más complejo
I Con software especializado los dos modelos estimados prácticamente sin esfuerzo

También podría gustarte