Está en la página 1de 5

Notas de Clase Econometría 2010:

Introducción a Modelos con Datos de Panel

Prof. Hildegart Ahumada

Los llamados datos de panel (antiguamente se los llamaba “pooling”) se


caracterizan por combinar datos de series de tiempo (días, meses, años, etc.) con
datos de corte transversal (familias, firmas, regiones, países, etc.) Los modelos
para este tipo de datos están generalmente pensados para el análisis de corte
transversal. Es decir, la heterogeneidad de las unidades de observación son de
principal interés siendo la dimensión temporal, frecuentemente, corta (pocas
observaciones temporales que se captan por variables dummies). A continuación
solo analizaremos las heterogeneidades debidas a corte transversal. Para
comparación partimos de un modelo sin discriminación de observaciones que
sería el siguiente (a veces llamado de variaciones totales o “pooling”),

yit    x´it    it i  1,2,..., n (grupo) (1)


t  1,2,..., T (tiempo)

donde tanto las x como el término de error tienen las propiedades usuales. Sin
embargo, los estimadores de (1) no serán insesgados (ni consistentes) si el
verdadero modelo incluye heterogeneidades por i (variables omitidas). Es decir, si
el modelo es,

yit   i  x ´it    it i  1,2,..., n (2)


t  1,2,..., T

Este es modelo es el de FIXED EFFECTS que puede estimarse por MCO


agregando n dummies (n-1 si dejamos la ordenada). Como muchas veces n es
muy grande una formulación equivalente es expresar el modelo en forma de
desvíos con respecto a las medias de cada grupo1. Para ello 1ro. sumamos cada
término en t y dividimos por T obteniendo,

yi   i  x ´i    i i  1,2,..., n (3)

y restando miembro a miembro (2) menos (3),


1
El análisis siguiente es similar al que se realiza cuando el modelo (sin dummies) se expresa en forma de
desvíos con respecto a las medias de las variables eliminando la constante para estimar los coeficientes de
regresión. Lego el estimador de la constante se obtiene partir de las medias y los coeficientes estimados.
 yit  yi   x it

 xi    it -  i 
´
i  1,2,..., n (4)
t  1,2,..., T

La ecuación (4) puede estimarse por MCO para obtener los estimadores de

los efectos parciales de las x ̂ . Este modelo se llama LSDV (Least Squares
Dummy Variable) ya que es equivalente a estimar (2) incluyendo estas variables.
A la equación (4) también se la denomina de “Within (groups) effects” mientras
que la (3) es la de “Between (groups) effects” y la (1) la de “Total effects”.

Es importante notar que los estimadores de los β son insesgados,


eficientes y consistentes cuando n o T tiende a infinito (con los supuestos
usuales) pero hay algo distinto con los estimadores de los efectos por grupo.
Primero notemos que ellos se obtendrían como,

ˆ i  yi - x ´ ˆ i
i  1,2,..., n (5)

Siendo las varianzas (V) obtenidas como,

V ˆ i  
 2
T

- x ´i V βˆ x i i  1,2,..., n (6)

En el caso de los estimadores de los efectos por grupo, la consistencia


depende de que solo T tienda a infinito. Intuitivamente, cuando n tiende a infinito
(estando T fijo) el número de parámetros que tenemos que estimar también tiende
a infinito.2

Para tener en cuenta este problema de números de parámetros a estimar y


cuando se quiere aplicar el modelo a unidades de corte tranversal que no están
incluidas en la muestra (otros países o familias, por ejemplo) puede ser razonable
suponer el modelo RANDOM EFECTS, para el cual el modelo sería,

yit  x´it    i   it i  1,2,..., n (7)


t  1,2,..., T

2
En (6) la varianza no tiende a cero excepto que T tienda a infinito.
donde  i es una variable aleatoria cuyas realizaciones son las heterogeneidades
observadas para los distintos grupos. Para esta variable se supone, además de no
estar correlacionada con el error de la regresión  it ,

- E [  i ] = 0 (podemos pensar que tienen una media así si incluimos


constante en la regresión )

- E [  i .  j ] =   si i=j y cero si distintos.

Por lo tanto puede pensarse que en realidad el término de error en la ecuación (7)
es it que tiene dos componentes,

 it   i   it

E  it   0
 
E  it2   2   2
E  is .  it    2 ts

En este caso la matriz de varianzas y covarianzas (W) de los errores de nT. nT no


es diagonal. Puede notarse que si reemplazamos a los  i por  i en (2) y (3), la
ecuación “Between” sería,

yi  i  x ´i    i i  1,2,..., n (8)

y restando (8) de (7) llegamos también a la ecuación (4) , expresada en forma de


desvíos donde no hay efectos por grupo,  i .

De allí podrían estimarse los β ya que serán insesgados.3 Sin embargo,


debido a la menciona matriz de varianzas y covarianzas de los errores, los
estimadores de los β no serán eficientes. Pueden entonces estimarse por MCG
notando que,

 
̂ MCG  X ' W 1 X  . X ' W 1 y 
´
1

 

3
En el caso de los modelos de efectos aleatorios pueden aparecer problemas de consistencia si dichos
efectos están correlacionados con las variables explicativas.
Donde

 0 0 0 ... 0 
0 Ω 0 0 ... 0 
 
 
W  E w.w  0 0 Ω 0 ... 0 
'

 
 ......................... 
 0 0 0 0 ...  

 2   2  2  2  2 ...  2 
 
   2   2  2  2 ...  2 
2

 
    2  2  2   2  2 ...  2 
 ......................................................................... 
 
  2  2 ...  2   2 
 

Las matrices  , una para cada grupo, son de dimensión T.T.

Para llegar a los MCG factibles solo deberán estimarse dos parámetros,

y   usando, por ejemplo los siguientes estadísticos,
2 2

De (4)
  ˆ it  ˆi 
ˆ  2 i t

nT  k  n

De (8)
ˆ 2 usando la varianza residual que es
ˆ 2
ˆ 2 
T

Los estimadores de efectos aleatorios, a diferencias de los fijos pueden incluir


variables X i (es decir que varían solo por i no por t). Sin embargo, en este caso la
ecuación (4) o LSDV no podrán calcularse. En este caso se podrá usar los
residuos de la ecuación (7) estimada por MCO es decir a partir de  ,
ˆ 2
ˆ 2  ˆ 2  ˆ 2

junto a la (8) para estimar las varianzas necesarias para los MCG factibles.

Para profundizar el tema puede verse Greene Econometric Analysis (1999 y ed.
Posteriores, CH. 14 ( y los manuales de Eviews y Stata).