Modelos de Datos de Panel Espacial Usando Stata

Machine Translated by Google
El diario de Stata (2017)

17, Número 1, págs. 139–180
Modelos de datos de panel espacial usando Stata
Federico Belotti Universidad

Centro de Estudios Económicos e Internacionales Gordon Hughes de Edimburgo
Universidad de Roma Tor Vergata Roma, Italia Edimburgo, Reino
federico.belotti@uniroma2.it Unido gahughes@ed.ac.uk
Andrea Piano Mortari

Centro de Estudios Económicos e Internacionales
Universidad de Roma Tor Vergata Roma, Italia
andrea.piano.mortari@uniroma2.it
Resumen. xsmle es un nuevo comando escrito por el usuario para el análisis espacial.
Consideramos la estimación de verosimilitud casi máxima de un amplio conjunto de modelos
espaciales de efectos fijos y aleatorios para datos de panel balanceados. xsmle permite a los
usuarios manejar paneles no balanceados utilizando su compatibilidad total con el conjunto de
comandos mi, usar matrices de peso espacial en forma de matrices de Stata y objetos spmat,
calcular efectos marginales directos, indirectos y totales y errores estándar relacionados para
lineal ( en variables) especificaciones, y explotar una amplia gama de características de
postestimación, incluidos los predictores de caso de datos de panel de Kelejian y Prucha (2007,
Regional Science and Urban Economics 37: 363–374). Además, xsmle permite el uso de
márgenes para calcular los efectos marginales totales en presencia de especificaciones no
lineales obtenidas utilizando variables factoriales. En este artículo, describimos el comando y
todas sus funcionalidades utilizando datos reales y simulados.
Palabras clave: st0470, xsmle, análisis espacial, modelo de autocorrelación espacial, modelo
espacial autorregresivo, modelo espacial de Durbin, modelo de error espacial, modelo de efectos
aleatorios de panel espacial generalizado, datos de panel, estimación de máxima verosimilitud
1. Introducción
Es ampliamente reconocido que los datos de muestra recopilados de entidades geográficamente
cercanas no son independientes sino espacialmente correlacionados, lo que significa que las
observaciones de unidades más cercanas tienden a ser más similares que las observaciones de
unidades más alejadas (Tobler 1970).1 El agrupamiento espacial, o correlación geográfica, se observa
a menudo para variables económicas y sociodemográficas como el desempleo, las tasas de criminalidad,
los precios de la vivienda, los gastos per cápita en salud , etc. éret 2009; Elhorst, Piras y Arbia 2010;
Moscone, Tosetti y Vittadini 2012). Los modelos teóricos suelen reconocer la existencia de derrames
espaciales,
1. Tenga en cuenta que también se puede observar una dependencia estructurada no espacial. En estos casos,
las medidas de proximidad geográfica se reemplazan por medidas de similitud, lo que permite investigar los
efectos de pares a través de redes sociales o industriales (LeSage y Pace 2009; Bramoullé, Djebbari y Fortin
2009).
c 2017 StataCorp LLC st0470

140 Modelos de datos de panel espacial usando Stata
que disminuyen a medida que aumenta la distancia entre las unidades; empíricamente, los modelos de datos de panel espaciales
se han convertido en una herramienta popular para medir dichos efectos indirectos.
Hasta donde sabemos, aunque tanto R como MATLAB ofrecen un amplio conjunto de funciones para
estimar modelos de datos de panel espaciales (Millo y Piras 2012; LeSage y Pace 2009), con la notable
excepción representada por el código adjunto de Kapoor, Kelejian, y Prucha (2007): las capacidades de
Stata incluyen un amplio conjunto de comandos diseñados para manejar solo datos transversales (Drukker
et al. 2013; Drukker, Prucha y Raci borski 2013a,b). Desarrollamos el comando xsmle para estimar una
amplia gama de modelos de datos de panel espacial usando Stata. En particular, xsmle permite a los
usuarios estimar modelos espaciales autorregresivos (SAR) de efectos fijos (FE) y efectos aleatorios (RE) ,
modelos espaciales de Durbin (SDM), modelos de error espacial (SEM), modelos de autocorrelación
espacial FE (SAC) , y modelos RE espaciales generalizados (GSPRE) . Para autorregresivos espaciales
(SAR) y SDM con FE, xsmle también permite una especificación dinámica mediante la implementación del
enfoque de máxima verosimilitud con corrección de sesgo descrito en Yu, de Jong y Lee (2008).
Entre otras funciones interesantes, xsmle permite a los usuarios i) utilizar matrices de ponderación espacial
creadas mediante el comando spmat de Drukker et al. (2013); ii) calcular los efectos marginales directos,
indirectos y totales; iii) calcular los errores estándar agrupados y de Driscoll-Kraay; iv) probar si un modelo
FE o RE es apropiado utilizando una prueba robusta de Hausman; v) y explotar una amplia gama de
predictores, extendiéndose a los estimadores de casos de datos de panel de Kelejian y Prucha (2007).
El resto de este artículo se organiza como sigue. En la sección 2, presentamos una breve revisión de
los modelos de datos de panel espacial que se pueden estimar con xsmle. La sección 3 documenta la
sintaxis xsmle y sus opciones principales, mientras que la sección 4 ilustra sus características principales
utilizando conjuntos de datos reales y simulados. La última sección concluye.
2 modelos de datos de panel espacial

Aquí resumimos los modelos de datos de panel espacial, centrándonos en aquellos que se pueden estimar
con xsmle. Tenga en cuenta que xsmle está diseñado principalmente para manejar datos de panel
equilibrados en los que se observan n unidades durante exactamente T períodos. Pasaremos a los paneles
desequilibrados en la sección 4.1, donde mostramos cómo manejarlos explotando el conjunto de comandos
oficial de Stata mi.
A continuación, denotamos el vector columna n × 1 de la variable dependiente con yt y la matriz de

regresores n × k con Xt, donde t = 1,...,T indica periodos de tiempo. Para cada sección transversal, W es la
matriz n × n que describe la disposición espacial de las n unidades, y cada entrada wij ÿ W representa el
peso espacial asociado a las unidades i
F. Belotti, G. Hughes y A. Piano Mortari 141
2
y j. Para excluir a los vecinos propios, los elementos diagonales wii se fijan
convencionalmente en cero. Tenga en cuenta que xsmle permite el uso de dos formatos
diferentes para la matriz de peso; es decir, W puede ser una matriz de Stata o un objeto spmat.
Esto permite al usuario aprovechar las capacidades de otros comandos de Stata que permiten
la creación y gestión de matrices de peso, como spmat, spatwmat (Pisati 2001) o spwmatrix (Jeanty 2010).
Además, xsmle se ocupa automáticamente de la naturaleza longitudinal de los datos.
Por lo tanto, los usuarios deben proporcionar solo la matriz de peso transversal n × n para ajustarse a un modelo
específico.
xsmle permite a los usuarios adaptarse a los siguientes modelos:
modelo SAR . La ecuación básica para el modelo SAR es
yt = ÿWyt + Xtÿ + ÿ + t t = 1 ...,T
Se supone que ÿ ÿ N(0, ÿ2 ÿ) en el caso RE , mientras que ÿ es un vector de parámetros ÿ

estimar en la variante FE . Las suposiciones estándar, que it y E( it js) = 0 para iN(0,
= j oÿ2
t =) s,
a
se aplican en este caso.
SDM. Este modelo es una generalización del modelo SAR , que también incluye espacialmente
variables independientes ponderadas como variables explicativas,
yt = ÿWyt + Xtÿ + WZtÿ + ÿ + t
donde M es una matriz de ponderaciones espaciales que pueden o no ser iguales a W.

Este modelo se puede generalizar aún más usando Zt = Xt.
modelo SAC . Este modelo (también conocido como SAR con errores espacialmente autocorrelados, SAC) amplía
el modelo SAR al permitir un modelo espacialmente autocorrelacionado .
error,
yt = ÿWyt + Xtÿ + ÿ + ÿt ÿt = ÿMÿt

+t
donde M es una matriz de ponderaciones espaciales que pueden o no ser iguales a W. La

literatura se centra en la variante FE de esta especificación porque la variante RE se puede
escribir como un caso especial de la especificación SAR .
2. Generalmente se explotan dos fuentes de información de ubicación. Primero, la ubicación en el espacio

cartesiano (por ejemplo, latitud y longitud) se usa para calcular distancias entre unidades. En segundo lugar,
el conocimiento del tamaño y la forma de las unidades de observación permite la definición de medidas de contigüidad.
Por ejemplo, se puede determinar qué unidades son vecinas en el sentido de que comparten fronteras
comunes. Así, la primera fuente apunta hacia la construcción de matrices de distancia espacial, mientras que
la segunda se utiliza para construir matrices de contigüidad espacial. Tenga en cuenta que las fuentes de
información de ubicación antes mencionadas no son necesariamente diferentes. Por ejemplo, se puede
construir una matriz de contigüidad espacial definiendo unidades como contiguas cuando se encuentran dentro
de una cierta distancia; por otro lado, al calcular las coordenadas del centroide de cada unidad de observación,
se pueden obtener matrices de distancias espaciales aproximadas utilizando las distancias entre centroides.
Más detalles están disponibles en LeSage y Pace (2009).
SEM. El SEM se enfoca en SAC en el término de error, como en
yt = Xtÿ + ÿ + ÿt ÿt =
ÿMÿt + t
Este es un caso especial del modelo SAC , pero también es un caso especial del SDM.
GSPRE. Este modelo se puede representar como
yt = Xtÿ + ÿ + ÿt ÿt =
ÿMÿt + t
ÿ = ÿWÿ + ÿ
Esta es una generalización del SEM, en la que los efectos de panel, representados por el vector ÿ,
están espacialmente correlacionados. Se supone que los vectoresnormalmente
ÿ y t son errores
de forma
distribuidos
independiente, por lo que el modelo es necesariamente una especificación RE con ÿ = (I ÿ ÿW)ÿ1ÿ
y ÿt = (I ÿ ÿW)ÿ1 t. Hay varios casos especiales de la
especificación general, con (a) ÿ = ÿ = 0, (b) ÿ = 0, (c) ÿ = 0, (d) ÿ = ÿ.
Además de la distinción entre FE y RE, existe una distinción separada entre especificaciones
estáticas y dinámicas. Los modelos antes mencionados son todos estáticos en el sentido de que
involucran valores contemporáneos de las variables dependientes e independientes. xsmle también
permite la estimación de modelos SAR y SDM , como
yt = ÿytÿ1 + ÿWytÿ1 + ÿWyt + Xtÿ + ÿ + t
donde la variable dependiente retrasada (en el tiempo) o la variable dependiente retrasada (tanto en el
tiempo como en el espacio) pueden incluirse en la especificación.
2.1 Estimación
Se han propuesto varios métodos para ajustar modelos de paneles espaciales. En términos generales,
se dividen en dos categorías: i) método generalizado de momentos y ii) estimadores de cuasi-máxima
verosimilitud (QML) . Todos los modelos que se pueden ajustar con xsmle pertenecen a la segunda
categoría. En la tabla 1 se presenta una guía de sinopsis con todos los modelos estimables y sus
características .
La ganancia de los gradientes de programación es grande, por lo que los evaluadores v1 se
utilizan para todas las especificaciones menos una. La excepción es RE SEM, cuya función de
verosimilitud implica una transformación utilizando los factores de Cholesky de una matriz bastante
complicada que contiene los parámetros a estimar, por lo que la diferenciación de matrices es
extremadamente complicada.
3. Elhorst (2010a) sugiere que el tiempo de cálculo requerido para llevar a cabo una estimación de máxima
verosimilitud total se puede reducir transformando las variables de una manera que permita concentrar la
función de verosimilitud para que la estimación se pueda realizar en dos pasos. Al traducir sus rutinas a
Mata, encontramos que usar una probabilidad concentrada tendía a aumentar tanto el número de
iteraciones como el tiempo requerido para ajustar los modelos.
GSPRE
QML SDM
QML SEM
SACO QML RAE Modelo
QML QML Estimación
Tiempo
Individual
Aleatorio
wmatrix()
ematrix()
dmatrix()
Método
dinámico
Tabla
1.
Un
resumen
de
las
capacidades
de
estimación
xsmle
FE
X X X X
FE
X X X X
efectos
X X X X
X X X X
X X X
X
X X
143 F. Belotti, G. Hughes y A. Piano Mortari
Para los modelos dinámicos, es decir, aquellos que incluyen una variable dependiente retardada
en el tiempo, una variable dependiente retardada en el tiempo y el espacio, o ambas, xsmle implementa
solo la variante FE de los modelos SAR y SDM utilizando el enfoque QML con corrección de sesgo
descrito por Yu, de Jong y Lee (2008), lo cual es consistente cuando tanto n ÿ ÿ como T ÿ ÿ. El comando
comienza construyendo estimaciones de máxima verosimilitud, tratando las variables rezagadas
mencionadas anteriormente como regresores exógenos. Luego se calculan las correcciones de sesgo
para cada uno de los coeficientes y se usan para ajustar las estimaciones iniciales de máxima verosimilitud.
Para cada modelo, la matriz de varianza-covarianza asintótica (VC) predeterminada de los

coeficientes se obtiene de la matriz de información observada.4 Angrist y Pischke (2009) enfatizan los
peligros potenciales de este enfoque para conjuntos de datos para los que puede haber una correlación
serial desconocida. en los errores dentro de cada unidad del panel. Hasta donde sabemos, no existen
métodos establecidos para calcular errores estándar robustos para modelos de datos de panel espacial.
Imitando la derivación de errores estándar robustos para modelos de panel no espaciales, xsmle
implementa dos enfoques diferentes: i) errores estándar agrupados unidireccionales y ii) errores
estándar de Driscoll y Kraay (1998) . Como en otros comandos oficiales de Stata de datos de panel,
especificar vce(robust) es equivalente aquí a especificar vce(cluster panelvar), donde panelvar es la
variable que identifica los paneles.
En cuanto a los errores estándar de Driscoll–Kraay, la implementación de xsmle se basa en el

comando xtscc de Hoechle (2007) . El enfoque de Driscoll-Kraay proporciona una variante específica
del estimador de covarianza robusto de Newey-West calculado utilizando el núcleo de Bartlett y una
serie temporal de promedios transversales de puntajes.5
En nuestras ejecuciones de prueba, las diferencias entre los errores estándar asintóticos y robustos
suelen ser pequeñas, pero no nos hemos centrado en los casos con valores pequeños de n y T.
En principio, sería útil incluir un estimador bootstrap para la matriz VC .
Desafortunadamente, existe una barrera importante para aplicar métodos de arranque estándar en
este caso. La suposición crucial para el remuestreo es que los errores de las observaciones o unidades
de las que se extrae cada muestra deben ser independientes. Para datos de panel o agrupados, esto
significa que el remuestreo se basa en unidades de panel o agrupaciones. Para paneles espaciales,
nuestro modelo base asume que las observaciones para diferentes unidades de panel están
correlacionadas en el espacio para cualquier período t. De ello se deduce que el remuestreo basado
en unidades de panel no puede reconciliarse con la hipótesis de interacciones espaciales en las relaciones de interés.
Como alternativa, podríamos usar períodos de tiempo como unidad de remuestreo, pero esto será
válido solo si no existe una correlación serial dentro de los paneles. Además, para muchas aplicaciones
de estimación de panel espacial, el valor de T es considerablemente más pequeño que n, por lo que
no se aplican las suposiciones de muestras grandes de estadísticas de arranque. Los estadísticos han
desarrollado métodos de arranque para datos espaciales, pero a costa de imponer restricciones
sustanciales sobre el alcance de las interacciones espaciales que se pueden examinar. Los métodos
han tendido a centrarse en redes regulares, pero se pueden aplicar a datos espaciales para unidades
económicas bastante pequeñas, como condados y áreas del mercado laboral.
4. También está disponible una variante obtenida del producto exterior de los gradientes especificando vce(opg).
5. El ancho de banda para el núcleo se especifica con un valor predeterminado de piso{4(T /100)2/9} si no se especifica ningún valor.
especificado.
Efectos marginales directos, indirectos y totales
Debido a que los modelos de regresión espacial explotan la complicada estructura de dependencia
entre unidades, el efecto del cambio de una variable explicativa para una unidad específica
afectará a la unidad misma y, potencialmente, a todas las demás unidades indirectamente. Esto
implica la existencia de efectos marginales directos, indirectos y totales. Con la excepción de los
modelos SEM y GSPRE , y solo si se especifica la opción de efectos, estos efectos se calculan
usando las fórmulas reportadas en la tabla 2. El comando distingue automáticamente entre efectos
marginales a corto y largo plazo cuando se utiliza un modelo espacial dinámico. está en forma
Fuente:
Adaptado
de
Elhorst
(2014).
Nota:
El
superíndice
¯d
denota
el
operador
que
calcula
el
elemento
diagonal
medio
de
una
matriz,
yel
superíndice
rsum
denota
el
operador
que
calcula
la
suma
media
de
fila
los
elementos
no
diagonales. RAE SDM SACO RAE SEM SDM tipo
de
modelo
{(I
ÿÿW)
ÿ1
×(ÿkI
+
ÿWk )}
{(yo
ÿÿW)
ÿ1
Efecto
directo
a
corto
plazo
×(ÿkI)}
ninguna ninguna ninguna ninguna
d
d
{(I
ÿÿW)
ÿ1
×(ÿkI
+
ÿWk
rsum
)}
Efecto
indirecto
a
corto
plazo
{(yo
ÿÿW)
ÿ1
×(ÿkI)}
rsuma
ninguna ninguna ninguna ninguna
Tabla
2.
Efectos
directos,
indirectos
ytotales
Dinámica
{(I
ÿÿW)
ÿ1
×
(ÿkI
+
ÿWk )}
Estático
{(I
ÿÿW)
ÿ1
×
(ÿkI)} {(I
ÿÿW)
ÿ1
×
(ÿkI)}
×(ÿkI)}
×(ÿkI
+
ÿWk
{(1
ÿ)I
(ÿ
+ÿ)W)
ÿ1
{(1
ÿÿ)I
(ÿ
+
ÿ)W)
ÿ1 )}
Efecto
directo
a
largo
plazo
¯d
ÿk
d
d
dd
{(I
ÿÿW)
ÿ1
×
(ÿkI
+
ÿWk
rsum)}
{(I
ÿÿW)
ÿ1
×
(ÿkI)}
rsum {(I
ÿÿW)
ÿ1
×
(ÿkI)}
rsum
×(ÿkI)}
rsum
×(ÿkI
+
ÿWk
rsum
{(1
ÿÿ)I
(ÿ
+
ÿ)W)
ÿ1
{(1
ÿÿ)I
(ÿ
+
ÿ)W)
ÿ1 )}
Efecto
indirecto
a
largo
plazo
ninguna
Modelos de datos de panel espacial usando Stata 146
Tenga en cuenta que los resultados analíticos informados en la tabla 2 son válidos solo para
especificaciones lineales (en variables). Por lo tanto, por defecto, una especificación de “variables
factoriales” bloqueará el cálculo de estos efectos.6 No obstante, en estos casos, xsmle permite el uso
de márgenes para al menos calcular los efectos marginales totales. Como se describe en la sección
4.1, xsmle también calcula los errores estándar de los efectos marginales mediante la simulación
Monte Carlo (predeterminada) o el método Delta.
Prueba robusta de Hausman
Una pregunta clásica en los análisis empíricos de datos de panel se refiere a la elección entre las
variantes FE y RE (cuando ambas pueden estimarse). Se puede dar una respuesta a esta pregunta
utilizando el estadístico de Hausman (1978) ,
ÿ1
ÿ = ÿV 0 d (1)
donde ÿ = (ÿ FE ÿ ÿ RE) es la diferencia entre las estimaciones FE y RE y V una 0 es
estimación de la matriz VC de ÿ. La distribución asintótica de (1) bajo la hipótesis nula

de que no hay diferencia sistemática entre los dos conjuntos de estimaciones es ÿ2 con
c grados de libertad, siendo c generalmente el tamaño del vector de parámetros estimado.
Esta prueba se puede implementar fácilmente en Stata usando el comando oficial de hausman.
Sin embargo, uno de los problemas comunes con los modelos de datos de panel espacial es que la
prueba de especificación de Hausman a menudo no cumple con sus suposiciones asintóticas,
especialmente en muestras pequeñas. Esto se debe a que, bajo la hipótesis
0 garantiza
alternativa,
ÿ V sea
quenodefinida
Vse
RE = V FE
positiva. xsmle permite a .los usuarios superar este problema porque .
representa directamente a Cov (ÿ FE, ÿ RE); es decir,
0 + VV 0RE
e hasta
Icÿdenota
2Cov
DW/0D
(ÿ
particular,
FE,
donde
ÿ RE).
xsmle
D=In(Ic,
= VÿIc)
FE
estima Vfórmula
consistentemente utilizando la siguiente , conjunta
la matrizsándwich,
identidad de, tamaño
W/0, sec. La matriz VC
estima
ÿ1 ÿ1
HFE O SFE,FE SFE,RE HFE O
W/0 =
O HRE SRE,FE SRE,RE O HRE
con
1
norte
ÿ2Lpi ÿ pag
Hp _ =ÿ
, p = FE, RE
norte
yo=1 ÿÿ ÿÿ
ÿLpi ÿ ÿLqi ÿ
norte
1 pag q
Spq = , p, q = FE, RE
norte
yo=1
ÿÿ ÿÿ
ÿ1 ÿ1 ÿ1 ÿ1
donde H FE( SFE,FE)HFE yH
RE( S ¯RE,RE)H dondeRE son las matrices VC robustas de clúster de
FE yÿ RE, el clúster está representado por la unidad del panel. Tenga en cuenta que el hausman
La opción ÿ solo está permitida para modelos estáticos.

6. Agradecemos a un árbitro anónimo por señalarnos este punto. Al igual que otros comandos de estimación de
Stata, xsmle no puede reconocer especificaciones no lineales que no se basen en variables de factores, por
ejemplo, interacciones o términos de segundo orden definidos por el usuario.
3 El comando xsmle
El comando xsmle se escribe utilizando el conjunto de funciones de optimización () y el motor de optimización utilizado
por ml. Comparte las mismas características de todos los comandos de estimación de Stata. Stata 10.1 es la primera
versión que puede ejecutar xsmle. Solo pesos analíticos
(un peso), pero la variable de pesos declarada debe ser constante dentro de cada
unidad del tablero. xsmle admite el prefijo mi pero no admite el prefijo svy.
Las variables de factor están permitidas si se usa Stata 11 (o posterior) para ejecutar el comando.
Un requisito previo importante para usar el comando se refiere a la construcción de n × n

matriz de pesos espaciales. Esta matriz puede ser una matriz de Stata o un objeto spmat, y
puede seguir cualquier esquema de ponderación espacial, aunque es habitual normalizar las ponderaciones espaciales
por lo tanto, las sumas de las filas o las columnas son iguales a uno.7 xsmle no permite el uso
de matrices de peso variables en el tiempo. Esto significa que la matriz de pesos se ve obligada a ser
lo mismo para cada sección transversal, y xsmle lo replicará automáticamente para siempre
períodos. Esto podría ser una limitación, especialmente en paneles largos, por lo que una posible extensión a
xsmle puede proporcionar la opción de leer múltiples matrices de peso (que varían en el tiempo). Nota
que la dimensión máxima de una sola matriz de Stata depende del sabor de Stata: 40×40
(Pequeño), 800×800 (IC) y 11000×11000 (SE o MP). Para superar esta limitación, uno
debe especificar matrices más grandes como objetos spmat. Un segundo requisito para xsmle es que
los datos deben ser tsset o xtset por el panel y las variables de tiempo antes del comando
es ejecutado.8
La sintaxis básica de xsmle es la siguiente:
xsmle depvar indepvars Si en peso , opciones
El valor predeterminado es el modelo RE SAR . A continuación se proporciona una descripción de las principales
opciones de estimación y postestimación. Se proporciona una descripción completa de todas las opciones disponibles.
en el archivo de ayuda xsmle.
3.1 Opciones principales para xsmle
Opciones comunes a todos los modelos
model(name) especifica el modelo espacial que se va a ajustar. el nombre puede ser sar para el modelo SAR ,
sdm para el SDM, sac para el SAR con modelo de errores espacialmente autocorrelacionados, sem para
el SEM, o gspre para el modelo GSPRE . El valor predeterminado es modelo (sar).
7. No se supone que W sea simétrico, pero (IÿÿW) debe ser no singular. Esto implica condiciones
sobre los valores propios de W discutidos extensamente en la literatura (por ejemplo, ver LeSage y Pace
[2009, cap. 3]).
8. Esto evita la necesidad de agregar sintaxis para especificar las variables de panel y tiempo. Sin embargo, hay
es un corolario que conviene señalar. La forma natural de organizar datos de panel espacial para la estimación
propósitos es apilar cada unidad de panel para el período t = 1 seguido de unidades de panel para t = 2, y así sucesivamente.
Por lo tanto, xsmle clasifica internamente el conjunto de datos por tiempo y unidad de panel, pero restaura la clasificación original en
salida.
vce(vcetype) especifica cómo estimar la matriz VC correspondiente a las estimaciones de parámetros. Los errores
estándar informados en la tabla de resultados de la estimación son la raíz cuadrada de las varianzas
(elementos diagonales) del estimador VC . vcetype puede ser uno de los siguientes:
oim utiliza la matriz de información observada.
opg usa la suma del producto exterior de los gradientes.
robusto es el sinónimo de estimador sándwich agrupado, donde clustvar es el pan

elvar
cluster clustvar especifica el estimador sándwich agrupado.
dkraay # especifica el estimador robusto de Driscoll–Kraay. # es el retraso máximo utilizado en el cálculo.
robusto es el sinónimo de vce (cluster panelvar).
cluster(clustvar) es el sinónimo de vce(cluster clustvar).
restricciones(restricciones); ver [R] opciones de estimación.
level(#) establece el nivel de confianza para los intervalos de confianza; el valor predeterminado es el nivel (95).
postcore guarda puntajes de observación por observación en la lista de resultados de la estimación.
posthessian guarda el Hessian correspondiente al conjunto completo de coeficientes en la lista de resultados de

la estimación.
opciones de visualización: vsquish, niveles base, todos los niveles base; ver [R] opciones de estimación.
maximizar opciones: difícil, técnica (especificación de algoritmo), iterar (#), sin registro, desde (especificaciones
de inicio), tolerancia (#), intolerancia (#), intolerancia (#), no tolerancia; ver [R] maximizar. Estas opciones
rara vez se utilizan.
Opciones para el modelo SAR
wmatrix(name) especifica la matriz de peso para el término SAR . El nombre puede ser una matriz de Stata o un
objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
reutiliza el estimador de efectos aleatorios; re es el predeterminado.
fe utiliza el estimador de efectos fijos.
type(type option , leeyu ) especifica el tipo de efectos fijos. La opción de tipo se puede encontrar para efectos fijos
individuales, tiempo para efectos fijos temporales o ambos para efectos fijos individuales y temporales. La
subopción leeyu transforma los datos según Lee y Yu (2010).
dlag(dlag) define la estructura del modelo espaciotemporal. Cuando dlag es igual a 1, solo se incluye la variable
dependiente con retraso en el tiempo; cuando dlag es igual a 2, sólo
se incluye la variable dependiente retrasada en el espacio-tiempo; cuando dlag es igual a 3, se incluyen

tanto las variables dependientes retrasadas en el tiempo como en el espacio-tiempo.
noconstant suprime el término constante en el modelo. Se utiliza sólo para el re

estimador.
efectos calcula los efectos directos, indirectos y totales y los suma a e(b).
vceeffects(vcee type , nsim(#) ) establece cómo se calculan los errores estándar para los efectos directos,
indirectos y totales. El tipo de vcee puede ser dm para los errores estándar del método delta, sim[,
nsim(#)] para los errores estándar de Monte Carlo, donde nsim(#) establece el número de simulaciones
para el procedimiento de LeSage y Pace (2009) , o none para ningún estándar errores
hausman realiza la prueba robusta de Hausman, detectando automáticamente el estimador alternativo. La

prueba se calcula estimando la matriz VC de la diferencia entre los estimadores fe y re como en White
(1982). Solo está permitido para modelos estáticos.
Opciones para el modelo SDM
wmatrix(name) especifica la matriz de peso para el término SAR . El nombre puede ser una matriz de Stata
o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
dmatrix(name) especifica la matriz de peso para los regresores retrasados espacialmente; el defecto es
usar la matriz especificada en wmat(nombre). El nombre puede ser una matriz de Stata o un objeto
spmat. Esta matriz puede estar estandarizada o no.
durbin(varlist) especifica los regresores que deben retrasarse espacialmente; el valor predeterminado es
para retrasar todas las variables independientes en varlist.
type(type option , leeyu ) especifica el tipo de efectos fijos. La opción de tipo se puede encontrar para
efectos fijos individuales, tiempo para efectos fijos temporales o ambos para efectos fijos individuales
y temporales. La subopción leeyu transforma los datos según Lee y Yu (2010).
dlag(dlag) define la estructura del modelo espaciotemporal. Cuando dlag es igual a 1, solo se incluye la
variable dependiente con retraso en el tiempo; cuando dlag es igual a 2, solo se incluye la variable
dependiente retrasada en el espacio-tiempo; cuando dlag es igual a 3, se incluyen tanto las variables
dependientes con retraso en el tiempo como en el espacio-tiempo.

estimador.

Opciones para el modelo SAC
wmatrix(name) especifica la matriz de peso para el término SAR . El nombre puede ser una matriz de Stata
o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
ematrix(name) especifica la matriz de peso para el término de error SAC . El nombre puede ser una matriz
de Stata o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere ematrix().
Opciones para el modelo SEM
de Stata o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere ematrix().

estimador.

Opciones para el modelo GSPRE
wmatrix(nombre) especifica la matriz de peso para el SAC RE. El nombre puede ser una matriz de Stata o
un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
de Stata o un objeto spmat. Esta matriz puede estar estandarizada o no.
re utiliza el estimador de efectos aleatorios.
error(opciones de error) define la estructura de error de efecto aleatorio con opciones de error = 1,..., 4.
En particular, error(1) (predeterminado) para ÿ = ÿ = 0, error(2) para ÿ = 0 y ÿ = 0, error(3) para ÿ = 0
y ÿ =0 (modelo SEM ), y error(4) para ÿ = ÿ.

estimador.
3.2 Comando de postestimación después de xsmle
Después de una estimación xsmle, el comando predict se puede usar para calcular los valores predichos.
Además, predict permite la postestimación de FE o RE. Los métodos implementados en este comando
son la extensión de datos de panel de los disponibles en Kelejian y Prucha (2007) y Drukker, Prucha y
Raciborski (2013b). Consulte la sección 4.1 para obtener más detalles.
Sintaxis para predecir
La sintaxis del comando es la siguiente:
predecir tipo newvar si en , rform completo limitado ingenuo xb a noie
Opciones para predecir
rform, el valor predeterminado, calcula los valores pronosticados a partir de la ecuación de forma reducida,
yit = (In ÿ ÿW)ÿ1(xitÿ + ÿi).
full calcula los valores pronosticados basándose en el conjunto de información completo. Esta opción está disponible
capaz solo con modelo(sac).
limited calcula los valores predichos en función del conjunto de información limitada. Esta opción está
disponible solo con modelo(sac).
ingenuo calcula los valores predichos en función de los valores observados de yit = ÿWyit+xitÿ+ÿi.
xb calcula la predicción lineal incluyendo FE o RE xitÿ + ÿi.
a estima ÿi, la FE o la RE. Con los modelos FE , esta estadística solo se permite con
tipo (ind).
noie excluye el ÿi estimado, la FE o RE de la predicción.
4 ejemplos
4.1 Datos simulados
En esta sección, usamos datos simulados para ilustrar las capacidades de estimación del comando xsmle,
centrándonos en la selección, predicción y estimación del modelo en presencia de datos faltantes.9 En
particular, consideramos el siguiente modelo FE SDM ,
norte norte
yt = 0.3 wijyjt + 0.5x1it ÿ 0.3x2it ÿ 0.2x3it + 0.3 wijx1it

j=1 j=1
norte norte
+ 0,6 wijx2it + 0.9 wijx3it + ÿi + eso (2)

j=1 j=1
donde los parámetros molestos (ÿi) se extraen de una variable aleatoria gaussiana estándar independiente
e idénticamente distribuida (iid). Para permitir la dependencia entre los efectos específicos de la unidad y
los regresores, generamos estos últimos de la siguiente manera,
xkit = 0.4ÿi + (1 ÿ 0.42) 1/2 zkit (3)
donde zkit es gaussiana estándar con k = 1, 2, 3. El tamaño de la muestra se establece en 940 (n = 188 y
T = 5) observaciones.10
Comencemos importando una matriz de contigüidad espacial de primer orden de las autoridades
sanitarias locales italianas utilizando el comando spmat:
. utilice ASL_contiguity_mat_ns.dta
. spmat dta WW*, reemplazar
El comando spmat dta permite a los usuarios almacenar un objeto spmat llamado W en la memoria de
Stata. Tenga en cuenta que, para ajustar un modelo usando xsmle, se debe usar la matriz de ponderación
espacial como una matriz de Stata o un objeto spmat. La siguiente entrada spmat permite a los usuarios
resumir fácilmente el objeto W:
9. Informamos el código utilizado para cada ejemplo en el archivo adjunto sj Examples simdata.do.
10. La dimensión de la sección transversal elegida (n = 188) depende de la dimensión del peso utilizado
matriz, una matriz de contigüidad de las autoridades sanitarias locales italianas.
. spmat resumen W, enlaces
Resumen del objeto de ponderación espacial W
Matriz Descripción
Dimensiones 188x188
Almacenado como 188x188
Enlaces
total 906
min 1
significar 4.819149
máximo 13
Como se puede observar, la matriz espacial importada consta de 188 unidades transversales con
al menos 1 vecino, con unas 4,8 unidades contiguas en promedio. Porque xsmle no
hacer esta transformación automáticamente, el siguiente paso consiste en la normalización de filas
del objeto W. Esto se puede realizar fácilmente usando lo siguiente:
. spmat dta WW*, reemplazar normalizar (fila)
En particular, la sintaxis para ajustar un FE SDM es
. xtset id t
variable del panel: id (fuertemente balanceada)
tiempo variable: t, 1 a 5
delta: 1 unidad
. xsmle y x1 x2 x3, wmat(W) modelo(sdm) fe tipo(ind) nolog

Advertencia: todos los regresores estarán rezagados espacialmente
SDM con efectos fijos espaciales Número de observaciones = 940
Variable de grupo: id Número de grupos = 188

Variable de tiempo: t Longitud del panel = 5
R-cuadrado: dentro = 0.3852

entre = 0.3705
total = 0.3635
Media de efectos fijos = 0,0314
Log-verosimilitud = -1204.1194
y coef. estándar Errar. z P>|z| [95% de conf. Intervalo]
Principal
x1 .5456416 .034473 15,83 0,000 -7,86 .4780758 .6132075
x2 -.2798453 .0356246 -.1896873 0,000 -5,32 0,000 -.3496683 -.2100224
x3 .0356751 -.2596093 -.1197654
Ancho x
x1 .3093954 .0716979 .5063665 4,32 0,000 6,67 .16887 .4499207

x2 .0759508 .9072591 .0748364 0,000 12,12 0,000 .3575057 .6552273
x3 .7605825 1.053936
Espacial
ro .2274947 .0425135 5.35 0.000 .1441699 .3108196
Diferencia
sigma2_e .7500305 .0347637 21.58 0.000 .6818948 .8181661
. estima tienda sdm_fe
Cuando se especifica la opción fe, xsmle ajusta un modelo con una FE específica de la unidad. Esto
significa que, en el ejemplo anterior, podríamos omitir la opción type(ind).11 Esta última permite a los
usuarios especificar formas alternativas para FE: type(time) permite FE de tiempo, mientras que
type(both) especifica tanto tiempo como tiempo. unidad FE. En el caso de SDM, xsmle también permite
a los usuarios especificar un conjunto diferente de variables explicativas retrasadas espacialmente a
través de la opción durbin(varlist). Como informa el mensaje de advertencia, el valor predeterminado es
retrasar todas las variables independientes en varlist.
Para simplificar la tarea de producir tablas con calidad de publicación, los informes xsmle etiquetan
los resultados de la estimación. La ecuación principal contiene el vector ÿ, la ecuación Wx informa (solo
para SDM) el vector ÿ, la ecuación espacial informa los coeficientes espaciales (en este caso, ÿ) y la
ecuación de varianza informa los parámetros auxiliares como la varianza del error (ÿ2 en este caso).12
Incluso si ya sabemos que FE SDM se especifica correctamente en este ejemplo, podríamos estar
interesados en probar la idoneidad de una variante RE utilizando el comando oficial Stata hausman:
11. La opción nolog rara vez se usa y permite a los usuarios omitir la visualización del registro de iteración de la función de
probabilidad de registro. xsmle permite a los usuarios utilizar todas las opciones de maximización disponibles para los comandos
de estimación de ml (consulte la ayuda para maximizar), además de las opciones adicionales de postpuntuación y posthessian,
que informan la puntuación y la hessian como una matriz e(). Tenga en cuenta que el límite habitual para la dimensión de la
matriz se aplica en este caso.
12. Tenga en cuenta que para modelos que no sean SDM, las ecuaciones auxiliares serán diferentes según la parametrización
específica utilizada.
. xsmle y x1 x2 x3, wmat(W) modelo(sdm) re tipo(ind) nolog

Advertencia: se ignorará el tipo de opción (ind)
SDM con efectos aleatorios Número de observaciones = 940


entre = 0.5567
total = 0.4429
Principal
x1 .6278704 .0383441 -.1595226 16,37 0,000 -3,96 .5527173 .7030236
x2 .0402597 -.0807422 .0400913 0,000 -2,01 0,044 -.2384301 -.0806151
x3 .0214849 .0669073 0,32 0,748 -.1593197 -.0021648
_contras -.109651 .1526208
Ancho x
x1 .3042129 .0784076 .5215032 3,88 0,000 6,47 .1505368 .4578889

x2 .0805461 .9631849 .0813256 0,000 11,84 0,000 .3636356 .6793707
x3 .8037896 1.12258
Espacial
ro .2558274 .040904 6.25 0.000 .175657 .3359977
Diferencia
lgt_theta -.0751917 .1284863 .9648846 -0,59 0,558 18,73 -.3270202 .1766369
sigma2_e .0515123 0,000 .8639224 1.065847
. tienda de estimaciones sdm_re
. hausman sdm_fe sdm_re, eq(1:1 2:2 3:3)

Coeficientes
(b) (B) (cama y desayuno)
sqrt(diag(V_b-V_B))
sdm_fe sdm_re Diferencia SE
comp1
x1 .5456416 .6278704 -.0822288 .
x2 -.2798453 -.1595226 -.1203227 .
x3 -.1896873 -.0807422 -.1089451 .
comp2
x1 .3093954 .3042129 .0051825 .
x2 .5063665 .5215032 -.0151366 .
x3 .9072591 .9631849 -.0559257 .
comp3
ro .2274947 .2558274 -.0283326 .011587
b = consistente bajo Ho y Ha; obtenido de xsmle

B = inconsistente bajo Ha, eficiente bajo Ho; obtenido de xsmle
Prueba: Ho: diferencia de coeficientes no sistemática

chi2(7) = (bB)´[(V_b-V_B)^(-1)](bB)
= -75,83 chi2<0 ==> modelo instalado en estos
los datos no cumplen con la asintótica
supuestos de la prueba de Hausman;
ver suest para una prueba generalizada
En este ejemplo, la estadística de Hausman no cumple con sus supuestos asintóticos. Este
El problema se puede solucionar agregando la opción hausman al comando de estimación:
. xsmle y x1 x2 x3, wmat(W) modelo(sdm) fe tipo(ind) hausman nolog

... estimación del modelo de efectos aleatorios para realizar la prueba de Hausman
SDM con efectos fijos espaciales Variable de Número de observaciones = 940
grupo: id Variable de tiempo: t Número de grupos = 188

Longitud del panel = 5

entre = 0.3705
total = 0.3635
Principal
x1 .5456416 .034473 -.2798453 15,83 0,000 -7,86 .4780758 .6132075
.0356246 -.1896873 .0356751 0,000 -5,32 0,000 -.3496683 -.2100224
x2x3 -.2596093 -.1197654
Ancho x
x1 .3093954 .0716979 .5063665 4,32 0,000 6,67 .16887 .4499207

x2 .0759508 .9072591 .0748364 0,000 12,12 0,000 .3575057 .6552273
x3 .7605825 1.053936
Espacial
ro .2274947 .0425135 5.35 0.000 .1441699 .3108196
Diferencia
sigma2_e .7500305 .0347637 21.58 0.000 .6818948 .8181661
Ho: diferencia de coeficientes no sistemática chi2(7) = 91,10 Prob>=chi2 = 0.0000
Como era de esperar, en este caso, rechazamos fuertemente la hipótesis nula, con una prueba de ÿ2
estadístico igual a 91,10 y un valor de p inferior al 1%. Tenga en cuenta que, si se especifica, el hausman
La opción detecta automáticamente el modelo alternativo, que en nuestro ejemplo es el RE.
Otra tarea común que realizan rutinariamente los profesionales espaciales es la selección de
modelos. Siguiendo la estrategia descrita en LeSage y Pace (2009) y Elhorst (2010b),
los investigadores deben comenzar con el SDM como una especificación general y probar las alternativas.
Es decir, ajustamos un SDM pero nos gustaría saber si es el mejor modelo para
los datos a la mano. Este tipo de procedimiento se puede implementar fácilmente usando xsmle. Para
Por ejemplo, uno puede estar interesado en probar las especificaciones SAR o SEM . Porque el
SDM se puede derivar fácilmente a partir de un SEM, uno puede mostrar fácilmente que si ÿ = 0 y
ÿ = 0, el modelo es un SAR, mientras que si ÿ = ÿÿÿ, el modelo es un SEM. Después de la estimación
del SDM, estas pruebas se pueden realizar explotando el xsmle "etiquetado con ecuaciones"
vector de coeficientes estimados y utilizando los comandos oficiales test y testnl de Stata
como sigue:
. prueba [Wx]x1 = [Wx]x2 = [Wx]x3 = 0

( 1) [Anchox]x1 - [Anchox]x2 = 0
(2) [Anx]x1 - [Anx]x3 = 0
(3) [Anx]x1 = 0
chi2( 3) = 203.77
Prob > chi2 = 0.0000
. testnl ([Wx]x1 = -[Espacial]rho*[Principal]x1) ([Wx]x2 = -[Espacial]rho*[Principal]x2)

> ([Wx]x3 = -[Espacial]rho*[Principal]x3)
(1) [Wx]x1 = -[Espacial]rho*[Principal]x1
chi2(3) = 193.70
Prob > chi2 = 0.0000
Finalmente, debido a que SAC y SDM no están anidados, se pueden usar criterios de información
para probar si el modelo más adecuado es el SAC utilizando lo siguiente:
. estimaciones restaurar sdm_fe

(los resultados sdm_fe están activos ahora)
. estado ic
Criterio de información de Akaike y criterio de información bayesiano
Modelo Obs ll(nulo) ll(modelo) d.f. AIC BIC
sdm_fe 940 . -1204.119 8 2424.239 2463.006
Nota: N=Obs utilizados en el cálculo de BIC; ver [R] nota BIC.

. xsmle y x1 x2 x3, wmat(W) emat(W) modelo(sac) fe tipo(ind) nolog
SAC con efectos fijos espaciales Variable de Número de observaciones = 940


entre = 0.0007
total = 0.0667
Principal
x1 .4860935 .0415495 -.3332588 11,70 0,000 -9,00 .4046579 .5675291
x2 .0370124 -.3039008 .0371472 0,000 -8,18 0,000 -.4058019 -.2607158
x3 -.3767081 -.2310936
Espacial
rho -.134535 .1106866 .4760945 -1,22 0,224 5,42 -.3514768 .0824067
lambda .0877639 0,000 .3040804 .6481085
Diferencia
sigma2_e 1.073918 .0469018 22,90 0,000 .9819918 1.165844
. estado ic
Criterio de información de Akaike y criterio de información bayesiano
Modelo Obs ll(nulo) ll(modelo) d.f. AIC BIC
. 940 . -1290.957 6 2593.915 2622.99
Nota: N=Obs utilizados en el cálculo de BIC; ver [R] nota BIC.
En este caso, todas las pruebas apuntan hacia un FE SDM. Finalmente, uno puede estar interesado en el
postestimación de la FE o valores predichos de la variable de resultado. En la sección 4.1,
resumimos los predictores espaciales implementados en xsmle. Son los datos del panel
extensión de los predictores discutidos en Kelejian y Prucha (2007), que van desde
el predictor ingenuo subóptimo al predictor de información completa del error cuadrático medio
mínimo (MSE) eficiente . Aquí damos algunos ejemplos de la sintaxis de postestimación xsmle.
Por ejemplo, para posestimar la FE una vez que se ha ajustado un modelo espacial de FE , escribimos
. estimaciones restaurar sdm_fe

(los resultados sdm_fe están activos ahora)
. predecir alphahat, un
Ahora, para visualizar inmediatamente la desviación entre lo verdadero (simulado) y lo estimado

valores acoplados de ÿi , podemos graficarlos usando
. bidireccional (kdensidad alfa, lpattern(punto) lwidth(*2))

> (kdensidad alphahat, lpattern(guión)),
> leyenda (fila (1) etiqueta (1 "Verdadero") etiqueta (2 "Estimado"))
.4
.3
.2
.1
0
ÿ4 ÿ2 2 4
0x
Verdadero Estimado
Figura 1. Posestimación de xsmle: FE predicha
El gráfico resultante se muestra en la figura 1. De manera similar, podemos obtener una forma reducida y
predicción ingenua de la variable de resultado utilizando (la gráfica resultante se muestra en la figura 2)
. predecir yhat_rform
(forma de opción asumida)
. predecir yhat_naive, ingenuo
. bidireccional (kdensidad y, lpatrón(punto) lancho(*2))
> (kdensidad yhat_rform, lpattern(guión))
> (kdensity yhat_naive), leyenda (fila (1) etiqueta (1 "Verdadero")
> label(2 "Forma reducida") label(3 "Ingenuo"))
ÿ5 0 5
X
Verdadero Forma reducida Ingenuo
Figura 2. Posestimación de xsmle: forma reducida y predictores ingenuos
Posestimación
En esta sección, analizamos brevemente los predictores disponibles en xsmle y replicamos el

Kelejian y Prucha (2007) Estudio Monte Carlo, ampliándolo al caso de datos de panel.
Consideremos el siguiente SAR con un modelo de errores SAC ,
yt = ÿWyt + Xtÿ + ÿ + ÿt ÿt = ÿMÿt (4)

+t (5)
para lo cual usamos la misma notación discutida en la sección 2. En este modelo, yit se
determina como
yit = ÿwi.yt + xitÿ + ÿi + ÿit

ÿit = ÿmi.ÿt + it
donde, para t = 1,...,T, wi. y mi. son las i-ésimas filas de W y M, xit es la i-ésima fila de
Xt, ÿit e it son los i-ésimos elementos de ÿt y t, ÿi es el i-ésimo elemento de ÿ, y wi.yt
y mi.ÿt denotan los i-ésimos elementos de los rezagos espaciales Wyt y Mÿt con wi.yt que
no incluye yit. Haciendo las mismas suposiciones de Kelejian y Prucha (2007),
tenemos (ver Kelejian y Prucha [2007] para más detalles sobre los supuestos del modelo)
ÿt ÿ N (0, ÿ2 ÿÿt )
yt ÿ N (ÿt, ÿ2 ÿyt )
con
ÿt = (yo ÿ ÿW) ÿ1(Xtÿ + ÿ)

ÿ1
ÿÿt = (yo ÿ ÿM) ÿ1(yo ÿ ÿM ) ÿyt =
ÿ1
(yo ÿ ÿW) ÿ1ÿÿt (yo ÿ ÿW )
Consideramos tres conjuntos de información,
ÿ1 = {Xt,W} ÿ2 =
{Xt,W, wi.yt} ÿ3 = {Xt,W,
yt,ÿ1}, t = 1,...,T
donde ÿ3 es el conjunto de información completa que contiene todas las n ÿ 1 observaciones sobre yt y
ÿ1 y ÿ2 son ambos subconjuntos de ÿ3. Consideramos los siguientes cuatro predictores de yit (denotados
como
eso
y(p) ..., 4),13 con p = 1
y(1)
eso = E(yit|ÿ1)
ÿ1
= (yo ÿ ÿW) i. (Xtÿ + ÿ)
y(2)
eso
= E(yit|ÿ2)
cov(ÿit, wi.yt)
ÿwi.yt + xitÿ + ÿi + var(wi.yt) {wi.yt ÿ E(wi.yt)} =
y(3)
eso = E(yit|ÿ3) =
ÿ1
ÿwi.yt + xitÿ + ÿi + cov(ÿit, yt,ÿi) {VC(yt,ÿi)} = ÿwi.yt + xitÿ {yt,ÿi ÿ E(yt,ÿi)}
y(4)
eso + ÿi
donde
E(wi.yt) = wi.(I ÿ ÿW) ÿ1(Xtÿ + ÿ) var(wi.yt) =

ÿ2 wi.ÿytw cov(ÿi, wi.yt) = ÿ2 ÿÿt
i. (I ÿ ÿW ) ÿ1w
E(yt,ÿi) = St,ÿi(I ÿ ÿW) ÿ1(Xtÿ

i. + ÿ) i.
VC(yt,ÿi) = ÿ2 St,ÿiÿytS t,ÿi
cov(ÿit, yt,ÿi) = ÿ2 ÿÿt i. (I ÿ ÿW ) ÿ1S t,ÿi
ÿ1
En las expresiones anteriores, (I ÿ ÿW)i.y ÿÿt y ÿÿt
, respectivamente,
i. denote las i-ésimas
mientrasfilas
que de
St,ÿi
(I ÿesÿW)ÿ1
la
matriz selectora n ÿ 1 ×
ésima fila de I. n idéntica a la matriz identidad n × n I , excepto que se elimina la i-
13. p = 1 indica el predictor de forma reducida, p = 2 indica el predictor de información limitada, p = 3

indica el predictor de información completa, y p = 4 indica el predictor ingenuo.
Ahora comparamos los predictores anteriores en términos de eficiencia predictiva, extendiendo el

diseño Monte Carlo de Kelejian y Prucha (2007) a modelos FE como el informado en (4)–(5). En
particular, consideramos el siguiente modelo FE SAC ,
norte
yit = ÿ wijyjt + 0.5x1it + ÿi + ÿit

j=1
norte
ÿit = ÿ wijÿjt + eso

j=1
donde los parámetros molestos, ÿi, se extraen de una variable aleatoria gaussiana estándar iid,
mientras que el regresor x1it se genera de acuerdo con (3). La simulación se basa en lo que Kelejian
y Prucha (2007) describen como la matriz de peso “dos adelante y dos atrás”, en la que cada unidad
está directamente relacionada con las dos unidades inmediatamente posteriores e inmediatamente
anteriores en el ordenamiento. La matriz está normalizada por filas y todos sus elementos distintos de
cero son iguales a 1/4.14 Como en Kelejian y Prucha (2007), reportamos resultados para 25
combinaciones de ÿ, ÿ = ÿ0.9, ÿ0.4, 0, 0.4, 0.9 y establezca ÿ2 = 1. El tamaño de la muestra se
establece en 500 (n = 100 y T = 5) observaciones. Tenga en cuenta que cuando ÿ = 0, los resultados
se refieren al SEM.
Resultados de la simulación en términos de promedios de muestra sobre i = 1,..., 100 y t = 1,..., 5

para MSE(y(p)
eso
15 Como
panel ) para p = 2,..., 4 se dan en la tabla 3. caso era de
de datos, los esperar, incluso
resultados en el
numéricos
son totalmente consistentes con las nociones teóricas reportadas en Kelejian y Prucha (2007): el
predictor ingenuo sesgado es el peor, especialmente cuando ÿ = ÿ = 0,9, mientras que el predictor de
información completa es siempre el mejor.
14. Ver Kelejian y Prucha (2007) para más detalles sobre la estructura de esta matriz de ponderación. Claramente,
los resultados reportados aquí dependen de la estructura de esta matriz.
15. Debido a que el predictor de forma reducida tiene, por mucho, el peor desempeño, no informamos sus resultados.
Tabla 3. Resultados de la simulación (MSEs)
ÿ ÿ ingenuo limitado completo ÿ
ÿ0,9 ÿ0,9 1,441 0.488 0.308 0.398

ÿ0,9 ÿ0,4 0,931 0,547 0,464 0,263
ÿ0,9 0 0.811 0,678 0,659 0,221
ÿ0,9 0.4 0.940 ÿ0.9 0.932 0,913 0,244
0.9 6.384 ÿ0.4
ÿ0.4
ÿ0.9
ÿ0.4
1.348 1,331 1.155 1.594
0.902 ÿ0.4 0 0.809 ÿ0.4 0,547 0,465 0,359
0.4 0.937 ÿ0.4 0.9 6.362 0 0,649 0,625 0,246
ÿ0.9 1.340 0 ÿ0.4 0.887
0 0 0,764 0,761 0,224
0.803 0 0.4 0.4 0.9. ÿ0,4 0,863 0,857 0,252
0,885 0,4 0 0,811 0,4 0,4 0,856 0,849 1,586
0,966 0,4
ÿ0,9
0,91,340
5,5410,9
0,9 0,678 0,659 0,346
ÿ0,4 0,887
0,9 0,9
0,4 01,445
0,805 0,764 0,761 0,240
0,793 0.792 0.220
0,765 0,762 0,257
0,702 0,660 1,548
0,931 0,913 0,341
0,863 0,857 0,233
0,765 0,762 0,229
0,673 0,651 0,274
0,659 0.518 1.445
1,334 1.156 0.339
0,857 0,849 0,230
0,702 0,660 0,215
0,659 0.518 0.758
0.9 0.9 8.150 1.127 0.391 2.250
Sobre los efectos marginales
Como ya se mencionó en la sección 2.1, una característica peculiar de los modelos de regresión espacial es la
proceso de retroalimentación entre unidades correlacionadas espacialmente, lo que conduce a la distinción entre
efectos marginales directos, indirectos y totales. Para mostrar cómo calcular estos efectos usando
xsmle, consideremos el proceso de generación de datos del siguiente FE SDM dinámico
modelo,
norte norte
yit = ÿyitÿ1 + ÿ wijyjtÿ1 + 0.2 wijyjt + 0.5x1it ÿ 0.3x2it ÿ 0.2x3it

j=1 j=1
norte norte norte
+ 0.3 wijx1it + 0.6 wijx2it + 0.9 wijx3it + ÿi + eso (6)

j=1 j=1 j=1
donde, en cuanto al proceso de generación de datos informado en (2), los parámetros molestos son
extraída de una variable aleatoria gaussiana estándar iid y la correlación entre
Los efectos y regresores específicos de la unidad se obtienen de acuerdo con (3). El tamaño de la muestra se establece
a 1.960 observaciones (n = 196 y T = 10) y ÿ = ÿ = 0,3.16
Como se documenta en la sección 3.1, xsmle permite la estimación de (6) especificando el

opción dlag(3).17 Al agregar la opción de efectos, se puede usar xsmle para calcular
Efectos indirectos y totales:
. xsmle y x1 x2 x3, wmat(Wspmat) modelo(sdm) fe dlag(3) nolog de efectos

Cálculo de errores estándar de efectos marginales usando simulación MC...
SDM dinámico con efectos fijos espaciales Variable de Número de observaciones = 1764


entre = 0.9108
total = 0.8354
Principal
y
L1. .278483 .0187886 14.82 0.000 .2416579 .315308
Wy
L1. .3371464 .0312009 10.81 0.000 .2759938 .3982989
x1 .471855 .0261821 18,02 0,000 .420539 .523171

x2 -,2774485 ,0263341 -10,54 0,000 -,1814445 ,0268751 -.3290623 -.2258347
x3 -6,75 0,000 -.2341187 -.1287704
Ancho x
x1 .3501276 .0516946 .5557425 6,77 0,000 11,15 .2488081 .4514471

x2 .0498404 .9499813 .0503458 0,000 18,87 0,000 .4580572 .6534278
x3 .8513054 1.048657
Espacial
ro .152554 .0287441 5.31 0.000 .0962165 .2088915
Diferencia
sigma2_e .9612217 .0291937 32.93 0.000 .9040031 1.01844
SR_directo
x1 .4920234 .0251053 19,60 0,000 .4428179 .541229
x2 -,2567458 ,0253696 -10,12 0,000 -,1435512 ,0251039 -.3064693 -.2070222
x3 -5,72 0,000 -.1927539 -.0943484
16. Agradecemos a Jihai Yu por compartir su código MATLAB para crear la matriz de ponderaciones espaciales de la torre.
utilizado en este ejemplo. El código original ha sido traducido a Mata para nuestros propósitos (ver el
adjunto sj ejemplos simdata.do archivo para más detalles).
17. dlag(1) permite la estimación de (6), en la que ÿ = 0, mientras que dlag(2) es el caso en el que ÿ = 0.
SR_Indirecto
x1 .4867733 .0582277 .5859261 8,36 0,000 9,69 .372649 .6008975
x2 .0604524 0,000 17,06 0,000 .4674416 .7044107
x3 1.052221 .0616699 .9313501 1.173092
SR_Total
x1 .9787967 .0683064 .3291804 14,33 0,000 4,83 .8449185 1.112675
x2 .0681426 .9086697 .0672656 0,000 13,51 0,000 .1956234 .4627374
x3 .7768315 1.040508
LR_directo
x1 .8954026 .0504489 -.2565021 17,75 0,000 -5,77 .7965245 .9942807
x2 .0444616 .0384557 .0470276 0,000 -.3436452 -.1693589
x3 0,82 0,414 -.0537168 .1306282
LR_Indirecto
x1 2.750811 .4462418 1.485876 6,16 0,000 5,41 1.876193 3.625428
x2 .2744933 3.352583 .4749726 0,000 7,06 0,000 .9478791 2.023873
x3 2.421653 4.283512
LR_Total
x1 3.646213 .4830534 1.229374 7,55 0,000 4,06 2.699446 4.59298
x2 .3028385 3.391038 .5056929 0,000 6,71 0,000 .6358214 1.822927
x3 2.399898 4.382178
Cuando se especifica la opción de efectos, los efectos marginales se mostrarán

y se suma al vector estimado e(b). Dada su naturaleza dinámica, (6) implica tanto
efectos a corto y largo plazo (ver tabla 2). En estos casos, los efectos a corto plazo se informan
bajo las tres ecuaciones denominadas SR Directo, SR Indirecto y SR Total, mientras que los efectos a
largo plazo se reportan bajo LR Directo, LR Indirecto y LR Total. 18 Equivalentemente,
Los efectos totales a corto plazo se pueden obtener a través de márgenes usando la siguiente sintaxis:
. márgenes, dydx(*) predecir(rform noie)

Número de obs. = 1,764
Efectos marginales medios Modelo
VCE : OIM
Expresión: predicción de forma reducida, predecir (rform noie)

dy/dx valor : x1 x2 x3
método delta
dy/dx Est. Errar. z P>|z| [95% de conf. Intervalo]
x1 .9699528 .0681065 .3283914 14,24 0,000 4,91 .8364665 1.103439

x2 .0669413 .9068859 .0712236 0,000 12,73 0,000 .1971888 .459594
x3 .7672903 1.046481
18. Los nombres de las ecuaciones siguen la terminología de Elhorst (2014) sobre los efectos marginales a corto y largo plazo.
Para garantizar que los márgenes funcionen, agregamos la opción de postestimación xsmle de noie a través de
la opción predict() de los márgenes. Como puede verse, los dos procedimientos producen ligeras
resultados diferentes. Esto se debe a que xsmle, por defecto, usa el procedimiento de Monte Carlo
descrito en LeSage y Pace (2009). Por lo tanto, las estimaciones puntuales (errores estándar) son
promedios (desviaciones estándar) sobre las (predeterminadas) 500 réplicas de Monte Carlo. Él
Se pueden obtener las mismas estimaciones puntuales usando xsmle con la opción vceeffects(none).19
. tranquilamente xsmle y x1 x2 x3, wmat(Wspmat) model(sdm) fe dlag(3) efectos

> vceeffects(ninguno)
. tienda de estimaciones dsdm_fe
. esto fuera dsdm_fe, mantener (SR_Total:) c (b)
dsdm_fe
b
SR_Total
x1 .9699528
x2 .3283914
x3 .9068859
Debido a que las fórmulas analíticas para los efectos directos, indirectos y totales informados en
la tabla 2 implica una especificación lineal (en variables), xsmle suprime el cálculo de
estos efectos cuando se especifican variables de factor, como se muestra en el siguiente ejemplo:
. xsmle y c.x1##c.x1 c.x1#c.x2 c.x2 c.x3, wmat(Wspmat) modelo(sdm) fe dlag(3)

> nolog de efectos
Advertencia: los efectos directos e indirectos no se pueden calcular si las variables factoriales
se especifica la opción -efectos- ignorados. Observe que los efectos totales
se puede obtener usando -margins
SDM dinámico con efectos fijos espaciales Número de observaciones = 1764


entre = 0.9122
total = 0,8378
19. La opción vceeffects(none) suprime el cálculo de errores estándar.

Principal
y
L1. .282856 .0187596 15.08 0.000 .2460878 .3196242
Wy
L1. .3418741 .0311604 10.97 0.000 .2808008 .4029474
x1 .4766421 .0261214 18.25 0.000 .4254451 .5278391
c.x1#c.x1 .0446299 .017106 2,61 0,009 .0111027 .0781571
c.x1#c.x2 -.0847021 .0243227 -3,48 0,000 -.1323737 -.0370306
-.2720875 .0263194 -10.34 0.000 -.1824236 .0267751 -.3236725 -.2205025

x2x3 -6.81 0.000 -.2349018 -.1299453
Ancho x
x1 .3633111 .0517657 7.02 0.000 .2618521 .4647701
c.x1#c.x1 .0073658 .0327561 0,22 0,822 -.056835 .0715667
c.x1#c.x2 -.0608174 .0472681 -1,29 0,198 -.1534612 .0318264
.5585988 .0496918 .9484272 11,24 0,000 18,91 .4612047 .6559929

x2x3 .0501452 0,000 .8501445 1.04671
Espacial
ro .1509144 .0287019 5.26 0.000 .0946597 .2071691
Diferencia
sigma2_e .9534039 .0289549 32.93 0.000 .8966533 1.010154
No obstante, cuando la especificación incluye variables factoriales, xsmle permite la

uso de márgenes para calcular los efectos marginales totales:
. márgenes, dydx(x1 x2 x3) predecir(rform noie)

Advertencia: no se puede realizar la comprobación de funciones estimables.
Número de obs. = 1,764
Efectos marginales medios Modelo
VCE : OIM
Expresión: predicción de forma reducida, predecir (rform noie)

dy/dx valor : x1 x2 x3
método delta
dy/dx Est. Errar. z P>|z| [95% de conf. Intervalo]
x1 .9952611 .0683488 .3278821 14,56 0,000 4,93 .8613 1.129222

x2 .0665554 .9021512 .0707735 0,000 12,75 0,000 .1974359 .4583284
x3 .7634377 1.040865
xsmle también ofrece la oportunidad de calcular errores estándar usando el método Delta
a través de la opción vceeffetcs(dm).20
. xsmle y x1 x2 x3, wmat(Wspmat) modelo(sdm) fe dlag(3) efectos vceeffects(dm)

> nolog
Cálculo de errores estándar de efectos marginales usando el método delta...
SDM dinámico con efectos fijos espaciales Variable de Número de observaciones = 1764


entre = 0.9108
total = 0.8354
Principal
y
L1. .278483 .0187886 14.82 0.000 .2416579 .315308
Wy
L1. .3371464 .0312009 10.81 0.000 .2759938 .3982989
x1 .471855 .0261821 18,02 0,000 .420539 .523171

x2 -,2774485 ,0263341 -10,54 0,000 -,1814445 ,0268751 -.3290623 -.2258347
x3 -6,75 0,000 -.2341187 -.1287704
Ancho x
x1 .3501276 .0516946 .5557425 6,77 0,000 11,15 .2488081 .4514471

x2 .0498404 .9499813 .0503458 0,000 18,87 0,000 .4580572 .6534278
x3 .8513054 1.048657
Espacial
ro .152554 .0287441 5.31 0.000 .0962165 .2088915
Diferencia
sigma2_e .9612217 .0291937 32.93 0.000 .9040031 1.01844
SR_directo
x1 .4889378 .0262506 -.2566706 18,63 0,000 -9,79 .4374875 .5403881
x2 .0262086 -.144119 .02613 0,000 -5,52 0,000 -.3080385 -.2053026
x3 -.1953328 -.0929052
SR_Indirecto
x1 .481015 .058585 8,21 0,000 10,08 .3661905 .5958395
x2 .585062 .0580324 0,000 16,67 0,000 .4713206 .6988034
x3 1.051005 .0630431 .9274428 1.174567
20. Si bien el uso del método Delta garantiza que los resultados no dependan de la variabilidad estocástica, es una
procedimiento más intensivo computacionalmente.
SR_Total
x1 .9699528 .0681065 .3283914 14,24 0,000 4,91 .8364665 1.103439
x2 .0669413 .9068859 .0712236 0,000 12,73 0,000 .1971888 .459594
x3 .7672903 1.046481
LR_directo
x1 .8860048 .0680006 -.25736 13,03 0,000 -5,45 .7527261 1.019283
x2 .0472579 .0347029 .0566012 0,000 0,61 0,540 -.3499839 -.1647362
x3 -.0762334 .1456392
LR_Indirecto
x1 2.659826 .5536009 1.457852 4,80 0,000 5,12 1.574789 3.744864
x2 .2844823 3.280576 .5347181 0,000 6,14 0,000 .9002767 2.015427
x3 2.232548 4.328604
LR_Total
x1 3.545831 .6090295 1.200492 5,82 0,000 3,81 2.352155 4.739507
x2 .3154343 3.315279 .5776118 0,000 5,74 0,000 .582252 1.818732
x3 2.183181 4.447377
Paneles desequilibrados
Los datos faltantes pueden plantear problemas importantes al ajustar modelos econométricos porque es
es poco probable que los valores perdidos falten completamente al azar. Lo más importante aquí es
que xsmle generalmente no puede manejar paneles desequilibrados. Una estrategia para abordar este problema
sin depender de enfoques econométricos más complejos es por imputación múltiple,
es decir, el proceso de reemplazar valores perdidos por múltiples conjuntos de valores plausibles. Este
La sección proporciona un ejemplo simple en el que xsmle se usa junto con mi, la suite de Stata
de comandos que se ocupan de la imputación de datos múltiples, para superar el obstáculo. Nos deja
considere el mismo proceso de generación de datos informado en (2). La siguiente sintaxis permite
usuarios para asignar aleatoriamente 5% de valores faltantes a la covariable x1it :21
. establecer semilla 12345
. reemplazar x1 = (49 . si uniforme()<0.05

cambios reales realizados, 49 faltantes)
El primer paso es declarar el conjunto de datos como un conjunto de datos mi usando mi set. Los datos deben ser
mi set antes de que se puedan usar otros comandos mi. En este ejemplo, elegimos el ancho
estilo. El segundo paso es registrar (declarar) las variables con valores faltantes usando
el comando mi registro:
. mi juego de ancho
. mi registro imputado x1
21. Como de costumbre, una buena práctica para obtener resultados reproducibles es establecer la semilla del pseudoaleatorio de Stata
generador de números usando el comando set seed #, donde # es cualquier número entre 0 y 231 ÿ 1.
Luego usamos mi impute regress para completar los valores faltantes de x1 usando el
método de regresión lineal con la covariable z como predictor.22 La opción add(50) especifica
el número de imputaciones a sumar (actualmente, el número total de imputaciones
no puede exceder de 1.000).
. mi imputar regreso x1 = z, agregar (50) rseed (12345)

Imputación univariada Imputaciones = Regresión lineal agregada = Imputada: m=1 a m=50 50
actualizada = 50
0
Observaciones por m
Variable Completo Incompleto Imputado Total
x1 891 49 49 940
(completo + incompleto = total; imputado es el mínimo a través de m

del número de observaciones rellenadas.)
Después de ejecutar mi imputación, 50 nuevas variables # x1 (con # = 1,..., 50)

se agregan al conjunto de datos, cada uno de los cuales representa una versión imputada de x1. Finalmente, escribimos
. mi estimación, publicación de puntos: xsmle y x1 x2 x3, wmat (W) modelo (sdm) fe tipo (ind) nolog
Imputaciones (50):
.........10.........20.........30.........40.........50 hecho
= 50
Estimaciones de imputación múltiple imputaciones
Número de obs. = 940
SDM con efectos fijos espaciales
= 0.0452
IVR promedio
= 0.1304
FMI más grande
Ajuste DF: muestra grande DF: min = 2.908,95
promedio = 126.717,41
máximo = 516.684,95
Prueba del modelo F: FMI igual F( 8,205401.9) = Problema > 130.14
OMI F = 0.0000
Dentro del tipo de VCE:
y coef. estándar Errar. t P>|t| [95% de conf. Intervalo]
Principal
x1 .509667 .0367065 -.2737751 13,88 0,000 -7,52 .4377079 .581626
x2 .0363977 -.1947675 .036523 0,000 -5,33 0,000 -.3451134 -.2024368
x3 -.2663518 -.1231832
Ancho x
x1 .2788079 .0769524 .5316003 3,62 0,000 6,82 .1279211 .4296947

x2 .0779399 .8991836 .0768688 0,000 11,70 0,000 .3788391 .6843615
x3 .748522 1.049845
Espacial
ro .2471005 .042971 5.75 0.000 .1628754 .3313257
Diferencia
sigma2_e .7751222 .0364928 21.24 0.000 .7035961 .8466484
22. Consulte la ayuda mi imputación para obtener detalles sobre los métodos de imputación disponibles. La covariable z es un estándar
Variable aleatoria gaussiana diseñada específicamente para ser correlacionada con x1. Ver el código informado en
el archivo sj Examples simdata.do para más detalles.
explotar xsmle para ajustar el FE SDM utilizando las 50 versiones imputadas de la variable x1.
De esta forma, tanto los coeficientes como los errores estándar se ajustarán por la variabilidad entre
imputaciones según las reglas de combinación dadas en Rubin (1987). Nosotros
repitió el mismo ejercicio asignando (al azar) un porcentaje más alto (10% y
20%) de valores faltantes a la covariable x1. Para ofrecer un ejemplo en el que los múltiples
La estrategia de imputación afecta directamente el valor del parámetro ÿ, usamos la misma estrategia,
asignando 5%, 10% y 20% de valores perdidos a la variable dependiente.23
El panel superior de la tabla 4 informa los resultados para el caso en el que x1 es el que falta .
variable. Como era de esperar, el sesgo que afecta el parámetro ÿ1 aumenta cuando el número de
los valores imputados crecen. Lo mismo es cierto para el parámetro ÿ cuando los valores faltantes son
en la variable dependiente (panel inferior de la tabla 4). Tenga en cuenta que incluso si estos no son los
resultados de una simulación de Monte Carlo, el efecto de los valores faltantes es aparentemente más fuerte
en ÿ que ÿ1.
Tabla 4. Resumen de los resultados de la estimación por % de valores perdidos†
Falta x1
No falta 5% falta 10% falta 20% falta

ÿ1 0,546 0,510 0,471 0.425
(0,034) (0,037) (0,040) (0.043)
te falta
No falta 5% falta 10% falta 20% falta

ÿ 0,227 0.192 0,171 0.103
(0,043) (0.047) (0,053) (0.060)
† Errores estándar entre paréntesis. Valores verdaderos: ÿ1 = 0,5, ÿ = 0,3.
4.2 Datos reales

Como ejemplo del uso de modelos de paneles espaciales con datos reales, utilizamos un conjunto de datos
sobre el uso de electricidad a nivel estatal en los Estados Unidos. Los datos cubren los 48 estados de la
Estados Unidos continental más el Distrito de Columbia para el período 1990–2010. Él
Los datos se extraen del Electric Power Annual compilado por la Agencia de Información Energética del
Departamento de Energía junto con información económica, demográfica y general.
información meteorológica de otras agencias estadísticas de EE. UU., incluida la Oficina de Trabajo
Estadísticas y el Negociado del Censo.24
23. Los lectores interesados pueden encontrar el código Stata relacionado en los ejemplos sj adjuntos simdata.do
expediente.
24. Los lectores interesados pueden encontrar el código de Stata y los datos utilizados para esta aplicación en el adjunto
sj empírico application.do, wstate rook.spmat y archivos dbf.dta espaciales de estado.
El análisis se centra en la respuesta de la demanda eléctrica residencial a los precios y

condiciones meteorológicas o climáticas. La dimensión espacial surge al menos de dos formas:
• Los precios relativos en los estados vecinos pueden influir en las decisiones sobre la ubicación de las
actividades económicas y, posteriormente, de la residencia. Los precios de la electricidad en California
son altos en comparación con los precios en el Noroeste y partes del Medio Oeste, pero uno esperaría
que las decisiones de ubicación y, por lo tanto, la demanda de electricidad estén más fuertemente
influenciadas por los precios en el Noroeste que en el Medio Oeste.
En términos de modelado, este comportamiento puede manifestarse como un coeficiente significativo en
los precios ponderados espacialmente o en la variable dependiente espacialmente rezagada.
• Tanto las variables meteorológicas como las climáticas pueden servir como sustitutos de las influencias
regionales a corto y largo plazo sobre la ubicación de la actividad económica, la eficiencia energética de
los edificios y otros determinantes del uso de la electricidad. Dado el stock de capital físico, las variaciones
anuales del clima afectarán la demanda de electricidad para aire acondicionado o calefacción. Por lo
tanto, es interesante determinar si las variables climáticas locales o regionales tienen una influencia
estadísticamente distinta en la demanda de electricidad.
Tenga en cuenta que la lógica que sugiere un papel para las influencias espaciales en la demanda de
electricidad en cada estado no implica interacciones espaciales directas para la variable dependiente, como en
los casos en los que se argumenta que las decisiones de política en un estado, por ejemplo, los impuestos sobre
la propiedad, están influenciadas. por decisiones tomadas por estados vecinos. En cambio, los argumentos
reflejan una combinación de variables omitidas que pueden estar correlacionadas espacialmente más la influencia
distribuida espacialmente de variables que estarían incluidas en cualquier modelo de demanda de electricidad.
Las tablas 5 a 7 resumen los resultados obtenidos cuando se utilizan modelos FE para examinar la demanda
residencial de electricidad utilizando el logaritmo del consumo residencial por persona como variable dependiente.
Elhorst y otros argumentan que los modelos FE son más apropiados para dichos datos porque la muestra
representa la población completa de los estados continentales de EE. UU. en lugar de una muestra aleatoria
extraída de esa población. Esta afirmación está respaldada por la evidencia proporcionada en las dos últimas
líneas de la tabla 5, donde todas las especificaciones de RE estáticas son fuertemente rechazadas por la prueba
de Hausman. Los modelos no brindan un análisis integral de los factores que pueden influir en la demanda, pero
se refinaron para centrarse en las variables clave que explican los cambios en la demanda de electricidad durante
las últimas dos décadas. Para el consumo residencial, las grandes diferencias entre los estadísticos intra y entre
R2 , excepto para los modelos que incluyen la variable dependiente rezagada (en el tiempo), confirman la
importancia del estado FE asociado a variables que no están incluidas en el análisis o que no se puede identificar
en esta especificación. No obstante, las estadísticas dentro de R2 , al menos igual a 0,82, muestran que los
modelos pueden explicar una gran proporción de la variación en el tiempo en el consumo de electricidad para
uso residencial por estado. Las variables meteorológicas, tanto los grados día de calefacción como los de
refrigeración, tienen una influencia importante en el consumo residencial, al igual que el tamaño del parque de
viviendas.25
25. Probamos medidas alternativas de ingresos; el mejor indicador parece ser el ingreso personal disponible
ajustado por las diferencias en el costo de vida entre los estados (utilizando el índice de costo de vida
ACCRA) y por los cambios en el IPC a lo largo del tiempo.
Niveles
de
significación:
* valor
pde
Hausman Hausman
ÿ2 R2R2bR2w Probabilidad
de
registro
Observaciones Precio
total
medio
real ÿ Ingreso
personal
real
Precio
residencial
promedio
real
Unidades
de
vivienda
Grados
día
de
refrigeración
Grados
día
de
calefacción
L.Residencial
consumo
de
electricidad
p<
5%,
y***
p<
10%,
**
2029.91
0,82
0,12
0,18 0,391***
1,019***
0,075***
0,188***
ÿ0,235***
1078
FE
Tabla
5.
Modelos
FE
para
demanda
eléctrica
residencial
2108.54
pag
<
1% 0,82
0,14
0,20
0,00
28,24 0.367*** 0,203***
0,747***
0,057***
0,140***
ÿ0,239***
1078 RAE
2315.67 SAR
dinámico
0,89
0,91 0,554***
0,261*** 0,150*
0,073***
0,146***
ÿ0,144*** 0.033
1029
0,165***
2144,51
0,85
0,16
0,22
0,00
27,33 0.416*** 0,212***
0,629***
0,057***
0,131***
ÿ0,293*** SDM
1078
2323.58 SDM
dinámico
0,89
0,91
0,90 0.057** 0,534***
0,284*** 0,128*
0,072***
0,140***
ÿ0,165*** 0.039
1029
2071.08
1078
0,82
0,21
0,26
0,00
33,19 0.390*** 0,375***
0,818***
0,071***
0,156***
ÿ0,271*** SEM
2108.58
0,82
0,14
0,20 0,359***
0,018 0,207***
0,748***
0,057***
0,141***
ÿ0,241***
1078 SACO
Modelos de datos de panel espacial usando Stata 174
Tabla 6. Demanda de electricidad residencial: prueba para la selección del modelo
ÿ2 valor p de akaike
criterio de información
SAR frente a SAR dinámico 414,26 0,000 SDM frente a .

SDM dinámico 358,14 0,000 SAR dinámico
SDMfrente
dinámico
a .
15,82 0,000 SEM frente a SDM dinámico 505,00 0,000 .
SAC .
. . ÿ4201.0
SDM dinámico . . ÿ4629.0
Cuadro 7. Efectos directos, indirectos y totales: demanda de electricidad residencial
dinámica dinámica
RAE RAE SDM SDM SACO
Efectos directos a largo plazo
Renta personal real 0,214*** 0.210*** 0.082 0.223*** 0.096

Precio residencial medio real ÿ0,247*** ÿ0,359*** ÿ0,307*** ÿ0,401*** ÿ0,249***
Viviendas 0,375** 0,775*** 0,775*** 0,660*** 0,312*
Grados día de refrigeración 0,059*** 0,182*** 0,059*** 0,059*** 0,174***
Grados día de calefacción 0,366*** 0,146*** 0,145*** 0,138*** 0,339***
Precio total medio real 0,020*** 0,026*
Efectos indirectos a largo plazo
Renta personal real 0,110*** Precio residencial medio 0.095 0,141*** 0,121* ÿ0,194*** 0.109***
real ÿ0,130*** ÿ0,417** Unidades de vivienda 0,406*** 0,031*** Grados ÿ0,508** 0,417*** 0,038*** ÿ0,126**
día de refrigeración Grados día de calefacción
medio real Precio 0,435*
0,076*** total 0,087*** 0,262*** 0,394 0.393*
0,211*** 0,221*** 0.030*
0,424** 0,429** 0.074*
0,285*
Efectos totales a largo plazo
Renta personal real 0,323*** 0.321*** 0.177 0.364*** 0.217

Precio residencial medio real ÿ0,377*** ÿ0,777*** ÿ0,502*** ÿ0,909*** ÿ0,375***
Viviendas 0.809** 1.168*** 1,180*** 1,077*** 0,706*
Grados día de refrigeración 0,090*** 0,393*** 0,089*** 0,097*** 0,395***
Grados día de calefacción 0,790*** 0,220*** 0,222*** 0,225*** 0,768***
Precio total medio real 0,282*** 0,311*
Efectos directos a corto plazo
ingresos personales reales 0,033 0.040

Precio residencial medio real ÿ0,146*** ÿ0,169***
Unidades habitacionales 0,152* 0.131*
Grados día de enfriamiento 0,074*** 0.073***
Grados día de calefacción 0,149*** 0.142***
Precio total medio real 0.004*
Efectos indirectos a corto plazo

Unidades habitacionales 0,050* 0.048
Grados día de refrigeración 0,024*** 0.027***
Grados día de calefacción 0,049*** 0.052***
Efectos totales a corto plazo

Unidades habitacionales 0,203* 0.179
Grados día de refrigeración 0,098*** 0.100***
Grados día de calefacción 0,198*** 0,195***
Niveles de significación: * p < 10 %, ** p < 5 % y *** p < 1 %

La Tabla 5 muestra fuertes interacciones espaciales en el consumo residencial. Los coeficientes

de la variable dependiente espacialmente rezagada (ÿ) y del precio espacialmente ponderado son
muy significativos y parecen tener influencias bastante separadas sobre el consumo. Las variables
espaciales de Durbin con coeficientes no significativamente diferentes de cero se han eliminado del
modelo. Los resultados de la tabla 6 refuerzan las recomendaciones de LeSage y Pace (2009) y
Elhorst (2010a) de que los investigadores deben comenzar con el SDM como una especificación
general y probar la exclusión de variables para modelos anidados utilizando pruebas de razón de
verosimilitud; para el modelo SAC , adoptamos el criterio de información de Akaike modificado como
en Burnham y Anderson (2004). El coeficiente ÿ positivo es consistente con los factores regionales
omitidos que varían con el tiempo y afectan el consumo residencial. El coeficiente positivo del precio
promedio espacialmente ponderado en los estados vecinos indica un claro efecto de desplazamiento
por el cual un aumento en los precios de la electricidad en un estado fomenta un cambio en la
demanda de ese estado a los estados vecinos. Esa es una restricción importante sobre el impacto de
los programas estatales para promover las energías renovables o reducir las emisiones de CO2 .
Los coeficientes de la variable dependiente rezagada son altamente significativos en las columnas (3)
y (5) de la tabla 5. Las series dentro del tiempo del panel son demasiado cortas para realizar pruebas
confiables, pero el coeficiente de la variable dependiente rezagada está muy lejos de uno que es poco
probable que las ecuaciones tengan una raíz unitaria. El coeficiente ÿ en la columna SEM , (6), es
altamente significativo, pero esta especificación está dominada por el modelo SAC en la columna (7).
La inclusión de las variables dependientes retrasadas espacialmente reduce la estimación de ÿ de
0,39 a alrededor de 0,02, de modo que ya no es significativamente diferente de 0. En general, los
resultados de la tabla 5 junto con la prueba informada en la tabla 6 sugieren que el SDM dinámico ( la
columna 5) proporciona la mejor especificación.
Una de las razones para estudiar tales modelos es ajustar las elasticidades precio de la demanda.
En la especificación no espacial, la elasticidad es simplemente el coeficiente del precio del logaritmo.
Como se discutió en la sección 2, el efecto marginal del precio en la demanda de electricidad puede
diferir entre estados debido a las interacciones espaciales. La diferencia clave entre los impactos
directos y totales es que el impacto directo mide el impacto de un cambio de unidad en la variable xk
en el estado i en demanda en el estado i promediado sobre todos los estados. Por el contrario, el
impacto total mide el impacto del mismo cambio unitario en la variable xk en todos los estados a
pedido en el estado i, nuevamente promediado para todos los estados. xsmle muestra valores para el
impacto directo, indirecto y total de los cambios en cada una de las variables independientes. A
diferencia de los valores informados en la tabla 5, la tabla 7 informa elasticidades que representan la
retroalimentación espacial. Además, para las especificaciones dinámicas de SAR y SDM , el cuadro 7
también distingue entre efectos marginales de corto y largo plazo. Tenga en cuenta que los efectos
marginales en los modelos estáticos se han etiquetado como de largo plazo, pero deben compararse
con los efectos de corto plazo de los modelos dinámicos (consulte la tabla 2). Estos resultados
adicionales son consistentes en todas las especificaciones espaciales, siendo los controles
significativos y con los signos esperados. La inclusión de la variable dependiente desfasada en el
tiempo hace que el coeficiente del ingreso personal real deje de ser significativo y reduce en gran
medida la elasticidad del consumo residencial con respecto a los demás controles.
5. Conclusiones
En este artículo, describimos el nuevo comando xsmle, que se puede usar para ajustar una amplia
variedad de modelos espaciales para datos de panel. xsmle admite matrices de peso en forma de
matrices de Stata y objetos spmat, permite el cálculo de efectos directos, indirectos y totales y errores
estándar relacionados, y proporciona varias funciones de estimación posterior para obtener predicciones,
incluido el uso de márgenes. Además, xsmle es totalmente compatible con el conjunto de comandos mi
Stata. Utilizamos datos simulados para ilustrar las capacidades de estimación de xsmle, centrándonos
en la selección, predicción y estimación del modelo en presencia de datos faltantes, y proporcionamos
una aplicación empírica basada en datos de uso de electricidad a nivel estatal en los Estados Unidos.
6 Agradecimientos
Nos gustaría agradecer, en particular, a Paul Elhorst y Michael Pfaffermayr por permitirnos usar su
código MATLAB . Para la mayoría de las rutinas, hemos modificado o ampliado la forma en que operan
las rutinas, por lo que no deben hacerse responsables de los errores que pueda haber en nuestro código.
7. Referencias
Angrist, JD y J.-S. Pischke. 2009. Econometría mayormente inofensiva: el compañero de un empirista.
Princeton, Nueva Jersey: Princeton University Press.
Bramoullé, Y., H. Djebbari y B. Fortin. 2009. Identificación de efectos de pares a través de

redes sociales. Revista de Econometría 150: 41–55.
Burnham, KP y DR Anderson. 2004. Inferencia multimodelo: comprensión de AIC y BIC en la selección

de modelos. Métodos e investigación sociológicos 33: 261–304.
Driscoll, JC y AC Kraay. 1998. Estimación de matriz de covarianza consistente con datos de panel
espacialmente dependientes. Revisión de Economía y Estadística 80: 549–560.
Drukker, DM, H. Peng, IR Prucha y R. Raciborski. 2013. Creación y gestión de matrices de ponderación
espacial con el comando spmat. Diario de Stata 13: 242–286.
Drukker, DM, IR Prucha y R. Raciborski. 2013a. Un comando para estimar modelos autorregresivos
espaciales con perturbaciones autorregresivas espaciales y variables endógenas adicionales. Diario
de Stata 13: 287–301.
. 2013b. Máxima verosimilitud y estimadores espaciales generalizados de mínimos cuadrados

en dos etapas para un modelo espacial autorregresivo con perturbaciones espaciales autorregresivas.
Diario de Stata 13: 221–241.
Elhorst, JP 2010a. Modelos de datos de panel espacial. En Handbook of Applied Spatial Analysis:
Software Tools, Methods and Applications, ed. MM Fischer y A. Getis, 377–408. Berlín: Springer.
. 2010b. Econometría espacial aplicada: subiendo el listón. Anal económico espacial

ysis 5: 9–28.
. 2014. Econometría espacial: de datos transversales a paneles espaciales.

Heidelberg: Springer.
Elhorst, JP y S. Fréret. 2009. Evidencia de la competencia de criterios políticos en Francia utilizando

un modelo de Durbin espacial de dos regímenes con efectos fijos. Revista de Ciencias Regionales
49: 931–951.
Elhorst, P., G. Piras y G. Arbia. 2010. Crecimiento y convergencia en una multirregional

modelo con dinámica espacio-temporal. Análisis geográfico 42: 338–355.
Hausman, JA 1978. Pruebas de especificación en econometría. Econométrica 46: 1251–1271.
Hoechle, D. 2007. Errores estándar robustos para regresiones de panel con dependencia
transversal. Diario de Stata 7: 281–312.
Jeanty, PW 2010. spwmatrix: módulo de Stata para generar, importar y exportar ponderaciones
espaciales. Componentes de software estadístico 457111, Departamento de Economía, Boston
College. https://ideas.repec.org/c/boc/bocode/s457111.html.
Kapoor, M., HH Kelejian e IR Prucha. 2007. Modelos de datos de panel con

componentes de error correlacionados. Revista de Econometría 140: 97–130.
Kelejian, HH e IR Prucha. 2007. Las eficiencias relativas de varios predictores en modelos

econométricos espaciales que contienen retrasos espaciales. Ciencia Regional y Economía
Urbana 37: 363–374.
Kostov, P. 2009. Un modelo hedónico de regresión cuantil espacial de precios de tierras agrícolas.
Análisis económico espacial 4: 53–72.
Lee, L.-F. y J. Yu. 2010. Estimación de modelos de datos de panel autorregresivos espaciales con
efectos fijos Revista de Econometría 154: 165–185.
LeSage, J. y RK Pace. 2009. Introducción a la Econometría Espacial. Boca Ratón, Florida: Chapman
& Hall/CRC.
Millo, G. y G. Piras. 2012. splm: modelos de datos de panel espacial en R. Journal of

Software estadístico 47(1): 1–38.
Moscone, F. y M. Knapp. 2005. Explorando el patrón espacial del gasto en salud mental. Revista
de política y economía de la salud mental 8: 205–217.
Moscone, F., E. Tosetti y G. Vittadini. 2012. Interacción social en la elección de hospital de los
pacientes: Evidencia de Italia. Revista de la Royal Statistical Society, Serie A 175: 453–472.
Ollé, AS 2003. Rendición de cuentas electoral y mimetismo fiscal: Los efectos de los márgenes
electorales, el gobierno de coalición y la ideología. Revista Europea de Economía Política 19:
685–713.
. 2006. Efectos indirectos del gasto e interacciones fiscales: evidencia empírica de

gobiernos locales en España. Revista de Economía Urbana 59: 32–53.
Pisati, M. 2001. sg162: Herramientas para el análisis de datos espaciales. Boletín técnico de Stata 60: 21–
37. Reimpreso en Stata Technical Bulletin Reprints, vol. 10, págs. 277–298. College Station, Texas:
Stata Press.
Revelli, F. 2005. Sobre la empírica espacial de las finanzas públicas. Impuestos Internacionales y Públicos
Finanzas 12: 475–492.
Rubin, DB 1987. Imputación múltiple por falta de respuesta en encuestas. Nueva York: Wiley.
Tobler, WR 1970. Una película de computadora que simula el crecimiento urbano en la región de Detroit.
Geografía Económica 46: 234–240.
White, H. 1982. Estimación de máxima verosimilitud de modelos mal especificados. Econométrica

50: 1–25.
Yu, J., R. de Jong y L.-F. Sotavento. 2008. Estimadores de verosimilitud casi máxima para datos de panel
dinámicos espaciales con efectos fijos cuando tanto n como T son grandes. Revista de Econometría
146: 118–134.
Sobre los autores
Federico Belotti es profesor asistente de econometría en el Departamento de Economía y Finanzas

de la Universidad de Roma Tor Vergata y miembro del Centro de Economía y Estudios Internacionales
(Universidad de Roma Tor Vergata).
Gordon Hughes es profesor de economía en la Escuela de Economía de la Universidad de Edimburgo.
Andrea Piano Mortari es investigador del Consejo Nacional de Investigación, Instituto de Investigación
sobre Población y Políticas Sociales, y miembro del Centro de Economía y Estudios Internacionales
(Universidad de Roma Tor Vergata).

Modelos de Datos de Panel Espacial Usando Stata

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Modelos de Datos de Panel Espacial Usando Stata

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

El diario de Stata (2017)

Modelos de datos de panel espacial usando Stata

Federico Belotti Universidad

Andrea Piano Mortari

c 2017 StataCorp LLC st0470

140 Modelos de datos de panel espacial usando Stata

2 modelos de datos de panel espacial

A continuación, denotamos el vector columna n × 1 de la variable dependiente con yt y la matriz de

F. Belotti, G. Hughes y A. Piano Mortari 141

xsmle permite a los usuarios adaptarse a los siguientes modelos:

modelo SAR . La ecuación básica para el modelo SAR es

yt = ÿWyt + Xtÿ + ÿ + t t = 1 ...,T

Se supone que ÿ ÿ N(0, ÿ2 ÿ) en el caso RE , mientras que ÿ es un vector de parámetros ÿ

yt = ÿWyt + Xtÿ + WZtÿ + ÿ + t

donde M es una matriz de ponderaciones espaciales que pueden o no ser iguales a W.

yt = ÿWyt + Xtÿ + ÿ + ÿt ÿt = ÿMÿt

donde M es una matriz de ponderaciones espaciales que pueden o no ser iguales a W. La

2. Generalmente se explotan dos fuentes de información de ubicación. Primero, la ubicación en el espacio

142 Modelos de datos de panel espacial usando Stata

SEM. El SEM se enfoca en SAC en el término de error, como en

GSPRE. Este modelo se puede representar como

yt = ÿytÿ1 + ÿWytÿ1 + ÿWyt + Xtÿ + ÿ + t

144 Modelos de datos de panel espacial usando Stata

Para cada modelo, la matriz de varianza-covarianza asintótica (VC) predeterminada de los

En cuanto a los errores estándar de Driscoll–Kraay, la implementación de xsmle se basa en el

F. Belotti, G. Hughes y A. Piano Mortari 145

Efectos marginales directos, indirectos y totales

F. Belotti, G. Hughes y A. Piano Mortari 147

Prueba robusta de Hausman

estimación de la matriz VC de ÿ. La distribución asintótica de (1) bajo la hipótesis nula

La opción ÿ solo está permitida para modelos estáticos.

148 Modelos de datos de panel espacial usando Stata

Un requisito previo importante para usar el comando se refiere a la construcción de n × n

La sintaxis básica de xsmle es la siguiente:

xsmle depvar indepvars Si en peso , opciones

3.1 Opciones principales para xsmle

Opciones comunes a todos los modelos

F. Belotti, G. Hughes y A. Piano Mortari 149

oim utiliza la matriz de información observada.

opg usa la suma del producto exterior de los gradientes.

robusto es el sinónimo de estimador sándwich agrupado, donde clustvar es el pan

cluster clustvar especifica el estimador sándwich agrupado.

dkraay # especifica el estimador robusto de Driscoll–Kraay. # es el retraso máximo utilizado en el cálculo.

robusto es el sinónimo de vce (cluster panelvar).

cluster(clustvar) es el sinónimo de vce(cluster clustvar).

restricciones(restricciones); ver [R] opciones de estimación.

postcore guarda puntajes de observación por observación en la lista de resultados de la estimación.

posthessian guarda el Hessian correspondiente al conjunto completo de coeficientes en la lista de resultados de

Opciones para el modelo SAR

reutiliza el estimador de efectos aleatorios; re es el predeterminado.

fe utiliza el estimador de efectos fijos.

150 Modelos de datos de panel espacial usando Stata

se incluye la variable dependiente retrasada en el espacio-tiempo; cuando dlag es igual a 3, se incluyen

noconstant suprime el término constante en el modelo. Se utiliza sólo para el re

hausman realiza la prueba robusta de Hausman, detectando automáticamente el estimador alternativo. La

Opciones para el modelo SDM

reutiliza el estimador de efectos aleatorios; re es el predeterminado.

fe utiliza el estimador de efectos fijos.

noconstant suprime el término constante en el modelo. Se utiliza sólo para el re

F. Belotti, G. Hughes y A. Piano Mortari 151

hausman realiza la prueba robusta de Hausman, detectando automáticamente el estimador alternativo. La

Opciones para el modelo SAC

. testnl ([Wx]x1 = -[Espacial]rho[Principal]x1) ([Wx]x2 = -[Espacial]rho[Principal]x2)