Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen. xsmle es un nuevo comando escrito por el usuario para el análisis espacial.
Consideramos la estimación de verosimilitud casi máxima de un amplio conjunto de modelos
espaciales de efectos fijos y aleatorios para datos de panel balanceados. xsmle permite a los
usuarios manejar paneles no balanceados utilizando su compatibilidad total con el conjunto de
comandos mi, usar matrices de peso espacial en forma de matrices de Stata y objetos spmat,
calcular efectos marginales directos, indirectos y totales y errores estándar relacionados para
lineal ( en variables) especificaciones, y explotar una amplia gama de características de
postestimación, incluidos los predictores de caso de datos de panel de Kelejian y Prucha (2007,
Regional Science and Urban Economics 37: 363–374). Además, xsmle permite el uso de
márgenes para calcular los efectos marginales totales en presencia de especificaciones no
lineales obtenidas utilizando variables factoriales. En este artículo, describimos el comando y
todas sus funcionalidades utilizando datos reales y simulados.
Palabras clave: st0470, xsmle, análisis espacial, modelo de autocorrelación espacial, modelo
espacial autorregresivo, modelo espacial de Durbin, modelo de error espacial, modelo de efectos
aleatorios de panel espacial generalizado, datos de panel, estimación de máxima verosimilitud
1. Introducción
Es ampliamente reconocido que los datos de muestra recopilados de entidades geográficamente
cercanas no son independientes sino espacialmente correlacionados, lo que significa que las
observaciones de unidades más cercanas tienden a ser más similares que las observaciones de
unidades más alejadas (Tobler 1970).1 El agrupamiento espacial, o correlación geográfica, se observa
a menudo para variables económicas y sociodemográficas como el desempleo, las tasas de criminalidad,
los precios de la vivienda, los gastos per cápita en salud , etc. ´eret 2009; Elhorst, Piras y Arbia 2010;
Moscone, Tosetti y Vittadini 2012). Los modelos teóricos suelen reconocer la existencia de derrames
espaciales,
1. Tenga en cuenta que también se puede observar una dependencia estructurada no espacial. En estos casos,
las medidas de proximidad geográfica se reemplazan por medidas de similitud, lo que permite investigar los
efectos de pares a través de redes sociales o industriales (LeSage y Pace 2009; Bramoull´e, Djebbari y Fortin
2009).
que disminuyen a medida que aumenta la distancia entre las unidades; empíricamente, los modelos de datos de panel espaciales
se han convertido en una herramienta popular para medir dichos efectos indirectos.
Hasta donde sabemos, aunque tanto R como MATLAB ofrecen un amplio conjunto de funciones para
estimar modelos de datos de panel espaciales (Millo y Piras 2012; LeSage y Pace 2009), con la notable
excepción representada por el código adjunto de Kapoor, Kelejian, y Prucha (2007): las capacidades de
Stata incluyen un amplio conjunto de comandos diseñados para manejar solo datos transversales (Drukker
et al. 2013; Drukker, Prucha y Raci borski 2013a,b). Desarrollamos el comando xsmle para estimar una
amplia gama de modelos de datos de panel espacial usando Stata. En particular, xsmle permite a los
usuarios estimar modelos espaciales autorregresivos (SAR) de efectos fijos (FE) y efectos aleatorios (RE) ,
modelos espaciales de Durbin (SDM), modelos de error espacial (SEM), modelos de autocorrelación
espacial FE (SAC) , y modelos RE espaciales generalizados (GSPRE) . Para autorregresivos espaciales
(SAR) y SDM con FE, xsmle también permite una especificación dinámica mediante la implementación del
enfoque de máxima verosimilitud con corrección de sesgo descrito en Yu, de Jong y Lee (2008).
Entre otras funciones interesantes, xsmle permite a los usuarios i) utilizar matrices de ponderación espacial
creadas mediante el comando spmat de Drukker et al. (2013); ii) calcular los efectos marginales directos,
indirectos y totales; iii) calcular los errores estándar agrupados y de Driscoll-Kraay; iv) probar si un modelo
FE o RE es apropiado utilizando una prueba robusta de Hausman; v) y explotar una amplia gama de
predictores, extendiéndose a los estimadores de casos de datos de panel de Kelejian y Prucha (2007).
El resto de este artículo se organiza como sigue. En la sección 2, presentamos una breve revisión de
los modelos de datos de panel espacial que se pueden estimar con xsmle. La sección 3 documenta la
sintaxis xsmle y sus opciones principales, mientras que la sección 4 ilustra sus características principales
utilizando conjuntos de datos reales y simulados. La última sección concluye.
2
y j. Para excluir a los vecinos propios, los elementos diagonales wii se fijan
convencionalmente en cero. Tenga en cuenta que xsmle permite el uso de dos formatos
diferentes para la matriz de peso; es decir, W puede ser una matriz de Stata o un objeto spmat.
Esto permite al usuario aprovechar las capacidades de otros comandos de Stata que permiten
la creación y gestión de matrices de peso, como spmat, spatwmat (Pisati 2001) o spwmatrix (Jeanty 2010).
Además, xsmle se ocupa automáticamente de la naturaleza longitudinal de los datos.
Por lo tanto, los usuarios deben proporcionar solo la matriz de peso transversal n × n para ajustarse a un modelo
específico.
modelo SAC . Este modelo (también conocido como SAR con errores espacialmente autocorrelados, SAC) amplía
el modelo SAR al permitir un modelo espacialmente autocorrelacionado .
error,
yt = Xtÿ + ÿ + ÿt ÿt =
ÿMÿt + t
Este es un caso especial del modelo SAC , pero también es un caso especial del SDM.
yt = Xtÿ + ÿ + ÿt ÿt =
ÿMÿt + t
ÿ = ÿWÿ + ÿ
Esta es una generalización del SEM, en la que los efectos de panel, representados por el vector ÿ,
están espacialmente correlacionados. Se supone que los vectoresnormalmente
ÿ y t son errores
de forma
distribuidos
independiente, por lo que el modelo es necesariamente una especificación RE con ÿ = (I ÿ ÿW)ÿ1ÿ
y ÿt = (I ÿ ÿW)ÿ1 t. Hay varios casos especiales de la
especificación general, con (a) ÿ = ÿ = 0, (b) ÿ = 0, (c) ÿ = 0, (d) ÿ = ÿ.
Además de la distinción entre FE y RE, existe una distinción separada entre especificaciones
estáticas y dinámicas. Los modelos antes mencionados son todos estáticos en el sentido de que
involucran valores contemporáneos de las variables dependientes e independientes. xsmle también
permite la estimación de modelos SAR y SDM , como
donde la variable dependiente retrasada (en el tiempo) o la variable dependiente retrasada (tanto en el
tiempo como en el espacio) pueden incluirse en la especificación.
2.1 Estimación
Se han propuesto varios métodos para ajustar modelos de paneles espaciales. En términos generales,
se dividen en dos categorías: i) método generalizado de momentos y ii) estimadores de cuasi-máxima
verosimilitud (QML) . Todos los modelos que se pueden ajustar con xsmle pertenecen a la segunda
categoría. En la tabla 1 se presenta una guía de sinopsis con todos los modelos estimables y sus
características .
La ganancia de los gradientes de programación es grande, por lo que los evaluadores v1 se
utilizan para todas las especificaciones menos una. La excepción es RE SEM, cuya función de
verosimilitud implica una transformación utilizando los factores de Cholesky de una matriz bastante
complicada que contiene los parámetros a estimar, por lo que la diferenciación de matrices es
extremadamente complicada.
3. Elhorst (2010a) sugiere que el tiempo de cálculo requerido para llevar a cabo una estimación de máxima
verosimilitud total se puede reducir transformando las variables de una manera que permita concentrar la
función de verosimilitud para que la estimación se pueda realizar en dos pasos. Al traducir sus rutinas a
Mata, encontramos que usar una probabilidad concentrada tendía a aumentar tanto el número de
iteraciones como el tiempo requerido para ajustar los modelos.
GSPRE
QML SDM
QML SEM
SACO QML RAE Modelo
QML QML Estimación
Tiempo
Individual
Aleatorio
wmatrix()
ematrix()
dmatrix()
Método
dinámico
Tabla
1.
Un
resumen
de
las
capacidades
de
estimación
xsmle
FE
X X X X
FE
X X X X
efectos
X X X X
X X X X
X X X
X
X X
143 F. Belotti, G. Hughes y A. Piano Mortari
Machine Translated by Google
Machine Translated by Google
Para los modelos dinámicos, es decir, aquellos que incluyen una variable dependiente retardada
en el tiempo, una variable dependiente retardada en el tiempo y el espacio, o ambas, xsmle implementa
solo la variante FE de los modelos SAR y SDM utilizando el enfoque QML con corrección de sesgo
descrito por Yu, de Jong y Lee (2008), lo cual es consistente cuando tanto n ÿ ÿ como T ÿ ÿ. El comando
comienza construyendo estimaciones de máxima verosimilitud, tratando las variables rezagadas
mencionadas anteriormente como regresores exógenos. Luego se calculan las correcciones de sesgo
para cada uno de los coeficientes y se usan para ajustar las estimaciones iniciales de máxima verosimilitud.
En nuestras ejecuciones de prueba, las diferencias entre los errores estándar asintóticos y robustos
suelen ser pequeñas, pero no nos hemos centrado en los casos con valores pequeños de n y T.
En principio, sería útil incluir un estimador bootstrap para la matriz VC .
Desafortunadamente, existe una barrera importante para aplicar métodos de arranque estándar en
este caso. La suposición crucial para el remuestreo es que los errores de las observaciones o unidades
de las que se extrae cada muestra deben ser independientes. Para datos de panel o agrupados, esto
significa que el remuestreo se basa en unidades de panel o agrupaciones. Para paneles espaciales,
nuestro modelo base asume que las observaciones para diferentes unidades de panel están
correlacionadas en el espacio para cualquier período t. De ello se deduce que el remuestreo basado
en unidades de panel no puede reconciliarse con la hipótesis de interacciones espaciales en las relaciones de interés.
Como alternativa, podríamos usar períodos de tiempo como unidad de remuestreo, pero esto será
válido solo si no existe una correlación serial dentro de los paneles. Además, para muchas aplicaciones
de estimación de panel espacial, el valor de T es considerablemente más pequeño que n, por lo que
no se aplican las suposiciones de muestras grandes de estadísticas de arranque. Los estadísticos han
desarrollado métodos de arranque para datos espaciales, pero a costa de imponer restricciones
sustanciales sobre el alcance de las interacciones espaciales que se pueden examinar. Los métodos
han tendido a centrarse en redes regulares, pero se pueden aplicar a datos espaciales para unidades
económicas bastante pequeñas, como condados y áreas del mercado laboral.
4. También está disponible una variante obtenida del producto exterior de los gradientes especificando vce(opg).
5. El ancho de banda para el núcleo se especifica con un valor predeterminado de piso{4(T /100)2/9} si no se especifica ningún valor.
especificado.
Machine Translated by Google
Debido a que los modelos de regresión espacial explotan la complicada estructura de dependencia
entre unidades, el efecto del cambio de una variable explicativa para una unidad específica
afectará a la unidad misma y, potencialmente, a todas las demás unidades indirectamente. Esto
implica la existencia de efectos marginales directos, indirectos y totales. Con la excepción de los
modelos SEM y GSPRE , y solo si se especifica la opción de efectos, estos efectos se calculan
usando las fórmulas reportadas en la tabla 2. El comando distingue automáticamente entre efectos
marginales a corto y largo plazo cuando se utiliza un modelo espacial dinámico. está en forma
Fuente:
Adaptado
de
Elhorst
(2014).
Nota:
El
superíndice
¯d
denota
el
operador
que
calcula
el
elemento
diagonal
medio
de
una
matriz,
yel
superíndice
rsum
denota
el
operador
que
calcula
la
suma
media
de
fila
los
elementos
no
diagonales. RAE SDM SACO RAE SEM SDM tipo
de
modelo
{(I
ÿÿW)
ÿ1
×(ÿkI
+
ÿWk )}
{(yo
ÿÿW)
ÿ1
Efecto
directo
a
corto
plazo
×(ÿkI)}
ninguna ninguna ninguna ninguna
d
d
{(I
ÿÿW)
ÿ1
×(ÿkI
+
ÿWk
rsum
)}
Efecto
indirecto
a
corto
plazo
{(yo
ÿÿW)
ÿ1
×(ÿkI)}
rsuma
ninguna ninguna ninguna ninguna
Tabla
2.
Efectos
directos,
indirectos
ytotales
Dinámica
{(I
ÿÿW)
ÿ1
×
(ÿkI
+
ÿWk )}
Estático
{(I
ÿÿW)
ÿ1
×
(ÿkI)} {(I
ÿÿW)
ÿ1
×
(ÿkI)}
×(ÿkI)}
×(ÿkI
+
ÿWk
{(1
ÿ)I
(ÿ
+ÿ)W)
ÿ1
{(1
ÿÿ)I
(ÿ
+
ÿ)W)
ÿ1 )}
Efecto
directo
a
largo
plazo
¯d
ÿk
d
d
dd
{(I
ÿÿW)
ÿ1
×
(ÿkI
+
ÿWk
rsum)}
{(I
ÿÿW)
ÿ1
×
(ÿkI)}
rsum {(I
ÿÿW)
ÿ1
×
(ÿkI)}
rsum
×(ÿkI)}
rsum
×(ÿkI
+
ÿWk
rsum
{(1
ÿÿ)I
(ÿ
+
ÿ)W)
ÿ1
{(1
ÿÿ)I
(ÿ
+
ÿ)W)
ÿ1 )}
Efecto
indirecto
a
largo
plazo
ninguna
Modelos de datos de panel espacial usando Stata 146
Machine Translated by Google
Machine Translated by Google
Tenga en cuenta que los resultados analíticos informados en la tabla 2 son válidos solo para
especificaciones lineales (en variables). Por lo tanto, por defecto, una especificación de “variables
factoriales” bloqueará el cálculo de estos efectos.6 No obstante, en estos casos, xsmle permite el uso
de márgenes para al menos calcular los efectos marginales totales. Como se describe en la sección
4.1, xsmle también calcula los errores estándar de los efectos marginales mediante la simulación
Monte Carlo (predeterminada) o el método Delta.
Una pregunta clásica en los análisis empíricos de datos de panel se refiere a la elección entre las
variantes FE y RE (cuando ambas pueden estimarse). Se puede dar una respuesta a esta pregunta
utilizando el estadístico de Hausman (1978) ,
ÿ1
ÿ = ÿV 0 d (1)
donde ÿ = (ÿ FE ÿ ÿ RE) es la diferencia entre las estimaciones FE y RE y V una 0 es
ÿ1 ÿ1
HFE O SFE,FE SFE,RE HFE O
W/0 =
O HRE SRE,FE SRE,RE O HRE
con
1
norte
ÿ2Lpi ÿ pag
Hp _ =ÿ
, p = FE, RE
norte
yo=1 ÿÿ ÿÿ
ÿLpi ÿ ÿLqi ÿ
norte
1 pag q
Spq = , p, q = FE, RE
norte
yo=1
ÿÿ ÿÿ
ÿ1 ÿ1 ÿ1 ÿ1
donde H FE( SFE,FE)HFE yH
RE( S ¯RE,RE)H dondeRE son las matrices VC robustas de clúster de
FE yÿ RE, el clúster está representado por la unidad del panel. Tenga en cuenta que el hausman
3 El comando xsmle
El comando xsmle se escribe utilizando el conjunto de funciones de optimización () y el motor de optimización utilizado
por ml. Comparte las mismas características de todos los comandos de estimación de Stata. Stata 10.1 es la primera
versión que puede ejecutar xsmle. Solo pesos analíticos
(un peso), pero la variable de pesos declarada debe ser constante dentro de cada
unidad del tablero. xsmle admite el prefijo mi pero no admite el prefijo svy.
Las variables de factor están permitidas si se usa Stata 11 (o posterior) para ejecutar el comando.
El valor predeterminado es el modelo RE SAR . A continuación se proporciona una descripción de las principales
opciones de estimación y postestimación. Se proporciona una descripción completa de todas las opciones disponibles.
en el archivo de ayuda xsmle.
model(name) especifica el modelo espacial que se va a ajustar. el nombre puede ser sar para el modelo SAR ,
sdm para el SDM, sac para el SAR con modelo de errores espacialmente autocorrelacionados, sem para
el SEM, o gspre para el modelo GSPRE . El valor predeterminado es modelo (sar).
7. No se supone que W sea simétrico, pero (IÿÿW) debe ser no singular. Esto implica condiciones
sobre los valores propios de W discutidos extensamente en la literatura (por ejemplo, ver LeSage y Pace
[2009, cap. 3]).
8. Esto evita la necesidad de agregar sintaxis para especificar las variables de panel y tiempo. Sin embargo, hay
es un corolario que conviene señalar. La forma natural de organizar datos de panel espacial para la estimación
propósitos es apilar cada unidad de panel para el período t = 1 seguido de unidades de panel para t = 2, y así sucesivamente.
Por lo tanto, xsmle clasifica internamente el conjunto de datos por tiempo y unidad de panel, pero restaura la clasificación original en
salida.
Machine Translated by Google
vce(vcetype) especifica cómo estimar la matriz VC correspondiente a las estimaciones de parámetros. Los errores
estándar informados en la tabla de resultados de la estimación son la raíz cuadrada de las varianzas
(elementos diagonales) del estimador VC . vcetype puede ser uno de los siguientes:
level(#) establece el nivel de confianza para los intervalos de confianza; el valor predeterminado es el nivel (95).
opciones de visualización: vsquish, niveles base, todos los niveles base; ver [R] opciones de estimación.
maximizar opciones: difícil, técnica (especificación de algoritmo), iterar (#), sin registro, desde (especificaciones
de inicio), tolerancia (#), intolerancia (#), intolerancia (#), no tolerancia; ver [R] maximizar. Estas opciones
rara vez se utilizan.
wmatrix(name) especifica la matriz de peso para el término SAR . El nombre puede ser una matriz de Stata o un
objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
type(type option , leeyu ) especifica el tipo de efectos fijos. La opción de tipo se puede encontrar para efectos fijos
individuales, tiempo para efectos fijos temporales o ambos para efectos fijos individuales y temporales. La
subopción leeyu transforma los datos según Lee y Yu (2010).
dlag(dlag) define la estructura del modelo espaciotemporal. Cuando dlag es igual a 1, solo se incluye la variable
dependiente con retraso en el tiempo; cuando dlag es igual a 2, sólo
Machine Translated by Google
efectos calcula los efectos directos, indirectos y totales y los suma a e(b).
vceeffects(vcee type , nsim(#) ) establece cómo se calculan los errores estándar para los efectos directos,
indirectos y totales. El tipo de vcee puede ser dm para los errores estándar del método delta, sim[,
nsim(#)] para los errores estándar de Monte Carlo, donde nsim(#) establece el número de simulaciones
para el procedimiento de LeSage y Pace (2009) , o none para ningún estándar errores
wmatrix(name) especifica la matriz de peso para el término SAR . El nombre puede ser una matriz de Stata
o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
dmatrix(name) especifica la matriz de peso para los regresores retrasados espacialmente; el defecto es
usar la matriz especificada en wmat(nombre). El nombre puede ser una matriz de Stata o un objeto
spmat. Esta matriz puede estar estandarizada o no.
durbin(varlist) especifica los regresores que deben retrasarse espacialmente; el valor predeterminado es
para retrasar todas las variables independientes en varlist.
type(type option , leeyu ) especifica el tipo de efectos fijos. La opción de tipo se puede encontrar para
efectos fijos individuales, tiempo para efectos fijos temporales o ambos para efectos fijos individuales
y temporales. La subopción leeyu transforma los datos según Lee y Yu (2010).
dlag(dlag) define la estructura del modelo espaciotemporal. Cuando dlag es igual a 1, solo se incluye la
variable dependiente con retraso en el tiempo; cuando dlag es igual a 2, solo se incluye la variable
dependiente retrasada en el espacio-tiempo; cuando dlag es igual a 3, se incluyen tanto las variables
dependientes con retraso en el tiempo como en el espacio-tiempo.
efectos calcula los efectos directos, indirectos y totales y los suma a e(b).
Machine Translated by Google
vceeffects(vcee type , nsim(#) ) establece cómo se calculan los errores estándar para los efectos directos,
indirectos y totales. El tipo de vcee puede ser dm para los errores estándar del método delta, sim[,
nsim(#)] para los errores estándar de Monte Carlo, donde nsim(#) establece el número de simulaciones
para el procedimiento de LeSage y Pace (2009) , o none para ningún estándar errores
wmatrix(name) especifica la matriz de peso para el término SAR . El nombre puede ser una matriz de Stata
o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
ematrix(name) especifica la matriz de peso para el término de error SAC . El nombre puede ser una matriz
de Stata o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere ematrix().
type(type option , leeyu ) especifica el tipo de efectos fijos. La opción de tipo se puede encontrar para
efectos fijos individuales, tiempo para efectos fijos temporales o ambos para efectos fijos individuales
y temporales. La subopción leeyu transforma los datos según Lee y Yu (2010).
efectos calcula los efectos directos, indirectos y totales y los suma a e(b).
vceeffects(vcee type , nsim(#) ) establece cómo se calculan los errores estándar para los efectos directos,
indirectos y totales. El tipo de vcee puede ser dm para los errores estándar del método delta, sim[,
nsim(#)] para los errores estándar de Monte Carlo, donde nsim(#) establece el número de simulaciones
para el procedimiento de LeSage y Pace (2009) , o none para ningún estándar errores
ematrix(name) especifica la matriz de peso para el término de error SAC . El nombre puede ser una matriz
de Stata o un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere ematrix().
type(type option , leeyu ) especifica el tipo de efectos fijos. La opción de tipo se puede encontrar para
efectos fijos individuales, tiempo para efectos fijos temporales o ambos para efectos fijos individuales
y temporales. La subopción leeyu transforma los datos según Lee y Yu (2010).
Machine Translated by Google
wmatrix(nombre) especifica la matriz de peso para el SAC RE. El nombre puede ser una matriz de Stata o
un objeto spmat. Esta matriz puede estar estandarizada o no. Se requiere wmatriz().
ematrix(name) especifica la matriz de peso para el término de error SAC . El nombre puede ser una matriz
de Stata o un objeto spmat. Esta matriz puede estar estandarizada o no.
re utiliza el estimador de efectos aleatorios.
error(opciones de error) define la estructura de error de efecto aleatorio con opciones de error = 1,..., 4.
En particular, error(1) (predeterminado) para ÿ = ÿ = 0, error(2) para ÿ = 0 y ÿ = 0, error(3) para ÿ = 0
y ÿ =0 (modelo SEM ), y error(4) para ÿ = ÿ.
Después de una estimación xsmle, el comando predict se puede usar para calcular los valores predichos.
Además, predict permite la postestimación de FE o RE. Los métodos implementados en este comando
son la extensión de datos de panel de los disponibles en Kelejian y Prucha (2007) y Drukker, Prucha y
Raciborski (2013b). Consulte la sección 4.1 para obtener más detalles.
rform, el valor predeterminado, calcula los valores pronosticados a partir de la ecuación de forma reducida,
yit = (In ÿ ÿW)ÿ1(xitÿ + ÿi).
full calcula los valores pronosticados basándose en el conjunto de información completo. Esta opción está disponible
capaz solo con modelo(sac).
Machine Translated by Google
limited calcula los valores predichos en función del conjunto de información limitada. Esta opción está
disponible solo con modelo(sac).
ingenuo calcula los valores predichos en función de los valores observados de yit = ÿWyit+xitÿ+ÿi.
a estima ÿi, la FE o la RE. Con los modelos FE , esta estadística solo se permite con
tipo (ind).
4 ejemplos
4.1 Datos simulados
En esta sección, usamos datos simulados para ilustrar las capacidades de estimación del comando xsmle,
centrándonos en la selección, predicción y estimación del modelo en presencia de datos faltantes.9 En
particular, consideramos el siguiente modelo FE SDM ,
norte norte
donde los parámetros molestos (ÿi) se extraen de una variable aleatoria gaussiana estándar independiente
e idénticamente distribuida (iid). Para permitir la dependencia entre los efectos específicos de la unidad y
los regresores, generamos estos últimos de la siguiente manera,
donde zkit es gaussiana estándar con k = 1, 2, 3. El tamaño de la muestra se establece en 940 (n = 188 y
T = 5) observaciones.10
Comencemos importando una matriz de contigüidad espacial de primer orden de las autoridades
sanitarias locales italianas utilizando el comando spmat:
. utilice ASL_contiguity_mat_ns.dta
. spmat dta WW*, reemplazar
El comando spmat dta permite a los usuarios almacenar un objeto spmat llamado W en la memoria de
Stata. Tenga en cuenta que, para ajustar un modelo usando xsmle, se debe usar la matriz de ponderación
espacial como una matriz de Stata o un objeto spmat. La siguiente entrada spmat permite a los usuarios
resumir fácilmente el objeto W:
9. Informamos el código utilizado para cada ejemplo en el archivo adjunto sj Examples simdata.do.
10. La dimensión de la sección transversal elegida (n = 188) depende de la dimensión del peso utilizado
matriz, una matriz de contigüidad de las autoridades sanitarias locales italianas.
Machine Translated by Google
Matriz Descripción
Dimensiones 188x188
Almacenado como 188x188
Enlaces
total 906
min 1
significar 4.819149
máximo 13
Como se puede observar, la matriz espacial importada consta de 188 unidades transversales con
al menos 1 vecino, con unas 4,8 unidades contiguas en promedio. Porque xsmle no
hacer esta transformación automáticamente, el siguiente paso consiste en la normalización de filas
del objeto W. Esto se puede realizar fácilmente usando lo siguiente:
. xtset id t
variable del panel: id (fuertemente balanceada)
tiempo variable: t, 1 a 5
delta: 1 unidad
Log-verosimilitud = -1204.1194
Principal
x1 .5456416 .034473 15,83 0,000 -7,86 .4780758 .6132075
x2 -.2798453 .0356246 -.1896873 0,000 -5,32 0,000 -.3496683 -.2100224
x3 .0356751 -.2596093 -.1197654
Ancho x
Espacial
ro .2274947 .0425135 5.35 0.000 .1441699 .3108196
Diferencia
sigma2_e .7500305 .0347637 21.58 0.000 .6818948 .8181661
Machine Translated by Google
Cuando se especifica la opción fe, xsmle ajusta un modelo con una FE específica de la unidad. Esto
significa que, en el ejemplo anterior, podríamos omitir la opción type(ind).11 Esta última permite a los
usuarios especificar formas alternativas para FE: type(time) permite FE de tiempo, mientras que
type(both) especifica tanto tiempo como tiempo. unidad FE. En el caso de SDM, xsmle también permite
a los usuarios especificar un conjunto diferente de variables explicativas retrasadas espacialmente a
través de la opción durbin(varlist). Como informa el mensaje de advertencia, el valor predeterminado es
retrasar todas las variables independientes en varlist.
Para simplificar la tarea de producir tablas con calidad de publicación, los informes xsmle etiquetan
los resultados de la estimación. La ecuación principal contiene el vector ÿ, la ecuación Wx informa (solo
para SDM) el vector ÿ, la ecuación espacial informa los coeficientes espaciales (en este caso, ÿ) y la
ecuación de varianza informa los parámetros auxiliares como la varianza del error (ÿ2 en este caso).12
Incluso si ya sabemos que FE SDM se especifica correctamente en este ejemplo, podríamos estar
interesados en probar la idoneidad de una variante RE utilizando el comando oficial Stata hausman:
11. La opción nolog rara vez se usa y permite a los usuarios omitir la visualización del registro de iteración de la función de
probabilidad de registro. xsmle permite a los usuarios utilizar todas las opciones de maximización disponibles para los comandos
de estimación de ml (consulte la ayuda para maximizar), además de las opciones adicionales de postpuntuación y posthessian,
que informan la puntuación y la hessian como una matriz e(). Tenga en cuenta que el límite habitual para la dimensión de la
matriz se aplica en este caso.
12. Tenga en cuenta que para modelos que no sean SDM, las ecuaciones auxiliares serán diferentes según la parametrización
específica utilizada.
Machine Translated by Google
Log-verosimilitud = -1461.5464
Principal
x1 .6278704 .0383441 -.1595226 16,37 0,000 -3,96 .5527173 .7030236
x2 .0402597 -.0807422 .0400913 0,000 -2,01 0,044 -.2384301 -.0806151
x3 .0214849 .0669073 0,32 0,748 -.1593197 -.0021648
_contras -.109651 .1526208
Ancho x
Espacial
ro .2558274 .040904 6.25 0.000 .175657 .3359977
Diferencia
lgt_theta -.0751917 .1284863 .9648846 -0,59 0,558 18,73 -.3270202 .1766369
sigma2_e .0515123 0,000 .8639224 1.065847
comp1
x1 .5456416 .6278704 -.0822288 .
x2 -.2798453 -.1595226 -.1203227 .
x3 -.1896873 -.0807422 -.1089451 .
comp2
x1 .3093954 .3042129 .0051825 .
x2 .5063665 .5215032 -.0151366 .
x3 .9072591 .9631849 -.0559257 .
comp3
ro .2274947 .2558274 -.0283326 .011587
Machine Translated by Google
En este ejemplo, la estadística de Hausman no cumple con sus supuestos asintóticos. Este
El problema se puede solucionar agregando la opción hausman al comando de estimación:
... estimación del modelo de efectos aleatorios para realizar la prueba de Hausman
SDM con efectos fijos espaciales Variable de Número de observaciones = 940
Log-verosimilitud = -1204.1194
Principal
x1 .5456416 .034473 -.2798453 15,83 0,000 -7,86 .4780758 .6132075
.0356246 -.1896873 .0356751 0,000 -5,32 0,000 -.3496683 -.2100224
x2x3 -.2596093 -.1197654
Ancho x
Espacial
ro .2274947 .0425135 5.35 0.000 .1441699 .3108196
Diferencia
sigma2_e .7500305 .0347637 21.58 0.000 .6818948 .8181661
Como era de esperar, en este caso, rechazamos fuertemente la hipótesis nula, con una prueba de ÿ2
estadístico igual a 91,10 y un valor de p inferior al 1%. Tenga en cuenta que, si se especifica, el hausman
La opción detecta automáticamente el modelo alternativo, que en nuestro ejemplo es el RE.
Otra tarea común que realizan rutinariamente los profesionales espaciales es la selección de
modelos. Siguiendo la estrategia descrita en LeSage y Pace (2009) y Elhorst (2010b),
los investigadores deben comenzar con el SDM como una especificación general y probar las alternativas.
Es decir, ajustamos un SDM pero nos gustaría saber si es el mejor modelo para
los datos a la mano. Este tipo de procedimiento se puede implementar fácilmente usando xsmle. Para
Machine Translated by Google
Por ejemplo, uno puede estar interesado en probar las especificaciones SAR o SEM . Porque el
SDM se puede derivar fácilmente a partir de un SEM, uno puede mostrar fácilmente que si ÿ = 0 y
ÿ = 0, el modelo es un SAR, mientras que si ÿ = ÿÿÿ, el modelo es un SEM. Después de la estimación
del SDM, estas pruebas se pueden realizar explotando el xsmle "etiquetado con ecuaciones"
vector de coeficientes estimados y utilizando los comandos oficiales test y testnl de Stata
como sigue:
Finalmente, debido a que SAC y SDM no están anidados, se pueden usar criterios de información
para probar si el modelo más adecuado es el SAC utilizando lo siguiente:
Log-verosimilitud = -1290.9574
Principal
x1 .4860935 .0415495 -.3332588 11,70 0,000 -9,00 .4046579 .5675291
x2 .0370124 -.3039008 .0371472 0,000 -8,18 0,000 -.4058019 -.2607158
x3 -.3767081 -.2310936
Espacial
rho -.134535 .1106866 .4760945 -1,22 0,224 5,42 -.3514768 .0824067
lambda .0877639 0,000 .3040804 .6481085
Diferencia
sigma2_e 1.073918 .0469018 22,90 0,000 .9819918 1.165844
. estado ic
En este caso, todas las pruebas apuntan hacia un FE SDM. Finalmente, uno puede estar interesado en el
postestimación de la FE o valores predichos de la variable de resultado. En la sección 4.1,
resumimos los predictores espaciales implementados en xsmle. Son los datos del panel
extensión de los predictores discutidos en Kelejian y Prucha (2007), que van desde
el predictor ingenuo subóptimo al predictor de información completa del error cuadrático medio
mínimo (MSE) eficiente . Aquí damos algunos ejemplos de la sintaxis de postestimación xsmle.
Por ejemplo, para posestimar la FE una vez que se ha ajustado un modelo espacial de FE , escribimos
. predecir alphahat, un
.4
.3
.2
.1
0
ÿ4 ÿ2 2 4
0x
Verdadero Estimado
El gráfico resultante se muestra en la figura 1. De manera similar, podemos obtener una forma reducida y
predicción ingenua de la variable de resultado utilizando (la gráfica resultante se muestra en la figura 2)
. predecir yhat_rform
(forma de opción asumida)
. predecir yhat_naive, ingenuo
. bidireccional (kdensidad y, lpatrón(punto) lancho(*2))
> (kdensidad yhat_rform, lpattern(guión))
> (kdensity yhat_naive), leyenda (fila (1) etiqueta (1 "Verdadero")
> label(2 "Forma reducida") label(3 "Ingenuo"))
Machine Translated by Google
ÿ5 0 5
X
Posestimación
para lo cual usamos la misma notación discutida en la sección 2. En este modelo, yit se
determina como
donde, para t = 1,...,T, wi. y mi. son las i-ésimas filas de W y M, xit es la i-ésima fila de
Xt, ÿit e it son los i-ésimos elementos de ÿt y t, ÿi es el i-ésimo elemento de ÿ, y wi.yt
y mi.ÿt denotan los i-ésimos elementos de los rezagos espaciales Wyt y Mÿt con wi.yt que
no incluye yit. Haciendo las mismas suposiciones de Kelejian y Prucha (2007),
tenemos (ver Kelejian y Prucha [2007] para más detalles sobre los supuestos del modelo)
ÿt ÿ N (0, ÿ2 ÿÿt )
yt ÿ N (ÿt, ÿ2 ÿyt )
Machine Translated by Google
con
ÿ1 = {Xt,W} ÿ2 =
{Xt,W, wi.yt} ÿ3 = {Xt,W,
yt,ÿ1}, t = 1,...,T
donde ÿ3 es el conjunto de información completa que contiene todas las n ÿ 1 observaciones sobre yt y
ÿ1 y ÿ2 son ambos subconjuntos de ÿ3. Consideramos los siguientes cuatro predictores de yit (denotados
como
eso
y(p) ..., 4),13 con p = 1
y(1)
eso = E(yit|ÿ1)
ÿ1
= (yo ÿ ÿW) i. (Xtÿ + ÿ)
y(2)
eso
= E(yit|ÿ2)
cov(ÿit, wi.yt)
ÿwi.yt + xitÿ + ÿi + var(wi.yt) {wi.yt ÿ E(wi.yt)} =
y(3)
eso = E(yit|ÿ3) =
ÿ1
ÿwi.yt + xitÿ + ÿi + cov(ÿit, yt,ÿi) {VC(yt,ÿi)} = ÿwi.yt + xitÿ {yt,ÿi ÿ E(yt,ÿi)}
y(4)
eso + ÿi
donde
ÿ1
En las expresiones anteriores, (I ÿ ÿW)i.y ÿÿt y ÿÿt
, respectivamente,
i. denote las i-ésimas
mientrasfilas
que de
St,ÿi
(I ÿesÿW)ÿ1
la
matriz selectora n ÿ 1 ×
ésima fila de I. n idéntica a la matriz identidad n × n I , excepto que se elimina la i-
norte
donde los parámetros molestos, ÿi, se extraen de una variable aleatoria gaussiana estándar iid,
mientras que el regresor x1it se genera de acuerdo con (3). La simulación se basa en lo que Kelejian
y Prucha (2007) describen como la matriz de peso “dos adelante y dos atrás”, en la que cada unidad
está directamente relacionada con las dos unidades inmediatamente posteriores e inmediatamente
anteriores en el ordenamiento. La matriz está normalizada por filas y todos sus elementos distintos de
cero son iguales a 1/4.14 Como en Kelejian y Prucha (2007), reportamos resultados para 25
combinaciones de ÿ, ÿ = ÿ0.9, ÿ0.4, 0, 0.4, 0.9 y establezca ÿ2 = 1. El tamaño de la muestra se
establece en 500 (n = 100 y T = 5) observaciones. Tenga en cuenta que cuando ÿ = 0, los resultados
se refieren al SEM.
14. Ver Kelejian y Prucha (2007) para más detalles sobre la estructura de esta matriz de ponderación. Claramente,
los resultados reportados aquí dependen de la estructura de esta matriz.
15. Debido a que el predictor de forma reducida tiene, por mucho, el peor desempeño, no informamos sus resultados.
Machine Translated by Google
Como ya se mencionó en la sección 2.1, una característica peculiar de los modelos de regresión espacial es la
proceso de retroalimentación entre unidades correlacionadas espacialmente, lo que conduce a la distinción entre
efectos marginales directos, indirectos y totales. Para mostrar cómo calcular estos efectos usando
xsmle, consideremos el proceso de generación de datos del siguiente FE SDM dinámico
modelo,
norte norte
donde, en cuanto al proceso de generación de datos informado en (2), los parámetros molestos son
extraída de una variable aleatoria gaussiana estándar iid y la correlación entre
Los efectos y regresores específicos de la unidad se obtienen de acuerdo con (3). El tamaño de la muestra se establece
a 1.960 observaciones (n = 196 y T = 10) y ÿ = ÿ = 0,3.16
SDM dinámico con efectos fijos espaciales Variable de Número de observaciones = 1764
Log-verosimilitud = -2396.3051
Principal
y
L1. .278483 .0187886 14.82 0.000 .2416579 .315308
Wy
L1. .3371464 .0312009 10.81 0.000 .2759938 .3982989
Ancho x
Espacial
ro .152554 .0287441 5.31 0.000 .0962165 .2088915
Diferencia
sigma2_e .9612217 .0291937 32.93 0.000 .9040031 1.01844
SR_directo
x1 .4920234 .0251053 19,60 0,000 .4428179 .541229
x2 -,2567458 ,0253696 -10,12 0,000 -,1435512 ,0251039 -.3064693 -.2070222
x3 -5,72 0,000 -.1927539 -.0943484
16. Agradecemos a Jihai Yu por compartir su código MATLAB para crear la matriz de ponderaciones espaciales de la torre.
utilizado en este ejemplo. El código original ha sido traducido a Mata para nuestros propósitos (ver el
adjunto sj ejemplos simdata.do archivo para más detalles).
17. dlag(1) permite la estimación de (6), en la que ÿ = 0, mientras que dlag(2) es el caso en el que ÿ = 0.
Machine Translated by Google
SR_Indirecto
x1 .4867733 .0582277 .5859261 8,36 0,000 9,69 .372649 .6008975
x2 .0604524 0,000 17,06 0,000 .4674416 .7044107
x3 1.052221 .0616699 .9313501 1.173092
SR_Total
x1 .9787967 .0683064 .3291804 14,33 0,000 4,83 .8449185 1.112675
x2 .0681426 .9086697 .0672656 0,000 13,51 0,000 .1956234 .4627374
x3 .7768315 1.040508
LR_directo
x1 .8954026 .0504489 -.2565021 17,75 0,000 -5,77 .7965245 .9942807
x2 .0444616 .0384557 .0470276 0,000 -.3436452 -.1693589
x3 0,82 0,414 -.0537168 .1306282
LR_Indirecto
x1 2.750811 .4462418 1.485876 6,16 0,000 5,41 1.876193 3.625428
x2 .2744933 3.352583 .4749726 0,000 7,06 0,000 .9478791 2.023873
x3 2.421653 4.283512
LR_Total
x1 3.646213 .4830534 1.229374 7,55 0,000 4,06 2.699446 4.59298
x2 .3028385 3.391038 .5056929 0,000 6,71 0,000 .6358214 1.822927
x3 2.399898 4.382178
Los efectos totales a corto plazo se pueden obtener a través de márgenes usando la siguiente sintaxis:
método delta
dy/dx Est. Errar. z P>|z| [95% de conf. Intervalo]
18. Los nombres de las ecuaciones siguen la terminología de Elhorst (2014) sobre los efectos marginales a corto y largo plazo.
Machine Translated by Google
Para garantizar que los márgenes funcionen, agregamos la opción de postestimación xsmle de noie a través de
la opción predict() de los márgenes. Como puede verse, los dos procedimientos producen ligeras
resultados diferentes. Esto se debe a que xsmle, por defecto, usa el procedimiento de Monte Carlo
descrito en LeSage y Pace (2009). Por lo tanto, las estimaciones puntuales (errores estándar) son
promedios (desviaciones estándar) sobre las (predeterminadas) 500 réplicas de Monte Carlo. Él
Se pueden obtener las mismas estimaciones puntuales usando xsmle con la opción vceeffects(none).19
dsdm_fe
b
SR_Total
x1 .9699528
x2 .3283914
x3 .9068859
Debido a que las fórmulas analíticas para los efectos directos, indirectos y totales informados en
la tabla 2 implica una especificación lineal (en variables), xsmle suprime el cálculo de
estos efectos cuando se especifican variables de factor, como se muestra en el siguiente ejemplo:
Advertencia: los efectos directos e indirectos no se pueden calcular si las variables factoriales
se especifica la opción -efectos- ignorados. Observe que los efectos totales
se puede obtener usando -margins
Log-verosimilitud = -2389.1429
Principal
y
L1. .282856 .0187596 15.08 0.000 .2460878 .3196242
Wy
L1. .3418741 .0311604 10.97 0.000 .2808008 .4029474
Ancho x
Espacial
ro .1509144 .0287019 5.26 0.000 .0946597 .2071691
Diferencia
sigma2_e .9534039 .0289549 32.93 0.000 .8966533 1.010154
método delta
dy/dx Est. Errar. z P>|z| [95% de conf. Intervalo]
xsmle también ofrece la oportunidad de calcular errores estándar usando el método Delta
a través de la opción vceeffetcs(dm).20
SDM dinámico con efectos fijos espaciales Variable de Número de observaciones = 1764
Log-verosimilitud = -2396.3051
Principal
y
L1. .278483 .0187886 14.82 0.000 .2416579 .315308
Wy
L1. .3371464 .0312009 10.81 0.000 .2759938 .3982989
Ancho x
Espacial
ro .152554 .0287441 5.31 0.000 .0962165 .2088915
Diferencia
sigma2_e .9612217 .0291937 32.93 0.000 .9040031 1.01844
SR_directo
x1 .4889378 .0262506 -.2566706 18,63 0,000 -9,79 .4374875 .5403881
x2 .0262086 -.144119 .02613 0,000 -5,52 0,000 -.3080385 -.2053026
x3 -.1953328 -.0929052
SR_Indirecto
x1 .481015 .058585 8,21 0,000 10,08 .3661905 .5958395
x2 .585062 .0580324 0,000 16,67 0,000 .4713206 .6988034
x3 1.051005 .0630431 .9274428 1.174567
20. Si bien el uso del método Delta garantiza que los resultados no dependan de la variabilidad estocástica, es una
procedimiento más intensivo computacionalmente.
Machine Translated by Google
SR_Total
x1 .9699528 .0681065 .3283914 14,24 0,000 4,91 .8364665 1.103439
x2 .0669413 .9068859 .0712236 0,000 12,73 0,000 .1971888 .459594
x3 .7672903 1.046481
LR_directo
x1 .8860048 .0680006 -.25736 13,03 0,000 -5,45 .7527261 1.019283
x2 .0472579 .0347029 .0566012 0,000 0,61 0,540 -.3499839 -.1647362
x3 -.0762334 .1456392
LR_Indirecto
x1 2.659826 .5536009 1.457852 4,80 0,000 5,12 1.574789 3.744864
x2 .2844823 3.280576 .5347181 0,000 6,14 0,000 .9002767 2.015427
x3 2.232548 4.328604
LR_Total
x1 3.545831 .6090295 1.200492 5,82 0,000 3,81 2.352155 4.739507
x2 .3154343 3.315279 .5776118 0,000 5,74 0,000 .582252 1.818732
x3 2.183181 4.447377
Paneles desequilibrados
Los datos faltantes pueden plantear problemas importantes al ajustar modelos econométricos porque es
es poco probable que los valores perdidos falten completamente al azar. Lo más importante aquí es
que xsmle generalmente no puede manejar paneles desequilibrados. Una estrategia para abordar este problema
sin depender de enfoques econométricos más complejos es por imputación múltiple,
es decir, el proceso de reemplazar valores perdidos por múltiples conjuntos de valores plausibles. Este
La sección proporciona un ejemplo simple en el que xsmle se usa junto con mi, la suite de Stata
de comandos que se ocupan de la imputación de datos múltiples, para superar el obstáculo. Nos deja
considere el mismo proceso de generación de datos informado en (2). La siguiente sintaxis permite
usuarios para asignar aleatoriamente 5% de valores faltantes a la covariable x1it :21
El primer paso es declarar el conjunto de datos como un conjunto de datos mi usando mi set. Los datos deben ser
mi set antes de que se puedan usar otros comandos mi. En este ejemplo, elegimos el ancho
estilo. El segundo paso es registrar (declarar) las variables con valores faltantes usando
el comando mi registro:
. mi juego de ancho
. mi registro imputado x1
21. Como de costumbre, una buena práctica para obtener resultados reproducibles es establecer la semilla del pseudoaleatorio de Stata
generador de números usando el comando set seed #, donde # es cualquier número entre 0 y 231 ÿ 1.
Machine Translated by Google
Luego usamos mi impute regress para completar los valores faltantes de x1 usando el
método de regresión lineal con la covariable z como predictor.22 La opción add(50) especifica
el número de imputaciones a sumar (actualmente, el número total de imputaciones
no puede exceder de 1.000).
Observaciones por m
x1 891 49 49 940
. mi estimación, publicación de puntos: xsmle y x1 x2 x3, wmat (W) modelo (sdm) fe tipo (ind) nolog
Imputaciones (50):
.........10.........20.........30.........40.........50 hecho
= 50
Estimaciones de imputación múltiple imputaciones
Número de obs. = 940
SDM con efectos fijos espaciales
= 0.0452
IVR promedio
= 0.1304
FMI más grande
Ajuste DF: muestra grande DF: min = 2.908,95
promedio = 126.717,41
máximo = 516.684,95
Prueba del modelo F: FMI igual F( 8,205401.9) = Problema > 130.14
OMI F = 0.0000
Dentro del tipo de VCE:
Principal
x1 .509667 .0367065 -.2737751 13,88 0,000 -7,52 .4377079 .581626
x2 .0363977 -.1947675 .036523 0,000 -5,33 0,000 -.3451134 -.2024368
x3 -.2663518 -.1231832
Ancho x
Espacial
ro .2471005 .042971 5.75 0.000 .1628754 .3313257
Diferencia
sigma2_e .7751222 .0364928 21.24 0.000 .7035961 .8466484
22. Consulte la ayuda mi imputación para obtener detalles sobre los métodos de imputación disponibles. La covariable z es un estándar
Variable aleatoria gaussiana diseñada específicamente para ser correlacionada con x1. Ver el código informado en
el archivo sj Examples simdata.do para más detalles.
Machine Translated by Google
explotar xsmle para ajustar el FE SDM utilizando las 50 versiones imputadas de la variable x1.
De esta forma, tanto los coeficientes como los errores estándar se ajustarán por la variabilidad entre
imputaciones según las reglas de combinación dadas en Rubin (1987). Nosotros
repitió el mismo ejercicio asignando (al azar) un porcentaje más alto (10% y
20%) de valores faltantes a la covariable x1. Para ofrecer un ejemplo en el que los múltiples
La estrategia de imputación afecta directamente el valor del parámetro ÿ, usamos la misma estrategia,
asignando 5%, 10% y 20% de valores perdidos a la variable dependiente.23
El panel superior de la tabla 4 informa los resultados para el caso en el que x1 es el que falta .
variable. Como era de esperar, el sesgo que afecta el parámetro ÿ1 aumenta cuando el número de
los valores imputados crecen. Lo mismo es cierto para el parámetro ÿ cuando los valores faltantes son
en la variable dependiente (panel inferior de la tabla 4). Tenga en cuenta que incluso si estos no son los
resultados de una simulación de Monte Carlo, el efecto de los valores faltantes es aparentemente más fuerte
en ÿ que ÿ1.
Falta x1
te falta
23. Los lectores interesados pueden encontrar el código Stata relacionado en los ejemplos sj adjuntos simdata.do
expediente.
24. Los lectores interesados pueden encontrar el código de Stata y los datos utilizados para esta aplicación en el adjunto
sj empírico application.do, wstate rook.spmat y archivos dbf.dta espaciales de estado.
Machine Translated by Google
• Los precios relativos en los estados vecinos pueden influir en las decisiones sobre la ubicación de las
actividades económicas y, posteriormente, de la residencia. Los precios de la electricidad en California
son altos en comparación con los precios en el Noroeste y partes del Medio Oeste, pero uno esperaría
que las decisiones de ubicación y, por lo tanto, la demanda de electricidad estén más fuertemente
influenciadas por los precios en el Noroeste que en el Medio Oeste.
En términos de modelado, este comportamiento puede manifestarse como un coeficiente significativo en
los precios ponderados espacialmente o en la variable dependiente espacialmente rezagada.
• Tanto las variables meteorológicas como las climáticas pueden servir como sustitutos de las influencias
regionales a corto y largo plazo sobre la ubicación de la actividad económica, la eficiencia energética de
los edificios y otros determinantes del uso de la electricidad. Dado el stock de capital físico, las variaciones
anuales del clima afectarán la demanda de electricidad para aire acondicionado o calefacción. Por lo
tanto, es interesante determinar si las variables climáticas locales o regionales tienen una influencia
estadísticamente distinta en la demanda de electricidad.
Tenga en cuenta que la lógica que sugiere un papel para las influencias espaciales en la demanda de
electricidad en cada estado no implica interacciones espaciales directas para la variable dependiente, como en
los casos en los que se argumenta que las decisiones de política en un estado, por ejemplo, los impuestos sobre
la propiedad, están influenciadas. por decisiones tomadas por estados vecinos. En cambio, los argumentos
reflejan una combinación de variables omitidas que pueden estar correlacionadas espacialmente más la influencia
distribuida espacialmente de variables que estarían incluidas en cualquier modelo de demanda de electricidad.
Las tablas 5 a 7 resumen los resultados obtenidos cuando se utilizan modelos FE para examinar la demanda
residencial de electricidad utilizando el logaritmo del consumo residencial por persona como variable dependiente.
Elhorst y otros argumentan que los modelos FE son más apropiados para dichos datos porque la muestra
representa la población completa de los estados continentales de EE. UU. en lugar de una muestra aleatoria
extraída de esa población. Esta afirmación está respaldada por la evidencia proporcionada en las dos últimas
líneas de la tabla 5, donde todas las especificaciones de RE estáticas son fuertemente rechazadas por la prueba
de Hausman. Los modelos no brindan un análisis integral de los factores que pueden influir en la demanda, pero
se refinaron para centrarse en las variables clave que explican los cambios en la demanda de electricidad durante
las últimas dos décadas. Para el consumo residencial, las grandes diferencias entre los estadísticos intra y entre
R2 , excepto para los modelos que incluyen la variable dependiente rezagada (en el tiempo), confirman la
importancia del estado FE asociado a variables que no están incluidas en el análisis o que no se puede identificar
en esta especificación. No obstante, las estadísticas dentro de R2 , al menos igual a 0,82, muestran que los
modelos pueden explicar una gran proporción de la variación en el tiempo en el consumo de electricidad para
uso residencial por estado. Las variables meteorológicas, tanto los grados día de calefacción como los de
refrigeración, tienen una influencia importante en el consumo residencial, al igual que el tamaño del parque de
viviendas.25
25. Probamos medidas alternativas de ingresos; el mejor indicador parece ser el ingreso personal disponible
ajustado por las diferencias en el costo de vida entre los estados (utilizando el índice de costo de vida
ACCRA) y por los cambios en el IPC a lo largo del tiempo.
Niveles
de
significación:
* valor
pde
Hausman Hausman
ÿ2 R2R2bR2w Probabilidad
de
registro
Observaciones Precio
total
medio
real ÿ Ingreso
personal
real
Precio
residencial
promedio
real
Unidades
de
vivienda
Grados
día
de
refrigeración
Grados
día
de
calefacción
L.Residencial
consumo
de
electricidad
p<
5%,
y***
p<
10%,
**
2029.91
0,82
0,12
0,18 0,391***
1,019***
0,075***
0,188***
ÿ0,235***
1078
FE
Tabla
5.
Modelos
FE
para
demanda
eléctrica
residencial
2108.54
pag
<
1% 0,82
0,14
0,20
0,00
28,24 0.367*** 0,203***
0,747***
0,057***
0,140***
ÿ0,239***
1078 RAE
2315.67 SAR
dinámico
0,89
0,91 0,554***
0,261*** 0,150*
0,073***
0,146***
ÿ0,144*** 0.033
1029
0,165***
2144,51
0,85
0,16
0,22
0,00
27,33 0.416*** 0,212***
0,629***
0,057***
0,131***
ÿ0,293*** SDM
1078
2323.58 SDM
dinámico
0,89
0,91
0,90 0.057** 0,534***
0,284*** 0,128*
0,072***
0,140***
ÿ0,165*** 0.039
1029
2071.08
1078
0,82
0,21
0,26
0,00
33,19 0.390*** 0,375***
0,818***
0,071***
0,156***
ÿ0,271*** SEM
2108.58
0,82
0,14
0,20 0,359***
0,018 0,207***
0,748***
0,057***
0,141***
ÿ0,241***
1078 SACO
Modelos de datos de panel espacial usando Stata 174
Machine Translated by Google
Machine Translated by Google
ÿ2 valor p de akaike
criterio de información
dinámica dinámica
RAE RAE SDM SDM SACO
Renta personal real 0,110*** Precio residencial medio 0.095 0,141*** 0,121* ÿ0,194*** 0.109***
real ÿ0,130*** ÿ0,417** Unidades de vivienda 0,406*** 0,031*** Grados ÿ0,508** 0,417*** 0,038*** ÿ0,126**
día de refrigeración Grados día de calefacción
medio real Precio 0,435*
0,076*** total 0,087*** 0,262*** 0,394 0.393*
0,211*** 0,221*** 0.030*
0,424** 0,429** 0.074*
0,285*
Una de las razones para estudiar tales modelos es ajustar las elasticidades precio de la demanda.
En la especificación no espacial, la elasticidad es simplemente el coeficiente del precio del logaritmo.
Como se discutió en la sección 2, el efecto marginal del precio en la demanda de electricidad puede
diferir entre estados debido a las interacciones espaciales. La diferencia clave entre los impactos
directos y totales es que el impacto directo mide el impacto de un cambio de unidad en la variable xk
en el estado i en demanda en el estado i promediado sobre todos los estados. Por el contrario, el
impacto total mide el impacto del mismo cambio unitario en la variable xk en todos los estados a
pedido en el estado i, nuevamente promediado para todos los estados. xsmle muestra valores para el
impacto directo, indirecto y total de los cambios en cada una de las variables independientes. A
diferencia de los valores informados en la tabla 5, la tabla 7 informa elasticidades que representan la
retroalimentación espacial. Además, para las especificaciones dinámicas de SAR y SDM , el cuadro 7
también distingue entre efectos marginales de corto y largo plazo. Tenga en cuenta que los efectos
marginales en los modelos estáticos se han etiquetado como de largo plazo, pero deben compararse
con los efectos de corto plazo de los modelos dinámicos (consulte la tabla 2). Estos resultados
adicionales son consistentes en todas las especificaciones espaciales, siendo los controles
significativos y con los signos esperados. La inclusión de la variable dependiente desfasada en el
tiempo hace que el coeficiente del ingreso personal real deje de ser significativo y reduce en gran
medida la elasticidad del consumo residencial con respecto a los demás controles.
Machine Translated by Google
5. Conclusiones
En este artículo, describimos el nuevo comando xsmle, que se puede usar para ajustar una amplia
variedad de modelos espaciales para datos de panel. xsmle admite matrices de peso en forma de
matrices de Stata y objetos spmat, permite el cálculo de efectos directos, indirectos y totales y errores
estándar relacionados, y proporciona varias funciones de estimación posterior para obtener predicciones,
incluido el uso de márgenes. Además, xsmle es totalmente compatible con el conjunto de comandos mi
Stata. Utilizamos datos simulados para ilustrar las capacidades de estimación de xsmle, centrándonos
en la selección, predicción y estimación del modelo en presencia de datos faltantes, y proporcionamos
una aplicación empírica basada en datos de uso de electricidad a nivel estatal en los Estados Unidos.
6 Agradecimientos
Nos gustaría agradecer, en particular, a Paul Elhorst y Michael Pfaffermayr por permitirnos usar su
código MATLAB . Para la mayoría de las rutinas, hemos modificado o ampliado la forma en que operan
las rutinas, por lo que no deben hacerse responsables de los errores que pueda haber en nuestro código.
7. Referencias
Angrist, JD y J.-S. Pischke. 2009. Econometría mayormente inofensiva: el compañero de un empirista.
Princeton, Nueva Jersey: Princeton University Press.
Driscoll, JC y AC Kraay. 1998. Estimación de matriz de covarianza consistente con datos de panel
espacialmente dependientes. Revisión de Economía y Estadística 80: 549–560.
Drukker, DM, H. Peng, IR Prucha y R. Raciborski. 2013. Creación y gestión de matrices de ponderación
espacial con el comando spmat. Diario de Stata 13: 242–286.
Drukker, DM, IR Prucha y R. Raciborski. 2013a. Un comando para estimar modelos autorregresivos
espaciales con perturbaciones autorregresivas espaciales y variables endógenas adicionales. Diario
de Stata 13: 287–301.
Elhorst, JP 2010a. Modelos de datos de panel espacial. En Handbook of Applied Spatial Analysis:
Software Tools, Methods and Applications, ed. MM Fischer y A. Getis, 377–408. Berlín: Springer.
Machine Translated by Google
Hoechle, D. 2007. Errores estándar robustos para regresiones de panel con dependencia
transversal. Diario de Stata 7: 281–312.
Jeanty, PW 2010. spwmatrix: módulo de Stata para generar, importar y exportar ponderaciones
espaciales. Componentes de software estadístico 457111, Departamento de Economía, Boston
College. https://ideas.repec.org/c/boc/bocode/s457111.html.
Kostov, P. 2009. Un modelo hedónico de regresión cuantil espacial de precios de tierras agrícolas.
Análisis económico espacial 4: 53–72.
Lee, L.-F. y J. Yu. 2010. Estimación de modelos de datos de panel autorregresivos espaciales con
efectos fijos Revista de Econometría 154: 165–185.
LeSage, J. y RK Pace. 2009. Introducción a la Econometría Espacial. Boca Ratón, Florida: Chapman
& Hall/CRC.
Moscone, F. y M. Knapp. 2005. Explorando el patrón espacial del gasto en salud mental. Revista
de política y economía de la salud mental 8: 205–217.
Moscone, F., E. Tosetti y G. Vittadini. 2012. Interacción social en la elección de hospital de los
pacientes: Evidencia de Italia. Revista de la Royal Statistical Society, Serie A 175: 453–472.
Oll´e, AS 2003. Rendición de cuentas electoral y mimetismo fiscal: Los efectos de los márgenes
electorales, el gobierno de coalición y la ideología. Revista Europea de Economía Política 19:
685–713.
Machine Translated by Google
Pisati, M. 2001. sg162: Herramientas para el análisis de datos espaciales. Boletín técnico de Stata 60: 21–
37. Reimpreso en Stata Technical Bulletin Reprints, vol. 10, págs. 277–298. College Station, Texas:
Stata Press.
Revelli, F. 2005. Sobre la empírica espacial de las finanzas públicas. Impuestos Internacionales y Públicos
Finanzas 12: 475–492.
Rubin, DB 1987. Imputación múltiple por falta de respuesta en encuestas. Nueva York: Wiley.
Tobler, WR 1970. Una película de computadora que simula el crecimiento urbano en la región de Detroit.
Geografía Económica 46: 234–240.
Yu, J., R. de Jong y L.-F. Sotavento. 2008. Estimadores de verosimilitud casi máxima para datos de panel
dinámicos espaciales con efectos fijos cuando tanto n como T son grandes. Revista de Econometría
146: 118–134.
Andrea Piano Mortari es investigador del Consejo Nacional de Investigación, Instituto de Investigación
sobre Población y Políticas Sociales, y miembro del Centro de Economía y Estudios Internacionales
(Universidad de Roma Tor Vergata).
Machine Translated by Google