datos espaciales Ral Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3 Reunin Espaola de Usuarios de STATA 2010 2 Estructura de la presentacin
STATA como herramienta para el anlisis de datos espaciales: procedimientos disponibles
Desarrollos en curso: Matriz de pesos espaciales Sobre la introduccin de retardos espaciales de las variables explicativas en modelos de regresin Sobre la visualizacin de los resultados del anlisis exploratorio espacial
Anlisis de datos espaciales 3 ssc install spmap ssc install shp2dta ssc install mif2dta Anlisis de datos espaciales Herramientas disponibles 4 net install sg162.pkg Anlisis de datos espaciales http://www.stata.com/products/stb/journals/stb60.pdf 5 Anlisis de datos espaciales Columbus Ohio http://www.rri.wvu.edu/WebBook/LeSage/spatial/anselin.html
http://www.rri.wvu.edu/WebBook/LeSage/spatial/aford.html 49 vecindarios del distrito de Columbus en Ohio (Estados Unidos)
Informacin para 1980 sobre: Precio de la vivienda Ingresos familiares Robos por cada 1000 viviendas
6 Anlisis de datos espaciales (43.299999,96.400002] (33.5,43.299999] (25.700001,33.5] [17.9,25.700001] (48.585487,68.892044] (34.000835,48.585487] (20.048504,34.000835] [.178269,20.048504] Precio de la vivienda Crimen
CRIME Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Root MSE = 11.435 R-squared = 0.5524 Prob > F = 0.0000 F( 2, 46) = 45.47 Linear regression Number of obs = 49 7 En el anlisis economtrico estndar, se supone que cada una de las observaciones analizadas es independiente del resto (hiptesis de no autocorrelacin).
Autocorrelacin espacial y/o retardos espaciales de las variables explicativas: matriz de pesos espaciales.
La matriz de pesos espaciales recoge la existencia de relaciones entre los territorios analizados. Existen diferentes especificaciones de dicha matriz. Anlisis de datos espaciales La matriz de pesos espaciales 8 Se han propuesto distintas especificaciones:
Contigidad (matriz de contactos binaria) Proximidad (matriz basada en distancias entre centroides o entre capitales) Flujos (matriz basada en movimientos de personas, mercancias, etc. asimtrica)
Es importante analizar la robustez de los resultados a distintas especificaciones de la matriz.
Anlisis de datos espaciales 9 Pero, los procedimientos existentes en STATA slo permiten trabajar con matrices binarias generadas manualmente por el usuario o matrices basadas en distancias (simtricas).
En otros programas como GEODA-PYSAL, MATLAB o R es posible generar y utilizar distintas matrices de manera muy simple (a partir del propio mapa). Sin embargo, estos programas no ofrecen la potencialidad de STATA en otros aspectos. Anlisis de datos espaciales 10 Anlisis de datos espaciales Geoda 11 Hemos desarrollado procedimientos que permiten importar matrices generadas desde estos programas, normalizarlas y utilizarlas con spatreg (aunque sean asimtricas por naturaleza como las obtenidas a partir del procedimiento K- nearest neighbours-)
gal2dta gwt2dta sparse2dta normw
Anlisis de datos espaciales 12 La existencia de autocorrelacin espacial en un modelo de regresin puede indicar la omisin de variables relevantes como retardos espaciales de alguna de las explicativas.
Sin embargo, los procedimientos existentes en STATA no permiten introducir de manera directa retardos de las variables, por lo que hemos desarrollado un procedimiento que permite hacerlo de manera muy sencilla.
slag Anlisis de datos espaciales Retardos espaciales de las variables explicativas 13 Anlisis de datos espaciales Visualizacin del anlisis exploratorio de datos espaciales Geoda Stata
CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -183.83993 Sigma = 10.24 Squared corr. = 0.601 Variance ratio = 0.562 Spatial error model Number of obs = 49 Row-standardized: SWMImpo Type: Name: W Weights matrix Iteration 4: log likelihood = -183.83993 Iteration 3: log likelihood = -183.83993 Iteration 2: log likelihood = -183.84089 Iteration 1: log likelihood = -183.93603 Iteration 0: log likelihood = -184.67541 rescale eq: log likelihood = -184.67541 rescale: log likelihood = -184.67541 initial: log likelihood = -184.67541 . spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error) 20 Anlisis de datos espaciales High-High Low-High Low-Low Non Significant Columbus Ohio. Source: Geoda LISA MAP. CRIME 1% 5% 10% Non Significant Columbus Ohio. Source: Geoda LISA SIGNIFICANCE MAP. CRIME 21 Los interesados en los procedimientos mencionados pueden contactar con nosotros a travs del correo electrnico en las siguientes direcciones: rramos@ub.edu, vroyuela@ub.edu
Existen otros procedimientos de inters en este mbito: anketest, usswm, chinaspatdwm, spmlreg,
y seguimos a la espera de la difusin de spmat, sarml y g2sls de David Drukker http://repec.org/snasug08/drukker_spatial.pdf Anlisis de datos espaciales