Está en la página 1de 21

Herramientas adicionales

en STATA para el anlisis de


datos espaciales
Ral Ramos y Vicente Royuela
AQR-IREA, Universitat de Barcelona
3 Reunin Espaola de
Usuarios de STATA 2010
2
Estructura de la presentacin

STATA como herramienta para el anlisis de datos
espaciales: procedimientos disponibles

Desarrollos en curso:
Matriz de pesos espaciales
Sobre la introduccin de retardos espaciales de las
variables explicativas en modelos de regresin
Sobre la visualizacin de los resultados del anlisis
exploratorio espacial

Anlisis de datos espaciales
3
ssc install spmap
ssc install shp2dta
ssc install mif2dta
Anlisis de datos espaciales
Herramientas disponibles
4
net install sg162.pkg
Anlisis de datos espaciales
http://www.stata.com/products/stb/journals/stb60.pdf
5
Anlisis de datos espaciales
Columbus Ohio
http://www.rri.wvu.edu/WebBook/LeSage/spatial/anselin.html

http://www.rri.wvu.edu/WebBook/LeSage/spatial/aford.html
49 vecindarios del distrito de Columbus en Ohio
(Estados Unidos)

Informacin para 1980 sobre:
Precio de la vivienda
Ingresos familiares
Robos por cada 1000 viviendas


6
Anlisis de datos espaciales
(43.299999,96.400002]
(33.5,43.299999]
(25.700001,33.5]
[17.9,25.700001]
(48.585487,68.892044]
(34.000835,48.585487]
(20.048504,34.000835]
[.178269,20.048504]
Precio de la vivienda
Crimen

_cons 68.61896 4.233089 16.21 0.000 60.09819 77.13973
INC -1.597311 .4609711 -3.47 0.001 -2.525197 -.6694242
HOVAL -.2739315 .1625712 -1.68 0.099 -.6011702 .0533073

CRIME Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

Root MSE = 11.435
R-squared = 0.5524
Prob > F = 0.0000
F( 2, 46) = 45.47
Linear regression Number of obs = 49
7
En el anlisis economtrico estndar, se supone que cada
una de las observaciones analizadas es independiente del
resto (hiptesis de no autocorrelacin).

Autocorrelacin espacial y/o retardos espaciales de
las variables explicativas: matriz de pesos espaciales.

La matriz de pesos espaciales recoge la existencia de
relaciones entre los territorios analizados. Existen
diferentes especificaciones de dicha matriz.
Anlisis de datos espaciales
La matriz de pesos espaciales
8
Se han propuesto distintas especificaciones:

Contigidad (matriz de contactos binaria)
Proximidad (matriz basada en distancias entre
centroides o entre capitales)
Flujos (matriz basada en movimientos de personas,
mercancias, etc. asimtrica)


Es importante analizar la robustez de los resultados a
distintas especificaciones de la matriz.

Anlisis de datos espaciales
9
Pero, los procedimientos existentes en STATA slo permiten
trabajar con matrices binarias generadas manualmente
por el usuario o matrices basadas en distancias
(simtricas).

En otros programas como GEODA-PYSAL, MATLAB o R es
posible generar y utilizar distintas matrices de manera
muy simple (a partir del propio mapa). Sin embargo,
estos programas no ofrecen la potencialidad de STATA en
otros aspectos.
Anlisis de datos espaciales
10
Anlisis de datos espaciales
Geoda
11
Hemos desarrollado procedimientos que permiten importar
matrices generadas desde estos programas, normalizarlas y
utilizarlas con spatreg (aunque sean asimtricas por
naturaleza como las obtenidas a partir del procedimiento K-
nearest neighbours-)


gal2dta gwt2dta sparse2dta normw


Anlisis de datos espaciales
12
La existencia de autocorrelacin espacial en un modelo de
regresin puede indicar la omisin de variables relevantes
como retardos espaciales de alguna de las explicativas.

Sin embargo, los procedimientos existentes en STATA no
permiten introducir de manera directa retardos de las
variables, por lo que hemos desarrollado un procedimiento
que permite hacerlo de manera muy sencilla.

slag
Anlisis de datos espaciales
Retardos espaciales de las variables explicativas
13
Anlisis de datos espaciales
Visualizacin del anlisis exploratorio de datos espaciales
Geoda
Stata




spatlsa2
Measures of local spatial autocorrelation
Weights matrix
--------------------------------------------------------------
Name: W1
Type: Imported (binary)
Row-standardized: No
--------------------------------------------------------------
Moran's Ii (CRIME)
-------------------------------------------------------------
Location | Ii E(Ii) sd(Ii) z p-value*
--------------------+-----------------------------------------
1 | 1.474 -0.042 1.381 1.097 0.136
2 | 1.586 -0.063 1.674 0.985 0.162
3 | 0.375 -0.083 1.912 0.240 0.405
14
Anlisis de datos espaciales
Matriz binaria de
contactos normalizada
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 .25 0 0
SWMImpo 0 0 0 0 0 0 .16666667
SWMImpo 0 0 0 0 0 0 .33333333
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 .25 0 0
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 .16666667 .16666667 0
SWMImpo 0 0 0 .2 .2 0 .2
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 .5 0 0
SWMImpo 0 0 .14285714 .14285714 0 .14285714 0
SWMImpo 0 .25 .25 0 .25 0 0
SWMImpo .25 .25 0 .25 .25 0 0
SWMImpo .33333333 0 .33333333 .33333333 0 0 0
SWMImpo 0 .5 .5 0 0 0 0
c1 c2 c3 c4 c5 c6 c7
W[49,49]
1
2
3
15
Anlisis de datos espaciales
Acceptable range for lambda: -1.531 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 5.815 (0.016)
Likelihood ratio test of lambda=0: chi2(1) = 8.127 (0.004)
Wald test of lambda=0: chi2(1) = 13.365 (0.000)

lambda .5484742 .1500262 3.66 0.000 .2544282 .8425201

_cons 60.37518 5.798748 10.41 0.000 49.00985 71.74052
INC -.9610433 .3704535 -2.59 0.009 -1.687119 -.2349678
HOVAL -.3031982 .0927166 -3.27 0.001 -.4849194 -.121477
CRIME

CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -183.31357 Sigma = 9.75
Squared corr. = 0.537
Variance ratio = 0.329
Spatial error model Number of obs = 49
Row-standardized: SWMImpo
Type:
Name: W
Weights matrix
Iteration 4: log likelihood = -183.31357
Iteration 3: log likelihood = -183.31357
Iteration 2: log likelihood = -183.31857
Iteration 1: log likelihood = -183.50365
Iteration 0: log likelihood = -187.42512
rescale eq: log likelihood = -187.42512
rescale: log likelihood = -187.42512
initial: log likelihood = -187.42512
. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)
16
Anlisis de datos espaciales
Acceptable range for lambda: -1.531 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 5.600 (0.018)
Likelihood ratio test of lambda=0: chi2(1) = 5.943 (0.015)
Wald test of lambda=0: chi2(1) = 7.422 (0.006)

lambda .4480536 .1644596 2.72 0.006 .1257187 .7703886

_cons 72.69648 9.01754 8.06 0.000 55.02242 90.37053
WHOVAL1 .0961597 .2040779 0.47 0.638 -.3038257 .4961451
WINC1 -1.041591 .5847625 -1.78 0.075 -2.187704 .1045227
INC -1.057194 .3242875 -3.26 0.001 -1.692786 -.4216026
HOVAL -.2774837 .0919551 -3.02 0.003 -.4577123 -.0972552
CRIME

CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -181.74271 Sigma = 9.60
Squared corr. = 0.597
Variance ratio = 0.524
Spatial error model Number of obs = 49
Row-standardized: SWMImpo
Type:
Name: W
Weights matrix
Iteration 5: log likelihood = -181.74271
Iteration 4: log likelihood = -181.74271
Iteration 3: log likelihood = -181.74275
Iteration 2: log likelihood = -181.76435
Iteration 1: log likelihood = -183.1555
Iteration 0: log likelihood = -184.85114
rescale eq: log likelihood = -184.85114
rescale: log likelihood = -184.85114
initial: log likelihood = -184.85114
. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)
17
Anlisis de datos espaciales
Matriz binaria de
contactos de primer
y segundo orden
normalizada
SWMImpo 0 0 0 0 .05263158 .05263158 0
SWMImpo 0 0 0 0 .04166667 .04166667 0
SWMImpo 0 0 0 0 .05555556 0 0
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 .05263158 .05263158 0
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 0 0 .04761905 .04761905 0
SWMImpo 0 0 0 0 0 0 .09090909
SWMImpo 0 0 0 0 .07142857 0 .07142857
SWMImpo 0 0 0 0 0 0 0
SWMImpo 0 0 .04761905 .04761905 .04761905 .04761905 .04761905
SWMImpo 0 0 .05 .05 .05 .05 0
SWMImpo 0 0 0 0 .08333333 0 .08333333
SWMImpo 0 0 0 .1 .1 0 .1
SWMImpo 0 0 0 .07692308 .07692308 0 .07692308
SWMImpo 0 0 .0625 .0625 .0625 .0625 .0625
SWMImpo 0 0 0 0 .0625 .0625 0
SWMImpo 0 0 .04166667 .04166667 .04166667 .04166667 0
SWMImpo 0 .07692308 .07692308 .07692308 .07692308 .07692308 .07692308
SWMImpo 0 0 0 .1 .1 0 0
SWMImpo 0 0 .07692308 .07692308 .07692308 0 0
SWMImpo .04761905 .04761905 .04761905 .04761905 0 .04761905 .04761905
SWMImpo .07692308 .07692308 .07692308 0 .07692308 .07692308 .07692308
SWMImpo .1 .1 0 .1 .1 .1 0
SWMImpo .2 0 .2 .2 .2 0 0
SWMImpo 0 .25 .25 .25 .25 0 0
c1 c2 c3 c4 c5 c6 c7
W[49,49]
1
2
3
4
5
18
Anlisis de datos espaciales
Acceptable range for lambda: -3.301 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 2.977 (0.084)
Likelihood ratio test of lambda=0: chi2(1) = 3.645 (0.056)
Wald test of lambda=0: chi2(1) = 6.030 (0.014)

lambda .5759911 .2345679 2.46 0.014 .1162464 1.035736

_cons 61.58694 6.763022 9.11 0.000 48.33166 74.84222
INC -1.177725 .3796858 -3.10 0.002 -1.921896 -.4335548
HOVAL -.2840458 .0930066 -3.05 0.002 -.4663353 -.1017563
CRIME

CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -185.55462 Sigma = 10.47
Squared corr. = 0.548
Variance ratio = 0.385
Spatial error model Number of obs = 49
Row-standardized: SWMImpo
Type:
Name: W
Weights matrix
Iteration 4: log likelihood = -185.55462
Iteration 3: log likelihood = -185.55462
Iteration 2: log likelihood = -185.55549
Iteration 1: log likelihood = -185.59347
Iteration 0: log likelihood = -187.42512
rescale eq: log likelihood = -187.42512
rescale: log likelihood = -187.42512
initial: log likelihood = -187.42512
. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)
19
Anlisis de datos espaciales
Acceptable range for lambda: -3.301 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 1.484 (0.223)
Likelihood ratio test of lambda=0: chi2(1) = 1.397 (0.237)
Wald test of lambda=0: chi2(1) = 1.598 (0.206)

lambda .366046 .2896015 1.26 0.206 -.2015626 .9336545

_cons 81.06832 13.16094 6.16 0.000 55.27335 106.8633
WHOVAL1 .0177241 .4586195 0.04 0.969 -.8811537 .9166019
WINC1 -1.343775 .915043 -1.47 0.142 -3.137226 .4496763
INC -1.135263 .3397802 -3.34 0.001 -1.80122 -.469306
HOVAL -.3052847 .096751 -3.16 0.002 -.4949132 -.1156562
CRIME

CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -183.83993 Sigma = 10.24
Squared corr. = 0.601
Variance ratio = 0.562
Spatial error model Number of obs = 49
Row-standardized: SWMImpo
Type:
Name: W
Weights matrix
Iteration 4: log likelihood = -183.83993
Iteration 3: log likelihood = -183.83993
Iteration 2: log likelihood = -183.84089
Iteration 1: log likelihood = -183.93603
Iteration 0: log likelihood = -184.67541
rescale eq: log likelihood = -184.67541
rescale: log likelihood = -184.67541
initial: log likelihood = -184.67541
. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)
20
Anlisis de datos espaciales
High-High
Low-High
Low-Low
Non Significant
Columbus Ohio. Source: Geoda
LISA MAP. CRIME
1%
5%
10%
Non Significant
Columbus Ohio. Source: Geoda
LISA SIGNIFICANCE MAP. CRIME
21
Los interesados en los procedimientos mencionados pueden
contactar con nosotros a travs del correo electrnico en las
siguientes direcciones: rramos@ub.edu, vroyuela@ub.edu

Existen otros procedimientos de inters en este mbito:
anketest, usswm, chinaspatdwm, spmlreg,

y seguimos a la espera de la difusin de spmat, sarml y
g2sls de David Drukker
http://repec.org/snasug08/drukker_spatial.pdf
Anlisis de datos espaciales

También podría gustarte