Está en la página 1de 21

3 Reunin Espaola de

Usuarios de STATA 2010

Herramientas adicionales
en STATA para el anlisis de

datos espaciales
Ral Ramos y Vicente Royuela
AQR-IREA, Universitat de Barcelona

Anlisis de datos espaciales


Estructura de la presentacin
STATA como herramienta para el anlisis de datos
espaciales: procedimientos disponibles
Desarrollos en curso:
Matriz de pesos espaciales
Sobre la introduccin de retardos espaciales de las
variables explicativas en modelos de regresin
Sobre la visualizacin de los resultados del anlisis
exploratorio espacial

Anlisis de datos espaciales


Herramientas disponibles

ssc install spmap


ssc install shp2dta
ssc install mif2dta

Anlisis de datos espaciales

net install sg162.pkg

http://www.stata.com/products/stb/journals/stb60.pdf

Anlisis de datos espaciales


Columbus Ohio

49 vecindarios del distrito de Columbus en Ohio

(Estados Unidos)
Informacin para 1980 sobre:
Precio de la vivienda
Ingresos familiares
Robos por cada 1000 viviendas

http://www.rri.wvu.edu/WebBook/LeSage/spatial/anselin.html
http://www.rri.wvu.edu/WebBook/LeSage/spatial/aford.html

Anlisis de datos espaciales

Precio de la vivienda

Crimen

(43.299999,96.400002]
(33.5,43.299999]
(25.700001,33.5]
[17.9,25.700001]

(48.585487,68.892044]
(34.000835,48.585487]
(20.048504,34.000835]
[.178269,20.048504]

Linear regression

Number of obs =
F( 2,
46) =
Prob > F
=
R-squared
=
Root MSE
=

CRIME

Coef.

HOVAL
INC
_cons

-.2739315
-1.597311
68.61896

Robust
Std. Err.
.1625712
.4609711
4.233089

t
-1.68
-3.47
16.21

P>|t|
0.099
0.001
0.000

49
45.47
0.0000
0.5524
11.435

[95% Conf. Interval]


-.6011702
-2.525197
60.09819

.0533073
-.6694242
77.13973

Anlisis de datos espaciales


La matriz de pesos espaciales
En el anlisis economtrico estndar, se supone que cada

una de las observaciones analizadas es independiente del


resto (hiptesis de no autocorrelacin).
Autocorrelacin espacial y/o retardos espaciales de
las variables explicativas: matriz de pesos espaciales.
La matriz de pesos espaciales recoge la existencia de
relaciones entre los territorios analizados. Existen
diferentes especificaciones de dicha matriz.

Anlisis de datos espaciales


Se han propuesto distintas especificaciones:
Contigidad (matriz de contactos binaria)

Proximidad (matriz basada en distancias entre


centroides o entre capitales)
Flujos (matriz basada en movimientos de personas,

mercancias, etc. asimtrica)



Es importante analizar la robustez de los resultados a
distintas especificaciones de la matriz.

Anlisis de datos espaciales

Pero, los procedimientos existentes en STATA slo permiten


trabajar con matrices binarias generadas manualmente
por el usuario o matrices basadas en distancias
(simtricas).
En otros programas como GEODA-PYSAL, MATLAB o R es
posible generar y utilizar distintas matrices de manera

muy simple (a partir del propio mapa). Sin embargo,


estos programas no ofrecen la potencialidad de STATA en
otros aspectos.

Anlisis de datos espaciales


Geoda

10

Anlisis de datos espaciales

11

Hemos desarrollado procedimientos que permiten importar


matrices generadas desde estos programas, normalizarlas y
utilizarlas con spatreg (aunque sean asimtricas por
naturaleza como las obtenidas a partir del procedimiento Knearest neighbours-)

gal2dta

gwt2dta

sparse2dta

normw

Anlisis de datos espaciales


Retardos espaciales de las variables explicativas
La existencia de autocorrelacin espacial en un modelo de

regresin puede indicar la omisin de variables relevantes


como retardos espaciales de alguna de las explicativas.

Sin embargo, los procedimientos existentes en STATA no


permiten introducir de manera directa retardos de las
variables, por lo que hemos desarrollado un procedimiento
que permite hacerlo de manera muy sencilla.
slag

12

Anlisis de datos espaciales


Visualizacin del anlisis exploratorio de datos espaciales
Geoda

Stata

spatlsa2

Measures of local spatial autocorrelation


Weights matrix
-------------------------------------------------------------Name: W1
Type: Imported (binary)
Row-standardized: No
-------------------------------------------------------------Moran's Ii (CRIME)
------------------------------------------------------------Location |
Ii
E(Ii) sd(Ii)
z
p-value*
--------------------+----------------------------------------1 | 1.474 -0.042
1.381
1.097
0.136
2 | 1.586 -0.063
1.674
0.985
0.162
3 | 0.375 -0.083
1.912
0.240
0.405

13

Anlisis de datos espaciales

14
1

Matriz binaria de
contactos normalizada

W[49,49]
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo

c1
0
.33333333
.25
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

c2
.5
0
.25
.25
0
0
0
0
0
0
0
0
0
0
0
0
0
0

c3
.5
.33333333
0
.25
.14285714
0
0
0
0
0
0
0
0
0
0
0
0
0

c4
0
.33333333
.25
0
.14285714
0
0
.2
0
0
0
0
0
0
0
0
0
0

c5
0
0
.25
.25
0
.5
0
.2
.16666667
0
.25
0
0
0
.25
0
0
0

c6
0
0
0
0
.14285714
0
0
0
.16666667
0
0
0
0
0
0
0
0
0

c7
0
0
0
0
0
0
0
.2
0
0
0
0
.33333333
.16666667
0
0
0
0

Anlisis de datos espaciales

15

. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)


initial:
rescale:
rescale eq:
Iteration 0:
Iteration 1:
Iteration 2:
Iteration 3:
Iteration 4:

log
log
log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

=
=
=
=
=
=
=
=

-187.42512
-187.42512
-187.42512
-187.42512
-183.50365
-183.31857
-183.31357
-183.31357

Weights matrix
Name: W
Type:
Row-standardized: SWMImpo
Spatial error model

Number of obs
Variance ratio
Squared corr.
Sigma

Log likelihood = -183.31357


Std. Err.

P>|z|

=
=
=
=

49
0.329
0.537
9.75

CRIME

Coef.

[95% Conf. Interval]

HOVAL
INC
_cons

-.3031982
-.9610433
60.37518

.0927166
.3704535
5.798748

-3.27
-2.59
10.41

0.001
0.009
0.000

-.4849194
-1.687119
49.00985

-.121477
-.2349678
71.74052

lambda

.5484742

.1500262

3.66

0.000

.2544282

.8425201

CRIME

Wald test of lambda=0:


Likelihood ratio test of lambda=0:
Lagrange multiplier test of lambda=0:

chi2(1) =
chi2(1) =
chi2(1) =

13.365 (0.000)
8.127 (0.004)
5.815 (0.016)

Acceptable range for lambda: -1.531 < lambda < 1.000

Anlisis de datos espaciales

16

. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)


initial:
rescale:
rescale eq:
Iteration 0:
Iteration 1:
Iteration 2:
Iteration 3:
Iteration 4:
Iteration 5:

log
log
log
log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

=
=
=
=
=
=
=
=
=

-184.85114
-184.85114
-184.85114
-184.85114
-183.1555
-181.76435
-181.74275
-181.74271
-181.74271

Weights matrix
Name: W
Type:
Row-standardized: SWMImpo
Spatial error model

Number of obs
Variance ratio
Squared corr.
Sigma

Log likelihood = -181.74271


Std. Err.

P>|z|

=
=
=
=

49
0.524
0.597
9.60

CRIME

Coef.

[95% Conf. Interval]

HOVAL
INC
WINC1
WHOVAL1
_cons

-.2774837
-1.057194
-1.041591
.0961597
72.69648

.0919551
.3242875
.5847625
.2040779
9.01754

-3.02
-3.26
-1.78
0.47
8.06

0.003
0.001
0.075
0.638
0.000

-.4577123
-1.692786
-2.187704
-.3038257
55.02242

-.0972552
-.4216026
.1045227
.4961451
90.37053

lambda

.4480536

.1644596

2.72

0.006

.1257187

.7703886

CRIME

Wald test of lambda=0:


Likelihood ratio test of lambda=0:
Lagrange multiplier test of lambda=0:

chi2(1) =
chi2(1) =
chi2(1) =

7.422 (0.006)
5.943 (0.015)
5.600 (0.018)

Acceptable range for lambda: -1.531 < lambda < 1.000

Anlisis de datos espaciales

17
1

Matriz binaria de
contactos de primer
y segundo orden
normalizada

3
5

W[49,49]
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo
SWMImpo

c1
0
.2
.1
.07692308
.04761905
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

c2
.25
0
.1
.07692308
.04761905
0
0
.07692308
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

c3
.25
.2
0
.07692308
.04761905
.07692308
0
.07692308
.04166667
0
.0625
0
0
0
.05
.04761905
0
0
0
0
0
0
0
0
0

c4
.25
.2
.1
0
.04761905
.07692308
.1
.07692308
.04166667
0
.0625
.07692308
.1
0
.05
.04761905
0
0
0
0
0
0
0
0
0

c5
.25
.2
.1
.07692308
0
.07692308
.1
.07692308
.04166667
.0625
.0625
.07692308
.1
.08333333
.05
.04761905
0
.07142857
0
.04761905
0
.05263158
0
.05555556
.04166667

c6
0
0
.1
.07692308
.04761905
0
0
.07692308
.04166667
.0625
.0625
0
0
0
.05
.04761905
0
0
0
.04761905
0
.05263158
0
0
.04166667

c7
0
0
0
.07692308
.04761905
0
0
.07692308
0
0
.0625
.07692308
.1
.08333333
0
.04761905
0
.07142857
.09090909
0
0
0
0
0
0

Anlisis de datos espaciales

18

. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)


initial:
rescale:
rescale eq:
Iteration 0:
Iteration 1:
Iteration 2:
Iteration 3:
Iteration 4:

log
log
log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

=
=
=
=
=
=
=
=

-187.42512
-187.42512
-187.42512
-187.42512
-185.59347
-185.55549
-185.55462
-185.55462

Weights matrix
Name: W
Type:
Row-standardized: SWMImpo
Spatial error model

Number of obs
Variance ratio
Squared corr.
Sigma

Log likelihood = -185.55462


Std. Err.

P>|z|

=
=
=
=

49
0.385
0.548
10.47

CRIME

Coef.

[95% Conf. Interval]

HOVAL
INC
_cons

-.2840458
-1.177725
61.58694

.0930066
.3796858
6.763022

-3.05
-3.10
9.11

0.002
0.002
0.000

-.4663353
-1.921896
48.33166

-.1017563
-.4335548
74.84222

lambda

.5759911

.2345679

2.46

0.014

.1162464

1.035736

CRIME

Wald test of lambda=0:


Likelihood ratio test of lambda=0:
Lagrange multiplier test of lambda=0:

chi2(1) =
chi2(1) =
chi2(1) =

6.030 (0.014)
3.645 (0.056)
2.977 (0.084)

Acceptable range for lambda: -3.301 < lambda < 1.000

Anlisis de datos espaciales

19

. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)


initial:
rescale:
rescale eq:
Iteration 0:
Iteration 1:
Iteration 2:
Iteration 3:
Iteration 4:

log
log
log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

=
=
=
=
=
=
=
=

-184.67541
-184.67541
-184.67541
-184.67541
-183.93603
-183.84089
-183.83993
-183.83993

Weights matrix
Name: W
Type:
Row-standardized: SWMImpo
Spatial error model

Number of obs
Variance ratio
Squared corr.
Sigma

Log likelihood = -183.83993


Std. Err.

P>|z|

=
=
=
=

49
0.562
0.601
10.24

CRIME

Coef.

[95% Conf. Interval]

HOVAL
INC
WINC1
WHOVAL1
_cons

-.3052847
-1.135263
-1.343775
.0177241
81.06832

.096751
.3397802
.915043
.4586195
13.16094

-3.16
-3.34
-1.47
0.04
6.16

0.002
0.001
0.142
0.969
0.000

-.4949132
-1.80122
-3.137226
-.8811537
55.27335

-.1156562
-.469306
.4496763
.9166019
106.8633

lambda

.366046

.2896015

1.26

0.206

-.2015626

.9336545

CRIME

Wald test of lambda=0:


Likelihood ratio test of lambda=0:
Lagrange multiplier test of lambda=0:

chi2(1) =
chi2(1) =
chi2(1) =

1.598 (0.206)
1.397 (0.237)
1.484 (0.223)

Acceptable range for lambda: -3.301 < lambda < 1.000

Anlisis de datos espaciales


LISA MAP. CRIME
High-High
Low-High
Low-Low
Non Significant

20
LISA SIGNIFICANCE MAP. CRIME
1%
5%
10%
Non Significant

Columbus Ohio. Source: Geoda


Columbus Ohio. Source: Geoda

Anlisis de datos espaciales

21

Los interesados en los procedimientos mencionados pueden


contactar con nosotros a travs del correo electrnico en las

siguientes direcciones: rramos@ub.edu, vroyuela@ub.edu


Existen otros procedimientos de inters en este mbito:
anketest, usswm, chinaspatdwm, spmlreg,
y seguimos a la espera de la difusin de spmat, sarml y
g2sls de David Drukker
http://repec.org/snasug08/drukker_spatial.pdf

También podría gustarte