Está en la página 1de 32

Econometra Espacial

La econometra espacial fue definida a principios de los aos setenta por Jean Paelinck como el creciente cuerpo de la literatura en ciencia regional que trata primordialmente con problemas de estimacin encontrados en la utilizacin de modelos economtricos multirregionales.

Luc Anselin (1988) uno de los pioneros y grandes impulsores de la econometra espacial considera que el campo de esta disciplina esta formado por: aquellos mtodos y tcnicas que, sustentados en una representacin formal de la estructura de la dependencia y heterogeneidad espacial, provee el medio para llevar a cabo la adecuada especificacin, estimacin, prueba de hiptesis y prediccin para modelos en la ciencia regional.

Los mtodos desarrollados por la econometra espacial permiten atender problemas de violacin a los supuestos del modelo de regresin, que no es posible resolverlos en el marco de los modelos economtricos estndar. Estos problemas son tpicos en los datos espaciales y se refieren a: 1) Dependencia espacial entre observaciones:

Correlacin espacial. 2) Heterogeneidad espacial entre observaciones:

Heteroscedasticidad espacial. El caso al que se le ha dedicado mayor atencin es al primero, debido a que el segundo ha podido estudiarse en el marco de modelos de panel y otras tcnicas similares en donde la heteroscedasticidad y el cambio estructural juegan un papel relevante. Los temas que se abordan son: Vecindad Dependencia espacial Estadsticos de dependencia espacial Regresin espacial Seleccin de modelos espaciales.

Vecindad Normalmente el manejo de series econmicas se hace desde una perspectiva en la cual se toma como dadas las coordenadas de localizacin geogrfica de las variables. Es decir, por ejemplo, cuando se analiza el desempleo, el PIB por habitante y la inflacin no se hace referencia a su ubicacin geogrfica especfica; se asla a la variable de su contexto regional.

Tasa de desocupacin por entidad federativa 2000 y 2007

Fuente: Elaboracin propia con informacin de INEGI y STPS.

PIB por habitante por entidad federativa 2000 y 2007

Fuente: Elaboracin propia con informacin de INEGI

ndices de Precios por entidad federativa 2000 y 2007

Fuente: Elaboracin propia con informacin de INEGI Nota: Precios se midieron con los deflactores implcitos

Dependencia espacial

serial,

contempornea

versus

Errores independientes en modelos panel Los modelos panel pueden estar mal especificados cuando no cumple con el supuesto de independencia (contempornea y serial):

Donde i y j son los elementos de seccin cruzada y se establece ij; t y s son subndices de tiempo ts.

Errores independientes en modelos de seccin cruzada (SC) Los modelos SC pueden estar mal especificados cuando no cumple con el supuesto de independencia (contempornea):

Donde i y j son los elementos de seccin cruzada y se establece ij;

Errores con dependencia serial La dependencia serial se define como relacin de los errores en el tiempo y generalmente tiene el siguiente formato panel e individual

Autocorrelacin serial de primer orden

con el operador rezago L

Autocorrelacin serial de segundo orden

con el operador rezago L

Autocorrelacin serial de orden s

con el operador rezago L

Errores con dependencia contempornea La dependencia contempornea se define como relacin de los errores en la seccin cruzada

Modelo panel t e i En el modelo panel tiene el siguiente formato donde ij e i = 1, 2,3,, N elementos de seccin cruzada.

Matriz de correlacin contempornea entre elementos de seccin cruzada en panel 1 0.8 0.1 : : 0.7 1 0.5 : 0.2 1 : 0.1 . 1

Modelo de corte transversal t=0 Que sucede con la matriz de correlacin contempornea?

En un modelo de Desempleo, inflacin y crecimiento en seccin cruzada

Se estima y se grfica los errores

Distribucin de los errores con 5 y 3 Quantiles

Fuente: Elaboracin propia con OpenGeoda (2009)

Errores y variables con dependencia espacial La dependencia espacial se define como la existencia de una relacin funcional entre lo que ocurre en un punto del espacio y lo que sucede en otro lugar, lo cual se explica fundamentalmente por razones de la interaccin humana con su entorno fsico-ambiental en lo geogrfico. sentido, las variables socioeconmicas, En tal fsicas,

ambientales etc. generalmente presentan algn tipo de dependencia o autocorrelacin espacial. La dependencia espacial implicara que al tomar en consideracin una variable, para diferentes regiones, localidades, etc. esperaramos caractersticas ms similares en las regiones o localidades vecinas, que en aqullas separadas por grandes distancias. La dependencia espacial puede ser positiva o negativa; de ser positiva la presencia de un atributo en una regin o localidad se extendera a las regiones vecinas y, en caso de ser negativa, obstaculizara su presencia en sus vecindades.

Dependencia temporal y espacial La dependencia temporal, como la correlacin serial, es unidireccional (el pasado explica el presente), mientras que la dependencia espacial es multidireccional (una regin puede estar afectada no solamente por otra regin contigua o vecina sino por otras que la rodean, al igual que ella puede afectar a las otras). Este hecho imposibilita la utilizacin del operador rezago L, LPYt= Yt-p, presente en el contexto temporal, que establece una relacin unidireccional. La solucin consiste en utilizar una matriz W de efectos espaciales, que se puede leer como una media ponderada de los valores vecinos y se define como:

donde yj es el valor que toma el atributo medido en la vecindad j, wij es un ponderador cuya suma es la unidad. Los datos espaciales se pueden clasificar de acuerdo con el objeto espacial al que se refieren y al nivel de medida de las variables. Dicha clasificacin puede ilustrarse

matricialmente como en la figura 1

Figura 1 Matriz de pesos espaciales Interaccin, conectividad o vecindad espacial Sitios 0 0 1 : : : 0 0 0 : 0 0 Donde los sitios se determinan por el tipo de desagregacin espacial, geogrfica, territorial, etc. que se est analizando. Si por alguna razn la matriz de pesos espaciales no es constante en el tiempo, se tiene que construir una matriz para cada perodo del tiempo. Las relaciones entre las variables y localizaciones clasificadas en la matriz de pesos espaciales, pueden 1

establecerse desde un punto de vista geogrfico a travs de conectividad o vecindad.

Vecindad geogrfica Para el anlisis de vecindad se puede utilizar las variables binarias; en tal caso, s dos unidades espaciales tienen una frontera comn se les asigna un uno, en caso contrario se asigna un cero. Bajo esta sencilla idea, una variable particular podra referenciarse en un mapa, a partir del cual es posible establecer sus fronteras y, en consecuencia, identificar sus vecindades. Luc Anselin (1988) plantea diferentes medidas de vecindad, las cuales se asemejan a un tablero de ajedrez y que podemos apreciar en la figura 2:
Figura 2

Diferentes vecindades
B B A B C B C A C C C B C B A B C B C

TORRE

ALFIL

REINA

La vecindad entre puntos tambin puede ser de orden superior, s se consideran series de bandas concntricas alrededor de la localidad bajo consideracin.
Figura 3 Vecindad de orden superior D C B C D B A B D C B C D

En la figura 3 y considerando vecindad tipo torre, las celdas C y D son contiguas de segundo orden a la celda A, y son contiguas de primer orden a B. De esta forma, al ubicar nuestras variables en un mapa geogrfico es posible construir este tipo de matrices de vecindad.

Vecindad por distancias Anselin tambin plantea que, en caso de que la unidad espacial sea un sistema urbano, la vecindad puede ser obtenida de la trayectoria ms corta en una red o grfica formada por una conexin de puntos.

Por ejemplo, en la figura 4, la distancia ms corta entre los puntos es representada por la lnea punteada y la vecindad por el crculo que conecta los puntos y tiene como centroide a la localidad A.
Figura 4 Vecindad por distancia ms corta B B A B B

El centroide como punto de referencia para medir las distancias geogrficas, Fotheringham, Brunsdon and Charlton (2000), Quantitative Geography: Perspectives on Spatial Data Analisys.

Mtodos para medir distancias I. Localizacin en el plano cartesiano Para un sistema cartesiano, la distancia se mide por el teorema de Pitgoras La localizacin por medio de las coordenadas geogrficas: latitud y longitud. 1. Distancia Euclidiana Con base a las coordenadas de latitud (x) y la longitud (y), la distancia entre las localidades 1 y 2:

La distancia euclidiana entre dos localidades i y j con coordenadas (xi,1, xi,2), (xj,1, xj,2), se puede escribir tambin como:

La distancia puede ser generalizada a m dimensiones.

2. Mtrica de Minkowski

si p=2 es la distancia euclidiana, si p=1 es la distancia conocida como Manhattan o distancia taxicab.

II. Localizacin en el globo o superficie de la tierra En este caso se necesita de los clculos geomtricos 1. Trigonometra esfrica (curvatura de la tierra) Sij= R.arcos[cos(900-i)cos(900-j) + sin(900-i)sin(900-j)cos(j- i)] R es el radio de la tierra, la latitud y longitud de la locacin i son (i, i) Primero: utilizar un sistema de proyeccin en el plano 2. Mercator (proyeccin a una forma cilndrica) x =R y = Rln(tan(/4+ /2) Donde R es el radio de la tierra, ln es el logaritmo natural, es la latitud y es la longitud. 3. Lambert (proyeccin a un rea cilndrica) x =R y = Rsin

Medidas de Cercana Alternativas 1. Distancias por el sistema carretero La utilizacin de la capa carretero en un GIS, considera la topografa. 2. La distancia en tiempo real Medicin en campo de la distancia y el tiempo que tarda en ir de una localidad a otra. 3. Encuesta de preferencias relevadas El origen destino como una medida de los flujos y por tanto de las vecindades

Estadsticos de dependencia espacial Para la medicin de dependencia espacial se han propuesto numerosos estadsticos, uno de los ms utilizados es el ndice de Moran (1948), que se define en la frmula siguiente: ndice de Moran

donde xi es la variable cuantitativa x en la regin i, tamao de muestra (Regiones) y

es su

media muestral, wij son los pesos de la matriz W, R es el

Bajo la hiptesis nula de no autocorrelacin, el estadstico de Moran es asintticamente normal:

El ndice de Moran sigue una distribucin normal estandarizada en muestras grandes (Vaya y Moreno, 2000), de forma tal que un valor positivo (negativo) significativo del ndice Z(I) llevar al rechazo de la

hiptesis nula de no autocorrelacin espacial y a la aceptacin (negativa). de autocorrelacin espacial positiva

Otros estadstico: Geary

Es posible graficar la informacin del ndice en un diagrama de dispersin de Moran. Dicho diagrama, presenta en el eje horizontal a la variable x normalizada y en el eje vertical a la variable x multiplicada por la matriz de pesos W, lo cual da lugar al rezago espacial de dicha variable. La visualizacin de un patrn aleatorio en la grfica brinda evidencia de la ausencia de

autocorrelacin espacial.

ndice de Moran: Tasa de desocupacin regional en Mxico

En procesos en los cuales existen patrones de agrupacin local o clusters, el ndice de Moran no los puede detectar, dado que slo evala la dependencia global de todas las regiones. Como alternativa se han propuesto estadsticos locales, tal es el caso del Indicador Local de Asociacin Espacial LISA (Local Indicator of Spatial Association), que se calcula en cada regin o localidad y su definicin es la siguiente:

donde zi es el valor de la variable correspondiente en la regin i, Nj es el conjunto de regiones vecinas a i. Un valor elevado, positivo (negativo) y significativo del estadstico da lugar a la existencia de un cluster alrededor de la regin i de valores similares elevados (bajos). Con base en el ndice local, Ii, es posible encontrar su contribucin al ndice global, I, y detectar sus valores extremos lo cual lo convierte en un LISA.

Modelos espaciales El proceso Confirmatorio Un vez que con el proceso exploratorio se identifico la presencia de dependencia espacial de los datos, es

necesario especificar un modelo de espacial que confirme la dependencia espacial. Para plantear una especificacin general prototipo, retomaremos la formulada por Anselin (1988) para datos de corte transversal como los que hemos analizado en el caso 2. El modelo general planteado es:

yi = rW 1 yi + b Xi + q W2 Xi + e i ei = lW3ei + ui
con ui~N(0,) siendo los elementos diagonales de ii=hi(z) con hi>0 donde yi es el vector de la variable endgena, Xi es una matriz de variables exgenas y el trmino de error que incorpora una estructura de dependencia espacial

autorregresiva, W1, espaciales.

W2 y W2 son matrices de pesos

A partir de esta especificacin podemos tener cinco casos: 1. Modelo de regresin clsico sin efectos espaciales: :

yi = b Xi + e i ei = ui

2.

Modelo autorregresivo:

yi = rW 1 yi + b Xi + e i ei = ui

3.

Modelo de error espacial autorregresivo:

yi = b Xi + e i ei = lW3ei + ui
yi = b Xi + e i

ei = ( I - lW3 )-1 ui

yi = b Xi + ( I - lW3 )-1 ui

4.

Modelo Durbin Spatial

De acuerdo al modelo de error espacial, se utiliza la estrategia de Durbin que establece el factor comn y Error Espacial

Entonces, 1) Despejar de la primera ecuacin los errores y sustituir en la segunda

ei = lW3 ( yi - b Xi ) + ui
2) Sustituir el resultado en la primera ecuacin

yi = b Xi + lW3 ( yi - b Xi ) + ui yi = lW3 yi + b Xi - blW3 Xi + ui yi = lW3 yi + b Xi + q W3 Xi + ui q = -bl


donde:

5.

Modelo mixto autorregresivo espacial con errores espaciales autorregresivos (SARIMA): :

yi W1 yi X i ( I W2 )1ui
Al igual que en el modelo de regresin clsico, la presencia de autocorrelacin espacial dar lugar a que los estimadores de mnimos cuadrados ordinarios sean insesgados, pero ineficientes, por lo cual se incumple el teorema de Gauss-Markov. En los casos 2 y 4 la especificacin considera rezagos autorregresivos de la variable dependiente, en consecuencia los estimadores de mnimos cuadrados ordinarios sern sesgados e

inconsistentes. La estimacin del modelo espacial se realiza a travs del mtodo de mxima verosimilitud en concordancia con el modelo espacial especfico que se seleccione.

Proceso de decisin
Estimar con MCO Estimar modelo de error espacial Pruebas LM -LM(lag) LM(error)

LM(error)

Ninguna

significativa?

Una

Conservar el modelo de MCO

Ambas LM(lag) LM(error)

LM(lag)

Robustas LM(lag) LM(error)

Estimar modelo de rezago espacial

significativa? LM(lag) robusta LM(error) robusta

Estimar modelo de rezago espacial

Estimar modelo de error espacial