Untitled

Machine Translated by Google
A Francesco y Enrica
Prefacio
En los últimos años, la llamada nueva geografía económica y el tema de la convergencia

económica regional han atraído cada vez más el interés de los economistas por el
análisis empírico de datos regionales y espaciales. Sin embargo, incluso si la metodología
para el tratamiento econométrico de datos espaciales está bien desarrollada, no existe
un libro de texto fundamentado teóricamente, bien motivado y de fácil acceso para los
economistas que no son especialistas. Las técnicas de econometría espacial reciben
poca o ninguna atención en los principales libros de texto de econometría. Muy
ocasionalmente, los libros de texto estándar de econometría dedican algunos párrafos al
tema, pero la mayoría simplemente lo ignora. Por otro lado, los libros de econometría
espacial (como Anselin, 1988 o Anselin, Florax y Rey, 2004) brindan tratamientos
integrales y exhaustivos del tema, pero no siempre son fácilmente accesibles para
personas cuya carrera principal no es en economía cuantitativa o estadística. .
Este libro pretende cerrar la brecha entre la teoría económica y los métodos
estadísticos espaciales. Comienza motivando fuertemente al lector hacia el problema
con ejemplos basados en datos reales, luego brinda un tratamiento riguroso, basado en
la teoría de campos estocásticos, del modelo lineal espacial básico, y finalmente discute
los casos más simples de violación de los supuestos de la regresión clásica. que ocurren
cuando se trata de datos espaciales. Estoy convencido de que, una vez que el lector se
familiarice con los argumentos probabilísticos y estadísticos en los que se basa el modelo
lineal básico, será capaz de comprender también con bastante facilidad los modelos y
técnicas más sofisticados que están presentes en la literatura econométrica espacial. .
Una revisión de algunos temas más avanzados excluidos del rango de interés de este
libro se limita a un capítulo final que proporciona las referencias para estudios posteriores
más profundos.
El proyecto de un libro autónomo de base estadística sobre econometría espacial se
remonta a 1996, cuando impartí por primera vez un curso sobre temas econométricos
avanzados en la facultad de Economía de la “G. D'Annunzio” Universidad de Pescara.
La serie de notas de conferencias que redacté en italiano se imprimió en una serie de
documentos de trabajo provisionales y constituye la columna vertebral del presente
volumen. Esta versión preliminar sufrió varios cambios e integraciones cuando se usó en
una serie de cursos de posgrado que he estado impartiendo en la facultad de Economía
de Roma "Tor Vergata" desde 1997. El estudiante típico que asistía a estos cursos era
un Máster o Doctorado. estudiante con una licenciatura en Economía, Ciencias Políticas
o alguna de las otras Ciencias Sociales.
Teniendo en cuenta tal tipología de estudiante durante la redacción del libro, los
únicos requisitos previos para leer esta monografía son un buen primer curso de probabilidad.
viii Prefacio
idad al nivel de libros como Grimmett y Stirzaker (1994) y un curso de Estadística al nivel
de libros como Azzalini (1996) o Mood et al. (1974). Un conocimiento previo de los
métodos básicos de análisis de series de tiempo al nivel de los primeros cinco capítulos
de Hamilton (1994) ayuda, porque existe cierta analogía entre la metodología espacial y
temporal.
Este volumen podría utilizarse como libro de texto para un curso introductorio de
posgrado de unas 20/30 horas, o como libro de referencia para estudiantes de posgrado
que realicen trabajos de doctorado en economía cuantitativa (u otras ciencias sociales),
en problemas de estimación econométrica espacial evolutiva.
Habiendo esbozado el objetivo general de este libro, descrito su génesis y sus lectores
potenciales, ahora me complace cumplir con el grato deber de agradecer a las muchas
personas que contribuyeron a su preparación y realización final. Este es el mejor momento
al escribir un libro (¡como bien sabe cualquiera que tenga una experiencia directa!). Hay
al menos dos razones para esto. La primera es que estas son, de hecho, las últimas
palabras escritas por el autor en este contexto, lo que significa que el trabajo pesado
finalmente está hecho y que lo que en la última fase solo puede calificarse como una
“obsesión”, eventualmente dará paso a otras. (esperemos que menos convincentes) tareas.
La segunda es que este es el único lugar donde se puede hablar de uno mismo y de su
entorno laboral y familiar y no sólo de conceptos abstractos y formalismos y esto es una
fuente inevitable de autosatisfacción para todos los autores.
Habría sido casi imposible realizar este libro sin la ayuda y el apoyo que recibí de
muchas personas. Me gustaría comenzar agradeciendo a Jean Pa elinck por ser el primer
autor que leí sobre el tema allá por 1984 cuando era estudiante de doctorado en la
Universidad de Cambridge y, después de conocerlo en persona, por haberse convertido
en una referencia constante para mi trabajo sobre este tema. En especial, hay que
agradecerle su constante ayuda, las útiles correcciones y sugerencias que me proporcionó
en varios borradores del libro y, sobre todo, su amistad.
También se agradece a Gianfranco Piras por su asistencia diaria durante este último año
con todos los problemas técnicos y no técnicos que surgieron durante la preparación del
volumen, así como por haber sido coautor del Capítulo 6 y el Apéndice. Mi agradecimiento
también a Francesco Moscone de la London School of Economics por su entusiasmo y
aliento desde el comienzo de este proyecto, a Giovanni Lafratta y Paolo Postiglione
(ambos de la Universidad “D'Annunzio” de Pescara) por haber sido coautores de las
Secciones 2.4 .2.10 y 4.4.2.3, respectivamente, ya Elisa To setti de la Universidad de
Cambridge por haber leído el manuscrito en varias etapas y por haber proporcionado
correcciones y sugerencias y adiciones muy útiles al texto original. No hace falta decir que
solo yo soy totalmente responsable de cualquier error que quede en la escritura y los
cálculos. También debo agradecer a Roberto Basile del Istituto di Studi ed Analisi
Economica (ISAE) y a Laura De Dominicis de la Universidad “Tor Vergata” y de la
Universidad Libre de Amsterdam por su ayuda en algunos de los cálculos informados en
la Sección 1.3 y el Capítulo 5. así como para revisar partes del libro. También deseo
agradecer a Robert Haining por su hospitalidad en el Departamento de Geografía de
Cambridge durante el verano de 2004 cuando estaba escribiendo el borrador final.
Finalmente quiero agradecer a todos mis estudiantes de doctorado por
Prefacio IX
su paciencia y apoyo en todo el período en que menos tiempo pude dedicar a sus
investigaciones ya los actores de la compañía de teatro “Palcoscenico '95” que tuvieron
que prescindir de mí en muchas ocasiones durante este período de intensa escritura.
Una mención muy especial se la debo a mis amados padres, quienes fallecieron
durante el último año cuando estaba trabajando en la versión final de este libro. Ya les
he dedicado mi segundo libro, pero siento que les estoy particularmente en deuda.
Aparte de la inmensa gratitud que siento hacia ellos por todos los aspectos de mi vida,
me gustaría decir muy específicamente que la presencia, el amor y el aliento constante
de mis padres para apuntar cada vez más alto han hecho toda la diferencia en mi vida
laboral y profesional como todo. No será lo mismo sin ellos.
Es común que los prefacios de libros contengan expresiones de agradecimiento a la
familia, esposa e hijos del autor por haberle permitido dedicarse (casi) por completo a
la carga de escribir un libro durante un largo período (durante el trabajo y no). horas de
trabajo, durante la semana y los fines de semana) y por haberle brindado el ambiente
propicio para cumplir con esta tarea. Esto es sin duda menos deseable, pero no creo
que se corresponda enteramente con lo que ocurre en la práctica. La mayoría de las
veces los distintos miembros de la familia no tienen elección y, si la tuvieran, preferirían
tener un libro menos en la estantería y más tiempo para pasar despreocupadamente
con su marido/padre, más paciencia de éste, más su ayuda en relación con sus propias
tareas. Habiendo dicho eso, en este mismo momento cuando estoy escribiendo estas
que (con suerte) serán las palabras finales de este libro, mis tres hijos están gritando
alegremente en la habitación contigua y (incluso si estoy tentado a unirme a ellos) no
están proporcionando exactamente lo que uno define como el "entorno adecuado" para
un escritor. No obstante, este libro está dedicado a mi maravillosa familia y, en particular,
a Francesco y Enrica ya que dediqué mi primer libro a Paola y Elisa antes de que
nacieran mis dos hijos menores. Es difícil decir por qué uno decide deliberadamente
dedicar tiempo a escribir un libro a expensas de su familia. Puede ser por un puro amor
al conocimiento, su difusión o tal vez la ilusión falaz de dejar algo a la posteridad, o
locura plana, o simplemente autosatisfacción o cualquier combinación de los anteriores.
Pero, al fin y al cabo, la positividad de nuestras acciones y el significado de cualquier
momento no está en nuestras manos: son cosas que simplemente suceden, como un
regalo inmerecido. Como la que celebramos este mismo día como todos los años.
Roma, Navidad de 2005 Giuseppe Arbia

Proemio
Su distancia le da encanto a la vista. …

Guillermo Wordsworth
Mientras ejercía el preciado privilegio de leer el manuscrito de este libro, retrocedí en el tiempo, y en
el espacio... a principios de los años cincuenta, cuando comencé mi trabajo econométrico. Fue como
redescubrir los innovadores análisis de la demanda de René Roy (Econometrica, 1947), luego hojear
Mathematical Methods of Statistics, Sixth Printing, 1954, de Harald Cramer, para continuar con
Econometric Methods, 1963, de Johnston, y terminar con algunos artículo reciente sobre Sistemas de
Demanda Casi Ideales.
De hecho, esa es la ruta del libro de Giuseppe Arbia, que comienza con un problema espacial
empírico, mostrando la necesidad de un marco analítico riguroso, trabajando a través de una versión
simplificada pero operativa de este, y luego señalando que para ambos modelos fundamentales, el las
suposiciones son negadas en gran medida por los datos espaciales y sus representaciones apropiadas,
y esto desde los tres puntos de vista del modelo de probabilidad, el proceso de generación estadística
y el muestreo.
Esta presentación sintética del modelo espacial debe considerarse particularmente útil para el
lector que desee iniciarse en los modelos econométricos espaciales. Es especialmente importante el
hecho de que el análisis se realice a partir de la noción fundamental de campos aleatorios, ya que de
esta manera se establece la base axiomática para cualquier análisis regional posterior.
No es de extrañar, por lo tanto, que el modelo regional presentado inicialmente haya tenido que
adaptarse desde diferentes ángulos, ya que un enfoque simple y homogéneo no podía cubrir toda la
complejidad de los datos espaciales.
Estos, de hecho, muestran un patrón tan complejo, en parte inducido por el hecho de que están
fundamentalmente sesgados, como he mostrado en otra parte, de ahí esa aparente heterogeneidad.
De hecho, de las técnicas avanzadas propuestas en el último capítulo, quizás se deba prestar especial
atención a las herramientas exploratorias, y esto no solo para las variables crudas –que ya muestran
la mayoría de las veces puntos calientes, como han demostrado repetidamente los estadísticos
espaciales– sino también por los residuos obtenidos a partir de un primer análisis, aunque sea
debidamente espacializado (el “principio del doggy-bag”, como me gusta llamarlo: nunca tirar las
sobras…). De hecho, creo que las interdependencias espaciales y las externalidades están más
involucradas de lo que podría cubrirse con esquemas espacializados multivariados de Markov o
incluso de Yule. Cómo modelar apropiadamente, es decir, especificar, interrelaciones tan complejas
es, creo, uno de los principales desafíos para el futuro trabajo econométrico espacial.
XII Proemio
El libro de Giuseppe Arbia es otro testimonio de la vitalidad del análisis econométrico

espacial durante las últimas dos décadas. Va de la mano con la constatación por parte de los
economistas generales de que el espacio pregeográfico debe ser un componente esencial de
todo análisis económico, que no puede ignorar los elementos topológicos en su búsqueda de
proposiciones de comportamiento económico; como suelo ponerlo amigablemente con mis
alumnos: ¡“el espacio importa”! Pero, por otro lado, deben tenerse en cuenta las contribuciones
fundamentales de los economistas generales para permitir que los econometristas espaciales
mejoren sus especificaciones teóricas, como se insinuó más arriba. De hecho, las estructuras
matemáticas utilizadas para establecer un modelo espacial son absolutamente pertinentes
para el uso que se le dará; pero sospecho que esa validez es más general, ya que se refiere
a los procesos económicos que el econometrista espacial quiere representar.
Lo que he tratado de transmitir al lector de este libro es un sentido de su importancia

como buscador de caminos para los jóvenes investigadores, no necesariamente en el campo
de la econometría espacial propiamente dicha, sino también en otros campos del análisis
económico. rético y aplicado: un precio no es sólo una p, sino una variable estocástica en un
campo aleatorio bidimensional, es decir, tiene una distribución estadística bidimensional. Difícil
al principio de imaginar, pero así son las cosas; nuestra tarea, como la de los físicos, es crear
belleza a partir de la basura...
Lectori salutem.
enero de 2006 Jean HP Paelinck
Posdata y pensamiento posterior
El campo aleatorio de precios mencionado anteriormente es conocido por los observadores

espaciales desde hace mucho tiempo; menos conocida es la distribución de regímenes
espaciales, es decir, de parámetros de comportamiento. En el último capítulo de aplicación de
este libro, se ha demostrado que el norte y el sur de Italia pueden abordarse como entidades
espaciales (macro-) separadas, y se han estudiado otros casos: el norte y el sur de Bélgica,
Canadá y los Estados Unidos (los llamados "División continental"). En Paelinck y Klaassen,
Spatial Econometrics, 1979, se ha sugerido que, dada la naturaleza de los patrones espaciales,
podría ser apropiado un enfoque de subconjunto borroso; de hecho, es muy probable que los
regímenes espaciales no estén separados de manera clara, sino que se "superpongan" en un
sentido confuso, y esa misma idea podría aplicarse no solo a los parámetros de un patrón de
comportamiento dado, sino también a diferentes “variedades” de esos patrones, es decir,
patrones basados en diferentes supuestos teóricos. En otras palabras, los coeficientes binarios
que separan los regímenes pueden ser borrosos.
El siguiente paso es volver a lo básico y desarrollar una teoría de campos aleatorios borrosos.
Ars longa, vita breve …
Tabla de contenido
1 Motivación .................................................. .................................... 3

1.1 Introducción................................................ ..........................................3
1.2 Modelos económicos teóricos que requieren econometría espacial

Técnicas.................................................. ..........................................7
1.2.1 Introducción.................................................. ..........................................7
1.2.2 El enfoque de convergencia ÿ........................................... ..........8 1.3 Un análisis
de convergencia ÿ de las regiones de Europa e Italia ..................14

1.3.1 Introducción.................................................. ..........................................14
1.3.2 Un análisis de convergencia ÿ de las provincias italianas NUTS-3

(1951-1999) .............................................. ......................................dieciséis
1.3.3 Un análisis de convergencia ÿ de las regiones europeas NUTS-2

(1980-1996) .............................................. ..........................................22 1.4 Una
lista de temas omitidos y un resumen de los Libro ...............................27
2 Campos Aleatorios y Modelos Espaciales...................................... 31

2.1 Introducción.................................................. .............................................31
2.2 El concepto de campo aleatorio ............................................... ...................33
2.2.1 La Naturaleza del Índice S ............................................... ....................34
2.2.1.1 Generalidades ............................................... ........................34
2.2.1.2 La Topología de un Campo Aleatorio .......................................36 2.2.2
La Estructura de dependencia de un campo aleatorio .......................39

2.3 Restricciones en campos aleatorios ............................................... ...................43
2.3.1 Restricciones a la heterogeneidad espacial de un campo aleatorio .......43 2.3.2
Restricciones a la dependencia espacial de un campo aleatorio ......46 2.4 Algunos
campos aleatorios especiales ...... .................................................... .............49 2.4.1 Ruido
blanco espacial ............................... ..........................................49

2.4.2 Campos aleatorios de Markov ............................................. .....................49
2.4.2.1 Generalidades ............................................... ........................49
2.4.2.2 El teorema de Hammersley y Clifford ..........................50

XIV Tabla de contenido
2.4.2.3 Ley de Ising.................................................... ..........................52 2.4.2.4 El

modelo automático de Strauss ............... ..................................55
2.4.2.5 El campo autobinomial.................................................. ........56
2.4.2.6 El modelo de Auto-Poisson........................................... ........57
2.4.2.7 El campo Auto-normal (o CAR) ..........................................57 2.4 .2.8 El

Campo Gaussiano Intrínseco.................................................. .58
2.4.2.9 El campo autonormal bivariado ................................................59
2.4.2.10 El campo Auto-normal multivariado (o MCAR) ...............60

2.4.3 Campos no markovianos ............................................... ........................63
2.4.3.1 El campo aleatorio autorregresivo simultáneo

(SAR) ....................................................... ..........................63 2.4.3.2 El
campo aleatorio de la media móvil ......... .......................65 2.4.3.3 El campo
aleatorio de la media móvil autorregresiva .......66 2.4.3.4 El campo aleatorio del
componente de error espacial ..........66 2.4.3.5 La representación directa de un
campo aleatorio ................67 2.5 Limitación Teoremas para campos
aleatorios ............................................... ......68

2.5.1 Introducción ................................................. ......................................68
2.5.2 Algunos teoremas de límite para campos aleatorios..........................69
3 Función de Verosimilitud para Muestras Espaciales............... 73

3.1 Introducción.................................................. .............................................73
3.2 Algunas aproximaciones para la probabilidad de campos aleatorios ........76 3.2.1 La técnica
de codificación .................. .................................................... .76 3.2.2 La Aproximación
Unilateral.................................................. .............77 3.2.3 La pseudo-verosimilitud a la
Besag ........................... ......................79 3.2.4 Aspectos
computacionales ...................... .............................................80 3.3 Propiedades de
estimación de máxima verosimilitud en Muestras Espaciales...........81

3.4 Pruebas basadas en la probabilidad ........................................... ..........................81
3.5 Pruebas basadas en sumas residuales de cuadrados ........................................... .....84
4 El modelo de regresión lineal con datos espaciales ................. 85

4.1 Introducción.................................................. .............................................85
4.2 Especificación de un modelo de regresión lineal ........................................... .85 4.2.1 La
Especificación Condicional ........................................... ..............86 4.2.1.1 Hipótesis sobre
el Modelo de Probabilidad (PM) ......................86

Tabla de contenido XV
4.2.1.2 Hipótesis sobre el Mecanismo Generador de

Estadísticas (MG) ........................................... .......................87
4.2.1.3 Hipótesis sobre el Modelo de Muestreo (SM) .......................88
4.2.2 Especificación estándar de libros de texto.................................... .......88
4.3 Violación de las Hipótesis del Modelo de Muestreo ................................90

4.3.1 Introducción.................................................. ..........................................90
4.3.2 Un procedimiento de prueba de propósito general para la

independencia espacial .................................. ..........................................91
4.3.3 La reespecificación de la regresión lineal como un campo

CAR multivariante .................................. .............................93
4.3.3.1 Introducción .............................................. ..........................93
4.3.3.2 Reespecificación de las Hipótesis PM, GM y SM .......94

4.3.3.3 Probabilidad de un modelo bivariado de regresión lineal
espacial CAR........................................... .......................96
4.3.3.4 Contraste de Hipótesis en el CAR Bivariado Espacial
Modelo de regresión lineal ............................................... ... 98
4.3.3.5 Probabilidad de un CAR espacial lineal multivariable
Modelo de regresión................................................ ..........100
4.3.4 La Reespecificación de la Regresión Lineal con SAR

Residuos (el modelo de error espacial ) ........................................... .100
4.3.4.1 Introducción ............................................. ......................100
4.3.4.2 Derivación de la probabilidad ...........................................102
4.3.4.3 Equivalencia del modelo estadístico implícito en el

CAR Bivariado y el SAR Residual...................................103
4.3.4.4 Contraste de hipótesis en el modelo de error espacial ..............105

4.3.4.5 Estimadores de mínimos cuadrados generalizados ..........................106
4.3.4.6 Técnicas de Estimación Aproximada .............................108
4.3.5 La re-especificación de la regresión lineal agregando un

Retraso espacial (el modelo de retraso espacial ) .................................. ..110
4.3.5.1 Introducción .............................................. ......................110
4.3.5.2 Derivación de la probabilidad ...........................................110
4.3.5.3 Estimación ............................................... ........................113
4.3.5.4 Contraste de hipótesis.................................................. ............115
4.3.6 Modelo espacial general de Anselin.................................................. ......116
4.4 Violación de las Hipótesis del Modelo de Probabilidad..........................120

4.4.1 Introducción.................................................. ..................................120
XVI Tabla de Contenidos
4.4.2 Normalidad .................................................. ..........................................120

4.4.2.1 Generalidades ............................................... ......................120
4.4.2.2 Pruebas de desviaciones de la normalidad ...........................121 4.4.2.3

Soluciones al problema de la no normalidad .... ...............123 4.4.3 Heterocedasticidad
espacial.................................. ...............................126
4.4.3.1 Introducción ............................................. ......................126
4.4.3.2 Contrastes de Heterocedasticidad Espacial...........................128 4.4.3.3

Solución al Problema de la Heterocedasticidad Espacial
Heteroscedasticidad .................................................. ...........131 4.4.4
Invariancia espacial de los parámetros .................................. ............131 4.4.4.1 Invariancia
espacial de los parámetros de prueba ..................131 4.4. 4.2 Estimación en

Presencia de Cambios Estructurales ..........134
5 Revisión de los modelos de convergencia ÿ italianos y europeos.... 135

5.1 Introducción.................................................. ............................................135
5.2 Un análisis econométrico espacial del modelo de convergencia ÿ de

las provincias italianas .................................. ..........................................135 5.2.1 Violación
de las Hipótesis sobre la Modelo de muestreo ........... 135
5.2.2 Violación de las Hipótesis del Modelo de Probabilidad...................138
5.3 Análisis econométrico espacial de las regiones europeas

Modelo de convergencia ÿ .............................................. .............................141 5.3.1
Violación de las hipótesis del modelo de muestreo ........ ..........141
5.3.2 Violación de las Hipótesis del Modelo de Probabilidad.................143
6 Mirando hacia el futuro: una revisión de temas más avanzados

en econometría espacial .................................................. ........ 147
6.1 Introducción.................................................. ............................................147
6.2 Modelos alternativos.................................................... ....................................148
6.2.1 Modelos de datos de panel.................................... ..........................148
6.2.2 Modelos de convergencia regional ............................................. ........149 6.2.3
Modelos de espacio-tiempo .................................. ....................................151

6.2.4 Variables discretas ............................................... ..........................153
6.2.5 Externalidades espaciales ............................................... ........................153 6.2.6
Modelos bayesianos.................... .................................................... ....153
6.2.7 Técnicas no paramétricas ............................................... ..............154

Tabla de contenido XVII
6.3 Pruebas alternativas .............................................. .....................................156
6.4 Métodos alternativos de estimación ............................................... ..............159
6.5 Herramientas exploratorias ............................................... ....................................162
Apéndice: Una revisión del software disponible para el análisis

econométrico espacial .................................. ......................... 163
A.1 Introducción................................................. .............................................163
A.2 El programa SpaceStat ............................................... .........................164

A.3 GeoDa................................................... .................................................... ....164
A.4 Cajas de herramientas ............................................. ..........................................165
Referencias.................................................. ............................. 167
Lista de tablas............................................... ............................... 191
Lista de Figuras ............................................... ............................. 193
Índice de nombres ............................................... ............................. 195
Índice de materias.................................................. ............................. 201

“La armonía oculta es más poderosa que la aclamada.”

Heráclito, 500 a.C.
1 Motivación
1.1 Introducción
Hasta finales del siglo pasado los métodos econométricos espaciales eran como los seis
personajes pi randellianos en busca de autor (Pirandello, 1921). En el drama surrealista del
gran dramaturgo italiano, seis personajes deambulaban por el escenario buscando
desesperadamente un autor que les explicara lo que tenían que hacer y les diera una razón
para vivir. La situación dramática residía en que sabían exactamente lo que tenían que
hacer, ¡pero no sabían por qué tenían que hacerlo! De manera similar, hasta hace unos
años, los métodos econométricos espaciales estaban bien desarrollados en la literatura,
pero el drama fue que nadie los usó en el análisis económico aplicado dominante.
Históricamente, los métodos econométricos espaciales provienen directamente de los
desarrollos del siglo XX en la literatura estadística diseñados para considerar el problema
de la violación del modelo de muestreo clásico (el paradigma de la urna) con un gran énfasis
en las similitudes causadas por la proximidad espacial. Estos desarrollos fueron necesarios
para proporcionar el entorno adecuado para explicar los fenómenos de difusión espacial
que se encuentran con frecuencia en muchos campos aplicados, como la epidemiología, la
geografía, los estudios agrícolas, la geología, el análisis de imágenes, las ciencias
regionales, la astronomía, la arqueología y muchos otros (ver Haining, 2003 para una revisión).
Las técnicas de estadística espacial que proporcionan la base para la econometría
espacial se remontan a medio siglo y pueden fecharse convencionalmente en el artículo
seminal de Peter Whittle de 1954 (Whittle, 1954), seguido de otras contribuciones
importantes del mismo autor (Whittle, 1962; 1963), por Bartlett (1963; 1975) y por Besag
(1974) entre otros. Los principales resultados obtenidos dieron lugar a una primera
codificación en los años setenta con importantes publicaciones como los célebres libros de
Cliff y Ord (1973) y Bennett (1979). Otros libros de texto bien establecidos siguieron en los
años ochenta (Ripley, 1981; 1988; Upton y Fingleton, 1985; 1989; Griffith, 1988; Arbia, 1989
entre otros), los años noventa (Haining, 1990; Cressie, 1991) y al principio del nuevo siglo
(Haining, 2003).
El término “econometría espacial” fue acuñado por Jean Paelinck a finales de los años
setenta durante el discurso general que pronunció en la reunión anual de la Asociación
Estadística Holandesa en mayo de 1974 (ver Paelinck y Klaassen, 1979), aunque el propio
autor sugiere que la La idea ya había aparecido en una conferencia anterior (ver Paelinck,
1967). En el prólogo del primer libro enteramente dedicado al tema (Paelinck y Klaassen,
1979) se sugiere que la nueva rama de la econometría es una “mezcla de teoría económica,
formalización matemática y estadística matemática” (página vii). Hay cinco características
fundamentales de
4 1 Motivación
el nuevo campo que se puede encontrar en el libro seminal de Paelinck y Klaassen

(Paelinck y Klaassen, 1979), a saber, (i) el papel de la interdependencia espacial en los
modelos espaciales, (ii) la asimetría de las relaciones espaciales, (iii) la importancia de
factores explicativos ubicados en otros espacios, (iv) la diferenciación entre interacción ex-
post y ex-ante, y (v) la modelización explícita del espacio. Es importante señalar que algunas
de las contribuciones significativas a la economía regional (como las bien resumidas en
libros estándar como Isard (1960), Paelinck y Nijkamp (1975), Klaassen et al. (1979)), en
este período tratan principalmente con la fase de especificación poniendo un gran énfasis
en la teoría económica subyacente, en lugar de la fase de estimación estadística y prueba
de hipótesis. Cuando se reportan ejemplos de estimación estadística estos se limitan a la
aplicación de métodos existentes (OLS y ML esencialmente) al caso examinado.
Aparte de algunos ejemplos notables de la posibilidad de utilizar métodos estadísticos

espaciales en economía (como el del premio Nobel Clive Granger, en los años sesenta y
setenta; véase Granger, 1969, 1974), el libro publicado por Luc Anselin a finales de los
ochenta (Anselin, 1988), constituye sin duda un importante paso adelante en el desarrollo
histórico de la disciplina. Recopilando contribuciones anteriores, aquí por primera vez el
autor presenta un tratamiento integral de temas, como la dependencia espacial y la
heterogeneidad espacial, que son fundamentales en el análisis de datos económicos
espaciales, como se mostrará más adelante en este libro. Define la materia como “el
conjunto de técnicas que se ocupan de las peculiaridades provocadas por el espacio en el
análisis estadístico de modelos científicos regionales” (Anselin, 1988, p. 7).
Así, a finales de los años ochenta, la fase pionera de la disciplina parecía haber
concluido. Los métodos estaban allí, esperando que alguien los usara, ¡pero esto no
sucedió! ¡El drama pirandelliano!
De hecho, no fue sino hasta los años que unen los dos milenios que la corriente principal
de la econometría expresó un interés creciente en los métodos estadísticos espaciales: un
interés atestiguado por el creciente número de artículos que se refieren a importantes
problemas espaciales que aparecen en revistas econométricas y económicas aplicadas
recientes. Florax y De Vlist (2003) y Anselin et al. (2004) revisan estos documentos
minuciosamente y estudian 11 artículos en revistas econométricas y 30 en revistas de
economía aplicada ¡solo para el período posterior al año 2000!
Sin embargo, la integración de los métodos espaciales con la econometría se encuentra
en una fase temprana y aún está muy por detrás de la experimentada por los métodos de
series temporales en los años setenta después del libro pionero de Box y Jenkins (1970).
De hecho, si bien es cierto que ningún libro de texto estándar de econometría puede ignorar
las metodologías de series temporales, el tratamiento de los métodos espaciales es, por el
contrario, todavía muy raro y, cuando ocurre, no se dedican más que unos pocos párrafos
al tema. No se hace mención, por ejemplo, en algunos de los libros de texto introductorios
más recientes como Baltagi (1999), Berndt (1991), Davidson (2000), Davidson y MacKinnon
(1993), Dougherty (2002), Goldberg (1998), Gourieroux y Montfort (1995), Greene (2003),
Hayashi (2000), Hendry y Morgan (1995), Holly y Weale
1.1 Introducción 5
(2000), Johnston y Dinardo (1997), Judge et al. (1988), Ruud (2000), Seddighi et al. (2000), Spanos
(1986), Stewart y Gill (1998), Stock y Watson (2003), Thomas (1997), Verbeek (2000) y Woolridge
(2002b).
Excepciones notables en este sentido son los libros de Johnston (1991), Kmenta (1997), Maddala
(2001), Baltagi (2001), Woolridge (2002a), Gujarati (2003) y Kennedy (2003).
Johnston (1991) dedica unas pocas líneas a los problemas espaciales y señala que: “La exposición
anterior ha asumido implícitamente un marco temporal o de series de tiempo, pero el mismo fenómeno
puede surgir con datos de sección transversal, donde a menudo se lo denomina espacial .
autocorrelación.” (Johnston, 1991; pág. 305).
Kmenta (1997) también reconoce el problema de la no independencia de las observaciones
estadísticas en el espacio, afirmando que: “En muchas circunstancias, la suposición más cuestionable
del modelo anterior es que las unidades transversales son mutuamente independientes. Por ejemplo,
cuando las unidades transversales son regiones geográficas con límites trazados arbitrariamente,
como los estados de los Estados Unidos, no esperaríamos que esta suposición se satisfaga por
completo”. (página 512). Sin embargo, no se mencionan las posibles soluciones a este problema.
Maddala (2001) solo menciona brevemente el problema de la dependencia espacial entre residuos
contiguos de una regresión lineal: “Existen dos situaciones en las que se pueden correlacionar los
términos de error en el modelo de regresión. En datos de sección transversal puede surgir entre
unidades contiguas. Por ejemplo, si estamos estudiando el patrón de consumo de los hogares, se
pueden correlacionar los términos de error para los hogares del mismo barrio. Esto se debe a que los
términos de error recogen los efectos de las variables omitidas y estas variables tienden a estar
correlacionadas para los hogares.
en el mismo vecindario (debido al efecto "mantenerse al día con los Jones").
De manera similar, si nuestros datos son sobre estados, los términos de error para estados contiguos
tienden a estar correlacionados. Todos estos ejemplos caen en la categoría de correlación espacial”.
(ver Maddala, 2001, p. 228).
La segunda edición del conocido libro de texto de Baltagi sobre datos de panel incluye una breve
discusión de los problemas generados por el tratamiento de paneles espaciales. El autor afirma que
“Cuando uno comienza a observar una sección transversal de países, regiones, estados, etc., es
probable que estas unidades agregadas muestren una correlación transversal que debe abordarse.
Existe una extensa literatura que utiliza estadística espacial que trata este tipo de correlación… Los
modelos de dependencia espacial pueden utilizar una métrica de distancia económica que proporcione
datos transversales con una estructura similar a la que proporciona el índice de tiempo en una serie
de tiempo”. (Baltagi, 2001; págs. 195-197).
Gujarati presenta el problema solo brevemente al señalar que: “si por casualidad tal correlación
se observa en unidades de sección transversal, se denomina autocorrelación espacial, es decir,
correlación en el espacio y no en el tiempo” (Gujarati, 2003; p. 441) .
Kennedy (2003) advierte al lector que: “no todos los casos de errores autocorrelacionados se
relacionan con datos de series de tiempo […]. La econometría espacial se refiere al análisis de datos
espaciales en los que los errores se correlacionan con errores asociados con regiones cercanas.
Este tipo de no esfericidad se denomina correlación espacial”.
6 1 Motivación
Finalmente, Woolridge (2002a) dedica una mención al tema de la dependencia espacial en las
primeras páginas de su libro: “Una situación que requiere una consideración especial ocurre
cuando las observaciones de la sección transversal no son independientes entre sí. Un ejemplo
son los modelos de correlación espacial . Esta situación surge cuando se trata de grandes
unidades geográficas que no se puede asumir que sean independientes de una gran población,
como los 50 estados de los Estados Unidos. Es razonable esperar que la tasa de desempleo en
un estado se correlacione con el desempleo en los estados vecinos. Si bien los métodos de
estimación estadística, como los mínimos cuadrados ordinarios o los mínimos cuadrados en dos
etapas, generalmente se pueden aplicar en estos casos, la teoría asintótica debe modificarse.
Las estadísticas clave a menudo (aunque no siempre) deben modificarse […]. Para bien o para
mal, la correlación espacial a menudo se ignora en el trabajo aplicado porque corregir el problema
puede ser difícil” (Woolridge, 2002; p. 6). Este libro de texto también contiene una breve sección
que desarrolla la idea un poco más a fondo cuando se trata de las diversas formas de dependencia
entre los residuos “Como sugiere la subsección anterior, los datos de sección transversal que no
son el resultado de un muestreo independiente pueden ser difíciles de manejar.
La correlación espacial, o, más generalmente, la dependencia espacial, ocurre típicamente

cuando las unidades transversales son grandes en relación con la población, como cuando los
datos se recopilan a nivel de condado, estado, provincia o país. Es probable que los resultados
de las unidades adyacentes estén correlacionados”. (Woolridge, 2002a; pág. 134).
El único problema que se menciona en todas estas citas es el de la correlación espacial (un
concepto que se tratará extensamente en este libro), pero se ignoran muchos otros conceptos
importantes de la econometría espacial. Más importante aún, no se discuten las consecuencias
del problema en la estimación estadística y la prueba de hipótesis, de cómo probar las hipótesis
relacionadas con las relaciones espaciales y de cómo eliminar los problemas emergentes y
derivar conclusiones inferenciales correctas.
Como consecuencia de tales lagunas en la literatura estándar de los libros de texto de
econometría, el autor se siente obligado a motivar al lector hacia estos temas (una tarea inusual
cuando se trata de otras tipologías de datos económicos, como series de tiempo, secciones
transversales o datos de panel). ) al mostrar el surgimiento de la necesidad de un marco de
modelado adecuado para analizar datos espaciales. Tal es el propósito del primer capítulo
introductorio de este libro.
Un evento importante en la historia de la econometría espacial es sin duda el advenimiento de
las teorías ahora celebradas de la "nueva geografía económica", comenzando con las
"conferencias de Gaston Eyskens" de Krugman en Lovaina en 1990 (luego publicadas en
Krugman, 1991; ver también Fujta et al. al., 1999). De hecho, estas conferencias proporcionan
un marco teórico que justifica un análisis espacial de los datos económicos al abordar temas
como la convergencia regional, la concentración regional de actividades económicas y la dinámica
de ajuste. Muchas de estas teorías han llevado a la especificación de modelos susceptibles de
validación empírica y que han mostrado la importancia de desarrollar herramientas econométricas
específicas para datos distribuidos en el espacio. En el resto de este capítulo revisaremos algunos
de estos modelos concentrándonos, en particular, en los modelos de convergencia regional (Barro
y Sala-i-Martin, 1995) ya que son un ejemplo muy útil para introducir los conceptos básicos de la
econometría espacial.
1.2 Modelos económicos teóricos 7
Para motivar al lector en su estudio de los métodos econométricos espaciales, primero

analizaremos el modelo de convergencia ÿ con cierto detalle (Sección 1.2). Luego
consideraremos algunos estudios empíricos sobre la convergencia regional en la Unión
Europea y los utilizaremos para mostrar algunas de las incongruencias y los agujeros
negros dejados en este caso particular por el modelo clásico de regresión lineal (Sección 1.3).
Finalmente, concluiremos este capítulo introductorio revisando una lista de temas que han
sido excluidos del volumen y presentando el plan general de este último (Sección 1.4).
1.2 Modelos económicos teóricos que exigen análisis espacial

Técnicas Econométricas
1.2.1 Introducción
Hasta hace unos años la estadística espacial era un tema fuera del campo de interés de
los economistas aplicados. En años recientes, sin embargo, ha habido un florecimiento de
estudios económicos que, al desarrollar modelos teóricos que implican relaciones entre
variables observadas en países o regiones, han estimulado mucho el interés en la medición
y el modelado estadístico de variables espaciales. La mayoría de estos modelos están
vinculados a los desarrollos de la llamada nueva geografía económica (Krugman, 1991,
Fujta et al., 1999; Krugman y Venables, 1995; Ottavio y Puga, 1998; Puga y Venables,
1997; 1999). ; Durlauf y Quah, 1999) y al renovado interés de los economistas por los
problemas relacionados con el crecimiento económico y las condiciones bajo las cuales los
niveles de ingreso per cápita de varias regiones tienden a converger en el tiempo. Este
tema es actualmente de gran interés especialmente en relación con el reciente debate
europeo. De hecho, en muchos aspectos, una de las principales razones de una Unión
Europea y de un acuerdo sobre políticas económicas es el objetivo de reducir las
disparidades en la distribución del bienestar. Un aspecto importante de tal objetivo se
refiere a la reducción de las disparidades entre las tasas de crecimiento de los niveles de
ingreso per cápita, sobre la base de que esto, a la larga, garantizaría una reducción de las
disparidades en el bienestar. El análisis de la dispersión de los ingresos regionales se
considera a menudo como un indicador de la desigualdad en la distribución de los ingresos
personales y se utiliza como indicador en los debates de política económica (véase UE,
2005). Como consecuencia, los científicos europeos han dedicado importantes esfuerzos
de investigación empírica a este tema (como lo atestiguan libros como Fingleton, 2003, por ejemplo).
En esta sección revisaremos brevemente algunos modelos teóricos que se han
introducido para formalizar la idea de convergencia regional y proporcionar una base
rigurosa para la prueba empírica de tal hipótesis. En particular, en la Sección 1.2.2 nos
concentraremos en el modelo de convergencia popular
ÿ para una (ver Barro
revisión). Este ymodelo
Sala-i Martin, 1995a lo
se utilizará
largo del libro para ilustrar las diversas técnicas econométricas espaciales. La razón de
esta elección es de dos
8 1 Motivación
pliegue. En primer lugar, dicho modelo ha sido el más popular en el campo de la convergencia
regional e indudablemente el que ha experimentado el uso más amplio de técnicas econométricas
espaciales en la literatura (ver, por ejemplo, Fingleton, 2003; Anselin et al., 2004 ). ). En segundo
lugar, representa un ejemplo muy simple e intuitivamente atractivo que proporciona una buena
base tanto para ilustrar las peculiaridades de los diversos problemas planteados por una
regresión basada en datos espaciales como para describir las diversas soluciones que ofrecen
las técnicas econométricas espaciales.
1.2.2 El enfoque de convergencia ÿ
El enfoque de convergencia ÿ fue desarrollado por Mankiw et al. (1992) y Barro y Sala-i-Martin
(1995) a partir de las contribuciones anteriores de Solow (1956) y Swan (1956), y, desde un
punto de vista económico-teórico, se considera uno de los más convincentes para explicar la
convergencia económica de la renta per cápita.
El modelo se concibió originalmente para explicar las diferencias entre los diferentes niveles de
ingreso nacional, pero de hecho descubrió una razón de ser más fuerte cuando se usó para
explicar las diferencias entre el ingreso regional dentro del mismo país o grupo de países. De
hecho, el modelo de crecimiento neoclásico predice la convergencia condicional al único estado
estacionario1 de economías caracterizadas por los mismos parámetros estructurales en términos
de gustos, dotaciones y tecnologías. Sin embargo, el supuesto de condiciones estructurales
uniformes puede aceptarse más fácilmente cuando se refiere a regiones dentro de un país que
entre países, como lo reconocen, por ejemplo, Barro y Sala-i-Martin (1995) cuando afirman:
“aunque Si existen diferencias en tecnologías, preferencias e instituciones entre regiones, es
probable que estas diferencias sean menores que entre países (Barro y Sala-i-Martin, 1995; p.
382).
También comentan explícitamente: “Es más probable que la convergencia absoluta se aplique
entre regiones dentro de los países que entre países”.
El marco teórico se basa en el modelo neoclásico de Solow Swan de crecimiento a largo
plazo (Solow, 1956; Swan, 1956). El modelo asume tasas de ahorro exógenas y una función
de producción basada en la productividad decreciente del capital y rendimientos constantes a
escala. Bajo estos supuestos, el modelo predice que, a largo plazo, el ingreso per cápita de una
economía converge hacia su estado estacionario.
El modelo de Solow-Swan supone tasas de ahorro constantes (dadas exógenamente) y

considera el caso de una economía cerrada constituida por regiones o países aislados.
Formalicemos este supuesto definiendo los parámetros estructurales de una economía como:
(i) la tasa de ahorro (digamos, s), (ii) la tasa de depreciación del capital (digamos ), d
L
y (iii) el crecimiento de la población definido como n = , L que representa la fuerza laboral
L
y L su derivada con respecto al tiempo.
1
Un estado estacionario se define como la situación en la que todas las variables crecen a tasas constantes.
El modelo también asume que cada país (o región) dentro de la economía se

caracteriza por la misma función de producción. Si definimos el stock de capital como K
y el producto como Y, entonces, como consecuencia de los supuestos anteriores, cada
país (o región) también mostraría los mismos valores de estado estacionario para el capital
, y para el ingreso per cápita definido como Y.
Relación laboral K , definida como k = y=
L L
Introduzcamos ahora una expresión explícita para la función de producción y
supongamos que la relación técnica entre los insumos (trabajo y capital) y el producto
está bien descrita por una función de producción tipo Cobb-Douglas (Douglas, 1934). En
su formulación básica, esta función se caracteriza por rendimientos constantes a escala
y se define como:
un 1 un
yfk= =AK( )L ÿ (1.1)
siendo A el nivel de tecnología (inicialmente asumido como una constante) y a ( 0 ÿ a ÿ

1 ) un parámetro que representa la elasticidad de la producción con respecto al stock de
capital.
Una segunda ecuación fundamental en el modelo es la función de acumulación del
capital físico dada por:
K = yo - dk (1.2)
siendo I el nivel de los flujos brutos de inversión y K la derivada del stock de capital con
respecto al tiempo. Así, en cada período de tiempo, el crecimiento del capital físico es
igual a la cantidad de flujos brutos de inversión menos la depreciación del capital.
Suponiendo que la inversión es igual al ahorro total y que el ahorro total es proporcional
al ingreso, tenemos:
= = sAK L ÿ 1
I sy un un
(1.3)
y por lo tanto:
=
K sAK LK un 1ÿ un
ÿ
d (1.4)
Para estudiar la evolución de la renta per cápita y de la economía, consideremos la

relación:
k k L k
=ÿ=ÿ
norte (1.5)
k k L k
Multiplicando ambos lados por k obtenemos
k
kk = knk ÿ=ÿ
nk (1.6)
k L
y, usando la Ecuación (1.2) se obtiene:

10 1 Motivación
IK d
ÿ
k= ÿ
nk (1.7)
L
Sustituyamos ahora la Ecuación (1.3) en la Ecuación (1.7). Tenemos:
SAK L 1 un un
dk
ÿ
k= ÿÿ=
( nk sak knÿ + d
un
) (1.8)
L L
Finalmente, al dividir ambos lados por k, obtenemos una expresión formal del crecimiento del
ÿ k, como:
capital, digamos
k 1
== sak
ÿ
( ÿ +d norte)
un
ÿ k (1.9)
k
Dado que, de la Ecuación (1.1), el crecimiento de y es proporcional al crecimiento de k, entonces

la Ecuación (1.9) también describe la tasa de crecimiento del ingreso per cápita.
Si asumimos que los parámetros estructurales s y n, y el nivel de tecnología A son
constantes en el tiempo, la ecuación (1.9) implica que las regiones con un valor inicial más
ÿ k y,
bajo de la relación capital-trabajo tienen tasas de crecimiento per cápita más altas tanto,
por lo
por lo
tanto, tienden a alcanzar o “convergir” a aquellos con relaciones capital-trabajo más altas.
En un sentido más amplio, al introducir la idea de “convergencia condicional”, el modelo
neoclásico predice que cada economía converge hacia su propio estado estacionario y que la
velocidad con la que se produce esta convergencia es inversamente proporcional a la distancia
del propio estado estacionario.
Este modelo básico se ha ampliado para tener en cuenta el progreso tecnológico,
dando lugar a la siguiente expresión:
ˆ
ÿ = ÿ sAk
() 1 ÿ +(+xn d)
ˆ
un
(1.10)
k
ˆ es una versión transformada de la relación capital-trabajo definida como

donde k
ˆ k k
k= = , y A(t) es un término tecnológico que crece a una tasa constante x
En( ) LA (t )
(ver, por ejemplo, Barro y Sala-i-Martin, 1995, p. 32, para más detalles)
Al considerar una aproximación logarítmica lineal de la Ecuación (1.10) en la vecindad del
estado estacionario, obtenemos (ver Barro y Sala-i-Martin, 1995; p. 36, para la derivación):
ˆ
ˆ
[ ˆ ]
= dk en(
ÿ ÿ k ÿÿ
(1.11)
ÿ k dt b ln
) /ÿ ÿ ÿ ÿ
ÿ
ˆ*ÿ
ÿ k ÿÿ
ÿ
ÿ
ÿ ÿ
ˆ * ˆ
, y el
donde ln representa el logaritmo natural, k el valor de estado estacionario de k
el coeficiente b se puede obtener de la expresión b = (1ÿ a)(x + n + )d.
Definamos ahora, por analogía con el término k , una versión transformada de la

producción per cápita que da cuenta de los cambios tecnológicos y nos referiremos a esto
ˆ Y . Si sustituimos esta expresión en
cantidad con el símbolo aa = =
En( ) LA (t )
Ecuación (1.10) y utilizando la función Cobb-Douglas (1.1), obtenemos una ecuación diferencial,
expresada en términos de ln[yˆ(t)], que admite solución en el punto:
ÿbt * ÿbt
ln[ yt
] ˆ( ) (1 e )ln(+ˆtu) y
ln[ˆ(0)] (1.12)
*
yˆ . donde
yˆ El
representa
coeficiente
el b
valor
en la
deecuación
estado estacionario
(1.12) proviene
de
de la linealización logarítmica de la ecuación ˆ
ción (1.10) alrededor del estado estacionario y determina la velocidad con la que k se mueve
ˆ*
hacia su valor de estado estacionario ( k ). Por esta razón, se denomina velocidad de convergencia
(ver Barro y Sala-i-Martin, 1995; Apéndice del Capítulo 1). Usando la función de producción Cobb-
Douglas simple (1.1) encontramos que el coeficiente de velocidad de convergencia para el
producto per cápita y es igual a la velocidad de convergencia para la relación capital-trabajo k.
Además, su valor no depende del nivel de tecnología A(t).
Un segundo parámetro crucial para juzgar la convergencia de la economía está representado

por el llamado tiempo de vida media definido como el tiempo que es necesario para que ln[ ] yˆ(t)
esté a medio camino entre el valor inicial ln[yˆ( 0)] y el valor de estado estacionario [
ln yˆ ].* En otras palabras, representa el tiempo que tarda la mitad del ini
Se debe eliminar la brecha potencial en el producto per cápita.
ÿbt
Este valor debe satisfacer la condición de que la e = 0,5 , como es evidente de
Ecuación (1.12). Resolviendo con respecto a t tenemos:
1
= en (2) = 0,69 b
ÿ
media vida
ÿ
(1.13)
b
Una de las limitaciones del modelo (1.12) es que, de forma poco realista, supone tasas de ahorro
constantes. Para eliminar esta limitación, algunos autores han tratado de extender el marco
anterior asumiendo que la tasa de ahorro es función del stock de capital per cápita k. El modelo
parte de un sistema de dos ecuaciones diferenciales que explica el comportamiento de la relación
capital-trabajo tecnológicamente aumentada
ˆ
k y del consumo per cápita tecnológicamente aumentado cˆ , definido como
ˆ
ˆ = C , C que representa el consumo y L = LA t( ) .
C ˆ
L
Esto nuevamente lleva a expresar el producto per cápita como:
ÿbt *
ln[ yt
] ˆ( ) =ÿ
(1 e )ln(ÿporˆ )cierto
+ y
ln[ˆ(0)] (1.14)
Para una demostración basada en la expansión de Taylor en torno al estado estacionario, véase
Barro y Sala-i-Martin (1995; p. 87).
12 1 Motivación
En cualquier momento t ÿ 0, el término ln[yˆ(t)] en la ecuación (1.14) parece ser un

promedio ponderado del valor inicial de la producción per cápita (es decir, ln[ ] yˆ( 0) )
( ) * proporcionados eÿ y ( por
y del valor de estado estacionario (es decir, ln yˆ ), con pesos
bt
eÿ 1ÿ ) bt . El peso sobre el valor inicial, por lo tanto, disminuye expo
nencialmente a la tasa b. La ecuación (1.14) coincide así con la ecuación (1.12)
aunque, en este nuevo escenario, la velocidad de convergencia depende de los
parámetros tecnológicos y de las preferencias del consumidor y no sólo de los
parámetros estructurales de la economía.
Si consideramos todo el periodo entre el tiempo 0 y el tiempo T, obtenemos que el
la tasa de crecimiento promedio de la producción per cápita y durante el intervalo viene dada por:
( ÿ ÿ( 1) y T 1
ÿ
mi
ÿ
bt ) ÿÿ
yˆ
*
ÿ = +X
en ÿ
ÿ
ÿ
(1.15)
en ÿ ÿ
T ÿ yˆ(0) ÿ T ÿ yˆ(0) ÿ
siendo x la tasa de crecimiento ya definida del término tecnológico (ver Barro y Sala-i-
Martin, 1995; p. 80-81). Si el término x, la velocidad de convergencia b y la duración
del intervalo de tiempo T son constantes, entonces el efecto de la condición inicial yˆ y
el* modelo predice con condicional depende de
la vergencia de la posición de estado estacionario.
Escribamos ahora la Ecuación (1.14) en forma operativa expresándola en tiempo

discreto (por ejemplo, años). Si volvemos a parametrizarlo de forma conveniente,
obtenemos:
ÿy ÿ
'- ÿ en[y ]t
ln ÿ t ÿ (1.16)
ÿ=
ÿ yt ÿ
con t = 1, 2, …, T, y
ÿ
' 1 = x + -(mi ÿ
bt )[en(yˆ )+ x *
]t
se supone que es constante en todos
regiones. El parámetro ÿ está vinculado a la velocidad de convergencia por la relación
( eÿ
= ÿ 1ÿ ) bt e, inversamente, b =ÿ
ln(1+ ÿ ) .
Embarcacion
ÿ t
En particular, si consideramos solo dos observaciones al comienzo y al final del
período de tiempo, la ecuación (1.6) implica que la tasa de crecimiento promedio en el
intervalo de longitud T está dada por:
1 ÿ yT ÿ
en ÿ= ÿ
' en
ÿ
[y] 0 (1.17)
T
ÿ
ÿ
ÿy0 ÿ
' = + x (1 (1 )
ÿbT ÿbT
ˆ en(1+ ÿ T ) .
ÿ ÿ
e e
con ÿ ) en( )y * y ÿ =ÿ y por lo tanto b =ÿ
T T T
Partiendo de esta base conceptual, autores como Mankiw et al. (1992) y Barro y Sala-i-
Martin (1995) sugirieron aumentar la Ecuación (1.17) para
Incluir una perturbación aleatoria que refleje cambios inesperados en las condiciones
o preferencias de producción y estimarla utilizando observaciones transversales. Así
propusieron el siguiente modelo estadístico:
ÿy Yo,
ÿ
1 en = µ + ÿ (1.18)
ÿ ÿ
o ,ti , i
T
ÿy
ÿ
0,i ÿ ÿ
donde yt,i (t=0,…, T; i=1,…,n) representa el ingreso per cápita en el momento t en la

µ región 0,T,representa el componente sistemático del modelo dado por: i,
bT
' (1 mi
ÿ
)
=
µ ÿ en y
(1.19)
ÿ
0, yo
0, Yo
,
T
con b la velocidad de convergencia, y la ÿparte

i no sistemática del modelo.
De las Ecuaciones (1.18) y (1.19) obtenemos finalmente:
bT
y Yo, ÿ
ÿ
ÿ
(1 mi
ÿ
1 en ' = -ÿ ) En y + ÿ (1.20)
ÿ ÿ
0,i i
T T
ÿ y 0,i ÿ
ÿ ÿ
Desde un punto de vista inferencial, la Ecuación (1.20) suele estimarse siguiendo dos
estrategias posibles. Se estima directamente a través de mínimos cuadrados no lineales
bT
o, alternativamente, se vuelve a parametrizar configurando ÿ(1 =)ÿ)ÿ mi
y
ÿ
) (y por lo tanto
en(1+ ÿ '
b =ÿ
ÿ =T ÿ . En este segundo caso la Ecuación (1.20) se convierte en:
T
ÿy ÿ
, en ÿ Yo = ÿ + ÿ en + y ÿ (1.21)
ÿ ÿ
0,i i
ÿ y 0,i ÿ ÿ
y los parámetros se estiman mediante Mínimos Cuadrados Ordinarios (Barro y Sala-i

Martin, 1995).
De acuerdo con la formalización contenida en la Ecuación (1.21), se dice que los
ÿ significativamente
datos favorecen la convergencia absoluta si la estimación de es negativa y
diferente de 0. Por lo tanto, podemos usar los procedimientos estadísticos habituales
de prueba de hipótesis para validar la economía. -hipótesis teórica de la convergencia.
Específicamente, si se rechaza la hipótesis
ÿ nula (= 0) a favor de la hipótesis alternativa
( < 0), podemos concluir
ÿ rápido que empíricamente
las ricas, sinono
quesolo queconvergen
todas las regiones
a elpobres
mismocrecen más
nivel de
ingreso per cápita.
Ahora echemos un vistazo más de cerca a la Ecuación (1.21) y consideremos las

hipótesis formuladas por Barro y Sala-i-Martin (1995) al usarla con fines inferenciales.
Para aplicar correctamente los estimadores MCO al tratar con la
14 1 Motivación
modelo de probabilidad, los autores asumen implícitamente que el componente no sistemático ( i)

ÿ muestreo, 2
ÿ En palabras
se distribuye normalmente
asumen(0,
que) independientemente de lny0,i.
{ n } son observaciones Además,
independientes
de los al tratar conde
del“Suponemos
autores: modelo el modelo de
probabilidad.
que… [el
error]… tiene media cero, la misma varianza […] para todasÿlas
1, economías,
ÿ
2 ,...,
ÿ el tiempo
y es independiente
y entre en
economías” (Barro y Sala-i-Martin, 1995 ; pág. 31).
La hipótesis formulada sobre el modelo de muestreo es particularmente crucial y los propios

autores admiten que a menudo es poco realista en casos empíricos (ver Barro y Sala-i-Martin, 1995;
p. 385). Muchos otros autores que se dedicaron a validar el modelo teórico con base en datos
observacionales señalaron esto como una debilidad en el enfoque. Por ejemplo, De Long y Summers
(1991) afirman que: “Muchas regresiones comparativas entre países han asumido que no hay
dependencia entre los residuos y que cada país proporciona una observación tan informativa e
independiente como cualquier otro. Sin embargo, es difícil creer que el crecimiento económico belga
y holandés alguna vez diverja significativamente, o que aparezcan brechas sustanciales de
productividad en Escandinavia. Las variables omitidas que se capturan en los residuos de la
regresión parecen tener ex ante valores similares en los países vecinos. Esto sugiere que los
residuos en las naciones cercanas estarán correlacionados” (p. 456).
Mankiw también comenta que: “para que los errores estándar informados sean correctos, los
residuos de Canadá no deben estar correlacionados con los residuos de EE. UU. Si los residuales
de los países están de hecho correlacionados, como es plausible, lo más probable es que los datos
contengan menos información de la que indica el error estándar informado”. (ver Mankiw, 1995; p. 304)
Finalmente Temple (1999; p. 130) reconoce que: “sin más evidencia de que las perturbaciones
son independientes, los errores estándar en la mayoría de las regresiones de crecimiento deberían
ser tratados con cierto grado de desconfianza”.
Debido a la importancia primordial de este tema, ahora lo ilustraremos más a fondo haciendo
referencia a dos conjuntos de datos regionales europeos.
1.3 Un análisis de convergencia ÿ de las regiones

europeas e italianas
1.3.1 Introducción
En esta sección presentamos algunos conjuntos de datos regionales relacionados con el crecimiento
económico que se utilizarán a lo largo del libro para ilustrar los problemas que surgen al cuantificar
las relaciones en el espacio. Más específicamente, el objetivo es ilustrar algunas de las
características geográficas del PIB y los datos de crecimiento utilizados en el análisis de
convergencia estándar e introducir la necesidad de correcciones apropiadas en consideración a su
naturaleza espacial.
Una importante fuente de información sobre la distribución espacial de la renta y la riqueza a
nivel europeo se puede encontrar en la base de datos REGIO. RE GIO es la base de datos
estadística regional armonizada de Eurostat que cubre los principales aspectos de la vida económica
y social en la Unión Europea. Fue creado en 1975
1.3 Un análisis de convergencia ÿ de las regiones europeas e italianas 15
y actualmente se divide en diez dominios estadísticos: demografía, cuentas económicas, desempleo,

encuesta por muestreo de población activa, estadísticas de energía, transporte, agricultura, condiciones
de vida, turismo y estadísticas sobre investigación y desarrollo. La base de datos se basa en la
Nomenclatura de Unidades Territoriales Estadísticas (NUTS): un sistema coherente creado para
proporcionar una subdivisión geográfica del territorio de la UE. El sistema NUTS es una clasificación
jerárquica. Cada Estado miembro de la UE se divide en varias regiones en el nivel NUTS-1. Cada uno
de ellos se divide a su vez en subregiones en el nivel NUTS-2 y éstas, a su vez, en áreas más
pequeñas en el nivel NUTS-3 (Eurostat, 2002). Hay 78 regiones de la Unión Europea en el nivel
NUTS-1, 211 unidades administrativas básicas en el nivel NUTS-2 y 1093 subdivisiones de unidades
administrativas básicas en el nivel más fino de desagregación espacial NUTS-3.
Se analizarán dos conjuntos de datos distintos extraídos de la base de datos REGIO. El primero se
refiere a una serie temporal del PIB per cápita en las 92 provincias italianas, es decir, las regiones de
nivel NUTS-3 de la clasificación oficial de la UE. En la Figura 1.1 se presenta un mapa de las provincias
italianas. El segundo conjunto de datos describe la dinámica del PIB per cápita en 129 regiones
europeas NUTS-2 de 10 países europeos cuyo mapa se muestra en la Figura 1.2. Elegimos
deliberadamente dos niveles diferentes de desagregación espacial porque, como puede imaginarse
fácilmente, las conclusiones pueden ser muy diferentes si observamos un fenómeno económico en un
nivel de detalle geográfico grueso o fino.
En las siguientes dos secciones analizaremos el crecimiento del PIB en los dos conjuntos de datos.
aplicando el marco de convergencia ÿ descrito en la sección anterior.
Figura 1.1. Mapa de las 92 regiones italianas de nivel NUTS-3 según la clasificación oficial de la
UE (provincias).
dieciséis 1 Motivación
Figura 1.2. Mapa de 129 regiones europeas de nivel NUTS-2 de la clasificación oficial de la UE
de 10 países europeos.
1.3.2 Un análisis de convergencia ÿ de las provincias italianas NUTS-3

(1951-1999)
Comencemos con un análisis descriptivo del fenómeno del crecimiento regional en las
provincias italianas durante el período 1951-1999. La Tabla 1.1 presenta algunas
estadísticas descriptivas y las Figuras 1.3 y 1.4 muestran el patrón geográfico de los
ingresos per cápita al principio y al final. del período observado y sus tasas de crecimiento
relativas, respectivamente.
La Figura 1.3 está dibujada como un mapa de cuartiles y muestra un patrón marcado
centro-periferia en ambos años: El centro está situado en la parte norte del país, lo que
refleja la conocida dicotomía italiana entre el norte rico y las provincias más pobres del
sur. . Esta característica es evidente en ambos años, con la única diferencia de un cambio
de las provincias del noroeste a las del noreste durante el período. Una de las
características más notables de este conjunto de datos es que las provincias ricas tienden
a agruparse en el espacio y, como consecuencia, todo el mapa muestra una tendencia
geográfica bastante evidente que disminuye de norte a sur. De hecho, al mirar los dos
mapas, uno tiene la impresión visual de que el ingreso per cápita se distribuye
continuamente en el espacio con solo unas pocas excepciones. Esta tendencia de las
regiones ricas a estar rodeadas por otras regiones ricas (y, por el contrario, las regiones
pobres a estar rodeadas por regiones pobres) no es en modo alguno peculiar del estudio
de caso examinado aquí y ciertamente representa una de las características más comunes
mostradas por datos económicos espaciales. La continuidad de los fenómenos económicos
en el espacio representa la evidencia empírica de la característica descrita en los diversos libros de texto de econometría.
Tabla 1.1. Estadísticas descriptivas de los ingresos per cápita y tasas de crecimiento en las 92
provincias italianas (años 1951 y 1999).
El ingreso per capita
segundo tercer Coeficiente

Período mínimo Media máxima Curtosis asimétrica
primer cuartil
cuartil cuartil de variación
1951 3.28 14.00 6.97 4.72 5.90 7.17 0.38 1.14 3.89
1999 15.77 49.13 30.97 23.08 29.75 35.57 0.27 0.10 2.23
Tasa de crecimiento
segundo tercer Coeficiente

Período mínimo Media máxima Curtosis asimétrica
primer cuartil
cuartil cuartil de variación
1951-99 1.82 4.43 3.16 2.94 3.33 3.63 0.16 -0.40 0.03
Provincias italianas Provincias italianas

primer cuartil primer cuartil
segundo cuartil segundo cuartil
tercer cuartil tercer cuartil
cuarto cuartil cuarto cuartil
(un) (b)
Figura 1.3. Distribución del PIB per cápita (expresado en logaritmo natural) en las 92 provincias
italianas; (a) año 1951 y (b) año 1999.
revisado en la Sección 1.1 (Kmenta, 1997, Maddala, 2001, Johnston, 1991, Baltagi, 2001,
Kennedy, 2003 y Woolridge, 2002a). Más adelante en el libro se hará referencia a esta
característica como “dependencia espacial”.
La Figura 1.4 muestra las tasas de crecimiento registradas en el intervalo de tiempo
observado. Aquí el patrón es muy diferente, con las tasas más altas distribuidas irregularmente
en la parte este del país. Una mirada más cercana a las Figuras 1.3 y 1.4 revela evidencia de
convergencia ÿ en el sentido de que algunas de las regiones más pobres (a saber, aquellas
distribuidas a lo largo del mar Adriático) experimentaron un crecimiento más rápido que la
mayoría de las regiones más ricas en el norte durante el tiempo observado. intervalo.
18 1 Motivación
Provincias italianas
primer cuartil
segundo cuartil
tercer cuartil
cuarto cuartil
Figura 1.4. Distribución de las tasas de crecimiento del PIB per cápita de las provincias (log) para las 92
provincias italianas durante el período 1951-1999.
Obviamente, se requiere un análisis más formal para corroborar esta impresión visual y
cuantificar la velocidad de convergencia.
El gráfico 1.5 muestra la dinámica de la dispersión del PIB real per cápita (medida en
términos logarítmicos) durante el período 1951-1999, medida sintéticamente por el coeficiente
de variación (la relación entre la desviación estándar y el promedio nacional).
El análisis de la trayectoria temporal de la variabilidad geográfica se refiere a menudo en la
criticado duramente,
ÿ convergencia
por ejemplo,
lit ( Barro
por Arbia
y Sala-i-Martin,
(2001b), es1995),
el adoptado
un enfoque
en elque,
informes
aunque
oficiales
de la UE (véase, por ejemplo, UE, 2005). Las desigualdades regionales se redujeron en más
de la mitad durante todo el período, pero la marcada tendencia hacia la convergencia se limitó
al período comprendido entre 1951 y 1970. Esto se debe en parte al importante esfuerzo de
desarrollo territorial en el Sur (a través de la Cassa del Mezzogiorno) y en parte al desarrollo
de las regiones nororientales. El período subsiguiente se caracterizó, en cambio, por una
sustancial invariancia de las desigualdades de ingresos.
Finalmente, la figura 1.6 muestra el diagrama de dispersión de las tasas de crecimiento

registradas en las 92 provincias italianas durante el período 1951-1999 frente a su PIB per
cápita inicial. El gráfico muestra una marcada tendencia a la disminución lineal e indica cómo
las provincias más pobres son las que experimentan un crecimiento más rápido en el período
considerado, comenzando así a alcanzar a las más ricas.
Todos los elementos considerados en este primer análisis descriptivo por lo tanto corrobo
evaluar la idea de una convergencia a largo plazo de las provincias italianas.
0.19 0,95
0.9
0.17
0.85
0.15 0.8
0.75
0.13
0.7
0.11 0,65
1951 1953 1955 1957 1959 1961 1963 1965 1967 1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999
0.6
0.09
0,55
0.07 0.5
coeficiente de variación
Figura 1.5. Provincias italianas ÿ-convergencia de la renta per cápita en el período 1951-99 (Coeficiente
de variación).
5
4,5
4
3,5
3
crecimiento
1951-1999
tasas
de
2,5
2
1,5
1
0,5
0
8 8,2 8,4 8,6 8,8 9 9,2 9,4 9,6 9,8
Logaritmo natural del PIB per cápita de 1951
Figura 1.6. ÿ-convergencia entre las provincias italianas. Diagrama de dispersión de la tasa de
crecimiento durante el período 1951-1999 versus el logaritmo natural del PIB per cápita (1951).
Pasando a un análisis de convergencia ÿ más formal, comenzamos calculando las

estimaciones de mínimos cuadrados ordinarios de los parámetros de convergencia de la
ecuación (1.21) utilizando el conjunto de datos que se refiere a las 92 provincias italianas.
También juzgaremos el desempeño de la regresión estimada calculando algunas de las
pruebas estándar de errores de especificación.
La Tabla 1.2 muestra los resultados del procedimiento de estimación de MCO transversal.
La variable dependiente del modelo es la tasa de crecimiento del porcentaje de la provincia.
20 1 Motivación
Tabla 1.2. OLS Estimaciones de la regresión de convergencia ÿ del ingreso per cápita en las 92 provincias italianas (1950-1999).
(Los números entre paréntesis se refieren a los valores p).
-0,016
ÿ (Constante)
(0,735)
-0,909
ÿ
(0,000)
Velocidad de convergencia (*) 0.047
Media vida (**) 14,74
Bondad de ajuste
R2 ajustado 0.366
Criterio de Schwartz -105.890
Diagnóstico de regresión
2,133
Prueba de normalidad de Jarque-Bera
(0,344)
0,050
Prueba de heteroscedasticidad de Breusch-Pagan
(0.822)
en(1 + ÿ ) 1
= en (2) = 0,69b _
ÿ
(*) Velocidad de Convergencia b =ÿ

; (**) Vida media = vida media ÿ
T b
ingreso per cápita, mientras que el predictor es el nivel inicial de ingreso per cápita (expresado en
logaritmos naturales). Ambas variables están escaladas al promedio nacional.
Nuestros resultados parecen estar muy en línea con los hallazgos previos sobre el desarrollo de
las regiones/provincias italianas. El coeficiente de ÿ-convergencia para todo el período es altamente
significativo con el signo negativo esperado, lo que confirma la presencia de convergencia en los años
1951-1999. Su valor (-0,909) implica una tasa de convergencia anual del 4,7% y una vida media de
14,74 años.
La Tabla 1.2 también informa algunos diagnósticos para identificar especificaciones erróneas en el
modelo de regresión. En primer lugar, la prueba de normalidad de Jarque-Bera (Jarque y Bera, 1980)
no es significativa. En consecuencia, podemos interpretar con seguridad los resultados de las diversas
pruebas de errores de especificación que dependen del supuesto de normalidad. En segundo lugar,
dado que no se revelaron problemas con respecto a la falta de normalidad, se da el estadístico de
Breusch-Pagan (Breusch y Pagan, 1979). Su valor también está lejos de ser significativo, lo que lleva a
aceptar el supuesto de homocedasticidad.
El resultado de la regresión, por lo tanto, informa un buen ajuste y ninguna advertencia de error de
especificación. Pero, ¿qué pasa con la hipótesis de independencia asumida en el modelo de muestreo?
Cuando se trata de un modelo de regresión dinámico basado en series temporales de datos, es
práctica habitual contrastar el supuesto de independencia del componente no sistemático (ver Sección
1.2) con el de una dependencia temporal entre residuos.
En este caso, el supuesto de independencia se prueba formalmente a través de la prueba de Durbin
Watson (Durbin y Watson, 1950, 1951) o a través de las otras alternativas.
Residuales (1951/99)
Más de -1 Estándar desarrollo
De -1 a 0 Estándar desarrollo
De 0 a 1 Estándar desarrollo
Más de 1 estándar desarrollo
Figura 1.7. Mapa de los residuos estandarizados empíricos de la Ecuación (1.21) estimados en las
92 provincias italianas. Las tasas de crecimiento se han medido para el período 1950-1999. Los
residuos grandes se identifican como aquellos que exceden más o menos una desviación estándar
y se muestran en blanco y negro respectivamente.
propuestos en la literatura (por ejemplo, los propuestos por Box y Pierce, 1970; Wallis, 1972;
Ljung y Box, 1978; Kobayashi, 1991 entre otros).
Por el contrario, cuando se trata de una regresión estimada a partir de datos espaciales, los
libros de texto de econometría sugieren que no se realicen pruebas rigurosas de la independencia
de los residuos de la regresión porque no existe una alternativa adecuada. Ante esta carencia,
comencemos, al menos por el momento, con una simple inspección visual del mapa geográfico
de los residuos estandarizados. Este mapa se muestra en la Figura 1.7.
Una inspección visual de la Figura 1.7 revela un patrón geográfico de residuos bastante
distinto. De hecho, los grandes residuos geográficos positivos se concentran en las regiones del
extremo sur de la península (Cerdeña, Sicilia y Apulia), mientras que los grandes residuos
negativos se concentran en las zonas central y norte correspondientes a gran parte del Véneto,
Emilia-Romagna y Regiones de Umbría. Además, en pocos casos podemos observar grandes
residuos positivos (los marcados en negro en el mapa) yuxtapuestos a grandes residuos negativos
(los marcados en blanco). Los residuos se distribuyen de manera bastante regular en el espacio
con una transición suave desde unos pocos “puntos calientes” de valores positivos grandes
(ubicados en el sur) a valores más bajos, dando la impresión visual de una especie de continuidad
espacial.
A partir de estas consideraciones, parece bastante claro que la relación estimada es bastante
insatisfactoria a pesar de los buenos resultados del modelo medidos por los diagnósticos del
modelo estándar. De hecho, el modelo tiende a sobreestimar (produciendo residuos negativos)
las tasas de crecimiento en algunas provincias ubicadas en
22 1 Motivación
proximidad entre sí (es decir, las zonas centro y norte). Por el contrario, la relación tiende a
subestimar las tasas de crecimiento (produciendo residuos positivos) en algunas otras
provincias geográficamente ubicadas en el sur. En estas condiciones, la relación estimada en
la regresión anterior no puede tomarse como una buena representación de la realidad. De
hecho, la especificación lineal no es capaz de capturar la relación entre las dos variables o,
alternativamente, se han omitido algunas variables explicativas relevantes relacionadas con la
geografía del fenómeno. Note que no podemos cambiar la especificación del modelo en el
caso específico que estamos analizando porque el modelo económico-teórico que queremos
probar requiere la linealidad de la relación como se explica en la Sección 1.2. Así, la única
posibilidad de mejorar el desempeño del modelo descansa en la consideración explícita del
espacio como una variable adicional que explica por qué algunas regiones que ocupan una
posición definida en el espacio crecen más rápido de lo que deberían según la teoría
económica asumida.
Tales consideraciones nos motivan hacia un análisis más formal de la peculiaridad del
espacio en el estudio de las relaciones económicas.
1.3.3 Un análisis de convergencia ÿ de las regiones europeas NUTS-2

(1980-1996)
Consideremos ahora el segundo conjunto de datos que se refiere a las regiones de la Unión
Europea en un nivel NUTS-2. En este análisis, consideramos nuevamente el PIB per cápita
(medido en paridades de poder adquisitivo) de 129 regiones europeas para el período 1980-1996.
Al igual que los datos italianos considerados en la Sección 1.3.2, este segundo conjunto de
observaciones también se deriva de la base de datos REGIO proporcionada por Eurostat y se
refiere a las unidades territoriales de diez países europeos (es decir, Bélgica, Dinamarca,
Francia, Grecia, Alemania Occidental, Italia, Luxemburgo, Portugal, España y los Países
Bajos) al nivel NUTS-2.
Hemos elegido la subdivisión NUTS-2 en este segundo análisis porque puede
considerarse lo suficientemente fina como para observar efectos espaciales a nivel continental.
Comencemos de nuevo con un análisis descriptivo basado en la convergencia
ÿ de las
regiones europeas durante el período considerado. La Figura 1.8 muestra el coeficiente de la
dinámica de variación durante el período 1980-1996. Tras una fase en la que las desigualdades
regionales parecen permanecer constantes, a partir de 1986 se observa una tendencia
decreciente del coeficiente de variación y, por tanto, una disminución de las disparidades
económicas entre regiones.
Consideremos además una inspección visual del patrón geográfico del PIB en el año inicial
(1980) y en el año final del período (1996), y de la tasa de crecimiento observada durante
todo el período. Los mapas del PIB en los dos años se reportan en las Figuras 1.9ay 1.9b.
Ambos mapas muestran una tendencia espacial con un marcado patrón centro-periferia. De
hecho, los valores más altos del PIB en ambos años se concentran en el centro del continente
(ubicado entre el sur de Alemania, el este de Francia y el norte de Italia) con un descenso
suave hacia los valores más bajos que pueden observarse en las regiones periféricas del
continente.
0,12
0,11
0,1
0,09
0,08
0,07
0,06
Figura 1.8. ÿ-convergencia de la renta per cápita de las regiones europeas durante el período 1980-
1996 (coeficiente de variación).
La Figura 1.10 reporta las tasas de crecimiento registradas en el período de 1980 a 1996.
De manera similar a la Figura 1.4, las regiones caracterizadas por niveles iniciales más bajos de PIB
per cápita (por ejemplo, las regiones españolas) experimentaron tasas de crecimiento más altas en
el intervalo de tiempo, mientras que las regiones con un alto nivel de PIB per cápita en 1980
(notablemente Francia y el norte regiones italianas) muestran bajos niveles de crecimiento en el intervalo.
Dado que las Figuras 1.8 a 1.10 muestran evidencia de convergencia, pasamos a una forma formal
ÿ -Análisis de convergencia estimando la Ecuación (1.21) en este nuevo conjunto de datos.
Para empezar, la figura 1.11 muestra el diagrama de dispersión de la tasa de crecimiento con
respecto al nivel inicial de ingreso per cápita y corrobora aún más la hipótesis de convergencia.
De hecho, las regiones más pobres (correspondientes a Portugal) muestran mayores tasas de
crecimiento y las más ricas (correspondientes a los Países Bajos) crecen relativamente menos:
casi un 80% más lentamente que las más pobres.
Los principales resultados de los procedimientos de estimación de OLS se resumen en la Tabla 1.3.
Los resultados empíricos destacan la convergencia. La estimación del coeficiente
ÿ es negativa
y altamente significativa. La velocidad de convergencia implícita es del 1,87% y la vida media es
de 36,96 años. Este resultado está de acuerdo con la “ley empírica del 2%” observada por Barro
y Sala-i-Martin (1995) y Sala-i-Martin (1996)2 .
La Tabla 1.3 también muestra algunos diagnósticos para evaluar el desempeño del modelo de
regresión. Tanto la prueba de normalidad de Jarque-Bera como la prueba de heteroske dasticity
de Breusch-Pagan no son significativas.
2
En Barro y Sala-i-Martin (1995) y Sala-i-Martin (1996), los autores encontraron que, al analizar
las regiones europeas, norteamericanas y japonesas por separado, la velocidad de convergencia
fue sorprendentemente similar en diferentes regiones y midió aproximadamente aproximadamente
el 2%.
24 1 Motivación
(un)
(b)
Figura 1.9. Distribución del PIB per cápita (expresado en logaritmo natural) en las 129
regiones europeas NUTS-2 en (a) 1980 y (b) 1996.
Yo cuartil
II cuartil
III Cuartil
Cuartil IV
Figura 1.10. Distribución de las tasas de crecimiento del PIB per cápita (expresadas en logaritmo natural)
en las 129 regiones europeas NUTS-2 en el período 1980-1996.
1,8
1,6
1,4
1,2
0,8
0,6
0,4
0,2
7,5 7,75 8 8,25 8,5 8,75 9 9,25 9,5 9,75 10
Logaritmo natural del PIB per cápita de 1980
Figura 1.11. ÿ-convergencia entre las regiones europeas. Diagrama de dispersión de la tasa de
crecimiento durante el período 1980-1996 versus el logaritmo natural del PIB per cápita (1980).
26 1 Motivación
Tabla 1.3. Estimaciones MCO de la regresión de convergencia ÿ de la renta per cápita en las 129 regiones europeas
(1980-1996). (Los números entre paréntesis se refieren a los valores p)
3.361
ÿ (Constante)
(0.000)
-0.273
ÿ
(0.000)
Velocidad de convergencia (*) 0.01875
Media vida (**) 36,96
Bondad de ajuste
0.322
R2 ajustado
-154.545
criterio de swartz
3,014
Prueba de normalidad de Jarque-Bera
(0,222)
0,067
(0,796)
( ÿ)
en 1 + = en (2) = 0,69b _
ÿ
1
; (**) Vida media = vida media ÿ
T b
Figura 1.12. Mapa de los residuos empíricos estandarizados de la Ecuación (1.10) estimados sobre las 129 regiones a
nivel NUTS-2 durante el período 1980-95. Los residuos se clasifican en las 4 clases intercuartiles.
1.4 Una lista de temas omitidos y un esquema del libro 27
De nuevo, la única posibilidad de investigar la violación del supuesto de independencia

entre los componentes no sistemáticos del modelo de regresión es inspeccionando
visualmente el mapa de los residuos empíricos estandarizados. Esto se muestra en la Figura
1.12. El mapa muestra una marcada regularidad geográfica con la mayoría de las regiones
de Francia y todas las regiones del sur de Italia subestimadas sistemáticamente por la
regresión de convergencia ÿ. Otra característica geográfica, ya observada en el análisis
presentado en la Sección 1.3.2, está constituida por una variación evidentemente suave de
residuos positivos altos a positivos bajos (los tonos más oscuros en la Figura 1.11) y de
residuos negativos altos a negativos bajos (los tonos más claros). en la Figura 1.11). Solo
ocasionalmente las regiones que caen en la cuarta clase intercuartil están cerca de las
regiones que caen en la primera clase intercuartil.
Al igual que el caso discutido en la Sección 1.3.2, este segundo ejemplo muestra que, a
pesar de su buen desempeño con respecto a los diagnósticos de regresión estándar, el
modelo no es del todo satisfactorio. Regiones enteras, que no están simplemente dispersas
aleatoriamente en el espacio geográfico, experimentan una sobreestimación/subestimación
de las tasas de crecimiento sobre la base de la relación postulada y esta evidencia vuelve a
enfatizar la necesidad de incluir formalmente el espacio y las relaciones espaciales en la
formulación teórica de una convergencia. modelo.
1.4 Una lista de temas omitidos y un esquema del libro
Es importante señalar, al final de este capítulo introductorio, que este volumen no pretende
cubrir todos los temas posibles en econometría espacial (tarea que se logra mejor en otros
libros como Anselin, 1988; Anselin y Bera, 1998). ; Anselin y Florax, 1995 y Anselin et al.,
2004). Más bien, está interesado en introducir el modelo básico de regresión lineal espacial
mostrando su relevancia en un caso particular: la prueba de convergencia regional del
ingreso per cápita.
Vemos esto como un ejemplo paradigmático que puede ayudar a comprender modelos más
complicados. Por lo tanto, el libro está limitado en términos de los temas cubiertos, incluso si
presenta de manera rigurosa todos los conceptos y herramientas estadísticos básicos para
que el lector interesado esté en condiciones de comprender métodos y técnicas más
avanzadas si es necesario.
Así, muchos temas importantes y aspectos específicos de la disciplina se han omitido
deliberadamente y no reciben consideración en este volumen.
En particular, incluso si hay muchas formas en que los datos espaciales pueden
manifestarse en el análisis económico (por ejemplo, puntos en un mapa, como en el caso de
las plantas, o líneas en un mapa, como en el caso de los flujos de transporte), este libro se
concentrará únicamente en el tratamiento de agregados geográficos, es decir, datos
recopilados a nivel regional, cen sus tract, condado o nacional. Hasta la fecha, este tipo
particular de datos espaciales ha sido claramente la tipología más utilizada tanto en el
análisis económico como en los debates políticos (ver Arbia y Espa, 1996a para una revisión
exhaustiva de los métodos disponibles para las otras tipologías de datos económicos espaciales). .
28 1 Motivación
Una segunda limitación de este libro radica en el hecho de que aquí solo considera los
problemas inferenciales que surgen en las fases de estimación y prueba de hipótesis. No se
presta atención al importante problema de la identificación del modelo oa la elección de la
mejor especificación entre los modelos espaciales en competencia (véase, por ejemplo,
Paelinck y Klaassen, 1979).
Un tercer tema importante que queda fuera del alcance de este libro es el de la agregación
espacial. Está claro que el resultado de cualquier análisis de regresión basado en datos
espaciales depende esencialmente del nivel de agregación geográfica elegido y no puede
extenderse simplemente de un nivel de agregación a otro. Por ejemplo (tomando de nuevo el
ejemplo elegido como hilo conductor de este libro), es perfectamente posible, al analizar el
proceso de convergencia económica de un conjunto de regiones, observar la convergencia al
nivel europeo NUTS-2, y, por el contrario, divergencia en otro nivel (por ejemplo, el nivel
NUTS-3). Esta indeterminación de los resultados estadísticos es una de las posibles
manifestaciones del llamado Problema de la Unidad Modificable (Yule y Kendall, 1950), o,
mejor, de su contraparte geográfica conocida como Problema de la Unidad del Área Modificable
(o MAUP; ver Openshaw y Taylor, 1981; Arbia, 1989) también denominada “segunda ley de la
geografía” (Arbia et al., 1996). La elección del nivel de agregación es, por lo tanto, de suma
importancia en cualquier análisis econométrico espacial. Por supuesto, este problema no es
típico de los estudios geográficos y generalmente se refiere a la posible inconsistencia entre
las relaciones micro y macro en economía, un problema que ha recibido mucha atención en
economía desde la contribución seminal de Theil (Theil, 1954). Sin embargo, como hemos
dicho, se ha dejado fuera del alcance del presente libro.
Una cuarta limitación de esta monografía está representada por el hecho de que sólo
considerará el caso de series de datos espaciales sincrónicas. De hecho, especialmente en
los últimos años, existe una creciente disponibilidad de datos espacialmente distribuidos
observados a través del tiempo y este hecho, a su vez, ha estimulado mucho el desarrollo de
técnicas y modelos que buscan capturar simultáneamente la dinámica espacial y temporal de
los fenómenos económicos. . En el Capítulo 6, al final del libro, se presenta una breve
descripción de los modelos estadísticos de espacio-tiempo y de los modelos de datos de panel
espacial, pero el tema no se considera en el resto de la monografía.
Habiendo (espero) motivado al lector al estudio de las relaciones económicas usando
datos espaciales, y habiendo aclarado los límites dentro de los cuales hemos planeado
confinarnos en la presente monografía, ahora podemos presentar la estructura del libro con
más detalle.
Los capítulos 2 y 3 proporcionan los antecedentes necesarios para introducir la teoría del
modelado lineal espacial. Más específicamente, el Capítulo 2 está dedicado a un tratamiento
riguroso de la teoría de campos estocásticos como marco natural para el análisis de datos
espaciales. Aquí presentaremos la definición de un campo aleatorio y las restricciones que
debemos considerar para realizar inferencias estadísticas. También discutiremos en detalle
las características de algunos campos aleatorios básicos que son particularmente útiles en el
análisis econométrico. Finalmente, discutiremos algunos teoremas limitantes importantes que
son útiles para evaluar los resultados de la teoría asintótica de campos aleatorios. En el
Capítulo 3 introduciremos el concepto de probabilidad y
1.4 Una lista de temas omitidos y un esquema del libro 29
sus procedimientos de prueba relacionados y discutiremos algunas de las adaptaciones que

son necesarias para definir una probabilidad espacial.
El Capítulo 4 representa el núcleo de todo el libro y contiene los principales temas
encontrados al analizar un modelo lineal espacial. Aquí discutiremos las principales violaciones
de las hipótesis de regresión lineal clásica que ocurren cuando el modelo se estima con datos
espaciales. Al hacerlo, analizaremos las violaciones relacionadas con el modelo de muestreo
(SM) por separado de las relacionadas con el modelo de probabilidad subyacente (PM).
En el Capítulo 5 volveremos a los ejemplos introductorios discutidos en el presente

capítulo y volveremos a analizar el mismo conjunto de datos para mostrar cómo la lección
aprendida sobre el tratamiento de datos espaciales puede modificar las conclusiones sobre la
convergencia de datos. regiones italianas y europeas.
Finalmente, el Capítulo 6 está dedicado a todos aquellos que desean aprender más sobre
la econometría espacial y consideran este libro solo como una primera lectura antes de
abordar las cuestiones más profundas y los desarrollos más recientes en los temas. Aquí
revisaremos brevemente la literatura reciente y brindaremos una visita guiada por las diversas
técnicas más avanzadas propuestas en las últimas décadas.
El Apéndice del libro contiene algunas referencias al software estadístico que está
actualmente disponible para la aplicación real de procedimientos econométricos espaciales a
conjuntos de datos empíricos.
2 Campos aleatorios y modelos espaciales
2.1 Introducción
Un modelo econométrico susceptible de estimación estadística se construye a partir de un

conjunto de n (posiblemente multivariadas) observaciones empíricas, digamos x=(x1, x2,...., xn),
que se conciben como el resultado de un solo experimento relacionado con un conjunto de
variables aleatorias (X1, X2,...., Xn). Para avanzar por este camino es necesario introducir una
serie de hipótesis sobre la naturaleza de dichas variables aleatorias y la forma en que se
relacionan con los valores observados. Es útil clasificar estas hipótesis dentro de dos categorías
distintas, a saber:
1. Hipótesis relacionadas con un modelo de probabilidad (PM) que postula una forma
plausible para la distribución conjunta de las variables aleatorias involucradas. Es
conveniente expresar dicho modelo en forma de una familia paramétrica de funciones de densidad.
ciones ÿ = { f (xxx
, 2 ,..., ;ÿ),ÿ ÿÿ} , con F
1,norte
X1X2X _ ,...,
_ norte
,..., X1 , 2x2 _ ( , ,...,X x1 x2 xn ÿ ; )
norte
la función de densidad conjunta de las variables aleatorias asociadas a las n

observaciones, ÿ el vector de parámetros desconocidos a estimar, ÿ el espacio
paramétrico y ÿ la familia paramétrica de funciones de densidad; y
2. Hipótesis sobre un modelo de muestreo (SM) para las n observaciones disponibles,

que incorpore información sobre el criterio de selección del PM y proporcione un vínculo
entre dicho PM y los datos observacionales.
Las hipótesis en las que se basan el PM y el SM se expresan teniendo en cuenta la naturaleza

de los datos económicos específicos considerados.
A grandes rasgos, podemos distinguir entre cuatro grandes tipologías de eco
datos económicos que surgen en la investigación empírica.
(i) Una primera tipología está representada por datos transversales que se refieren a un
solo agente económico (hogar o empresa) oa grupos de ellos (como sectores
económicos). Al construir un modelo estadístico para tales datos económicos, la forma
más adecuada de modelo de muestreo es la que se basa en la noción de una muestra
aleatoria en la que suponemos que cada variable aleatoria se distribuye de forma
( ;ÿ) la. variable
independiente con una función de densidad. En este caso, función conjunta La de
de densidad
efectos especiales
X yo
i
probabilidad considerada en el PM se puede simplificar como el producto de las

densidades marginales, es decir:
norte
f (x2
, X1,X2
xn ÿ ;,...,X
) x1 ,..., ( ; ÿ)
efectos especiales
X yo
norte
= ÿ=i 1
i
32 2 Campos aleatorios y modelos espaciales
(ii) Una segunda tipología de datos se relaciona con una serie de tiempo, refiriéndose una
vez más a agentes económicos individuales oa grupos de ellos, observados en
diferentes momentos del tiempo. En este caso, el modelo de probabilidad puede ti T
expresarse como ÿ = { f (xttt, 1xt
X
2
,X ,...,X
t 1
norte
2
,...,xt ;ÿ),en ÿel que
,ÿÿÿ} norte
X , X t ,..., X tn representan una colección de variables aleatorias ordenadas con re

t1 2
espectro a tiempo (un proceso aleatorio), y f XXX t 1

t1 , t2 ,..., t
( xxx, t2
,..., t norte
ÿ ; ) su
norte
función de densidad conjunta. Al construir un modelo estadístico basado en

observaciones de series temporales, no es posible descomponer la función de
densidad de probabilidad conjunta en la misma forma simple que en el caso anterior.
Sin embargo, debido al orden intrínseco de los datos temporales, se puede escribir
como el producto de las densidades condicionales, es decir:
norte
FXXX, t 1 ,...,
( xxx, t2
,..., t ÿ;) FXXX ( xxx , t1 t2
,...,X ÿ;)
= ÿ=i 1 ,..., yo
t1 t2 t norte i _
ÿ
1
norte
ti t2 Tennesse
(iii) Una tercera tipología de datos económicos se relaciona con las series espaciales, es
decir, la tipología a la que está dedicado el presente libro. Este tipo de datos surge al
observar agentes económicos individuales (o grupos de ellos), con información
adicional sobre su posición en el espacio. Esta es la primera vez que usamos la
palabra “espacio” en esta monografía y, dado que todo el libro está dedicado a este
tema, es importante dar una definición formal del mismo. De hecho, son posibles
varias definiciones según nos refiramos a un espacio geográfico, un espacio
económico, un espacio técnico u otras formas del mismo. Paelinck (1983) define un
“espacio” en los términos más generales como el par S { } O, R con O representando
ÿ
= O puede
los objetos de estudio y R las relaciones existentes
como
representar
puntos,
entrelíneas
cualquier
ellos.oElpolígonos
conjunto
figura geométrica
en
de ÿobjetos
. En
cuanto a la relación entre objetos, Paelinck (1983) considera diferentes definiciones y
enumera los tres casos notables de estructuras topológicas, estructura económica y
k
estructuras técnicas que conducen a diferentes
sobre estos conceptos en la Sección 2.2.1. definiciones de espacio. Volveremos
Cuando los datos proporcionan información adicional sobre su posición en el

espacio, la muestra observada puede considerarse extraída de un modelo de
especificado como ÿ = { probabilidad en el que
f X ,X ,...,X( xs ,xs ,...,xs ;ÿ), ÿSi,ÿÿÿ}
S
s1
_ s2 _ sn 1 2 norte
X
s1
, X s ,..., X
2 sn
representan una colección de variables aleatorias ordenadas con re
spect a su ubicación geográfica, f XXX, s 1 ,...,

s1
_ s2 _
s norte
( xxx
, ,..., ss 2 norte
; ÿ) representar
envía su función de densidad de probabilidad conjunta, y S es un índice referente a la

ubicación espacial cuya naturaleza se aclarará en las páginas siguientes. En este
tercer caso, ninguna de las simplificaciones anteriores de la función de densidad de
probabilidad conjunta es factible en el modelo de probabilidad.
2.2 El concepto de campo aleatorio 33
Por lo tanto, surge el problema de cómo redefinir completamente el modelo de probabilidad

para poder tener en cuenta la estructura de dependencia geográfica entre las variables
aleatorias involucradas.
(iv) Finalmente, una cuarta tipología de información económica se relaciona con datos de
panel que se refieren a un solo agente económico o unidades espaciales como regiones
o estados. En este segundo caso nos referimos, más concretamente, a datos de panel espacial.
Esta tipología se origina por la combinación de las tipologías (i) y (ii) o, alternativamente,
(ii) y (iii) anteriores. Cuando disponemos de un conjunto de datos de panel espacial, la
muestra observada es generada por el PM especificado como:
ÿ = {f X ,X ,...,X X ,...,X xs t xs t (xs t xs, t ,..., , ÿ S ti,T ÿ ;ÿ ÿÿ}

,...,xs t ;ÿ), si
st1 1 st2 1 1 , snt st 1 2 sntm 11 21 norte 1 12 Nuevo Méjico
y las variables aleatorias están ordenadas simultáneamente con respecto a un índice

temporal T y un índice espacial S.
La forma más natural de tener en cuenta los problemas de dependencia geográfica que surgen en
el modelo de probabilidad para datos espaciales está representada por la extensión de los conceptos
familiares relacionados con un proceso aleatorio temporal (ver, por ejemplo,
Hamilton, 1994) a la idea de un proceso aleatorio bidimensional (también denominado en la
literatura como campo aleatorio).
La idea de un campo aleatorio fue introducida por primera vez por Yaglom (1957; 1961; 1962) y
luego estudiada por Matern (1960) (reimpreso más recientemente en Matern, 1986) y Whittle (1954;
1963). Este capítulo proporciona una introducción a este tema concentrándose solo en aquellos
aspectos que son necesarios para especificar un modelo de regresión lineal estadístico basado en
datos espaciales. Para una revisión más completa ver Guyon (1995).
2.2 El concepto de campo aleatorio
Empecemos introduciendo la siguiente definición.
Definición 1. Sea ( ) ÿ,B,P(.) el triplete que define un espacio de probabilidad, con ÿ

que representa el espacio muestral, B el conjunto de Borel asociado y P(.) una medida de
probabilidad. Además, sea S un conjunto no vacío en R2 , y definamos la función X(.,.), con
X(.,.) tal que: ÿ x S ÿ R. La secuencia ordenada de variables aleatorias {X(.,s), sÿS} = { X(s), sÿS},
indexado con respecto a s, se denomina proceso aleatorio espacial o campo aleatorio.
Hay dos características fundamentales de un campo aleatorio {X(s), sÿS}. El primero se relaciona
con la naturaleza de los índices sÿS, es decir, con la topología de las observaciones.
El segundo se refiere a la estructura de dependencia espacial que presenta el conjunto de variables
aleatorias que constituyen el campo. Estas dos características ahora serán discutidas a su vez en
las Secciones 2.2.1 y 2.2.2.
2.2.1 La Naturaleza del Índice S
2.2.1.1 Generalidades
Los índices pertenecientes al conjunto S pueden ser continuos o discretos. En primera instancia,
el índice s representa las coordenadas de n puntos en R2 (ver Figura 2.1a); en el segundo caso,
representa las coordenadas en una cuadrícula regular (generalmente cuadrada) (ver Figura
2.1b) o una serie ordenada de valores relacionados con un conjunto finito de polígonos (o
“regiones” en geografía económica) (ver Figura 2.1c) . En esta última instancia, el
+
el vector s en realidad representa un escalar relativo a un número arbitrario asignado
sÿ I para cada polígono. Solo para dar una idea al lector, en las Figuras 2.2 y 2.3 se dan
algunos casos reales de datos espaciales de puntos y polígonos.
*
(1,1) (1,2) 1 2
*
(2,1) 3
4 5
* *
6
** *
7
** *
8
(un) (b) (C)
Figura 2.1. Tres posibles tipologías de datos espaciales discretos: (a) Puntos, (b) Red reticulada
regular y (c) Red reticulada irregular.
La información estadística en el análisis de datos económicos generalmente se refiere a puntos

en la economía espacial relacionados con la posición de un solo agente económico, o a
agregados observados dentro de unidades territoriales subnacionales como municipios o
regiones. El caso de los datos distribuidos en una cuadrícula regular (un caso extremadamente
interesante en otros campos aplicados como la teledetección y el análisis de imágenes, véase,
por ejemplo, Arbia, 1993) es, por el contrario, todavía muy limitado en el análisis económico.
Para algunos ejemplos de esta tipología de datos espaciales económicos, se remite al lector a
(por ejemplo) Arbia (1996a).
El resto de este libro se concentrará en el estudio de campos aleatorios relacionados
únicamente con datos puntuales y datos regionales con un mayor énfasis en los datos regionales.
Nos referiremos al primer caso como un campo aleatorio de parámetros continuos y lo
definiremos como {X(s), s=(r,s), r,sÿR}. En segunda instancia nos referiremos a un campo
aleatorio de parámetros discretos que se definirá como {X(s), s=s, s ÿ I+ }.
Figura 2.2. Ejemplo de datos puntuales: la ubicación de las empresas textiles dentro del área del
municipio de Prato. Cada punto representa una empresa. Tomado de Arbia y Espa (1996a).
Figura 2.3. Ejemplo de datos de polígonos: distribución espacial de teléfonos móviles en los estados de EE.
UU. en 2004.
2.2.1.2 La topología de un campo aleatorio
En el caso de un campo aleatorio de parámetros continuos, la topología del espacio de

referencia se especifica completamente a través del concepto de métrica o distancia. En el
caso de una distancia euclidiana en el espacio n, por ejemplo, se tiene:
re = re(syo,s ) = s (ÿ i s
yo j
)T (s i- sj _ )
con d la distancia entre el punto s y los campos . Por el contrario, en el caso de dis
yo i sj
aleatorios de parámetro creto del punto, la topología debe ser especificada exógenamente por
el investigador, lo que inevitablemente introduce un cierto grado de subjetividad en el análisis.
Una forma común de proceder es considerar la distancia entre los centroides de los
polígonos como representativa de la distancia entre ellos. Sin embargo, esta solución no es del
todo satisfactoria, especialmente en presencia de polígonos de forma muy irregular. Como
alternativa, se puede utilizar el concepto de Hausdorff de distancia entre polígonos que lleva el
nombre de Felix Hausdorff y se define como la distancia máxima de un polígono al punto más
cercano en el otro polígono. (Ver Hausdorff, 1914 y Edgard, 1995). Más formalmente, la
distancia de Hausdorff desde el polígono A y [ el polígono B es una función maxmin , definida
( , ) max min = { como] d( ), ab
HAB},
a ÿA b B ÿ
donde a y b son puntos de los polígonos A y B respectivamente, y d(a, b) es cualquier

medida de la distancia entre estos puntos. Muchas otras definiciones alternativas han sido
sugeridas en la literatura. Para una revisión, véase, por ejemplo, Paelinck (1983).
En un contexto económico es cuestionable si una simple distancia euclidiana es la más
adecuada para captar los vínculos geográficos entre los agentes económicos y las regiones.
Las definiciones alternativas incluyen una distancia basada en el tiempo requerido para
llegar al sitio s algunos
desde elautores
al., 1993;sitio suna
Conleyosugieren
en el costo
ydefinición
Topa, económico
el2002).
uso
másdeamplia
Las involucrado
distancias
de distancia
distancias en
sociales ( el viaje.
Doreian
económica
medidas en Más
términosaún
,(Case
1980) o,
deet
i
flujos observados empíricamente (Murdoch et al, 1997) o en medidas de interacción basadas
en el comercio (Aten, 1996, 1997) también podrían tenerse en cuenta en la investigación
empírica.
Una definición importante en el análisis de los enlaces topológicos dentro de campos

aleatorios de parámetros continuos y discretos es la de la vecindad de un sitio.
Varias definiciones son posibles. Aquí revisamos algunos de los más utilizados en la
literatura econométrica espacial.
Definición 2. Barrio crítico de corte. Se dice que dos sitios s y s son

i
j vecinos si 0 dd *el
representa
límite crítico. ÿ < , con d la distancia apropiada adoptada, yd*
ij yo
Definición 3. Vecino más cercano. Se dice que dosi sitios s jy s son vecinos si d Min( ) d ÿ ik
yo
= , . yo
Definición 4. Barrio por contigüidad. En el caso de campos aleatorios de parámetros

discretos, una definición simple de vecindad podría basarse en la mera adyacencia entre
dos polígonos. En este caso, se dice que dos polígonos indexados por s y s son vecinos
i
si
comparten
j
un límite común.
Definamos N(i) como el conjunto de todos los vecinos (sin embargo definidos) si y
ÿ i del sitio como la cardinalidad de este conjunto. Por definición si ÿ Es. que
tenemos
N(i)
necesario enfatizar aquí que el resultado de cualquier análisis econométrico
dependerá de la topología específica (y, por lo tanto, de la estructura vecina) elegida
para el campo aleatorio. En consecuencia, siempre es aconsejable probar la solidez de
los resultados obtenidos adoptando varias definiciones de vecindad.
Habiendo aclarado la idea de una distancia entre sitios tanto en el caso de parámetros
continuos como en los de parámetros discretos, y también el concepto de vecindario,
introduzcamos ahora una herramienta fundamental que se usará extensamente en el resto
del libro para Expresar estos conceptos de forma analítica. Esta es la llamada matriz de
conectividad (o matriz de pesos).
La forma general de una matriz de conectividad binaria W del elemento genérico wij
viene dada por:
ÿ1 si jn yo
ÿ ()
wij = ÿ
(2.1)
ÿ
0 de lo contrario
con N(i) especificada de acuerdo con cualquiera de las definiciones anteriores. Observe que
ahora podemos expresar la cardinalidad de N(i) como

ÿ i=ÿ Una
tanto wij . matriz de conectividad por lo
j
expresa formalmente los vínculos de proximidad existentes entre todos los pares de sitios que
constituyen un campo aleatorio según un concepto de vecindad preespecificado.
En lugar de una simple matriz de ponderaciones binarias, se puede introducir un conjunto
generalizado de ponderaciones que permita al investigador incorporar su conocimiento previo
sobre la geografía del fenómeno en estudio. Esto permite una mayor flexibilidad y la posibilidad
de introducir elementos como barreras naturales, dimensiones y formas de polígonos. Por otra
parte, sin embargo, cuanto más compleja sea la estructura de la matriz de conectividad, más
difícil será distinguir entre lo que es un efecto espacial genuino y un efecto forzado por el
investigador.
La expresión general para una matriz de ponderaciones generalizada viene dada por:
wij = gdij [ ] (2.2)
siendo g una función inversa de la distancia. Un ejemplo lo proporciona la ponderación de tipo

gravitacional:
-ÿ
wd ij=ij ÿ 0> (2.3)
A veces es útil considerar matrices de ponderaciones que están estandarizadas por filas,
en el sentido de que cada fila suma 1. Esto se logra definiendo un conjunto de
ponderaciones * W* w ij ÿ tal que
* w yo w yo
w = = (2.4)
ÿ
yo
w yo ÿ i
j
así que eso * ÿ = wij 1 . Esta última definición es particularmente útil para introducir la
j
noción de variable retrasada espacialmente. En el análisis de series de tiempo es bien sabido

que, dada una secuencia de variables aleatorias que constituyen un proceso aleatorio, digamos
X , X t ,..., X tn , el operador de retardo se define como:
t1 2
=
L( )Xt Xt i i 1
ÿ
de manera que la variable rezagada es la variable adyacente a Xt i en la escala temporal.

En un contexto espacial, sin embargo, el concepto es de difícil extensión. De hecho, debido a
si
la multilateralidad de la proximidad en el espacio, el valor rezagado de la variable ( ) X puede ser
cualquiera de los vecinos de s según laadoptada
idefinición
endelavecindad
literaturaelegida.
es la deLa
definir
solución
el rezago
comúnmente
espacial
de una variable aleatoria ( ) X s como la media de las variables aleatorias observadas en la
vecindad del sitio i
si
yo
. En consecuencia tenemos la siguiente definición.
Definición 5. Dado un campo aleatorio {X(s), sÿS}={X (s1 ); X (s dada 2 y );..., X (sn el
)},
la topología inducida por la definición de vecindad N(i) , el valor rezagado de espacialmente
la variable aleatoria ( ) X se define como: si
yo
1
LX[ s
( ) ]i ÿÿ
X ( )s j (2.5)
= ÿ i sj yo( )
o, de manera equivalente, por
]s ( )= ÿ1 *
norte norte
LX[ i w X ( ) sij j = ÿ w X ( ) sijj (2.6)

ÿ i j =1 j =1
usando la Ecuación (2.4), o, en notación matricial, para todo el campo
*
L [X s
] (=) WX s ( ) (2.7)
donde X( )s es el vector columna (( ( ) ( Xs

) _ 1 , Xs _ 2 ,..., X ( s)) T
norte
.
2.2.2 La estructura de dependencia de un campo aleatorio
Pasemos ahora a la segunda característica fundamental de un campo aleatorio que, como

anticipamos, se refiere a la estructura de dependencia de las variables aleatorias {X(s),
sÿS}. Tal estructura puede ser determinada por la función de distribución de probabilidad
conjunta acumulativa del campo, digamos:
F [x(s),x1( s),... 2, ( )] x s = Pr{X(s1) ÿ x(s1),X(s2 ) ÿ x(s2 ),...,.X(sn ) ÿ x(sn )}

norte (2.8)
o, en el caso de variables aleatorias absolutamente continuas, por la función de

X s
s xx 1 de tal manera
densidad de probabilidad conjunta
F X ( 1s), ),...,.
X ( 2 s)..., X(( )] sdefinido
), [ ( ), ( que: norte
s2 _ norte
X ( s)1 X ( s) norte
F [x (s),x1(s),..., 2( )] x s = norte ÿ ...ÿ 1 2 Fu uu

, ,..., norte
, [uu,21 ,...,un
] du1 du
2 ...
du norte (2.9)
ÿ
ÿ ÿ
Tenga en cuenta que la continuidad de las variables aleatorias no debe confundirse con
la continuidad del índice s. Podemos tener variables aleatorias continuas distribuidas en
un espacio continuo o discreto y, de manera similar, podemos tener variables aleatorias
discretas distribuidas en un espacio continuo o discreto. Un ejemplo de variable aleatoria
discreta distribuida en un espacio continuo está representado por el número de
2
empleados en un conjunto de ubicaciones industriales en ÿ espacio
ver, por(para
ejemplo,
un ejemplo
Arbia,
2001a); un ejemplo de una variable aleatoria discreta en un espacio discreto está
representado por el número de empleados en un conjunto de regiones; un ejemplo
de una variable aleatoria continua en un espacio discreto está representado por el PIB
regional; y, finalmente, un ejemplo de variable aleatoria continua sobre un espacio continuo
está representado por el valor de la producción realizada en diferentes localizaciones
industriales.
La ventaja de operar con variables aleatorias distribuidas en el espacio está representada
por el hecho de que la posición geográfica de la variable aleatoria puede sugerir restricciones
a la función de densidad de probabilidad, como veremos en el futuro.
( ),..., X s1 ( ), 1,ser
Definición 6. Para cada secuencia de variables aleatorias nÿ norte
X s larga al campo {X(s), sÿS}, la función de densidad marginal de ( )1 X s se

puede definir como:
ÿ ÿ
[ fx ()=
x ( s1 )
s1
_
] ÿ ...ÿ F X ( s1 ),X (s2 ),...,X s( )norte
[s(xx), s( 1),...,
2 ( )] ( ),..., dX
xsn _ _
dX ( )
s2 _ sn
_
(2.10)
ÿÿ ÿÿ
Definición 7. Para cada variable aleatoria ()X

si pertenecientes al campo aleatorio
{ X ( )s , sÿS}, la media, la varianza y los momentos superiores de ( ) X puede ser
i
definido como:
MI[] X ( )
si = µ (si) ÿ i
Var[ ] X ( ) = ÿ
si
yo
2
()
si
yo
ÿ yo (
r
E[X ( )i s ]= rµ( ) si ÿi, ÿr ÿ1,sÿS
Como podemos ver, tales características de X (s), generalmente pueden expresarse como
funciones del índice s ya que, al menos en principio, cualquier variable aleatoria X ( )s tiene
s
una función de densidad de probabilidad fx (geográfico.
)X diferente en cualquier punto s del espacio
( s)
Definición 8. Para cada par de variables aleatorias X( )s1y ( ) 2 X pertenecientes

s al
campo aleatorio { X ( )s , sÿS}, la función de densidad de probabilidad bivariada conjunta es
definido como:
=
FX s( 1X ),s ( 2 ) [ xsxs
( ), 1( 2)]
ÿ ÿ
=
ÿ...ÿFs
ÿÿ ÿÿ
s
X ( 1 ),X ( 2 ),...,X () s norte
s2 _
s
[ s( xx), 1( ),..., ( )] x( dX
),..., dX (s)3
norte
s norte
(2.12)
Los diversos momentos conjuntos relacionados con las distribuciones conjuntas descritos
en la Definición 8 asumen un significado particular, dada la importancia del índice s ÿ S en un
contexto geográfico. En particular, consideremos la siguiente definición:
Definición 9. Dado el campo {X(s), sÿS}, la cantidad:
ÿ (si ,sj) = E[(X (si) ÿ µ (si) (X (sj) ÿ (sj))]

µ ) si ,sj ÿ R2 (2.13)
se denomina función de autocovarianza espacial del campo. Además, su versión estandarizada,

dada por:
= ÿ ( ss
1 2) s1, s2ÿ R2
ÿ ( ss
1 2) (2.14)
ÿ ( ) ( ÿ s2 ) s1
_
se dice que es la función de autocorrelación espacial en el campo.

Uno de los ejemplos más importantes de campos aleatorios en econometría es el campo
gaussiano (o normal). De hecho, los miembros de esta familia tienen propiedades matemáticas
convenientes que simplifican enormemente los cálculos. Además, se ha encontrado que la
distribución de muchos procesos empíricos se puede aproximar satisfactoriamente. Por lo tanto,
introducimos la siguiente definición:
Definición 10. Un campo aleatorio {X(s), sÿS} se llama gaussiano si, para cada subconjunto
finito en R2 , digamos (s1, s2,…,sn), (X(s1),…,X(sn)) = X(s) es tal que:
X(s) ÿ MVN (µ, V)
o:
X s =
FX ( 1s),X ( 2 ),...,X
s () s norte
[ s( xx
), 1( ),..., ( )] s2 _
norte
1/ 2
V ÿ
1
= det( ) exp ÿ
ÿ
ÿ
( X( )s(µ( )s (VX
ÿ
))
T
( ))ÿs µ s ÿ
ÿ
1 ÿ
ÿ
(2.15)
/2
(2 )
ÿ
norte
ÿ 2
con (ÿ [ ssyoÿV;
) =1,...,i ; =1,...,nj; V una matriz de autocovarianza de n por n y ]T n ( ), ( ),..., ( ) norte
mÿ µ s1
_ µ s2 _ µ s un vector n-by-1 de valores esperados.
Un campo gaussiano espacial se especifica completamente en términos de sus dos primeros
momentos que, a su vez, son funciones del índice s.
En el análisis econométrico, a menudo analizamos conjuntamente varios fenómenos que están
distribuidos espacialmente, por ejemplo, la tasa de crecimiento regional y el PIB regional, o los
precios y las cantidades vendidas en varios lugares del espacio. Para abordar este importante
aspecto es necesario introducir el concepto de campo aleatorio vectorial de dimensión k.
Definición 11. Un campo vectorial aleatorio {X(s), sÿS} se define como el campo X(s)=(X1(s),
X2(s),…,Xk(s))T en el que cada componente Xi(s) representa un campo aleatorio {Xi(s), sÿS}.
Tal definición introduce una dimensión extra al análisis porque un vector aleatorio X(s)
de dimensión k está asociado con cada sitio considerado, si, i=1,...,n. La función de
distribución de probabilidad conjunta acumulada del vector aleatorio se define como:
F [ xsxs
( ), (2),..., ( )] xsP{X(s1)
= ÿ x1, X(s2) ÿ x2,…, X(sn) ÿ xn} (2.16)
1 norte
y, en el caso de variables aleatorias continuas, la función de densidad de probabilidad

conjunta es:
FX (s1X),s(X2 s),..., ( norte

[ xsxs
( ), 1( ),..., 2( )] ) xs norte
(2.17)
Muchas de las definiciones introducidas para campos aleatorios pueden extenderse a

campos vectoriales aleatorios (p. ej., media, varianza y momento r-ésimo) con un simple
cambio de notación. Sin embargo, es necesario enfatizar la importancia de los conceptos
que describen las complejas relaciones entre pares de variables aleatorias. Por esta
razón, presentamos las siguientes definiciones adicionales:
Definición 12. Dado el campo aleatorio vectorial {X(s), sÿS} las cantidades:
ÿ lm(si) ,sj = E[ ( Xl(si)ÿ µ l(si) (Xm(sj)ÿ m(sj))

µ ]) R2 ÿl,m; ÿsi ,sj ÿ (2.18)
ÿ ( ss )
yo soy
ÿ lm (si sj ) = ÿ ÿyo; s , s ÿ R2 (2.19)
yo
ÿ todos
( ss
) yoÿmm j ( )
se denominan, respectivamente, funciones de covarianza cruzada espacial y de

correlación cruzada espacial del campo.
Usando la notación empleada en la Definición 11, ahora podemos introducir el
concepto de campo gaussiano vectorial.
Definición 13. Se dice que un campo aleatorio vectorial {X(s), sÿS} es gaussiano si:
ÿ Xs( )1 ÿ ÿ ÿ µs( ) ÿ ÿ ÿ ss( ,)1)( ...

VsC C (ss , ) ÿ
1 1 2 1 norte
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
Xs( ) µs( )2 Vs( )

2 2
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ ÿ
ÿ
MVN
ÿ
ÿ ÿ
ÿ
ÿ
... ... ... ÿ
(2.20)
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ Xs( ) ÿ ÿ µs( ) ÿ ÿ ÿ C (ss

, ÿ 1) ... Vs( )
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ
ÿÿ ÿÿ
norte norte norte norte
con vectores µ(si) k-by-1 de valores esperados, y V(si) y C(si, sj), respectivamente,
representan las matrices k-by-k de covarianza cruzada en el sitio si, y el k- Matrices by-k
de autocovarianza espacial y covarianza cruzada espacial entre pares de sitios, definidas
por:
2.3 Restricciones en campos aleatorios 43
ÿÿ 11 (ssi , i ) ÿ 12 (ssi , i ) ÿ (ss, i )ÿ

ki 1
ÿ ÿ
ÿ ÿ
Vs( )i = ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿÿ () ,
ss ki 1 i ÿ ()ÿ
k yo
ss, i ÿ
ÿÿ
ÿ
11 (ss ij, ) ÿ 12 (ss ij, ) ÿ 1kij (ss, )ÿ ÿ
ÿ ÿ
y C (ss )= (2.21)
ÿ ÿ
,yo ÿ ÿ
ÿ ÿ
ÿÿ
ÿ
1 ()
ss ,kij ÿ k ij
()ÿ
ss,
ÿ
La definición de campos aleatorios dada hasta ahora es demasiado general para permitir
la construcción de modelos estadísticos estimables. De hecho, en el análisis econométrico,
el investigador tiene casi invariablemente una sola realización del campo, es decir, una
sola observación para cada sitio. Por tanto, el número de parámetros a estimar es mucho
mayor que el tamaño de la información disponible.
El propósito de las siguientes secciones es considerar algunas formas particulares de
campos aleatorios en los que se imponen una serie de restricciones, para obtener una
situación en la que el número de parámetros se reduce a un punto en el que su valor
puede inferirse de la realización única. disponible. Estas restricciones se refieren a:
1. la heterogeneidad espacial del campo (Sección 2.2.1), y

2. la dependencia espacial del campo (Sección 2.2.2).
2.3 Restricciones en campos aleatorios
2.3.1 Restricciones a la heterogeneidad espacial de un campo aleatorio
En términos generales, para un campo aleatorio {X(s), sÿS}, la función de distribución

de probabilidad conjunta F(X(s), ÿs) depende del sitio s y se caracteriza por un
conjunto de parámetros ÿs que también son dependiente del sitio. Esta definición
general, sin embargo, no es operativa. De hecho, debido a la naturaleza no experimental
de los datos económicos, la situación estándar es la de tratar con una única réplica
disponible para cada variable aleatoria del campo. Por lo tanto, el número de parámetros
a estimar es mucho mayor que las observaciones disponibles en circunstancias
empíricas. Por esta razón, uno se ve obligado a restringir la atención a una subclase
de campos aleatorios que, conservando un grado aceptable de generalidad, presenta
un cierto nivel de homogeneidad espacial y puede usarse para modelar fenómenos
reales. Un ejemplo de estos campos está representado por la clase de campos aleatorios estacionarios.
Definición 14: Se dice que un campo aleatorio {X(s), sÿS} es estacionario (en sentido
estricto) si, para cada subconjunto de sitios (s1, s2, ..., sn) pertenecientes al espacio S , la
función de densidad de probabilidad conjunta f(X(s), sÿ S) no cambia cuando el subconjunto
se desplaza en el espacio.
Cuando se trata de estacionariedad en el tiempo, la noción de desplazamiento (unidimensional)

no presenta ningún problema. Por el contrario, cuando se trata de datos espaciales (dado que
el espacio es, al menos, bidimensional), un subconjunto de variables aleatorias puede tener
dos tipos diferentes de desplazamientos. Un conjunto de variables aleatorias se puede rotar
en un cierto ángulo o trasladar con un movimiento rígido. Si un campo aleatorio permanece
sin cambios en términos de su función de densidad de probabilidad conjunta después de una
traslación, se dice que es estacionario bajo traslaciones u homogéneo (un concepto que es lo
opuesto a heterogéneo), lo que implica que el tipo de estructura de dependencia dentro de el
campo aleatorio no cambia sistemáticamente de un lugar a otro. Si un campo aleatorio
permanece sin cambios en términos de su función de densidad de probabilidad conjunta
después de una rotación, se dice que es estacionario bajo rotaciones alrededor de un punto
fijo o isotrópico (en oposición a anisotrópico), lo que implica que la estructura de dependencia
no cambia sistemáticamente. a lo largo de diferentes direcciones. Los dos casos se ilustran en la figura 2.4.
X(si ) Traducción X(si )
Rotación
X(si )
Figura 2.4. Si las características del proceso no cambian durante la traducción, se dice que el proceso
es homogéneo. Si no cambian bajo rotación, se dice que el proceso es isotrópico.
En el caso de campos aleatorios de parámetros continuos, habiendo definido un vector de

constantes arbitrarias ÿÿ(l,m); l, m ÿ R, la estacionariedad implica que la función de densidad
de probabilidad conjunta es:
=
F X ( 1s),X ( 2 ),...,X
s () s norte
[ s( ),
xx( 1),..., ( )]
s2 _
xs
norte
=
F X ( +s X + ÿ ), (X + ÿ ),..., ( X+ s ÿ )] ÿ ÿ R (2.22)
1
ÿ X ), ( +s2 _ ÿ X ),..., ( +s norte
ÿ )[ ( s1
_ s2 _ norte
En el caso de campos aleatorios de parámetros discretos, en cambio, la extensión del concepto

de estacionariedad de una a dos dimensiones es mucho más complicada, porque los polígonos
que constituyen la georeferencia del campo aleatorio se caracterizan, no sólo por su posición
en el plano, sino también por su tamaño y forma (irregular).
Si un campo aleatorio es homogéneo e isótropo, se dice que es estacionario en sentido

estricto.
Una consecuencia de la estacionariedad en sentido estricto es que todos los momentos univariados y todos
los momentos mixtos de cualquier orden no varían cuando se modifica el espacio de referencia.
Sin embargo, tal concepto de estacionariedad rara vez se realiza en circunstancias
empíricas y, por lo tanto, hay que introducir el concepto más débil de estacionariedad de orden
k que puede definirse sobre la base de los primeros k momentos del campo aleatorio.
Definición 15. Se dice que un campo aleatorio {X(s), sÿS} es estacionario de orden k si, para
cada subconjunto (s1, s2, ..., sn) de S, sus momentos hasta el orden k hacen no cambia
cuando el subconjunto está sujeto a traslaciones o rotaciones. Consideraremos dos casos
particulares:
(i) Estacionariedad de primer orden:
Se dice que un campo aleatorio {X(s), sÿS} es estacionario de orden 1 si E(|X(s)|) < +
ÿ, ÿ sÿ S y, además,
E(X(s)) = E(X(s+ÿ) = µ ÿs,ÿ (2.23)
(ii) Estacionariedad de segundo orden (o sentido débil):
Se dice que el campo aleatorio {X(s), sÿS} es estacionario de orden 2 si

E(|X(s)|)2 < ÿ, ÿ sÿ S y, además
una. E(X(s)) = E(X(s+ÿ)) = µ ÿs,ÿ
b. E[X(s)]2 = E(X(s+ÿ))2 = ÿ2 ÿs,ÿ (2.24)
C. E[X(si) X(sj)] = ÿ (dij) ÿsi, sj
donde el símbolo dij denota la distancia entre si y sj.

La estacionariedad de orden 2, por lo tanto, implica que la media y la varianza de un campo

aleatorio no dependen de s y que las covarianzas espaciales del campo aleatorio ÿ(si,sj)
dependen solo de la distancia entre si y sj y no en su posición absoluta en el plano.
En el caso de campos aleatorios gaussianos, la estacionariedad en sentido débil implica

estacionariedad en sentido estricto y esto explica el énfasis en la literatura dedicada a un
concepto de sentido débil.
2.3.2 Restricciones a la dependencia espacial de un campo aleatorio
Las restricciones de dependencia espacial juegan un papel fundamental en el estudio de

campos aleatorios. Su papel en este campo es definitivamente mucho más crucial que las
restricciones análogas en el estudio de procesos aleatorios temporales.
En el caso de series de datos económicos distribuidos espacialmente que se conciben
como una sola realización de un campo aleatorio {X(s), sÿS}, normalmente se espera que se
cumpla la siguiente proposición.
Primera Ley de la Geografía: “Todo está correlacionado con todo lo demás, pero las cosas
cercanas están más correlacionadas que las cosas que están lejos” (Tobler, 1970).
Por ejemplo, si X(s) se refiere al precio de un bien producido por una empresa ubicada en el
sitio con coordenadas s, esperamos que la dependencia entre X(s1) y X(s2) sea más fuerte
cuando los dos sitios están cerca entre sí, y tiende a disminuir cuando aumenta la distancia.
Del mismo modo, los ingresos de una región dependerán mucho más de los ingresos de las
regiones vecinas que de las regiones distantes en el espacio geográfico. Además, es razonable
suponer que bloques de unidades espaciales suficientemente distantes en el espacio (por
ejemplo, grupos de individuos que viven en regiones muy alejadas) tienden a asumir un
comportamiento independiente.
Se puede derivar una descripción formal de tal fricción espacial en términos de la función
de densidad de probabilidad conjunta de un campo aleatorio a través de la siguiente definición.
Definición 16. Se dice que un campo aleatorio {X(s), sÿS} es asintóticamente independiente
si, tomando dos subconjuntos de sitios {s1, s2,..., sn}ÿS y {t1, t2, ..., tn}ÿS de tal forma que
d(si, ti) = d (con d(si, ti) una medida de distancia) se tiene:
ÿ } ÿ)]
Abs{ F[ ]] X(s1),...,X(sn ),X(t1),...,X(tn ) ÿF[X(s1),...,X(sn ) F [X(t1),...,X(tn ()ÿ
límited ÿ+ÿ ÿÿ() = 0 (2.25)
Se puede obtener una forma más débil de la restricción a través del concepto de
descorrelación asintótica resumido en la siguiente definición:
Definición 17. Se dice que un campo aleatorio {X(s), sÿS} no está correlacionado asintóticamente
si existe una secuencia de constantes {ÿ(dij)}, siendo dij la distancia entre el sitio ubicado
en si y el sitio ubicado en sj, definida por:
|ÿ(si, sj)| ÿ ÿ( dij) (2.26)
tal que 0 ÿ ÿ(dij) ÿ 1 yÿdij ÿ(dij) < + ÿ, con la suma extendida sobre todos
distancias posibles dentro del sistema espacial.
En otras palabras, la incorrelación asintótica se puede expresar mediante un límite
superior, en función de la distancia dij, que se impone a los coeficientes de autocorrelación.
Obviamente, en el caso de campos aleatorios gaussianos, el concepto de descorrelación
asintótica y el concepto de independencia asintótica coinciden.
Otra forma de restricción de la estructura de dependencia de un campo aleatorio que
resultará útil para desarrollar teorías asintóticas para campos espaciales se puede
derivar de la siguiente definición.
Definición 18. Se dice que un campo aleatorio {X(s), sÿS} se mezcla fuertemente si,
tomando dos subconjuntos de sitios (s1, s2,...,sn) ÿS y (t1, t2,. .., tn) ÿS, de tal manera
d , X(s1),...,X(sn),
que d(si, ti) = y definiendo A comoyelB ÿ-álgebra generada
como ÿ-álgebra por laspor
generada variables aleatorias
las variables
aleatorias X(t1), ...., X(tn), se tiene para cada evento AÿA y BÿB:
límite
d ÿ+ÿ ()ÿÿ= 0
con ÿ ()d= arriba [P( AÿB )-P(A)P(B)] (2.27)
UN
d
La cantidad () ÿrepresenta intuitivamente una medida de la dependencia entre dos grupos
de variables que constituyen los dos subconjuntos de sitios a una distancia dada ÿ.
De hecho, en el caso de la independencia, se tiene P(AÿB)=P(A)P(B) y, por tanto, () = 0
ÿÿ Joe, 1997).
(ver
Una medida alternativa de dependencia entre grupos de variables aleatorias es
suministrado por la cantidad:
ÿ(ÿ) = sup [P(A|B)-P(A)] P(B)>0 (2.28)

UN
De hecho, incluso en este caso se tiene P(A|B)=P(A), o, alternativamente, ÿÿ

() = 0 en el
caso de la independencia (ver nuevamente Joe, 1997). En base a esta otra medida de
dependencia, es posible introducir el concepto de campos de mezcla uniforme a través
de la siguiente definición.
Definición 19. Se dice que un campo aleatorio {X(s), sÿS} se mezcla uniformemente si,
tomando dos subconjuntos de sitios (s1, s2,..., sn) ÿS y (t1, t2,. .., tn) ÿS de tal forma que y
d ,y llamando
X(s1),...,X(sn), a B la ÿ- álgebra
A a la ÿ-álgebra
asociadaasociada
a las variables
a las variables
aleatoriasaleatorias
X(t1), ....,d(si,
X(tn),
ti)se
= tiene,
para cada evento AÿA e BÿB:
límite d ÿ +ÿ ()ÿÿ= 0 (2.29)
La forma más débil de restricción sobre la dependencia entre variables aleatorias que
pertenecen a un campo aleatorio, se deriva de la llamada propiedad de ergodicidad. La
ergodicidad es un término tomado de la mecánica estadística (Khinchin, 1949) usado
extensamente en la literatura de series de tiempo y extendido a campos aleatorios (Christakos, 1992).
En un proceso aleatorio temporal, es una condición que asegura que la memoria del proceso,
medida por las correlaciones por pares, "se debilita al promediar con el tiempo".
(Spanos, 1986; Hamilton, 1994). Esto implica que la media y covarianza de X(s) coinciden con
las calculadas mediante las únicas realizaciones disponibles.
Aplicar una idea similar a un campo aleatorio conduce a la siguiente definición.
Definición 20. Un campo aleatorio {X(s), sÿS} que es estacionario hasta el segundo orden se
dice que es ergódico si:
1
d
lím
ij ÿ+ÿ ÿ
ÿ ÿ ( =, i)0ssj (2.30)
d yo
con la suma extendida a todas las distancias posibles en el sistema espacial, y el número de ÿ
tales distancias.
Como consecuencia de la propiedad de ergodicidad tenemos que los promedios espaciales
convergen en probabilidad a los promedios establecidos (sobre el concepto de convergencia en
probabilidad, véase la Definición 35 en la Sección 3.2 a continuación). Por lo tanto:
1 norte
pag
X µ
i
n ÿ=
1i ÿ
1 norte
2
pag
2
( µ) ÿ (2.31)
x nÿ
i =1
ÿ ÿi
1 norte norte
pag
(x j µ )( ÿ ÿµ ) ÿ ( d)
ÿ
x
yo
nn( ÿ
1) ÿÿ=
yo
j 1= i 1
Todas las restricciones introducidas, tanto a la heterogeneidad como a la dependencia

de un campo aleatorio, permiten reducir el número de parámetros necesarios para
caracterizar el campo y permiten su estimación estadística. Se reconsiderarán más
adelante en este capítulo cuando se trate de resultados asintóticos (consulte la Sección
2.5 a continuación).
2.4 Algunos campos aleatorios especiales 49
2.4 Algunos campos aleatorios especiales
El objetivo de esta sección es presentar varias tipologías de modelos de campos aleatorios

que se pueden utilizar en el modelado espacial. Algunos de estos modelos ya han sido
ampliamente explotados en la literatura; otros representan la base para establecer modelos
que son más sofisticados que los que se utilizan actualmente en la literatura de econometría
espacial aplicada.
2.4.1 Ruido blanco espacial
El más simple de todos los campos aleatorios es la extensión a dos dimensiones del
concepto de un proceso de tiempo de ruido blanco. Introduzcamos la siguiente definición:
Definición 21. Se dice que un campo aleatorio {u(s), sÿS} es un ruido blanco espacial si:
(i) E(u(s)) = 0 ÿ s (2.32)
2 = s
ÿÿ por si
yo
(ii) E(u(si), u(sj)) = ÿ ÿ

j 0 de lo contrario
es decir, si las variables aleatorias que lo constituyen tienen media cero y no están
correlacionadas por pares, sin importar cuál sea su posición en el plano. El ruido blanco
espacial obviamente no tiene interés per se en un contexto espacial donde necesitamos
modelar eventos dependientes. Sin embargo, representa la base para construir campos
más significativos.
Una clase importante de modelos de campos aleatorios paramétricos es la que se basa
en la propiedad bidimensional de Markov. Esta clase de modelos se presentará en la
siguiente sección.
2.4.2 Campos aleatorios de Markov
Una clase importante de campos aleatorios muy estudiada en la literatura es la de los

campos aleatorios de Markov. El concepto de campo aleatorio de Markov se debe
esencialmente a Dobrushin (1968) y representa una forma de extender la propiedad de
Markov, originalmente definida para procesos de tiempo, a más de una dimensión. Como
es bien sabido, para procesos aleatorios en el tiempo, la propiedad de Markov se puede
expresar por el hecho de que el “futuro” del proceso, dado el “presente”, no se ve afectado
por el “pasado”. Para campos aleatorios espaciales, la extensión debe tener en cuenta la
multilateralidad de la dependencia en el espacio. En términos generales, es posible
introducir la siguiente definición.
Definición 22. Un campo aleatorio {X(s), sÿS} se llama campo de Markov si, para cada
siÿS se tiene:
E[ X ( ) si ] < ÿ
y (2.33)
=
MI[ ] X ( )B
si
yo ÿs
yo
MI[ X ( )ÿ ( X s(j ): s jÿ
si
yo
N(yo)] )
donde Bÿs representa el álgebra ÿ asociada con todas las X(sj) excluyendo X(si)
i
y (X ( sj):sj ÿ
ÿ
N(yo)) representa el álgebra ÿ asociada solo con el azar
variables X(sj) pertenecientes a la vecindad de X(si).
Un resultado importante útil para particularizar una familia de campos aleatorios
paramétricos de Markov está representado por el teorema de Hammersley y Clifford. Debido
a la suma importancia de este resultado, dedicaremos la siguiente sección a su discusión
antes de introducir algunos campos aleatorios paramétricos especiales de Markov.
2.4.2.2 El teorema de Hammersley y Clifford
Una forma en la que los campos aleatorios de Markov pueden especificarse en la práctica
consiste en asumir una forma funcional particular para la función de densidad condicional
de cada variable aleatoria y, posteriormente, derivar la función de densidad conjunta resultante.
Sin embargo, excepto en casos triviales, no existe una forma obvia de deducir la estructura
de probabilidad conjunta de un proceso derivado de un conjunto de distribución condicional.
Además, la estructura de probabilidad condicional está sujeta a una serie de condiciones
de coherencia interna y, como consecuencia, en algunos casos es imposible definir matrices
de varianza-covarianza bien condicionadas a partir de hipótesis sobre las distribuciones
condicionales.
Para garantizar que la función de densidad conjunta del campo aleatorio existe, es única
y está bien condicionada, es necesario imponer un conjunto de restricciones a las
densidades condicionales que están relacionadas con su forma funcional. Estas restricciones son
identificado por el teorema de Hammersey-Clifford, un resultado célebre que circuló durante
muchos años de forma privada (Hammersey y Clifford, 1971) antes de ser publicado por
otros autores (ver, por ejemplo, Besag, 1974; Preston, 1973; y Grimmett, 1973 para una
versión simplificada).
Comencemos por definir la cantidad
FX (X) (2.34)
Q(=
X) en
FX (0)
siendo (x) Xf la función de densidad conjunta de una sola realización x = x ,....... x 2 ) de

x1 , _ norte
( un campo X(s), y (0) Xf el valor asumido por la función de densidad conjunta en el punto
x0 = ( 0,0,...... .0 ) La función Q(x) a veces se conoce como la “función de potencial negativo”.
función” de un campo aleatorio (Kaiser y Cressie, 1997). Supongamos además que

(0) Xf > 0, lo que significa que tal realización tiene una probabilidad distinta de cero
de ocurrir. El teorema de Hammersley y Clifford identifica la forma más general de
Q(x) que asegura una estructura de probabilidad conjunta que es válida y consistente
para el sistema espacial en estudio.
Tal forma general es proporcionada por la expresión:
q (x ) =
norte norte norte norte norte norte
= ÿ ÿÿ
xi G x( i )+ xx G xx( ij,yoij ) + ÿÿÿ xxx G xxx jj ,
( jjjjjj , + ...
+ (2.35)
)
i =1 i = =11 j i ===
111
j k
<
yo jk< <
+ xxx
12
... xxx
G ( ,1 2 ,..., )
norte
1,2,...,
norte norte
donde los términos de interacción G(.) son distintos de cero solo si el conjunto de variables
aleatorias incluidas son vecinas. De tal manera, se pueden definir probabilidades condicionales
válidas. De hecho, de la Ecuación (2.35) se tiene:
fxxj
XX ij
n (yo ; ÿ ( ))
yo = Exp[ QQ
] ( x) ÿ (x ) i
fxjXX Ni
ij
(0 ; j ÿ ( ))
(2.36)
con x = yo (xxx,...,
1 yo 1 + yo 1ÿ
,0, ,...,X) . norte
La importancia del resultado anterior radica no solo en que garantiza la existencia de una
función de densidad conjunta dadas algunas restricciones sobre las densidades condicionales
de las variables aleatorias que interactúan espacialmente, sino también en que sugiere las
restricciones que deben imponerse a tales densidades condicionales para obtener
representaciones válidas. Mediante el teorema de Hammersley-Clifford, las densidades
conjuntas siempre se pueden descomponer en la interacción entre pares de variables, tripletes
de variables, etc. En la práctica, sin embargo, los campos markovianos se han estudiado
generalmente restringiendo solo la interacción por pares (Ripley, 1990). Esta es una
simplificación obvia, pero con algunos fundamentos empíricos. En física, por ejemplo, las
fuerzas gravitatorias y electrostáticas proporcionan dos ejemplos en los que la interacción entre
los diversos elementos del espacio es puramente por pares (Künsch, 1981). En las ciencias
naturales, además, muchas especies animales sólo tienen luchas por parejas cuando defienden
sus territorios (Ripley, 1990). Sin embargo, existen muchos otros casos, incluidas las situaciones
económicas, en los que sería interesante profundizar en nuestro conocimiento de la interacción
de orden superior. El caso de la competencia de precios espaciales (Haining, 1990) constituye
uno de esos casos. Los modelos de interacción espacial por pares de campos aleatorios
también se conocen como modelos automáticos, después de Besag (1974).
Para estos modelos, la Ecuación (2.35) se reduce a:
norte norte norte
q(x) = ÿ x iG x ( ) i + ÿÿ ( xx
i G xx
j yo yo
) (2.37)
i=1 i = 11 j =
yo<
ÿ ÿ ÿÿ
ÿ
norte ÿ
(x ) exp ( xi G=x ÿ ÿ (2.38)

ÿ ÿ
QQ
(X) )+ ÿ
ÿ
i ÿ
i i x ÿ
ij j ÿ
ÿ
ÿ
j =1 ÿ
ÿ ÿ <
yo ÿÿ
donde los parámetros representan

ÿ términos de interacción espacial por pares y son tales =
yo
ÿ 0 a menos que j ÿ N(i) y que ÿ = ÿ ji . De esta forma, las restricciones a

yo yo
imponer sobre la función de densidad de probabilidad conjunta se reducen a restricciones

sobre el posible rango de valores asumido por los parámetros
ÿ yo .
A partir de los resultados del teorema de Hammersley-Clifford, Besag (1974)
examinó qué tipo de funciones de distribución se pueden definir, lo que lleva a
modelos válidos para campos aleatorios. Algunos de estos procesos son
potencialmente muy útiles en los análisis económicos y se revisarán en las siguientes secciones.
2.4.2.3 Ley de Ising

Un caso simple que ocurre en instancias prácticas es la situación donde la variable
observada es dicotómica. Esto ocurre cuando detectamos la presencia de un
determinado agente económico en un lugar, o la presencia de una determinada
característica en una región (por ejemplo, una innovación tecnológica o un tipo
particular de asentamiento industrial). En este caso es necesario modelar la probabilidad condicional:
P{X (si) X (sj),si ÿ sj}= P{X (si) X (sj);sj ÿ N(i)} (2.39)
donde las variables aleatorias X(si ) solo pueden asumir los valores 0 y 1. Sobre esta base,
por lo tanto, se pueden definir las probabilidades:
(2.40)
pag=pag [
X (si) 1X
]
i = sj( =) x( ); ÿ
sj sj N(i)
y
(2.41)
= X (si) 0= X
sj (=) sj
X sj
( );ÿ N(i)
]
qP
i [
(con pi + qi = 1), representando las probabilidades de presencia y ausencia , si

yo
en el sitio condicionadas a la presencia o ausencia del fenómeno en los sitios

vecinos , j N(i) sj.ÿ
Si, en particular, los parámetros distintos de cero son aquellos asociados con una
estructura vecina que consta de un solo sitio o pares de sitios, el resultado es un modelo
de interacción por pares tal que:
norte norte norte
q (x) = ÿ ÿÿ ÿ _
xii + ÿ xx ij ij (2.42)
i =1 i ==11 j
<
yo
De las ecuaciones (2.35) y (2.36) se tiene:
F XX s yo ( s( xx ); ( ) s( j ) sj
) ( yo ÿ yo ( )) norte
sj ÿ
= exp ( xÿ ÿ i + ÿ yoXj ÿ)ÿ (2.43)
ÿ yo
F XX ( ) ( )
si
yo sj (0 (X); ss
j j
ÿ yo ( )) ÿ=
j 1 ÿ
con j ÿ yo = 0 a menos que y =

ÿ yo ÿ ji .
En base a las nociones
anteriores podemos ahora introducir la siguiente definición.
Definición 23. Se dice que un campo aleatorio {X(s), sÿS} obedece a la ley de la
autologística (o ley de Ising), si la función de densidad condicional de cada variable
aleatoria con respecto a las demás se puede escribir como:
X s( ) Xs j ( )ÿx( =
F s i) x(s j)ÿ = f X s( ) Xs j ( )ÿx(
s i) x(s j); js ÿ N(i)ÿ
i i
X ÿ + ÿ X ( s))]
= Exp[( ( )(
si
yo i j yo
(2.44)
1 +exp[( ÿ
i
+ ÿ X ( s))]
j yo
con X(si ) = (0, 1), y ÿ y

yo ÿ yo
parámetros En particular se tiene:
Exp[ ( ÿ ÿ
i
+ ÿ X ( s))]
j yo
s yo( )
[ ( ) ]=
ÿ
N iyo= ( s) i 1 (=), p PX
j
s xj ÿ (2.45)
j
1 exp[ ( + ÿ ÿ
i
+ ÿ X ( s))]
j yo
s
j
ÿ yo( )
1
= x ([) 0 s
q iPX ( i), = ss ÿ yo ( ) ] = (2.46)
jj
1 exp[ ( + ÿÿ ÿ yo
+
ÿ X ( ))]
s
yo j
s
j
yo( )
Las ecuaciones (2.45) y (2.46) muestran cómo nuestra expectativa de la “presencia” del
fenómeno en el sitio si se modifica en función del número de presencias en los sitios
vecinos. El conjunto de parámetros representa la
ÿ interacción
vecinos. Los
por parámetros
pares entre son,
sitiospor el yo
contrario, parámetros locales y se pueden utilizarÿ para

i una
modelar
variablelaen
suave
el espacio.
variación
El de
significado de los parámetros también se puede aclarar, considerando que, en el caso
de que no haya interacción espacial,
ÿ i obviamente se tiene = 0 y, por lo tanto:
ÿ yo
exp[ÿ ] i
Pr[( ) s1i= (s ÿ), p X j
= yo
xji N ( )]= (2.47)
1+exp[ ]ÿ i
En aquellos casos en que ÿ ÿ 0, estos parámetros regulan la intensidad con la que la información
yo
del contexto local modifica la probabilidad de presencia.

Para ilustrar el significado de los parámetros, consideremos un simple =1
ÿ = ÿ
ejemplo y supongamos que un campo aleatorio obedece la ley de Ising, con para cada i i
y, además:
ÿ ÿ Si sj ÿ N(yo)
ÿ =
yo ÿ
ÿ
0 de lo contrario
=
o, equivalentemente, que ÿ yo ÿ con wij el elemento genérico de un contigu simple wij , ÿ 1if
ÿ N(yo)
sj
matriz de idad W tal que wij = .
_ ÿ
ÿ
0 de lo contrario
Consideremos también la siguiente configuración espacial:
X(si ) = 1
si
X(sj ) = 0
La probabilidad de que la localidad si presente un valor igual a 1 estará dada por:
exp[(1 + ÿ ÿ X ( s))]
yo j
s yo( )
[ yo ( ) ] =
ÿ
j
p PX
i
=x ( s) i = 1 ( ),ss ÿ
jj
1 +exp[(1 + ÿ ÿ X ( s))]
yo j
s
j
ÿ yo( )
En el caso de que no haya interacción espacial entre los sitios, simplemente tenemos:
[ exp[1] =
yo = ( ) 1 ( ), pi = PX si = x(sj) ]sj ÿ norte 0.73
+
1 experiencia[1]
para cada ubicación. Este valor representa la probabilidad que a priori (es decir, antes de observar lo
que sucede en el vecindario) atribuimos al evento X (si) =1, y depende únicamente del parámetro. En
ÿ
nuestro ejemplo, tres vecinos de cuatro presentan un valor igual a 1.
En el caso más general tenemos por lo tanto:
[ Exp[1 3] +
( )]
ÿ
( )sj1 ÿ( ),
PX si = x sj pi = yo =
norte + +
1 experiencia[1ÿ3 ]
En el caso de una dependencia espacial moderada (p. ej. con = 0,33), tenemos
ÿ que pi = 0,88, valor
que es mayor que el valor incondicional obtenido anteriormente (0,73). En el caso de un alto nivel de
interacción espacial (p. ej. = 1) tenemos, en cambio, que pi = 0,98 que es aúnÿmayor.
el caso
Finalmente,
de una en
interacción negativa (p. ej. = -0,33), la probabilidad condicional tomará el valor pi = 0,5, lo que muestra
cómo la probabilidad
ÿ incondicional (0,73) se reduce al condicionar los valores asumidos en la vecindad.
El modelo autologístico corresponde en física a la ley de ferromagnetismo de Ising (Ising, 1925)

y ha sido explotado en economía, por ejemplo, por Haining (1990), entre otros. Puede considerarse
una extensión de la versión espacial del modelo logístico clásico (Cox, 1970), además de que las
variables explicativas están representadas, en este caso, por las variables espaciales vecinas.
Algunas realizaciones simuladas interesantes de un campo autologístico, que son útiles para
comprender el mecanismo subyacente a este proceso, pueden verse, por ejemplo, en Cross y Jain
(1983).
2.4.2.4 El modelo automático de Strauss
La extensión inmediata del campo autologístico está representada por el caso en que la variable
observada es categórica, con un número discreto de, digamos, c resultados desordenados. Esta
instancia es bastante común en economía y ocurre, por ejemplo, al modelar las elecciones discretas
de un agente individual. En este caso, de la Ecuación (2.37) se tiene:
C C C
Qx()
=
ÿ ÿÿ ÿ nkk _ ÿ
ÿ kl nkl
(2.48)
k =1 k = =11 yo
kl<
donde nk representa el número de sitios pertenecientes a la clase k y, de manera similar, nkl el

número de pares de sitios pertenecientes a las clases k y l respectivamente. Finalmente, y sonÿ k
ÿ kl
parámetros. De (2.48) y recordando (2.38), se puede derivar la siguiente definición.
Definición 24. Se dice que un campo aleatorio {X(s), sÿS} obedece la ley de Strauss si la función de
densidad condicional de cada variable aleatoria con respecto a las demás se puede escribir como:
ÿ C
ÿ
Exp
ÿ
ÿ
ÿ
k
+ ÿ ÿ kl ulsi ( )
ÿ
=1
ÿ
yo
ÿ ÿ
PX[ kx
( s( )),= sj
s ÿ yo( ) ] = lkÿ
(2.49)
i j
C
ÿ C
ÿ
ÿ Exp
ÿ
ÿ
ÿ
k
+ ÿ ÿ kl
uls ( )
i
ÿ
yo
=1 yo
=1
ÿ lkÿ ÿ
donde u (l) representa el número de vecinos de sitios si pertenecientes a la clase l.

si
yo
En la hipótesis de que las clases son intercambiables y, además, que la expresión se simplifica
=
ÿ kl
ÿ , a:
Exp ÿ Reino Unido

() ]
PX[ k (X)( ),= si
yo
ss
jj
ÿ yo ( ) ] = si
yo
(2.50)
[ÿ
ÿ
C C
ÿ
ÿ ÿExp ÿ
ÿ ulsi ( )
ÿ
yo
=1 yo
=1
ÿ
ÿ
lkÿ ÿ
ÿ
Tal modelo markoviano fue propuesto por primera vez por Strauss (1977) y obviamente se reduce
a la autologística cuando c = 2.
2.4.2.5 El campo autobinomial
Una segunda extensión del campo de la logística automática está representada por el caso en el
que la variable observada puede asumir un conjunto discreto de resultados numéricos (por
ejemplo, el número de plantas industriales en una región o el número de personas empleadas por
una empresa).
En tal caso, el valor en cada sitio se puede representar como el resultado de, digamos, c
pruebas donde la probabilidad de éxito en cada prueba es p. En otras palabras, podemos suponer
que cada variable aleatoria que constituye el campo se distribuye condicionalmente con una
densidad binomial. Esto lleva a la siguiente definición.
Definición 25. Se dice que un campo aleatorio {X(s), sÿS} obedece a una ley autobinomial
(Besag, 1974), si la función de densidad condicional de cada variable aleatoria con respecto a las
demás se puede escribir como:
ÿÿ
Cÿ
PX[ kxnorte yo (s ) = (s ),s ÿ ( )]= ÿ
k
(1 i pp
ÿ
)
ck
ÿ
(2.51)
i i
ÿk ÿ
j j ÿ ÿ
siendo k = 0, 1,…, c y pi un parámetro que varía espacialmente. En este caso, siguiendo el

teorema de Hammersley y Clifford, tenemos:
ÿ pagi
norte
=ÿ +i X (2.52)
registro ÿ
ÿ
ÿÿ ÿ=1 ÿ yo j
1ÿ pagi ÿ j
y por lo tanto,
ÿ norte
ÿ
Exp ÿ
ÿ
i
+ ÿ ÿ X
yo j
ÿ
= ÿ j =1 ÿ
pag
i (2.53)
ÿ norte
ÿ
+
1 experiencia ÿ ÿ
i
+ ÿ ÿ X
yo j
ÿ
ÿ j =1 ÿ
con y =
ÿ
i ÿ yo
parámetros y, por ejemplo
ÿ de contigüidad
con wij ÿWpriada
una matriz
apro ÿ yo
wij . Para c = 1, el modelo obviamente se reduce al campo autologístico más simple.
2.4.2.6 El modelo de Auto-Poisson
Otro caso interesante ocurre cuando el campo aleatorio está constituido por variables
que representan conteos de eventos (tallies), pero donde estos eventos presentan
una probabilidad muy baja de ocurrencia. En este caso, es razonable suponer que la
distribución condicional de cada variable aleatoria en cada sitio sigue una ley de
ÿ i , las ocurrencias
probabilidad de Poisson con un valor esperado, digamos en el sitio i, que
en los
depende
sitios de
vecinos. En este caso, se cumple la siguiente definición.
Definición 26. Se dice que un campo aleatorio {X(s), sÿS} obedece a la ley de auto-
Poisson (Besag, 1974), si la función de densidad condicional de cada variable aleatoria
con respecto a las demás se puede escribir como:
X ÿ
ÿ
ÿ mi i
PX[ kx
( s)i(= ss
), ÿ yo( ) ] = i
(2.54)
j j !X
norte
ÿ ÿ
ÿ = exp ÿ
ÿ ÿ yoÿj ÿ (2.55)
i i
ÿ + ÿ=
j 1 ÿ
Besag (1974) demostró que las condiciones de consistencia derivadas del teorema de
Hammersley-Clifford imponen la restricción <0 en el parámetro
ÿ y para
j, y que
cada
porpar
lo tanto
de sitiosÿ i yo yo
dentro de este marco solo se puede modelar la dependencia espacial negativa. Este
hecho ha limitado fuertemente el uso de dicho modelo en el análisis económico donde
los fenómenos de dependencia espacial positiva son de suma importancia. Sin embargo,
más recientemente, Kaiser y Cressie (1997) desarrollaron un modelo que también
permite una dependencia espacial positiva al especificar distribuciones condicionales
basadas en un Poisson truncado (a menudo denominado Poisson winsorizado después
de Galambos, 1988). Este campo aleatorio Winsorizado de Poisson se puede usar para
modelar dependencias positivas o negativas entre variables aleatorias distribuidas
espacialmente y se ha usado en la literatura para describir el patrón de mortalidad y
morbilidad en estudios epidemiológicos (Clayton y Kaldor, 1987).
2.4.2.7 El campo Auto-normal (o CAR)

Si la variable observada es del tipo continuo, a menudo es posible formular un
proceso de Markov basado en una distribución normal. En este caso se
cumple la siguiente definición:
Definición 28. Un campo aleatorio {X(s), sÿS} se denomina auto-normal o AutoRegresivo

Condicional (CAR) (Besag, 1974), si la función de densidad condicional de cada variable
aleatoria con respecto a las demás puede ser expresado como:
F XX(s)yo
() sj
[s (xx)yo( sj )] =
FXX ( ) ( )
i sj
[s xx( yo) (norte
); yo ss ÿ ss ÿ ; jj ( )]
j i
=
1
2
ÿ
ÿ 1 ÿ
ÿ
ÿ
2 ÿ
(2 ÿÿ i ) exp ÿÿ ÿ
ÿ
2 ÿ Xÿ (ÿÿ) ÿÿ
si
yo µ i ÿ yo
(X ( )s j
ÿ
µ j )ÿ ÿ (2.56)
2ÿ i yo
ÿ
ÿ ÿÿ
2
donde µi = E( ( ) X si ), esÿ un
i
= Var( ( ) de
conjunto X si constantes
), y ÿ tales que, por ejemplo, con wij yo
ÿ = de
ÿW y W una matriz ÿ conectividad
que: apropiada. wij , de estas definiciones se deduce
yo
(fYy i
= i X xi =
ÿ i ,)i (2.57)
yo X
_ yo
(2.58)
Var X[ s (=) xi ( X ] 2
), ss ÿ norte yo = j j () ÿ
yo
De las definiciones anteriores también se deduce que la función de densidad de probabilidad conjunta
del campo aleatorio es MVN(µ,V), con un vector de medias µ ÿ (µ1, µ2,..., µn) y una varianza-auto-
covarianza matriz V tal que:
V = (I – B)–1 ÿ (2.59)
ÿÿ 2 ÿ
1 000
ÿ ÿ
2
ÿ
0 ÿ
2
ÿ
con ÿ = ÿ ÿ
y B ={ ÿ }, con B simétrico, para
yo
ÿ ÿ
2
ÿ 0
ÿ ÿ
ÿ
norte
ÿ
garantizar la simetría de V.
El campo de Markov descrito es, con mucho, el más utilizado en la práctica en el
aplicaciones (ver Besag 1986; Mardia, 1990; y Ripley, 1988 para una revisión).
2.4.2.8 El campo gaussiano intrínseco
Besag et al. (1991) introdujeron una especificación diferente para un modelo autonormal
basado en la especificación directa de la función de densidad de probabilidad conjunta del
campo. Esto se expresa como
ÿ ÿ
cx( ) 1 norte norte
2
ÿ ; )= wxx
ÿ ÿ
FXXX
s 1 ,s 1s 2 ,...,
( XX , s ,..., 2 X
ÿ ÿÿ ÿ ÿ
Exp ÿ 2 yo (
j i ) ÿ (2.60)
sn sn _
2ÿ
norte
ÿ i =1 j 1
ÿ Ji=< ÿÿ
con wij ÿ W y W una matriz de conectividad. Tal función de densidad de probabilidad conjunta se
define mediante los valores esperados condicionales:
i i 1
( ) EX s)X=sj N( (i () )) =
j
EX( s resto ( ); ÿ
ÿÿ Xj (2.61)
i jn yo ( )
ÿ
con i
ya definido en la Sección 2.2.1.2, y
ÿ
2
i i ÿ
)X =s X sj N i =
j norte
(2.62)
( (s)resto
Var X ( ( ) ( Var
); ( )) ÿ
ÿ= w yo
j 1
y posee valores esperados incondicionales cero y una matriz de varianza-covarianza definida

como:
norte
ÿ
ÿ= w yo
ÿ j 1
2 =
V =
ÿ
si yo (2.63)
ÿ ÿ
ÿ
w yo
2
ÿ
Si yoÿ
ÿÿ
Para obtener más detalles sobre el campo aleatorio gaussiano intrínseco, consulte también Molliè (1996).
2.4.2.9 El campo autonormal bivariado
Dada su importancia en la econometría espacial (como quedará patente en el Capítulo 4), en esta
sección y en la siguiente extenderemos la idea de un campo autonormal para abarcar el caso de
campos vectoriales aleatorios. Para empezar, en la presente sección definiremos el campo
aleatorio autonormal bivariado. En la siguiente sección ampliaremos más este concepto e
introduciremos el campo autonormal multivariante.
T T T
Definición 29. Un campo aleatorio {Z(s), sÿS}, Z(s) =(Y(s) , X(s) ) se ha dicho
autonormal bivariado (o CAR doble ; véase Kim et al., 2001) si la función de densidad condicional
de cada variable aleatoria con respecto a las demás viene dada por:
F YYXX ji ( ) ( ), ( ),ss( )yyxx

si
sj
] =
( ) ( ),), ( s j (
si
yo
si
yo
si
yo ) yo
jj ( ) ]
=
FYYXX
( s ) ( ),),s(( ) sj s
ji ( ) ss( yyxx
[[ si
), ( ), ( ); norte
yo ss ÿ yo (2.64)
i i i
1
2
ÿ
ÿ 1 ÿ ÿ
ÿ
ÿ
= (2 ÿÿ )
2 ÿ
Y(s yo
) yÿyoÿÿµ ÿ (X (s )
ÿ
µ ) (X ÿ(s ) j X jyo Xÿyoÿÿµ )

ÿ
ÿ (Y(s )j Y j
ÿ
µ
i ÿ 2 ÿ
yo yo
)ÿ ÿ
ÿ
ÿÿ
yo ÿ ÿ
yo ÿ
yo ÿ ÿÿ
2 =
donde Xµi = E(X(si)), Yµi = E(Y(si)), fx X = i x( ÿi = Var(X(si))
i) y Var(Y(si)), Y
ÿ yo ,
i
con ÿ, ÿ, ÿ a conjunto de parámetros tales que y W una ÿ =ÿ

matriz de
ÿ
=ÿ
Wij , wij , wij ÿ W yo yo
conectividad propiamente definida.

Tenga en cuenta que, a partir de la ecuación (2.64), la esperanza condicional de Y(si) dadas todas
las demás variables aleatorias se puede expresar como:
EY[ s(X) i (s );Y (s);(X (s) i

]=
jj
(2.65)
= yo
+µ ÿ[ ÿ
yo
X s (j
X) j
ÿ
µ ]+ ÿ [Xs ( ) ÿ
yo X yo µ ]+ÿ [ÿ yo
Ys( ) ÿ
jYj µ ]
yo
ÿ yo
ÿ
es decir, como una función lineal tanto de ( )i X s como de los valores retrasados espacialmente
de las variables ( )j X s y ( )j Y s .
La función de densidad de probabilidad conjunta del campo aleatorio resultante viene dada por:
ÿÿ µ ÿ ÿ
Y
Z ÿMVN ÿ
ÿ ÿ
; q ÿ
(2.66)
µ ÿ
ÿ ÿ
ÿÿ X
ÿ ÿ
ÿ
con la matriz de varianza-covarianza Q dada por

ÿ
1
ÿ ÿ ÿ primera guerra
ÿ + ÿ( ÿÿ)
mundial ÿ ÿÿ ÿ
ÿ
* ÿ
Q= ÿ yo
ÿ
ÿÿ WI + ÿ( ÿ) ÿW
ÿ ÿ
ÿ
ÿÿ ÿ ÿÿ
donde I* es la matriz identidad de dimensión 2n, I la matriz identidad de dimensión

2 2 2 2 2 2
n, wij ÿ W ÿ ,=ydiag ( ) Y
ÿ , ÿ 2 ,..... Y ÿ , n X ÿ 1 , X ÿ 2 ......., X
1 año
ÿ . Asumiendo el norte
ÿ yoÿ 2 0 ÿ
X
constantes en las n observaciones, esto se simplifica como ÿ = ÿ ÿ ÿ
.
0 yoÿ
2 ÿ
ÿ y ÿ
2.4.2.10 El campo autonormal multivariante (o MCAR)
Definición 30. Un campo aleatorio k-dimensional X = {X(si),i ÿ1,…,n}, X( ) si ÿ Rk,

se dice que es un CAR multivariante (o MCAR, o un campo aleatorio autonormal
multivariante; ver Mardia, 1988) si admite las siguientes distribuciones condicionales:
F
Xs( Xs
),i ji ( ) j ÿ
ÿ µ +( ÿi
norte
: ÿ
( ( )ÿ µ j
CXjjjis ij ), V i ), (2.67)
donde µi es un vector columna de valores esperados cada uno de dimensión k , Cij

ÿC son los elementos de una matriz de parámetros k-by-k (tal que, por ejemplo, ÿ =Cij
wij ), y Vi es la matriz de varianza-covarianza de ( )i X s condicionado (a(X(sj),

) ÿ ji .
=
Consideremos ahora el vector k-by-1 ZX's " X's 1 ( )) T .Bajo específico norte
condiciones, Z puede considerarse distribuido como el campo gaussiano:

Z ÿ N( ) µ,ÿ , (2.68)
T donde µ (= µ1 " µn y,)

estableciendo do = ÿyo yo
pag
,
ÿ CV 1 " CV 1 ÿ
ÿ ÿ
ÿ ÿ
1 11 1 1norte
1 =
ÿ ÿ
ÿ #%# . (2.69)
ÿ
ÿ ÿ
CV 1 " CV 1
ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿ nn 1 nn ÿ
En particular, la Ecuación (2.68) se cumple si asumimos las siguientes hipótesis:

1. T
CijVj = Vi Cji , ÿ i, j = 1,…,n ;
2. al menos una entre matrices

ÿ ÿ
V1 1 ÿ
" ÿ
V1 1ÿ ÿ
#%#
ÿ ÿ
ÿ ÿ
ÿ
ÿ
ÿ
1 " ÿ
ÿ
1 ÿ
ÿ vn vn ÿ
ÿ
ÿ
C 11 " ÿ
C1 norte
ÿ
ÿ
#%# ÿ
ÿ ÿ
ÿ
ÿ
ÿ
C norte 1
" ÿ
C nn ÿ ÿ
es definida positiva.
El resultado anterior se puede probar de la siguiente manera. Observe que la densidad conjunta
relacionado con las densidades condicionales
FX (s X(s
) ), ÿ ji i j
Zf es por la propiedad (ver, por ejemplo,
arroyo, 1964):
FZ (z) = norte
FX (s Xi )s ( ),j ji ÿ
(; xxx
yo yo…
1 ,, ÿ
1, µ yo 1 ,+
…, µ norte
)
ÿ=
(2.70)
FZ (µ) (; µi µ 1µ, …
i 1
FX (s )Xi s ( ), ji ÿj
µ, i 1 ÿ
,X yo + 1 , … , X ), norte
T =Z (x xn
donde xi representa una forma abreviada de ( )i xs y )Ecuación 1 (2.67)
,..., . Además, desde
podemos escribir
1/2 ÿ 1
)(= ) 2 k/2 ÿ
(; xxx d TV d 21
ÿ
(2.71)
ÿ
V
ÿ
F X (s X)s ( ), yo yo… , …µ
1 ,µ , ÿ Exp ,
ÿ
1, ÿ
i i i i
ÿ
ÿ
yo 1 , +
i ÿ jij norte
ÿ ÿ
donde
i 1
Cxyo(j
ÿ
dxi = i ÿ µi ÿÿ ÿµ ), (2.72)
j =1 j
(y ÿ)(Xÿˆ)W y ÿ Xÿ ˆ T
(2.73)
2
j ÿ
donde
ÿi = ÿÿ Ji= + jjC x (ÿ µ 1 ij
norte
). (2.74)
Como consecuencia, de la Ecuación (2.70) podemos escribir
ÿf (y )ÿ Z ÿ ÿ T 1 1 T 1 ÿ ÿ
ÿ
norte ÿ ÿ
2ln ÿ ÿ
=ÿ
2ln ÿ
Exp ÿ
ÿ
1dV
i
di2 i
+ ÿ i
V i di
ÿ F Z (µ )ÿ
i =1
ÿ
ÿ =ÿ ÿ
ÿ ÿ
ÿ ÿ 2 ÿÿ
T 1 T 1
=
ÿ ÿ di =
norte ÿ
norte ÿ
d iv d i i
ÿ
di V i
i =1 i =1
(2.75)
T 1
ÿ ÿ1 (X i ) ( )
norte norte ÿ
=ÿ ÿ
µ i
CVi x ÿ=
µ
i= j =1 yo j j
T 1
()(),
ÿ
=ÿ
z ÿ zµ ÿ
así que eso
nk / 2 1/ 2 T
) ( y ÿ y +) ÿ µ ÿ1µ(
ÿ
z
ÿ
ÿ (2.76)
ÿ
=ÿ
ÿ
),
ÿ
2ln( f Z ( ) ) () 2ln( 2
lo que implica
nk / 2 1/ 2 1 T
() ( )2 ÿ 1
ÿ
FZ z =
ÿ
ÿ ÿ exp ÿ
ÿ
ÿz()()
µ ÿ, zÿ µ ÿ
ÿ ÿ
(2.77)
ÿ 2
Como se dijo anteriormente.
El campo CAR univariado simple presentado en la Sección 2.4.2.7 se puede

obtener a partir de las fórmulas anteriores haciendo k = 1. De hecho, en este caso,
X colapsa al campo aleatorio univariado, las matrices de varianza-covarianza Cij se
vuelven escalares y pueden denominarse parámetros de dependencia ij , y,con cii = ÿ1 ,
finalmente,
c
Vi representa la varianza condicional (escalar) de ( ) X ( además, tenemos

, decir si
yo
ÿ
2 yo .
En
Y T= X (s "(X)1 s ) ( ) , µ T= µ 1 " µ ), y norte norte
2 2 2
ÿ 1/ ÿ 1 ÿ
do /ÿ " ÿ
C /ÿ ÿ
12 1 1 norte 1
ÿ 2 2 2 ÿ
/ ÿ 2 1/ ÿ 2 " ÿ
C / ÿ 2
ÿ
1 21 _
=
2 norte
ÿ ÿ ÿ
, (2.78)
ÿ
# #%# ÿ
ÿ
2 2 2 ÿ
do /ÿ ÿ
C 2 /ÿ " 1/ ÿ
ÿ
ÿ
1
norte norte norte norte norte
ÿ
ÿ
o, en notación matricial compacta, como:
1 1
(
ÿ ÿ
ÿ = MI ÿB ), (2.79)
que es formalmente equivalente a la Ecuación (2.59). Se pueden encontrar más detalles sobre
los campos MCAR en Banerjee et al. (2004) .
2.4.3 Campos no markovianos
Incluso si la clase de campos aleatorios markovianos es lo suficientemente amplia como para

abarcar la mayoría de las situaciones empíricas, se han introducido en la literatura otros modelos
de campos aleatorios derivados de diferentes hipótesis. A continuación se revisarán algunos de
los que han sido explotados en la literatura econométrica espacial.
2.4.3.1 El campo aleatorio autorregresivo simultáneo (SAR)
Una primera clase de campos aleatorios que no son de Markov se deriva de la extensión del
modelo autorregresivo temporal, haciendo uso del concepto de retraso espacial presentado en la
Definición 5. Tenemos la siguiente definición.
Definición 31. Se dice que un campo aleatorio {X(s), sÿS} es autorregresivo simultáneo (o SAR;
Whittle, 1954), si satisface la siguiente ecuación de diferencia estocástica:
X s( -) i= ÿ Xµ si - + tu sÿ ( ) yo yo
[() j µ j
] (2.80)
yo
ÿ
con ÿ = ÿ wij , wij ÿW y W una matriz de conectividad apropiada, y {u(si ), sÿS} un proceso
yo
de ruido blanco espacial. De esta forma, cada una de las variables aleatorias que constituyen el
campo se ve como una suma ponderada de las variables aleatorias vecinas.
a través de la matriz de ponderación W. En este sentido, el término ÿ [ ÿ yo
X (s )
j
ÿ
µ j
] como
yo
ÿ
asume el significado de un retraso espacial de la variable centrada X (s ) µ i , y Ecua

ÿ
ción (2.80) también podría escribirse como:
X ( )s - yo µ = ÿ LX[ ( ) s - yo µ i ] tu +(s) i (2.81)

i
con L[ ]. el operador de retardo espacial presentado en la Sección 2.2.1.2.

De esta ecuación podemos obtener algunas propiedades de la distribución conjunta de

2
ÿÿ 1
000 ÿ
ÿ ÿ
2
0 ÿ
2 ÿ
2
ÿ
X(si ). Específicamente, si establecemos Var(X (si )) = ÿ i yÿ= ÿ ÿ

, la
ÿ ÿ
2
ÿ 0
ÿ ÿ
ÿ
norte ÿ
La matriz de varianzas y autocovarianzas espaciales derivadas de este modelo viene dada
por:
VIBIB = ( ÿ 1) ÿ( ÿ )
ÿ
ÿT
(2.82)
con B ÿ { ij},ÿy V sujeto a la restricción de que (I – B) no sea singular para asegurar

la existencia del inverso (I – B) -1. Si, en particular, ÿi 2 =ÿ2 ÿi, la ecuación
(2.82) se reduce a:
V= ÿ 2
[(yo
) (ÿBIT ÿB ) ]1 (2.83)
El campo SAR es sin duda el más utilizado en econometría espacial (Anselin,

1988; Anselin et al., 2004).
Tenga en cuenta que (como destaca Anselin, 2001a), debido al hecho de que los
elementos diagonales en la Ecuación (2.83) no son constantes incluso con términos de
error iid, el modelo generalmente define campos que no son estacionarios en covarianza.
Una excepción a esto ocurre cuando cada sitio tiene un número idéntico de vecinos, pero
este es un caso de uso práctico limitado en econometría. Esta falta de estacionariedad tiene
una relación importante cuando uno está interesado en la aplicación de los teoremas del
límite central y las leyes de los grandes números con el fin de derivar propiedades asintóticas
para los estimadores y estadísticos de prueba. Este punto ha sido planteado recientemente
por Anselin (2001a), pero, hasta el momento, no ha recibido en la literatura la atención que merece.
La relación entre un modelo CAR (Ecuación 2.56) y la especificación SAR es la
misma que existe entre un modelo autorregresivo de arranque fijo y uno de arranque
aleatorio en la literatura de series temporales (Hamilton, 1994). De hecho, también en
una teoría de autorregresión de series de tiempo, podemos especificar un modelo de
dos formas alternativas: ya sea como las expectativas de la variable dependiente
condicionadas a las variables independientes, o, alternativamente, como una relación lineal impuesta a priori.
entre la variable dependiente por un lado y las variables independientes por el otro con un
término estocástico adicional. Sin embargo, hay una diferencia notable con el caso espacial.
En el caso de una autorregresión de series de tiempo bajo la hipótesis de normalidad,
ambas especificaciones conducen a las mismas conclusiones inferenciales en términos
tanto de estimaciones puntuales como de sus propiedades de segundo orden. En el caso
espacial, por el contrario, las propiedades de segundo orden de las dos especificaciones
son diferentes, como queda claro al comparar la matriz de varianzas-covarianzas obtenida
en la Ecuación (2.59) con la obtenida en la Ecuación (2.83). Además, la especificación CAR
conduce a un modelo estacionario, mientras que la especificación SAR generalmente no lo hace. Nota
2.4 Algunos campos aleatorios especiales sesenta y cinco
también que, en el caso gaussiano, cualquier modelo simultáneo definido por la matriz B
(llámese Bs) se puede expresar como un modelo autorregresivo condicional definido por el
T T
matriz Bc = Bs + Bs – BsBs . Sobre las relaciones entre la CAR y la SAR
modelos se remite al lector interesado a Brook (1964). Nótese, finalmente, que en este
contexto usamos el acrónimo SAR como se usa en la literatura de estadística espacial (ver,
por ejemplo, Cressie, 1991), con un significado diferente al usado en la literatura de
econometría espacial donde indica la regresión espacial mixta - modelo de autorregresión
(LeSage, 1999; véase el Capítulo 4.3.6 a continuación).
2.4.3.2 El campo aleatorio de la media móvil
Se puede construir una segunda clase de modelos de campos aleatorios que no son de
Markov extendiendo el concepto de promedio móvil (o filtrado) a más de una dimensión.
Esto lleva a la siguiente definición.
Definición 32. Se dice que un campo aleatorio {X(s), sÿS} es una media móvil (SMA;
Haining, 1978), si la variable aleatoria X(si ) se puede expresar como:
Xs
( )yo
= µ i tu s + tu s (j ) ( )
i +ÿm yo
(2.84)
yo
ÿ
con mij un conjunto de constantes tales que mij = mwij , wij ÿW , es apropiado
matriz de conectividad y {u(si ), sÿS} un proceso de ruido blanco
ÿÿ 2
ÿ
1 0espacial.
00 ÿ
ÿ
2
ÿ
0 ÿ
2
ÿ
Si asumimos que Var(u(si )) = ÿ2 i, yÿ= ÿ ÿ

, entonces la
ÿ ÿ
2
0
ÿ ÿ
ÿ ÿ norte
ÿ
La matriz de varianzas y autocovarianzas espaciales resultante para el modelo {X(s),

sÿS} viene dada por:
[ + M)ÿ(yo + M)
V = (yo
]T (2.85)
con METRO ÿ { mij }. Si, además, ÿ2 i =ÿ2 ÿi, la expresión se simplifica a:
V= ÿ 2
[( yo
)( ) + mi + m ]T (2.86)
Este campo representa el análogo espacial de los modelos de promedio móvil temporal.
Aquí, la dependencia se introduce filtrando un campo de ruido blanco de una manera que se
parece mucho al efecto Slutsky-Yule en el análisis de series temporales. Nuevamente, como
en el caso de los procesos autorregresivos espaciales, los elementos diagonales en la
Ecuación (2.85) no son constantes incluso si el término de error es un ruido blanco. El modelo,
por lo tanto, define campos que no son estacionarios en covarianza.
2.4.3.3 El campo aleatorio de la media móvil autorregresiva
Definición 33. Se dice que un campo aleatorio {X(s), sÿS} es una media móvil autorregresiva
(o SARMA; véase Huang, 1984), si la variable aleatoria X(si ) se puede expresar como:
( )=
Xs i +ÿµX ÿ [ tu( sj + tuµsj ]) ( )yo
i s ÿ +ÿm yo yo
( )j (2.87)
ÿi yo
ÿ
ÿ =ÿ , W es un
donde mij es un conjunto de constantes tal que mij = yo wij , wij ÿW
mwij ; matriz de conectividad apropiada y {u(si ), sÿS} un campo de ruido blanco espacial.
ÿÿ 2
1
000 ÿ
ÿ ÿ
2
ÿ
0 ÿ
2
ÿ
Si asumimos que Var(X (si )) = ÿ2 yo ,

yÿ=ÿ ÿ
, la matriz de
ÿ ÿ
2
ÿ 0
ÿ ÿ
ÿ
norte
ÿ
las varianzas y autocovarianzas espaciales resultantes para el modelo {X(s), sÿS} viene
dada por:
1
VIBIMIMIB
= (-)
ÿ
( + )ÿ( + )( ÿ )
ÿT
(2.88)
con M ÿ { mij } y B ÿ { los ÿ ij}. Este proceso representa el análogo espacial de = ÿ2 ÿ

modelos ARMA en un contexto de series de tiempo. En el caso más simple donde ÿ2
i
si , la matriz de covarianza de varianza se reduce a:
2 1
IBIMIMIB
V = (-)
ÿ
ÿ
( + )( + )( - )
ÿT
(2.89)
2.4.3.4 El campo aleatorio del componente de error espacial
Relacionado con la especificación anterior está el llamado componente de error espacial

modelo introducido por Keleijan y Robinson (1993, 1995, 1997). Este campo espacial es muy
similar a un campo SMA, pero, en lugar de especificarse en términos de un solo término de
ruido blanco, contiene dos componentes de ruido blanco independientes.
Definición 34. Un campo aleatorio {X(s), sÿS} se denomina componente de error espacial
(SEC), si la variable aleatoria X(si ) se puede expresar como:
X s( )=i +ÿm
µ i v s + tu s ( )yo
j
)
yo
(2.90)
ÿ
yo
con mij = mwij un conjunto de constantes, wij , W una matriz de conectividad adecuada
ÿW y {u(si ), sÿS} y {v(si ), sÿS} dos campos de ruido blanco espacial independientes. Él
m v(s )j implica un suavizado de los valores vecinos denominado

yo
término ÿiÿ
j
“efecto regional” (Anselin, 2001a), mientras que el término u(si ) es un efecto de innovación
específico de la ubicación.
La matriz resultante de varianzas y autocovarianzas espaciales viene dada por
(Keleijan y Robinson, 1993; Anselin, 2001a):
V=ÿ 2 yo +
tu
ÿ
2
v
milímetro
T
(2.91)
2
y 2
ÿ son los componentes de las varianzas en relación con el
donde M ÿ { mij } e ÿ tu
v
innovación y efecto regional, respectivamente.
2.4.3.5 La representación directa de un campo aleatorio
Una forma alternativa de especificar un modelo de campo aleatorio consiste en expresar los
elementos de la matriz de covarianza de varianza de manera parsimoniosa como alguna
función de la distancia entre pares de sitios. Si adoptamos esta estrategia, podemos
introducir la siguiente definición.
Definición 35. Un campo aleatorio {X(s), sÿS} se representa directamente (DR) (Mardia,
1990; Anselin, 2001a; Anselin et al. 2004), si cada elemento de la matriz de varianzas y
auto- las covarianzas entre las variables aleatorias X(si ) se pueden expresar como:
2
ÿ(s1, s2) = ÿ
f dij
( , )ÿ (2.92)
con d la distancia entre el sitio i y el sitio j, f (.) una función de disminución de la distancia tal
yo
ese ÿF
< 0 , fd( ,ÿ) ÿ1 y ÿ representa un vector apropiado de parame
yo
ÿd yo
ters. Por ejemplo, Mardia y Watkins (1989) propusieron la función:
ÿ d ÿ4
2ÿ 1 yo
ÿ(s1, s2) = ÿ (2.93)
ÿ
ÿ
ÿ ÿ
ÿ ÿ
Utilizando la Ecuación (2.93) para definir cada elemento individual de covarianza, la matriz
completa de varianza y autocovarianzas espaciales viene dada por:
V= ÿ 2
( ÿ dij ÿ , ) (2.94)
que debe ser definida positiva con elementos ÿ ÿÿ tal que ij ÿ =1 yyo
ÿ ÿ1 para cada i y j. Dado que cada elemento de la matriz de varianza-covarianza se modela

yo
directamente, podemos usar la "representación directa" para superar el problema de la no

estacionariedad en la varianza observada con los modelos SAR, SMA y SARMA. En la literatura
econométrica se ha empleado la representación directa para analizar el mercado de la vivienda
urbana por ejemplo, Dubin (1988, 1992), Olmo (1995) y Basu y Thibodeau (1998), entre otros.
Anselin (2001a) ha analizado una serie de problemas que surgen con la representación directa.
Se consideran extensiones adicionales de este enfoque dentro de un enfoque semiparamétrico
del modelado espacial: un tema que no se trata en detalle aquí. Consulte la Sección 6.2.8 a
continuación para obtener una discusión más detallada y referencias.
2.5 Teoremas limitantes para campos aleatorios
2.5.1 Introducción
En el centro de los diversos problemas de estimación, inferencia y prueba de hipótesis

en econometría se encuentra el problema de determinar la distribución de un conjunto
de estimadores de parámetros relacionados con el modelo de probabilidad ÿ = {f (X,ÿ),ÿÿÿ} .
En términos generales, estos estimadores pueden escribirse como funciones del vector
aleatorio X. Los resultados clásicos de la inferencia estadística se basan casi exclusivamente en
el caso de variables aleatorias distribuidas normalmente e independientemente, o variables que
pueden reducirse a este paradigma utilizando argumentos asintóticos.
Sin embargo, la naturaleza no independiente de las observaciones en el espacio impide la
aplicación de la mayoría de los resultados de la teoría inferencial tradicional.
Por otro lado, incluso la teoría asintótica (en la que se basa gran parte de la inferencia de
los modelos económicos dinámicos), parece encontrar obstáculos cuando se traduce al dominio
espacial. De hecho, en este contexto, no siempre está claro cómo los datos espaciales pueden
aproximarse al infinito considerando que, a diferencia del tiempo, el espacio geográfico es
inherentemente limitado.
Cressie (1991) proporciona algunas aclaraciones a este respecto al distinguir entre dos tipos
de teorías asintóticas aplicables a los campos espaciales. El número de unidades espaciales en
las que se observa un proceso aleatorio puede tender al infinito, ya sea dentro de un dominio que
también tiende al infinito, o dentro de un dominio que todavía está acotado, pero con un número
creciente de unidades (más densamente distribuidas) dentro de él. .
Cressie llama al primer tipo asintótico de dominio creciente y al segundo asintótico de relleno.
Mientras que en el contexto de las series de tiempo el tipo asintótico de dominio creciente parece
el más apropiado, en la econometría espacial la elección depende de la naturaleza del problema
que se está abordando. En el caso de un campo aleatorio de parámetros discretos (por ejemplo,
uno observado en particiones geográficas del espacio económico), se puede aplicar el enfoque de
dominio creciente expandiendo el número de campos observados.
2.5 Teoremas limitantes para campos aleatorios 69
variables aleatorias fuera del límite del área observada. Alternativamente, se puede aplicar
una teoría asintótica de relleno considerando un área limitada y niveles de particiones
subregionales cada vez más detalladas al desagregar posteriormente las unidades
existentes. Es importante señalar, sin embargo, que incluso en este caso no siempre es
posible aplicar un criterio que asegure que las observaciones tiendan al infinito de manera
regular: esto se debe tanto a la forma como al tamaño diferente de las distintas unidades
espaciales. ya la arbitrariedad con la que puede ocurrir una desagregación posterior (ver
Arbia, 1989, para una discusión detallada de este tema).
En el caso de campos aleatorios de parámetros continuos, la teoría asintótica de

relleno es probablemente conceptualmente más apropiada. De hecho, en esta segunda
instancia, es posible imaginar un mecanismo que lleve a un número creciente de
observaciones dentro de un mismo dominio, dado que en este caso el fenómeno
económico puede observarse en cualquiera de los infinitos puntos del espacio, pero el el
dominio a menudo se debe considerar como delimitado.
Según Anselin (2001a), "hasta la fecha, todavía faltan algunos resultados formales
para el caso de la dependencia espacial", pero "la intuición detrás de las asintóticas es
bastante sencilla en el sentido de que se necesitan condiciones de regularidad para limitar
el grado de dependencia espacial (memoria) y heterogeneidad". de la serie espacial para
obtener leyes apropiadas (uniformes) de grandes números y teoremas centrales del límite
para establecer consistencia y normalidad asintótica” (Anselin, 2001a).
Incluso con las precauciones indicadas anteriormente, es posible identificar condiciones
dentro de las cuales las propiedades asintóticas de un campo aleatorio son válidas para
fines inferenciales. En el resto de este capítulo, consideraremos algunas extensiones de
la teoría asintótica tradicional a campos aleatorios espaciales.
2.5.2 Algunos teoremas de límite para campos aleatorios
Dada la importancia del tema, citaremos ahora algunos conceptos de convergencia útiles
para comprender los teoremas de límite en el análisis espacial.
Definición 36. Se dice que una secuencia de variables aleatorias {Xn(s), nÿN} converge
casi con seguridad (o con probabilidad 1) a la variable aleatoria X(s), y se indica
COMO
como X (s)
ÿ X (s) , Si:
norte
} =1
PAGS { s : limnÿ+ÿ Xn (s) = X (s) (2.95)
Definición 37. Decimos que una secuencia de variables aleatorias {Xn(s), nÿN}
converge en probabilidad a la variable aleatoria X(s), y se indica como
PAG
X (s) Xÿ (s)
norte
, Si:
limnÿ+ÿ P{s: |Xn(s) – X(s)|<ÿ} = 1 (2.96)

Definición 38. Decimos que una secuencia de variables aleatorias {Xn(s), nÿN},
caracterizada por la función de distribución {Fn(X), nÿN}, converge en distribución a
D
la variable aleatoria X(s), y la indicamos Xn(s) ÿ X(s), si:
limnÿ+ÿ Fn(X) = F(X) (2.97)
en todos los puntos donde F(X) es continua.

Ahora podemos introducir las dos leyes probabilísticas fundamentales sobre las cuales
Se basa la teoría inferencial asintótica.
El criterio de convergencia casi segura está asociado al denominado:
Ley Fuerte de los Grandes Números (Teorema de Kolmogorov 2): Sea {Xn, nÿ1} una
2
secuencia de variables aleatorias independientes tal que E(Xi) = µ i, y Var(Xi) = ÿ
i
ÿ
1
() < +ÿ , entonces:
existen para todo i = 1,2,… y que ÿ k2 Var Xk
k=1
norte
1 norte
COMO
1( ÿ ÿX i
ÿ
norte
µ i ) ÿ0 (2.98)
n 1 i= i =1
El SLLN establece las condiciones bajo las cuales los promedios de las variables aleatorias
convergen a sus valores esperados, y por lo tanto constituye la base para obtener la
distribución de estimadores y contrasta estadísticos que se construyen como combinaciones lineales de
los valores observados.
Una vez más, la hipótesis de independencia entre variables aleatorias considerada en
la formulación de la ley imposibilita su uso en el caso de datos espaciales. Sin embargo,
McLeish (1975) y White (1984) demostraron que la SLLN puede extenderse al caso de
variables aleatorias dependientes siempre que obedezcan formas particulares de
restricción. Más específicamente, el siguiente resultado es válido:
Ley Fuerte de los Grandes Números para Campos Mezclados: Sea {Xn, nÿ1} un campo
aleatorio mezclado (fuerte o uniformemente: vea las Definiciones 18 y 19) donde tenemos:
d
r
ÿ (m) = O(m- ) d> (2.99)
2r ÿ1
Para campos fuertemente mezclados o, alternativamente,
d
r
ÿ (m) = O(m- ) d>
r -1
para campos de mezcla uniforme, y tal que está dominado por el proceso {Zn, nÿ1}en el
sentido de que |Xn| ÿ Zn. Entonces:
2.5 Teoremas limitantes para campos aleatorios 71
norte
1 norte
COMO
1( ÿ ÿX i
ÿ
µ i ) ÿ0 (2.100)
n 1i = norte
i =1
ÿ
1
siempre que ÿ 2 Var (Xk ) < +ÿ , y además, E(|Zr+d|) < D < + ÿ, nÿ1,
k =1 k
ÿ d>0. En esta formulación, el valor de r está relacionado con (m), es decir,

ÿ (m) y con
ÿ el grado
de dependencia entre las variables aleatorias. Cuanto mayor sea el grado de
dependencia, más se extenderán las restricciones a los momentos de orden superior.
El criterio de convergencia en probabilidad está asociado al denominado:
Teorema del límite central (CLT): Sea {Xn, nÿ1} una secuencia de variables aleatorias
independientes e idénticamente distribuidas de modo que E(Xi) = y Var(Xi)
µ i, i=1,2...,n
Además,
= ÿ
2
< +ÿ ÿ sea definimos la variable aleatoria

yo
NSE ( ) ÿ
norte
Y = norte norte
, con S norte xi , y caracterizado por una función de distribución

Var (S)
norte
norte
ÿ= =i 1
Fn(Y). Entonces:
D
Sí ÿ Z ÿ N(0,1) (2.101)
El CLT es la base para calcular las distribuciones límite de muchos estimadores y

estadísticos de prueba. Sin embargo, al igual que el SLLN, no puede aplicarse como
tal a sucesiones de variables aleatorias ordenadas en el espacio, debido a las
condiciones de independencia que impone. Sin embargo, se ha extendido al caso de
variables aleatorias mixtas a través del siguiente resultado
Teorema del límite central para campos de mezcla. Sea {Xn, nÿ1} un campo
aleatorio de mezcla (fuerte o uniforme) donde tenemos:
d r
ÿ (m) = O(m- ) d >
2r ÿ1
o (2.102)
d r
ÿ (m) = O(m- ) d >
r -1
por lo que está dominado por el proceso {Zn, nÿ1} en el sentido de que |Xn| ÿ Zn, y así
+d
2r 1 norte
que E(Xn)=0, nÿ1, y E(|Xn| )ÿ k < + ÿ. Además, sea Sn( Xi d )=ÿ ser
norte i =d+ 1
definido de modo que ÿ Vÿ0 y ÿ d , Entonces: sucede que lim ÿÿ +ÿ [E(Sn(

d))2 -V] = 0.
S (0) D
norte
ÿ Z ÿ N(0,1) (2.103)
Nevada
(ver White y Domowitz, 1984).

Una segunda forma de extender el CLT a procesos espaciales se obtiene
introduciendo los conceptos de campos aleatorios regulares y campos aleatorios
localmente covariantes .
Definición 39. Un campo aleatorio {X(s), sÿS} con E(X(si))=µi, y Var(X(si))=ÿ2 i,

se dice que es regular si (Smith, 1980) : (estado uniforme no degenerado)
2
i) ÿ
i
ÿ d
y (2.104)
2+d
ii) E(|X(si)- µ yo| )ÿÿ (Condición de limitación de Lyapunov)
Definición 40. Se dice que un campo aleatorio {X(s), sÿS} con µ i, y Var(X(si)) = ÿ2 i
E(X(si))= < ÿ, es localmente covariante si:
*
ÿ 0 si ÿ dd < yo
E(X(si) X(sj))= ÿ (2.105)

= 0 de lo contrario
ÿ
con dij cualquier medida de distancia entre los sitios si y sj (ver Sección 2.2.1).
El concepto de un campo aleatorio localmente covariante (debido a Smith, 1980 y estudiado
en detalle por Arbia, 1989) se basa en una forma de restricción en la dependencia del proceso
análoga a la independencia asintótica de los procesos aleatorios temporales.
Al desarrollar estos conceptos, Smith (1980) demostró el siguiente resultado.
Teorema del límite central para campos regulares y localmente covariantes. Sea {Xn,
µ i,
nÿ1} un campo aleatorio regular y localmente covariante tal que E(Xi)= y Var(Xi) = ÿi=1,2,…,n.
2
ÿ < +ÿ
Además, considere la variable aleatoria yo
NSE ( ) ÿ
norte
Y = norte norte
con S norte xi , caracterizada por la distribución acumulativa

Var (S) ÿ=i =1
norte
norte
función Fn(Y). Entonces:
D
Sí ÿ Z ÿ N(0,1) (2.106)
Serfling (1980) amplió aún más la CLT a procesos que presentan formas de dependencia más
complejas que las consideradas en el presente contexto (ver también Wooldridge y White,
1988).
3 Función de probabilidad para muestras espaciales
3.1 Introducción
Los procedimientos de estimación y prueba de hipótesis más comunes en econometría

son los que se basan en la noción de probabilidad introducida el siglo pasado por Sir
Ronald Fisher en las décadas de 1920 y 1930 y posteriormente ampliada por el trabajo de
varios estadísticos. Antes de introducir la especificidad de la probabilidad espacial, primero
introduzcamos la notación y los conceptos básicos.
Definición 39. Sea ÿ un modelo de probabilidad ÿ = f { XXXS, s 2 sn,...,

s1
_ s2 _
(xxx
1
, ,..., s norte
ÿ ; ),
si ÿ S,ÿÿÿ} y sea X un vector aleatorio, tal que X ÿ (X(s1), X(s2),…, X(sn)), relativo a
una muestra observada extraída de ( , con
x ÿ xxacuerdo ,..., Xun cierto
) , población.
modelo La
de función
muestreodede la s1
_
s2
_
sn
_
densidad de probabilidad conjunta del con ÿÿÿ el conjunto de muestra se define como
Esta función representa la Fprobabilidad
XXX , ,..., (de , s ,...,
XX que, antes
s1
X del
s , parámetrostuviéramos
ÿ );experimento,
s2
a estimar.
s 1 2 norte
norte
que sacar la muestra que realmente observamos. La función de verosimilitud se

define como:
L = L( ÿ ) = L(, x)
ÿ = ( ) cf X
XXX s, , s 1 ,...,
2 ( XX ,..., xÿs ; ) (3.1)
s1
_ s2 _ sn norte
con ( )cx = cxx _( s1

_
, s2 _
,..., x una
sn _
) función de solo los datos observados.
Debido a la naturaleza exponencial de muchas funciones de densidad, a menudo es útil
operar con la transformación logarítmica de la probabilidad (o log-verosimilitud) definida
como ln[L(, x)] = l(ÿ,las
x) =llamadasÿ sus
l( ). Asociado ÿ Enelparticular,
con
cantidades
momentos, logaritmo
de que de siguientes
verosimilitud
sonlas verosimilitud
interés hayde
y un conjunto unfunciones
conjunto
en definiciones
la inferencia estadística.
son de
esenciales para desarrollar procedimientos de estimación y prueba de hipótesis.
Definición 40. La primera derivada de la función logarítmica de verosimilitud con respecto a

los parámetros desconocidos se define como la función de puntuación y se expresa como:
ÿ l (Xÿ, ) ÿ
q (ÿ) = (3.2)
ÿ ()
74 3 Función de probabilidad para muestras espaciales
Definición 41. La matriz de la segunda derivada de la función log-verosimilitud con respecto a

pares de parámetros se denomina matriz de información observada de Fisher y se expresa como:
2
ÿ ÿ( l,X)
j (ÿ)= ÿ ÿÿ yo , k
ÿ ÿ (3.3)
ÿÿ ÿÿ yo k
Definición 42. El valor esperado de la matriz de la segunda derivada de la función log-verosimilitud

con respecto a pares de parámetros se denomina matriz de información esperada de Fisher y se
expresa como:
i(ÿ) = E[j(ÿ)] [] = Var q(ÿ) (3.4)
Dadas las definiciones anteriores, es natural introducir la siguiente definición.
Definición 43. Dada una función de verosimilitud L(ÿ, x) el estimador

ˆ de máxima verosimilitud de
los parámetros ÿ es la función de Borel ÿ :xÿÿ , tal que:
L ˆ(ÿ;xL =) máx ( ÿ;x ) (3.5)

ÿ ÿÿ
En el caso de funciones de densidad absolutamente continuas y diferenciables, el estimador de

máxima verosimilitud se puede obtener como solución a las ecuaciones:
ÿ ÿ L ( ÿ;x
) = =
q ( ÿ) 0
ÿÿ
(3.6)
ÿÿ
ÿ 2
ÿ L ( ÿ;x
)
ÿ
2
< 0
ÿ
ÿ ÿÿ
Los estimadores de máxima verosimilitud así obtenidos satisfacen un conjunto de propiedades

óptimas. En particular, si se puede asumir la independencia entre las observaciones en el modelo
de muestreo, se ha demostrado que son completamente eficientes y (bajo ciertas condiciones de
regularidad en el modelo de probabilidad) consistentes, asintóticamente insesgadas y
asintóticamente distribuidas normalmente (ver Azzalini, 1996) .
Como ya hemos comentado en la Sección 2.1, si las observaciones representan una muestra
representativa de individuos, a menudo es legítimo asumir la independencia de las variables
aleatorias para que la función de densidad de probabilidad conjunta de la muestra pueda escribirse
como:
norte
FX1 , ( , ,...,X x1
,..., x2 xn ÿ ; ) X yo ( ;ÿ) (3.7)
= ÿ=
2x2 efectos especiales
_ norte
i
i 1
3.1 Introducción 75
Sobre esta base, la log-verosimilitud de la muestra se puede escribir como:
norte
ÿ
=
l (ÿ) en[ c (x)f XXX ( xx
, 1 2xn
] = c(x) + ln ÿ X yo
ÿ ( ;ÿ) = ÿ
1 ,2 ,..., norte
,..., ÿ ; )
ÿ
ÿ=
i 1
i
efectos especiales
ÿ
norte
= c(x) + ÿ [ en X yo
efectos yo
especiales ( ;ÿ)
] (3.8)
i =1
donde el término ln[ ( ;ÿ)] X yo representa el log-verosimilitud para una sola observación
efectos especiales
x
yo .
Para las observaciones extraídas de una serie temporal, ya no es legítimo suponer la

independencia de las variables aleatorias componentes. Sin embargo, es posible
descomponer la función de densidad de probabilidad conjunta de la muestra (ver
nuevamente la Sección 2.1) como:
norte
F1 2 ( xxx XXX t , t ,..., t ÿ;) FXXX es ( xxxx t ,..., t 2 yo ÿ;) (3.9)

, ,..., t,1 1
t2
= ÿ=i ,..., 1
yo ÿ
t1 norte ÿ
_
Tennesse
tt 1 yo
Por lo tanto, la log-verosimilitud se puede escribir como:
=
l (ÿ)
= cfln[ (x) XXX
t1 , t2 ,..., Tennesse
(xxx
, _ ,..., ;ÿ] 1 2 norte
norte
C X
ÿ ( ) en ÿ F XXX es ( xxx t1
, t2
,..., X 1 ; ÿ) =ÿ
ÿ
,..., yo yo ÿ
t1 ti 1 _ _
= + ÿ=
ÿ
ÿ i 1 ÿ
norte
= C ( X) + en fXXX ( xxxx , ,..., ÿ;) (3.10)

ÿ=
i 1
eso
t1 ,..., ti ÿ
1 i t1 t2 yo
_
ÿ
donde registrof XXX

t1 ,...,
( xxxx
i
, t1 t2 ,..., yo
_
ÿ
1
ÿ ; ) ahora representa el log-verosimilitud para
eso ti ÿ
una sola observación x condicionada a su pasado. eso
Sin embargo, en el caso de las observaciones extraídas de un campo aleatorio espacial,

no es posible descomponer la función de densidad de probabilidad conjunta de la muestra
de manera similar a la que se observa para las secciones transversales o las series
temporales, dada la mayor complejidad de dependencia en el espacio. . A este respecto,
se pueden seguir dos enfoques alternativos. La primera consiste en obtener algunas
soluciones aproximadas para derivar la verosimilitud a partir de las densidades marginales
o condicionales del campo aleatorio. Este enfoque se seguirá en este capítulo. El segundo
enfoque consiste en derivar la verosimilitud total sobre la base de uno de los modelos para
campos aleatorios presentados en la Sección 2.4 anterior. Este segundo enfoque se
presentará en el Capítulo 4 cuando se analicen los diversos procedimientos de estimación
y prueba de hipótesis dentro del contexto del modelo de regresión.
3.2 Algunas aproximaciones para la probabilidad

de campos aleatorios
3.2.1 La técnica de codificación
Una primera forma de proceder para derivar la función de verosimilitud a partir de muestras
espaciales es la denominada técnica de codificación sugerida por Besag (1972). La
técnica se basa en la consideración de que si un campo aleatorio es markoviano (consulte
la Sección 2.4.2), entonces los pares de variables aleatorias asociadas con dos
ubicaciones no vecinas (ya sean puntos o regiones) son mutuamente independientes
condicionalmente a las variables aleatorias restantes. En consecuencia, al seleccionar ad
hoc un subconjunto de ubicaciones que no son vecinas, la probabilidad puede derivarse
en términos del producto de las funciones de densidad de probabilidad condicional.
Para ilustrar mejor la técnica de codificación, observemos la Figura 3.1.
(un) (b)
Figura 3.1. Modelo de codificación para un campo de parámetros continuos (a) y para un campo de parámetros
discretos (b).
En la figura 3.1, cada ubicación está etiquetada con una cruz o con un círculo, de tal
manera que las ubicaciones etiquetadas con una cruz no se encuentran juntas. Llamemos
Q al conjunto de ubicación marcado con una cruz y supongamos que su cardinalidad es
#[ ] Q = q . De esta forma, si el campo observado es markoviano, las
variables aleatorias asociadas a la ubicación codificadas en cruz son todas mutuamente
3.2 Algunas aproximaciones para la probabilidad de campos aleatorios 77
condicionalmente independiente y, en consecuencia, la función de densidad de probabilidad

conjunta de la muestra se puede expresar como:
q
FXXX s, 1s1 ,..., sn
( xxx
, s2 _
,..., sn _ ÿ ; ) = ÿ FXX (xxs
s
ni syo ,
i j
ÿ ( ); ÿ) (3.11)
_ s2 _
s j
es j
i=1
yo
ÿ q
De esta forma, podemos obtener el logaritmo de verosimilitud condicional de la muestra como:
l(ÿ) = log[cf(X ) XXX ss ,.....

,.....s 2 sn
s1 , _ s2 _
(XX
, 1
x
norte
;ÿ)] =
ÿ ÿ
q
en ÿ
ÿ
( xxs Ns jyo, ( );ÿ)
ÿ
ÿ (x) cf ÿ si
XXes sj
yo j ÿ
i =1
ÿ
ÿ
yoÿ q ÿ ÿ
q
= Cÿ(X) + en f XX , j( );ÿ ÿ)
( xxs Ns j yo
si
yo
(3.12)
es sj
i=1
yoÿ q
donde ln f (xx ,s N(i);ÿ)

XX es
ss j j
ÿ representa la verosimilitud logarítmica de la
s
j
observación única x (i=1, 2, ...., q) condicional a sus vecinos.
si
yo
Obviamente, en cualquier caso específico, hay muchas alternativas posibles para codificar
las ubicaciones y, como resultado, todas las conclusiones inferenciales dependerán de la
elección realizada. Es necesario, por tanto, comprobar en qué medida los resultados son
robustos a la elección realizada al aplicar esta metodología a casos empíricos.
La filosofía básica detrás de la técnica descrita es que es preferible descartar información
(en nuestro caso, las ubicaciones marcadas con círculos) en lugar de perder las propiedades
óptimas de las estimaciones y pruebas basadas en la probabilidad. En este sentido, la
técnica se aplica en los casos en que se dispone de un gran conjunto de datos (para que la
pérdida de información no comprometa el número de grados de libertad) de encuestas
completas (por ejemplo, encuestas relacionadas con agentes económicos individuales, o
encuestas de cobertura completa). de datos regionales). La técnica también se recomienda
en los casos en que los datos provienen de encuestas por muestreo y es posible controlar
el diseño del muestreo mediante la introducción de restricciones no vecinales entre las
ubicaciones (véanse, por ejemplo, los planes de muestreo sugeridos por Arbia y Switzer,
1994; Arbia, 1995a; y Arbia y Lafratta, 1997, 2002).
3.2.2 La aproximación unilateral
Una forma alternativa de derivar la función de verosimilitud consiste en construir (a

partir del campo observado) un campo aleatorio que tenga aproximadamente la
misma estructura probabilística, pero que sea más sencillo de tratar. Para lograr este
objetivo, consideremos primero las siguientes definiciones.
Definición 44. Dado un conjunto de ubicaciones (s1, s2,…, sn), si = (s1i, s2i), entonces, para cada
ubicación si definamos el conjunto de predecesores de si, digamos P(i), como el conjunto de posiciones
sj tal que:
P(i)={s :(s1 ÿ s1i ) ÿ(s <s (3.13)
Definición 45. Dado un conjunto de ubicaciones (s1, s2, ...., sn), si = (s1i, s2i), dada la estructura vecina
N(i) y la definición de predecesores P(i) , proporcionada por Definición 44, para cada ubicación si
definamos el conjunto de predecesores-vecinos

de si, digamos PN(i) , como el conjunto de posiciones sj tal que:
PN(i)={s : P(i) ÿ N(i)} (3.14)
Consulte la Figura 3.2 para ver una ilustración.
(un) (b)
Figura 3.2. Predecesores de ubicación si ( P(i) ), vecinos de si ( N(i) ) y vecinos predecesores ( PN(i) ) de
si en el caso de campos de parámetros continuos (a) y de parámetros discretos (b).
Si suponemos que el campo aleatorio en estudio es isotrópico (ver Sección 2.3.1), entonces su estructura
de dependencia será idéntica en las cuatro direcciones originadas en las cuatro esquinas del área (NW,
NE, SE, SW). Por lo tanto, no es limitante estudiar el campo aleatorio basado en las variables aleatorias
que caen (p. ej.) en el cuadrante superior izquierdo de cada si (ver Figura 3.2).
3.2 Algunas aproximaciones para la probabilidad de campos aleatorios 79
De esta forma, podemos generar un campo aleatorio unilateral {X(s), sÿ } especificando

cada variable aleatoria componente condicionalmente a los valores de sus predecesores.
Además, si el campo es de tipo Markov, la distribución de cada X(si) se puede especificar en
términos de aquellos predecesores P(i) que también son vecinos de si. Este tipo de campo
representa la extensión natural del clásico proceso autorregresivo de series temporales
siempre que podamos especificar un arranque razonable como valor inicial. (Para estos
campos ver Bartlett y Besag, 1969; Bartlett, 1971; Besag, 1972; 1974).
La gran ventaja de utilizar una aproximación unilateral radica en el hecho de que la

función de verosimilitud ahora se puede escribir utilizando un desglose similar al considerado
para las series temporales, es decir:
yo
(ÿ) en= [cf( ) X XXX, s1
_ s2 _
,...., sn
( xxx
, 1,..., ss 2 norte
;ÿ)] =
ÿ
norte
( xx ss ij ÿ PN yo
ÿ ( );ÿ) ÿ=
ln (x)
ÿ cf ÿ XXs es j
;s j
ÿ i =1 ÿ
norte
C (X) en f XX es ( xx ss ij ;s j ÿ PN yo
( );ÿ) (3.15)
s
ÿ= +
i 1 j
donde ( fxx ;s j ÿ xPN (s i);ÿ) ahora asume el significado del logaritmo

XX es si
yo
sj
j
probabilidad para una sola observación
condicional
s a sj que son predecesores i
vecina de si.
Si bien esta técnica brinda una excelente solución al problema de calcular una verosimilitud
en el caso de campos aleatorios de parámetros continuos, no parece aconsejable en el caso
de campos aleatorios de parámetros discretos, dada la necesaria arbitrariedad en la definición
de predecesores en casos donde la partición es particularmente compleja y los polígonos
son de forma y tamaño irregular.
3.2.3 La pseudo-verosimilitud a la Besag
Las aproximaciones discutidas anteriormente están sujetas a algunas limitaciones. Para los
datos derivados de encuestas completas o encuestas basadas en un diseño estadístico
riguroso y extraídas de un campo de Markov, la técnica de codificación parece ser la más
adecuada. Por el contrario, en el caso de campos isotrópicos de Markov especificados con
un parámetro continuo, se puede utilizar una aproximación unilateral.
Si no se da ninguna de estas condiciones, la única solución parece basarse en la
denominada pseudoverosimilitud (PL) de Besag . Como es bien sabido, una
pseudoverosimilitud es una función que, aunque no sea una verosimilitud propiamente
definida, satisface todas o algunas de las propiedades de una función de verosimilitud (Pace y Salvan, 1997). Besag (1974)
sugirió el uso en un contexto espacial de una función de pseudoverosimilitud simplemente

definida como el producto de las diversas densidades condicionales o:
=
Pl (ÿ)
= cf ln[ (x) XXX, s sn,...,
s1
_ s2 _
(xxx
, ,..., ss 2
1 norte
;ÿ]
norte
ÿ
ln (x)
ÿ cf ÿ XX ij es s
( xx ss ÿ ; sj ÿ i s ;ÿ)=ÿ
ÿ i =1 j
ÿ
norte
= C (X) + en f XX ij es ( xx ss ;s j ÿ si ;ÿ) (3.16)

ÿ=
i 1 s
j
Geman y Graffigne (1987) probaron que la técnica conduce a estimadores consistentes de los
parámetros desconocidos. Sin embargo, el elemento que parece estar más a favor de la
pseudoverosimilitud de Besag es la circunstancia muy práctica de que proporciona buenos
resultados en casos reales (Ripley, 1990).
3.2.4 Aspectos computacionales
Cuando se propusieron los métodos anteriores durante la década de 1970, todavía existían
enormes límites computacionales al usar el método de máxima verosimilitud para la estimación
de parámetros y la construcción de procedimientos de prueba de hipótesis. Estos problemas
ahora parecen estar obsoletos, ya que es posible resolver el problema bastante rápido usando
aproximaciones numéricas (ver Ripley, 1990).
Sin embargo, en el caso de que el número de ubicaciones que constituyen el campo sea
muy alto, aún es necesario considerar los posibles problemas de cálculo al derivar la función de
verosimilitud. A modo de ejemplo, consideremos el caso de un campo autonormal (CAR) (ver
Definición 28), que es un campo MVN(µ, V) con vector medio µ ÿ (µ1, µ2,…,µn) y matriz de
varianza-covarianza V, tal que ) ÿ VIB ÿ
1
=ÿ
( . Hasta hace unos años, el cálculo del determinante |I – B| se consideró
prohibitivo incluso con un pequeño número de ubicaciones. De hecho, en muchas aplicaciones
prácticas, la matriz B está dispersa y cuasi-singular (véase, por ejemplo, Arbia, 1986). Si
ÿ
definimos i como los valores propios de la matriz W, Ord (1975) sugirió usar el desglose:
norte
IBI ÿ=ÿ
ÿ W 1= ÿ( ) ÿ
ÿÿ i (3.17)
i=
1
Para otras aproximaciones ver Mead (1967) y Whittle (1954) y, más recientemente, Smirnov y
Anselin (2001), Griffith (2000, 2004), Pace y LeSage (2004), Pace y Zou (2000), Pace (1997) ,
Pace y Barry (1997b, 1997c).
3.3 Propiedades de estimación de máxima verosimilitud en muestras espaciales 81
3.3 Propiedades de estimación de máxima verosimilitud en muestras

espaciales
Como es sabido, los estimadores de máxima verosimilitud satisfacen un conjunto de

propiedades óptimas bajo las hipótesis de regularidad del modelo probabilístico e
independencia del modelo muestral (Azzalini, 1996). En el caso de las observaciones
dependientes, Bates y White (1985) y Heijmans y Magnus (1986) demostraron que las
estimaciones de máxima verosimilitud mantienen sus propiedades de consistencia,
eficiencia total, insesgamiento asintótico y normalidad, incluso si se basan en observaciones
extraídas de datos aleatorios. procesos con componentes no independientes si, además,
se cumplen las siguientes condiciones: (i ) existe L( )
ÿ
(ii) existen las siguientes derivadas ÿÿÿÿ
ÿ LXÿ( , ) ÿ 2 L( ,ÿ X ) ÿ 3 L( ,ÿ x )
L '( ÿ) = ; L' '() ÿ= ÿ y L' ' '() = ÿ
ÿ ÿ ÿ2 ÿ ÿ3
ÿ L( ÿ , x )
(iii) L'() = ÿ <ÿ
ÿÿ
(iv) V existe y no es singular; con V = {ÿ(si, sj)} la matriz de varianza-covarianza del

campo aleatorio que genera los datos.
De la eficiencia asintótica de los estimadores de Máxima Verosimilitud se deduce que su
varianza asintótica alcanza el límite inferior de Cramer y Rao:
-1
Var(ÿ) = iÿ(ÿ) 1 = [limnÿÿ( en(ÿ))]-1 (3.18)
norte
siendo in(ÿ) la matriz de información esperada de Fisher basada en n observaciones.

Sin embargo, como afirma Anselin (1988), esta expresión sólo puede obtenerse de forma
analítica explícita en campos espaciales muy particulares.
3.4 Pruebas basadas en la probabilidad
Los procedimientos de prueba estadísticos más utilizados en econometría se derivan de la

noción de probabilidad y se incorporan en tres criterios fundamentales que conducen a tres
pruebas asintóticamente equivalentes uniformemente más poderosas. Estos son la razón
de verosimilitud, el multiplicador de Lagrange (o prueba de puntuación) y el criterio de Wald
(Greene, 2003). Resumamos ahora las principales definiciones relacionadas con estas
pruebas.
Definición 46. Sea la función de verosimilitud L(ÿ; X ), ˆÿ0 el vector de los parámetros bajo la
hipótesis nula H0 y ÿ el estimador de máxima verosimilitud de
ÿ . El radio:
LX
( ÿ0
ÿ(X) = (3.19)
; ÿ) ; ) ˆ(
LX
se denomina razón de verosimilitud. Dado que una transformación monótona no altera las
conclusiones de la prueba, es equivalente considerar la transformación:
LRT = ÿ2log ÿ (X) (3.20)
que representa la prueba de razón de verosimilitud. Se puede probar que, bajo las hipótesis de
regularidad requeridas para la optimalidad de los estimadores de máxima verosimilitud, la prueba
de razón de verosimilitud se distribuye asintóticamente bajo H0 como ÿ2
(m) con m grados de libertad, donde m es el número de restricciones bajo la hipótesis nula.
Definición 47. Bajo los supuestos habituales de regularidad, mediante laˆ expansión de la prueba
de razón de verosimilitud según la serie de Taylor alrededor de ÿ y deteniéndonos en el
segundo término, obtenemos:
ˆ 2
( ÿ - ÿ yo
LRT = norte ) (ÿ )+ o
0 0 pag
(1) (3.21)
siendo i(ÿ) la información esperada de Fisher y (1) un término asintóticamente

o
pag
de
orden 1. El término
ˆ 2
)()
( ÿ - ÿ0 yo ÿ0
WT = norte (3.22)
es una prueba alternativa llamada prueba de Wald. De la Ecuación (3.21) puede verse que WT es
asintóticamente equivalente a LRT y, como consecuencia, también se distribuye asintóticamente
como ÿ2 (m).
Definición 48. Se puede obtener un tercer procedimiento de prueba alternativo expandiendo la

función de puntaje de acuerdo con la serie de Taylor. Esto lleva a:
(ˆ ) q (ÿ)
0
(3.23)
ÿ ÿ- = 0
norte + op (1)
yo 0
norte
( )ÿ
que, sustituida en la Ecuación (3.21) da:

3.4 Pruebas basadas en la probabilidad 83
2
( q ÿ0 )
PESO = + o (1) (3.24)
norte yo
( )ÿ
pag
El término
2
( q ÿ0 )
LMT = yo (3.25)
n ÿ( )
0
es asintóticamente equivalente al LRT y al WT. Rao (1948) la denominó “prueba de

puntuación” y Aitchinson y Silvey (1958, 1960) y Silvey (1959) “prueba del multiplicador de
Lagrange” . Debido a la equivalencia asintótica con las otras dos pruebas, la LMT también
tiene una distribución asintótica de ÿ2 (m).
Hay muchas razones para considerar los tres procedimientos a pesar de que conducen a
resultados inferenciales asintóticamente equivalentes. En primer lugar, es cierto que en
muestras grandes si aplicamos cualquiera de ellas al mismo sistema de hipótesis se
obtendrán exactamente los mismos resultados en cuanto a la decisión estadística. Sin
embargo, no debe olvidarse que las tres pruebas pueden conducir a resultados bastante
diferentes cuando se trata de muestras pequeñas. En segundo lugar, ninguna de las tres
pruebas domina en absoluto a las demás en cuanto a su potencia cuando se trata de muestras pequeñas.
Por lo tanto, diferentes situaciones pueden requerir diferentes elecciones. En tercer lugar,
hay algunas ventajas/desventajas relativas al elegir una prueba sobre la otra en circunstancias
particulares. Por ejemplo, la prueba de Wald no es invariable a las transformaciones y esto
puede verse como un inconveniente en algunos procedimientos inferenciales. De manera
similar, la prueba de puntuación tiene la ventaja de no requerir la evaluación de los
estimadores puntuales antes de su cálculo. Esta ventaja es solo aparente porque en la
mayoría de los procesos inferenciales, la fase de estimación puntual a menudo precede a la
de la prueba de hipótesis.
La distribución asintótica de las tres pruebas presentadas anteriormente se basa en las
propiedades óptimas del estimador de máxima verosimilitud y, en particular, en aquellas
propiedades derivadas de la normalidad asintótica de los estimadores.
Por lo tanto, si las condiciones para la optimalidad de los estimadores de máxima
verosimilitud son válidas y, además, se verifican las condiciones para aplicar los teoremas
de los límites al caso de campos aleatorios (ver Sección 2.5), las pruebas también mantienen
su validez en el caso de observaciones espaciales.
Los tres criterios presentados aquí se utilizarán en el próximo capítulo para probar
hipótesis sobre el modelo lineal con datos espaciales. La mayoría de los procedimientos
empleados en las pruebas de hipótesis de campos aleatorios se basan en la razón de
verosimilitud y los criterios de Wald. A nivel teórico se han propuesto pruebas basadas en el
multiplicador de Lagrange (Anselin, 1988), pero, hasta la fecha, nunca se han utilizado en la práctica.
casos.
3.5 Pruebas basadas en sumas residuales de cuadrados
Una forma muy popular de derivar estadísticas de prueba en el análisis de regresión se

basa en la comparación entre las sumas residuales de cuadrados obtenidas en dos
situaciones contrastantes; es decir, el caso en el que la hipótesis nula es cierta y aquél en
el que es válida una hipótesis alternativa debidamente especificada.
Si ÿˆdenota el conjunto de estimaciones bajo la hipótesis nula y ÿ el conjunto
ˆ de
0 1
estimaciones bajo la hipótesis alternativa, entonces se puede calcular un estadístico F para

probar H1 contra H0 mediante
ˆ
norte - r [RSS ˆ(ÿ 1) ÿ
RSS ( ÿ 0 ) ] (3.26)
r RSS ) ÿˆ(0
con n el número de observaciones, r el número de restricciones bajo la nula hy ) ˆ( RSS

ˆ( RSS ÿ0 laÿ1suma
la suma
de los
de cuadrados
los cuadrados
de los
de residuos
los residuos
bajobajo
la nula.
la hipótesis
e In En alternativa,
los casos en) que
cantidad
las variables
expresada aleatorias
en la Ecuación
involucradas
(3.26) en
se la
distribuye
regresión
como
son una
conjuntamente
F de Fishernormales,
con r la
y nr grados de libertad.
4 El modelo de regresión lineal con

Datos espaciales
4.1 Introducción
El modelo de regresión lineal representa el punto de referencia para otros modelos

estadísticos más sofisticados de relaciones econométricas. En este capítulo comenzaremos
presentando los conceptos básicos de la regresión lineal y luego introduciremos la
especificidad que surge al estimarla sobre la base de datos distribuidos espacialmente.
Discutiremos en detalle solo el modelo de regresión lineal estándar y sus violaciones más
comunes en el contexto espacial. No obstante, confiamos en que el marco que se
presenta aquí es lo suficientemente general como para extenderlo fácilmente a modelos
más complejos simplemente adaptando las nociones introducidas en el Capítulo 2 cuando
se analizan los modelos de campos aleatorios.
Sea Y(si) la variable dependiente del modelo en la ubicación si, X(si) un vector de
variables explicativas de dimensión k (incluyendo el término constante) y Z(si) = una
T T
[Y(si), X(si) ] colección de variables aleatorias pertenecientes al vector aleatorio
campo {Z(s) sÿ } definido en el espacio de probabilidad (ÿ, B, P(.)) que genera un conjunto
de datos observados en n ubicaciones de coordenadas (s1, s2,...,sn) en un continuo o un
espacio discreto. Supongamos que queremos construir un modelo que explique el
comportamiento de la variable económica Y(si) en la ubicación si en términos del
comportamiento de las otras variables aleatorias X(si) que constituyen el campo aleatorio.
Habiendo aclarado el significado de los diferentes índices espaciales si en los capítulos
T T
anteriores, en adelante simplificaremos la notación indicando el campo aleatorio Z(si)] = [Y(si), X(si) como
T T T T T .
Zi = (Yi, Xi T) y las observaciones muestrales z(si) = [y(si), x(si) ] ]
como zi = [yi, xi
4.2 Especificación de un modelo de regresión lineal

En esta sección resumiremos los supuestos básicos que subyacen a un modelo de
regresión lineal. Se presentarán dos especificaciones alternativas del modelo. En la
Sección 4.2.1 presentaremos un modelo basado en la especificación completa del
T
comportamiento conjunto de las variables Zi = (Yi, Xique
en el T) modelamos la parte sistemática
a través de expectativas condicionales. Nos referiremos a esto como la especificación
condicional. En la Sección 4.2.2 consideraremos la especificación de libro de texto más
estándar basada en el modelado del componente de error estocástico. Ambas
especificaciones se usarán luego cuando se discutan las violaciones de las hipótesis al
usar muestras espaciales.
86 4 El modelo de regresión lineal con datos espaciales
4.2.1 La especificación condicional
Ahora resumiremos los supuestos básicos en los que se basa un modelo de regresión
lineal. Agruparemos las hipótesis en tres bloques: (i) hipótesis sobre el modelo de
probabilidad (PM), (ii) hipótesis sobre el mecanismo generador de estadísticas (GM) e
(iii) hipótesis sobre el modelo de muestreo de datos (SM).
4.2.1.1 Hipótesis sobre el Modelo de Probabilidad (PM)
El supuesto fundamental en el que se basa el modelo de regresión lineal estándar es

que la distribución conjunta de las variables aleatorias involucradas (tanto Yi como las
variables explicativas Xi ) es Gaussiana multivariante, es decir:
= ÿ ÿ ÿ ÿ ÿk 1+
} yZ ÿMVN
PM { ÿ = ÿ ; i ( , );i fZ Zi z ÿi i
donde ÿ representa una familia paramétrica de funciones de densidad, ÿ la

parametrización asociada y ÿ el espacio paramétrico.
Todas las demás hipótesis relativas al modelo de probabilidad son consecuencias de esta
suposición básica. De hecho, la normalidad de las distribuciones condicionales se sigue
directamente de la normalidad conjunta. Por lo tanto
PM1 (fYy = =
X xi ÿ ) ÿ norte
yo
_
X
yo
i i yo , i
Y, de PM1, la linealidad del valor esperado (función de regresión),
PM2 E(Yi = yi| Xi = xi) = ÿTxi
siendo ÿ un vector de columna k-por-1 de parámetros y xi un vector de columna k-por-1

de observaciones de las variables aleatorias Xi. De PM1 también se sigue la constancia
de la varianza condicional (también llamada función de cedasticidad) independientemente
del valor de xi (homocedasticidad):
PM3 Var(Yi | Xi = xi) = ÿ2 ÿxi
y, finalmente, la hipótesis de la invariancia espacial de los parámetros
PM4 ÿi ÿ (ÿ,ÿ²)= ÿ ÿi
PM1 a PM4 resumen todos los aspectos del Modelo de Probabilidad que son necesarios para
construir los procedimientos estadísticos inferenciales.
4.2 Especificación de un modelo de regresión lineal 87
4.2.1.2 Hipótesis sobre el Mecanismo Generador de Estadísticas (GM)
El supuesto básico detrás del mecanismo de generación de estadísticas es que está constituido
por un componente sistemático (predecible) y un componente no sistemático (no predecible). En
el modelo básico de regresión lineal, los dos componentes se combinan linealmente. Como es
obvio, esta linealidad no tiene nada que ver con la linealidad de la media condicional asumida
bajo PM2 como consecuencia de la multinormalidad postulada. En particular, el componente
sistemático (digamos µi) está representado por la expectativa condicional de yi dado xi , mientras
que el componente no sistemático es simplemente la parte no explicada del modelo, medida por
la diferencia entre el valor observado y el componente sistemático. Tenemos por lo tanto:
GM1 µ i = E(Yi| Xi = xi)

ui = Yi – µi
Yi = µi + ui = E(Yi| Xi = xi) + ui
De la linealidad de la media, asumida en PM2, tenemos:
Yi = ÿTxi + ui _
De la normalidad postulada en el PM, también tenemos que los únicos parámetros de interés del
modelo están representados por el vector ÿ y la varianza condicional de y dada X (digamos ÿ2 ).
GM2 ÿ ÿ (ÿ; ÿ2 ) ; ÿ ÿ ÿk ÿ ÿ+1
Por supuesto, la parametrización depende de las hipótesis específicas realizadas para el PM.
Cambiar el PM (como haremos al introducir algunos de los procedimientos para tratar datos
espaciales) dará como resultado, en general, una parametrización diferente.
El hecho de concentrarse en modelar la distribución condicional de Yi dada
Xi = xi (y, específicamente, el valor esperado de esta distribución) en lugar de
modelar directamente su distribución conjunta, implica que en la identidad:
fZ z( ,ÿi )=i ( fy i
X iX=ÿ ,i () Fi XX=ÿ
X yo yo i
, i )
i yo X
_ yo
decidimos deliberadamente ignorar toda la información relevante contenida en la densidad

marginal , ) ( fx Xi = x iÿ i . Operacionalmente, esto significa que toda la información
i
contenida enfx(
i
, )i inferencialmente irrelevante con respecto al problema de
X =i x ÿ i es
estimando el vector de parámetros de interés ÿ. Esta hipótesis simplificadora conduce a la
siguiente suposición:
GM3 Xi es débilmente exógeno con respecto a ÿ ÿ (ÿ; ÿ2 )
Véase Engle et al. (1983) para detalles sobre exogeneidad.

Además, no se imponen restricciones a priori sobre el rango (si es determinista) o sobre la
distribución (si es estocástica) de los parámetros ÿ.
GM4 No tenemos información a priori sobre ÿ ÿ (ÿ; ÿ2 ).
Finalmente, por razones relacionadas con los procedimientos de estimación y, en particular, para
evitar la singularidad de la matriz de varianzas-covarianzas, asumimos que la matriz de datos
observada es de rango completo, cualquiera que sea la muestra observada, es decir:
Rango GM5 (X) = k
T
con X = (x1, x2,...,xn) , xi un vector k-by-1 de observaciones y X un n-by-k datos
matriz tal que n > k.
Las hipótesis GM1 a GM5 representan lo que llamamos el Mecanismo Generador de
Estadísticas.
4.2.1.3 Hipótesis sobre el Modelo de Muestreo (SM)
La suposición básica detrás del modelo de muestreo es que los datos se extraen con un
criterio aleatorio simple de la distribución condicional de Y dada X. En otras palabras:
T
SM1 y ÿ (y1, y2,...,yn) es una muestra independiente extraída de la densidad
( fy i
X x ÿ=
i i , i ) , i = 1,.....,n
Yi X i
El conjunto de hipótesis presentado anteriormente define todos los elementos requeridos

para implementar procedimientos de inferencia estadística. La distinción entre supuestos
relacionados con la esfera de probabilidad, el proceso de generación de datos y el esquema
de muestreo es puramente por claridad de presentación y para facilitar la discusión de las
violaciones de los supuestos básicos. Sin embargo, el lector puede estar más familiarizado
con una especificación alternativa y equivalente de la regresión lineal que se encuentra más
comúnmente en los libros de texto de econometría estándar, en la que los tres aspectos se
tratan juntos. Antes de discutir las hipótesis básicas en el caso de muestras extraídas de un
campo espacial, revisaremos esta segunda especificación y la compararemos con la
presentada anteriormente.
4.2.2 Especificación estándar de libros de texto
Una formulación equivalente del modelo de regresión lineal más comúnmente utilizado en los
manuales de econometría (y que utilizaremos en algunas circunstancias en este libro) se
concentra en el modelado de un componente de error estocástico y deriva de él todas las
hipótesis sobre el PM y el SM .
En esta segunda formulación, se supone a priori una relación lineal entre yi y xi (y no se
deriva del modelo de probabilidad como antes) y todas las suposiciones probabilísticas se
concentran en un término de error estocástico en lugar de directamente en la relación
T.
estocástica entre yi y el xi
En particular, la suposición de linealidad implica en primer lugar
4.2 Especificación de un modelo de regresión lineal 89
A1 yi = ÿTxi + ui _
o, de forma más compacta:
A1 y = Xÿ + tu
con u un vector de columna de n por 1 de los términos de error y X una matriz de datos de n por
k (n > k). El supuesto A1 es paralelo al supuesto GM1 en la especificación anterior.
Además, suponemos que el componente de error, condicionalmente a los valores observados
de X, se distribuye en una forma gaussiana con valor esperado cero y varianza constante
A2 (u X) uf ÿ N(0, ÿ2 In)
Al ser una matriz identidad n-por-n .

Nótese que A2 implica los supuestos PM1 a PM4 y SM1 de la formulación alternativa anterior.
Finalmente, en paralelo al supuesto GM4 de la formulación anterior, suponemos ÿ ÿ ÿk que

+1
restricciones a priori sobre los parámetros ÿ ÿ no se imponen
A3 no tenemos información previa sobre ÿ ÿ (ÿ, ÿ2 )
Y, paralelamente a GM5, postulamos que la matriz de datos observada es de rango completo

cualquiera que sea la muestra observada,
Rango A4 (X) = k
T
con X = (X1, X2, ....., Xn) una matriz n por k que contiene la información de la muestra (n
> k).
De acuerdo con nuestro objetivo propuesto de describir las metodologías básicas para probar
las relaciones espaciales, no vamos a discutir aquí todo el conjunto de supuestos en los que se
basa el modelo de regresión lineal en las dos formulaciones alternativas.
Por el contrario, nos vamos a limitar a considerar sólo aquellas violaciones que asumen un
significado preciso y de fácil interpretación en los casos en que los datos empíricos provienen de
observaciones espaciales.
En particular, no vamos a discutir los supuestos relacionados con el modelo estadístico de
generación de datos (GM). Las siguientes secciones de este Capítulo se concentrarán en los
supuestos relacionados solo con el Modelo de probabilidad (PM) y el Modelo de muestreo (SM).
Más específicamente, la Sección 4.3 discutirá la hipótesis más crucial (violada sistemáticamente
con los datos espaciales) de la independencia de las observaciones espaciales. La Sección 4.4
discutirá las violaciones de las hipótesis detrás del modelo de probabilidad y, en particular,
aquellas relacionadas con la homocedasticidad espacial y la invariancia espacial de los
parámetros que se encuentran con mayor frecuencia en instancias empíricas en el análisis
económico.
4.3 Violación de las hipótesis del modelo de muestreo
4.3.1 Introducción
El supuesto SM1 de muestreo aleatorio simple es sin duda el más importante entre aquellos
en los que se basa el modelo de regresión lineal. En la práctica, ninguno de los resultados
relacionados con la estimación y la prueba de hipótesis siguen siendo válidos si se rechazan
sobre la base de datos empíricos. Más precisamente, las implicaciones de la violación de la
hipótesis del muestreo aleatorio simple en SM son que las estimaciones de MCO de ÿ y ÿ2
son ineficientes e inconsistentes incluso si aún no están sesgadas.
Además, las varianzas de muestreo están sesgadas y, en la mayoría de los casos,
significativamente subestimadas. Como consecuencia, el coeficiente de determinación (R2 )
así como los estadísticos de prueba t y F tienden a estar inflados, lo que lleva a aceptar el
modelo con más frecuencia de la que debería (Maddala, 2001). Como se indicó en la Sección
1.1, muchos libros de texto de econometría son conscientes del problema de la falta de
independencia que surge al tratar con datos recopilados espacialmente. Kmenta (1997)
advierte que: “En muchas circunstancias, la suposición más cuestionable […] es que las
unidades transversales son mutuamente independientes […] cuando las unidades transversales
son regiones geográficas […] no esperaríamos esta suposición estar bien satisfecho”. De
manera similar, Maddala (2001) señala que: “En datos de sección transversal [correlación]
puede surgir entre unidades contiguas […] De manera similar, si nuestros datos son sobre
estados, los términos de error para estados contiguos tienden a estar correlacionados”.
Woolridge (2002a), también es consciente del problema cuando dice que “… los datos de
corte transversal que no son el resultado de un muestreo independiente pueden ser difíciles
de manejar. La correlación espacial, o, más generalmente, la dependencia espacial,
generalmente ocurre cuando […] los datos se recopilan a nivel de condado, estado, provincia
o país. Es probable que los resultados de las unidades adyacentes estén correlacionados”. A
este respecto, conviene recordar también las citas de Baltagi (2001), Gujarati (2003), Johnston (1991) y Kennedy (2003) citadas en
En el nivel al que se ha mantenido este libro, nos limitaremos al paradigma gaussiano.
Así, el estudio de cómo se viola la situación ideal de independencia en el espacio se reduce
al estudio más simple de la correlación entre unidades espaciales o correlación espacial.
Históricamente, el estudio de la correlación espacial (o autocorrelación espacial, como la
llamamos en el Capítulo 2) fue el primer tema abordado por la estadística espacial (ver
Whittle, 1954; Besag; 1974; Cliff y Ord, 1981). Condujo a la especificación de una primera
prueba de independencia espacial que sigue siendo muy popular en la literatura econométrica
espacial. Esta es la llamada prueba de autocorrelación espacial I de Moran, que lleva el
nombre del estadístico que la introdujo en la década de 1950 (Moran, 1950).
La I de Moran tiene varias desventajas. En primer lugar, no es un coeficiente de correlación
en el sentido de que no oscila entre –1 y 1. En segundo lugar, no es una prueba estadística
propiamente dicha porque, aunque se basa en la hipótesis nula implícita de independencia
espacial, no considera un hipótesis alternativa explícita. Otras críticas al I de Moran se pueden
encontrar en Arbia (1989). Por otro lado, el I de Moran representa la estadística de prueba
más simple y más utilizada en la literatura econométrica espacial. Además, el hecho de que
no requiera la especificación de una alternativa
4.3 Violación de las hipótesis del modelo de muestreo 91
La hipótesis alternativa puede resultar una ventaja cuando se abordan inicialmente los problemas de
forma exploratoria, antes de especificar un modelo de campo aleatorio definido como alternativa a los
supuestos básicos. Finalmente, Burridge (1980) demostró que la prueba I de Moran es asintóticamente
equivalente a una prueba del multiplicador de Lagrange si la alternativa a la hipótesis nula de
independencia espacial se expresa mediante un modelo de campo aleatorio SAR o SMA.
Por estas razones, dedicaremos la próxima sección a una discusión de esta prueba.
4.3.2 Un procedimiento de prueba de propósito general para la

independencia espacial
Mientras estudiaban la autocorrelación espacial, Moran (1950) y Cliff y Ord (1972) propusieron una
prueba que se puede aplicar al estudio del patrón de dependencia de los residuos de un modelo de
regresión lineal al menos en un análisis exploratorio. La prueba asume la forma:
norte norte
ÿÿ ˆˆ
ij ij
pequeñito
i = =1 j 1
Yo= h norte (4.1)

2
ÿ ˆ
mii
i =1
î ˆT
con n el número de observaciones espaciales, ey ÿ x los residuos dei la regresión
i OLS, wij ÿW y W una =ÿ
matriz de contigüidad n-by-n correctamente definida , xi a k-by

ˆ
1 vector de datos, ÿ las estimaciones OLS del vector de parámetros (k-by-1) ÿ , y h a
norte
factor de normalización tal que h = norte norte

.
wij
ÿÿ=
i 1=j 1
En notación matricial, la Ecuación (4.1) se convierte en
(eee ˆ1 ( T ˆ)
) ˆnosotros
T
ÿ
=
Yo h
(4.2)
con eˆ = y – X ÿ
ˆ y X una matriz de datos n por k .
De manera equivalente, al referirse a la matriz de conectividad estandarizada W* (consulte la Sección
2.2.1.2), la estadística de prueba se simplifica como:
T
ÿ
1 T *
yo= (4.3)
(ˆ)) eee
ˆˆ(We
En primer lugar, observemos que la prueba de series temporales análogas más célebre para la
autocorrelación temporal, la prueba de Durbin-Watson, puede expresarse de manera similar. Es suficiente
mostrar este punto para definir una matriz de conectividad apropiada que dé cuenta del patrón de
dependencia temporal.
* T
En particular, si sustituimos la matriz tal que: =
W LL en la Ecuación (4.3) con L
ÿ0 ÿ
1000 . . 0ÿ
ÿ ÿ
ÿ
01ÿ ÿ
100 . . 0 ÿ
00ÿ 1 ÿ
10 . . 0 ÿ
. . .
L=
ÿ ÿ
(4.4)
.
ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿ
. ÿ
ÿ0 0 0 0 0
ÿ
. 1 ÿ
1ÿ
ÿ
y si, además, reemplazamos el índice espacial i (i = 1, 2, …….n) con un índice de tiempo t (t = 1,

2,…, T), y, finalmente, establecemos h = 1, Ecuación (4.2) se convierte en:
T
ˆ ˆ
( ÿ ee tt
ÿ
1
)2
= t=2
yo
T
(4.5)
ˆ2
ÿ mi
t
t =2
que es la expresión familiar de la prueba de Durbin-Watson (Maddala, 2001).

Cliff y Ord (1972, 1981) estudiaron la distribución asintótica del estadístico I calculado
sobre los residuos de la regresión OLS. Si los residuos se distribuyen normalmente (como
se postula explícitamente en la Sección 4.2.2), el estadístico de prueba también es
asintóticamente normal con valor esperado
k ÿ
1
IE( ) = MW*
( ) 1 tr (4.6)
nk ÿÿ
y varianza
( MW
)( MW
* MW ) [( tr
* T MW tr + tr +* )2 1 ( nknk *
)]
2
() =
Var yo IE( ) 2 (4.7)
ÿ
( ÿÿÿ+ 1)
con el símbolo tr(.) denotando la traza de una matriz, M la matriz de proyección idempotente
T 1 T
derivada de la matriz de datos X de tal manera que ) ÿ MIX(XXX =ÿ
,
y k el número de variables independientes del modelo incluyendo la constante
término.
Cuando no se puede suponer normalidad para los residuos, Cliff y Ord (1972) han
probado la normalidad de la prueba utilizando un argumento permutacional no paramétrico.
4.3.3 La reespecificación de la regresión lineal como un

campo CAR multivariante
4.3.3.1 Introducción
En esta sección nos referiremos a un modelo de regresión lineal especificado en forma

condicional como se describe en la Sección 4.2.1. Si mantenemos los supuestos básicos
sobre el modelo de probabilidad (es decir, que el vector de variables aleatorias Z es
gaussiano multivariado), podemos considerar el caso particular donde se viola el supuesto
SM1 de independencia de las observaciones de la muestra.
En estas circunstancias, necesitamos volver a especificar nuestro modelo como un vector gaussiano
campo aleatorio (ver Sección 2.2.2) para el cual tenemos:
ÿX 1ÿ ÿ µ 1 ÿ ÿ CV1 ÿ 12
. . C
1 norte
ÿ
ÿ ÿ ÿ ÿ
ÿ
X µ2 . V .
ÿ
2 ÿ ÿ ÿ ÿ
2 ÿ
ÿ ÿ
ÿ
MVN ÿ ÿ ÿ
. . . ÿ
(4.8)
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ ÿ ÿ ÿ ÿ
. . . ÿ
ÿ ÿ ÿ ÿ
ÿµ ÿ ÿC . . . V
ÿ ÿ
ÿ Xn ÿ norte norte 1 norte

ÿ
donde cada µi representa un vector k-by-1 de valores esperados en el sitio i, y Vi y Cij

las matrices de covarianza cruzada y, respectivamente, de autocovarianza espacial y de
covarianza cruzada espacial entre pares de sitios definidos por:
ÿÿ . ) ÿ
( yo
11 ( yo
) ÿ 12 ( ) . yo ÿ 1k
ÿ ÿ
ÿ
. . . ÿ
V = ÿ
. . . ÿ
(4.9)
i ÿ ÿ
ÿ
. . ÿ
ÿ ÿ
ÿÿ ( yo
) . . . ÿ ( yo
) ÿ
k1 k
ÿÿ
ÿ
11 ( ) ()ÿ ij ij 12 ÿ 1k yo( )ÿ ÿ
ÿ ÿ
C
= ÿ ÿ
(4.10)
ij ÿ ÿ
ÿ ÿ
() ()ÿÿ
ÿ
ÿÿ k1
ÿ k yo
ÿ kl (ii) siendo la covarianza entre las variables aleatorias Xk y Xl en la ubicación i

y (ij) ÿlaklcovarianza cruzada entre Xk y Xl en las ubicaciones iy j. (ver Sección 2.2.2).
Sin embargo, como ya se señaló, tal definición de un campo aleatorio es demasiado

general y requiere una gran cantidad de parámetros (todos los elementos en las matrices).
Este último no puede estimarse sobre la base de una sola realización a menos que
introduzcamos algunas restricciones tanto en la heterogeneidad como en la estructura
de dependencia del campo.
En la práctica, para obtener un modelo de muestreo operativo, es útil limitarnos
a uno de los campos aleatorios presentados en la Sección 2.4 cuyas propiedades
se conocen. Dada la naturaleza continua de muchas variables económicas, y debido
a su simplicidad, la literatura econométrica espacial se ha concentrado casi
exclusivamente en campos aleatorios que obedecen al campo autorregresivo simultáneo.
El marco presentado aquí, sin embargo, es lo suficientemente general como para
permitir la aplicación a cualquier otro campo aleatorio en aquellos casos en los que el
fenómeno bajo estudio requiere una especificación diferente. En la presente sección
redefiniremos la hipótesis básica del modelo de regresión lineal en el caso de un
modelo de muestreo no independiente haciendo referencia explícita al campo aleatorio
autonormal. En la siguiente sección explotaremos un marco basado en el campo
autorregresivo simultáneo.
4.3.3.2 Reespecificación de las hipótesis PM, GM y SM
modelo de probabilidad
Una primera forma de redefinir el modelo de regresión lineal para tener en cuenta la naturaleza
espacial de los datos es redefinir el modelo de probabilidad de tal manera que se suponga que
el vector de variables aleatorias involucradas obedece a un campo autonormal, es decir:
2(k1)
{ ( fZi Z=z ÿ i ÿ, ÿi ÿ);ÿ ÿ ÿ ; }
PM ÿ= + yZ ÿMVN
i i
De este supuesto fundamental podemos derivar una serie de consecuencias en

términos del modelo de probabilidad. En primer lugar, tenemos la normalidad de las
distribuciones condicionales:
PM1 ( YY
fyXyo, x ix= yo
= N i ( );
, Y yj ;j
ÿ ÿ
i ) ÿ norte
i yo
Como consecuencia de PM1, tenemos la linealidad de los valores esperados que

(recordando la definición de un campo aleatorio autonormal establecido en la Sección
2.4.2.7) ahora se puede expresar como:
norte norte
PM2 ey( Xx ;
i i
=
i
= ÿ ;j
Yj yj N i ( );ÿ) ÿ
= T
ÿ w
ij jx ÿ+
x
T
i
+ ÿ ÿ wyj ij
j =1 j =1
T
norte
ÿ
norte norte
ÿ
donde ÿ ÿ (ÿ1, ÿ2,…, ÿk)
T = wx 1 ,..., wx ij y ÿ, ÿ y ÿ son
, ÿÿÿ wÿij jx ÿ
yo j kj
ÿ
j ===
111 ÿj j ÿ
los parámetros a estimar. En particular, ÿ y ÿ son los parámetros que
regular la cantidad de dependencia espacial en las variables independientes y en la variable

dependiente rezagada respectivamente. Una segunda consecuencia de PM1 es la
constancia de la varianza condicional (homocedasticidad), es decir:
PM3 Var(Yi| Xi = xi; Yj =yj; jÿN(i), ÿ) = ÿ2 ÿxi yi
También derivamos la constancia de todos los parámetros con respecto al espacio, es decir:
PM4 ÿi (ÿT , ÿ T, ÿ, ÿ²) = ÿ ÿi
Modelo estadístico
Aquí podemos mantener la hipótesis principal de que las observaciones de la variable

aleatoria Yi son generadas por una combinación lineal de un componente sistemático y un
componente no sistemático
Yi = µi + ui (4.11)
El componente sistemático µi está constituido por la expectativa condicional de la variable

Y en la ubicación i, condicionada a la variable Y en las ubicaciones aledañas y a las
variables X registradas en la misma ubicación i y en las ubicaciones aledañas (ver Sección
2.4.2.8) :
µ i = ey( X x ;i (=);ÿ)i Yj yj=N i ; yoÿ
De la linealidad de la expectativa condicional derivada de PM2 y sustituyendo en la Ecuación

(4.11) obtenemos
norte norte
T T
GM1
Yi = ÿÿ w+x
ij j ÿ x i + wy ÿ
ÿ + tu yo j i
j =1 j =1
De la normalidad postulada en el PM también tenemos que los parámetros de interés son
GM2 ÿ ÿ (ÿT , ÿT , ÿ, ÿ²)
También mantenemos la hipótesis de exogeneidad débil de Xi con respecto a ÿ:
GM3 Xi es débilmente exógeno con respecto a ÿ
El modelo considerado aquí impone algunas restricciones sobre los parámetros relacionados
con la simetría de la matriz de varianza-covarianza. En particular, tenemos:
GM4 Los parámetros ÿ ÿ (ÿT , ÿ T, ÿ, ÿ²) están sujetos a las restricciones:

2 2 2 2 2 2
ÿÿ = ÿÿ ; ÿ ÿ =ÿ ÿ ; ÿÿ = ÿÿ ; ÿi, j, l
li wij yo
j wji yo
yo wij ljwji _ yo wij j wji
asegurando que la matriz de varianza-covarianza del campo sea simétrica. En términos

prácticos, debido a la suposición de PM3 de varianza constante, esta restricción solo requiere la
elección de una matriz W simétrica , una condición que se respeta casi invariablemente en la
generalidad de las aplicaciones geográficas.
Finalmente, para evitar la singularidad de la matriz de varianza-covarianza, necesitamos una
T
también para suponer que X ÿ (x1, x2,..., xn) matriz de rango completo (n-por-k) para todos los
valores observados de las variables aleatorias X:
Rango GM5 (X) = k
Modelo de muestreo
T
Finalmente, en el modelo de muestreo, supondremos que y ÿ (y1, y2,...,yn) es una muestra
extraído de un campo aleatorio estacionario caracterizado por la distribución condicional
( YfyyXiij, i x ix= yo
= N i ÿ ÿ( ); )decir:
, Y yj ;j es
T
SM1 y ÿ (y1, y2, …, yn) se extrae independientemente de
fyY yXiij ( Xi Xi = , Y yj= N i ( );ÿ)

yo
ÿ ;j
El modelo así especificado se denominará modelo de regresión lineal espacial CAR multivariado.
A pesar de sus sólidos fundamentos probabilísticos, no se encuentra en la literatura econométrica
espacial aplicada. También se debe señalar que parte del problema puede residir en el hecho de
que actualmente no existe una rutina disponible para la estimación y la prueba de hipótesis
basadas en este marco de modelado (consulte el Capítulo 6 a continuación).
4.3.3.3 Probabilidad de un modelo de regresión lineal espacial CAR bivariado
En esta sección nos limitaremos simplemente a campos autonormales bivariados Zi = (Yi, Xi)
T
. La extensión a campos de dimensiones superiores es más complicada en su
formalismo y se describe en la siguiente sección.
Si Y y X se distribuyen conjuntamente como un campo aleatorio bivariado, sabemos (de
Sección 2.4.2.8) que podemos expresar el valor esperado condicional de Yi como:
[ Xj ;Yj ;Xi=Y+µ i
EYi ]ÿ ÿ
ij( XjXj ) µ
ÿ
+ ÿ (X ÿ + yo
µ X) yo ÿÿ (Y
ij j Y j
ÿ
µ )
(4.12)
yo
ÿ yo
ÿ
Para simplificar una notación que corre el riesgo de volverse demasiado engorrosa, expresaremos
(sin perder la generalidad) cada variable aleatoria como una desviación de su respectivo valor
esperado. La ecuación (4.12) ahora se convierte en
E [Yi Xj ; Yj ; xi = ]ÿ ÿ x + + ÿX
yo ji ÿ ÿ ij Y
j
(4.13)
yo
ÿ yo
ÿ
con ÿ =ÿ =ÿ
yo Wij , ÿ yo wij , ÿ, ÿ y una ÿ parámetros y wij ÿW . los elementos de
matriz de contigüidad propiamente definida.
Esta expresión del valor condicional esperado proporciona una forma operativa para
el componente sistemático del modelo. Así, si definimos el componente no sistemático
como:
=ÿ
ui Yi E Yi X j ;Yj ; xi yi[ ]ÿ =ÿ
ÿ
j
X ij ÿÿ
ÿ Xi ÿ ÿ ij jY
(4.14)
yo
ÿ yo
ÿ
y redefinimos el modelo estadístico de generación de datos como la suma de los

componentes sistemáticos y no sistemáticos:
[ i ;Yj ; jX + i tu
] (4.15)
Yi = EYX i
tenemos:
ÿ
Yi = ÿw + jÿw Y ÿ+ tu i
X + X yo ÿ yo j i
(4.16)
ÿi yo
ÿ
De esta forma, cada observación de la variable aleatoria Y en la ubicación i se expresa

en función de la observación de la variable X en la misma ubicación (como en un modelo
de regresión lineal estándar), pero también de los valores retrasados espacialmente de
la variable X y de la variable Y. Es decir, se expresa en función de la media de los valores
vecinos de ambas variables.
Sabemos que un campo CAR bivariado tiene una matriz de varianza-covarianza dada por
Ecuación (2.66) (reportada aquí nuevamente por conveniencia):
1
ÿ primera guerra + ÿ( ÿÿ
mundial
* ÿ )
ÿ ÿ ÿ ÿÿ ÿ
=(,
QQ ÿ ÿ ÿ, ÿ ,
2
, ÿ
2
) =ÿ
ÿ
ÿ yo ÿ (4.17)
X
ÿW
y
ÿÿ WI + ÿ( ÿ
ÿ ÿ
ÿÿ
ÿ ) ÿ ÿÿ
2
ÿ yo ÿ 0 ÿ 2
nx 2
con ÿ = ÿ ÿ
, Il son matrices identidad l-by-l y ÿ y ÿ son los

2 X
ÿ
0 yo ÿ ÿ y
ÿ Nueva York ÿ
varianzas incondicionales de X e Y respectivamente.
Por lo tanto, es inmediato redefinir la función de verosimilitud de la muestra como una
22
ÿ ,ÿ ÿ,de , covarianza,
función de densidad gaussiana bivariada que tiene ( , Q = Qÿ matriz x
ÿ
y
) como es
unadecir:
variación
1
22 1 T 1 ÿ
ÿ
ÿ
(4.18)
ÿ
; z) = C ( z) Q
L ( ÿ, ÿ ÿ, ÿ, ÿ
2
Exp ÿ zQz
ÿ
, xy ÿ
ÿ 2 ÿ
y, en consecuencia, la log-verosimilitud se define como:

1
ÿ ,ÿ ÿ, 2
,ÿ 2
; z) C (z) Q z Q zT2 1
ÿ
yoÿ( ,
=ÿ
1 en ÿ
(4.19)
X y 2
Esta expresión es altamente no lineal en los parámetros y, por lo tanto, solo puede maximizarse
utilizando algoritmos numéricos (ver, por ejemplo, LeSage, 1998) para obtener estimadores de
máxima verosimilitud. La probabilidad así derivada también constituye la base para construir
varios procedimientos de prueba de hipótesis, como mostraremos en la siguiente sección.
4.3.3.4 Prueba de hipótesis en el modelo de regresión lineal espacial CAR bivariado
Como dijimos en la Sección 3.4, las pruebas generales más populares utilizadas en econometría
se basan en las tres estadísticas asintóticamente equivalentes derivadas del concepto de
verosimilitud, a saber, la razón de verosimilitud (LRT), la prueba de Wald (WT) y la prueba del
multiplicador de Lagrange. (LMT). Ahora que hemos especificado completamente la hipótesis
alternativa a la hipótesis nula de independencia espacial en el modelo de regresión, estamos en
condiciones de aplicar estos procedimientos generales a este caso particular.
Este es el objetivo de la presente sección.
En efecto, una vez reespecificado el modelo (como se indicó en la Sección 4.3.3.1 anterior),
el sistema de hipótesis puede obtenerse explícitamente contrastando la hipótesis nula H0 : con
= ÿ =0 ÿ ÿ0
0 : En ,términos de la probabilidad que tenemos, bajoÿel0;
ÿ ÿ
la hipótesis alternativa
0 H1 nulo:
1
2 2
ÿ
ÿ 1 T ÿ
1 ÿ
; z) = C ( z) Q
2
L ( ÿ, 0 ÿ X ,0 ,ÿ y ,0 0 exp ÿ
ÿ
ÿ z Q z0 (4.20)
ÿ 2 ÿ
2
siendo Q0 la matriz de varianzas-covarianzas que, en este caso, es Q0 = Q ÿ( 0, ÿ ,ÿ
2x ,0 y ,0
)
ÿ
1
ÿ ÿ0ÿ ÿI ÿ ÿ
=ÿ
ÿ
yo
* ÿ
ÿ
ÿ ÿ , lo que implica independencia entre las observaciones.
0 ÿ
ÿ
ÿÿ ÿ ÿI ÿÿ
En consecuencia, la log-verosimilitud se puede expresar como:
1 1 en 1
2 2 T
; z) = C ( z)
ÿ
ÿ ,ÿ Q z0 Q z
ÿ ÿ
yo ( ÿ 0, X ,0 y ,0 0 (4.21)
2 2
En contraste, bajo la hipótesis alternativa de un campo aleatorio CAR bivariado, la verosimilitud

asume la expresión
1
22
ÿ
ÿ 1 T 1 ÿ
L (ÿ, ÿ ÿ, ÿ, ; z) = C ( z) Q
ÿ
2
xy
ÿ , exp ÿ
ÿ
ÿ zQz (4.22)
ÿ 2 ÿ
2 2
con Q = Q ( , ÿla ÿ ,ÿ ÿ, X
,ÿ y ) proporcionada por la Ecuación (2.62). En consecuencia, bajo
hipótesis alternativa, la log-verosimilitud se convierte en:
22 1 1 en T 1
) = ( z)
ÿ
ÿ , ÿ ÿ, ÿ , ,ÿ ; zc QzQz2 (4.23)
ÿ ÿ
yo (
xy
2
Por lo tanto, se puede derivar fácilmente una prueba de independencia espacial a partir del
criterio de prueba de razón de verosimilitud, simplemente restando la diferencia logarítmica entre
(4.20) y (4.22). Esto lleva a:
Lÿ
( ;z)0 2ln
LRT = ÿ
(4.24)
L ( ÿz
; )1
con ÿ 0ÿ (ÿ 0 , ÿ 2
X ,0 ,ÿ ) 2, y
y ,0
ÿ1 ÿ
( ÿ, ÿ ÿ, ÿ ,
2
X ,ÿ
2
y ; z) . Sustituyendo (4.21) y
(4.23) en (4.24) obtenemos:
LRT = 2[ ÿ] ln
L ÿ0
( ; )Xlnÿ (L; ÿ1
) X=2[(
2 2 2 =
yo
ÿ 0,
ÿ
X ,0 ,ÿ y2 ,0 ; z) - yo (ÿ , ÿ ÿ, , ÿ X ,ÿ y ; z)]
= en [ Q +z Q z Q
en z Q z]
0
T
0
ÿ
1
ÿ ÿ
T ÿ
1
(4.25)
que representa la expresión formal de una prueba de razón de verosimilitud en el caso de un

campo gaussiano bivariado.
Una forma alternativa de obtener un estadístico de prueba para la hipótesis de
independencia en un modelo de regresión lineal CAR bivariado consiste en considerar
las diferentes formulaciones que asume el mecanismo de generación de datos según
se verifique o no la hipótesis del muestreo aleatorio. De hecho, cuando se respeta tal
condición, el modelo de generación de datos se puede expresar como:
Yi = ÿ x yo
+ ui (4.26)
Mientras que, en el segundo caso, si postulamos como alternativa un campo aleatorio

autonormal bivariado, éste viene dado inversamente por:
ÿ
Yi = ÿwx + x +yoÿwy
j + ÿu i ÿ yo j i (4.27)
ÿ ÿ
yo yo
En consecuencia, se puede construir una prueba simple para la hipótesis de independencia

utilizando el estadístico de prueba general presentado en la Sección 3.5:
F= norte - r [RSS 1RSS ÿ
0
]
(4.28)
r RSS0
con n el número de observaciones, r el número de restricciones bajo la hipótesis nula,

RSS1 la suma de los cuadrados de los residuos del modelo (4.27) y RSS0 la suma de
los cuadrados de los residuos del modelo (4.26). La expresión (4.28) tiene una
distribución F de Fisher central con r y nr grados de libertad.
4.3.3.5 Probabilidad de un modelo de regresión lineal espacial CAR multivariable
Consideremos ahora el caso más general de un modelo de regresión lineal multivariante y la

extensión de la derivación de la probabilidad considerada en la Ecuación (4.19).
A partir de la Ecuación (2.77), la probabilidad del modelo CAR multivariante viene dada por:
1
ÿ 1 T 1 ÿ
L ( ) ,µ ÿ z ;= C ( zÿ
ÿ
2
) Exp ÿ zµÿzµ (4.29)
ÿÿ ÿ
ÿ 2 ()()ÿ ÿ
y, por lo tanto, la log-verosimilitud por
1 1 en T 1
(µ , ÿz ; )
ÿ
yo
=ÿ
C( z
) ÿ z ÿÿ ()()
z ÿ ÿµ
µ2 (4.30)
2
La ecuación (4.30) se puede expresar de manera diferente asumiendo las siguientes

2 2
metrizaciones de reparación para µi , Cij y Vi : ÿi : µi = ÿ y Vi = V = 1 pag
, :ÿ i ÿ C = ÿ donde ,ÿ es una matriz simétrica k por k y wij ÿ W

), ÿijj yo wij
es el elemento genérico de una matriz de pesos.

Bajo estos supuestos, podemos escribir:
1 1 1
ÿ ,
ÿ ÿ ÿ
norte
(4.31)
de modo que la log-verosimilitud se convierte en:
(ÿ ÿ, , Vz ; )= C( z
) + 1 en ÿ - ÿ +1
IVWV 1
ÿ
ÿ ÿ
yo
2
norte
1
ÿ 1(x )(
V x)
T 1
norte
ÿ ÿ +ÿ
ÿ
i
ÿ
i
(4.32)
2 i=
1
+ ÿ ÿ1
norte
i=
(x iV ÿ ÿ )wTÿ
ÿ
1
(X j ÿ
ÿ ).
2 jji : ÿ yo
y puede ser utilizado en los procedimientos de estimación y prueba de hipótesis.
4.3.4 La Reespecificación de la Regresión Lineal con Residuales

SAR (el Modelo de Error Espacial)
En la Sección 4.3.2 anterior, atacamos el problema de la no independencia en el modelo de

muestreo al considerar las observaciones espaciales extraídas de un campo CAR multivariado.
Abordemos ahora el problema siguiendo una estrategia diferente.
En esta sección, partiremos de la formulación alternativa del modelo de regresión lineal

presentado en la Sección 4.2.2. Siguiendo esta formulación, el modelo se puede escribir
como:
A1 T
yi= ÿ x +yo ui
O, más compactamente, como
A1 y = Xÿ + u
Si usamos tal especificación, sabemos (de la Sección 4.2.2) que la hipótesis del muestreo
aleatorio simple se incorpora en el componente de error al suponer que se distribuye
condicionalmente como un ruido blanco espacial gaussiano:
A2 (u X) uf ÿ N(0, ÿ2In)
con En una matriz identidad n-por-n .

Una forma de expresar formalmente la violación de esta condición poco realista es
considerar, como alternativa, un campo aleatorio {u} caracterizado por una distribución
particular conocida. De esta forma, el problema pasa de la modelización directa del campo
T
aleatorio Zi = (Yi, Xi T) al problema más simple de postular una forma
plausible de dependencia para el campo aleatorio {ui}. Por supuesto, al menos en principio,
cualquiera de los modelos de campos aleatorios presentados en la Sección 2.4 podría
usarse para lograr este objetivo. Sin embargo, una de las alternativas más populares a la
hipótesis del ruido blanco espacial adoptada en la literatura econométrica es la de postular
un modelo SAR para el componente no sistemático. Esta formulación se conoce en la
literatura econométrica como el "Modelo de error espacial" o SEM (ver Anselin y Bera, 1998;
Anselin et al., 2004). Sin duda, es el modelo más comúnmente utilizado en la econometría
espacial aplicada, en parte porque el software y las rutinas específicas están fácilmente
disponibles para fines de estimación (consulte el Capítulo 6 a continuación). Sin embargo, la
terminología utilizada en la mayor parte de la literatura econométrica espacial corre el riesgo
de crear confusión en aquellos que están más familiarizados con la literatura estadística
espacial. De hecho, el acrónimo SAR adoptado aquí se usa (de acuerdo con la literatura de
estadísticas espaciales; véase, por ejemplo, Whittle, 1954; Cressie, 1991) para indicar el
modelo de campo autoregresivo simultáneo discutido en la Sección 2.4.3.1. En la literatura
econométrica espacial, por otro lado, el término suele indicar el llamado modelo AutoRegresivo
Espacial (ver Anselin y Bera, 1998; Anselin et al., 2004; LeSage, 1999). Esta última tiene
una formulación completamente distinta (y menos justificada, desde el punto de vista
probabilístico) respecto a la aquí presentada y que será examinada en el apartado 4.3.6 a
continuación.
4.3.4.2 Derivación de la probabilidad
Si decidimos modelar el componente no sistemático como un campo aleatorio SAR, necesitamos

redefinir el modelo de regresión lineal complementando la ecuación fundamental:
T
yo y = ÿ xi + ei (4.29)
con la expresión autorregresiva simultánea (ver Sección 2.4.3.1) para el error

término:
norte
yo
_
= ÿ
ÿ weu ij ji + (4.30)
j =1
yo
ÿ
donde ui es un ruido blanco espacial gaussiano, wij ÿ W y W una matriz de pesos correctamente
definida.
En notación de matriz compacta, las Ecuaciones (4.29) y (4.30), se convierten respectivamente
y = Xÿ + e (4.31)
con X una matriz n-por-k de observaciones y
mi = ÿ nosotros + tu (4.32)
Dado que u es un campo de ruido blanco gaussiano, e también es gaussiano. Bajo estos supuestos,
el problema se transforma en una situación donde es necesario hacer inferencia sobre el vector de
parámetros desconocidos ÿ ÿ (ÿ, ÿ2 , ÿ) y, con la
característica adicional de normalidad introducida por la hipótesis sobre el campo aleatorio u, la
violación de la hipótesis del muestreo aleatorio se reduce al estudio de la autocorrelación espacial
presente en la componente no sistemática.
Sabemos (de la Sección 2.4.3.1) que un proceso SAR se caracteriza por un
matriz de varianza-covarianza:
1 ÿ
T
VIB=ÿIB
(-)(-) (4.33)
2=
con B ÿ ÿ ij}, ÿij = ÿ wij y ÿ una matriz diagonal del elemento genérico ÿi
{ Var(ui ).
2
Nos referiremos a esta matriz como V (ÿ, ÿi ) para hacer referencia explícita a = ÿ2
2
los parámetros de interés inferencial. En el caso de varianzas constantes ÿi ,
la matriz V en la Ecuación (4.33) se convierte en
VV( = ÿ ÿ,
2
ÿ
2
IBIB ) = 1( ÿ ) ( ÿ )
ÿ
ÿT
(4.34)
De la Ecuación (4.31) derivamos entonces

e = y – Xÿ (4.35)
y, dado que se supone que e se distribuye como un campo aleatorio SAR gaussiano, obtenemos
fácilmente la función de verosimilitud dada por:
1
2 2
ÿ
1 2 1 mi ÿ
ÿe ,; ) = C ( e) (V
2
ÿ
L ( ÿÿ, ÿÿ, ÿ ) exp ÿ

ÿ
TE ( ÿ, ÿ ) ÿ (4.36)
ÿ V2 ÿ
Sustituyendo la expresión e = y – Xÿ en esta última ecuación obtenemos:
1
ÿ
ÿ 1 T ÿ
, ) (=, ) (cy ( y Xÿ V ( ),
2 2 21 (4.37)
L ( ÿ, ÿ 2
ÿ
, ÿ ;y XXV , )ÿexp ÿÿ ÿÿ ) ( y Xÿ ) ÿ
ÿÿ ÿ
ÿ ÿ
2
y sustituyendo la expresión explícita por la matriz V reportada en la Ecuación (4.34) podemos

escribir:
2 =
L ( ÿ, ÿ , ÿ ;y X, )
1
(4.38)
1
()
norte
ÿ
[ ) ] 1 ( y Xÿ ÿ
ÿ
= C ( y, )X 2 1 T T 1 T
ÿ ÿ
( IBIB
)( ) 2
ÿ ÿ ÿ ÿ
ÿ 2 ÿ ÿ
Exp ÿ
ÿ
( ) ( ) ( y XÿIBIB
ÿ ÿ ÿ ÿ
) ÿ
2
ÿ 2ÿ ÿ
y, finalmente, el log-verosimilitud se puede expresar como
2
yoÿ( ÿ, , ÿ;y ,X ) = (4.39)
1
]( 1
norte ÿ
2 ÿ
1 ÿT T ÿ
1 ÿT
y XC (ÿ ,2) = en(ÿ) 1 en ( 2yo ÿBI) ÿB
( ÿ2 ) ( Xÿ
) ( y) ÿ Xÿ
) [(I ÿBI ÿB y ÿ )
ÿ
2
ÿ
La ecuación (4.39) no se puede maximizar analíticamente debido al alto grado de no linealidad

en los parámetros. Sin embargo, puede maximizarse numéricamente para producir estimaciones
de los parámetros ÿ , ÿ² y . Para los aspectos computacionales,
(1999). Sin
ÿ embargo,
procedimientos
se remite
debemos
alcomputacionales
lector
señalar
a LeSage
que los
empleados en el software disponible son todos aproximados en el sentido de que se basan en
una versión de pseudoverosimilitud de la Ecuación (4.30) y, más específicamente, en una
función de verosimilitud parcial (Pace y Salvan, 1997). El logaritmo de verosimilitud derivado de
la Ecuación (4.39) también se puede utilizar para construir procedimientos de prueba de
hipótesis.
4.3.4.3 Equivalencia del Modelo Estadístico Implícito por el CAR Bivariado y

el Residual SAR
Es instructivo mostrar la relación existente entre el modelo residual SAR y

el modelo CAR bivariado introducido anteriormente. Para lograr este
objetivo, consideremos la matriz de conectividad estandarizada por filas de
el elemento genérico
* W* wij ÿ introducida en la Ecuación (2.4) y reescribamos
Modelo residual SAR como:
y i= ÿx + ei i
(4.40)
*
norte
yo
= ÿÿ + =
weu leu
yo i ÿ [ ] yo
+ i
(4.41)
_ j
j =1
yo
ÿ
con [ ]i L e el valor retrasado espacialmente de

i e (Ver Definición 5). De la Ecuación (4.41),
reordenando los elementos, tenemos:
mi - yo ÿL [e ]= uii
(4.42)
y finalmente:
tui = (1ÿ ÿ L)e i

(4.43)
Ahora multipliquemos ambos lados de la Ecuación (4.40) por (1ÿ ÿ L) . Obtenemos:
(1 ÿ
ÿ ly ) =ÿ
(1 ÿ L )ÿx (1
+ ÿ yo ÿ le ) =
i i
y Ly=ÿxÿ ÿLx + ÿ yo ÿ +ÿ (1 ÿ le ) = (4.44)

i i i i
y Ly=ÿxÿ ÿLx u+ ÿ ÿ +
i i i i i
y, al escribir la expresión explícita de un desfase espacial, esto se convierte en:
* *
norte norte
y= ( ÿ + ÿx + ÿwyj + tu )
i ÿ ÿ ÿwx yo i ÿ yo j i
(4.45)
j =1 j =1
Esta expresión es formalmente equivalente a un modelo CAR bivariado con la

reparametrización. Sin
ÿ embargo,
ÿÿ dosincluso si el modelolas
especificaciones, estadístico es equivalente
implicaciones en términos
=ÿ en de
las
inferencia estadística son bastante diferentes, como queda patente al comparar las dos
funciones de verosimilitud derivadas de las Ecuaciones (4.19) y (4.39). En particular, de
una comparación surge que la parametrización ri ÿ impone una restricción en la Ecuación
= ÿ tenemos
(4.39) que no estáÿ presente en lados
Ecuación (4.19).que
parámetros Además, en elaCAR
se refieren bivariado,
las varianzas
incondicionales de los campos aleatorios X e Y ( y ) en lugar del único parámetro que
2
aparece en el modelo SAR residual que representa la varianza del componente no
ÿ
X
2 2
ÿ
y
sistemático u. Por lo tanto, los resultados
ÿ son
obtenidos
diferentes
en en
lostérminos
dos marcos
de estimación
de modelado
puntual, propiedades de las estimaciones y procedimientos de prueba de hipótesis.
4.3.4.4 Prueba de hipótesis en el modelo de error espacial
Si adoptamos el enfoque basado en el modelado de autocorrelación residual, es posible construir

pruebas de independencia a partir de la función de verosimilitud establecida en la Ecuación (4.30).
De hecho, si consideramos que el componente no sistemático del modelo obedece a un campo
aleatorio SAR como se postula en esta sección, la prueba se puede construir considerando la
hipótesis nula ÿ=0 contra la hipótesis alternativa ÿÿ0.
Bajo la hipótesis alternativa, la verosimilitud del modelo se obtuvo en la Ecuación (4.38) y está
dada por:
2
L ( ÿ, ÿ ,ÿ
; ,y X ) =
1 (4.46)
norte
ÿ
1 1 ÿ
(ÿ 2 ) 2 ( IBIB 1 T ÿ
[ ) T 1 T
]
ÿ ÿ
= C ( y, )X 2
ÿ ÿ ÿ ÿ
)( ) Exp ÿ ( ) ( ) ( y XÿIBIB ( y Xÿ
ÿ ÿ ÿ ÿ ÿ ÿ ÿ
2 ) ÿ
ÿ 2ÿ ÿ
En consecuencia, la log-verosimilitud viene dada por:
2
yoÿ( ÿ, , ÿ;y, )X=
n 1 1
( y ÿ Xÿ I )ÿBI
[ (ÿB ) ) ( ]
ÿ
2 ÿ
1 ÿT T ÿ
1 ÿT
y XC (ÿ ,2) = en ÿ 1 en (yo
) ( ÿBI
) ÿB ÿ 2 ÿ Xÿ ) (4.47) ( y
ÿ
2
2ÿ
En cambio, bajo la hipótesis nula de independencia espacial, la verosimilitud se define como:
norte
1
, ÿ Xy ; , ) = ( , )Xcy(ÿ )2
2 2 T ÿ
ÿ
ÿ
L 0 (ÿ exp ÿ
ÿ
( Xÿ
) ( y) ÿXÿ y
ÿ ÿ
ÿ
(4.48)
2
ÿ 2ÿ
y el log-verosimilitud se define así por:
2 n 2 1 T
yo
( , ; , cy
0 ÿ )(,)ÿyX=X- en ÿ ÿ
( y) ÿ( yXÿ
ÿ Xÿ
) (4.49)
2
2 2ÿ
A partir de las ecuaciones (4.47) y (4.49), se puede obtener fácilmente una prueba de razón de
verosimilitud para la hipótesis de independencia espacial como:
LRT= ÿ l 2[ (ÿ ÿ, 2
,ÿ; y, X) ( ,ÿl,ÿ;0 y,
ÿ ÿX)]
2
(4.50)
Sustituyendo las Ecuaciones (4.47) y (4.49) en la Ecuación (4.50) tenemos:
LRT =
1
] 1( y Xÿ )
ÿ norte
2 1 T
[ T 1 T
ÿ
=ÿÿ
2ÿ en ÿ ÿ
1 en ( IBIB )) 2
ÿ
(
ÿ
ÿ
ÿ
( ) ( ) ( y XÿIBIB
ÿ
)
ÿ
ÿ
ÿ
ÿ
+
2
ÿ 2 2ÿ
n 1 T (4.51)
+ en ÿ 2+
2 (ÿÿy) Xÿ
ÿ y Xÿ ( ÿ )
2 2 ÿ ÿ
Y, después de un poco de álgebra, finalmente se obtiene:
1 1
]
ÿ
1 ÿT T 1 ÿT
LRT en
= ÿ(yo
) (ÿBI
) ÿB ÿ
ÿ ÿ
2
( ÿB) ()
( y ÿ Xÿ) I[ ÿBI ( y ÿ Xÿ )
ÿ
1 T (4.52)
+ 2 (Xÿ
) ( y ÿ Xÿ )
ÿ
La prueba anterior se distribuye asintóticamente como ÿ2 con un grado de libertad.

Con base en las mismas hipótesis consideradas anteriormente, Anselin (1988) derivó dos
pruebas adicionales de independencia espacial utilizando las expresiones generales de la prueba
de Wald y la prueba del multiplicador de Lagrange presentadas en la Sección 3.4. La prueba de
Wald asume la siguiente expresión:
2
PESO = ˆ 2 [a + b – c / norte] (4.53)
ÿ
con ˆ el estimador de máxima verosimilitud del auto W) -1] T del componente no

ÿ
parámetro regresivo del y con a = tr{ [W(I- [W(I- W) -1].ˆ ysistemático
c = tr [W(I- ˆ W) -1] }, b
ÿ ÿ ÿ
= tr [W(I- ˆ W) -1] 2 , ˆ
ÿ ÿ
La prueba del multiplicador de Lagrange, en cambio, está dada por:
LMT = (y ÿ)(Xÿˆ)W y ÿ Xÿ ˆ
T
(4.54)
2
j ÿ
con J = tr +[(W W )W] T . Al igual que el LRT, tanto el WT como el LMT son asintomáticos.
distribuida tóticamente como una ÿ2 con un grado de libertad.
4.3.4.5 Estimadores de mínimos cuadrados generalizados
Hemos visto en las páginas anteriores que, siguiendo el enfoque basado en el modelado
SAR del componente no sistemático, es posible obtener estimadores de máxima
verosimilitud utilizando la función de verosimilitud derivada de la Ecuación (4.36). En este
caso, sin embargo, también es posible utilizar los estimadores basados en los Mínimos
Cuadrados Generalizados (GLS) como alternativa.
Primero, recordemos que, en este caso, el modelo se especifica como:
yi = ÿTxi + ei _ (4.55)
ei = ÿ ÿiÿj wij ej + ui (4.56)
o, de manera equivalente, en notación matricial más compacta, como:
y = Xÿ + e (4.57)
mi = segundo mi + tu (4.58)
con u un campo de ruido blanco, B = ÿW y Wÿ{wij} una matriz de contigüidad propiamente

definida.
Por lo tanto, minimizando la ecuación GLS con respecto a ÿ:
T
gls (ÿ) = (y ÿ ÿX) V (yÿ1 ÿ ÿX) (4.59)
y usando la matriz de varianza-covarianza V como se especifica en la Ecuación (4.34) anterior,

obtenemos:
ˆ
T T
] 1 (yo
T
ÿ B)T(yo ÿ B)y
ÿ
ÿ = [X (yo ÿ B) (yo ÿ B)XX (4.60)
Es fácil convencerse de que, en términos numéricos, esta última expresión es

equivalente al estimador MCO aplicado a una transformación de las variables X
e Y. Definamos un nuevo par de variables* X e Y tal
*
que
*
X = (I- B)X (4.61)
*
Y = (I- B)Y (4.62)
A partir de las Ecuaciones (4.61) y (4.62) podemos interpretar las variables X*

*
transformadas e Y como las variables originales con los efectos espaciales
“filtrados” (sobre el filtrado de variables espacialmente correlacionadas ver Griffith,
2003). Derivando los estimadores MCO del vector de parámetros ÿ
ˆ
para las variables transformadas se obtiene:
ˆ
= ( *T * )1 *T *
ÿ
ÿXXXY = (X*T X*)-1 X*T Y* (4.63)
y al sustituir las Ecuaciones (4.61) y (4.62) en la Ecuación (4.63) obtenemos

nuevamente la Ecuación (4.60).
El problema fundamental en el uso de Mínimos Cuadrados Generalizados es que
suponen un conocimiento previo del parámetro ÿ que representa el argumento de la
matriz B. En la práctica, sin embargo, esta condición casi nunca se cumple a menos
que dispongamos de una estimación preliminar basada en estudios previos. o una
muestra previa. Algunas de las propuestas para superar esta limitación se revisarán
en la siguiente sección.
4.3.4.6 Técnicas de estimación aproximada
En esta sección revisaremos un conjunto de técnicas diseñadas para superar las

limitaciones del procedimiento GLS antes mencionadas. Se trata de dos técnicas
iterativas propuestas por Hordijk (1974), Bartels (1979) y Anselin (1980) por analogía
con las propuestas por Cochrane y Orcutt (1949) y por Durbin (1960) en el contexto
del análisis de series temporales.
Una primera técnica deriva del procedimiento análogo introducido por Durbin
(1960) para procesos autorregresivos de series de tiempo. Sugiere una forma de
derivar una estimación del parámetro desconocido ÿ necesario para activar el
procedimiento GLS descrito en la sección anterior. Para introducir la técnica espacial
de Durbin, escribamos una vez más la formulación básica del modelo escrito en
notación matricial:
y = Xÿ + e (4.64)
e = ser + tu (4.65)
Al premultiplicar ambos lados de la Ecuación (4.64) por el término (I – B) obtenemos:
(Yo ÿ B)y = (Yo ÿ B)Xÿ + (Yo ÿ B)e (4.66)
y, dado que (I ÿ B)e = u , esto se reduce a:
(yo ÿ segundo )y = (yo ÿ segundo)Xÿ + u (4.67)
De la Ecuación (4.67), desarrollando los productos de la matriz, finalmente obtenemos:
y = Por + Xÿ + +BXÿ + u (4.68)
Escrito como en la Ecuación (4.68), el modelo es formalmente equivalente a un modelo

de regresión lineal simple caracterizado por un componente no sistemático u que es un
ruido blanco. Como consecuencia, los parámetros se pueden estimar con los Mínimos
Cuadrados Ordinarios sujetos a la restricción
ÿ parámetro.
B = W. Así En
obtenemos
un segundo
unapaso,
estimación
podemos
del
usar esta estimación
ÿ , decir .
para filtrar las variables X e y como se indica en Ecuaciones (4.61)
y (4.62) y podemos aplicar el MCO a los datos transformados. De esta forma,
obtenemos las estimaciones GLS del vector de parámetros ÿ.
El segundo método aproximado (conocido como método espacial Cochrane –

Orcutt) es una técnica iterativa propuesta por Hordijk (1974) para obtener
estimaciones de los parámetros de un modelo de regresión espacial. El procedimiento se desarrolla

a través de una serie de pasos.
En el primer paso, se asume un modelo de regresión a-espacial que obedece a la ecuación
y = Xÿ + e (4.69)
y las estimaciones de Mínimos Cuadrados Ordinarios se obtienen para el vector de parámetros

ÿ a través de la conocida expresión MCO:
ˆ T1T
ÿ (1)
XXX = y( )
ÿ
(4.70)
En consecuencia, los residuos se obtienen como:

ˆ
yo (1) = y ÿ Xÿ(1) (4.71)
En un segundo paso, los residuos así obtenidos se utilizan para derivar una estimación de ÿ
(el parámetro que define la autocorrelación espacial del componente no sistemático en la
ˆ
ecuación suplementaria), digamos (1) , a través de la ecuación:
ÿ
)( 1 T
ÿ
ˆ (1) = (camiseta
( 1 ) (1)
e Nosotros
) (4.72)
ÿ (1) (1)
con W la matriz de contigüidad habitual.

Finalmente, en el tercer paso la estimación del parámetro ˆ (1) se utiliza para obtener una nueva
ÿ
estimación del vector de parámetros ÿ, digamos (2)aplicando
ÿ
ˆ
la técnica de Mínimos Cuadrados
Generalizados descrita en la Sección 4.3.3.4. En particular, aplicando la Ecuación (4.60), se
obtiene:
T T 1 T
ˆ ]
ÿ
(2)
(4.73)
ÿ = [ XI ÿ( BI ÿ )BX
( [X (I) ÿ) B)y]
con B = ˆ(1)W .
ÿ
Luego, los tres pasos se iteran de modo que, en el k-ésimo paso, tenemos:
ÿˆ kf ( ) = [ÿˆ ( kÿ 1)
] (4.74)
ÿˆ k (1)
+
[ˆ k ( )] (4.75)
=gÿ
Se itera el proceso hasta lograr la convergencia y se obtiene:
ˆ ˆ (4.76)
k() ( kÿ 1)
ÿ ÿÿ
ˆ ˆ
ÿ k ( ) ÿ ÿ ( kÿ
1) (4.77)
ˆ ˆ
En cada paso, por lo tanto, los nuevos ÿ (k) y ÿ k()
son los que minimizan
valores de las sumas de los cuadrados de los residuos condicionan el valor
anterior. Se puede probar que la técnica eventualmente converge a un mínimo
local (para la prueba en el análisis de series de tiempo ver Sargan, 1964 y
Oberhofer y Kmenta, 1971). Cabe señalar, sin embargo, que no hay garantía de
que este mínimo local sea también el mínimo absoluto deseado.
4.3.5 La re-especificación de la regresión lineal agregando un retraso

espacial (el modelo de retraso espacial )
Los dos modelos presentados en las secciones anteriores (es decir, el modelo CAR bivariado
y el SAR residual) representan una forma formal de abordar el problema de la dependencia
de datos espaciales reemplazando el paradigma clásico de muestreo aleatorio con dos
modelos alternativos de campo aleatorio. En este sentido, los dos modelos proporcionan un
trasfondo probabilístico sólido para un modelo de regresión lineal espacial.
Otra alternativa, particularmente popular en la literatura econométrica espacial, no se
basa en ningún modelo de campo aleatorio específico. Consiste más bien en un recurso
técnico que busca dar cuenta de la dependencia espacial entre los datos agregando el
valor retrasado espacialmente de y como una variable independiente adicional de manera
similar a la inclusión de un término serialmente autorregresivo en un contexto de serie
de tiempo. Este modelo a menudo se denomina modelo de retraso espacial (p. ej., en
Anselin y Bera, 1998), modelo autorregresivo espacial regresivo mixto (Anselin, 1988) o,
por último, modelo autorregresivo espacial o modelo SAR (LeSage, 1999). ). Como ya
se observó en la Sección 4.3.4.1, esta última definición es particularmente engañosa
porque el acrónimo SAR se usa en estadísticas espaciales para indicar un campo
aleatorio específico: el campo AutoRegresivo Simultáneo (ver Sección 2.4.3.1). Debido
a la popularidad de este modelo, esta sección se centrará en describir esta especificación
alternativa de un modelo de regresión espacial.
4.3.5.2 Derivación de la probabilidad
Con el propósito de presentar el modelo de retraso espacial, nos referiremos a la

formulación alternativa de un modelo de regresión lineal presentado en la Sección
4.2.2. Siguiendo esta formulación, el modelo se puede escribir como el conjunto de las
siguientes hipótesis:
norte
A1 T
yo y =ÿ x i +ÿ ÿwy + u yo j i
j =1
donde ÿ es el vector k-by-1 habitual de parámetros regresivos, xi el vector k-by-1 de variables

ÿ ponderación
explicativas en el sitio i, un parámetro autorregresivo, wij ÿW los elementos
(posiblemente de una matriz
estandarizada porde
filas) y u un campo aleatorio espacial gaussiano tal que:
con En una matriz identidad n-por-n.

A diferencia del caso de la especificación análoga de series de tiempo, la presencia del
término retrasado espacialmente entre las variables explicativas induce una correlación entre
el término de error y la variable retrasada misma (ver Anselin y Bera, 1998).
Por lo tanto, los Mínimos Cuadrados Ordinarios no proporcionan estimadores consistentes en
esta especificación. Es importante señalar que este resultado específico (probado por Anselin,
1988) no depende del supuesto A2 y se cumple independientemente de las propiedades del
componente no sistemático.
Escribamos el supuesto A1 en una notación matricial más compacta como:
y = Xÿ + ÿ wy + tu (4.78)
con X ahora indicando una matriz de observaciones n-by-k .

Ahora proporcionaremos una justificación probabilística de la Ecuación (4.78), usando
conceptos de la teoría de campos aleatorios, antes de derivar la función de verosimilitud para
este modelo de regresión espacial alternativo. La ecuación (4.78) se puede interpretar como
una regresión lineal no estocástica en la que se supone que la matriz de observaciones X es
un conjunto fijo de números. Como consecuencia de la falta de supuestos probabilísticos
sobre las variables dependientes X, la Ecuación (4.78) puede interpretarse como una ecuación
diferencial estocástica que conduce a un campo aleatorio autorregresivo (SAR) simultáneo
(consulte la Sección 2.4.3.1) en el que el término constante adicional Xÿ
aparece La introducción de este término solo afecta el valor esperado del campo aleatorio: no
se alteran ni su varianza ni su estructura de dependencia. Por lo tanto, podemos explotar los
resultados relacionados con el campo SAR (y, más específicamente, utilizar la matriz de
varianza-covarianza definida en la Ecuación (2.69)) una vez que hayamos introducido las
modificaciones necesarias.
Formalmente, reescribamos nuestro modelo como:
y = ÿ Wy + ÿ (4.79)
con un componente no sistemático ÿ definido como ÿ = Xÿ + u y con u un campo de

ruido blanco espacial tal que tu ÿ 0norte( ; ÿ 2 yo ) . Como consecuencia de la suposición
norte
gaussiana sobre el componente de ruido blanco, tenemos que ÿ también es gaussiana,

2 . Xÿ
pero con valores esperados distintos de ceroreformulamos
tales variable
que;(ÿ ÿ yoÿla
y)Nen
modelo
la Aislamos
ecuación (4.79)
ahora yla
como:
y(
=ÿ
IW ÿÿ ) ÿ1
(4.80)
Ahora es posible derivar las propiedades del campo aleatorio y así generado (y, en
consecuencia, la probabilidad asociada con un conjunto de observaciones empíricas) de
la siguiente manera.
Para empezar, el valor esperado del campo aleatorio y está dado por:
1 1 (4.81)
)
ÿ ÿ
mi(=) mi - y [(IWÿ ÿ] () =ÿ
IW Xÿ
ÿ
En segundo lugar, utilizando la Ecuación (2.70), la matriz de varianzas-covarianzas del campo

aleatorio viene dada por:
T 2
, ÿ) =
2
(yo - ÿ WI )- ( 1
ÿW)
T
ÿ ÿ
mi yy
()=V( ÿ ÿ (4.82)
A partir de (4.81) y (4.82) derivamos la verosimilitud gaussiana de una muestra de

observaciones y obtenemos:
2
L (ÿ , ÿ, ; )ÿ y =
(4.83)
1
1
][ T
ÿ
2 ÿ
= CV 2 ÿ
[) y IW( Xÿ ÿV y IW 1Xÿ 1 1
ÿ ÿ ÿ
ÿ
( y) ( , ) Exp ÿ ÿ
ÿÿÿ ÿÿ
( ÿ )
ÿ 2 ]ÿ ÿ
y, por lo tanto, el log-verosimilitud se puede expresar como:
2
yo
(ÿ , ÿ, ÿ ;y) =
(4.84)
1 1
=ÿ
C( y
) V ln ÿ
2
,ÿ )
ÿÿÿ
[) y IW( Xÿ Vÿ y IW 1Xÿ
ÿ
][ T ÿ
1
ÿÿ
( ÿ )
ÿ
1
]
(2 2
2
V Recordando la Ecuación (4.82), el determinante de la matriz (ÿ , ÿ ) puede ser
Escrito como:
,ÿ ) = (yo - ÿ WI )- ( ÿ W =) (yo - ÿ WI )- ( )
2 2 1 ÿT 2 1 ÿT
V (ÿ
ÿ ÿ
ÿW
norte
ÿ ÿ
)( 1 ÿT
) )( 1 ÿT
)
ÿ ÿ
y, puesto que (yo - ÿ WI - ÿW = ( yo - ÿ WI - ÿW , eventualmente puede ser
expresado como:
2
ÿ
2
V (ÿ , ÿ) = ÿ
2 norte
(yo - ÿ W ) (4.85)
Volvamos ahora al log-verosimilitud y sustituyamos las Ecuaciones (4.82) y (4.85) en la Ecuación

(4.84). Obtenemos:
ÿy =
2
yo
(ÿ ,ÿ ,;)
= C( y
)
ÿ
1 en ÿ ( 2 norte
IW ÿ
ÿ
ÿ
2
)+
2
1 1
][
T 2 1 T
][ 1 1
]=
ÿ
ÿ ÿ ÿ ÿ
ÿÿ
( y IW Xÿ ÿ ) ÿ ( IWIW
ÿ
) ( ÿy IW Xÿ
ÿ
ÿ )
ÿÿ
( ÿ )
ÿ[
2
= C( y
ÿ
norte
en ÿ
2
+ ÿen
+ IW
) ÿ
2
1
ÿ
2ÿ 2
[]( y IW[]( Xÿ IWIW) y IW Xÿ (
ÿÿ
ÿ
ÿ
1 T
ÿ
ÿ )
T ÿ
ÿ )
ÿÿ
( ÿ )
ÿ
( ÿ ) ÿ 1) -
( IW Xÿ] = (yo - ÿ W)y ÿ Xÿ , finalmente obtenemos:
ÿ ÿÿ
y, desde IW [y
2
yo (
ÿ , ÿ, ; ) ÿ= y
2 1 T
[(I][ÿ ]W)y (4.86)
norte
= yCÿ( ) en ÿ en ÿ W ÿÿ 2
+ yo ÿ ÿ Xÿ (I ÿ W)y ÿ Xÿ ÿ
2
2 ÿ
que representa la expresión formal de la probabilidad de un modelo de regresión lineal con

retraso espacial . (Ver Anselin, 1988; p. 63, para una derivación alternativa).
4.3.5.3 Estimación
Una vez que se ha obtenido el log-verosimilitud del modelo de regresión lineal de retraso
espacial , podemos maximizarlo para obtener estimaciones de máxima verosimilitud de los
parámetros de interés. Desafortunadamente, esto no se puede lograr analíticamente porque la
Ecuación (4.86) es altamente no lineal en los parámetros y no existe una solución exacta para
el problema de maximización. Además, no se puede utilizar un algoritmo de optimización
simplex univariante simple porque esto deja sin resolver el problema de encontrar una estimación
2
del parámetro, como lo señaló LeSage (1999).
ÿ
Anselin (1988) propuso una solución aproximada basada en una pseudoverosimilitud y

LeSage (1999) la utiliza para derivar los procedimientos de software para su cálculo.
El procedimiento se basa en la idea de la verosimilitud del perfil (PL). Esto se obtiene
reduciendo el número de incógnitas en el problema reemplazando en la probabilidad
original algunos de los parámetros que no son de interés inferencial directo (o parámetros
molestos ) con estimaciones consistentes de ellos (ver Pace y Salvan, 1997). Obviamente,
una probabilidad de perfil no es una probabilidad genuina en el sentido de que no se
deduce de una función de densidad conjunta. Por tanto, no posee todas las propiedades
de una verosimilitud verdadera (por ejemplo, la puntuación del perfil no tiene expectativa
nula). Sin embargo, tiene algunas propiedades interesantes similares a las de una verdadera probabilidad.
Siguiendo a Anselin (1988), LeSage (1999) propone el siguiente procedimiento.
En un primer paso, construimos un modelo parcial haciendo una regresión de la variable y solo en
las variables X
(4.87)
y = Xÿ0 + u0
y derivamos la estimación MCO de ÿ0 , digamos ˆÿ0XXX

T ÿ
1 tonelada
.
=( y )
En un segundo paso, construimos un segundo modelo parcial haciendo una regresión de la
variable espacialmente rezagada Wy solo en las variables X
Wy = Xÿ L (4.88)
+ uL
Wyˆ En
T 1 T . ÿ
y derivamos la estimación MCO de ÿ ( L ,XXX

digamos L ÿ=el tercer paso,
)
calculamos los residuos estimados de los dos modelos reducidos contenidos en las
Ecuaciones (4.87) y (4.88) como:
ˆ (4.89)
0 0
uˆ = y ÿ Xÿ
y
ˆ ˆ (4.90)
uL Wy= ÿXÿ L
En el cuarto paso, usamos los residuos estimados obtenidos en las Ecuaciones (4.89) y (4.90)
para construir el logaritmo de verosimilitud parcial:
ˆ ˆ ˆ 1 ˆ ˆ ˆ ˆ
)( T
norte
yo ( ÿ ; tu 0, L ) = C (ˆ,
tu 0
L )
ÿ
ÿ en (
tu
0
ÿ
ÿ uuL 0
ÿ
ÿ ÿ )L tu ÿ +en
yo ÿ ÿ
W (4.91)
2 ÿ
ÿ norte
ÿ
ˆ
y lo maximizamos para obtener una estimación de , say .
ˆ ÿ 2 ÿ
Finalmente, usamos para obtener las estimaciones finales de ÿ y ÿ , dado por:
ÿ
ˆ 1
ÿ
2 = (tu 0 ÿ
ÿûˆ L )(T tu
0
ÿ
ÿûˆ ) L (4.92)
norte
ˆˆ
ÿˆ( =ˆ ÿ0 ÿ ÿ ÿ L ) (4.93)
respectivamente.
4.3.5.4 Prueba de hipótesis
Una vez que se ha obtenido la verosimilitud del modelo, es inmediato definir un

estadístico de prueba especificando las hipótesis nula y alternativa. Ya sabemos que,
bajo la hipótesis alternativa de una regresión lineal con un retraso espacial adicional,
el logaritmo de verosimilitud asume la expresión:
2
yo (
ÿ ,ÿ , ; ) = ÿ y
norte
2
1 T
C( ) ln = y ÿ 2 ÿ en ÿ W ÿÿ 2
+ yo
2
[(I][ÿ ]W)y
ÿ ÿ Xÿ (I ÿ W)y ÿ Xÿ (4.94)
ÿ
ÿ
Bajo la hipótesis nula, por otro lado, tenemos que H0 : por lo tanto, la ÿ = 0 y,
probabilidad logarítmica se puede expresar como:
1
ÿÿ y ( , ; )
l0 =
2
C ( y) ÿ2
norte
enÿ 2 ÿ
2ÿ 2 [ ] y ÿ Xÿ y ÿ Xÿ][
T
(4.95)
Como consecuencia, el estadístico de la prueba de razón de verosimilitud es igual a:
LRT= ÿ l 2[ ÿ(ÿ, ,ÿ;y) ÿl( ,ÿ; y)] 2 2

0
ÿ (4.96)
Sustituyendo las Ecuaciones (4.94) y (4.95) en la Ecuación (4.96) tenemos:
1
ÿ ÿ Xÿ (I ÿ W)y][ÿ Xÿ ÿ
ÿ norte
2 T
LRT =ÿÿ
2ÿ en ÿ en ÿ W ÿÿ 2
+ yo 2
[(I]+ÿ W)y
ÿ 2 ÿ
n 1 T ÿ
+ en ÿ + 2 [y][ÿyXÿ
ÿ Xÿ (4.97)
2 2 ÿ ]ÿ ÿ
que, después de un poco de álgebra sencilla, se simplifica en
ÿ 1 T
1 ÿ
LRT 2=en
ÿÿ yo ÿ W + ÿ ÿ
2
[ ] yo
()) ÿÿW y ÿ Xÿ yo ÿ][W( y ÿ ÿXÿ
ÿ
2
ÿ
y XÿT
[y][Xÿ ÿ
(4.98)
ÿ ÿ ]ÿ ÿ
Como es sabido, la ecuación (4.98) se distribuye asintóticamente como una variable

aleatoria ÿ² con un grado de libertad y puede usarse para probar la hipótesis de
dependencia espacial en el marco del modelo de regresión lineal tratado en esta sección.
4.3.6 Modelo espacial general de Anselin
Al discutir posibles alternativas a las especificaciones del modelo de regresión lineal

presentadas en los dos apartados anteriores, merece una mención especial la
sugerida por Anselin (1988) (y bautizada por él como modelo espacial general) .
Siguiendo esta especificación, el modelo de regresión lineal se puede escribir como:
norte
A1 yi =ÿÿij _ (1) + wy j x
T
i
+ mii (4.99)
j =1
yo
ÿ
donde ÿ es el vector habitual k-by-1 de parámetros regresivos, xi el vector k-by-1 de variables

explicativas en el sitio i, los elementos ÿde una matriz
parámetro de ponderaciones (posiblemente
autorregresivo, (1) W(1) w ij ÿ un
estandarizada por filas) y e es una matriz espacial autorregresiva campo aleatorio tal que:
norte
A1 yo
_
= ÿ
ÿ (2)
+ _
wij euj i (4.100)
j =1
yo
ÿ
definido en términos de la matriz de pesos (2) W(2) wij ÿ , el parámetro autorregresivo

ÿ y el campo de ruido blanco espacial gaussiano:
con En una matriz identidad n-por-n .

Es importante notar que las matrices de dos pesos W(1) y W(2) no necesariamente
tienen que ser iguales. De hecho, se puede probar que los parámetros autorregresivos
espaciales del modelo no se pueden identificar cuando son exactamente iguales.
Para mostrar esto, expresemos los supuestos A1 (contenidos en las Ecuaciones
(4.99) y (4.100)) en forma de matriz compacta como:
y = Xÿ + Wÿ y +(1)e (4.101)
(2) miÿ = mi + tu (4.102)
Reordenando las Ecuaciones (4.101) y (4.102), obtenemos:

(1) + nosotros+ tu
(2) y = Xÿ +ÿW y ÿ (4.103)
(1)
y, sustituyendo e = y – Xÿ + W y enÿla Ecuación (4.101), tenemos:
(1)
y = Xÿ + W ÿy ÿ [y (2)
+W
ÿÿ
Xÿ W y] ÿ
(1) + tu =
(1) (2) (2) (1) (2)
= Xÿ + Wÿy + W y ÿ Wÿ Xÿ ÿ WW yÿ + u ÿÿ (4.104)
Se pueden analizar dos casos notables. La primera se refiere al caso donde W(1)
y W(2) no tienen ningún elemento en común (por ejemplo, cuando se refieren a diferentes
órdenes de contigüidad). En tal caso, tenemos que W(1) W(2) = 0. La ecuación (4.104) se
convierte entonces en:
(1) (2) (2)

y = Xÿ + W ÿy + W y ÿ WÿXÿ + tu ÿ (4.105)
y se reduce a un retraso espacial biparamétrico con algunas restricciones adicionales en los

parámetros.
Por el contrario, cuando W(1) = W(2) , la ecuación (4.104) se convierte en:
2
ÿ ÿÿWXÿ ÿ Wÿy + u
y = Xÿ + ( + )Wy ÿÿ (4.106)
y los parámetros ÿ y ÿ están sujetos a dos restricciones (posiblemente en conflicto).

Por lo tanto, no pueden identificarse unívocamente (Anselin y Bera, 1998; p. 252).
Asimismo, el modelo de rezagos espaciales, Mínimos Cuadrados Ordinarios no proporciona
estimadores consistentes de los parámetros del modelo expresados en las Ecuaciones (4.101)
y (4.102) debido a la presencia de un término espacialmente rezagado entre los explicativos.
Para introducir los estimadores de máxima verosimilitud, derivemos ahora la función de

verosimilitud asociada con el modelo espacial general. En primer lugar, de la Ecuación (4.101)
obtenemos:
(1)
(Yo ÿÿ W )y = Xÿ + e (4.107)
(2) 1
=ÿ
ÿ tu
( ) ÿ e IW (4.108)
De las Ecuaciones (4.107) y (4.108) tenemos:
(1) (2) 1
(IW yÿXÿ IW )u
ÿ
=+ÿ ( ÿ )- (4.109)
y finalmente:
(2) (1)
(4.110)
Ahora estamos en posición de derivar la función de verosimilitud de las variables gaussianas u

dada por:
1
2 ÿ1u
T V u1
) = C ( uV
ÿ
L (ÿ ; tu
ÿ
) 2 ÿ exp
ÿ
(4.111)
ÿ
ÿ
2 ÿ
ÿ
2
con V la matriz de varianza-covarianza del campo aleatorio u. Desde VI = ÿ , nosotros
2n 2n
tener esa V= ÿ yo = ÿ . Además, la inversa de la varianza-covarianza
ÿ1 = ÿ2
matriz es V ÿ yo . Por lo tanto
1
1
(ÿ ) 2 Exp ÿ ÿ
ÿ
2 2 T
L (ÿ ) = C ( tu
; tu tu 2
norte
) (4.112)
ÿ
ÿ ÿ
ÿ 2ÿ ÿ
Ahora operemos un cambio de la variable de u a y usando la transformación expresada en la

Ecuación (4.109). El jacobiano de la transformación es:
ÿ tu (2)
J= =ÿ
IWI ÿ ÿ
ÿ W(1) (4.113)
ÿy
Por tanto, expresando la Ecuación (4.112) en función de y y multiplicando por el jacobiano

obtenido en (4.113), obtenemos la verosimilitud de y como:
1
2
yÿ, ; ) = C ( y) (ÿ 2
)
ÿ
L ( ÿ, ÿ ÿ , norte
2 ÿ
IWIW (2) (1)
ÿ
ÿ ÿ
(4.114)
ÿ 1 T
{( IWIW (2) [ (1) } ] {( (2) [ (1)
Exp ) ( ÿ y Xÿ IWIW
)( yÿXÿ ) ÿ ÿ )
2 ÿ } ]ÿ
ÿ
ÿ 2ÿ ÿ
y, en consecuencia, la log-verosimilitud como:
2 norte
2 (2) (1)
yo ( , ÿ ÿ, ÿ yÿ, ; ) = C( y
)
ÿ
en ÿ + ÿ IWIW
+ ÿen ln ÿ ÿ
2
(4.115)
{( IW [ IW [
1 T
ÿ
2ÿ 2
ÿ ÿ
(2)
)( IW y Xÿ {
ÿ
ÿ
(1)
)
ÿ
]} (
ÿ
ÿ
(2)
)( IW yÿ Xÿ
ÿ
(1)
)
ÿ
]}
Como en el caso del modelo de rezago espacial considerado en la Sección 4.3.5, la Ecuación
(4.115) no puede maximizarse analíticamente para propósitos de estimación, debido al alto grado
de no linealidad en los parámetros contenidos en la expresión. Como consecuencia, una vez más
tenemos que confiar en un enfoque de verosimilitud de perfil obtenido
reemplazando algunos de los parámetros (considerados, al menos inicialmente, como parámetros

molestos) con estimaciones consistentes de los mismos.
Una forma particular de proceder se describe en LeSage (1999) y consiste en
estimar el vector ÿ del parámetro con el estimador de mínimos cuadrados ponderados
del modelo reducido:
(2)
(Yo ÿÿ W )y = Xÿ + ÿ (4.116)
T
( ÿ ÿ WI (1)
usando ÿ = yo - )( ÿ W(1) ) como matriz de pesos, obteniendo así:
ˆ
ÿ= ()(
X ÿX)X ÿ IW y
T
ÿ
1 T ÿ
ÿ (2)
(4.117)
En segundo lugar, definimos los residuos estimados del modelo (4.116) como:
ˆ ˆ
ÿ(
=ÿ
IW yÿXÿ
(2) ) ÿ
(4.118)
y usarlos para producir un estimador consistente de la varianza del campo de ruido

blanco dado por:
2
ÿˆTÿˆ
ÿ = (4.119)
norte
Sustituyendo las Ecuaciones (4.117) y (4.119) en la Ecuación (4.115) se obtiene:
l ( ÿ, , )ÿ( )yy =c
ln ln +ÿ ÿ
IWIW (2)
+ ÿ
ÿ
(1)
+
(4.120)
1 ˆ T ˆ
ˆ 2 {( IW [ ÿ
(2) (1) ]} (2) (1) ]}
) (IW yÿXÿ { ) ( IW [ ÿ ) (IW yÿXÿ )
2ÿ
que se puede maximizar numéricamente para obtener una estimación máxima de

ˆ ˆ
y ÿ .
pseudoverosimilitud de los parámetros ÿ y ÿÿ, digamos
ˆ ˆ
Ahora sustituyendo ÿ y ÿ en las ecuaciones (4.117), (4.118) y (4.119), ob
tain las estimaciones por los parámetros ÿ² y ÿ.
En lo que respecta a la prueba de hipótesis, podemos aprovechar nuevamente el enfoque
de razón de verosimilitud para probar la hipótesis de independencia espacial en el marco del
ÿ =: ÿ= 0Usando
modelo espacial general especificando el valor nulo como H0 contra la
este
alternativa
enfoque,H1
bajo
: ÿel
0;
ÿ
valor nulo, ÿ ÿ0 .
la probabilidad se convierte en:
2
n
2
1 T
ÿ yÿ, ; ) = C ( y) - 2 en ÿ ÿ
(4.121)
l0 ( [ ][ ] y ÿ Xÿ y ÿ Xÿ
2ÿ 2
y, usando la Ecuación (4.115) y la Ecuación (4.121), el estadístico de la prueba de razón de

verosimilitud es igual a:
2
LRT= ÿ l 2[ ( ,ÿ,ÿ;y)
ÿ ( ,ÿ;y)] 2ÿl ÿ
0
1 T
=ÿ
2ln 2ln ÿ
(2)
IWIW ÿy Xÿ y Xÿ
ÿ ÿ
ÿ
(1) ÿ
2 [ ÿ
][ ÿ
]+
ÿ
(4.122)
{( IW [ IW [
T
+
ÿ
1
2
ÿ
ÿ
(2)
)( IW y Xÿ {
ÿ
ÿ
(1)
)
ÿ
]} (
ÿ
ÿ
(2)
) (IW y Xÿÿ
ÿ
(1)
)
ÿ
]}
2
una cantidad que, como es sabido, se distribuye asintóticamente como x con dos grados
de libertad.
4.4 Violación de las hipótesis sobre el modelo de probabilidad
4.4.1 Introducción
Esta sección se centrará en las violaciones relacionadas con el modelo de probabilidad que pueden
surgir en el modelo de regresión básico presentado en la Sección 4.2.
Como dijimos en la Sección 4.2.1, la suposición fundamental sobre el modelo de probabilidad
es la de normalidad, todas las demás hipótesis se siguen como meras consecuencias. Esta
hipótesis puede expresarse en forma de multinormalidad de la distribución conjunta (si usamos la
especificación condicional del modelo de regresión lineal como en la Sección 4.2.1) o,
alternativamente, en forma de normalidad de la distribución condicional de el componente no
sistemático dado el conjunto de valores observados de las variables independientes (si adoptamos
la especificación de libro de texto estándar como en la Sección 4.2.2). Dada su importancia, es
sensato analizar las violaciones de las hipótesis del modelo de probabilidad a partir de este
supuesto básico (Sección 4.4.2). Las dos secciones restantes de este capítulo (4.4.3 y 4.4.4) se
ocuparán de la violación de la hipótesis de la homocedasticidad y la violación de la hipótesis de la
invariancia espacial de los parámetros, respectivamente.
4.4.2 Normalidad
El primer punto importante a señalar es que, si relajamos la hipótesis de normalidad, manteniendo

las de linealidad de la media condicional y de homoscedasticidad, las consecuencias no son
dramáticas en términos de especificación del modelo. De hecho, el principal inconveniente es que,
en este caso, el método de máxima verosimilitud y los procedimientos de prueba relacionados solo
se pueden aplicar si somos capaces de especificar completamente un modelo de probabilidad
alternativo. Cabe señalar que, en el caso espacial, este
4.4 Violación de las hipótesis sobre el modelo de probabilidad 121
parece ser la única alternativa viable a los estimadores de máxima verosimilitud ya que los
estimadores MCO no pueden explotarse (como es habitual en las regresiones no espaciales)
debido a la presencia de términos espacialmente rezagados entre las variables explicativas. Esta
sección considerará primero el problema de probar la normalidad en una regresión espacial
(Sección 4.2.2.2) y luego pasará a considerar posibles soluciones a la violación de esta hipótesis
(Sección 4.2.2.3).
4.4.2.2 Pruebas de desviación de la normalidad
La hipótesis de normalidad puede contrastarse de diferentes formas según la especificación

particular del modelo espacial lineal considerado. Cuando un modelo se especifica en forma
condicional como un campo aleatorio multivariante (como en la Sección 4.3.3.5), el supuesto de
normalidad se refiere, de hecho, a la distribución conjunta de todas las variables involucradas. Por
el contrario, cuando adoptamos una de las especificaciones alternativas consideradas en este
capítulo (por ejemplo, el modelo de error espacial, el modelo de retraso espacial o el modelo
espacial general; consulte las Secciones de 4.3.4 a 4.3.6), la hipótesis de normalidad se refiere a
la distribución condicional del componente no sistemático del modelo dado el conjunto de valores
observados de las variables independientes.
Comencemos por abordar el problema de probar la normalidad univariada del componente no
sistemático. Luego generalizaremos el enfoque para probar la normalidad multivariada.
En el caso de un modelo especificado como en la especificación estándar del libro de texto,

están disponibles las pruebas de normalidad habituales. En este sentido, podemos distinguir entre
pruebas no paramétricas y paramétricas dependiendo de si la hipótesis alternativa se expresa de
forma paramétrica o no paramétrica. Las pruebas del primer tipo son la prueba de Kolmogorov-
Smirnov (Kolmogorov, 1933; Feller, 1948) y la prueba de Shapiro-Wilk (Shapiro y Wilk, 1965). La
más popular de las pruebas de la segunda tipología es la prueba de Bera-Jarque (Jarque y Bera,
1980; Bera y Jarque, 1982).
La prueba de Kolmogorv-Smirnov es una prueba general para medir qué tan bien se ajusta un
conjunto de observaciones empíricas a una distribución de probabilidad dada. Se basa en la
estadística de Kol mogorov dada por:
k = sorber F z( F) z ( )0
norte
ÿ
(4.123)
ÿÿ< <+ÿz
siendo F (z) la función de distribución acumulativa empírica basada en n observaciones

norte
y() F 0z la función de distribución acumulada teórica bajo la hipótesis nula. (Ver

Kendall y Stuart, 1979 para más detalles, y Durbin, 1973 para una discusión).
Shapiro y Wilk (1965) introdujeron otra prueba no paramétrica de normalidad basada en

estadísticas de orden. La prueba se basa en las estadísticas:
2
ÿ norte
ÿ
ÿÿ
ÿ Arizona
i (i ) ÿ
ÿ
SUDOESTE
= ÿ i =1 ÿ
(4.124)
norte
ÿ ( zz i
ÿ
)
2
i =1
siendo
(i) z el estadístico de i-ésimo orden, z la media muestral de la variable Z y ai a
conjunto de coeficientes tabulados. Los valores pequeños de las estadísticas SW son críticos en el
procedimiento de prueba (Kendall y Stuart, 1979).
La prueba de Bera-Jarque utiliza la familia de distribuciones de Pearson como
alternativa paramétrica al campo aleatorio gaussiano de ruido blanco. La familia de
funciones de densidad de Pearson (Kendall y Stuart, 1979) se caracteriza por el valor
esperado, la varianza y por el tercer y cuarto momentos estandarizados definidos
ÿ = µ3 y ÿ = µ 4 como , respectivamente,
µ estandarizado
siendo el momento
de orden r-ésimo.
central no
3
ÿ
3 4
ÿ
4 r
ˆ
Consideremos ahora el análogo de muestreo de y definido como: ÿ y ÿ
4 , di 3
ÿ
ˆ ˆ 3
ÿ
4 , basado en los residuos de regresión, digamos ui ,
1 norte
ˆ3
ˆ
ÿ tu
i
=
norte
i=1
ÿ
3
(4.125)
3
ÿ1 norte
ˆ2ÿ
ÿ
ÿ
ÿ tu
i ÿ
ÿ
ÿ norte
i =1 ÿ
1 norte
ˆ4
ˆ
ÿ tu
i
=
norte
i=1
ÿ
4 2
(4.126)
ÿ1 norte
ˆ2ÿ
ÿÿ
ÿ tu
i ÿ
ÿ
ÿ norte
i =1 ÿ
ˆ ˆ
Se sabe que, bajo la hipótesis nula de normalidad,
norte
ÿ y norte
( ÿ 4 -3)
3
6 24
son asintóticamente independientes y ambos asintóticamente distribuidos como
distribuciones normales estandarizadas (Kendall y Stuart, 1979). Como consecuencia,
su suma al cuadrado se distribuye asintóticamente, bajo el nulo, como un ÿ² con 2 grados
de libertad. Esto proporciona a la prueba de Bera-Jarque una forma operativa:
ˆ ˆ 2
2
(ÿ
norte norte
ÿ
BJ = ÿ + 4
ÿ
3 (4.127)
ÿ 3
24 ÿ)ÿ
ÿ6 ÿ
En el caso de un modelo especificado como un campo multivariante condicional, en

principio, se debe considerar una prueba de normalidad multivariante. Pruebas similares
se sugieren en la literatura. Por ejemplo, Mardia (1970, 1974, 1980) propuso una estadística
de asimetría y curtosis de k-variante para muestras extraídas de una distribución de k-
variante. El autor sugiere utilizar los estadísticos k-variable skewness y kurtosis definidos,
respectivamente, como:
ÿ
3k {[zi][- mi
= mi (]} 3
) (zi
T 1
) V z -i mi z i
ÿ
(4.128)
T 1
= mi
{[ ][ ]}zi
4 - mi
( ) zi V z -i mi (z)i
ÿ
ÿ
4k (4.129)
siendo
i z las observaciones n-dimensionales de la variable Zi y V la matriz de varianza-
covarianza espacial.
El autor también deriva el resultado de que, bajo la hipótesis nula de multinormal
norte
2 k(k +1)(k + 2) con grados de
idad, la distribución limitante de
6
ÿ
3k
es un x libre
6
norte [ÿ 4, k
+ k ( 2) ÿ ]
dom, mientras que la distribución limitante de es el estándar normal
8k(2) +
distribución. En el caso univariante, estos se reducen a la prueba habitual de asimetría y
curtosis (ver también Mardia, 1986, para referencias).
Las pruebas anteriores de multinormalidad de k-variante suponen que podemos
disponer de más de una réplica de la variable aleatoria en cada ubicación. Sin embargo,
en econometría espacial, casi invariablemente, tenemos una única observación en cada
ubicación en el espacio. Por lo tanto, los métodos descritos no son aplicables y la única
alternativa para probar la normalidad en un modelo de regresión condicionalmente
especificado es aplicar una de las pruebas mencionadas anteriormente para la normalidad
univariante al componente no sistemático del modelo proporcionado por ui = Yi – E (Yi| Xi = xi).
4.4.2.3 Soluciones al Problema de la No Normalidad
Cuando se rechaza la hipótesis de normalidad sobre la base de una de las pruebas

presentadas en la sección anterior, solo son posibles dos enfoques. La primera consiste
en explotar una de las transformaciones de normalización comunes para modificar los
datos empíricos y reducirlos a la normalidad. La segunda consiste en postular una
distribución diferente para el comportamiento conjunto de X e y (en la especificación
condicional) o para la distribución condicional de la perturbación (en la especificación
estándar de libro de texto). Esta segunda opción es raramente adoptada en la literatura
debido a su mayor complejidad. Estas dos alternativas serán ahora consideradas.
Transformaciones a la Normalidad
La transformada de Box-Cox (Box y Cox, 1964) proporciona una expresión general para una
clase de transformaciones de datos a la normalidad, dada por:
d
* Z ÿ1
Z = (4.130)
d
d siendo un parámetro tal que 0 ÿ La d ÿ 1.

ecuación (4.130) se puede particularizar a los tres casos de la transformación recíproca
(=-1), la transformación
d particular,
de la
raíz
transformación
cuadrada (=0,5)
logarítmica
y la transformación
es una de las
logarítmica
más
d literatura utilizadas
(= 0). en
econométrica En
y la
Spanos (1986) enumera tres razones
d variables principales
aleatorias de su popularidad.
caracterizadas por un sesgoEnpositivo
primer (como
lugar, muchas
gamma,
log-normal o chi-cuadrado) se reducen a la normalidad a través de esta transformación. En
segundo lugar, la transformación logarítmica produce un efecto estabilizador de la varianza
que ayuda a resolver ciertos problemas de heteroscedasticidad. Finalmente, tiene un atractivo
intuitivo en el sentido de que cuantifica conceptos como elasticidades y tasas de crecimiento,
como en el caso del modelo de convergencia ÿ presentado en el Capítulo 1.
Especificaciones alternativas no normales
En algunos casos, se rechaza la hipótesis de normalidad y no es posible simplemente

transformar nuestros datos para producir normalidad. Un caso típico ocurre cuando tenemos
variables dicotómicas o, más generalmente, variables aleatorias discretas. Ciertamente, el
objetivo de este libro no es discutir todas las posibles formulaciones alternativas de un modelo
de regresión cuando no se puede aceptar la normalidad. Simplemente a modo de ejemplo,
ahora discutiremos brevemente el caso del modelo autologístico espacial, ya que este
representa una de las violaciones más comunes de la hipótesis de normalidad que se
encuentran en el análisis econométrico espacial empírico.
Supongamos que estamos considerando n ubicaciones en el espacio y que en cada
ubicación observamos una variable dependiente binaria Y junto con un vector de k co ) T
i el( caso
varía Este xes= X , X que
,...,ocurre,
x yo
yo 1
por ejemplo, cuando tratamos de explicar la presencia o
yo2
ausencia de un agente económico en un lugar o la presencia de una innovación tecnológica

en una región.
En términos generales, los datos binarios pueden analizarse mediante modelos de
regresión logística (Collett, 1991; Cox y Snell, 1989). En este caso, se supone que la variable
Y se distribuye como un Bernoulli y se vuelve a especificar el modelo de regresión en términos
de la transformada logit que conduce al denominado modelo logístico (Agresti, 1990):
ÿ ÿ
logit( ) lni ÿ=
pag i T
ÿ ÿ
=+
ÿ ÿ x ÿ i
(4.131)
pag 1 ÿ
ÿ
pag i ÿ
En la Ecuación (4.131) definimos el término pi como el componente sistemático del modelo de

regresión, expresado en términos de la expectativa condicional:
T
Exp ÿ +x i
pag i
= E (Yi| ) Xi = P (Yi = 1| X i ) = (4.132)
[ +
1 experiencia ÿ
(( + x ) )yo T]
Además, la constante ÿ representa el intercepto general y ÿ es un vector de k

parámetros de regresión.
Si en el SM se puede asumir el muestreo aleatorio independiente, los estimadores de los
parámetros del modelo se pueden derivar a través de la máxima verosimilitud o utilizando métodos
basados en los estadísticos suficientes (ver Aitkin et al., 1989; Collett, 1991; McCullagh y Nelder ,
1989). El marco estándar del enfoque logístico, sin embargo, no es aplicable cuando la hipótesis
del muestreo aleatorio tiene que ser rechazada sobre bases empíricas, como ocurre cuando se
trata de datos espaciales.
El primer intento de extender el modelo logístico a datos espacialmente distribuidos fue

realizado por Besag (1974) quien introdujo el llamado campo aleatorio autologístico ya discutido
en la Sección 2.4.2.3. El campo autologístico de Besag, sin embargo, no incorpora ninguna variable
explicativa.
Una extensión adicional fue propuesta por Arbia y Espa (1996b) al analizar datos arqueológicos
y considera tanto el componente logístico como el autologístico. Fue explotado por Alfò y
Postiglione (2002) en un estudio espacial semiparamétrico.
contexto.
En este caso, el modelo estadístico asume la forma:
ÿ ÿ ÿÿ
Exp y i ÿ + ÿ ÿ yoyj
ÿ
ÿ + xT i
ÿ
ÿ ÿ
= = = ÿ ÿ jn yo ( )
ÿ ÿ ÿÿ ÿ
pr( Yi y Y yj , ÿ X
( ); i ) (4.133)
yo N yo j
ÿ ÿ ÿÿ
+ ÿ + ÿ ÿ + xT
1 experiencia
y
ÿ ÿ
ÿ
yo j i ÿ
ÿ
ÿ
ÿ
ÿ jnÿ yo ( ) ÿÿ ÿ
ÿ = un
donde, además de la notación anterior, representa ÿ Wijparámetro
, ÿ autorregresivo yo
y wij ÿ W son los elementos de la matriz de conectividad habitual.

La ecuación (4.133) se puede reescribir en términos de transformación logit como:
ÿ pr( 1YY ==
i yj N ij , ÿ ( ); x
yo
ÿ
j T
logit( ) lni p ÿ=
ÿ
==
ÿ
= +ÿ ÿ ÿ j y + ij x i (4.134)
1 Pr( 1 YY
i yj N ij , ÿ ( ); X i
ÿ ÿ
jnÿyo
()
ÿ j ÿ
El mayor problema al hacer inferencias estadísticas sobre los parámetros contenidos en la

Ecuación (4.134) radica en el hecho de que, dada la dependencia postulada en esta
modelo, no hay forma cerrada disponible para la probabilidad resultante (Besag, 1974). Para
resolver este problema, Besag (1975) sugirió estimar los parámetros del modelo mediante el
procedimiento de máxima pseudoverosimilitud presentado en la Sección 3.2.3.
En este caso, Strauss e Ikeda (1990) demostraron que las estimaciones de máxima verosimilitud
del vector de parámetros ) son formalmente equivalentes aÿlasÿ estimaciones
( ÿ,ÿ, ÿ verosimilitud
de máxima de los
parámetros de una regresión logística donde una nueva variable retrasada espacialmente ( )
*
ly ÿ y , ij j con ÿ = ÿ introducción
es la
i yo wij ,
ÿÿjn=yo ( )
entre las variables independientes. Este resultado formal se obtiene aplicando un método iterativo
de mínimos cuadrados reponderados (ver Cressie, 1991). Como consecuencia, para estimar los
parámetros del modelo (4.134) en un contexto autologístico logístico, uno puede simplemente usar
las opciones de regresión logística disponibles en los paquetes de computadora estándar.
4.4.3 Heterocedasticidad espacial

Como ya se observó en la Sección 4.2.1.1, el supuesto de constancia de la varianza condicional

(u homocedasticidad) se deriva directamente de la hipótesis de normalidad considerada dentro del
modelo de probabilidad. Por lo tanto, uno no puede simplemente aceptar una hipótesis y rechazar
la otra sin considerar los vínculos intrínsecos entre los dos. Es importante señalar, preliminarmente,
que cuando se trata de muestras espaciales (y, en particular, de datos regionales), la
heteroscedasticidad es un fenómeno común debido a la naturaleza de la recolección de datos. Las
fuentes obvias de varianzas no constantes están relacionadas con las diferentes dimensiones de
las diversas regiones que constituyen el área de estudio, la concentración desigual tanto de
población como de actividad económica, y la alternancia de áreas rurales y urbanas.
En términos de estimaciones de parámetros, la teoría econométrica clásica (Davidson y

MacKinnon, 1993) sugiere que en aquellas circunstancias en las que se viola la hipótesis de PM3,
los estimadores de mínimos cuadrados ordinarios del vector ÿ, bajo supuestos razonables,
mantienen algunas propiedades deseables como la falta de sesgo , consistencia y normalidad
asintótica. Sin embargo, dado que la matriz de covarianza de la varianza asintótica de los
estimadores difiere de la habitual, pueden ser muy ineficientes.
En tales circunstancias, el estimador de mínimos cuadrados generalizados (GLS) podría ser

derivado de la minimización de la ecuación:
Tÿ1
l (V) y( )ÿ(Xÿ
ÿ =) y ÿ Xÿ (4.135)
donde V es la matriz de varianzas y autocovarianzas espaciales del campo aleatorio asumido en el

modelo de probabilidad.
Si consideramos, en aras de la simplicidad, que la hipótesis de independencia aún

puede aceptarse en el modelo de muestreo, dicha matriz es diagonal y puede escribirse
como:
2
ÿÿ 1 0 ÿ
ÿ 2 ÿ
0 ÿ 2 2
V = ÿ ÿ
= ÿ ÿ (4.136)
ÿ
0 ÿ
ÿ
2 ÿ
ÿ
ÿ
0 ÿ norte
ÿ
ÿ
De la minimización de l(ÿ) obtenemos el estimador:
T ÿ1 T ÿ1 T ÿ1 T ÿ1
ÿ=(XV X)X V y=(X ÿ X)X ÿ y (4.137)
y el problema a resolver se convierte así en la propia definición de la matriz V

o, en otras palabras, la especificación de una forma particular para la cedasticidad no homo del
proceso de generación de datos.
En efecto, si se conociera a priori la matriz V , no habría necesidad de utilizar otros estimadores
que no sean MCO (o, equivalentemente, Máxima Verosimilitud). De hecho, en este caso, la matriz de
varianzas y autocovarianzas espaciales se puede descomponer mediante la descomposición espectral:
ÿ1
ÿ H HT = (4.138)
Si ahora transformamos el vector y y la matriz X de acuerdo con la siguiente expresión
*
y = Hy (4.139)
*
X = HX (4.140)
el modelo estadístico se puede volver a especificar como
* * *
y X=ÿ tu + (4.141)
y el vector ÿ estimado con MCO, obteniendo:

* * *T *
= ( yT
ÿ XXX ) (4.142)
Al sustituir las Ecuaciones (4.139) y (4.140) en la Ecuación (4.142) se obtiene la Ecuación (4.137).
Por otro lado, si V es desconocido (como ocurre en la mayoría de los casos empíricos en aplicaciones
económicas) necesitamos estimarlo sobre la base de nuestra muestra.
White (1980) propuso una salida a este problema al sugerir que, para fines inferenciales,
no necesitamos una estimación de la matriz
ˆ V, sino una estimación de la matriz de
T
varianza-covarianza de ÿ , dado por el producto X VX tent . Una consistencia
estimador de esta cantidad es proporcionado por:
norte
T
1 2Posada
ÿ=
i
tu XX (4.143)
n1
y no requiere que la función de cedasticidad se especifique explícitamente. Este

estimador se llama Estimador de matriz de covarianza consistente con heterocedasticidad
(HCCME) y se puede demostrar que es asintóticamente justificable (ver Davidson y
MacKinnon, 1993 para más detalles).
4.4.3.2 Pruebas de heterocedasticidad espacial
Cuando se trata de regresiones espaciales, la situación es mucho más complicada que la

descrita anteriormente. De hecho, cuando se trata de datos espaciales, es puramente
académico discutir el caso de la violación de la condición de homoscedasticidad por
separado del de la hipótesis de muestreo independiente, ya que es probable que ambos
ocurran en la práctica (por los vínculos entre la dependencia espacial y la dependencia
espacial). heterocedasticidad, véase Kelejian y Robinson, 2004). Anselin (1987a) mostró
que, cuando se viola la hipótesis de independencia espacial, todas las pruebas
tradicionales de homocedasticidad se distorsionan a favor de la hipótesis nula o alternativa
y su poder se reduce significativamente.
De hecho, no es concebible probar la homoscedasticidad por separado de la
independencia espacial. Si relajamos la hipótesis del muestreo independiente, todas las
pruebas estadísticas propuestas en la literatura econométrica sobre la hipótesis de la
homocedasticidad del PM3 pueden adaptarse al caso de los modelos econométricos
espaciales. Algunos de ellos ahora serán revisados aquí.
Históricamente, la primera prueba de heteroscedasticidad fue la propuesta por
Goldfeld y Quandt (1965). Los autores sugirieron comenzar por ordenar los datos de
acuerdo con los valores de alguna variable que pueda constituir la base del
comportamiento heterocedástico. En un contexto espacial, las opciones obvias para
estas variables de orden son las dimensiones de la región (en términos de su superficie,
su población u otros indicadores dimensionales) donde se observan las variables, así
como sus coordenadas espaciales. En un segundo paso, el procedimiento se desarrolla
dividiendo la muestra completa en tres porciones de dimensiones,
2 ( n = n1respectivamente,
y 1n3 + n2 + n3 ) y n,n
estimando el modelo de regresión usando solo la primera y la última conjuntos de
observaciones. Finalmente, se calculan los residuos de la regresión y, con base en ellos,
se calcula el estadístico de prueba GQ como la razón:
RSS3 nk1 ÿ
GQ = (4.144)
RSS1 nk3 ÿ
con RSS1 y RSS3 denotando la suma residual de cuadrados basada en la

primera y última porción de la muestra, respectivamente. El estadístico GQ bajo
la hipótesis nula de homocedasticidad se distribuye como . Esta
;( F1 n ÿ kn ÿ kdistribución
)
3
ción es exacta en el caso de que podamos aceptar la normalidad y se cumple asintóticamente en el caso
de que la normalidad deba ser rechazada.
Un segundo procedimiento de prueba posible es la prueba de White (White, 1980).
Este autor sugiere que podemos usar el estimador consistente de la matriz de varianza-
covarianza de las estimaciones (reportado en la Ecuación (4.143)) para construir una
prueba de desviación de la homocedasticidad. Aunque la prueba de White es consistente
con respecto a una amplia gama de alternativas paramétricas, puede no ser muy poderosa
en muestras finitas (Davidson y MacKinnon, 1993).
Las regresiones artificiales ofrecen una tercera opción para probar la heteroscedasticidad
en la regresión lineal. Presentemos este enfoque refiriéndonos a la especificación de libro
de texto estándar del modelo de regresión lineal presentado en la Sección 4.2.2, donde
tenemos:
T
yi = ÿx +i tu i
uf X
(tuÿi N(0,
i
ÿ2 ) ) (4.145)
o equivalente,
mi(tú)2 Xÿ2 _
= (4.146)
i
Consideremos además la Ecuación (4.146) como nuestra hipótesis nula y contrastémosla

con la alternativa implícitamente expresada como:
2
E(uXi ) = h (ÿ + ÿQ
)eso
(4.147)
donde Qi es un vector de variables predeterminadas exógenamente (por ejemplo, la

dimensión regional o las coordenadas espaciales) y ÿ parámetros
ÿ hipótesis desconocidos. La
de la homoscedasticidad
puede entonces probarse utilizando la hipótesis paramétrica de que ÿ = 0 a través de
un estadístico F ordinario . Por ejemplo, (Davidson y MacKinnon, 1993) proporcionan
una hipótesis alternativa explícita:
2 T ÿ
i ) = ÿX (
E(uX ) (4.148)
ÿ
i
De manera similar, también es posible derivar una prueba del multiplicador de

Lagrange bajo el supuesto de normalidad siguiendo el enfoque introducido
originalmente por God frey (1978) y por Breusch y Pagan (1979).
En particular, Breusch y Pagan (1979) propusieron una forma genérica de homoske

dasticity expresada por la siguiente ecuación
2
mi (tú) X= ÿ X +1 ÿ X + +... ÿ (4.149)
i 1 yo 2 2 yo k Xki
con ÿT ÿ(ÿ1, ÿ2,... ÿk) un conjunto de constantes, X1 el término constante de la regresión y los
regresores. En el caso de la homocedasticidad, obviamente, tenemos: X Xk ,..., 2
ÿ = ... = ÿ 0k= (4.150)

H0 : 2
de modo que, bajo H0 tenemos ÿ2i = ÿ1 = constante.

En estas circunstancias, las estadísticas de la prueba de Breusch-Pagan se pueden derivar
usando la expresión general de la prueba del multiplicador de Lagrange (Sección 3.4). Siguiendo
a Anselin (1988), esto podría expresarse como:
T
1ÿ ÿ ÿ norte norte
Tÿÿ
norte
ÿ
PA = ÿ ÿÿ ÿ ÿ x yo F i ÿ xxii
_ xii _F ÿ (4.151)
2 ÿ i =1 ÿ
ÿ
ÿ ÿÿ
i =1 ÿÿ
ÿÿ ÿÿ
i =1 ÿ
ÿ
ˆ ˆ
ÿ tu ˆ ˆ
norte
ˆ
con f i
=ÿ
ÿ î 1;ÿ (ÿ uy
i= ÿ ÿ i x
T
i )y ÿ
2
2 tu .
i
ÿÿ ÿ ÿ= =i 1
Bajo la hipótesis nula de varianza condicional constante, el estadístico de prueba contenido

en la Ecuación (4.151) se distribuye como una ÿ2 con k-1 grados de libertad.
No obstante, Anselin (1987b) demostró que, en presencia de una dependencia espacial
positiva en el modelo de muestreo, la prueba de Breusch y Pagan (4.151) presenta una
distorsión hacia la hipótesis alternativa de heteroscedasticidad, mientras que la prueba de
White presentada anteriormente muestra una distorsión a favor de la hipótesis nula de
homocedasticidad.
Sobre estas bases, Anselin (1988) propuso considerar un estadístico de prueba conjunto
que considere simultáneamente tanto la hipótesis de homoscedasticidad como la de
independencia. Como ya hemos visto (Ecuación (4.54)), la prueba del multiplicador de Lagrange
para la hipótesis de independencia espacial asume la expresión:
LMT =
ÿ ÿyÿ ÿ
( )(XW)ÿ
yÿX T
ÿ
2
j
ÿ
T
ÿ
(4.152)
ÿ ÿ
con J =estadísticas
tr + dure
[(Wsugerido
Wcontenidas
)W] Tpor Anselin
en
y se
lasdistribuye
Ecuaciones
(1987b)asintóticamente
considera
(4.151) la
y (4.152)
suma
como
deque
ÿ2
lasconducen
(1).
dosEl
pruebas
procedimiento
a la prueba
conjunta de heteroske dasticidad espacial e independencia expresada como:
2
T 1 T
ÿ ÿy ÿÿ x W
ÿ
T T
( )( ) ÿ ÿ y ÿ x
norte norte norte
1 ÿ
ÿ
ÿ ÿ ÿ ÿ
T
SHI xii _F ÿ ÿ
xxii _
ÿ ÿ xii _F +ÿ ÿ (4.153)
= ÿ2ÿÿÿ=
ÿ
2
i =1 ÿ ÿ i=1 ÿ ÿ i 1 ÿ ÿ j
ÿ
ÿ
ÿ
ÿ
Si se puede suponer que BP y LMT se distribuyen independientemente, entonces SHI es una

suma de dos ÿ2 independientes y, por lo tanto, también se distribuye como un ÿ2 con k grados
de libertad. La estrategia sugerida por Anselin (1988) es que, una vez que se rechazan las
hipótesis nulas conjuntas de no independencia espacial y no heteroscedasticidad, se podrían
probar las dos hipótesis por separado.
Hay muchos otros estadísticos de prueba propuestos en la literatura para probar la hipótesis
de la heterocedasticidad, incluida la célebre prueba de Glejser (Glejser, 1969) y los propuestos
por Szroeter (1978), Harrison y McCabe (1979), Ali y Giacotto (1984) Evans y King (1988) y
Newey y Powell (1987). En principio, todos estos pueden adaptarse para probar la independencia
espacial y la homocedasticidad espacial de forma conjunta.
4.4.3.3 Solución al Problema de la Heterocedasticidad Espacial
Cuando se rechaza la hipótesis de la varianza condicional no constante sobre la base de uno de

los procedimientos de prueba anteriores, el problema a resolver pasa a ser el de encontrar
alternativas al modelo de regresión para adaptarse a esta situación.
Debido a los vínculos entre los dos problemas, las soluciones estándar al problema de
heterocedasticidad están estrechamente relacionadas con las de no normalidad ya discutidas.
En particular, se podrían considerar un par de alternativas.
La primera alternativa consiste en aplicar una transformación de normalización apropiada
del tipo discutido en la Sección 4.4.2.3. Como se señaló anteriormente, esto tiene el efecto
secundario de estabilizar la varianza. Las transformaciones inversa y logarítmica son ejemplos
de este tipo.
Una segunda alternativa es la de postular un campo aleatorio diferente, no normal, en el
modelo de probabilidad que capte mejor las peculiaridades de los datos empíricos.
Si seguimos esta estrategia, el siguiente paso es derivar una formulación explícita para el valor
esperado condicional E(Yi | Xi = xi) y la varianza condicional Var(Yi | Xi
= xi) y sustituya estas expresiones en los supuestos de PM2 y PM3 en el modelo de probabilidad.
Debe observarse, sin embargo, que los resultados en esta dirección hasta ahora han sido muy
limitados en la literatura debido a la complejidad de especificar campos aleatorios multivariados
(ya discutidos en el Capítulo 2) y debido a los problemas para derivar expresiones explícitas para
el condicional. media y varianza cuando nos alejamos del supuesto de normalidad.
4.4.4 Invariancia espacial de los parámetros
4.4.4.1 Invariancia espacial de los parámetros de prueba
Una suposición importante que se mantiene detrás del modelo de regresión lineal es que el
vector de los parámetros ÿ = (ÿ, ÿ2 ) es constante con respecto a las observaciones. En un
contexto espacial, esto implica la constancia de los parámetros cuando cambia la ubicación.
Claramente, esta hipótesis ocurre rara vez en casos prácticos: típicamente, diferentes sitios en
el espacio reaccionan de manera diferente a estímulos similares.
La presente discusión se limitará a una forma particular de violación de esta suposición

que es más probable que ocurra en casos empíricos: es decir, un cambio en los parámetros
debido a cambios estructurales. Para otras formas de violación de la hipótesis de la invariancia
espacial de los parámetros, véase Anselin (1988).
Una situación que es particularmente común en el análisis econométrico de datos
espaciales es el caso en el que el modelo asume diferentes regímenes en diferentes
regiones del espacio. En particular, en aras de la simplicidad, consideraremos el caso
en el que solo se produce un cambio estructural a lo largo de una línea límite que
delimita dos regiones del espacio S, digamos S1 y S2, tales que S1 ÿ S2 = S.
Extensiones a más de dos regímenes son sencillos. Supongamos además que el
número total de ubicaciones consideradas es n y que las dos regiones están formadas por n1 y n2
.
ubicaciones respectivamente de modo que n1 + n2 = n
En este caso, el modelo estadístico (GM) se puede especificar a través de las ecuaciones:
T
yo y= ÿ1 X +i tu
1, yo
yo ÿ S1 (4.154)
para la primera región, y
T
yo y= ÿ2 X +i tu
2, yo
yo ÿ S2 (4.155)
para el segundo. En las Ecuaciones (4.154) y (4.155) los conjuntos S se definen como S1
={ }1 1,2,...,n
, y S2 = { } n1
y +1,n1
los vectores
+ 2,...,n
de los parámetros de ( ) 2
interés como ÿ1ÿ ÿ ,1 ÿ 1 y ÿ2ÿ ÿ(, 2 2ÿ )2. En una notación matricial más compacta,
Las ecuaciones (4.154) y (4.155) se pueden reescribir como:
y1 = X1ÿ1 + u1 yo ÿ S1 (4.156)
y2 = X2ÿ2 + u2 yo ÿ S2 (4.157)
En este caso podemos postular el siguiente modelo de probabilidad:
ÿy X ÿ ÿ ÿ X ÿ ÿ ÿ 2 yo 0 ÿÿ
1 1 11 1
ÿ ÿ
ÿMVN ; ÿ
norte
1 ÿ
(4.158)
T 2
ÿ ÿ
X ÿ 0
ÿ
ÿy 2 2 ÿ
ÿ ÿ ÿÿ ÿÿ
Xÿ yo
ÿ ÿ
ÿÿ 2 2 ÿ ÿ
ÿ 2 norte
2 ÿÿ ÿ
donde, una
no matriz unitaria de dimensión ni - por - ni ntal- por
marco,
no
- nhay
(imatriz
la=hipótesis
cambios
1,2),
deyceros.
0 an
de Ique
En
es
estructurales
1 2 puede especificarse mediante el sistema de hipótesis:
H :ÿ = ÿ1 2
0
contra
H :1ÿ ÿ ÿ1 2
En el contexto del análisis de series de tiempo, Chow (1960) propuso una prueba basada en la
estadística:
1 nk 2
CH = SQRT SQR SQR 2 ÿ
ÿ ÿ
(4.159)
SQR SQR 2
1 + k
donde SQRT , SQR1 y SQR2 representan la suma total de cuadrados, la suma de cuadrados se
refiere solo a iÿS1 y la suma de cuadrados se refiere a iÿS2 respectivamente. Esta cantidad se
distribuye bajo H0 como una Fisher-F con k y (n-2k) grados de libertad.
Consigliere (1981) y Corsi et al. (1982) demostraron que, si se rechaza la hipótesis de

dependencia en el modelo de muestreo, la prueba de Chow puede conducir a resultados inválidos.
Ante esta situación, Anselin (1988) propuso utilizar los siguientes estadísticos de prueba basados en
la prueba asintótica de Wald:
T T
EN = e0ve ve1 ve 1
ÿ ÿ
(4.160)
ÿ
0 1 1
eˆ son las estimaciones de máxima verosimilitud de los residuos bajo el donde eˆ y

0 1
hipótesis nula y bajo la hipótesis alternativa respectivamente, y V la matriz de varianza-covarianza
del campo. El estadístico AT se distribuye como ÿ2 con k
grados de libertad, siendo k la dimensión del vector ÿ.
En particular, si consideramos el enfoque basado en la autocorrelación (Sección 4.3.4) y la
hipótesis adicional de que el componente no sistemático sigue un campo SAR, sabemos que la
matriz V-1 asume la forma:
ˆ2
V =1 yoÿ ÿBI
ÿ
( ÿB) )T( (4.161)
(ver Sección 2.4.3.1) y, en consecuencia, el estadístico de prueba se puede escribir como:
[mi (yo - BI )- segundo

T
0
( )mi -] mi[yo (- BI - segundo
T
0
) ( ) mi
T
1
T
1
]
ˆ2 (4.162)
ÿ
ˆ2
con ÿ la estimación de máxima verosimilitud de la varianza del campo u.
4.4.4.2 Estimación en presencia de cambios estructurales
Por analogía con el análisis de series de tiempo, para estimar los cambios estructurales podemos utilizar
el procedimiento de prueba propuesto por Quandt (1958).
Consideremos primero la formulación presentada en la sección anterior y permítasenos
introducir la siguiente notación:
ÿX ÿ0 ÿ mi
* = ÿy 1
ÿ ÿ ÿ ÿ ÿ
x ;* = 1 * = 1 ; mi
* = 1 (4.163)
y ÿ ÿ ÿ ÿ
ÿ ÿ ÿ ÿ ÿ
0 X mi
ÿy 2ÿ ÿ 2ÿ ÿÿ 2ÿ ÿ 2ÿ
Con estas definiciones, podemos escribir el modelo estadístico de forma compacta como:
* ** *
y = X ÿ + tu (4.164)
Si consideramos el enfoque basado en el modelo de autocorrelación espacial residual, entonces el

modelo se complementa con la ecuación:
* **
mi = segundo mi + tu (4.165)
con u un ruido blanco espacial con su matriz de varianza-covarianza dada por:
2
yo 0
ÿ = 1 norte
1
tu
ÿ ÿ0 2
yo (4.166)
2 norte
2
siendo B* una matriz de conectividad que también puede asumir una estructura de dos regímenes.
Por ejemplo, podemos suponer
* ÿ W 10 ÿ
B = ÿ
1
ÿ
(4.167)
ÿ ÿ ÿ 0 vatios2 2ÿ
siendo W1 y W2 las matrices de contigüidad referidas, al conjunto de localizaciones incluidas en S1 y

S2 respectivamente.
La función logarítmica de verosimilitud del modelo así especificado asume la forma
yo
(ÿ 2 ,ÿ 2 , ÿ ,ÿ
*
, ÿ X; ) =
1 2 1 2
(4.168)
=ÿ
n1
en ÿ 2 ÿ
nº
2 en ÿ ÿ BI
2 + ÿ en * *
)T(y X ÿ
1 ( )( y X ÿ IB ÿ IB
ÿ ** ÿ
)
* T ÿ
1
(
ÿ * * ÿ **
)
2 1 2 2 2 tu
La ecuación (4.168) se puede emplear para derivar las estimaciones de máxima verosimilitud siguiendo
los procedimientos habituales.
5 Modelos de convergencia ÿ italianos y europeos

revisado
5.1 Introducción
En la Sección 1.3 presentamos dos conjuntos de datos regionales europeos que se

utilizaron de manera informal para ilustrar, de manera meramente intuitiva, algunos de los
problemas que pueden surgir en el modelado de regresión lineal de datos económicos
espaciales. Toda la gama de problemas que surgen en el modelado económico espacial ya
se ha discutido extensamente en los capítulos anteriores y se ha introducido una serie de
técnicas que definen los elementos básicos sobre los cuales se puede fundamentar un
análisis econométrico espacial formal. En esta etapa, por lo tanto, es útil volver al mismo
conjunto de datos y volver a analizarlos a la luz del enfoque presentado aquí. Esto nos
permitirá ver las técnicas econométricas espaciales en funcionamiento y discutir, aunque
sea brevemente, algunos de los problemas de interpretación que pueden surgir en este
contexto. Tal es el objetivo del presente capítulo.
Debe señalarse desde un principio que los paquetes estadísticos y econométricos
estándar no contienen las rutinas necesarias para implementar todas las metodologías
descritas en el Capítulo 4. Este hecho limita fuertemente la posibilidad de aplicar técnicas
econométricas espaciales en la práctica y el investigador interesado puede solo confíe en
los pocos softwares existentes que están dedicados a este tema específico. Como
consecuencia, este capítulo presentará ejemplos de aplicaciones que se limitan a los
procedimientos de estimación de modelos y pruebas de hipótesis compatibles con el
software existente. En particular, los ejemplos dados en este capítulo se desarrollan
haciendo uso del paquete SpaceStat (Anselin, 1992a; 1992b). Discutiremos los aspectos
relacionados con el software para el análisis econométrico espacial más a fondo en el
Apéndice.
5.2 Un análisis econométrico espacial del modelo de

convergencia ÿ de las provincias italianas
5.2.1 Violación de las hipótesis del modelo de muestreo
Comencemos revisando los resultados del análisis de convergencia ÿ que realizamos en la

Sección 1.3.2 al examinar la dinámica de crecimiento a largo plazo de las 92 provincias
italianas durante los años 1950 a 1999. Un análisis del diagnóstico de regresión nos llevó a
aceptar las hipótesis de normalidad y homocedasticidad, pero cuestionamos la
136 5 Modelos de convergencia ÿ italianos y europeos revisados
hipótesis de independencia de los residuos de la regresión OLS sobre la base de la

inspección visual de la Figura 1.7. De hecho, notamos que los residuos estaban dispuestos
en ese mapa con una especie de continuidad espacial y mostraban una disminución gradual
de residuos grandes positivos a negativos. También notamos que el modelo tenía la
tendencia a sobrestimar las tasas de crecimiento en algunas porciones definidas del espacio
geográfico ya subestimarlas en otras, indicando así que faltaba en el análisis algún factor
explicativo de la diferenciación geográfica.
Ahora estamos en posición de enfrentar el problema de una manera más formal y probar
la hipótesis nula de independencia espacial. Para hacerlo, emplearemos algunas de las
pruebas de dependencia espacial presentadas en la Sección 4.3 cuando discutamos las
violaciones del supuesto del modelo de muestreo. En particular, en el presente contexto se
considerarán tres pruebas diferentes de dependencia espacial. La primera es la prueba I de
Moran de propósito general que (como se señaló en la Sección 4.3.2) no admite una hipótesis
alternativa explícita para contrastar la nula. Los otros dos son pruebas de multiplicadores de
Lagrange (LMT) que consideran los modelos de “retraso espacial” y “error espacial” como
alternativas a la hipótesis de independencia espacial. Al calcular estas pruebas, y en todos
los análisis posteriores, hemos supuesto que la topología del área puede describirse
mediante una matriz de conectividad construida de acuerdo con la estructura de vecindario
simple basada en la contigüidad (consulte la Definición 4). También se probaron otras
definiciones de vecindario y los resultados no cambiaron sustancialmente.
Los resultados de los cálculos de las pruebas de dependencia espacial se muestran en
la Tabla 5.1. Todas las pruebas conducen al rechazo de la hipótesis nula. Tanto el LMT
(probado contra la alternativa de error espacial) como el LMT (probado contra la alternativa
de retraso espacial) presentan valores muy altos y ambos son altamente significativos.
Estos resultados resaltan el hecho de que el modelo original, que ha sido el caballo de
batalla de muchas investigaciones empíricas anteriores, adolece (al menos en el caso
particular examinado aquí) de una especificación errónea grave debido a la dependencia
espacial omitida.
Sería útil intentar algunas especificaciones alternativas para eliminar el problema de la
dependencia espacial. Desafortunadamente, el software disponible (en nuestro caso, el
paquete SpaceStat) solo permite el modelo de error espacial y el modelo de retraso espacial
como especificaciones alternativas al modelo de regresión lineal clásico. Los parámetros se
estiman a través de los métodos de máxima verosimilitud utilizando la definición de
pseudoverosimilitud y el método de maximización no lineal aproximada discutidos en las
Secciones 4.3.4.2 y 4.3.5.1.
Tabla 5.1. Pruebas de dependencia espacial para los residuos OLS de la convergencia ÿ en las 92 provincias italianas
(1950-1999) (las cifras entre paréntesis se refieren a los valores de p).
7.226
I de Moran
(0,000)
LMT (modelo de error espacial 45,866
como hipótesis alternativa) (0,000)

LMT (modelo de retraso espacial 15,959
como hipótesis alternativa) (0,000)

5.2 Análisis del modelo de convergencia ÿ de las provincias italianas 137
Los resultados de la estimación y de los procedimientos de prueba de hipótesis se reportan

en la Tabla 5.2. Todos los parámetros en ambas especificaciones son altamente
significativos. La tabla revela un gran cambio en el valor estimado del parámetro ÿ y, en
consecuencia, en la velocidad de convergencia y evaluación de la vida media . De hecho,
en el modelo lineal clásico considerado en la Sección 1.3, la velocidad de convergencia se
estimó en 0.047 (ver Tabla 1.2) mientras que ahora es 0.0187 en el modelo de error espacial
y 0.0181 en el modelo de retraso espacial . Esto, a su vez, da como resultado una vida
media más prolongada. En la Tabla 1.2 se estimó en 14,74 años y ahora es igual a 36 años en el error espacial
Tabla 5.2. Convergencia del ingreso per cápita en las 92 provincias italianas (1950-1999) – Modelos de dependencia espacial –
Estimaciones ML (los números entre paréntesis se refieren a los valores p).
Modelo de error espacial Modelo de retraso espacial
0.122 0.110
ÿ (Constante)
(0.046) (0.003)
-0.608 -0.5955
ÿ
(0.000) (0.000)
Velocidad de convergencia (*) 0.0187 00181
Media vida (**) 36.87 37.95
0,437
ÿ (ver Ecuación (4.30))
(0,000)
0,265
(0,001)
Bondad de ajuste
Criterio de Schwartz -40.326 -47.061
1. Heterocedasticidad espacial
1,107 0,682
(0,575) (0,711)
2. Dependencia espacial
10,973
LRT (modelo de error espacial frente a OLS)
(0,000)
0,307
LMT (modelo de retraso espacial como hipótesis alternativa)
(0,578)
8.759
LRT (modelo de retraso espacial frente a OLS)
(0.003)
2.167
LMT (modelo de error espacial como hipótesis alternativa)
(0.141)
( ÿ ) ; (**) Vida media =

en 1 + = en (2) .
vida media ÿ
T b
modelo y a 37 años en el modelo de rezago espacial . Cabe señalar, sin embargo, que en esta
nueva especificación no podemos asignar a los parámetros de velocidad y vida media exactamente
el mismo significado que tenían en la especificación original de Barro y Sala-i-Martin. Sobre la
interpretación de los parámetros en diferentes modelos de convergencia regional ver Arbia et al.
(2005).
Una segunda característica que surge de la Tabla 5.2 es que las nuevas especificaciones no
inducen problemas desde el punto de vista de la heteroscedasticidad: las pruebas de Breusch-
Pagan no son significativas en ambos casos.
Desde el punto de vista de la dependencia espacial, podemos observar una reducción general
del problema. De hecho, según las pruebas del multiplicador de Lagrange, los residuos ya no
muestran un patrón espacial (los valores p ahora son 0,578 y 0,141, respectivamente). Sin
embargo, la prueba de razón de verosimilitud aún reporta valores significativos, lo que muestra
que todavía podría haber un componente de dependencia espacial en los residuos empíricos de
los dos modelos de regresión.
5.2.2 Violación de las hipótesis del modelo de probabilidad

Los resultados de regresión informados en la sección anterior han supuesto homogeneidad de
varianzas en el espacio y constancia del valor de los parámetros en las diversas regiones
geográficas. En esta sección, consideraremos la violación de la hipótesis de parámetros
constantes y probaremos si, en el área de estudio en su conjunto, es posible distinguir diferenciales
en la velocidad de convergencia que puedan conducir a la identificación de regímenes espaciales.
El tema de los regímenes espaciales es un aspecto muy importante y a menudo descuidado en
los estudios empíricos, aunque se enfatiza fuertemente en la literatura del “club de
convergencia” (Quah, 1996a, 1996b; 1997; Baumont et al., 2003). La idea de los clubes de
convergencia es que las regiones dentro de un país o área integrada (como la Unión Europea)
puedan experimentar no tanto un proceso de convergencia global, sino una convergencia por
“clubes”, teniendo las condiciones iniciales en común. Las condiciones iniciales, a su vez, pueden
estar fuertemente correlacionadas con peculiaridades geográficas (por ejemplo, centro-periferia o
dicotomía Norte-Sur) o socioeconómicas (como capital humano, tasa de desempleo, infraestructura
pública, actividad de I+D o profundización financiera). La hipótesis del club de convergencia tiene
una implicación inequívoca en términos de la distribución del PIB per cápita: si los parámetros
que caracterizan a cada régimen son diferentes, un proceso de umbral debería ser consistente
con una distribución bimodal de los ingresos per cápita. Se sabe, a partir de estudios previos, que
los datos relativos al PIB per cápita de las provincias italianas presentan tal bimodalidad (ver Arbia
et al. 2002, 2003; Arbia y Basile, 2005 entre otros). Esto implica que la suposición de una relación
fija entre la tasa de crecimiento regional y los ingresos per cápita iniciales para el conjunto de
datos en su conjunto es insostenible. Más bien, la heterogeneidad puede estar presente, en forma
de diferentes intersecciones y/o pendientes en la ecuación de regresión relacionada con los
subconjuntos de datos.
Las pruebas empíricas de convergencia ÿ entre las provincias italianas a menudo toman en
cuenta la posibilidad de diferentes intersecciones al incluir variables ficticias en la especificación
de la regresión, típicamente, variables que indican si la región o la provincia pertenece al Sur o
al Norte-Centro ( véase, por ejemplo, Fabiani y Pellegrini, 1997). En términos generales, sin
embargo, no consideran ninguna de las especificaciones de régimen espacial discutidas en la
Sección 4.4.4.
Aquí se desea contrastar la hipótesis de la existencia de dos regímenes espaciales distintos:
el primero correspondiente a la zona Centro-Norte y el segundo a la zona sur del país. Las
provincias que caen dentro de las dos subáreas se muestran en la Figura 5.1. Se refieren al
programa político específico (conocido en Italia como Cassa del Mezzogiorno) que proporcionó
a las regiones del sur de Italia recursos financieros adicionales durante el período considerado.
Para probar la hipótesis de la existencia de dos velocidades diferentes de convergencia en

las 2 subáreas, consideramos una prueba de Chow de regímenes espaciales (ver Ecuación
(4.159) en la Sección 4.4.4.1). Los resultados de dicha prueba se informan en la Tabla 5.3. Las
pruebas son altamente significativas en lo que respecta tanto al error espacial como a la
especificación del retraso espacial . Conducen, en ambos casos, a rechazar la hipótesis de los
valores de los parámetros constantes.
Provincias italianas
Norte
Sud
Figura 5.1. Clasificación de las 92 provincias italianas dentro de los dos regímenes geográficos.
Tabla 5.3. Convergencia de la renta per cápita en las 92 provincias italianas (1950-1999). Invariancia espacial de los parámetros.
Modelo de error espacial Modelo de retraso

42.623 (0.000) espacial 71.273 (0.000)
prueba de comida
Tabla 5.4. Convergencia de la renta per cápita en las 92 provincias italianas (1950-1999). Modelos de dependencia espacial con
regímenes espaciales (estimaciones ML) (los números entre paréntesis se refieren a los valores p).
Modelo de error espacial Modelo de retraso
ÿ (Constante) 0,146 (0,014) -0,6172 espacial 0,111 (0,003)

Norte-Centro ÿ (0,000) -0,6004 (0,000)
Norte-Centro
Velocidad de convergencia (*) 0.019248 0.01834
Vida media 35.84 37.61
(**) ÿ (Constante) -0,551 -0,563
Mezzogiorno ÿ (0,000) (0,000)

-0,5899 -0,585
Mezzogiorno (0,000) (0,000)
Media vida (**) 38.69 39.22
0,421
(0,000)
0,259
(0,002)
Bondad de ajuste
0,977 0,504
(0,322) (0,477)
12,961
LRT (modelo de error espacial frente a OLS)
(0,000)
LMT (modelo de retraso espacial como hipótesis 0,249
alternativa) (0,617)
8.159
Prueba LRT (modelo de retraso espacial frente a OLS)
(0.004)
LMT (modelo de error espacial como hipótesis 2.183
alternativa) (0.139)
(
en 1 + ÿ ) ; (**) Vida media =
vida media
ÿ
= en (2) .
T b
Habiendo determinado la existencia de múltiples regímenes, ahora podemos estimar las

dos especificaciones alternativas del modelo de regresión al considerar dos regímenes
distintos en las dos particiones que se muestran en la figura 5.1. Permitiremos el parame
ters ÿ y ÿ a cambiar en los dos regímenes, como se postula en la Ecuación (4.164).
En contraste, consideraremos los efectos espaciales incorporados por los dos modelos
=
alternativos en las dos subregiones como constantes y por lo tanto asumiremos
ÿ 1en 2ÿ
Ecuación (4.167). Los resultados del análisis se muestran en la Tabla 5.4.
Podemos ver en la tabla que, en el modelo de error espacial , la velocidad de
convergencia (estimada originalmente con un valor de 0,0187) ahora se estima en
0,0192 en el Centro-Norte y en 0,0178 en el Mezzogiorno. En consecuencia, el
tiempo de vida media (originalmente 36,87 años para todo el país) ahora se estima
en 35,84 años en el Centro-Norte y en 38,69 años en el Sur. Por lo tanto, es evidente
que la convergencia fue más rápida en el Centro-Norte que en el Sur durante el
período considerado.
El mismo tipo de resultado es evidente cuando se exploran los efectos de los dos
regímenes en el modelo de rezago espacial . Aquí vemos que la velocidad de
convergencia (originalmente estimada en 0,0181) ahora se estima en 0,0183 en el
Centro-Norte y en 0,0175 en el Mezzogiorno. En consecuencia, el tiempo de vida
media (37,95 años para todo el país), se estima ahora en 37,61 años en el Centro-
Norte y en 39,22 años en el Sur.
En conclusión, los resultados informados en esta sección brindan una fuerte evidencia de los
efectos espaciales en el modelo de convergencia. Estos efectos tienen algunas implicaciones
importantes para la velocidad de convergencia estimada. En particular, nuestros resultados
sugieren claramente que, en presencia de una autocorrelación espacial positiva en los residuos
de OLS, las tasas de convergencia estimadas a través del modelo de regresión no espacial
tradicional pueden estar fuertemente sesgadas debido al hecho de que los efectos indirectos
regionales permiten regiones crezcan más rápido o más lento de lo que cabría esperar.
5.3 Un análisis econométrico espacial del modelo de

convergencia ÿ de las regiones europeas1
5.3.1 Violación de las hipótesis del modelo de muestreo
Reconsideremos ahora el proceso de convergencia ÿ de las 129 regiones europeas

NUTS-2 ya consideradas en la Sección 1.3.3 para el período 1980-1996. Como en el
caso de las provincias italianas discutidas anteriormente, cuando consideramos las
regiones europeas NUTS-2 en la Sección 1.3.3, notamos algunas indicaciones de
dependencia espacial entre los residuos de la regresión espacial OLS a (ver Figura
1.12). En esta sección, por lo tanto, intentaremos proporcionar fundamentos más
formales para la impresión visual que allí se reporta. Los resultados del análisis de dependencia espacial del OLS
1
Los resultados empíricos presentados aquí se basan en parte en Postiglione et. Alabama. (2002).
Tabla 5.5. Pruebas de dependencia espacial para los residuos OLS de la convergencia ÿ en las 129 regiones europeas
NUTS-2 (1950 – 1999). (Las cifras entre paréntesis se refieren a los valores p).
5.055
I de Moran
(0.000)
22.235
(0.000)
14.757
(0.000)
los residuos se reportan en la Tabla 5.5. Aquí, nuevamente, examinamos la prueba I de Moran
junto con dos versiones de la prueba del multiplicador de Lagrange, considerando el rezago
espacial y el modelo de error espacial como alternativas a la hipótesis de independencia espacial.
En el cálculo de la prueba (y en todos los análisis subsiguientes) consideramos la topología de
datos espaciales incorporada en una simple definición de pesos basada en la contigüidad.
Nuevamente, las definiciones más sofisticadas de vecindario no dieron lugar a diferencias
significativas.
Como se desprende de la tabla 5.5, las tres pruebas son altamente significativas y conducen
al rechazo de la hipótesis de independencia entre los residuos. Esta conclusión nos lleva a tratar
de eliminar los efectos perturbadores causados por la dependencia espacial usando uno de los
modelos de regresión espacial discutidos en el Capítulo 4.
Los resultados de los procedimientos de estimación se dan en la Tabla 5.6. Los parámetros
se estiman mediante el procedimiento de pseudoverosimilitud máxima. Todos los parámetros
son altamente significativos en ambas especificaciones. Conducen a una velocidad de
convergencia de 0,015 y 0,025, respectivamente, en los dos modelos (fue de 0,019 en el modelo
a-espacial presentado en la Sección 1.3.3) y, en consecuencia, a un tiempo de vida media de 44
y 27 años, respectivamente. en los dos modelos (fueron 34 años en el modelo a-espacial). Así,
la introducción de efectos espaciales conduce a una mayor velocidad de convergencia entre las
regiones.
En cuanto al diagnóstico del modelo, observamos que la prueba de Breusch-Pagan lleva a
aceptar la hipótesis de varianzas constantes.
En cuanto al problema de la dependencia espacial entre residuos en el modelo de rezago
espacial, tanto el test de razón de verosimilitud como el del multiplicador de Lagrange nos llevan
a rechazar la hipótesis de independencia espacial mientras que, en el caso del modelo de error
espacial, existe un contraste entre el resultados de la prueba de la razón de verosimilitud (que
nos lleva a rechazar la independencia espacial) y los proporcionados por la prueba del
multiplicador de Lagrange (que, por el contrario, lleva a la aceptación).
Las conclusiones generales no son, pues, muy diferentes de las del análisis anterior referente
a las provincias italianas. Cuando se detecta un alto grado de autocorrelación espacial positiva
entre los residuales, las velocidades de convergencia estimadas a través de la regresión lineal a-
espacial están fuertemente sesgadas con respecto a las obtenidas a través de las regresiones
espaciales. En este caso, sin embargo, el modelo no es del todo satisfactorio porque deja un alto
grado de dependencia espacial residual.
Tabla 5.6. Convergencia de la renta per cápita en las 129 regiones europeas NUTS-2 (1950-
1999)– Modelos de dependencia espacial – Estimaciones de máxima verosimilitud (los números entre paréntesis se refieren
a los valores de p).
Modelo de error espacial Modelo de retraso espacial
2,539 3,623
ÿ (Constante)
(0,000) (0,000)
-0,222 -0,302
ÿ
(0,002) (0,002)
Media vida (**) 44.20 27.60
0,501
---
(0,000)
0,385
---
(0,000)
Bondad de ajuste
0.776 0.692
(0.378) (0.452)
21.259
---
Prueba LRT (modelo de error espacial frente a OLS)
(0.000)
0.074
---
(0.785)
14.400
---
Prueba LRT (modelo de retraso espacial frente a OLS)
(0.000)
5.598
---
(0.018)
(
en 1 + ÿ ) ; (**) Vida media = vida
media = en (2) .
T
ÿ
5.3.2 Violación de las hipótesis del modelo de probabilidad
Las especificaciones del modelo elegidas en la sección anterior no son satisfactorias

ya que podemos observar que no se ha eliminado la dependencia espacial en los
residuos. Esto proporciona un margen adicional para derivar especificaciones
alternativas. En esta sección, sugeriremos algunas alternativas considerando posibles
violaciones del modelo de probabilidad.
Para mejorar nuestros modelos, consideraremos el área de estudio dividida en dos zonas, cada
una caracterizada por diferentes regímenes. Observemos de nuevo la Figura 1.9, donde presentamos
la distribución del logaritmo natural del PIB per cápita en las regiones de la UE al nivel NUTS 2 tanto
en 1980 (el período inicial de observación) como en 1996 (el período final de observación). El análisis
gráfico sugiere la existencia de al menos dos clubes diferentes con una clara distinción geográfica: las
regiones más ricas ubicadas en el centro del continente y las regiones más pobres ubicadas en la
periferia.
Para contrastar la hipótesis de la existencia de dos regímenes caracterizados por dos velocidades
de convergencia diferentes, clasificamos a la región de la UE como “pobre” si el nivel de PIB per cápita
está por debajo de la mediana europea y “rica” si la supera.
La clasificación puede basarse en el año inicial 1980 (Figura 1.9a) o, alternativamente, en el año final
1996 (Figura 1.9b). En esta sección intentamos ambas especificaciones. Los resultados de la prueba
de Chow de la invariancia de los parámetros (ver la Ecuación (5.159) en la Sección 4.4.4.1) se reportan
en la Tabla 5.7 para las cuatro especificaciones consideradas. Los resultados de las pruebas de Chow
son altamente significativos para tres de los cuatro modelos analizados, con la única excepción del
modelo de rezago espacial que adopta la clasificación de 1980.
1996) – Invariancia espacial de parámetros.
Modelo de error espacial Modelo de error espacial Modelo de retraso Modelo de rezago
(clasificación de 1980) (clasificación de 1996) espacial (clasificación de 1980)
espacial (clasificación
prueba de 5,990 (0,050) 65.175 1.344 de 1996) 64,475 (0,000)
comida (0.000) (0.511)
Habiendo encontrado suficiente evidencia de la existencia de dos regímenes, ahora podemos proceder
a una estimación de los parámetros y la verificación diagnóstica de los distintos modelos. La Tabla 5.8
muestra los resultados de la estimación de máxima verosimilitud de los parámetros de retraso espacial
y error espacial para los dos regímenes espaciales.
Las estimaciones de los parámetros son siempre significativas y las estimaciones de ÿ son del
signo esperado (ver Tabla 5.8). La velocidad de convergencia oscila entre 1,489% y 5,089% al emplear
los cuatro modelos diferentes. De acuerdo con la hipótesis de la convergencia teórica, el modelo de
cambio estructural identifica una mayor velocidad (5,089%) para las regiones “pobres” y una menor
velocidad (1,489%) para las regiones “ricas”.
Las pruebas de Breusch-Pagan no son significativas, por lo que se rechaza la heteroscedasticidad.

En base al valor de AIC, se indica el modelo de error espacial con la clasificación de 1996 como el
que mejor ajuste logra.
1999). Modelos de dependencia espacial con regímenes espaciales (estimaciones ML) (los números entre paréntesis se refieren
a los valores de p).
Modelo de error Modelo de error Modelo de Modelo de

espacial espacial rezago espacial rezago espacial
(clasificación de (clasificación de (clasificación de (clasificación de
ÿ (Constante) 1980) 2,815 (0,000) 1996) 4.380 1980) 2.475 1996) 4.313
Rico -0,213 (0,004) (0.000) (0.002) (0.000)
ÿ -0.378 -0.212 -0.395
Rico (0.000) (0.015) (0.000)
Velocidad de convergencia (*) 0.011497 0.02968 0.011489 0.03141
Vida media 46,30 23,35 46.83 22.06
(**) ÿ (Constante) 5.015 5.708 3.046 4.577
Pobre (0.000) (0.000) (0.000) (0.000)
ÿ -0.468 -0.557 -0.280 -0.446
Pobre (0.000) (0.000) (0.000) (0.000)
Velocidad de convergencia (*) 3,944% 5.089% 2.053% 3.691%
13.62 18.77
Media vida (**) 17.57 33.76
0,369 0,205
(0,000) (0,023)
0.369 0.205
(0.000) (0.023)
Bondad de ajuste
Criterio de Schwartz
-176.792 -219.507 -163.447 -213.801
Prueba de heterocedasticidad de0.059 1.551 0.091 0.262
Breusch-Pagan 2. Dependencia (0.808) (0.213) (0.763) (0.609)
espacial
LRT (modelo de error espacial 23.844 8.294
frente a OLS) (0.000) (0.003)

LMT (modelo de retraso 0.115 0.051
espacial como hipótesis alternativa)

(0.735) (0.821)
LRT (modelo de retraso espacial 12.499 4.589
frente a OLS) (0,000) (0,032)

LMT (modelo de error espacial 8,276 0,010
como hipótesis alternativa) (0,004) (0,920)
(
en 1 + ÿ ) ; (**) Vida media = vida
media ÿ
= en (2) .
T b
Finalmente, nótese que las especificaciones alternativas de dos regímenes consideradas también
eliminan el problema de la dependencia espacial residual en tres de las especificaciones
consideradas si basamos nuestras conclusiones en la prueba del multiplicador de Lagrange,
aunque la prueba de la razón de verosimilitud proporciona algunos resultados contrastantes.
6 Mirando hacia el futuro: una revisión de más avanzada

Temas de econometría espacial1
6.1 Introducción
Como se comentó en el primer capítulo, el objetivo de esta monografía es presentar una

introducción de base estadística al campo de la econometría espacial. En consecuencia, en
el presente contexto, solo hemos considerado las técnicas básicas y hemos omitido muchos
temas importantes y más avanzados.
Sin embargo, no queremos que el lector quede totalmente ajeno a las muchas otras
posibilidades que ofrece la econometría espacial. Por lo tanto, el objetivo de este capítulo es
proporcionar una breve revisión de algunos de los avances propuestos en la literatura que,
durante las últimas décadas, han mejorado sustancialmente la caja de herramientas
econométrica espacial básica presentada hasta ahora. Evidentemente, no es posible dar
cuenta completa y detallada de todos los desarrollos registrados en este campo y, como
dijimos, este no es el propósito del libro de todos modos. El objetivo de este capítulo es
simplemente proporcionar al lector interesado las referencias necesarias para que pueda
profundizar sus conocimientos en esta dirección si así lo desea. Además, dado que el resto
del libro se ha centrado únicamente en la convergencia regional del ingreso como ejemplo de
posibles aplicaciones, también deseamos aprovechar esta oportunidad para presentar una
serie de campos emergentes, en los que los métodos econométricos espaciales son
potencialmente útiles. Esto para abrir la mente del lector a otras posibles aplicaciones. Se
pueden encontrar revisiones más exhaustivas de problemas y métodos en Anselin et al.
(2004), Anselin y Bera (1998), LeSage (1999), Anselin (2001b; 2002) y Florax y van de Vlist (2003).
Este capítulo se divide en tres secciones. La primera sección está dedicada a los modelos
que ofrecen una alternativa al marco básico de regresión simple considerado en el Capítulo
4. La segunda es una revisión de las herramientas de diagnóstico, alternativas a las
presentadas en los capítulos anteriores, para probar las diversas hipótesis de regresión.
Finalmente, la tercera sección se enfoca en algunos métodos de estimación, además del
MGL y los métodos de máxima verosimilitud, que pueden usarse en un contexto econométrico
espacial para mejorar la precisión de las estimaciones.
1
Este capítulo está escrito conjuntamente con Gianfranco Piras.
148 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
6.2 Modelos alternativos
6.2.1 Modelos de datos de panel
Una tipología de modelos que es potencialmente de gran interés en econometría espacial es la

basada en datos de panel. Como es bien sabido, este tipo de datos permite el estudio
contemporáneo tanto de la dinámica como de la variación individual de los fenómenos económicos.
Baltagi (2001) enumera algunos de los beneficios y limitaciones del uso de tales datos (ver también
Hsiao, 1986; Klevmarken, 1989; Solon, 1989). En primer lugar, permiten controlar la heterogeneidad
de los individuos. Además, son más informativos que las series temporales puras o los datos
transversales, presentan más variabilidad, menos colinealidad entre las variables y más grados de
libertad. La otra cara de la moneda es que tienen una serie de inconvenientes. Para empezar, los
problemas de diseño y recopilación de datos son más complicados que en el caso de series
temporales puras o datos transversales. También pueden surgir errores de medición y pueden
producir distorsiones inferenciales. En muchos casos, la dimensión temporal es demasiado corta
para permitir un modelado dinámico adecuado debido a los altos costos asociados con la
recopilación de datos.
Finalmente, existen problemas importantes asociados con la selectividad de la muestra que surgen
en las diversas formas de autoselectividad, falta de respuesta, deserción o nueva entrada.
A pesar de estos problemas, la difusión de datos de panel se ha visto favorecida por la creciente
disponibilidad de datos. Hasta hace solo unos años, la difusión de conjuntos de datos de panel
estaba restringida a los Estados Unidos, el único país en el que se recopilaban datos de panel de
manera regular. Hoy en día, muchos de los países europeos tienen sus propias encuestas
longitudinales (p. ej., la Encuesta italiana sobre ingresos y riqueza de los hogares realizada por el
Banco de Italia), y el Panel de hogares de la Comunidad Europea (ECHP) es una valiosa fuente de
información para estudios económicos empíricos.
Los datos de panel referenciados espacialmente también son comunes en economía. La base de
datos REGIO ya citada (ver Sección 1.3.1) representa un ejemplo de un conjunto de datos de panel
espacial que está adquiriendo una importancia creciente en los estudios económicos regionales.
Recientemente, ha habido una amplia difusión de contribuciones a los métodos estadísticos
diseñados para analizar datos de panel. Sin embargo, solo unos pocos artículos en la literatura
tratan con datos de panel espacial. La aportación de Paul Elhorst (2001, 2003) tiene especial
relevancia en este sentido. El autor examina exhaustivamente la especificación de una serie de
modelos, desarrollados a partir del marco clásico de especificación de datos de panel tradicional y
conjugados con las técnicas típicas para modelar la dependencia espacial discutidas en este libro.
En particular, Elhorst elabora las estrategias de especificación y estimación para los modelos de
datos de panel espacial que incluyen la autocorrelación del error espacial y una variable dependiente
retrasada espacialmente. El autor parte de la literatura clásica sobre datos de panel y adapta lo que
se puede aprender de la literatura econométrica discutiendo cuatro modelos: el modelo espacial de
efectos fijos, el modelo espacial de efectos aleatorios y los modelos de error espacial de coeficiente
fijo y aleatorio. También deriva la probabilidad relativa de cada modelo y analiza las propiedades
asintóticas y los procedimientos de estimación. También se analizan los posibles problemas
derivados de la versión espacial de estos cuatro modelos.
6.2 Modelos alternativos 149
maldijo en detalle. Otro aspecto interesante es la derivación de la función de verosimilitud de un

modelo de datos de panel dinámico de efectos fijos ampliado para incluir la autocorrelación de errores
espaciales o variables dependientes espacialmente rezagadas. Volveremos a estos aspectos cuando
discutamos las técnicas de estimación en la Sección 6.4 a continuación.
Se han logrado algunos avances al considerar la predicción en modelos de regresión de datos de
panel al tener en cuenta la autocorrelación espacial entre estados y regiones.
Baltagi y Li (1999) derivan el mejor predictor lineal no sesgado para el modelo de componente de error
aleatorio con correlación espacial. Comparan el desempeño de varios predictores de una ecuación
simple de demanda de cigarrillos basada en un panel de 46 estados durante el período 1963-1992. Los
estimadores que comparan en el ejercicio de pronóstico son el OLS con efectos fijos (tanto teniendo en
cuenta como sin tener en cuenta los efectos de correlación espacial) y el estimador GLS para efectos
aleatorios (nuevamente, tanto ignorando como teniendo en cuenta los efectos de correlación espacial).
El principal resultado obtenido es que es importante tener en cuenta la correlación espacial y la
heterogeneidad entre estados porque su consideración mejora notablemente el rendimiento en términos
de RMSE de los pronósticos. Baltagui et al. (2003) proporcionan resultados adicionales y amplían los
resultados anteriores.
Se pueden encontrar revisiones más exhaustivas de los datos del panel espacial en Anselin (2001a)
y Anselin et al. (2004b).
6.2.2 Modelos de convergencia regional
Como queda claro a partir de los ejemplos de este libro, la teoría del crecimiento y la convergencia
económica son sin duda los campos en los que la econometría espacial se ha aplicado con mayor
frecuencia durante las últimas décadas. Dentro de este amplio campo, se han propuesto en la literatura
muchos modelos diferentes que se apartan sustancialmente del modelo de regresión lineal espacial
simple de los capítulos anteriores y requieren un tratamiento econométrico espacial adecuado.
Un enfoque que puede considerarse un importante paso adelante con respecto al marco de
modelado de convergencia de crecimiento neoclásico es el basado en el concepto de club de
convergencia desarrollado por Durlauf y Johnson (1995) y Quah (1993a; 1993b; 1996a; 1996b). Véase
Baumont et al. (2003) para una revisión. Tal concepto puede ayudar a explicar por qué observamos la
polarización económica y la persistencia de la pobreza en los estudios empíricos. La idea se basa en
modelos de crecimiento endógeno que conducen a una situación de múltiples equilibrios de estado
estacionario como la descrita en Azariadis y Drazen (1990). Según esta teoría, algunas economías
pueden converger, pero solo si sus condiciones iniciales caen dentro de la cuenca de atracción del
mismo estado estacionario. Galor (1996) demuestra que tal concepto de convergencia es, de hecho,
consistente con los modelos de crecimiento neoclásico estándar, si permitimos la heterogeneidad
individual.
En la misma línea, Quah (1993a) introdujo un enfoque original basado en matrices de transición de
cadenas de Markov. El enfoque de Quah se basa en la idea de que la convergencia es un tema tan
complicado que no puede estudiarse simplemente observando el
correlación lineal entre las tasas de crecimiento y los niveles iniciales del PIB, como en el
análisis estándar de convergencia ÿ. Más bien, tenemos que observar la distribución bivariada
completa de las dos variables involucradas (estimadas con densidades kernel) y también sus
desarrollos temporales para poder comprender completamente todas las fuerzas motrices y la
dinámica. Al desarrollar tal enfoque, Quah (1993a; 1993b) revela la existencia de una
polarización en dos clubes de países ricos y pobres en la distribución regional europea del
ingreso (ver Capítulo 5.3). Él llama a estos "picos gemelos".
Baumont et al. (2003) abordan el mismo problema en forma de inestabilidad estructural
entre clubes de convergencia espacial en la estimación del proceso de convergencia ÿ entre
138 regiones europeas durante el período 1980-1995. La estimación de los modelos de error
de régimen espacial apropiados muestra que el proceso de convergencia es diferente entre
los regímenes. Además, los autores también estiman un efecto de desbordamiento espacial
muy significativo: la tasa de crecimiento promedio del PIB per cápita en una región determinada
parece verse afectada positivamente por la tasa de crecimiento promedio de las regiones
vecinas. Rey (2001, 2003) analiza otras especificaciones particulares de la convergencia del
club y trata, en particular, de modelos espaciales de Markov y modelos de desigualdad espacial.
Como ya se señaló, la mayor parte del análisis empírico utiliza tradicionalmente técnicas
econométricas transversales para probar hipótesis de convergencia. Sin embargo, como
sugirieron Bernard y Durlauf (1995, 1996), estos procedimientos plantean varios problemas.
Los autores proponen una nueva definición de convergencia basada en el concepto de raíz
unitaria desarrollado en el contexto del análisis de series temporales. Si el progreso tecnológico
(que impulsa el crecimiento económico a largo plazo) contiene una tendencia estocástica, la
convergencia implica que los componentes permanentes del PIB son los mismos en todas las regiones.
En este contexto, la convergencia se presenta como un “ponerse al día durante un cierto
período de tiempo” (Bernard y Durlauf, 1996). La convergencia estocástica se puede probar
realizando pruebas de raíz unitaria de panel (ver Evans y Karras, 1996a,b; Bernard y Jones,
1996; Fleissig y Strauss, 2001; Arbia y Costantini, 2004). Sin embargo, hasta ahora, no se ha
considerado, en este campo, los problemas relacionados con la naturaleza espacial de las
observaciones que requerirían un modelo econométrico espacial explícito.
Es notable, sin embargo, que algunos de los conceptos en el análisis de series de tiempo
relacionados con las raíces unitarias y la cointegración han sido investigados en el contexto
de la econometría espacial (Fingleton, 1999; Mur y Trìvez, 2003). Getis y Griffith (2002), notan
que este importante tema aún falta en el tratamiento de otros problemas espaciales, siendo la
única excepción notable los trabajos de Griffith y Tiefelsdford (2002) y Getis y Aldstadt (2004).
En el contexto de la convergencia estocástica, es interesante considerar el enfoque

propuesto recientemente por Pesaran (2004b). Esto se basa en el cálculo de las medidas de
convergencia derivadas de una consideración de todos los posibles pares de (logaritmo)
brechas del producto per cápita en, digamos, N economías.
Otro marco de modelado innovador propuesto recientemente en la literatura sobre
convergencia regional, que parte de la conceptualización estándar, es el desarrollado por
Arbia y Paelinck (2003a; 2003b). Partiendo de la consideración de que el análisis de
convergencia tradicional proporciona indicios sobre la convergencia de
regiones hacia estados estacionarios comunes, pero no sobre el camino que siguen para
alcanzar dicha convergencia, los autores consideran un marco de tiempo continuo basado en
el sistema clásico de dos ecuaciones Lotka-Volterra depredador-presa (Lotka, 1956 y Volterra,
reimpreso en Chapman, 1931) propuesto por primera vez en un contexto económico por
Samuelson (1971). (Sobre modelos econométricos de tiempo continuo ver Bergstrom, 1990 y
Gandolfo, 1990). Extienden dicho marco de modelado al caso de más de dos regiones e
introducen explícitamente una modelización de la dependencia espacial que muestran las
regiones vecinas. El modelo así obtenido puede verse como una versión generalizada del
modelo de convergencia ÿ, en el que un sistema de regiones, bajo ciertas condiciones, se
mueve hacia un punto de convergencia matemáticamente estable. También consideran la
inferencia estadística e introducen una solución aproximada discreta basada en Mínimos
cuadrados dinámicos simultáneos (Paelinck, 1996) para estimar los parámetros del modelo.
Por lo tanto, al generalizar el modelo tradicional depredador-presa a un sistema multirregional,
muestran que cada región puede seguir su propia trayectoria, lo que lleva a una serie de
caminos de convergencia distintos. Los autores ilustran su enfoque comparando los resultados
empíricos generados por una ecuación de convergencia tradicional y por una ecuación de
convergencia condicionada espacialmente con los del modelo Lotka-Volterra para 119 regiones
europeas durante el período 1980-1994.
Al igual que Arbia y Paelinck (2003), Harvey y Carvalho (2002) también están interesados
en la dinámica de la convergencia más que en su ocurrencia dentro de un cierto período de
tiempo. Proponen un mecanismo de corrección de errores de segundo orden integrado en un
marco de convergencia estocástica que proporciona un desglose informativo en componentes
de tendencia, ciclo y convergencia. También muestran que las pruebas de series temporales
de convergencia económica pueden formularse dentro de este marco. Sin embargo, no se
presta atención en el documento citado a los efectos espaciales.
Fingleton (2004) propone un nuevo modelo de crecimiento económico que va más allá del
esquema neoclásico al incorporar (i) rendimientos crecientes (en lugar de constantes) a
escala, (ii) la difusión de innovaciones tecnológicas, (iii) ponerse al día y (iv) spa externalidades
potenciales. El modelo es una extensión de la ley de Verdoorn (Verdoorn, 1949) empleada en
el análisis económico por Kaldor (1957; 1970) y aumentada para incluir retraso espacial,
errores espaciales y otros efectos espaciales.
Ya hemos tratado el tema del modelado de datos de panel en la Sección 6.2.1. Las
aplicaciones de tales metodologías se pueden encontrar en el estudio de la convergencia
regional a partir del trabajo de Islam (1995, 1998). Para una aplicación reciente, véase, por
ejemplo, Arbia y Piras (2005) y Arbia et al. (2005).
Finalmente, Arbia et al. (2003) y Arbia y Basile (2005) proponen un non paramet
marco rico para estudiar el crecimiento y la convergencia en la UE.
6.2.3 Modelos de espacio-tiempo
A menudo, uno de los puntos más críticos en el análisis econométrico espacial es la necesidad
de considerar simultáneamente la dependencia espacial y temporal presente en las
observaciones bajo examen. En la literatura son pocos los artículos que consideran la
simultaneidad de estos hechos. Aquí sigue una breve reseña de algunos de los trabajos
recientes en esta dirección. La base para el modelado del espacio-tiempo fue fundada en los
años setenta por Bennett (1979) y Pfeiffer y Deutsch (1980), quienes introdujeron la clase de
procesos autorregresivos y de promedio móvil del espacio-tiempo (STARMA).
Estos procesos todavía representan el punto de partida para conceptualizaciones más
complicadas.
Pace et al. (1998) observaron que no existe una forma óptima obvia de incorporar las
dependencias espaciales y temporales en modelos de precios empíricamente factibles.
Para capturar mejor el efecto de la información espacial y temporal en los precios de los
bienes raíces, al superar los problemas asociados con los modelos de variables indicadoras,
introdujeron un modelo espacio-temporal que usa información de propiedades cercanas
vendidas recientemente al predecir el valor de una propiedad determinada. . En otras
palabras, en lugar de asumir que cada región tiene sus propios efectos modelados por
parámetros separados, la formulación de STARMA asume que las propiedades cercanas
tienen la misma relación con las observaciones en toda la muestra. Usando datos sobre los
precios de la vivienda, muestran los beneficios sustanciales obtenidos al modelar la
dependencia espacial y temporal de los datos. Más detalladamente, la autorregresión
espacio-temporal redujo significativamente el error absoluto mediano con referencia a un
modelo basado en indicadores. El rendimiento mejorado de su especificación se confirma
mediante el análisis del pronóstico de un paso adelante.
Giacomini y Granger (2003) comparan la eficiencia relativa de diferentes métodos para
pronosticar la agregación de series temporales espacialmente correlacionadas. Utilizando
aproximaciones asintóticas y los resultados de algunos estudios de simulación, muestran
que el rendimiento de la previsión puede mejorarse imponiendo restricciones a priori sobre
la cantidad de correlación espacial en el sistema. Una forma de hacerlo es agregar
pronósticos de un modelo autorregresivo de espacio-tiempo, ya que este último ofrece una
solución al problema de la maldición de la dimensionalidad que surge cuando se pronostica
con la metodología VAR. La importancia de su artículo radica en su prueba de que ignorar la
correlación espacial, incluso si es débil, conduce a pronósticos muy inexactos. Sin embargo,
es importante enfatizar que los resultados se basan en una simulación de muestra muy
pequeña (basada en un máximo de 16 observaciones colocadas en una red regular de 4x4)
y, por lo tanto, se ven afectados por fuertes efectos de borde. Además, los autores restringen
sus simulaciones al caso de autocorrelación espacial positiva y no dicen nada sobre el
desempeño del pronóstico en el caso de autocorrelación espacial negativa.
Recientemente se han registrado algunos avances en la construcción de modelos ARCH
espaciales y espacio-temporales derivados directamente de la serie temporal análoga.
Los desarrollos en este campo requieren una especificación y una comprensión completa de
la noción de “riesgo espacial” (Arbia, 2003) que tiene una relevancia importante en campos
como la desigualdad económica y el análisis de la pobreza. Algunas de las ideas y desarrollos
en este campo se informan en Florax et al. (2004). Para una revisión reciente de los modelos
de espacio-tiempo, véase Arbia (2004). Sobre la relación entre los componentes temporal y
espacial del modelo espacio-tiempo ver Arbia (1992).
6.2.4 Variables discretas
El modelo básico de correlación espacial desarrollado por Cliff y Ord (1981) y Anselin (1988)
permite la dependencia espacial en la variable dependiente o en el componente de error
referido a variables cuantitativas. Sin embargo, muchos estudios empíricos tienen un interés
explícito en modelar la dependencia espacial en los casos en que intervienen variables
categóricas. Fleming (2004) incluye el concepto de correlación espacial en modelos que
involucran variables dependientes limitadas en un contexto de elección discreta. De manera
similar, el modelo probit espacial ha sido investigado en algunos trabajos recientes por
Pinkse y Slade (1998), LeSage (2000), Beron et al. (2003), Murdoch et al. (2003) y Beron y
Vijverberg (2004).
Garret et al. (2003) adoptan un marco similar a las técnicas econométricas espaciales
estándar, pero su especificación se modifica para tener en cuenta la naturaleza discreta de
la variable dependiente y la estructura del panel de datos. Usan un probit espacial para
modelar la elección de un estado de sucursales bancarias y regímenes bancarios
interestatales como una función de las elecciones de régimen hechas por otros estados.
Extienden el modelo básico al permitir que la correlación espacial varíe en diferentes regiones geográficas.
6.2.5 Externalidades espaciales
La modelización de las externalidades espaciales es una de las cuestiones más abordadas

en la literatura reciente (Anselin, 2002; Lee, 2002; Dubin, 2003; Wall, 2004). Las
externalidades espaciales juegan un papel central en muchas ciencias sociales. Por ejemplo,
en economía se dedica cada vez más atención a la modelización de la interacción social
que introduce dependencia entre los agentes de un sistema. Además, el enfoque teórico en
la competencia imperfecta y los rendimientos crecientes a escala generaron un interés
creciente en la identificación y medición de las externalidades espaciales (Anselin, 2003a).
La prueba empírica de tales efectos requiere la especificación formal de modelos espaciales
adecuados. Anselin (2001a) esboza una taxonomía de modelos econométricos espaciales
que incorporan externalidades espaciales de diversas maneras. El punto de partida es una
forma reducida en la que los efectos indirectos locales o globales se expresan como
multiplicadores espaciales. A partir de este punto de partida, se deriva una gama de
especificaciones familiares y menos familiares para la forma estructural de una regresión
espacial. Este trabajo permitió que algunas de las limitaciones de los modelos más familiares
(en términos de su interpretación como modelos de externalidades espaciales) se hicieran
evidentes. De manera similar, el trabajo de Anselin et al. (1997) propone un nuevo enfoque
para formalizar las externalidades espaciales combinando la dependencia espacial y la
heterogeneidad espacial en forma de regímenes espaciales.
6.2.6 Modelos bayesianos
Otro aspecto que merece consideración es el uso de modelos bayesianos en econometría

espacial. LeSage (1997; 2000) es el que más ha contribuido a la difusión de las técnicas
bayesianas en econometría espacial. Ver, también, LeSage (2004) para un up-
revisión fechada. Este autor formula un modelo probit bayesiano con efectos individuales
que exhibe dependencias espaciales. Dado que los modelos probit a menudo se utilizan
para explicar la variación en las elecciones de los individuos, estos modelos bien pueden
explicar los efectos de interacción espacial debido a la ubicación espacial variable de los
tomadores de decisiones. El modelo propuesto por LeSage permite un vector de parámetros
de efectos de interacción espacial que toma la forma de una autorregresión espacial. Este
modelo es una extensión de los modelos espaciales probit/logit presentados en LeSage
(2000) y se aplicó a los resultados de las elecciones presidenciales de 1996 para los
condados de EE. UU. En LeSage (2001), el autor argumentó que el uso de métodos
Bayesianos en la estimación de regresiones geográficas puede ayudar a resolver los
problemas que pueden surgir con la estimación clásica, produciendo notables ventajas sobre
la estimación por Mínimos Cuadrados Ordinarios en métodos de regresión ponderados
geográficamente. . Finalmente, en LeSage (2004), el autor propone una familia de modelos
de regresión evaluados localmente (denominados Regresión ponderada geográficamente,
GWR) que se basan en el suavizado kernel obtenido a través de funciones de disminución
de la distancia espacial. También extiende este marco de trabajo a la llamada Regresión
ponderada geográficamente bayesiana (BGWR) utilizando estimadores robustos y suavizado
de parámetros para tratar los valores atípicos espaciales y la heterogeneidad espacial,
respectivamente. Finalmente, hace uso de los métodos MCMC con fines de estimación.
La comparación y selección de modelos es un punto central en la econometría. La teoría
bayesiana proporciona un marco integral para la elección de este modelo. Hepple (2003)
desarrolla este marco bayesiano para la familia de modelos econométricos espaciales.
Obtiene el factor de Bayes y la verosimilitud marginal para cada una de las principales
especificaciones espaciales y construye la forma computacional relativa. Este marco se
aplica luego a dos conjuntos de datos diferentes para ilustrar las ventajas de los métodos.
Baumont et al. también proporcionan una aplicación de los métodos bayesianos. (2003) que
utilizan técnicas econométricas espaciales bayesianas para controlar la autocorrelación
espacial, la heterogeneidad espacial y los valores atípicos en el análisis empírico del empleo
y la densidad de población en el área de Dijon.
Dowde y LeSage (1997) y LeSage y Krivelyova (1999), entre otros, también utilizan
antecedentes espaciales para el modelado del espacio-tiempo, así como Holloway et al.
(2002) y LeSage (1997, 2000) en el análisis probit espacial.
6.2.7 Técnicas no paramétricas
Los desarrollos de métodos de estimación no paramétricos y semiparamétricos aplicados a

problemas espaciales constituyen una desviación importante de los modelos clásicos de
regresión lineal espacial considerados en este libro. Una de las primeras contribuciones a
este campo fue realizada por Conley (1999) quien comenzó observando que el modelo
ARMA espacial tradicional captura la dependencia entre regiones al asumir que las distancias
económicas entre ellas se miden sin error de medición.
Para evitar tal suposición (y para evitar, también, las complicaciones de introducir esta
fuente adicional de incertidumbre en la probabilidad), el autor sugiere concentrarse en la
estimación basada en momentos y asumir una aproximación no paramétrica.
enfoque para modelar la dependencia espacial. En el artículo citado, el autor propone el uso
de un estimador del Método Generalizado de Momento (GMM; véase Hansen, 1982) que
demuestra ser consistente, como en el caso de los datos de series de tiempo. Sin embargo,
dado que la teoría de la distribución de los estimadores es diferente, propone además estimar
la matriz de covarianza de forma no paramétrica, permitiendo la dependencia espacial
mediante el uso de métodos análogos a los empleados por, por ejemplo, Newey y West
(1987), Andrews (1991) White (1984) y White y Domowitz (1984) dentro del contexto de
series temporales. Sugiere un estimador de covarianza que se basa en una secuencia de
promedios ponderados de autocovarianzas de muestra calculadas para subconjuntos de
pares de observación que caen dentro de un umbral de distancia dado de una manera similar
a la de otros campos de las estadísticas espaciales como la geoestadística (ver Cressie,
1991, pág. 69). Finalmente, el autor prueba que las matrices de covarianza así obtenidas son
estimadores consistentes de la verdadera aún cuando se asume que las distancias verdaderas
están distorsionadas por errores de medición.
De manera similar, Driscoll y Kraay (1998) proponen un método de estimación de
covarianza consistente para datos de panel espacialmente dependientes, y Keleijan y Prucha
(1999) analizan el uso de GMM en un modelo espacial. Pueden encontrarse ejemplos de
estimación semiparamétrica de la dependencia espacial en Chen y Conley (2001) y Pace y
LeSage (2002).
Otra contribución importante en esta área la ha hecho Gress (2003), quien parte de la
simple consideración de que los modelos espaciales no son una extensión directa de los
modelos de series temporales, incluso si muestran muchas características compartidas.
El artículo citado combina estimadores no paramétricos de la media con los estimadores
paramétricos habituales de los parámetros de retraso espacial. Esto se hace para los tres
modelos de principal interés en la literatura: el modelo de error autorregresivo espacial, el
modelo autorregresivo espacial con variables exógenas y el modelo autorregresivo espacial
con variables exógenas y errores autorregresivos espaciales. A continuación, se analizan las
propiedades de pequeñas muestras con simulaciones de Monte Carlo y se realizan algunos
análisis empíricos para comparar el resultado obtenido utilizando los métodos econométricos
habituales.
Los modelos de regresión parsimoniosos que utilizan datos espaciales a menudo
producen residuos no normales, heterocedásticos y espacialmente dependientes. Pace et al.
(2004) desarrollan un modelo que realiza simultáneamente transformaciones de forma
espacial y funcional para mitigar los efectos de este problema. Muestran que una mejor
especificación de la forma funcional podría reducir la autocorrelación espacial de errores
dado el agrupamiento espacial de observaciones similares y también puede reducir
simultáneamente la heteroscedasticidad y la no normalidad de los residuos. Los autores
aplican este marco a los datos de mercado de los precios de la vivienda y obtienen un buen
ajuste del modelo con un patrón de residuos significativamente mejorado con respecto al marco de modelado estándar.
McMillen y McDonald (2004) proponen un método no paramétrico para tratar la
heterogeneidad espacial dentro del marco de un modelo probit. El rendimiento se evalúa a
través de experimentos de Monte Carlo.
6.3 Pruebas alternativas
Una vez que se han explotado las propiedades y características del conjunto de datos en uso, el
enfoque de los trabajos empíricos en un contexto de regresión espacial se concentra
principalmente en las pruebas de especificación errónea. Desde el trabajo de Anselin (1988), el
desarrollo de pruebas de especificación errónea dentro de un marco de máxima verosimilitud y la
derivación de las propiedades asintóticas de estas pruebas y las propiedades asociadas de
muestras pequeñas han sido de interés. La gama de pruebas disponibles en tal contexto ha
mejorado significativamente en las últimas décadas, particularmente en relación con los casos
más simples considerados en el cuerpo principal de este libro.
En el contexto de la prueba de la hipótesis nula de la independencia espacial, muchos
autores han dedicado su atención al estudio de las propiedades de la prueba de correlación
espacial de Moran en condiciones variables y a ampliar sus posibles aplicaciones. Muchas
pruebas de dependencia espacial se basan, de hecho, en la estadística de Moran o se pueden
escribir de forma similar (p. ej., la prueba del multiplicador de Lagrange (LMT); véase Burridge,
1980). Algunos autores han explorado el uso de LMT en el contexto de modelos de regresión
espacial (ver Anselin y Rey, 1991; Anselin y Florax, 1995; Anselin, et al., 1996). Sin embargo,
Anselin y Rey (1991) y Anselin y Florax (1995) usaron simulaciones para demostrar que la I de
Moran tiene una potencia ligeramente mejor que la LMT en muestras pequeñas, aunque las
diferencias desaparecen cuando se trata de muestras medianas y grandes.
Entre las nuevas pruebas disponibles, recordamos la variante del I de Moran concebida por
Kelejian y Prucha (2001) y una prueba de muestra grande derivada por Kelejian y Rob inson
(1992, 1997). También se han desarrollado en la literatura un gran número de pruebas de
multiplicadores de Lagrange (LMT) unidireccionales, multidireccionales y robustos (Anselin y
Griffith, 1988; Anselin y Florax, 1995; Anselin et al., 1996; de Graaff et al., 2001; Anselin y Moreno,
2003, Florax y de Graaf, 2004 y Saavedra, 2003). La vasta literatura sobre las pruebas de
dependencia espacial incluye el trabajo de Anselin y Kelejian (1997) y Kelejian y Robinson (1992).
Estas pruebas se centran en la detección de residuos espacialmente correlacionados. Por lo
tanto, pueden usarse para probar especificaciones erróneas bien definidas, como un proceso de
error autorregresivo espacial o una variable dependiente retrasada espacialmente omitida.
Tiefelsdorf y Boots (1995) han demostrado que, en lugar de asumir la normalidad para derivar
la distribución aproximada de la prueba de Moran, es posible construir una prueba exacta basada
en la integración numérica (ver también Tiefelsdorf, 2002). Anselin y Keleijan (1997) han extendido
la aplicación del I de Moran para probar la hipótesis de dependencia entre los residuos del
procedimiento de mínimos cuadrados espaciales en dos etapas (S2STLS) (ver Anselin, 1980;
1988), mientras que Pinkse (1998) la extiende a residuos generalizados en un modelo probit. De
particular relevancia en este contexto son dos trabajos de Pinkse (1999, 2004). En su primer
artículo (Pinkse, 1999), el autor establece condiciones débiles bajo las cuales la prueba de
correlación espacial de Moran (o una variante de correlación cruzada de la misma) tiene una
distribución normal límite bajo la hipótesis nula de independencia. Para ambas pruebas, se
obtiene un resultado basado en un parámetro molesto.
6.3 Pruebas alternativas 157
siempre que permita aplicar la prueba a proxies de las variables cuya independencia se
quiere probar. Pinkse utiliza la estadística de prueba para determinar si tres pruebas del
multiplicador de Lagrange para la correlación espacial son válidas en un contexto de modelo
probit. En su segundo artículo (Pinkse, 2004), el autor ilustra las condiciones generales bajo
las cuales las pruebas de correlación espacial y correlación cruzada espacial con sabor a
Moran tienen una distribución normal limitante en presencia de un parámetro molesto en seis
modelos espaciales encontrados con frecuencia. . Las condiciones que deben imponerse son
más débiles que las consideradas en un trabajo relacionado del autor (Pinkse, 1999) y la
clase de problemas de parámetros molestos permitidos es mucho más amplia.
En términos generales, los diagnósticos de la dependencia del error espacial pueden
clasificarse como pruebas frente a una alternativa no especificada a la correlación espacial y
pruebas frente a procesos espaciales específicos. En el segundo caso, la típica alternativa a
la autocorrelación espacial se expresa bajo la forma de un proceso espacial autorregresivo.
En la literatura se han propuesto muchas pruebas de especificación y métodos de estimación
para este modelo. Kelejian y Robinson (1993) sugirieron un tipo diferente de proceso espacial
que combina un componente de error local o específico de la ubicación con un componente
regional o indirecto en lo que denominan proceso de componente de error espacial. Anselin y
Moreno (2003) propusieron una interesante alternativa basada en la siguiente formulación del
modelo. Consideraron una serie de pruebas de especificación frente a esta alternativa,
basadas tanto en un marco de máxima verosimilitud como en un enfoque de métodos
generalizados de estimación de momentos. Además, compararon el desempeño de estas
pruebas en una serie de experimentos de simulación de Monte Carlo para un rango de diseños
espaciales diferentes y bajo varias distribuciones de error diferentes, y encontraron que las
nuevas estadísticas funcionan mejor en términos de potencia, particularmente con referencia
a aquellos casos que no estén cubiertos por el supuesto de normalidad. De manera similar, la
variante de las estadísticas de Kelejian-Robinson, que se sugirió en este documento para dar
cuenta de los vecinos de segundo orden, también funciona bien. Así, el grado de generalidad
de los resultados del artículo está limitado por el diseño que se tiene en cuenta en los
experimentos de simulación.
En un trabajo reciente, Baltagi y Li (1999) observaron que ninguna de las pruebas LM de
dependencia espacial disponibles en la literatura ha sido calculada ejecutando una regresión
artificial. El objetivo principal de su artículo es mostrar que se puede obtener una LMT simple
tanto para la dependencia del retraso espacial como para la dependencia del error espacial
mediante el uso de la regresión de doble longitud (DLR) propuesta por Davidson y MacKinnon
(1993). Las regresiones de doble longitud son herramientas econométricas útiles para derivar
LM y estadísticas de prueba equivalentes. Además, se pueden aplicar a modelos que son
más generales que algunas de las otras contrapartes de regresión artificial y tienen mejores
propiedades de muestra finita que sus contrapartes de regresión de gradiente de producto externo.
Baltagi y Li (1999) obtienen las pruebas DLR tanto para la dependencia del retraso espacial
como para la dependencia del error espacial utilizando únicamente los residuos de mínimos
cuadrados del modelo restringido. Usan dos ejemplos simples para ilustrar estas pruebas:
uno se basa en la relación delictiva simple considerada por Anselin (1988) y el otro usa los
datos irlandeses considerados por Ord (1975). Además, los experimentos de Monte Carlo son
realizado para estudiar el rendimiento de muestra pequeña de estas pruebas y, como era de
esperar, tienen un rendimiento similar al de sus contrapartes LMT correspondientes.
Pesaran (2004a) está interesado en probar la dependencia transversal en paneles
dinámicos. Él parte de la consideración de que la forma tradicional de probar la dependencia
entre unidades de sección transversal espacial en datos de panel depende demasiado de la
elección subjetiva de una matriz de conectividad. Además, una conectividad puramente
geográfica no es apropiada en muchas aplicaciones económicas donde los factores económicos
y sociopolíticos podrían explicar mejor el patrón de dependencia. Como alternativa, propone
una prueba basada en un promedio simple de todos los coeficientes de correlación por pares
de los residuos de MCO de las regresiones simples contenidas en el panel. Para la prueba de
dependencia de la sección transversal así obtenida, las propiedades asintóticas y de muestra
pequeña se prueban y comparan con la prueba LMT estándar usando experimentos de Monte
Carlo. Una prueba de correlación espacial adecuada se deriva como una generalización para
los casos en los que tenemos un orden espacial a priori para las unidades de sección
transversal.
Se pueden encontrar contribuciones más recientes sobre la prueba de hipótesis en el
contexto espacial en Kelejian y Robinson (2004), donde los autores amplían su trabajo anterior
para tratar las estadísticas de prueba para múltiples fuentes de errores de especificación en
modelos de regresión lineal.
Finalmente, se han introducido algunas herramientas para probar la dependencia espacial
de forma no paramétrica. Se puede encontrar una prueba no paramétrica de independencia
espacial en Brett y Pinkse (1997) basada en una prueba similar de independencia serial
presentada por Pinkse (1998)
En el contexto de las pruebas de heteroscedasticidad en un modelo espacial, Baltagi et al.
(2003) extendieron la prueba LM de Breusch y Pagan al caso de un modelo de componente
de error espacial y derivaron varias pruebas del multiplicador de Lagrange (LMT) para el
modelo de regresión de datos de panel con correlación de error espacial. El punto de partida
es permitir tanto la correlación de errores espaciales como los efectos regionales en los
modelos de regresión de datos de panel y probar su significancia conjunta. Los autores usan
algunos experimentos de Monte Carlo para mostrar claramente que la literatura econométrica
espacial no debe ignorar la heterogeneidad entre las unidades transversales al probar la
presencia de correlación de error espacial. De manera similar, la literatura econométrica de
datos de panel no debe ignorar la correlación de error espacial al probar la presencia de efectos
regionales aleatorios. Baltagui et al. (2003) derivan pruebas LM conjuntas y condicionales que
son fáciles de implementar y más poderosas que la prueba LM unidimensional. El tamaño de
muestra utilizado en el análisis de Monte Carlo es pequeño, como es típico en los micropaneles.
En términos generales, la búsqueda de especificaciones en econometría espacial se ha
centrado en la detección de autocorrelación espacial y heteroscedasticidad espacial.
No se ha abordado la ocurrencia conjunta de autocorrelación y heteroscedasticidad, aun
cuando es un concepto central en la econometría espacial, como ya se comentó en el Capítulo
4.4.3. Anselin y Griffith (1988) sugieren que las pruebas tradicionales de autocorrelación
espacial pueden tener cierto poder contra la heteroscedasticidad, pero Kelei jan y Robinson
(1992) llegan a conclusiones opuestas. Aún no hay resultado teórico
6.4 Métodos de estimación alternativos 159
existe para mostrar cómo la heterogeneidad afecta las pruebas de correlación espacial. Para una
revisión reciente y nuevos resultados en este campo, ver Keleijan y Robinson (2004).
Los procedimientos de prueba de especificación disponibles en la literatura consisten en
expandir un modelo de regresión lineal espacial con variables dependientes retrasadas
espacialmente, condicionado a los resultados de una prueba de especificación errónea. Florax et al.
(1998) reúnen una serie de nuevas estrategias de búsqueda de especificaciones. En particular,
investigan una estrategia de especificación similar a la de Hendry, a partir del modelo de factor
común espacial y, posteriormente, reducen el número de variables retrasadas espacialmente sobre
la base de pruebas de significancia. Su simulación experimental se refiere a diferentes muestras de
diferentes tamaños de muestra y el campo espacial se modela en superficies reticulares regulares.
Concluyen que el enfoque paso a paso hacia adelante clásico supera a la estrategia de Hendry en
términos de encontrar el verdadero proceso de generación de datos, así como en la precisión
observada de los estimadores para parámetros espaciales y no espaciales. También domina el
enfoque escalonado concurrente sugerido en la literatura. Florax y Rey (1995) investigaron los
rendimientos de una muestra pequeña de una secuencia de pruebas unidireccionales y
multidireccionales y pruebas de errores de especificación local, tanto en términos de la probabilidad
de encontrar el proceso real de generación de datos como en términos del error cuadrático medio
de los parámetros estimados. Establecieron la existencia de una estrategia dominante que es muy
relevante para los practicantes del modelado de regresión espacial.
Finalmente, de Graaff et al. (2001) sugirió una prueba muy particular. Su artículo se ocupa de un
análisis metodológico y empírico del caos en los sistemas espaciales. Su objetivo es crear un vínculo
entre las herramientas de diagnóstico clásicas desarrolladas en econometría espacial y las pruebas
de no linealidad para series de datos empíricos, con especial atención a la llamada prueba BDS
(Brock et al., 1987). Desarrollaron una variante espacial de esta prueba y posteriormente la aplicaron
al caso de un modelo shift-share para los mercados laborales regionales holandeses durante el
período 1987-1992.
6.4 Métodos de estimación alternativos
Hasta hace unos años, los métodos de estimación predominantes se basaban básicamente en
estimadores GLS y ML para el modelo de error espacial y rezago espacial, como se discutió en
capítulos anteriores. Recientemente, se han logrado avances significativos en el desarrollo de
alternativas.
Kelejian y Robinson (1997), Kelejian y Prucha (1998; 1999) y la ya citada contribución de Conley
(1999) han dado un gran paso adelante en la dirección de proporcionar una alternativa viable a los
estimadores tradicionales GLS y ML. quien introdujo el uso de estimadores GMM en un contexto
econométrico espacial. En particular, Kelejian y Prucha (1999) desarrollan un conjunto de condiciones
de momento que producen ecuaciones de estimación para el parámetro de un modelo de error SAR
y sugieren el uso de mínimos cuadrados no lineales para derivar un método generalizado consistente
de estimador de momentos. Conley (1999) estudia en detalle las propiedades de los estimadores
GMM y proporciona las condiciones formales para su consistencia y asunción.
normalidad sintótica. Estos resultados permiten realizar estimaciones, inferencias y pruebas de

hipótesis con datos transversales dependientes.
Pinkse y Slade (1998) usan condiciones de momento en su modelo probit con errores SAR ya
citados en la Sección 6.2.4, sin embargo, no abordan explícitamente la estructura de la matriz de
covarianza espacial a estimar.
Pinkse et al. (2003) proporcionan un ejemplo muy interesante de tales procedimientos basados
en momentos. Hacen uso de un estimador GMM de un paso que permite la dependencia genérica
espacial y de series temporales. Este estimador es, además, consistente y asintóticamente
normal en condiciones débiles. Utilizan este nuevo procedimiento de estimación para estimar un
modelo probit espacial dinámico con efectos fijos que, a su vez, permite tomar decisiones
operativas en un contexto de opciones reales. El resultado principal de la aplicación empírica es
que los datos apoyan más un modelo de utilidad de media/varianza que un modelo de opción
real. Kelejian y Prucha (2004) ofrecen otro ejemplo del uso de estimadores GMM para el
parámetro autorregresivo de un modelo espacial.
Otro estimador alternativo es el método espacial de mínimos cuadrados en dos etapas

(S2SLS) propuesto originalmente por Anselin (1980; 1988) y desarrollado por Land y Leane
(1992), Kelejian y Robinson (1993) y Kelejian y Prucha (1998). Se ocupa de la endogeneidad de
las variables dependientes espacialmente rezagadas haciendo uso de variables instrumentales.
Bajo un conjunto de condiciones que a menudo se cumplen cuando se trata de matrices de
conectividad basadas en contigüidad pura, se demuestra que el método es consistente y produce
estimadores asintóticamente normales. La extensión a mínimos cuadrados de tres etapas se
analiza en Anselin (1988).
Recientemente se han introducido técnicas computacionalmente intensivas para estimar los
parámetros de los modelos espaciales. Un ejemplo reciente es el estimador de muestreo de
importancia recursivo (RIS) propuesto por Vijverberg (1997) y aplicado por Beron y Vijverberg
(2004) para resolver problemas espaciales.
Pinkse et al. (2002) estudiaron la competencia espacial de precios entre empresas que
fabrican productos diferenciados y compiten en los mercados mayoristas de gasolina de Estados
Unidos. Descubrieron que, en este mercado, la competencia está muy localizada. En este
interesante e innovador trabajo, los autores hacen uso de un estimador de variables instrumentales
para la matriz de coeficientes de respuesta de precios cruzados. También demuestran que el
estimador es consistente y derivan su distribución asintótica. Hacen uso de un enfoque
semiparamétrico que permite discriminar entre modelos de competencia global (en el que todos
los productos compiten con todos los demás) y competencia local (en el que los productos
compiten solo con sus vecinos).
El trabajo ya citado de Elhorst (2001) destaca un aspecto interesante de los avances en
cuanto a métodos de estimación. El autor analiza los métodos de estimación de un modelo de
datos de panel dinámico de efectos fijos ampliado para incluir la autocorrelación del error espacial
o una variable dependiente retrasada espacialmente. Es bien sabido que el estimador de variable
ficticia tradicional de mínimos cuadrados conduce a estimaciones inconsistentes de los parámetros
de interés. De hecho, todavía no se dispone de un procedimiento de estimación sencillo. La razón
de esto debe buscarse en el hecho de que los métodos existentes desarrollados para métodos
dinámicos (pero no espaciales) y para
6.4 Métodos de estimación alternativos 161
Los modelos de datos de panel espaciales (pero no dinámicos) pueden producir estimaciones
sesgadas cuando estos métodos se consideran conjuntamente. Para superar este problema,
primero se diferencian los modelos para eliminar los efectos fijos y luego se deriva la función de
verosimilitud incondicional teniendo en cuenta la función de densidad de las primeras
observaciones diferenciadas en cada unidad espacial. Este procedimiento produce un estimador
consistente tanto de los parámetros de respuesta como del coeficiente de autocorrelación
espacial cuando la dimensión transversal tiende a infinito y esto es independiente del tamaño de
la dimensión temporal. Las filas y las columnas de la matriz de ponderación espacial no divergen
hasta el infinito a una tasa igual (o más rápida que) la tasa del tamaño de la muestra en el
dominio de la sección transversal. El único problema que queda por resolver radica en la
estimación del efecto fijo. Este último no se puede estimar de manera consistente, ya que el
número de estos coeficientes aumenta a medida que aumenta el número de observaciones (el
problema de la maldición de la dimensionalidad ). Además, existe evidencia de que, cuando se
omiten las variables exógenas, se puede especificar la función de verosimilitud exacta, pero,
cuando, por el contrario, se incluyen variables exógenas, los valores premuestra de esta variable
(y por tanto la función de verosimilitud) solo se puede aproximar. El trabajo citado considera dos
casos para modelar los valores premuestra de las variables exógenas para las observaciones en
primeras diferencias de cada unidad espacial: la aproximación de Bhargava y Sargan (1983) y la
de Balestra y Nerlove (Balestra y Nerlove, 1966). ). La decisión de excluir variables explicativas
exógenas se basa en el hecho de que la presencia de tales variables complica aún más el
análisis, aunque en la literatura econométrica se han sugerido diferentes enfoques para tratar
los valores previos a la muestra de estas variables en un contexto dinámico.
Un problema importante que surge en los procedimientos de estimación de la dependencia

espacial se relaciona con los aspectos computacionales. Este problema, ya discutido en el
Capítulo 3.2.4, era predominante en el pasado cuando las capacidades de las computadoras
eran más limitadas. El Capítulo 3.2.4 examinó el algoritmo propuesto por Ord (1975) que
involucra una evaluación de valores propios que hizo que la estimación espacial fuera práctica
para conjuntos de datos de tamaño pequeño a moderado. En la misma línea de investigación,
Anselin (1988), Haining (1990), Anselin y Hudak (1992), Griffith (2004) y otros han trabajado en
la implementación de procedimientos de estimación espacial mediante la escritura de códigos
que reducen la carga computacional y facilitan la estimación factible en situaciones prácticas.
A pesar de las notables mejoras en las capacidades informáticas, algunas operaciones como
los determinantes, los valores propios y la evaluación inversa siguen siendo problemas sin
resolver cuando se trata de bases de datos espaciales muy grandes. Pace y Barry (1997a)
proporcionan una forma de calcular rápidamente las estimaciones de los parámetros cuando la
variable dependiente sigue un esquema autorregresivo espacial. Parten de la evidencia de que,
en algunos casos, solo unas pocas observaciones tienen influencia en los sitios vecinos, mientras
que otras tienen un efecto insignificante y, por lo tanto, la matriz de ponderación espacial puede
volverse escasa. De esta forma, al reorganizar la matriz de ponderaciones, las estimaciones de
los parámetros de interés pueden calcularse a un costo muy bajo, incluso en presencia de
grandes conjuntos de datos. Como demostración de la precisión de la técnica, el trabajo citado
proporciona evidencias de Monte Carlo del poco tiempo que necesita una computadora para
producir estimaciones en presencia de conjuntos de datos muy grandes.
Smirnov y Anselin (2001) (usando un enfoque polinomial característico), Griffith (2000,

2004) (usando aproximaciones de funciones polinómicas) y Pace y LeSage ( 2004) y Pace y
Zou (2000) (utilizando aproximaciones de Chebyshev). Pace (1997) y Pace y Berry (1997b,
1997c) también han explotado métodos exactos basados principalmente en técnicas de
descomposición para matrices dispersas (p. ej., descomposición de Choleski o Lu. Véase
Gentle, 1998; Press et al., 1992). usando una idea contenida originalmente en Arbia (1986)
6.5 Herramientas exploratorias
En aras de la exhaustividad, es necesario referirse a un último campo emergente en la

econometría espacial. Esto se refiere al conjunto de técnicas desarrolladas como una forma
preliminar de ver los datos antes de una formalización más rigurosa dentro de un modelo
econométrico espacial explicativo. Dichas herramientas se conocen en la literatura como
Análisis Exploratorio de Datos Espaciales (ESDA) y pueden verse como una extensión
natural de los métodos estadísticos conocidos como Análisis Exploratorio de Datos (EDA; ver Tuckey, 1977).
En Haining (1990; 2003) se puede encontrar una introducción general a ESDA dentro de una
aplicación estadística espacial. Los métodos ESDA están diseñados para visualizar datos,
describir la variabilidad espacial e identificar valores atípicos espaciales. Suelen adoptar la
forma de diagramas, gráficos y medidas de asociación espacial global o local. Podemos
clasificar instrumentos como el diagrama de dispersión de Moran (propuesto por Anselin,
1996), las estadísticas locales de Getis-Ord (Getis y Ord, 1992; Ord y Getis, 1995) y la clase
de Indicadores Locales de Asociación Espacial (o LISA, Anselin , 1995b) dentro de esta categoría.
Ver Haining (1990), Bailey y Gatrell (1995) y Anselin (1996) para reseñas.
Ver, también, Ertur y Le Gallo (2003) para una revisión y aplicaciones a las disparidades
regionales europeas.
Apéndice: Una revisión del software disponible para

Análisis Econométrico Espacial1
A.1 Introducción
La difusión de software estadístico ciertamente juega un papel fundamental en los estudios

empíricos. Como hemos visto en el Capítulo 4, el análisis econométrico espacial a menudo
requiere rutinas ad hoc para implementar técnicas de estimación y prueba de hipótesis.
Por lo tanto, las dificultades asociadas con la programación de tales rutinas en ausencia de un
software dedicado ciertamente ha sido uno de los factores que contribuyeron en el pasado a
la lenta difusión de los estudios empíricos en el análisis econométrico espacial.
En los últimos años, el paisaje ha cambiado drásticamente y actualmente se ofrecen al
investigador interesado varias opciones para aplicar metodologías econométricas espaciales
en casos reales.
El propósito de este apéndice es doble. Pretende tanto revisar brevemente el software
actualmente disponible para implementar un enfoque econométrico espacial de los datos
como describir las funciones principales respaldadas por los diversos programas. Al escribir
esta sección, somos conscientes de que este Apéndice está condenado a quedar obsoleto
rápidamente, dada la velocidad con la que se está desarrollando la situación en este campo.
Se remite al lector a los sitios web citados aquí para una actualización continua de la situación,
con la esperanza de los autores de que las direcciones de los sitios web no cambien tan
rápidamente como su contenido.
Hasta hace unos años (cuando ya existía una amplia difusión de software para el análisis
econométrico dinámico), el paquete SpaceStat (Anselin, 1992a; 1992b) representaba la única
oportunidad disponible para los investigadores dedicados al análisis de datos espaciales. De
hecho, hasta 1995, este fue el único software independiente e, incluso ahora, es el más
completo en términos de la gran cantidad de servicios que ofrece.
Como consecuencia, comenzaremos nuestra revisión en la Sección A.2 con este programa.
En las Secciones A.3 y A.4 consideraremos dos alternativas que están actualmente disponibles:
el paquete GeoDa y una serie de cajas de herramientas escritas en varios lenguajes de
programación. Nuestro objetivo es dar al lector algunas indicaciones y ayudarle a elegir entre
las distintas alternativas describiendo las principales funciones y utilidades que soportan.
1
Este Apéndice ha sido escrito conjuntamente con Gianfranco Piras.
164 Apéndice: Una revisión del software disponible para el análisis econométrico espacial
A.2 El Programa SpaceStat

Históricamente, SpaceStat fue el primer programa escrito para el análisis econométrico
espacial y sigue siendo el más utilizado por los investigadores en la actualidad. Antes de
SpaceStat, no había ningún otro software disponible para ejecutar análisis estadísticos
espaciales o econométricos espaciales específicos. El primer lanzamiento data de 1991 y
ha sido actualizado varias veces desde entonces. Obviamente, el objetivo de esta sección
no es dar una descripción detallada de todas las funciones que admite el programa.
Simplemente resumiremos algunas de las características principales, mientras remitimos al
lector interesado a Anselin (1992a, 1992b, 1995a) y al sitio web2 para obtener más información.
Una utilidad importante que ofrece SpaceStat se refiere a la posibilidad de imputar y
manipular matrices de pesos espaciales. El programa también presenta algunas
características relacionadas con el análisis de datos espaciales explicativos (consulte el
Capítulo 6.5), incluidas técnicas para describir y visualizar distribuciones espaciales,
identificar patrones de asociación espacial (agrupaciones espaciales) y sugerir diferentes regímenes espaciales.
Sin embargo, las herramientas más poderosas del software son aquellas relacionadas con
la estimación y la prueba de hipótesis de regresiones espaciales: permiten incorporar la
dependencia espacial y la heterogeneidad espacial dentro del marco de modelado. En
particular, el programa permite la estimación ML de los parámetros en los modelos de
retraso espacial y error espacial , así como la prueba de las diversas hipótesis de errores de
especificación, incluida la normalidad (la prueba de Jarque-Bera), la heteroscedasticidad (la
prueba de Breusch-Pagan). test) y dependencia espacial (el multiplicador de Lagrange y el
test de razón de verosimilitud).
El principal inconveniente de SpaceStat es su interfaz. El programa está escrito en el
lenguaje "Gauss" y presenta una interfaz desagradable, anticuada, en blanco y negro,
similar a Dos, caracterizada por líneas de comando, sin mouse ni comandos asistidos por
ventanas. Una extensión del programa permite el intercambio de datos con ArcView (el
Sistema de Información Geográfica producido por ESRI) y proporciona funciones que son
particularmente útiles cuando se construyen matrices de conectividad, se ejecutan análisis
de datos exploratorios y se visualizan mapas de salida.
A.3 GeoDa
GeoDa es un programa muy reciente diseñado para implementar técnicas de análisis de

datos exploratorios sobre datos espaciales en forma de puntos o polígonos en un espacio
geográfico. Representa una evolución espectacular con respecto a SpaceStat y, al igual que
su antecesor, fue desarrollado por Luc Anselin y sus colaboradores (Anselin, 2003b, 2004;
Anselin et al., 2004c). Una de sus principales ventajas sobre SpaceStat es el hecho de que
proporciona una interfaz gráfica fácil de usar basada en un entorno de Windows.
2
http://www.terraseer.com/products/spacestat.html.
A.4 Cajas de herramientas 165
El programa está pasando por una fase muy rápida de evolución. La primera versión fue
lanzada en febrero de 2003 y fue seguida por una segunda en junio de 2003. La edición más
reciente estuvo disponible en enero de 2004. Al momento de escribir este artículo, el paquete
puede descargarse de su sitio web3 sin cargo.
Hasta ahora, el programa se ha centrado principalmente en herramientas gráficas y análisis
espacial descriptivo simple, como estadísticas de autocorrelación espacial, análisis de valores
atípicos espaciales y una amplia gama de funciones relacionadas con datos espaciales explicativos.
En este sentido, permite evaluar la autocorrelación espacial global y local mediante el estadístico
de autocorrelación espacial I de Moran y la herramienta gráfica conocida como Scatter Plot de
Moran (Anselin, 1996; véase también el Capítulo 6.5).
Las rutinas de regresión econométrica espacial, por otro lado, son todavía muy limitadas en
su rango y actualmente solo permiten la estimación de la regresión lineal a-espacial clásica vía
OLS y estimadores de Máxima Verosimilitud de los parámetros asociados con el error espacial y
el rezago espacial. modelos El diagnóstico básico para la dependencia espacial, la
heteroscedasticidad espacial y la normalidad están disponibles para los residuos de regresión
OLS estándar. La inferencia asintótica se basa en el Like lihood Ratio Test y en una estimación
de la matriz de covarianza asintótica utilizando el algoritmo desarrollado por Smirnov (2003).
En cuanto a las matrices de pesos espaciales, el programa ofrece la interesante posibilidad

de construir matrices en base a diferentes criterios simplemente leyendo un mapa digitalizado (a
través de un archivo de forma). Sin embargo, los procedimientos de estimación solo admiten
estructuras simétricas para el peso espacial (p. ej., pesos de contigüidad o distancia) y no se
pueden realizar en estructuras más sofisticadas, como un esquema de ponderación de k-vecinos
más cercanos, por ejemplo.
GeoDa solo contiene unas pocas funciones dedicadas a mapear y geovisualizar datos que no
son comparables con las disponibles en los Sistemas de Información Geográfica más sofisticados.
Las funciones implementadas, sin embargo, son en general suficientes para las necesidades de
los econometristas cuyo principal interés es la descripción de datos y el análisis explicativo
preliminar. En el otro lado de la moneda, el programa es definitivamente mucho más fácil de usar
por no expertos que el GIS comercialmente disponible.
A.4 Cajas de herramientas
SpaceStat y GeoDa son los únicos productos dedicados disponibles para el análisis de datos
espaciales. Recientemente, sin embargo, un número creciente de iniciativas puestas en marcha
por investigadores individuales o grupos han puesto a disposición rutinas específicas. Estos han
sido escritos en varios lenguajes de programación y pueden ser invaluables para aquellos que
trabajan en el campo de la econometría espacial aplicada.
3
Su rutina de instalación está disponible en la dirección de Internet: http://sal.geoda.uiuc.edu/default.
Php y contiene todos los archivos y bibliotecas necesarios.
166 Apéndice: Una revisión del software disponible para el análisis econométrico espacial
Quizás las cajas de herramientas más conocidas para el análisis econométrico espacial son
las desarrolladas por Pace4 (ver Pace y Barry, 1998) y por LeSage5 . Ambos hacen uso de
rutinas de Matlab. La caja de herramientas de Kelly Pace está más orientada hacia la estimación
de modelos espaciales para grandes muestras de datos (p. ej., las que se encuentran en
aplicaciones ambientales y físicas). La caja de herramientas de James LeSage, por otro lado,
está más orientada hacia el modelado económico, con especial atención a los métodos espaciales
bayesianos (incluidas las rutinas del muestreador de Gibbs) discutidas en el Capítulo 6.2.7.
Además, proporciona rutinas para los procedimientos clásicos de prueba de hipótesis y estimación
relacionados con el modelo de retardo espacial , el modelo de error espacial y el modelo espacial
general de Anselin (ver Capítulo 4.3.7.1), así como los modelos espaciales probit, logit y tobit .
(ver Capítulo 6.2.4) y sus versiones robustas. Además, algunas rutinas también están disponibles
para estimar rápidamente modelos espaciales utilizando la técnica GMM (consulte la Sección
6.2.8) y probar la precisión a través de simulaciones de Monte Carlo. La biblioteca también cuenta
con procedimientos especializados de matriz dispersa para manejar grandes conjuntos de datos.
En total, la caja de herramientas econométricas de LeSage contiene alrededor de 50 funciones
de Matlab y las funciones econométricas espaciales constituyen solo una parte.
La caja de herramientas de Stata muestra características similares. Esta biblioteca contiene
diagnósticos de regresión, estimación de máxima verosimilitud y rutinas para implementar el
estimador Conley GMM (Conley, 1999). Véase Pisati (2001)6 para una descripción detallada.
Existen muchas comunidades web que ponen a disposición programas y rutinas para la
econometría espacial. Uno que merece especial atención es el basado en el lenguaje de
programación R7 y vinculado a la iniciativa R-Geo. Esta biblioteca tiene muchas funciones nuevas
para analizar datos espaciales, incluidas estadísticas de autocorrelación espacial descriptivas y
un conjunto completo de funciones econométricas espaciales.
SPDEP (herramientas de análisis espacial)8 de Bivand también está escrito en el lenguaje R y
proporciona programas para el análisis de regresión y autocorrelación espacial (ver Bivand y
Gebhardt, 2000; Bivand, 2002, y Bivand y Portnov, 2004).
Por último, pero no menos importante, la extensión S+SpatialStats del paquete estadístico S-
PLUS (Kaluzny et al., 1997) incluye algunas rutinas de regresión espacial9 y la extensión
Geobugs del programa Winbugs10 contiene rutinas específicamente dedicadas a Gibbs sampler
y Monte Carlo . Estimación del modelo espacial Markov Chain (MCMC).
4
Disponible en el sitio web http://www.spatial-statistics.com/.
5
La caja de herramientas de econometría de LeSage se puede descargar sin cargo desde el sitio web: http://
www.spatial-econometrics.com/.
6
Para la caja de herramientas de Stata, consulte el sitio web http://www.faculty.econ.nwu.edu/faculty/conley/
statacode.html.
7
Consulte el sitio web http://sal.uiuc.edu/csiss/Rgeo/.
8
Consulte el sitio web http://cran.r-project.org/src/contrib/packages.html.
9
Consulte el sitio web http://www.insightful.com/products/splus/default.asp.
10
Consulte http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml.
Referencias
Agresti A., 1990. Análisis de datos categóricos, Wiley, Nueva York.
Aitkin M., Anderson DA, Francis BJ y Hinde JP, 1989. Modelo estadístico
ling en GLIM, Clarendon Press, Oxford.
Aitchinson J. y Silvey SD, 1958. Estimación de máxima verosimilitud de parámetros sujetos a

restricciones, Annals of Mathematical Statistics, 29: 813-828.
Aitchinson J. y Silvey SD, 1960. Procedimientos de estimación de máxima verosimilitud y

pruebas asociadas de significancia, Journal of the Royal Statistical Society, Serie B, 22:
154-171.
Alfò M. y Postiglione P., 2002. Modelado semiparamétrico de observaciones binarias espaciales,

Modelado estadístico, Arnold Publishers, 2: 123-137.
Ali MM y Giacotto C., 1984. Un estudio de varias pruebas nuevas y existentes para
heterocedasticidad en el modelo lineal general, Journal of the American Statistical
Association, 80: 730-735.
Andrews DWK, 1991. Heterocedasticidad y covariable consistente con autocorrelación

estimación de la matriz de ance, Econometrica, 59: 817-858.
Anselin L., 1980. Estimation Methods for Spatial Autoregressive Structures, Ithaca, NY,
Universidad de Cornell, Disertación científica regional y serie de monografías, no. 8.
Anselin L., 1987a. Validación de modelos en econometría espacial: revisión y evaluación de

enfoques alternativos, International Regional Science Review, 11:279-316.
Anselin L., 1987b. Dependencia espacial y heterogeneidad espacial: una mirada más cercana a
los enfoques de modelado alternativos, documento de trabajo, Departamento de Geografía,
Universidad de California, Santa Bárbara, CA.
Anselin L., 1988. Econometría espacial, métodos y modelos, Kluwer Academic,

Bostón.
Anselin L., 1992a. SpaceStat: un programa para el análisis de datos espaciales, Centro Nacional
de Información y Análisis Geográfico, Universidad de California, Santa Bárbara, CA.
Anselin L., 1992b. Tutorial de SpaceStat: un libro de trabajo para usar SpaceStat en el análisis
de datos espaciales, Centro Nacional/er* para Información y Análisis Geográficos,
Universidad de California, Santa Bárbara, CA.
168 Referencias
Anselin L., 1995a. Guía del usuario de la versión 1.80 de SpaceStat, Instituto Regional de Investigación,
Universidad de West Virginia, Morgantown, Virginia Occidental.
Anselin L., 1995b. Indicadores locales de asociación espacial – LISA, Análisis Geográfico, 27(2): 93-115.
Anselin L., 1996. El diagrama de dispersión de Moran como herramienta exploratoria de análisis de datos
espaciales para evaluar la inestabilidad local en la asociación espacial, en MM Fischer, HJ
Scholten y D. Unwin (eds.), Perspectiva analítica espacial sobre SIG, Taylor & Francis, Londres,
111-125
Anselin L., 2001a. Econometría espacial, en BH Baltagi (ed.), A Companion to Theoretical Econometrics,
Basil Blackwell, Oxford: 310-330.
Anselin L., 2001b. Prueba de puntaje de Rao en econometría espacial, Journal of Statistical
Planificación e Inferencia 97(1): 113-139.
Anselin L., 2002. Bajo el capó: problemas en la especificación e interpretación de modelos de regresión
espacial, Agricultural Economics, 17: 247-267.
Anselin L., 2003a. Externalidades espaciales, multiplicadores espaciales y econometría espacial,

International Regional Science Review, 26: 147-152.
Anselin L., 2003b. Guía de Usuario de GeoDa 0.9, Laboratorio de Análisis Espacial (SAL).
Departamento de Economía Agrícola y del Consumidor, Universidad de Illinois, Urbana-Champaign,
IL.
Anselin L., 2004. Notas de versión de GeoDa 0.95, Laboratorio de análisis espacial (SAL).
Departamento de Economía Agrícola y del Consumidor, Universidad de Illinois, Urbana-Champaign,
IL.
Anselin L. y Bera AK, 1998. Dependencia espacial en modelos de regresión lineal con una introducción a
la econometría espacial, en A. Ullah y D. Giles (eds.), Handbook of Applied Economic Statistics,
Marcel Dekker, Nueva York: 237-
289.
Anselin L. y Florax R., 1995. New Directions in Spatial Econometrics,

Springer-Verlag, Nueva York.
Anselin L. y Griffith DA, 1988. ¿Realmente importan los efectos espaciales en el análisis de regresión?
Documento de la Asociación Regional de Ciencias, 65: 11-34
Anselin L. y Hudak S., 1992. Econometría espacial en la práctica: una revisión de opciones de software,
Regional Science and Urban Economics, 22: 509-536.
Anselin L. y Kelejian HH, 1997. Pruebas de autocorrelación de errores espaciales en presencia de

regresores endógenos, International Regional Science Review, 20: 153-180.
Anselin L. y Moreno R., 2003. Propiedades de las pruebas para componentes de error espacial, Regional
Science and Urban Economics, 33, 5: 595-618.
Anselin L. y Rey S., 1991. Propiedades de las pruebas de dependencia espacial en lineal
modelos de regresión, Análisis Geográfico, 23: 110-131.
Referencias 169
Anselin L., Bera AK, Florax RJGM y Yoon MJ, 1996. Pruebas de diagnóstico simples para la
dependencia espacial, Regional Science and Urban Economics, 26: 77-
104.
Anselin L., Florax RJGM y Rey S., 2004. Avances en econometría espacial: metodología,
herramientas y aplicaciones, Springer-Verlag, Nueva York.
Anselin L., Le Gallo J. y Jayet H., 2004b. Econometría de panel espacial, en L.

Matyas y P. Sevestre (eds), The Econometrics of Panel Data, tercera edición, Kluwer
Academic Publishers, Dordrecht.
Anselin L., Syabri I. y Kho Y., 2004c. GeoDa: una introducción a los datos espaciales
análisis, Análisis Geográfico. Próximo.
Anselin L., Varga A. y Acs Z., 1997. Efectos indirectos geográficos locales entre la investigación
universitaria y las innovaciones de alta tecnología, Journal of Urban Economics, 42: 422-448.
Arbia G., 1986. Sobre la simulación de procesos estocásticos estacionarios bidimensionales:

una comparación de diferentes enfoques, en F. De Antoni, C. Lauro y A.
Rizzi (eds), Actas del Séptimo Simposio de Estadística Computacional, Comunicaciones
Breves y Pósters, Physica-Verlag, Roma: 17 – 18.
Arbia G., 1989. Configuración de datos espaciales en el análisis estadístico de la economía

regional y problemas relacionados, Kluwer Academic Publishers, Dordrecht.
Arbia G., 1992. Sulla verifica empirica di teorie economiche: serie storiche o serie spaziali,
Rassegna di Statistiche del Lavoro, Centro Studi Confindustria, 3: 97-105, Roma.
Arbia G., 1993. Recenti sviluppi nella modellistica spaziale, en S. Zani (ed) Meto di statistici per
le analisi territoriali, Franco Angeli Editore, Milán: 193-217.
Arbia G., 1995a. Actualización de los diseños de muestreo existentes en estudios ambientales
repetidos. Documento de trabajo, Padua, 6.
Arbia G., 1995b. Le relazioni degli aggregati economici nel tempo e nello spazio, en G. Alvaro
(ed), Contabilita' Nazionale e Statistica Economica, Cacucci edi tore, Segunda edición, Bari:
883-958.
Arbia G., 2001a. Modelando la geografía de las actividades económicas en un espacio continuo,
Papers in Regional Sciences, 80: 411-424.
Arbia G., 2001b. El papel de los efectos espaciales en el análisis empírico de la concentración
regional, Journal of Geographical Systems, 3: 271-281.
Arbia G., 2003. Valor en riesgo bivariado, Statistica, 2: 231-247.
Arbia G., 2004. Enfoques alternativos a la convergencia regional explotando información espacial
y temporal. Para aparecer en Estudios de Economía Aplica da, 22(2): 429-448.
Arbia, G. y Basile, R. 2005. Dependencia espacial y no linealidades en las

comportamiento del crecimiento en Italia, Statistica, Bolonia (en prensa).
170 Referencias
Arbia G. y Costantini M., 2004. Prueba de la convergencia estocástica de las regiones italianas
utilizando datos de panel. Ponencia presentada en la Conferencia y Taller "Ciencias de la
Gestión Computacional" sobre "Econometría y Estadística Computacional", abril, Neuchâtel,
Suiza. Para aparecer en Applied Economics Letters, Routledge.
Arbia G. y Espa G., 1996a. Statistica Economica Territoriale, CEDAM, Padua.
Arbia G. y España G., 1996b. Pronóstico de modelos estadísticos de sitio arqueológico

ubicación, Archeologia e Calcolatori, Roma.
Arbia G. y Lafratta G., 1997. Evaluación y actualización del diseño muestral: el caso de la
concentración de SO2 en Padua, Journal of Agricultural, Biological and Environmental
Statistics, 2(4): 451-466.
Arbia G. y Lafratta G., 2001. Diseños de muestreo espacial optimizados bajo modelos
unisotrópicos de superpoblación, Journal of the Royal Statistical Society, Series C – Applied
Statistics, 51, 2: 223-241.
Arbia G. y Piras G., 2005. Convergencia del PIB per cápita en las regiones EU-NUTS2 utilizando
modelos de datos de panel extendidos a efectos de autocorrelación espacial, documento
de trabajo REAL T03-05, Universidad de Illinois en Urbana-Champain.
Arbia G. y Paelinck JHP, 2003a. Modelado econométrico espacial de convergencia regional en

tiempo continuo, International Regional Science Review, 26: 342-362.
Arbia G. y Paelinck JHP, 2003b. Modelado econométrico espacial de convergencia regional en

tiempo continuo, Journal of Geographical Systems, 5: 291-314.
Arbia G. y Switzer P., 1994. Diseños óptimos de muestreo espacial paso a paso, Trabajo
ing Paper, Universidad de Padua.
Arbia G., Basile R. y Piras G., 2005. Uso de datos de panel espacial para modelar el crecimiento
y la convergencia regionales, ISAE Working Paper, no. 51-2005.
Arbia G., Basile R y Salvatore M., 2002. Convergencia regional en Italia 1951-
1999: una perspectiva econométrica espacial, ISAE Working Paper, 29/02.
Arbia G., Basile R. y Salvatore M., 2003. Efectos espaciales en el crecimiento regional. Un
enfoque paramétrico y no paramétrico. Documento presentado en la conferencia Analytical
Frontiers in Spatial Aspects of Economic Development, mayo, WIDER, Helsinki.
Arbia G., Benedetti R. and Espa G., 1996. Effects of MAUP on image classifica
ción, Geographical Systems, 3: 123-141.
Arbia, G, Le Gallo, J. y Piras, G. 2005. A meta-analysis of Regional Conver gence of the

NUTS-2 Europeanregions, 1977-2002, Documento presentado en el 45º Congreso de
ERSA, Vrije Universitat, Amsterdam , agosto de 2005, presentado a Spatial Economic
Analysis, Routledge.
Referencias 171
Aten B., 1996. Evidencia de autocorrelación espacial en precios internacionales, Review of

Income and Wealth, 42: 149-163
Aten B., 1997. ¿Importa el espacio? Comparación internacional de precios de bienes

comerciables y no comerciables, International Regional Science Review, 20: 35-52.
Azariadis C. y Drazen A., 1990. Umbral de externalidades en el desarrollo económico

ment, Quarterly Journal of Economics, 105: 501-526.
Azzalini A., 1996. Inferencia estadística: basada en la probabilidad, Chapman y Hall,

Londres.
Bailey T. y Gatrell AC, 1995. Análisis interactivo de datos espaciales, Longman,

Harlow.
Balestra P. y Nerlove M., 1966. Combinación de datos transversales y de series temporales

en la estimación de un modelo dinámico: la demanda de gas natural. Econométrica, 34:3.
Baltagi BH, 1999. Econometrics, (tercera edición), Springer Verlag, Berlín.
Baltagi BH, 2001. Análisis econométrico de datos de panel (segunda edición), John Wiley and
Sons, Chichester, Inglaterra.
Baltagi BH y Li D., 1999. Regresiones artificiales de doble longitud para probar la dependencia
espacial, Econometric Review, 20: 31-40.
Baltagi BH, Song SH y Koh W., 2003. Prueba de modelos de regresión de datos de panel con
correlación de error espacial, Journal of Econometrics, 117: 123-150.
Banerjee S., Carlin Bp y Gelfand AE, 2004. Modelado y análisis jerárquico de datos espaciales,
Chapman & Hall/CRC, Boca Raton.
Barro RJ y Sala-i-Martin X., 1995. Crecimiento económico, McGraw-Hill.
Bhargava A. y Sargan JD, 1983. Estimación de modelos de efectos aleatorios dinámicos a

partir de datos de panel que cubren períodos de tiempo cortos, Econometrica,
Econometric Society, vol. 51(6), 1635-59.
Bartels C., 1979. Métodos estadísticos operativos para analizar datos espaciales. Cª.
Bartels y R. Ketellapper (eds.), Análisis exploratorio y explicativo de datos espaciales,
Martinus Nijhoff, Boston: 5-50.
Bartlett MS, 1963. El análisis espectral de los procesos puntuales, Journal of the Royal
Statistical Society, B, 25: 264-281.
Bartlett MS, 1971. Modelos físicos del vecino más cercano y series temporales no lineales,
Revista de Probabilidad Aplicada, 8: 222-232.
Bartlett MS, 1975. El análisis estadístico del patrón de puntos, Advances in Applied Probability,
6: 336-358.
Bartlett MS y Besag J., 1969. Propiedades de correlación de algunos modelos de vecinos

más cercanos, Boletín del Instituto Internacional de Estadística, 43(2): 191-193.
172 Referencias
Basu S. y Thibodeau TG, 1998. Análisis de la autocorrelación espacial en los precios de la

vivienda, The Journal of Real Estate Finance and Economics, 17: 61-85.
Bates C. y White H., 1985. Una teoría unificada de estimación consistente para modelos
paramétricos, Econometric Theory, 1: 151-78.
Baumont C., Ertur C. y Le Gallo J., 2003. Los clubes de convergencia espacial y el proceso
de crecimiento regional europeo, 1980-1995, en B. Fingleton (ed.), Crecimiento regional
europeo, Springer-Verlag, Berlín.
Baumont C., Ertur C. y Le Gallo J., 2004. Análisis espacial del empleo y la densidad de
población: el caso de la aglomeración de Dijon, 1999, Análisis geográfico, 36, 2, 146-176.
Bennett RJ, 1979. Análisis espacial de series de tiempo, pronóstico y control, Pion,
Londres.
Bera AK y Jarque CM, 1982. Pruebas de especificación de modelos: un ap simultáneo

enfoque, Journal of Econometrics, 20: 59-82.
Bergstrom AR, 1990. Modelado econométrico de tiempo continuo, Universidad de Oxford

City Press, Oxford.
Bernard AB y Durlauf SN, 1995. Convergencia en la producción internacional, Jour

final de Econometría Aplicada, 10: 97-108.
Bernard AB y Durlauf SN, 1996. Pruebas de interpretación de la hipótesis de convergencia,

Journal of Econometrics, 71: 161-173.
Bernard AB y Jones C., 1996. Tecnología y convergencia, Economic Jour

nal, 106.
Berndt ER, 1991. La práctica de la econometría, clásica y contemporánea, anuncio

Dison-Wesley Publishing Company, Lectura.
Beron KJ y Vijverberg WP, 2004. en L. Anselin, RJGM Florax y S. Rey (eds.), Advances in
Spatial Econometrics: Methodology, Tools and Applications, Springer-Verlag, Berlín.
Beron KJ, Murdoch JC y Vijverberg WP, 2003. ¿Por qué cooperar? Bienes públicos, poder
económico y el protocolo de Montreal, The Review of Economics and Statistics, 85:
286-297.
Besag J., 1972. Sobre el análisis estadístico de los sistemas de vecinos más cercanos,
Actas de la Reunión Europea de Estadísticos, Budapest.
Besag J., 1974. Interacción espacial y análisis estadístico en sistemas de celosía, Journal of
Royal Statistical Society, Serie B, 36: 192-236.
Besag J., 1975. Análisis estadístico de datos sin celosía, The Statistician, 24: 179-195.
Besag J., 1986. Sobre el análisis estadístico de imágenes sucias, Journal of the Royal
Sociedad de Estadística, Serie B, 36: 192-236.
Referencias 173
Besag, J., York J. y Mollié A., 1991. Restauración de imágenes bayesianas con dos
aplicaciones en estadísticas espaciales, Ann. Inst. Estadística Matemática, 43: 1-21
Bivand RS, 2002. Funciones de econometría espacial en R: clases y métodos,
Revista de Sistemas Geográficos, 4: 405–421.
Bivand RS y Gebhardt A., 2000. Implementación de funciones para el análisis estadístico
espacial utilizando el lenguaje R, Journal of Geographical Systems, 2: 307–317.
Bivand RS y Portnov BA, 2004. Exploración de técnicas de análisis de datos espaciales
usando R: el caso de observaciones sin vecinos, en L. Anselin, RJGM
Florax y S. Rey, 2004, Advances in Spatial Econometrics, Springer-Verlag, Berlín.
Box GEP y Cox DR, 1964. Un análisis de la transformación, Journal of the Royal Statistical
Society, Serie B, 26: 211-243.
Box GEP y Jenkins GM, 1970. Análisis de series de tiempo, pronóstico y contra
trol, Wiley.
Box GEP y Pierce DA, 1970. La distribución de la autocorrelación residual en modelos de
series de tiempo de promedio móvil integrado autorregresivo, Journal of the American
Statistical Association, 65: 1509-1526.
Box GEP y Cox DR, 1964. Un análisis de la transformación, Journal of the

Sociedad Real de Estadística, Serie B, 26, 211-43.
Brett C. y Pinkse J., 1997. ¡Esos impuestos por todo el mapa! Una prueba de
independencia espacial de las tasas impositivas municipales en Columbia Británica,
International Regional Science Review, 20, 131-151.
Breusch TS y Pagan AR, 1979. Una prueba simple para la heteroscedasticidad y la
variación del coeficiente aleatorio, Econometrica, 47: 1287-1294.
Brock WA, Dechert WD y Scheinkman J., 1987. Una prueba de independencia basada en
la dimensión de correlación, Documento de trabajo 8702 de SSRI, Madison:
Departamento de Economía, Universidad de Wisconsin, Brook D., 1964. Sobre la
distinción entre la dimensión condicional probabilidad y los enfoques de probabilidad
conjunta en la especificación de sistemas de vecinos más cercanos, Biometrika, 51,
481-3.
Burridge P., 1980. Sobre la prueba de Cliff-Ord para la autocorrelación espacial, Journal of
the Royal Statistical Society, Serie B, 42: 107-108.
Caso AC, Rosen H. y Hines JR, 1993. Desbordamientos presupuestarios e interdependencia
de la política fiscal: evidencia de los Estados, Journal of Public Economy, 52: 285-307.
Chapman RN, 1931. Ecología animal con referencia particular a los insectos,
McGraw-Hill, Nueva York.
Chen X. y Conley TG, 2001. Un nuevo modelo espacial semiparamétrico para series de
tiempo de panel, Journal of Econometrics, 105: 59-80.
174 Referencias
Chow G., 1960. Pruebas de igualdad entre conjuntos de coeficientes en dos regresiones lineales,
Econometrica, 28: 591-605.
Clayton D. y Kaldor J., 1987. Estimaciones empíricas de Bayes de riesgos relativos estandarizados
por edad para su uso en el mapeo de enfermedades, Biometrics, 43: 671-681.
Cliff AD y Ord JK, 1972. Pruebas de autocorrelación espacial entre residuos de regresión,
Geographical Analysis, 4: 267-84.
Cliff AD y Ord JK, 1973. Autocorrelación espacial, Pion, Londres.
Cliff AD y Ord JK, 1981. Procesos espaciales: modelos y aplicaciones, Pion,

Londres.
Cochrane D. y Orcutt GH, 1949. Aplicación de la regresión de mínimos cuadrados a las relaciones
que contienen términos de error autocorrelacionados, Journal of the American Statistical
Association, 44: 32-61
Collett D., 1991. Modelado de datos binarios, Chapman and Hall, Nueva York.
Conley TG, 1999. Estimación GMM con dependencia transversal, Journal of Econometrics, 92: 1-45.
Conley TG y Topa G., 2002. Distancia socioeconómica y patrones espaciales en el desempleo,

Journal of Applied Econometrics, 17: 303-327.
Consigliere I., 1981. La prueba de Chow con errores correlacionados en serie, Rivista Inter
nazionale di Scienze Sociali, 89: 125-37.
Corsi P., Pollock R. y Prakken J., 1982. La prueba de Chow en presencia de errores
correlacionados en serie, en Chow y Corsi (eds.), Evaluating the Reliability of Macro-economic
Models, Nueva York, Wiley: 163 -87.
Cox DR, 1970. Análisis de datos binarios, Methuen, Londres.
Cox DR y Snell EJ, 1989. Analysis of Binary Data (segunda edición), Londres:
Chapman y Hall.
Cressie N., 1991. Estadísticas para datos espaciales, Wiley, Nueva York.
Cross GR y Jain AK, 1983. Modelos de textura de campos aleatorios de Markov, IEEE Transaction
on Pattern Analysis and Machine Intelligence, PAMI, 1-5, 1: 25-39.
Christakos G., 1992. Modelos de campo aleatorio en ciencias de la tierra, Academic Press,
San Diego.
Davidson J., 2000. Teoría econométrica. Editorial Blackwell.
Davidson R. y MacKinnon JG, 1993. Estimación e inferencia en econometría, Oxford University

Press, Oxford.
de Graaff T., Florax RJGM, Nijkamp P. y Reggiani A., 2001. Una prueba general de mala
especificación para modelos de regresión espacial: heteroscedasticidad, dependencia y no
linealidad, Journal of Regional Sciences, 41: 255-276.
Referencias 175
DeLong J. y Summers L., 1991. Inversión en equipos y crecimiento económico,

The Quarterly Journal of Economics, 106: 445-502.
Dobrushin RL, 1968. Descripción de un campo aleatorio mediante probabilidades

condicionales y las condiciones que gobiernan su regularidad, Theory of Probability and
its Applications, 13: 197-224.
Doreian P., 1980. Modelos lineales con datos distribuidos espacialmente, ¿perturbación
espacial o efectos espaciales?, Sociological Methods and Research, 9: 29-60.
Dougherty M., 2002. Introducción a la econometría (segunda edición).
Douglas PH, 1934. Teoría de los salarios, MacMillan, Nueva York.
Dowde MR y LeSage JP, 1997. Análisis de las influencias de la contigüidad espacial en la

formación de precios estatales, International Journal of Forecasting, 13: 245-253.
Driscoll JC y Kraay AC, 1998. Estimación de matriz de covarianza consistente con datos de
panel espacialmente dependientes, The Review of Economics and Statistics, 80: 549-560.
Dubin R., 1988. Estimación de coeficientes de regresión en presencia de términos de error

espacialmente autocorrelacionados, Review of Economics and Statistics, 70: 466-474.
Dubin R., 1992. Autocorrelación espacial y calidad de vecindario, Regional

Ciencias y Economía Urbana, 22: 433-452.
Dubin R., 2003. Robustez de la especificación de autocorrelación espacial, algunas pruebas

de Monte Carlo, Journal of Regional Sciences, 43: 221-248.
Durbin J., 1960. Estimación de parámetros en modelos de regresión de series temporales,

Journal of the Royal Statistical Society, Serie B, 22: 559-566.
Durbin J., 1973. Teoría de distribución para pruebas basadas en la función de distribución de
muestra, SIAM, Filadelfia.
Durbin J. y Watson GS, 1950. Pruebas de correlación serial en regresión de mínimos

cuadrados I, Biometrika, 37: 409-428.
Durbin J. y Watson GS, 1951. Prueba de correlación serial en mínimos cuadrados

regresión II, Biometrika, 38: 159-178.
Durlauf SN y Johnson PA, 1995. Regímenes múltiples y comportamiento de crecimiento

entre países, Journal of Applied Econometrics, 10: 365-384.
Durlauf SN y Quah D., 1999. The new empirics of economic growth, en: J. Taylor y M.
Woodford (eds), Handbook of Macroeconomics, Elsevier Science, North Holland, New
York and Oxford: 235-308.
Edgard GA, 1995. Medida, Topología y Geometría Fractal, Springer-Verlag,

Berlina.
Elhorst JP, 2001. Modelos dinámicos en el espacio y el tiempo, Análisis geográfico, 33:
119-140.
176 Referencias
Elhorst JP, 2003. Especificación y estimación de modelos de datos de panel espacial,

International Regional Science Review, 26: 244-268.
Engle RF, Hendry DF y Richard J.-F., 1983. Exogeneity, Econometrica, 51:
277-304.
Unión Europea. 2005. Tercer informe de situación sobre la cohesión: hacia una nueva
asociación para el crecimiento, el empleo y la cohesión, Comunicación de la Comisión
de la Comunidad Europea, SEC (2005), 632, mayo, Luxemburgo.
Ertur C. y Le Gallo J., 2003. Un análisis exploratorio de datos espaciales de las disparidades
regionales europeas, 1980-1995, en B. Fingleton (ed), Crecimiento regional europeo,
Sprinter, Berlín.
Eurostat, 2002. Estadísticas regionales europeas, Guía de referencia, Comunidad
Europea, Luxemburgo.
Evans MA y King ML, 1988. Otra clase de pruebas de heterocedasticidad, Journal of
Econometrics, 27: 163-178.
Evans P. y Karras G., 1996a. ¿Convergen las economías? Evidencia de un panel de
estados de EE. UU., Review of Economics and Statistics, : 384-388.
Evans P. y Karras G., 1996b. Convergence Revisited, Journal of Monetary
Economía, 37: 249-265.
Fabiani S. y Pellegrini G., 1997. Educación, infraestructura, geografía y crecimiento: un

análisis empírico del desarrollo de las provincias italianas, Temi di Discussione, Banco
de Italia, Roma.
Feller W., 1948. Sobre los teoremas del límite de Kolmogorov-Smirnov para distribuciones
empíricas, Annals of Mathematical Statistics, 30: 381.
Fingleton B., 1999. Regresión espacial espuria: algunos resultados de Monte Carlo con
una raíz unitaria espacial y cointegración espacial, Journal of Regional Sciences, 39: 1-
19
Fingleton B., 2003. Crecimiento regional europeo, Springer-Verlag, Berlín.

Fingleton B., 2004. Crecimiento económico regional y convergencia: conocimientos desde
una perspectiva econométrica espacial, en L. Anselin, RJGM Florax y S. Rey (eds.),
Avances en econometría espacial: metodología, herramientas y aplicaciones, Springer-
Verlag , Nueva York.
Fleissig A. y Strauss J., 2001. Pruebas de raíz unitaria de panel de la conversión estocástica de la OCDE
gencia, Review of International Economics, 9: 153-162.
Fleming MM, 2004. Técnicas para estimar modelos de elección discreta espacialmente
dependientes, en L. Anselin, RJGM Florax y S. Rey (eds.), Advances in Spatial
Econometrics: Methodology, Tools and Applications, Springer Verlag, Nueva York:
145-168 .
Referencias 177
Florax RJGM y de Graaff T., 2004. El rendimiento de las pruebas de diagnóstico para la
dependencia espacial en modelos de regresión lineal: un metanálisis de estudios de
simulación, en L. Anselin, RJGM Florax y S. Rey (eds.), Advances in Econometría
espacial: metodología, herramientas y aplicaciones, Springer-Verlag, Nueva York.
Florax RJGM y Rey S., 1995. El impacto de la estructura espacial mal especificada en modelos
de regresión lineal, en L. Anselin y RJGM Florax (eds.), New Di rections in Spatial
Econometrics, Springer-Verlag, Nueva York: 111- 135.
Florax RJGM y van de Vlist A., 2003. Análisis de datos econométricos espaciales: ir más allá
de los modelos tradicionales, International Regional Science Review, 26: 233-243.
Florax RJGM, De Dominicis L. y De Graaff T., 2004. Procesos ARCH espaciales: una prueba
LM, resultados de simulación experimental e ilustraciones empíricas.
Documento presentado en la 50.ª Conferencia Norteamericana de la Regional Science
Association International (RSAI), Filadelfia, noviembre de 2003.
Florax RJGM, Folmer H. y Rey SJ, 1998. La relevancia de la metodología de Hendry:

resultados de simulación experimental para modelos espaciales lineales, documento de
trabajo 98, 125/4 Instituto Tinberger, Ámsterdam, Países Bajos.
Fujita M., Krugman P. y Venables AJ, 1999. La economía espacial: ciudades, regiones y
comercio internacional, MIT Press, Nueva York.
Galambos J., 1988. Métodos de truncamiento en la teoría de la probabilidad, en S. Kotz y NL

Johnson (eds.), Enciclopedia de Ciencias Estadísticas, Wiley, Nueva York: 355-
357.
Galor O., 1996. ¿Convergencia? Inferencia a partir de modelos teóricos, Económica

Diario, 106: 1056-1069.
Gandolfo G., 1981. Análisis Cualitativo y Estimación Econométrica de Continu

oustime Dynamic Models, Holanda Septentrional.
Garrett TA, Wagner GA y Wheelock DC, 2003. Un análisis probit espacial de la regulación
bancaria estatal, documento de trabajo 044A, Banco de la Reserva Federal de St.
Louis, St. Louis, MO.
Geman S. y Graffigne C., 1987. Campos aleatorios de Markov y sus aplicaciones a la visión
por computadora, en A. Gleason (ed), Actas del Congreso Internacional de Matemáticas,
American Mathematical Society, Providence.
Gentle JE, 1998. Factorización de Cholesky. §3.2.2 en Álgebra Lineal Numérica para
Aplicaciones en Estadística. Springer-Verlag, Berlín: 93-95.
Getis A. y Aldstadt J., 2004. Sobre la especificación de la matriz de pesos espaciales.

Análisis geográfico, 35.
Getis A. y Griffith DA, 2002. Filtrado espacial comparativo en regresión

análisis, Análisis Geográfico, 34: 130-140.
178 Referencias
Getis A. y Ord JK, 1992. El análisis de la asociación espacial mediante estadísticas de distancia.
tics, Análisis Geográfico, 24: 189-206.
Giacomini R. y Granger CWJ, 2003. Agregación de procesos de espacio-tiempo,

Revista de Econometría.
Glejser H., 1969. Una nueva prueba de heterocedasticidad, Journal of the American Statistical
Association, 64: 316-323.
Godfrey LG, 1978. Pruebas de heteroscedasticidad multiplicativa, Journal of

Econometría, 8: 227-236.
Goldberg AS, 1998. Introductory Econometrics Goldfeld , Mundo de la edición de Harvard.
SM y Quandt RE, 1965. Some tests for homocedasticity, Journal

de la Asociación Estadounidense de Estadística, 60, 539-547.
Gourieroux C. y Montfort A., 1995. Modelos estadísticos y econométricos, vols. 1 y 2, Cambridge

University Press.
Granger CWJ, 1969. Datos espaciales y análisis de series temporales, en A. Scott (ed), Stud
ies en Regional Science, Pion, Londres.
Granger CWJ, 1974. Aspectos del análisis e interpretación de los datos temporales y
datos espaciales, The Statistician, 24: 197-210.
Greene WH, 2003. Análisis econométrico (quinta edición), Nueva York, Macmillan.
Gress B., 2003. Modelos semiparamétricos de autocovarianza espacial, tesis doctoral.
Griffith DA, 1988. Estadística espacial avanzada, Kluwer Academic Publishers,

Dordrecht.
Griffith DA, 2000. Propiedades de funciones propias y aproximaciones de matrices de incidencia

seleccionadas empleadas en análisis espacial, Linear Algebra and its Applications, 321:
95-112.
Griffith, DA, 2003. Autocorrelación espacial y filtrado espacial, Springer Verlag, Berlín.
Griffith DA 2004. Funciones propias extremas de matrices de adyacencia para gráficos planos
empleados en análisis espaciales, Linear Algebra and its Applications, 388: 201-219.
Griffith DA y Tiefelsdorf M., 2002. Filtrado semiparamétrico de la autocorrelación espacial: el

enfoque del vector propio. Trabajo presentado en las Reuniones Norteamericanas de la
Regional Sciences Association International, noviembre, San Juan, Puerto Rico.
Grimmett GR, 1973. Un teorema sobre campos aleatorios, Bulletin of the London
Sociedad Matemática, 79: 5.
Grimmett GR y Stirzaker DR, 1994. Probabilidad y procesos aleatorios.

Clarendon Press, Oxford, Reino Unido.
Gujarati D., 2003. Econometría básica, (cuarta edición), McGraw-Hill.

Referencias 179
Guyon X., 1995. Campos aleatorios en una red, Springer-Verlag, Berlín.
Haining RP, 1978. El modelo de promedio móvil para la interacción espacial, Transac
Instituto Nacional de Geógrafos Británicos, NS 3: 202-225.
Haining RP, 1990. Análisis de datos espaciales en las ciencias sociales y ambientales, Cambridge
University Press, Cambridge.
Haining RP, 2003. Análisis de datos espaciales, Cambridge University Press, Cam
puente.
Hamilton JD, 1994. Análisis de series temporales, Princeton University Press, Princeton,
New Jersey.
Hammersey JM y Clifford P., 1971. Campos de Markov en redes de gráficos finitos,

manuscrito inédito.
Hansen LP, 1982. Propiedades de muestras grandes de la estimación generalizada del método de los
momentos, Econometrica, 1029-1054.
Harrison MJ y McCabe BP, 1979. Una prueba de heterocedasticidad basada en residuos de mínimos
cuadrados ordinarios, Journal of the American Statistical Association, 74: 494-499.
Harvey A. y Carvalho V., 2002. Modelos para economías convergentes, Cambridge Working Paper,
marzo.
Hausdorff F., 1914. Gundzüge der Mengenlehre, Von Vent, Leipzig, Alemania.
Reimpreso como Teoría de conjuntos, (segunda edición), Chelsea, Nueva York, 1962.
Hayashi F., 2000. Econometría, Princeton University Press.
Heijmans R. y Magnus J., 1986. Estimación consistente de máxima verosimilitud con observaciones
dependientes: el caso general (no normal) y el caso normal, Journal of Econometrics, 32: 253-285.
Hendry DF y Morgan MS, 1995. Los fundamentos del análisis econométrico.

Prensa de la Universidad de Cambridge, Cambridge.
Hepple LW, 2003. Elección del modelo bayesiano en econometría espacial, Documento para LSU,
Conferencia de econometría espacial, Baton Rouge, noviembre.
Holloway G., Shankar B. y Rahman S., 2002. Estimación probit espacial bayesiana: una cartilla y una
aplicación para la adopción de arroz HYV, Agricultural Economics, 27: 383-402.
Holly S. y Weale M., 2000. Modelado econométrico, Cambridge University Press, Cambridge.
Hordijk L., 1974. Correlación espacial en la perturbación de modelos lineales interregionales, Regional
Science and Urban Economics, 4: 117-40.
Hsiao C., 1986. Análisis de datos de panel, Cambridge University Press, Cambridge.
Huang JS, 1984. El modelo de promedio móvil autorregresivo para el análisis espacial,
Diario australiano de estadísticas, 26: 169-178.
180 Referencias
Isard W., 1960. Methods of Regional Analysis, Technology press of MIT and
Wiley, Nueva York.
Islam N., 1995. Growth empirics: a panel data approach, Quarterly Journal of
Economía, 110: 1127-1170.
Islam N., 1998. Crecimiento empírico: un enfoque de datos de panel. Una respuesta, Trimestral
Revista de Economía, 113(1): 325-329.
Ising E., 1925. Beitray sur theorie des ferromagnetismus, Zeitschrift Physic, 31:
253-258.
Jarque CM y Bera AK, 1980. Pruebas eficientes de normalidad, heterocedasticidad e

independencia serial de residuos de regresión, Economic Letters, 6: 255-59.
Joe H., 1997. Modelos multivariantes y conceptos de dependencia, Chapman y Hall,

Londres.
Johnston J., 1991. Métodos econométricos, McGraw Hill, Nueva York.
Johnston J. y Dinardo N., 1997. Econometric Methods, (cuarta edición),

McGraw-Hill, Nueva York.
Judge GG, Griffiths WE, Hill RE, Luetkepohl H. and Lee TC., 1988. Introducción a la teoría y
práctica de la econometría, John Wiley and Sons, Nueva York.
Kaiser MS y Cressie N., 1997. Modelado de variables de Poisson con dependencia espacial
positiva, Statistics and Probability Letters, 35: 423-432.
Kaldor N., 1957. Un modelo de crecimiento económico, Economic Journal, 67: 591-624
Kaldor N., 1970. El caso de las políticas regionales, Scottish Journal of Political Economy, 17:
37-48.
Kaluzny S., Vega S., Cardoso T. y Shelly A., 1997. (S+)SpatialStats User's
Manual, Springer-Verlag, Nueva York, NY.
Kelejian HH y Prucha L., 1998. Un procedimiento espacial generalizado de mínimos cuadrados

en dos etapas para estimar un modelo autorregresivo espacial con perturbaciones
autorregresivas, Journal of Real Estate Finance and Economics, 17: 99-121.
Kelejian HH y Prucha L., 1999. Un estimador generalizado de momentos para el parámetro

autorregresivo en un modelo espacial, International Economic Review, 40: 509-533.
Kelejian HH y Prucha L., 2001. Sobre la distribución asintótica del estadístico de prueba Moran
I con aplicaciones, Journal of Econometrics, 104: 219-257.
Kelejian HH y Prucha L., 2003. Estimación de sistemas simultáneos de ecuaciones transversales

espacialmente interrelacionadas, Journal of Econometrics, 118: 27-50.
Kelejian HH y Robinson DP, 1992. Autocorrelación espacial: una nueva prueba

computacionalmente simple con una aplicación a los gastos de política del condado per
cápita, Regional Science and Urban Economics, 22: 317-331.
Referencias 181
Kelejian HH y Robinson DP, 1993. Un método de estimación sugerido para modelos

interdependientes espaciales con errores autocorrelacionados y una aplicación a un modelo
de gastos del condado, Papers in Regional Science, 72: 297-312.
Keleijan HH y Robinson DP, 1995. Correlación espacial: una alternativa sugerida al modelo
autorregresivo, en L. Anselin y RJGM Florax (eds.), New Directions in Spatial Econometrics,
Springer-Verlag, Berlín: 5-95.
Keleijan HH y Robinson DP, 1997. Estimación de la productividad de la infraestructura y sus

especificaciones econométricas subyacentes: un análisis de sensibilidad, Papers in Regional
Science, 76: 115-131.
Kelejian HH y Robinson DP, 2004. La influencia de la heteroscedasticidad correlacionada

espacialmente en las pruebas de correlación espacial, en L. Anselin, RJGM
Florax y S. Rey (eds.), Avances en econometría espacial: metodología, herramientas y
aplicaciones, Springer-Verlag, Nueva York.
Kendall M. y Stuart A., 1979. The Advanced Theory of Statistics, vol. 2 (cuarto
edición), Charles Griffin & Co, Londres.
Kennedy P., 2003. A Guide to Econometrics, (quinta edición), Blackwell Publishers.
Khinchin A., 1949. Fundamentos matemáticos de la mecánica estadística, Dover,

Nueva York.
Kim H., Sun D. y Tsutaka RK, 2001. Un método Bayesiano bivariado para mejorar las estimaciones
de las tasas de mortalidad con un modelo autorregresivo condicional doble, Journal of the
American Statistical Association, 96: 1506-1521.
Klaassen LH, Paelinck JHP y Wagenaar S., 1979. Sistemas espaciales, Saxon House, Farnborough.
Klevmarken NA, 1989. Estudios de panel: ¿qué podemos aprender de ellos? una introducción
ducción, European Economic Review, 33: 523-529.
Kmenta J., 1997. Elements of Econometrics, (segunda edición), Macmillan, Nueva York.
Kobayashi M., 1991. Pruebas de perturbaciones autocorrelacionadas en regresión no lineal

sion analysis, Econometria, 59: 1153-1159.
Kolmogorov A., 1933. Sulla determinazione empirica di una legge di distribuzione,

Giornale dell'Istituto Italiano Attuari, 4: 83.
Krugman P., 1991. Geografía y Comercio, Leuven University Press, Lovaina y

MIT Press, Cambridge, Massachusetts.
Krugman P. y Venables AJ, 1995. La globalización y la desigualdad de las naciones,

Revista trimestral de economía, 11: 857-880.
Künsch H., 1981. Termodinámica y análisis estadístico de campos aleatorios gaussianos, Whar.
versión Geb., 58: 401-421.
Land K. y Leane G., 1992. Sobre la estimación de muestras grandes de modelos de regresión
con términos de efectos de redes espaciales: un enfoque de mínimos cuadrados en dos
etapas, en P. Mars den (ed.), Sociological Methodology, Jossey–Bass, San Francisco: 221-248.
182 Referencias
Lee LF, 2002. Consistencia y eficiencia de la estimación por mínimos cuadrados para
modelos autorregresivos espaciales regresivos mixtos, Econometric Theory, 18: 252-277.
LeSage J., 1997. Estimación bayesiana de modelos autorregresivos espaciales, Interna
Revista científica regional nacional, 20: 113-129.
LeSage J., 1999. Spatial Econometrics: The Web Book of Regional Science, Regional
Research Institute, West Virginia University, Morgantown, WV.
LeSage J., 2000. Estimación bayesiana de autore espacial de variable dependiente limitada
modelos progresivos, Análisis Geográfico, 32: 19-35.
LeSage J., 2004. Una familia de modelos de regresión ponderados geográficamente, en L.
Anselin, RJGM Florax y S. Rey (eds.), Advances in Spatial Econometrics: Methodology,
Tools and Applications, Springer-Verlag, Nueva York.
LeSage J. y Krivelyova A., 1999. Una previa espacial para los modelos autorregresivos
vectoriales bayesianos, Journal of Regional Science, 39: 297-317.
Ljung GM y Box GEP, 1978. Sobre una medida de falta de ajuste en series de tiempo mod
els, Biometrika, 65: 297-303.
Lotka AJ, 1956. Elements of Mathematical Biology, Dover, Nueva York (reimpresión del libro
original de 1924).
Maddala G., 2001. Econometría, McGraw-Hill, Nueva York.
Mankiw NG, 1995. El crecimiento de las naciones, Brooking Papers on Economic Activ ity,
1: 275-326.
Mankiw NG, Romer D. y Weil D., 1992. Una contribución a los datos empíricos del crecimiento
económico, Quarterly Journal of Economics, 107: 407-437.
Mardia KV, 1970. Medidas de asimetría multivariada y curtosis con aplicaciones, Biometrika,
57: 519-530.
Mardia KV, 1974. Aplicaciones de algunas medidas de asimetría y curtosis multivariadas

para probar estudios de normalidad y robustez, Sankhya, B36: 115-128.
Mardia KV, 1980. Pruebas de normalidad univariante y multivariante, en PR Krish naiah
(ed.), Handbook of Statistics, Vol.1, North Holland, Nueva York: 279-
320.
Mardia KV, 1986 Prueba de multinormalidad de Mardia, en NL Johnson, S. Kotz y C.Read

(eds.), Encyclopaedia of Statistics, 5, Wiley, Nueva York: 217-221.
Mardia KV, 1988. Campos aleatorios gaussianos de Markov multidimensionales y
multivariantes con aplicación al procesamiento de imágenes, Journal of Multivariate
Analysis, 24: 265-284.
Mardia KV, 1990. Estimación de máxima verosimilitud para modelos espaciales, en

Estadística espacial: pasado, presente y futuro, DA Griffith (ed.), Monografía N.° 12,
Instituto de Geografía Matemática.
Referencias 183
Mardia KV y Watkins AJ, 1989. Sobre la multimodalidad de la probabilidad de la

modelo lineal espacial, Biometrika, 76: 289-295.
Matern B., 1960. Variación espacial, Meddelanden Fråns Statens Skogsforskninsti

tut, 49: 1-144.
Matern B., 1986. Spatial Variation, (segunda edición), Springer-Verlag, Berlín.
McCullagh P. y Nedler JA, 1989. Modelos lineales generalizados, Chapman y

Pasillo, Londres.
McLeish D., 1975. Una desigualdad máxima y una ley fuerte dependiente, The Annals of Probability,
3: 827-39.
McMillen DP y McDonald JF, 2004. Estimación de máxima verosimilitud ponderada localmente:

evidencia de Monte Carlo y una aplicación, en L. Anselin, RJGM
Florax y S. Rey (eds.), Avances en econometría espacial: metodología, herramientas y
aplicaciones, Springer-Verlag, Nueva York.
Mead R., 1967. Un modelo matemático para la estimación de la competencia entre plantas,
Biometrics, 30: 295-307.
Molliè A., 1996. Mapeo bayesiano de enfermedades, en W. Gilks, S. Richardson y SDJ

Spiegelhalter (eds.), Markov Chain Monte Carlo in Practice, Chapman and Hall.
Mood AM, Graybill FA y Boes DC, 1974. Introducción a la Teoría de la Estadística, McGraw-Hill,
Nueva York.
Moran PAP, 1950. La interpretación de mapas estadísticos, Journal of the Royal

Sociedad de Estadística, Serie B, 10: 243-51.
Mur J. y Trìvez FJ, 2003. Raíces unitarias y tendencias deterministas en modelos econométricos
espaciales, International Regional Science Review, 26: 289-312.
Murdoch JC, Sandler T. y Sargent K., 1997. Una historia de dos colectivos: reducción de emisiones
de azufre versus óxido de nitrógeno en Europa, Public Finance Quarterly, 21: 334-350.
Murdoch JC Sandler T. y Vijverberg WP, 2003. La decisión de participación versus el nivel de

participación en una estrategia ambiental: un análisis probit espacial, Journal of Public
Economy, 87: 337-362.
Newey WK y Powell JL, 1987. Estimación y prueba de mínimos cuadrados simétricos,

Newey W. y West K., 1987. Una matriz de covarianza coherente con autocorrelación y
heteroscedasticidad semidefinida positiva simple, Econometrica, 55: 703-708.
Oberhofer J. y Kmenta J., 1974. Procedimiento general para obtener estimaciones de máxima
verosimilitud en modelos de regresión generalizados, Econometrica, 42: 579-90.
Olmo JC, 1995. Estimación espacial de precios de vivienda y rentas locativas, Estudios Urbanos,
32: 1331-1344.
184 Referencias
Openshaw S. y Taylor PJ, 1981. El problema de la unidad de área modificable, Catmog,

no. 38.
Ord JK, 1975. Métodos de estimación para modelos de interacción espacial, Journal of the
American Statistical Association, 70: 120-126.
Ord JK y Getis A., 1995. Estadísticas de autocorrelación espacial local: problemas de distribución
y una aplicación, Geographical Analysis, 27, 4: 286-306.
Ottaviano GMIP y Puga D., 1998. Aglomeración en la economía global: un estudio de la 'nueva
geografía económica', World Economy, 21 (6): 707-731.
Pace L. y Salvan A., 1997. Principios de inferencia estadística, World Scientific.
Pace RK, 1997. Realizando grandes regresiones espaciales y autorregresiones, Eco

nomic Letters, 54, 283-291.
Pace RK y Barry R., 1997a. Fast CarS, revista de computación y simulación,

59: 123-147.
Pace RK y Barry R., 1997b. Cálculo rápido de estimaciones autorregresivas espaciales

mación, Análisis Geográfico, 29: 232-246.
Pace RK y Barry R., 1997c. Autorregresiones espaciales dispersas, Estadísticas y Prob

Cartas de habilidad, 33: 291-297.
Pace RK y Barry R., 1998. Spatial Statistics Toolbox 1.0, Real Estate Research
Instituto, Universidad Estatal de Luisiana, Baton Rouge, LA.
Pace RK y LeSage JP, 2002. Estimaciones semiparamétricas de máxima verosimilitud de la

dependencia espacial, Geographical Analysis, 34: 76-90.
Pace RK y LeSage JP, 2004. Aproximación de Chebyshev de determinantes logarítmicos de

matrices de pesos espaciales, Computational Statistics and Data Analysis, 45: 179-196.
Pace RK y Zou D., 2000. Estimaciones de máxima verosimilitud de forma cerrada de la

dependencia espacial del vecino cercano al este, Geographical Analysis, 32: 154-172.
Pace RK, Barry R., Clapp JM y Rodiquez M., 1998. Modelos autorregresivos espacio-temporales
de efectos de vecindad, Journal of Real Estate Finance and Economics, 17: 15-33.
Pace RK, Barry R., Slawson VC y Sirman CF, 2004. Transformaciones simultáneas de formas
espaciales y funcionales, en L.Anselin, RJGM Florax y SJ
Rey (eds), Avances en econometría espacial: metodología, herramientas y aplicaciones,
Springer-Verlag, Berlín.
Paelinck JHP, 1967. L'efficacité de la politique économique régionale, Namur, Faculté des Sciences
Economiques.
Paelinck JHP, 1983 Economía espacial formal, Gower.
Paelinck JHP, 1996. Estudios en econometría espacial, artículos de investigación, Universidad

George Mason, Instituto de Políticas Públicas, Centro de Análisis Regional, Fairfax, VA, EE.
UU.
Referencias 185
Paelinck JHP y Klaassen LH, 1979. Econometría espacial, Gower, West Mead, Farnborough.
Paelinck JHP y Nijkamp P., 1975. Teoría y métodos operativos en economía espacial, Saxon House
y Lexington, Farnborough y Massachusetts.
Pesaran MH, 2004a. Pruebas diagnósticas generales de dependencia transversal en

panel de datos, documento de trabajo de la Universidad de Cambridge, junio.
Pesaran MH, 2004b. A pair-wise approach to testing for output and growth convergence, Mimeo,
Universidad de Cambridge, agosto.
Pfeiffer PE y Deutsch JS, 1980. Un procedimiento de construcción de modelos STARIMA con

aplicación a la descripción y pronóstico regional, Transaction of the Institute of British
Geographers, 70: 330-349.
Pinkse J., 1998. Una prueba no paramétrica consistente para la independencia de series, Journal
of Econometrics, 84: 205-231.
Pinkse J., 1999. Asintótica de la prueba de Moran y una prueba de correlación espacial en modelos
probit, documento de trabajo del Departamento de Economía, Universidad de British Columbia,
Vancouver, BC.
Pinkse J., 2004. Pruebas con sabor a Moran con parámetros molestos: ejemplos en L.
Anselin, RJGM Florax y S. Rey (eds.), Advances in Spatial Econometrics: Methodology, Tools
and Applications, Springer-Verlag, Nueva York.
Pinkse J. y Slade ME, 1998. Contacto en el espacio: una aplicación de estadísticas espaciales a
modelos de elección discreta, Journal of Econometrics, 85: 125-154.
Pinkse J., Shen L. y Slade M., 2003. Probit espacial dinámico con efectos fijos utilizando GMM de
un paso: una aplicación a las decisiones operativas de la mina. Bajo envío al Journal of
Econometrics.
Pinkse J., Slade ME y Brett C., 2002. Competencia espacial de precios: una semi
enfoque paramétrico, Econometrica, 70: 1111-1153.
Pirandello L., 1921. Sei personaggi in cerca d'autore, R. & F. Bemporad, Floren
Ce.
Pisati M., 2001. Herramientas para el análisis de datos espaciales, Boletín técnico de Stata, 60: 21–
37.
Postiglione P., Arbia G. y Salvatore M., 2002. Empíricos para la convergencia regional: el papel de
la dependencia espacial. Documento presentado en la reunión nacional de la Sociedad Italiana
de Estadística, Milán, junio.
Press, WH, Flannery BP, Teukolsky SA y Vetterling, WT, 1992. LU Descomposición y sus
aplicaciones. §2.3 en Recetas numéricas en FORTRAN: The Art of Scientific Computing,
(segunda edición), Cambridge University Press, Cambridge, Inglaterra: 34-42.
Preston CJ, 1973. Estados de Gibbs generalizados y campos aleatorios de Markov, Avances
en Probabilidad Aplicada, 5: 242-261.
186 Referencias
Puga D. y Venables AJ, 1997. Comercio preferencial y ubicación nacional, Revista

de Economía Internacional, 43 (3-4): 347-368.
Puga D. y Venables AJ, 1999. Aglomeración y desarrollo económico,

Diario económico, 109 (455): 292-311.
Quah D., 1993a. Dinámica transversal empírica en el crecimiento económico, European Economic
Review, 37:426-434.
Quah D., 1993b. Falacia de Galton y prueba de la hipótesis de la convergencia, Scandi

revista naviera de economía, 95: 427-443.
Quah D., 1996a. Twin Peaks: crecimiento y convergencia en modelos de distribución

dinámica, Revista Económica, 106: 1045-1055.
Quah D., 1996b. Clústeres de convergencia regional en toda Europa, European Eco
Revista económica, 40: 951-958.
Quah D., 1997. Empirics for growth and distribution: estratification, polarization and convergence
clubs, Journal of Economic Growth, 2: 27-59.
Quandt R., 1958. La estimación de parámetros de un sistema de regresión lineal que obedece
a dos regímenes separados, Journal of the American Statistical Association, 53: 873-880.
Rao CR, 1948. Pruebas de gran muestra de hipótesis estadísticas relativas a varios parámetros
con aplicaciones a problemas de estimación, Procedimientos de la Sociedad Filosófica de
Cambridge, 44: 50-57.
Rey SJ, 2001. Empírica espacial para el crecimiento económico y la convergencia, Análisis
geográfico, 33: 195-214.
Rey SJ, 2003. Análisis espacial del crecimiento económico regional, la desigualdad y el cambio,
en M. Goodchild y D. Janelle (eds.), Spatially Integrated Social Science, Oxford University
Press, Nueva York, NY.
Rey SJ y Montouri BD, 1998. Convergencia de ingresos regionales de EE. UU.: una perspectiva
econométrica espacial, Regional Studies, 33: 143-156.
Ripley BD, 1981. Estadística espacial, Wiley, Nueva York.
Ripley BD, 1988. Inferencia estadística para procesos espaciales, Cambridge University Press,
Cambridge.
Ripley BD, 1990. Modelos de interacción gibbsiana, en D. Griffith (ed), Estadística espacial:
pasado, presente y futuro, Monografía no. 12, Instituto de Geografía Matemática.
Ruud PA, 2000. Introducción a la teoría econométrica clásica, Universidad de Oxford

Versity Press.
Saavedra LA, 2003. Prueba de dependencia del retardo espacial basada en la estimación del
método de momentos, Regional Science and Urban Economics, 33: 27-58.
Sala-i-Martin X., 1996. El enfoque clásico del análisis de convergencia, Economic

Diario, 106, 437: 1019-1036.
Referencias 187
Samuelson P., 1971. Oscilaciones depredador-presa generalizadas en el equilibrio ecológico

y económico, Procedimientos de la Academia Nacional de Ciencias, 68: 980-3.
Sargan JD, 1964. Salarios y precios en el Reino Unido: un estudio en metodología

econométrica, en PE Hart, G. Mills y JK Whitaker (eds), Economic Analysis for (the)
National Economic Planning, Butterworths, Londres. Reimpreso en KF
Wallis y DF Hendry (eds), Economía cuantitativa y análisis econométrico, 1984, Basil
Blackwell, Oxford.
Seddighi HR, Lawler KA y Katos AV, 2000. Econometría: una práctica

Enfoque, Routledge, Taylor & Francis Group.
Serfling R., 1980. Teoremas de aproximación de la estadística matemática, New

York, John Wiley.
Shapiro SS y Wilk MB, 1965. Un análisis de las pruebas de varianza para la normalidad
(muestras completas), Biometrika, 52: 591.
Silvey SD, 1959. La prueba del multiplicador de Lagrangian, Annals of Mathematical Statis
tics, 30, 389-407.
Smirnov O., 2003. Computación de la matriz de información para modelos de interacción

espacial. Informe técnico, Laboratorio de aplicaciones económicas regionales (REAL),
Universidad de Illinois, Urbana-Champaigne, IL.
Smirnov O. y Anselin L., 2001. Estimación rápida de máxima verosimilitud de modelos

autorregresivos espaciales muy grandes: un enfoque polinomial característico,
Computational Statistics and Data Analysis, 35: 301-319.
Smith T., 1980. Un teorema del límite central para muestras espaciales, Geographical
Analysis, 12: 299-324.
Solon GS, 1989. El valor de los datos de panel en la investigación económica, en D. Kasprzyk,
GJ Duncan, G. Calton y MP Singh (eds), Panel Surveys, John Wiley, Nueva York: 486-496.
Solow RM, 1956. Una contribución a la teoría del crecimiento económico, Quarterly Journal of
Economics, 70, 1: 65-94.
Spanos A., 1986. Fundamentos estadísticos de modelos econométricos, Cambridge

Prensa universitaria, Cambridge.
Stewart J. y Gill M., 1998. Econometrics, (segunda edición), Prentice-Hall.

Stock JH y Watson MW, 2003 Introducción a la econometría, Addison
Wesley.
Strauss, DJ 1977. Agrupación de celosías de colores, Journal of Applied Probability,

14: 135-43.
Strauss DJ e Ikeda M., 1990. Estimación de pseudoverosimilitud para redes sociales,

Revista de la Asociación Estadounidense de Estadística, 85: 204-212.
188 Referencias
Swan TW, 1956. Crecimiento económico y acumulación de capital, Economic Re

cuerdas, 32: 334-361.
Szroeter J., 1978. Una clase de pruebas paramétricas de heteroscedasticidad en modelos

econométricos lineales, Econometrica, 46: 1311-1327.
Temple J., 1999. La evidencia del nuevo crecimiento, Journal of Economic Literature, 37,
112-156.
Theil H., 1954. Agregación lineal en relaciones económicas, North-Holland Publ.

Compañía, Ámsterdam.
Thomas L., 1997. Econometría moderna: una introducción, Pearson Education.
Tiefelsdorf M., 2002. La aproximación del punto de silla de las distribuciones de referencia de
Moran's I's y Moran's Ii's local y su evaluación numérica, Geo graphical Analysis, 34:
187-206.
Tiefelsdorf M. and Boots BN, 1995. La distribución exacta de Moran's I. Envi ronment and
Planning A, 27: 985-99.
Tobler W., 1970. Una película de computadora que simula el crecimiento urbano en Detroit re
gion, Suplemento de Geografía Económica, 46: 234-40.
Tuckey JW, 1977. Análisis exploratorio de datos, Reading, MA, Addison-Wesley.
Upton G. y Fingleton B., 1985. Análisis de datos espaciales mediante el ejemplo: patrón de
puntos y datos cuantitativos, volumen 1, Wiley, Nueva York.
Upton G. y Fingleton B., 1989. Análisis de datos espaciales por ejemplo: categórico
y Directional Data, Volumen 2, Wiley, Nueva York.
Verbeek M., 2000. Una guía para la econometría moderna. John Wiley e hijos, Nueva
York.
Verdoorn P., 1949. Fattori che regolano lo sviluppo della produttività del lavoro, L'industria, 1:
3-10.
Vijverberg WP, 1997. Evaluación de Monte Carlo de probabilidades normales multivariadas

lazos, Journal of Econometrics, 76: 281-307.
Wall MM, 2004. Una mirada cercana a la estructura espacial implícita en los modelos CAR y
SAR, Journal of Statistical Planning and Inference, 121: 311-324.
Wallis KF, 1972. Pruebas de autocorrelación de cuarto orden en ecuaciones de regresión

trimestrales, Econometrics, 40: 617-636.
White H., 1980. Un estimador de matriz de covarianza consistente heteroscedástico y un
prueba directa de heteroscedasticidad, Econometrica, 48: 817-38.
White H., 1984. Teoría asintótica para econometristas, Academic Press, Or

lando
White H. y Domowitz I., 1984. Regresión no lineal con observaciones dependientes,

Referencias 189
Whittle PJ, 1954. Sobre procesos estacionarios en el plano, Biometrika, 41: 434-49.
Whittle PJ, 1962. Correlación topográfica, funciones de covarianza de ley de potencia y difusión,
Biometrika, 49: 305-314.
Whittle PJ, 1963. Procesos estocásticos en varias dimensiones, Boletín del Instituto Internacional
de Estadística, 40(2): 975-994.
Woolridge JM, 2002a. Econometría: un enfoque moderno (segunda edición).
Woolridge JM, 2002b. Análisis Econométrico de Sección Transversal y Datos de Panel,

MIT Press, Cambridge, Massachusetts.
Woolridge JM y White H., 1988. Algunos principios de invariancia y teoremas del límite central
para procesos heterogéneos dependientes, Econometric Theory, 4: 210-230.
Yaglom AM, 1957. Algunas clases de campos aleatorios en el espacio n-dimensional,

relacionados con procesos aleatorios estacionarios, Theor. Aplicación de probabilidad, 2: 273-320.
Yaglom AM, 1961. Campos aleatorios homogéneos de segundo orden, Actas del 4º Simposio de
Berkeley sobre Matemáticas, Estadística y Probabilidad, University of California Press,
Berkeley, 2: 593-622.
Yaglom AM 1962. Introducción a la teoría de la función aleatoria estacionaria

ciones, Prentice-Hall, Englewood Cliffs, Nueva Jersey.
Yule U. y Kendall MS, 1950. Introducción a la teoría de la estadística,

Charles Griffin, Londres.
Lista de tablas
Tabla 1.1. Estadísticas descriptivas de los ingresos per cápita y tasas de crecimiento en
las 92 provincias italianas (años 1951 y 1999). ..........................17
Tabla 1.2. OLS Estimaciones de la regresión de convergencia ÿ del ingreso per cápita
en las 92 provincias italianas (1950-1999). (Los números entre paréntesis
se refieren a los valores p). .................................................... ........20
Tabla 1.3. Estimaciones MCO de la regresión de convergencia ÿ de la renta per cápita

en las 129 regiones europeas (1980-1996). (Los números entre paréntesis
se refieren a los valores p) ....................................... ....................26
Tabla 5.1. Pruebas de dependencia espacial para los residuos de MCO de la

ÿ-convergencia en las 92 provincias italianas (1950-1999) (las
cifras entre paréntesis se refieren a los valores de p) ....................... ..............136
Tabla 5.2. Convergencia del ingreso per cápita en las 92 provincias italianas
(1950-1999) – Modelos de dependencia espacial – Estimaciones ML
(los números entre paréntesis se refieren a los valores p). ....................................137
Tabla 5.3. Convergencia de la renta per cápita en las 92 provincias italianas

(1950-1999). Invariancia espacial de los parámetros. ...............................140
Tabla 5.4. Convergencia de la renta per cápita en las 92 provincias italianas

(1950-1999). Modelos de dependencia espacial con regímenes espaciales
(estimaciones ML) (los números entre paréntesis se refieren a los valores p). ..........140
Tabla 5.5. Pruebas de dependencia espacial para los residuos OLS de la

convergencia ÿ en las 129 regiones europeas NUTS-2 (1950
– 1999). (Las cifras entre paréntesis se refieren a los valores de p) ............ 142
Tabla 5.6. Convergencia de la renta per cápita en los 129 países europeos
Regiones NUTS-2 (1950-1999) – Modelos de dependencia espacial –
Estimaciones de máxima verosimilitud (los números entre paréntesis se
refieren a los valores p). .................................................... ..........................143
Tabla 5.7. Convergencia de la renta per cápita en los 129 NUTS-2 europeos
regiones (1980-1996) – Invariancia espacial de parámetros. ..........144
Tabla 5.8. Convergencia de la renta per cápita en las 119 regiones europeas NUTS-2
(1950-1999). Modelos de dependencia espacial con regímenes espaciales
(estimaciones ML) (los números entre paréntesis se refieren a los valores
p). .................................................... ..........................................145
Lista de Figuras
Figura 1.1. Mapa de las 92 regiones italianas de nivel NUTS-3 según el

Clasificación oficial de la UE (provincias). ...............................................15
Figura 1.2. Mapa de 129 regiones europeas de nivel NUTS-2 de la UE oficial

clasificación de 10 países europeos. ...........................................dieciséis
provincias italianas; (a) año 1951 y (b) año 1999. ................17
Figura 1.4. Distribución de las tasas de crecimiento del PIB per cápita (logaritmo) de
las provincias para las 92 provincias italianas durante el período 1951-1999 ........... 18
Figura 1.5. Provincias italianas ÿ-convergencia de la renta per cápita en el período

1951-99 (Coeficiente de variación)................................. .............19
Figura 1.6. ÿ-convergencia entre las provincias italianas. Diagrama de dispersión de la tasa
de crecimiento durante el período 1951-1999 versus el logaritmo natural del
PIB per cápita (1951).................................... .......................19
Figura 1.7. Mapa de los residuos estandarizados empíricos de la Ecuación (1.21) estimados
en las 92 provincias italianas. Las tasas de crecimiento se han medido para el
período 1950-1999. Los residuos grandes se identifican como aquellos que
exceden más o menos una desviación estándar y se muestran en blanco y
negro respectivamente. ..........21
Figura 1.8. Convergencia ÿ de la renta per cápita de las regiones europeas durante
el período 1980-1996 (coeficiente de variación) ................................23
regiones europeas NUTS-2 en (a) 1980 y (b) 1996. ..........24
Figura 1.10. Distribución de las tasas de crecimiento del PIB per cápita (expresadas en
logaritmo natural) en las 129 regiones europeas NUTS-2 en el período
1980-1996.................................................... ..........................................25
Figura 1.11. ÿ-convergencia entre las regiones europeas. Diagrama de dispersión de la tasa
de crecimiento durante el período 1980-1996 versus el logaritmo natural del
PIB per cápita (1980).................................... .......................25
Figura 1.12. Mapa de los residuos empíricos estandarizados de la Ecuación (1.10) estimados
sobre las 129 regiones a nivel NUTS-2 durante el período 1980-95. Los
residuos se clasifican en las 4 clases intercuartiles. ........26
Figura 2.1. Tres posibles tipologías de datos espaciales discretos: (a) Puntos,
(b) Red de celosía regular y (c) Red de celosía irregular. ..........................34
194 Lista de Figuras
Figura 2.2. Ejemplo de datos puntuales: la ubicación de las empresas textiles dentro del
área del municipio de Prato. Cada punto representa una empresa. Tomado
de Arbia y Espa (1996a)................................................ ...................35
Figura 2.3. Ejemplo de datos de polígonos: Distribución espacial de móviles

teléfonos en los estados de EE. UU. en 2004.................................... .............36
Figura 2.4. Si las características del proceso no cambian durante la traducción, se dice
que el proceso es homogéneo. Si no cambian bajo rotación, se dice que el
proceso es isotrópico. .............................44
Figura 3.1. Modelo de codificación para un campo de parámetros continuos (a) y para un
campo de parámetros discretos (b) ........................................... .....................76
Figura 3.2. Predecesores de ubicación si ( P(i) ), vecinos de si ( N(i) ) y vecinos predecesores

( PN(i) ) de si en el caso de campos de parámetros continuos (a) y de
parámetros discretos (b) . .............78
Figura 5.1. Clasificación de las 92 provincias italianas dentro de los dos

regímenes geográficos. .................................................... ..................139
Índice de nombres
UN Basu S. 68
Bates C. 81
Agresti A. 124
Aitchinson J. 83 Baumont C. 138, 149, 150, 154
Aitkin M. 125 Bayes T. 154
Aldstadt J. 150 Bennet RJ 3, 152
Alfo M. 125 Bera AK 20, 101, 110, 111, 117, 121,

122, 147
Ali MM 131
Bergström AR 151
Andrews DWK 155
Bernardo AB 150
Anselin L. 4, 8, 64, 67, 68, 69, 80, 81,
Berndt E.R 4
83, 101, 106, 108, 110, 111, 113,
114, 116, 117, 128, 130 – 133, 135, Berón KJ 153, 160
147, 149 , 153, 156 – 158, 160 – Besag J. 3, 50, 51, 52, 56, 57, 58, 76,
166 Arbia G. 3, 18, 34, 35, 39, 69, 79, 80, 90, 125, 126 Bhargava A.
72, 77, 80, 90, 125, 138, 150, 151, 152, 161
162 Bivand RS 166
Botas BN 156
Atón B. 37
Borel E. 33, 74
Azariadis C. 149
Recuadro GEP 4, 21, 124
Azzalini A. 74, 81
Brett C 158
Breusch TS 20, 23, 26, 129, 130, 137,

B
138, 140, 142 – 145, 158, 164
Bailey T. 162
Balestra P. 161 brock wa 159
Baltagi BH 4, 5, 17, 90, 148, 149, 157, Arroyo D. 61, 65
158
Burridge págs. 91, 156
Banerjee S. 63
Barro RJ 6 – 8, 10 – 14, 18, 23, 138 C
Barry R. 80, 161, 166 Carvalho V. 151
Bartels C. 108
Caja AC 37
Bartlett MS 3, 79
Chapman RN 151
Basile R. 138, 151
Chebyshev PL 162
196 Índice de nombres
Chen X 155 Durbin J. 20, 91, 92, 108, 121

Choleski A.-L. 162 Durlauf SN 7, 149, 150
Chow G. 133, 139, 140, 144
mi
Christakos G. 48
Clayton D. 57 Edgard GA 36
Acantilado AD 3, 90, 91, 92, 153 Elhorst JP 148, 160
Clifford págs. 50, 51, 56 Inglés RF 87

Cobb CW 9, 11 Ertur C. 162
Cochrane D. 108 España G. 35, 125

Collett D. 124, 125 Eurostat 14, 22
Conley TG 37, 154, 155, 159, 166 Evans MA 131, 150
Consigliere I. 133 Evans págs. 131, 150

Corsi pág. 133
F
Costantini M. 150
Cox RD 55, 124 Fabiani S. 139
Cramer H. 81 Talador W. 121
Cressie N. 3, 51, 57, 65, 68, 101, 126, Fingleton B. 3, 7, 8, 150, 151
155 Fisher R. 73, 74, 81, 82, 84, 99, 133
Cruz GR 55 Fleissig A. 150 Fleming MM 153 Florax
RJGM 4, 147, 152, 156,
D
Davidson J. 4, 126, 128, 129, 157 159
Davidson R. 4, 126, 128, 129, 157

GRAMO
De Vlist A. 4
Alemán JS 152 Galámbos J. 57
Dinardo nº 5 Abundancia O. 149
Dobrushin RL 49 Gandolfo G. 151
Domowitz I. 72, 155 Garrett TA 153
Doreiano pág. 37 Gatrell AC 162
Dougherty M.4 Gebhardt A 166
Douglas PH 9 Alemán S. 80
Dowde MR 154 Suave JE 162
Drazen A. 149 Getis A. 150, 162

Driscoll JC 155 Giacomini R. 152
Dubin R. 68, 153 Giacotto C. 131

Índice de nombres 197
Branquia M. 5
yo
Glejser H. 131 Ikeda M 126

Godfrey LG 129 Isard W. 4
Goldberg AS 4
Ising E. 52 – 55
Goldfeld SM 128
Islam nº 151
Gourieroux C. 4
Graffigne C. 80 j
Granger CWJ 4, 152 Jainista AK 55
Greene WH 4, 81
Jarque CM 20, 23, 26, 121, 164
Gress B 155
Jenkins Gerente General 4
Griffith AD 3, 80, 107, 150, 156, 158, jose h 47

161, 162
Johnson PA 149
Grimmett GR 50
Johnston J. 5, 17, 90
Gujarati D. 5, 90
Jones C. 5, 150
Guyon X. 33
Juez GG 5
H
k
Haining RP 3, 51, 55, 65, 161, 162
Káiser MS 51, 57
Hamilton JD 33, 48, 64
Kaldor J. 57, 151
Hammersey JM 50
Kaldor nº 57, 151
Hansen LP 155
Kaluzny S. 166
Harrison MJ131
Karras G. 150
Harvey A. 151
Kelejian HH 128, 156 – 160
Hausdorff F. 36
Kendall MS 121, 122 Kennedy
Hayashi F. 4
P. 5, 17, 90
Heijmans R. 81
Khinchín A. 48
Hendry DF 4, 159
Kim H. 59
Hepple LW 154
Rey ML 131
Heráclito 1
Klaassen LH 3
Holloway G. 154
Klevmarken NA 148
Holly S. 4 Hordijk
Kmenta J. 5, 17, 90, 110
L. 108
Kobayashi M. 21
Hsiao C. 148
Kolmogorov A. 121
Huang JS 66
Kraay AC 155
Hudak S. 161
Krivelyova A. 154
198 Índice de nombres
Krugman págs. 6, 7 Hidromiel R. 80
Künsch Alt. 51 Mollie A. 59

Montfort A. 4
L Moran PAP 90, 91, 136, 142, 156, 162,
Lafratta G. 77 165
Lagrange J.-L. 81, 83, 91, 98, 106, Moreno R. 156, 157
129, 130, 136, 138, 142, 146, 156, Morgan MS 4
157, 158, 164 Mur J. 150
Terreno K. 160
Murdoch JC 37, 153
El Gallo J. 162
Leane G. 160 norte
Lee LF 153 Nerlove M. 161

LeSage JP 65, 80, 98, 101, 103, Newey WK 131, 155
110, 113, 114, 119, 147, 153,
Nijkamp pág. 4
154, 155, 162, 166
Li D. 149, 157
O
Ljung GM 21
Oberhofer J. 110
Lotka AJ 151
Olmo JC 68
Lu 162
Orcutt GH 108
Liapunov AM 72
Ord JK 3, 80, 90 – 92, 153, 157,
161, 162
METRO
Ottaviano GMIP 7
MacKinnon JG 4, 126, 128, 129,
157
PAG
Maddala G. 5, 17, 90, 92

Paelinck JHP 3, 32, 37, 150, 151 AR
Magnus J. 81
pagano 20, 129, 130, 158
Mankiw NG 8, 12, 14
Mardia KV 58, 60, 67, 123
Markov AA 49, 50, 57, 58, 63, 65, 79,
149, 150
Materna B. 33
Pearson K 122
McCabe BP 131
Pellegrini G. 139
McCullagh pág. 125
Pesarán MH 150, 158
McDonald JF 155
Pfeiffer PE 152
McLeish D. 70
perforar da 21
McMillen DP 155
Pinkse J. 153, 156, 158, 160
Índice de nombres 199
Pirandello L. 3 Slutsky EE 65
Piras G. 147, 151, 163 Smirnov O. 80, 121, 162, 165
Pisati M. 166 Herrero T. 72
Veneno SD 57 Snell EJ 124
Portnov BA 166 Solon GS 148
Postiglione págs. 125, 141 Habitación Solow 8
Powell JL 131 Spanos A. 5, 48, 124

Prensa WH 162 Srauss J. 55, 56, 126, 150
Preston CJ 50 Estuardo J. 5
Prucha L. 155, 156, 159, 160 Acción JH 5
Puga D. 7 Strauss DJ 55, 56, 126, 150

Estuardo A. 121, 122
q Veranos L. 14
Quah D. 7, 138, 149 Cisne TW 8
Quant RE 134 Suiza P. 77
Szroeter J. 131
R
T
Rao CR 81, 83
Rey SJ 150, 156, 159 Taylor B. 11, 82
Ripley BD 3, 51, 58, 80 Templo J. 14
Robinson DP 66, 67, 128, Thibodeau TG 68
156 – 160 Tomás L. 5
Ruud PA 5 Tiefelsdorf M. 156
Tobler W. 46
S
Topa G. 37
Saavedra LA 156
Trivez FJ 150
Sala-i-Martin X. 6 – 8, 10 – 14, 18, 23,
Tuckey JW 162
138 Salvan A. 79, 103, 114
tu
Samuelson pág. 151
Hasta G. 3
Sargan JD 110, 161
Seddighi HR 5 Serfling V
R. 72 Shapiro SS 121 van de Vlist A. 147
Silvey SD 83 Slade ME Venables AJ 7
153, 160 Verbeek M. 5
Índice de 200 nombres
Verdoorn pág. 151 Blanco Alt. 49, 70, 72, 81, 128 – 130,
155
Vijverberg WP 153, 160
Whittle PJ 3, 33, 63, 80, 90, 101
W Wilk MB 121
Wald A. 81 – 83, 98, 106, 133 Woolridge JM 5, 6, 17, 90

Pared MM 153
Wallis KF 21
Y
Watkins AJ 67 Yaglom AM 33
Navidad U. 65
WatsonGS 20, 91, 92
watson MW 5
Weale M. 4
Z
Oeste K. 22, 155 Zou D. 80, 162
Índice de materias
UN Probit bayesiano modelo 154
Test de Bera-Jarque 121, 122

Estudios agrícolas 3
Mejor predictor lineal imparcial 149
Convergencia casi segura 69, 70
Matriz de conectividad binaria 37
Arqueología 3
Vista de arco 164 Campo autonormal bivariado 59, 96,
99
Regresión artificial 129, 157
Límites 5, 37, 132
Astronomía 3
Transformación Box-Cox 124
Asimetría de las relaciones espaciales 4
Prueba de Breusch-Pagan 20, 23, 26, 130,
Aproximación asintótica 152
137, 138, 140, 142 – 145, 164
Normalidad asintótica 69, 83, 126,
160
C
Teoría asintótica 6, 68, 69
Relación capital-trabajo 9 – 11
Independencia asintótica 46, 47, 72, 122
Casa del Mezzogiorno 18, 139
Variables categóricas 153

Descorrelación asintótica 46, 47
Centro-periferia 138
Estimador asintóticamente normal 74, 92,
160 Teorema del límite central 64, 69
Deserción 148 para mezclar campos 71
Campo autobinomial 56 para campos regulares y localmente

covariantes 72
ley autobinomial 56
Centroides 36
Auto-modelos 51, 55
caos 159
Auto-Poisson 57
Polinomio característico 162
Campos autorregresivos 94, 101, 110
Aproximación de Chebyshev 162
Campo de promedio móvil autorregresivo
(SARMA) 66, 68 Descomposición de Choleski 162
Prueba de comida 133, 139, 140, 144

B Función Cobb-Douglas 9, 11
factor bayesiano 154 Técnica de codificación 76, 79
Bayesiano Ponderado Geográficamente Colinealidad 148

Regresión (BGWR) 154 Técnicas computacionalmente
Modelos bayesianos 153 intensivas 160
202 Índice de materias
Concentración de actividades económicas Disminución de la distancia 67, 154

6
Regresión de longitud doble 157
Concentración de población 126, Prueba de Durbin-Watson 20, 91, 92
154
Asociación Holandesa de Estadística 3
Campo autorregresivo condicional
Paneles dinámicos 149, 158
(COCHE) 57, 58, 60, 62, 64, 80, 93, 96 –
Probit espacial dinámico 160
100, 103, 104, 110
Convergencia condicional 8, 10, 12

mi
Matriz de conectividad 37, 38, 58, 59, 60, 63,
65 – 67, 91, 103, 125, 134, 136, 158 Distancia económica 5, 37, 154
Desigualdad económica 7, 18, 22, 152
Consistencia 51, 57, 69, 74, 80, 81, 111, 114, Elasticidad de la salida 9
117, 119, 126, 128, 129, 138, 149, 155, Ley empírica del 2% 23
159 – 161
Endogeneidad 160
Rendimientos constantes a escala 8, 9, 151
Crecimiento endógeno 149
Barrio basado en contigüidad 37
Aplicaciones medioambientales 166
Campo aleatorio de parámetros continuos 34,
Estudios epidemiológicos 57
36, 37, 45, 76, 78, 79
Epidemiología 3
Clubes de convergencia 138, 149, 150
Ergodicidad 48
Convergencia en la distribución 70 Mecanismo de corrección de errores 151
Convergencia en probabilidad 48, 69, distancia euclidiana 36
71
Unión Europea 7, 14, 15, 16, 18, 22, 138,
Núcleo-periferia 16, 22
144, 151
Estimador de covarianza 155, 160
Corte crítico 37 F
Datos transversales 5, 6, 31, 90, 148, 160
Ferromagnetismo, ley del 55
Primera ley de la geografía 46

Unidades de sección transversal 5, 90, 158
Prueba F de Fisher 99
Maldición de dimensionalidad 152, 161
Modelo de datos de panel dinámico de
efectos fijos 160
D
Agregación de pronósticos 152
Técnicas de descomposición 162 Adelante paso a paso 159
Tasa de depreciación 8
Variables dicotómicas 52, 124 GRAMO
Representación directa 67, 68 Distribución gamma 124
Elección discreta 55, 153 Distribución gaussiana 89, 101, 103
Campo aleatorio de parámetros discretos Mínimos cuadrados generalizados (GLS)

34, 36, 37, 45, 68, 76, 78, 79 106 – 108, 126, 147, 149, 159
Índice de materias 203
Método generalizado de momentos yo
(MMG) 155, 159, 160, 166

Análisis de imagen 3, 34
Matriz de pesos generalizados 38
Estimador de muestreo de importancia 160
Geobugs 166
Rendimientos crecientes a escala 153
GeoDa 163 – 165
Asintótica de dominio creciente 68
Agregados geográficos 5, 34
Asentamientos industriales 39, 52, 56
Sistemas de Información Geográfica
Relleno asintótico 68, 69
(SIG) 164, 165
Variables instrumentales (IV) 160
Ponderado geográficamente
Regresión (GWR) 154 Campo gaussiano intrínseco 58, 59
Geografía 3, 5, 6, 14, 15, 16, 18, Campo aleatorio isotrópico 44, 45, 78,
21, 22, 27, 32 – 34, 37, 38, 40, 46, 68, 90, 96, 79
136, 138, 139, 144, 153, 154, 158, 164 Métodos iterativos 108, 109
Mínimos cuadrados reponderados iterativos

Geología 3 126
Geoestadística 155
Estadística local de Getis-Ord 162 j
Muestreador Gibbs 166 Prueba de normalidad de Jarque-Bera 20, 23,

26, 164
Prueba de Glejser 131
Prueba Goldfeld-Quandt 128 Función de densidad de probabilidad bivariada

conjunta 40
Pesas de tipo gravitacional 38
Funciones de densidad conjunta 31, 32, 50,
Teoría del crecimiento 149
51, 61, 114
Prueba de independencia y heteroscedasticidad

H
espacial conjunta 130
Tiempo de vida media 11, 20, 23, 26, 137,
138, 140 – 143, 145 k
Teorema de Hammersley-Clifford 51, 52, 57
Estadísticas de Kelejian-Robinson 157
Densidad del núcleo 150

distancia de Hausdorff 36
Suavizado del núcleo 154
Especificación tipo Hendry 159
Estadística de Kolmogorov 121
Heterocedasticidad 20, 23, 26, 124, 126, 128 –
Prueba de Kolmogorov-Smirnov 121
131, 137, 138, 140, 143 – 145, 155, 158
L
Heterocedasticidad-Consistente
Estimador de matriz de covarianza Operador de retardo 38, 63
(HCCME) 128
Prueba del multiplicador de Lagrange 81, 83, 91,
Homocedasticidad 20, 86, 89, 95, 120, 126 – 98, 106, 129, 130, 136, 138, 142, 146, 156,
131, 135 157, 158, 164
Variable ficticia de mínimos cuadrados Regresivo espacial mixto

Estimador 160 modelo autorregresivo 110
Probabilidad 73 – 77, 79 – 83, Identificación del modelo 20, 144

96 – 100, 102 – 106, 110 – 115, 117 – Especificación del modelo 6, 32, 33, 58,
121, 126, 134, 138, 142, 146, 148, 64, 85, 93, 96, 98, 106, 121, 123, 124,
154, 161, 164 – 166 134, 143
Razón de probabilidad 81 – 83, 98, 99, Estimación basada en momentos 154
105, 115, 119, 120, 138, 142, 146,
Procedimientos basados en momentos 160
164, 165
Cadena Montecarlo Markov
Variables dependientes limitadas 153
(MCMC) 154, 166
Indicadores Locales de Territorio
Pruebas con sabor a Moran 157
Asociación (LISA) 162
Morbilidad 57
Asociación espacial local 162
Mortalidad 57
Campos aleatorios localmente covariantes 72
Multinormalidad 87, 120, 123
Ubicación de las plantas 56
Campo autonormal multivariante 59,
Aproximación log-lineal 10, 11
60
Distribución logarítmica normal 124
Condicional multivariado
Lotka Volterra modelo 151
campo autorregresivo (MCAR) 60, 63
Lu descomposición 162
Lyapunov condición 72
norte
METRO
Vecino más cercano 37, 165
Función de densidad marginal 31, 40, 75, Función de potencial negativo 51

87 Teoría neoclásica del crecimiento 8, 149
Cadena de Markov 149
Aproximación de Nerlove-Balestra
Campos aleatorios de Markov 49, 50, 63, 161
sesenta y cinco
Nueva geografía económica 6, 7

Estadística matemática 3
Nueva entrada 148
Estimador de máxima verosimilitud 74, 80 –
Condición no degenerada 72
83, 98, 106, 113, 117, 120, 125, 126,
Mínimos cuadrados no lineales 13, 159
127, 133, 134, 136, 143, 144, 147, 156,
157 Maximización no lineal 98, 103,
136
Máxima pseudoprobabilidad
estimación 119, 126, 136, 142 Técnicas no paramétricas 92, 121, 154, 155,
158
Errores de medición 148, 154
Falta de respuesta 148
Error de especificación 19, 20, 136, 156,
158, 159, 164 No esfericidad 5
Componente no sistemático 14, 20, 27, 87, Modelo de probabilidad 14, 31, 32, 33,
95, 97, 101, 102, 104, 105, 106, 108, 68, 73, 74, 81, 86 – 89, 93 – 95, 120,
109, 111, 112, 120, 121, 123, 133 126, 131, 132, 138, 143
Función de producción 8, 9, 11
Distribución normal 14, 57, 68, 92, 122, 123,
pseudoverosimilitud 79, 80, 103, 114
156
Paridades del poder adquisitivo (PPA) 22
Transformaciones de normalización 123,
131
q
Prueba de normalidad 20, 23, 26, 92, 121
Procedimiento Quandt 134
Parámetros molestos 114, 119, 156
Algoritmos numéricos 98
R
Integración numérica 156
Campos aleatorios 31, 33, 34, 36 – 60,
Maximización numérica 103, 119
62, 63, 65, 66 – 72, 75 – 79, 81, 83,
TUERCAS 15, 16, 22, 24 – 26, 141 – 145
85, 91, 93, 94, 96, 98, 99, 101 – 105,
110 – 112, 116, 118, 121, 122, 125,
O 126, 131
Mínimos cuadrados ordinarios (OLS) 4, Precios inmobiliarios 152

13, 19, 20, 23, 26, 90, 91, 92, 107, Regímenes 132, 134, 138 – 141, 144
108, 109, 114, 121, 127, 136, 137, – 146, 150, 153, 164
140 – 143, 145, 149, 158, 165
REGIÓN 14, 15, 22, 148
Concentración regional 6
PAG Convergencia regional 6, 7, 138, 147,

149, 150, 151
Datos del panel 5, 6, 33, 148, 149, 151,
155, 158, 161 Ciencias regionales 3, 4
Modelos de datos de panel 148, 151, 161 Función de regresión 86
Familia paramétrica de funciones Campos aleatorios regulares 72
de densidad 31, 86 Teledetección 34
Familia de distribuciones de Pearson 122 Iniciativa R-Geo 166
campo de veneno 57 Matriz de pesos estandarizados por filas
Funciones polinómicas 38, 103, 111, 116
aproximaciones 162
Crecimiento de la población 8
S
Análisis de pobreza 149, 152 S+166
Modelo depredador-presa 151 Ejemplo de autocovarianzas 155

Predecesores 78, 79 Modelo de muestreo 3, 14, 20, 31, 73, 74,
Predecesores-Vecinos 78, 79 81, 86, 88, 89, 90, 94, 96, 100, 127,
130, 133, 135, 136, 141
Función de puntuación 73, 82 Difusión espacial 3
Puntuación prueba 81, 83 Campo de componente de error espacial (SEC)

66, 157, 158
Selectividad de la muestra 148
Autoselectividad 148 Modelo de error espacial 100, 101, 105, 121,

136, 137, 140 – 145, 148, 159, 164, 166
Técnicas semiparamétricas 68, 125, 154,
155, 160
Externalidades espaciales 151, 153
Estadístico de Shapiro-Wilks 121
Modelo espacial de efectos fijos 148
Estudio de simulación 152
Fricción espacial 46
Campo autorregresivo simultáneo
(SAR) 63, 64, 68, 91, 100 – 106, 110, 111, Heterogeneidad espacial 4, 43, 153 –
133, 159, 160 155, 164
Función de cedasticidad 86, 128 Desigualdad espacial 150
Propiedades de muestras pequeñas 155, 156, Invariancia espacial de los parámetros 89, 140, 144
158
distancia social 37 Modelo de retraso espacial 110, 117, 118,

121, 136 – 138, 140 – 145, 165, 166
Interacción social 153
Enfoque de Solow-Swan 8
Logit espacial 154, 166
SpaceStat 135, 136, 163, 164, 165
Campo de media móvil espacial (SMA) 65, 66, 68,
Modelos de espacio-tiempo 152, 154 91
Matriz dispersa 161, 162, 166 Multiplicador espacial 153
Herramientas de análisis espacial 166 Valores atípicos espaciales 154, 162, 165
Autocorrelación espacial 5, 41, 90, Modelos de datos de panel espacial 148, 161
91, 102, 109, 134, 141, 142, 148, 149, 152,
Competencia espacial de precios 51, 160
154, 155, 157, 158, 160, 165, 166
Prioridades espaciales 154
Función de autocorrelación espacial 41 Probit espacial 153, 154, 166
Autocovarianza espacial 41, 42, 64 – 67, Modelo espacial de efectos aleatorios 148
93, 126, 127 Mínimos cuadrados espaciales de dos etapas
Modelo autorregresivo espacial 101 (S2SLS) 160
Modelo de factor común espacial 159 Campo de ruido blanco espacial 66, 67, 112,
116
Correlación cruzada espacial 42, 156
Variable rezagada espacialmente 38, 39, 60, 97,
Covarianza cruzada espacial 42, 93
104, 110, 111, 114, 117, 121, 126, 148, 156,
Dependencia espacial 4 – 6, 17, 33, 43, 46, 159, 160
55, 57, 69, 90, 95, 110, 116, 128, 130, 136
Estadísticas Espaciales 166
– 138, 140 – 143, 145, 146, 148, 151, 153,
155 – 158, 161, 164, 165 Espacio-temporal ARCO 152
Descomposición espectral 127

Velocidad de convergencia 10 – 13, 18, 20, Modelos espaciales que requieren mucho tiempo
23, 26, 137, 138, 140 – 145 162
Derrames 150, 153, 157 Ley de Tobler 46

ESTRELLA 152 Topología 33, 36, 37, 39, 136, 142
Stata 166 Matriz de transición 149
Estacionariedad de orden 1 45 Flujos de transporte 15
Estacionariedad de orden 2 45, 46, 48 Mínimos cuadrados de dos etapas 6, 156
Estacionariedad de orden k 45 Coche doble 59
Estacionariedad bajo rotación 44
Estacionariedad bajo traslación 44

tu
Campos aleatorios estacionarios 43 Imparcialidad 74, 81, 90, 126
Mecanismo generador de estadísticas 86 – Mezclar uniformemente los campos 47, 48, 70,
89, 94, 132 71
Estado estacionario 8 – 12, 149, 151 Prueba uniformemente más potente 81
Ley fuerte de los grandes números 70 Aproximación unilateral 77, 79
Ley fuerte de los grandes números para

mezclar campos 70 V
Campos fuertemente mezclados 70 Modelos VAR 152
Cambios estructurales 132, 134, 144 Campo gaussiano vectorial 42, 93

Estadísticas suficientes 125 Campo aleatorio vectorial 41, 42, 59, 85
Componente sistemático 13, 87, 95, 97, 125 Ley de Verdoorn 151
W
T
Prueba de Wald 81 – 83, 98, 106, 133
Cuentas 57
exogeneidad débil 87, 95
Progreso tecnológico 10, 150
Estacionariedad de sentido débil 45, 46
Dependencia temporal 20, 91, 151,
Matriz de pesos 111, 161
152
Disparidades de bienestar 7
Mínimos cuadrados de tres etapas (3SLS)
Prueba blanca 129
160
Winbugs 166
Serie temporal 4 – 6, 15, 20, 32, 38, 48, 64, 65,
66, 68, 75, 79, 108, 110, 111, 133, 134, 148, Campo de Poisson windsorizado 57
150 – 152, 155, 160

Untitled

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Untitled

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

Machine Translated by Google

En los últimos años, la llamada nueva geografía económica y el tema de la convergencia

Roma, Navidad de 2005 Giuseppe Arbia

Su distancia le da encanto a la vista. …

El libro de Giuseppe Arbia es otro testimonio de la vitalidad del análisis econométrico

Lo que he tratado de transmitir al lector de este libro es un sentido de su importancia

enero de 2006 Jean HP Paelinck

Posdata y pensamiento posterior

El campo aleatorio de precios mencionado anteriormente es conocido por los observadores

1 Motivación .................................................. .................................... 3

1.2 Modelos económicos teóricos que requieren econometría espacial

1.2.2 El enfoque de convergencia ÿ........................................... ..........8 1.3 Un análisis

de convergencia ÿ de las regiones de Europa e Italia ..................14

1.3.2 Un análisis de convergencia ÿ de las provincias italianas NUTS-3

1.3.3 Un análisis de convergencia ÿ de las regiones europeas NUTS-2

lista de temas omitidos y un resumen de los Libro ...............................27

2 Campos Aleatorios y Modelos Espaciales...................................... 31

2.2 El concepto de campo aleatorio ............................................... ...................33

2.2.1 La Naturaleza del Índice S ............................................... ....................34

2.2.1.1 Generalidades ............................................... ........................34

2.2.1.2 La Topología de un Campo Aleatorio .......................................36 2.2.2

La Estructura de dependencia de un campo aleatorio .......................39

2.3.1 Restricciones a la heterogeneidad espacial de un campo aleatorio .......43 2.3.2

Restricciones a la dependencia espacial de un campo aleatorio ......46 2.4 Algunos

campos aleatorios especiales ...... .................................................... .............49 2.4.1 Ruido

blanco espacial ............................... ..........................................49

2.4.2.1 Generalidades ............................................... ........................49

2.4.2.2 El teorema de Hammersley y Clifford ..........................50

XIV Tabla de contenido

2.4.2.3 Ley de Ising.................................................... ..........................52 2.4.2.4 El

2.4.2.7 El campo Auto-normal (o CAR) ..........................................57 2.4 .2.8 El

2.4.2.10 El campo Auto-normal multivariado (o MCAR) ...............60

2.4.3.1 El campo aleatorio autorregresivo simultáneo

aleatorios ............................................... ......68

2.5.2 Algunos teoremas de límite para campos aleatorios..........................69

3 Función de Verosimilitud para Muestras Espaciales............... 73

de codificación .................. .................................................... .76 3.2.2 La Aproximación

Unilateral.................................................. .............77 3.2.3 La pseudo-verosimilitud a la

Besag ........................... ......................79 3.2.4 Aspectos

computacionales ...................... .............................................80 3.3 Propiedades de

estimación de máxima verosimilitud en Muestras Espaciales...........81

3.5 Pruebas basadas en sumas residuales de cuadrados ........................................... .....84

4 El modelo de regresión lineal con datos espaciales ................. 85

4.2 Especificación de un modelo de regresión lineal ........................................... .85 4.2.1 La

Especificación Condicional ........................................... ..............86 4.2.1.1 Hipótesis sobre

el Modelo de Probabilidad (PM) ......................86

4.2.1.2 Hipótesis sobre el Mecanismo Generador de

4.2.2 Especificación estándar de libros de texto.................................... .......88

4.3 Violación de las Hipótesis del Modelo de Muestreo ................................90

4.3.2 Un procedimiento de prueba de propósito general para la

4.3.3 La reespecificación de la regresión lineal como un campo

4.3.3.1 Introducción .............................................. ..........................93

4.3.3.2 Reespecificación de las Hipótesis PM, GM y SM .......94

4.3.4 La Reespecificación de la Regresión Lineal con SAR

4.3.4.3 Equivalencia del modelo estadístico implícito en el

4.3.4.4 Contraste de hipótesis en el modelo de error espacial ..............105

4.3.5 La re-especificación de la regresión lineal agregando un

4.3.5.4 Contraste de hipótesis.................................................. ............115

4.3.6 Modelo espacial general de Anselin.................................................. ......116

4.4 Violación de las Hipótesis del Modelo de Probabilidad..........................120

XVI Tabla de Contenidos

4.4.2 Normalidad .................................................. ..........................................120

4.4.2.2 Pruebas de desviaciones de la normalidad ...........................121 4.4.2.3