Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A Francesco y Enrica
Machine Translated by Google
Machine Translated by Google
Prefacio
viii Prefacio
idad al nivel de libros como Grimmett y Stirzaker (1994) y un curso de Estadística al nivel
de libros como Azzalini (1996) o Mood et al. (1974). Un conocimiento previo de los
métodos básicos de análisis de series de tiempo al nivel de los primeros cinco capítulos
de Hamilton (1994) ayuda, porque existe cierta analogía entre la metodología espacial y
temporal.
Este volumen podría utilizarse como libro de texto para un curso introductorio de
posgrado de unas 20/30 horas, o como libro de referencia para estudiantes de posgrado
que realicen trabajos de doctorado en economía cuantitativa (u otras ciencias sociales),
en problemas de estimación econométrica espacial evolutiva.
Habiendo esbozado el objetivo general de este libro, descrito su génesis y sus lectores
potenciales, ahora me complace cumplir con el grato deber de agradecer a las muchas
personas que contribuyeron a su preparación y realización final. Este es el mejor momento
al escribir un libro (¡como bien sabe cualquiera que tenga una experiencia directa!). Hay
al menos dos razones para esto. La primera es que estas son, de hecho, las últimas
palabras escritas por el autor en este contexto, lo que significa que el trabajo pesado
finalmente está hecho y que lo que en la última fase solo puede calificarse como una
“obsesión”, eventualmente dará paso a otras. (esperemos que menos convincentes) tareas.
La segunda es que este es el único lugar donde se puede hablar de uno mismo y de su
entorno laboral y familiar y no sólo de conceptos abstractos y formalismos y esto es una
fuente inevitable de autosatisfacción para todos los autores.
Habría sido casi imposible realizar este libro sin la ayuda y el apoyo que recibí de
muchas personas. Me gustaría comenzar agradeciendo a Jean Pa elinck por ser el primer
autor que leí sobre el tema allá por 1984 cuando era estudiante de doctorado en la
Universidad de Cambridge y, después de conocerlo en persona, por haberse convertido
en una referencia constante para mi trabajo sobre este tema. En especial, hay que
agradecerle su constante ayuda, las útiles correcciones y sugerencias que me proporcionó
en varios borradores del libro y, sobre todo, su amistad.
También se agradece a Gianfranco Piras por su asistencia diaria durante este último año
con todos los problemas técnicos y no técnicos que surgieron durante la preparación del
volumen, así como por haber sido coautor del Capítulo 6 y el Apéndice. Mi agradecimiento
también a Francesco Moscone de la London School of Economics por su entusiasmo y
aliento desde el comienzo de este proyecto, a Giovanni Lafratta y Paolo Postiglione
(ambos de la Universidad “D'Annunzio” de Pescara) por haber sido coautores de las
Secciones 2.4 .2.10 y 4.4.2.3, respectivamente, ya Elisa To setti de la Universidad de
Cambridge por haber leído el manuscrito en varias etapas y por haber proporcionado
correcciones y sugerencias y adiciones muy útiles al texto original. No hace falta decir que
solo yo soy totalmente responsable de cualquier error que quede en la escritura y los
cálculos. También debo agradecer a Roberto Basile del Istituto di Studi ed Analisi
Economica (ISAE) y a Laura De Dominicis de la Universidad “Tor Vergata” y de la
Universidad Libre de Amsterdam por su ayuda en algunos de los cálculos informados en
la Sección 1.3 y el Capítulo 5. así como para revisar partes del libro. También deseo
agradecer a Robert Haining por su hospitalidad en el Departamento de Geografía de
Cambridge durante el verano de 2004 cuando estaba escribiendo el borrador final.
Finalmente quiero agradecer a todos mis estudiantes de doctorado por
Machine Translated by Google
Prefacio IX
su paciencia y apoyo en todo el período en que menos tiempo pude dedicar a sus
investigaciones ya los actores de la compañía de teatro “Palcoscenico '95” que tuvieron
que prescindir de mí en muchas ocasiones durante este período de intensa escritura.
Una mención muy especial se la debo a mis amados padres, quienes fallecieron
durante el último año cuando estaba trabajando en la versión final de este libro. Ya les
he dedicado mi segundo libro, pero siento que les estoy particularmente en deuda.
Aparte de la inmensa gratitud que siento hacia ellos por todos los aspectos de mi vida,
me gustaría decir muy específicamente que la presencia, el amor y el aliento constante
de mis padres para apuntar cada vez más alto han hecho toda la diferencia en mi vida
laboral y profesional como todo. No será lo mismo sin ellos.
Es común que los prefacios de libros contengan expresiones de agradecimiento a la
familia, esposa e hijos del autor por haberle permitido dedicarse (casi) por completo a
la carga de escribir un libro durante un largo período (durante el trabajo y no). horas de
trabajo, durante la semana y los fines de semana) y por haberle brindado el ambiente
propicio para cumplir con esta tarea. Esto es sin duda menos deseable, pero no creo
que se corresponda enteramente con lo que ocurre en la práctica. La mayoría de las
veces los distintos miembros de la familia no tienen elección y, si la tuvieran, preferirían
tener un libro menos en la estantería y más tiempo para pasar despreocupadamente
con su marido/padre, más paciencia de éste, más su ayuda en relación con sus propias
tareas. Habiendo dicho eso, en este mismo momento cuando estoy escribiendo estas
que (con suerte) serán las palabras finales de este libro, mis tres hijos están gritando
alegremente en la habitación contigua y (incluso si estoy tentado a unirme a ellos) no
están proporcionando exactamente lo que uno define como el "entorno adecuado" para
un escritor. No obstante, este libro está dedicado a mi maravillosa familia y, en particular,
a Francesco y Enrica ya que dediqué mi primer libro a Paola y Elisa antes de que
nacieran mis dos hijos menores. Es difícil decir por qué uno decide deliberadamente
dedicar tiempo a escribir un libro a expensas de su familia. Puede ser por un puro amor
al conocimiento, su difusión o tal vez la ilusión falaz de dejar algo a la posteridad, o
locura plana, o simplemente autosatisfacción o cualquier combinación de los anteriores.
Pero, al fin y al cabo, la positividad de nuestras acciones y el significado de cualquier
momento no está en nuestras manos: son cosas que simplemente suceden, como un
regalo inmerecido. Como la que celebramos este mismo día como todos los años.
Proemio
Mientras ejercía el preciado privilegio de leer el manuscrito de este libro, retrocedí en el tiempo, y en
el espacio... a principios de los años cincuenta, cuando comencé mi trabajo econométrico. Fue como
redescubrir los innovadores análisis de la demanda de René Roy (Econometrica, 1947), luego hojear
Mathematical Methods of Statistics, Sixth Printing, 1954, de Harald Cramer, para continuar con
Econometric Methods, 1963, de Johnston, y terminar con algunos artículo reciente sobre Sistemas de
Demanda Casi Ideales.
De hecho, esa es la ruta del libro de Giuseppe Arbia, que comienza con un problema espacial
empírico, mostrando la necesidad de un marco analítico riguroso, trabajando a través de una versión
simplificada pero operativa de este, y luego señalando que para ambos modelos fundamentales, el las
suposiciones son negadas en gran medida por los datos espaciales y sus representaciones apropiadas,
y esto desde los tres puntos de vista del modelo de probabilidad, el proceso de generación estadística
y el muestreo.
Esta presentación sintética del modelo espacial debe considerarse particularmente útil para el
lector que desee iniciarse en los modelos econométricos espaciales. Es especialmente importante el
hecho de que el análisis se realice a partir de la noción fundamental de campos aleatorios, ya que de
esta manera se establece la base axiomática para cualquier análisis regional posterior.
No es de extrañar, por lo tanto, que el modelo regional presentado inicialmente haya tenido que
adaptarse desde diferentes ángulos, ya que un enfoque simple y homogéneo no podía cubrir toda la
complejidad de los datos espaciales.
Estos, de hecho, muestran un patrón tan complejo, en parte inducido por el hecho de que están
fundamentalmente sesgados, como he mostrado en otra parte, de ahí esa aparente heterogeneidad.
De hecho, de las técnicas avanzadas propuestas en el último capítulo, quizás se deba prestar especial
atención a las herramientas exploratorias, y esto no solo para las variables crudas –que ya muestran
la mayoría de las veces puntos calientes, como han demostrado repetidamente los estadísticos
espaciales– sino también por los residuos obtenidos a partir de un primer análisis, aunque sea
debidamente espacializado (el “principio del doggy-bag”, como me gusta llamarlo: nunca tirar las
sobras…). De hecho, creo que las interdependencias espaciales y las externalidades están más
involucradas de lo que podría cubrirse con esquemas espacializados multivariados de Markov o
incluso de Yule. Cómo modelar apropiadamente, es decir, especificar, interrelaciones tan complejas
es, creo, uno de los principales desafíos para el futuro trabajo econométrico espacial.
Machine Translated by Google
XII Proemio
Tabla de contenido
3.2 Algunas aproximaciones para la probabilidad de campos aleatorios ........76 3.2.1 La técnica
Tabla de contenido XV
espacial.................................. ...............................126
4.4.3.1 Introducción ............................................. ......................126
1 Motivación
1.1 Introducción
Hasta finales del siglo pasado los métodos econométricos espaciales eran como los seis
personajes pi randellianos en busca de autor (Pirandello, 1921). En el drama surrealista del
gran dramaturgo italiano, seis personajes deambulaban por el escenario buscando
desesperadamente un autor que les explicara lo que tenían que hacer y les diera una razón
para vivir. La situación dramática residía en que sabían exactamente lo que tenían que
hacer, ¡pero no sabían por qué tenían que hacerlo! De manera similar, hasta hace unos
años, los métodos econométricos espaciales estaban bien desarrollados en la literatura,
pero el drama fue que nadie los usó en el análisis económico aplicado dominante.
Históricamente, los métodos econométricos espaciales provienen directamente de los
desarrollos del siglo XX en la literatura estadística diseñados para considerar el problema
de la violación del modelo de muestreo clásico (el paradigma de la urna) con un gran énfasis
en las similitudes causadas por la proximidad espacial. Estos desarrollos fueron necesarios
para proporcionar el entorno adecuado para explicar los fenómenos de difusión espacial
que se encuentran con frecuencia en muchos campos aplicados, como la epidemiología, la
geografía, los estudios agrícolas, la geología, el análisis de imágenes, las ciencias
regionales, la astronomía, la arqueología y muchos otros (ver Haining, 2003 para una revisión).
Las técnicas de estadística espacial que proporcionan la base para la econometría
espacial se remontan a medio siglo y pueden fecharse convencionalmente en el artículo
seminal de Peter Whittle de 1954 (Whittle, 1954), seguido de otras contribuciones
importantes del mismo autor (Whittle, 1962; 1963), por Bartlett (1963; 1975) y por Besag
(1974) entre otros. Los principales resultados obtenidos dieron lugar a una primera
codificación en los años setenta con importantes publicaciones como los célebres libros de
Cliff y Ord (1973) y Bennett (1979). Otros libros de texto bien establecidos siguieron en los
años ochenta (Ripley, 1981; 1988; Upton y Fingleton, 1985; 1989; Griffith, 1988; Arbia, 1989
entre otros), los años noventa (Haining, 1990; Cressie, 1991) y al principio del nuevo siglo
(Haining, 2003).
El término “econometría espacial” fue acuñado por Jean Paelinck a finales de los años
setenta durante el discurso general que pronunció en la reunión anual de la Asociación
Estadística Holandesa en mayo de 1974 (ver Paelinck y Klaassen, 1979), aunque el propio
autor sugiere que la La idea ya había aparecido en una conferencia anterior (ver Paelinck,
1967). En el prólogo del primer libro enteramente dedicado al tema (Paelinck y Klaassen,
1979) se sugiere que la nueva rama de la econometría es una “mezcla de teoría económica,
formalización matemática y estadística matemática” (página vii). Hay cinco características
fundamentales de
Machine Translated by Google
4 1 Motivación
Así, a finales de los años ochenta, la fase pionera de la disciplina parecía haber
concluido. Los métodos estaban allí, esperando que alguien los usara, ¡pero esto no
sucedió! ¡El drama pirandelliano!
De hecho, no fue sino hasta los años que unen los dos milenios que la corriente principal
de la econometría expresó un interés creciente en los métodos estadísticos espaciales: un
interés atestiguado por el creciente número de artículos que se refieren a importantes
problemas espaciales que aparecen en revistas econométricas y económicas aplicadas
recientes. Florax y De Vlist (2003) y Anselin et al. (2004) revisan estos documentos
minuciosamente y estudian 11 artículos en revistas econométricas y 30 en revistas de
economía aplicada ¡solo para el período posterior al año 2000!
Sin embargo, la integración de los métodos espaciales con la econometría se encuentra
en una fase temprana y aún está muy por detrás de la experimentada por los métodos de
series temporales en los años setenta después del libro pionero de Box y Jenkins (1970).
De hecho, si bien es cierto que ningún libro de texto estándar de econometría puede ignorar
las metodologías de series temporales, el tratamiento de los métodos espaciales es, por el
contrario, todavía muy raro y, cuando ocurre, no se dedican más que unos pocos párrafos
al tema. No se hace mención, por ejemplo, en algunos de los libros de texto introductorios
más recientes como Baltagi (1999), Berndt (1991), Davidson (2000), Davidson y MacKinnon
(1993), Dougherty (2002), Goldberg (1998), Gourieroux y Montfort (1995), Greene (2003),
Hayashi (2000), Hendry y Morgan (1995), Holly y Weale
Machine Translated by Google
1.1 Introducción 5
(2000), Johnston y Dinardo (1997), Judge et al. (1988), Ruud (2000), Seddighi et al. (2000), Spanos
(1986), Stewart y Gill (1998), Stock y Watson (2003), Thomas (1997), Verbeek (2000) y Woolridge
(2002b).
Excepciones notables en este sentido son los libros de Johnston (1991), Kmenta (1997), Maddala
(2001), Baltagi (2001), Woolridge (2002a), Gujarati (2003) y Kennedy (2003).
Johnston (1991) dedica unas pocas líneas a los problemas espaciales y señala que: “La exposición
anterior ha asumido implícitamente un marco temporal o de series de tiempo, pero el mismo fenómeno
puede surgir con datos de sección transversal, donde a menudo se lo denomina espacial .
autocorrelación.” (Johnston, 1991; pág. 305).
Kmenta (1997) también reconoce el problema de la no independencia de las observaciones
estadísticas en el espacio, afirmando que: “En muchas circunstancias, la suposición más cuestionable
del modelo anterior es que las unidades transversales son mutuamente independientes. Por ejemplo,
cuando las unidades transversales son regiones geográficas con límites trazados arbitrariamente,
como los estados de los Estados Unidos, no esperaríamos que esta suposición se satisfaga por
completo”. (página 512). Sin embargo, no se mencionan las posibles soluciones a este problema.
Maddala (2001) solo menciona brevemente el problema de la dependencia espacial entre residuos
contiguos de una regresión lineal: “Existen dos situaciones en las que se pueden correlacionar los
términos de error en el modelo de regresión. En datos de sección transversal puede surgir entre
unidades contiguas. Por ejemplo, si estamos estudiando el patrón de consumo de los hogares, se
pueden correlacionar los términos de error para los hogares del mismo barrio. Esto se debe a que los
términos de error recogen los efectos de las variables omitidas y estas variables tienden a estar
correlacionadas para los hogares.
en el mismo vecindario (debido al efecto "mantenerse al día con los Jones").
De manera similar, si nuestros datos son sobre estados, los términos de error para estados contiguos
tienden a estar correlacionados. Todos estos ejemplos caen en la categoría de correlación espacial”.
(ver Maddala, 2001, p. 228).
La segunda edición del conocido libro de texto de Baltagi sobre datos de panel incluye una breve
discusión de los problemas generados por el tratamiento de paneles espaciales. El autor afirma que
“Cuando uno comienza a observar una sección transversal de países, regiones, estados, etc., es
probable que estas unidades agregadas muestren una correlación transversal que debe abordarse.
Existe una extensa literatura que utiliza estadística espacial que trata este tipo de correlación… Los
modelos de dependencia espacial pueden utilizar una métrica de distancia económica que proporcione
datos transversales con una estructura similar a la que proporciona el índice de tiempo en una serie
de tiempo”. (Baltagi, 2001; págs. 195-197).
Gujarati presenta el problema solo brevemente al señalar que: “si por casualidad tal correlación
se observa en unidades de sección transversal, se denomina autocorrelación espacial, es decir,
correlación en el espacio y no en el tiempo” (Gujarati, 2003; p. 441) .
Kennedy (2003) advierte al lector que: “no todos los casos de errores autocorrelacionados se
relacionan con datos de series de tiempo […]. La econometría espacial se refiere al análisis de datos
espaciales en los que los errores se correlacionan con errores asociados con regiones cercanas.
Este tipo de no esfericidad se denomina correlación espacial”.
Machine Translated by Google
6 1 Motivación
Finalmente, Woolridge (2002a) dedica una mención al tema de la dependencia espacial en las
primeras páginas de su libro: “Una situación que requiere una consideración especial ocurre
cuando las observaciones de la sección transversal no son independientes entre sí. Un ejemplo
son los modelos de correlación espacial . Esta situación surge cuando se trata de grandes
unidades geográficas que no se puede asumir que sean independientes de una gran población,
como los 50 estados de los Estados Unidos. Es razonable esperar que la tasa de desempleo en
un estado se correlacione con el desempleo en los estados vecinos. Si bien los métodos de
estimación estadística, como los mínimos cuadrados ordinarios o los mínimos cuadrados en dos
etapas, generalmente se pueden aplicar en estos casos, la teoría asintótica debe modificarse.
Las estadísticas clave a menudo (aunque no siempre) deben modificarse […]. Para bien o para
mal, la correlación espacial a menudo se ignora en el trabajo aplicado porque corregir el problema
puede ser difícil” (Woolridge, 2002; p. 6). Este libro de texto también contiene una breve sección
que desarrolla la idea un poco más a fondo cuando se trata de las diversas formas de dependencia
entre los residuos “Como sugiere la subsección anterior, los datos de sección transversal que no
son el resultado de un muestreo independiente pueden ser difíciles de manejar.
1.2.1 Introducción
Hasta hace unos años la estadística espacial era un tema fuera del campo de interés de
los economistas aplicados. En años recientes, sin embargo, ha habido un florecimiento de
estudios económicos que, al desarrollar modelos teóricos que implican relaciones entre
variables observadas en países o regiones, han estimulado mucho el interés en la medición
y el modelado estadístico de variables espaciales. La mayoría de estos modelos están
vinculados a los desarrollos de la llamada nueva geografía económica (Krugman, 1991,
Fujta et al., 1999; Krugman y Venables, 1995; Ottavio y Puga, 1998; Puga y Venables,
1997; 1999). ; Durlauf y Quah, 1999) y al renovado interés de los economistas por los
problemas relacionados con el crecimiento económico y las condiciones bajo las cuales los
niveles de ingreso per cápita de varias regiones tienden a converger en el tiempo. Este
tema es actualmente de gran interés especialmente en relación con el reciente debate
europeo. De hecho, en muchos aspectos, una de las principales razones de una Unión
Europea y de un acuerdo sobre políticas económicas es el objetivo de reducir las
disparidades en la distribución del bienestar. Un aspecto importante de tal objetivo se
refiere a la reducción de las disparidades entre las tasas de crecimiento de los niveles de
ingreso per cápita, sobre la base de que esto, a la larga, garantizaría una reducción de las
disparidades en el bienestar. El análisis de la dispersión de los ingresos regionales se
considera a menudo como un indicador de la desigualdad en la distribución de los ingresos
personales y se utiliza como indicador en los debates de política económica (véase UE,
2005). Como consecuencia, los científicos europeos han dedicado importantes esfuerzos
de investigación empírica a este tema (como lo atestiguan libros como Fingleton, 2003, por ejemplo).
En esta sección revisaremos brevemente algunos modelos teóricos que se han
introducido para formalizar la idea de convergencia regional y proporcionar una base
rigurosa para la prueba empírica de tal hipótesis. En particular, en la Sección 1.2.2 nos
concentraremos en el modelo de convergencia popular
ÿ para una (ver Barro
revisión). Este ymodelo
Sala-i Martin, 1995a lo
se utilizará
largo del libro para ilustrar las diversas técnicas econométricas espaciales. La razón de
esta elección es de dos
Machine Translated by Google
8 1 Motivación
pliegue. En primer lugar, dicho modelo ha sido el más popular en el campo de la convergencia
regional e indudablemente el que ha experimentado el uso más amplio de técnicas econométricas
espaciales en la literatura (ver, por ejemplo, Fingleton, 2003; Anselin et al., 2004 ). ). En segundo
lugar, representa un ejemplo muy simple e intuitivamente atractivo que proporciona una buena
base tanto para ilustrar las peculiaridades de los diversos problemas planteados por una
regresión basada en datos espaciales como para describir las diversas soluciones que ofrecen
las técnicas econométricas espaciales.
El enfoque de convergencia ÿ fue desarrollado por Mankiw et al. (1992) y Barro y Sala-i-Martin
(1995) a partir de las contribuciones anteriores de Solow (1956) y Swan (1956), y, desde un
punto de vista económico-teórico, se considera uno de los más convincentes para explicar la
convergencia económica de la renta per cápita.
El modelo se concibió originalmente para explicar las diferencias entre los diferentes niveles de
ingreso nacional, pero de hecho descubrió una razón de ser más fuerte cuando se usó para
explicar las diferencias entre el ingreso regional dentro del mismo país o grupo de países. De
hecho, el modelo de crecimiento neoclásico predice la convergencia condicional al único estado
estacionario1 de economías caracterizadas por los mismos parámetros estructurales en términos
de gustos, dotaciones y tecnologías. Sin embargo, el supuesto de condiciones estructurales
uniformes puede aceptarse más fácilmente cuando se refiere a regiones dentro de un país que
entre países, como lo reconocen, por ejemplo, Barro y Sala-i-Martin (1995) cuando afirman:
“aunque Si existen diferencias en tecnologías, preferencias e instituciones entre regiones, es
probable que estas diferencias sean menores que entre países (Barro y Sala-i-Martin, 1995; p.
382).
También comentan explícitamente: “Es más probable que la convergencia absoluta se aplique
entre regiones dentro de los países que entre países”.
El marco teórico se basa en el modelo neoclásico de Solow Swan de crecimiento a largo
plazo (Solow, 1956; Swan, 1956). El modelo asume tasas de ahorro exógenas y una función
de producción basada en la productividad decreciente del capital y rendimientos constantes a
escala. Bajo estos supuestos, el modelo predice que, a largo plazo, el ingreso per cápita de una
economía converge hacia su estado estacionario.
1
Un estado estacionario se define como la situación en la que todas las variables crecen a tasas constantes.
Machine Translated by Google
un 1 un
K = yo - dk (1.2)
siendo I el nivel de los flujos brutos de inversión y K la derivada del stock de capital con
respecto al tiempo. Así, en cada período de tiempo, el crecimiento del capital físico es
igual a la cantidad de flujos brutos de inversión menos la depreciación del capital.
Suponiendo que la inversión es igual al ahorro total y que el ahorro total es proporcional
al ingreso, tenemos:
= = sAK L ÿ 1
I sy un un
(1.3)
y por lo tanto:
=
K sAK LK un 1ÿ un
ÿ
d (1.4)
k k L k
=ÿ=ÿ
norte (1.5)
k k L k
k
kk = knk ÿ=ÿ
nk (1.6)
k L
10 1 Motivación
IK d
ÿ
k= ÿ
nk (1.7)
L
SAK L 1 un un
dk
ÿ
k= ÿÿ=
( nk sak knÿ + d
un
) (1.8)
L L
Finalmente, al dividir ambos lados por k, obtenemos una expresión formal del crecimiento del
ÿ k, como:
capital, digamos
k 1
== sak
ÿ
( ÿ +d norte)
un
ÿ k (1.9)
k
ˆ
ˆ
[ ˆ ]
= dk en(
ÿ ÿ k ÿÿ
(1.11)
ÿ k dt b ln
) /ÿ ÿ ÿ ÿ
ÿ
ˆ*ÿ
ÿ k ÿÿ
ÿ
ÿ
ÿ ÿ
ˆ * ˆ
, y el
donde ln representa el logaritmo natural, k el valor de estado estacionario de k
el coeficiente b se puede obtener de la expresión b = (1ÿ a)(x + n + )d.
Machine Translated by Google
ÿbt * ÿbt
ln[ yt
] ˆ( ) (1 e )ln(+ˆtu) y
ln[ˆ(0)] (1.12)
*
yˆ . donde
yˆ El
representa
coeficiente
el b
valor
en la
deecuación
estado estacionario
(1.12) proviene
de
de la linealización logarítmica de la ecuación ˆ
ción (1.10) alrededor del estado estacionario y determina la velocidad con la que k se mueve
ˆ*
hacia su valor de estado estacionario ( k ). Por esta razón, se denomina velocidad de convergencia
(ver Barro y Sala-i-Martin, 1995; Apéndice del Capítulo 1). Usando la función de producción Cobb-
Douglas simple (1.1) encontramos que el coeficiente de velocidad de convergencia para el
producto per cápita y es igual a la velocidad de convergencia para la relación capital-trabajo k.
Además, su valor no depende del nivel de tecnología A(t).
1
= en (2) = 0,69 b
ÿ
media vida
ÿ
(1.13)
b
Una de las limitaciones del modelo (1.12) es que, de forma poco realista, supone tasas de ahorro
constantes. Para eliminar esta limitación, algunos autores han tratado de extender el marco
anterior asumiendo que la tasa de ahorro es función del stock de capital per cápita k. El modelo
parte de un sistema de dos ecuaciones diferenciales que explica el comportamiento de la relación
capital-trabajo tecnológicamente aumentada
ˆ
k y del consumo per cápita tecnológicamente aumentado cˆ , definido como
ˆ
ˆ = C , C que representa el consumo y L = LA t( ) .
C ˆ
L
Esto nuevamente lleva a expresar el producto per cápita como:
ÿbt *
ln[ yt
] ˆ( ) =ÿ
(1 e )ln(ÿporˆ )cierto
+ y
ln[ˆ(0)] (1.14)
Para una demostración basada en la expansión de Taylor en torno al estado estacionario, véase
Barro y Sala-i-Martin (1995; p. 87).
Machine Translated by Google
12 1 Motivación
( ÿ ÿ( 1) y T 1
ÿ
mi
ÿ
bt ) ÿÿ
yˆ
*
ÿ = +X
en ÿ
ÿ
ÿ
(1.15)
en ÿ ÿ
T ÿ yˆ(0) ÿ T ÿ yˆ(0) ÿ
siendo x la tasa de crecimiento ya definida del término tecnológico (ver Barro y Sala-i-
Martin, 1995; p. 80-81). Si el término x, la velocidad de convergencia b y la duración
del intervalo de tiempo T son constantes, entonces el efecto de la condición inicial yˆ y
el* modelo predice con condicional depende de
la vergencia de la posición de estado estacionario.
ÿy ÿ
'- ÿ en[y ]t
ln ÿ t ÿ (1.16)
ÿ=
ÿ yt ÿ
con t = 1, 2, …, T, y
ÿ
' 1 = x + -(mi ÿ
bt )[en(yˆ )+ x *
]t
se supone que es constante en todos
( eÿ
= ÿ 1ÿ ) bt e, inversamente, b =ÿ
ln(1+ ÿ ) .
Embarcacion
ÿ t
En particular, si consideramos solo dos observaciones al comienzo y al final del
período de tiempo, la ecuación (1.6) implica que la tasa de crecimiento promedio en el
intervalo de longitud T está dada por:
1 ÿ yT ÿ
en ÿ= ÿ
' en
ÿ
[y] 0 (1.17)
T
ÿ
ÿ
ÿy0 ÿ
' = + x (1 (1 )
ÿbT ÿbT
ˆ en(1+ ÿ T ) .
ÿ ÿ
e e
con ÿ ) en( )y * y ÿ =ÿ y por lo tanto b =ÿ
T T T
Partiendo de esta base conceptual, autores como Mankiw et al. (1992) y Barro y Sala-i-
Martin (1995) sugirieron aumentar la Ecuación (1.17) para
Machine Translated by Google
Incluir una perturbación aleatoria que refleje cambios inesperados en las condiciones
o preferencias de producción y estimarla utilizando observaciones transversales. Así
propusieron el siguiente modelo estadístico:
ÿy Yo,
ÿ
1 en = µ + ÿ (1.18)
ÿ ÿ
o ,ti , i
T
ÿy
ÿ
0,i ÿ ÿ
bT
' (1 mi
ÿ
)
=
µ ÿ en y
(1.19)
ÿ
0, yo
0, Yo
,
T
bT
y Yo, ÿ
ÿ
ÿ
(1 mi
ÿ
1 en ' = -ÿ ) En y + ÿ (1.20)
ÿ ÿ
0,i i
T T
ÿ y 0,i ÿ
ÿ ÿ
Desde un punto de vista inferencial, la Ecuación (1.20) suele estimarse siguiendo dos
estrategias posibles. Se estima directamente a través de mínimos cuadrados no lineales
bT
o, alternativamente, se vuelve a parametrizar configurando ÿ(1 =)ÿ)ÿ mi
y
ÿ
) (y por lo tanto
en(1+ ÿ '
b =ÿ
ÿ =T ÿ . En este segundo caso la Ecuación (1.20) se convierte en:
T
ÿy ÿ
, en ÿ Yo = ÿ + ÿ en + y ÿ (1.21)
ÿ ÿ
0,i i
ÿ y 0,i ÿ ÿ
14 1 Motivación
Mankiw también comenta que: “para que los errores estándar informados sean correctos, los
residuos de Canadá no deben estar correlacionados con los residuos de EE. UU. Si los residuales
de los países están de hecho correlacionados, como es plausible, lo más probable es que los datos
contengan menos información de la que indica el error estándar informado”. (ver Mankiw, 1995; p. 304)
Finalmente Temple (1999; p. 130) reconoce que: “sin más evidencia de que las perturbaciones
son independientes, los errores estándar en la mayoría de las regresiones de crecimiento deberían
ser tratados con cierto grado de desconfianza”.
Debido a la importancia primordial de este tema, ahora lo ilustraremos más a fondo haciendo
referencia a dos conjuntos de datos regionales europeos.
1.3.1 Introducción
En esta sección presentamos algunos conjuntos de datos regionales relacionados con el crecimiento
económico que se utilizarán a lo largo del libro para ilustrar los problemas que surgen al cuantificar
las relaciones en el espacio. Más específicamente, el objetivo es ilustrar algunas de las
características geográficas del PIB y los datos de crecimiento utilizados en el análisis de
convergencia estándar e introducir la necesidad de correcciones apropiadas en consideración a su
naturaleza espacial.
Una importante fuente de información sobre la distribución espacial de la renta y la riqueza a
nivel europeo se puede encontrar en la base de datos REGIO. RE GIO es la base de datos
estadística regional armonizada de Eurostat que cubre los principales aspectos de la vida económica
y social en la Unión Europea. Fue creado en 1975
Machine Translated by Google
Se analizarán dos conjuntos de datos distintos extraídos de la base de datos REGIO. El primero se
refiere a una serie temporal del PIB per cápita en las 92 provincias italianas, es decir, las regiones de
nivel NUTS-3 de la clasificación oficial de la UE. En la Figura 1.1 se presenta un mapa de las provincias
italianas. El segundo conjunto de datos describe la dinámica del PIB per cápita en 129 regiones
europeas NUTS-2 de 10 países europeos cuyo mapa se muestra en la Figura 1.2. Elegimos
deliberadamente dos niveles diferentes de desagregación espacial porque, como puede imaginarse
fácilmente, las conclusiones pueden ser muy diferentes si observamos un fenómeno económico en un
nivel de detalle geográfico grueso o fino.
En las siguientes dos secciones analizaremos el crecimiento del PIB en los dos conjuntos de datos.
aplicando el marco de convergencia ÿ descrito en la sección anterior.
Figura 1.1. Mapa de las 92 regiones italianas de nivel NUTS-3 según la clasificación oficial de la
UE (provincias).
Machine Translated by Google
dieciséis 1 Motivación
Figura 1.2. Mapa de 129 regiones europeas de nivel NUTS-2 de la clasificación oficial de la UE
de 10 países europeos.
Comencemos con un análisis descriptivo del fenómeno del crecimiento regional en las
provincias italianas durante el período 1951-1999. La Tabla 1.1 presenta algunas
estadísticas descriptivas y las Figuras 1.3 y 1.4 muestran el patrón geográfico de los
ingresos per cápita al principio y al final. del período observado y sus tasas de crecimiento
relativas, respectivamente.
La Figura 1.3 está dibujada como un mapa de cuartiles y muestra un patrón marcado
centro-periferia en ambos años: El centro está situado en la parte norte del país, lo que
refleja la conocida dicotomía italiana entre el norte rico y las provincias más pobres del
sur. . Esta característica es evidente en ambos años, con la única diferencia de un cambio
de las provincias del noroeste a las del noreste durante el período. Una de las
características más notables de este conjunto de datos es que las provincias ricas tienden
a agruparse en el espacio y, como consecuencia, todo el mapa muestra una tendencia
geográfica bastante evidente que disminuye de norte a sur. De hecho, al mirar los dos
mapas, uno tiene la impresión visual de que el ingreso per cápita se distribuye
continuamente en el espacio con solo unas pocas excepciones. Esta tendencia de las
regiones ricas a estar rodeadas por otras regiones ricas (y, por el contrario, las regiones
pobres a estar rodeadas por regiones pobres) no es en modo alguno peculiar del estudio
de caso examinado aquí y ciertamente representa una de las características más comunes
mostradas por datos económicos espaciales. La continuidad de los fenómenos económicos
en el espacio representa la evidencia empírica de la característica descrita en los diversos libros de texto de econometría.
Machine Translated by Google
Tabla 1.1. Estadísticas descriptivas de los ingresos per cápita y tasas de crecimiento en las 92
provincias italianas (años 1951 y 1999).
1951 3.28 14.00 6.97 4.72 5.90 7.17 0.38 1.14 3.89
1999 15.77 49.13 30.97 23.08 29.75 35.57 0.27 0.10 2.23
Tasa de crecimiento
1951-99 1.82 4.43 3.16 2.94 3.33 3.63 0.16 -0.40 0.03
(un) (b)
Figura 1.3. Distribución del PIB per cápita (expresado en logaritmo natural) en las 92 provincias
italianas; (a) año 1951 y (b) año 1999.
revisado en la Sección 1.1 (Kmenta, 1997, Maddala, 2001, Johnston, 1991, Baltagi, 2001,
Kennedy, 2003 y Woolridge, 2002a). Más adelante en el libro se hará referencia a esta
característica como “dependencia espacial”.
La Figura 1.4 muestra las tasas de crecimiento registradas en el intervalo de tiempo
observado. Aquí el patrón es muy diferente, con las tasas más altas distribuidas irregularmente
en la parte este del país. Una mirada más cercana a las Figuras 1.3 y 1.4 revela evidencia de
convergencia ÿ en el sentido de que algunas de las regiones más pobres (a saber, aquellas
distribuidas a lo largo del mar Adriático) experimentaron un crecimiento más rápido que la
mayoría de las regiones más ricas en el norte durante el tiempo observado. intervalo.
Machine Translated by Google
18 1 Motivación
Provincias italianas
primer cuartil
segundo cuartil
tercer cuartil
cuarto cuartil
Figura 1.4. Distribución de las tasas de crecimiento del PIB per cápita de las provincias (log) para las 92
provincias italianas durante el período 1951-1999.
Obviamente, se requiere un análisis más formal para corroborar esta impresión visual y
cuantificar la velocidad de convergencia.
El gráfico 1.5 muestra la dinámica de la dispersión del PIB real per cápita (medida en
términos logarítmicos) durante el período 1951-1999, medida sintéticamente por el coeficiente
de variación (la relación entre la desviación estándar y el promedio nacional).
El análisis de la trayectoria temporal de la variabilidad geográfica se refiere a menudo en la
criticado duramente,
ÿ convergencia
por ejemplo,
lit ( Barro
por Arbia
y Sala-i-Martin,
(2001b), es1995),
el adoptado
un enfoque
en elque,
informes
aunque
oficiales
de la UE (véase, por ejemplo, UE, 2005). Las desigualdades regionales se redujeron en más
de la mitad durante todo el período, pero la marcada tendencia hacia la convergencia se limitó
al período comprendido entre 1951 y 1970. Esto se debe en parte al importante esfuerzo de
desarrollo territorial en el Sur (a través de la Cassa del Mezzogiorno) y en parte al desarrollo
de las regiones nororientales. El período subsiguiente se caracterizó, en cambio, por una
sustancial invariancia de las desigualdades de ingresos.
0.19 0,95
0.9
0.17
0.85
0.15 0.8
0.75
0.13
0.7
0.11 0,65
1951 1953 1955 1957 1959 1961 1963 1965 1967 1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999
0.6
0.09
0,55
0.07 0.5
coeficiente de variación
Figura 1.5. Provincias italianas ÿ-convergencia de la renta per cápita en el período 1951-99 (Coeficiente
de variación).
5
4,5
4
3,5
3
crecimiento
1951-1999
tasas
de
2,5
2
1,5
1
0,5
0
8 8,2 8,4 8,6 8,8 9 9,2 9,4 9,6 9,8
Logaritmo natural del PIB per cápita de 1951
Figura 1.6. ÿ-convergencia entre las provincias italianas. Diagrama de dispersión de la tasa de
crecimiento durante el período 1951-1999 versus el logaritmo natural del PIB per cápita (1951).
20 1 Motivación
Tabla 1.2. OLS Estimaciones de la regresión de convergencia ÿ del ingreso per cápita en las 92 provincias italianas (1950-1999).
(Los números entre paréntesis se refieren a los valores p).
-0,016
ÿ (Constante)
(0,735)
-0,909
ÿ
(0,000)
Bondad de ajuste
R2 ajustado 0.366
Diagnóstico de regresión
2,133
Prueba de normalidad de Jarque-Bera
(0,344)
0,050
Prueba de heteroscedasticidad de Breusch-Pagan
(0.822)
en(1 + ÿ ) 1
= en (2) = 0,69b _
ÿ
T b
ingreso per cápita, mientras que el predictor es el nivel inicial de ingreso per cápita (expresado en
logaritmos naturales). Ambas variables están escaladas al promedio nacional.
Nuestros resultados parecen estar muy en línea con los hallazgos previos sobre el desarrollo de
las regiones/provincias italianas. El coeficiente de ÿ-convergencia para todo el período es altamente
significativo con el signo negativo esperado, lo que confirma la presencia de convergencia en los años
1951-1999. Su valor (-0,909) implica una tasa de convergencia anual del 4,7% y una vida media de
14,74 años.
La Tabla 1.2 también informa algunos diagnósticos para identificar especificaciones erróneas en el
modelo de regresión. En primer lugar, la prueba de normalidad de Jarque-Bera (Jarque y Bera, 1980)
no es significativa. En consecuencia, podemos interpretar con seguridad los resultados de las diversas
pruebas de errores de especificación que dependen del supuesto de normalidad. En segundo lugar,
dado que no se revelaron problemas con respecto a la falta de normalidad, se da el estadístico de
Breusch-Pagan (Breusch y Pagan, 1979). Su valor también está lejos de ser significativo, lo que lleva a
aceptar el supuesto de homocedasticidad.
El resultado de la regresión, por lo tanto, informa un buen ajuste y ninguna advertencia de error de
especificación. Pero, ¿qué pasa con la hipótesis de independencia asumida en el modelo de muestreo?
Cuando se trata de un modelo de regresión dinámico basado en series temporales de datos, es
práctica habitual contrastar el supuesto de independencia del componente no sistemático (ver Sección
1.2) con el de una dependencia temporal entre residuos.
En este caso, el supuesto de independencia se prueba formalmente a través de la prueba de Durbin
Watson (Durbin y Watson, 1950, 1951) o a través de las otras alternativas.
Machine Translated by Google
Residuales (1951/99)
Más de -1 Estándar desarrollo
De -1 a 0 Estándar desarrollo
De 0 a 1 Estándar desarrollo
Más de 1 estándar desarrollo
Figura 1.7. Mapa de los residuos estandarizados empíricos de la Ecuación (1.21) estimados en las
92 provincias italianas. Las tasas de crecimiento se han medido para el período 1950-1999. Los
residuos grandes se identifican como aquellos que exceden más o menos una desviación estándar
y se muestran en blanco y negro respectivamente.
propuestos en la literatura (por ejemplo, los propuestos por Box y Pierce, 1970; Wallis, 1972;
Ljung y Box, 1978; Kobayashi, 1991 entre otros).
Por el contrario, cuando se trata de una regresión estimada a partir de datos espaciales, los
libros de texto de econometría sugieren que no se realicen pruebas rigurosas de la independencia
de los residuos de la regresión porque no existe una alternativa adecuada. Ante esta carencia,
comencemos, al menos por el momento, con una simple inspección visual del mapa geográfico
de los residuos estandarizados. Este mapa se muestra en la Figura 1.7.
Una inspección visual de la Figura 1.7 revela un patrón geográfico de residuos bastante
distinto. De hecho, los grandes residuos geográficos positivos se concentran en las regiones del
extremo sur de la península (Cerdeña, Sicilia y Apulia), mientras que los grandes residuos
negativos se concentran en las zonas central y norte correspondientes a gran parte del Véneto,
Emilia-Romagna y Regiones de Umbría. Además, en pocos casos podemos observar grandes
residuos positivos (los marcados en negro en el mapa) yuxtapuestos a grandes residuos negativos
(los marcados en blanco). Los residuos se distribuyen de manera bastante regular en el espacio
con una transición suave desde unos pocos “puntos calientes” de valores positivos grandes
(ubicados en el sur) a valores más bajos, dando la impresión visual de una especie de continuidad
espacial.
A partir de estas consideraciones, parece bastante claro que la relación estimada es bastante
insatisfactoria a pesar de los buenos resultados del modelo medidos por los diagnósticos del
modelo estándar. De hecho, el modelo tiende a sobreestimar (produciendo residuos negativos)
las tasas de crecimiento en algunas provincias ubicadas en
Machine Translated by Google
22 1 Motivación
proximidad entre sí (es decir, las zonas centro y norte). Por el contrario, la relación tiende a
subestimar las tasas de crecimiento (produciendo residuos positivos) en algunas otras
provincias geográficamente ubicadas en el sur. En estas condiciones, la relación estimada en
la regresión anterior no puede tomarse como una buena representación de la realidad. De
hecho, la especificación lineal no es capaz de capturar la relación entre las dos variables o,
alternativamente, se han omitido algunas variables explicativas relevantes relacionadas con la
geografía del fenómeno. Note que no podemos cambiar la especificación del modelo en el
caso específico que estamos analizando porque el modelo económico-teórico que queremos
probar requiere la linealidad de la relación como se explica en la Sección 1.2. Así, la única
posibilidad de mejorar el desempeño del modelo descansa en la consideración explícita del
espacio como una variable adicional que explica por qué algunas regiones que ocupan una
posición definida en el espacio crecen más rápido de lo que deberían según la teoría
económica asumida.
Tales consideraciones nos motivan hacia un análisis más formal de la peculiaridad del
espacio en el estudio de las relaciones económicas.
Consideremos ahora el segundo conjunto de datos que se refiere a las regiones de la Unión
Europea en un nivel NUTS-2. En este análisis, consideramos nuevamente el PIB per cápita
(medido en paridades de poder adquisitivo) de 129 regiones europeas para el período 1980-1996.
Al igual que los datos italianos considerados en la Sección 1.3.2, este segundo conjunto de
observaciones también se deriva de la base de datos REGIO proporcionada por Eurostat y se
refiere a las unidades territoriales de diez países europeos (es decir, Bélgica, Dinamarca,
Francia, Grecia, Alemania Occidental, Italia, Luxemburgo, Portugal, España y los Países
Bajos) al nivel NUTS-2.
Hemos elegido la subdivisión NUTS-2 en este segundo análisis porque puede
considerarse lo suficientemente fina como para observar efectos espaciales a nivel continental.
Comencemos de nuevo con un análisis descriptivo basado en la convergencia
ÿ de las
regiones europeas durante el período considerado. La Figura 1.8 muestra el coeficiente de la
dinámica de variación durante el período 1980-1996. Tras una fase en la que las desigualdades
regionales parecen permanecer constantes, a partir de 1986 se observa una tendencia
decreciente del coeficiente de variación y, por tanto, una disminución de las disparidades
económicas entre regiones.
Consideremos además una inspección visual del patrón geográfico del PIB en el año inicial
(1980) y en el año final del período (1996), y de la tasa de crecimiento observada durante
todo el período. Los mapas del PIB en los dos años se reportan en las Figuras 1.9ay 1.9b.
Ambos mapas muestran una tendencia espacial con un marcado patrón centro-periferia. De
hecho, los valores más altos del PIB en ambos años se concentran en el centro del continente
(ubicado entre el sur de Alemania, el este de Francia y el norte de Italia) con un descenso
suave hacia los valores más bajos que pueden observarse en las regiones periféricas del
continente.
Machine Translated by Google
0,12
0,11
0,1
0,09
0,08
0,07
0,06
Figura 1.8. ÿ-convergencia de la renta per cápita de las regiones europeas durante el período 1980-
1996 (coeficiente de variación).
La Figura 1.10 reporta las tasas de crecimiento registradas en el período de 1980 a 1996.
De manera similar a la Figura 1.4, las regiones caracterizadas por niveles iniciales más bajos de PIB
per cápita (por ejemplo, las regiones españolas) experimentaron tasas de crecimiento más altas en
el intervalo de tiempo, mientras que las regiones con un alto nivel de PIB per cápita en 1980
(notablemente Francia y el norte regiones italianas) muestran bajos niveles de crecimiento en el intervalo.
Dado que las Figuras 1.8 a 1.10 muestran evidencia de convergencia, pasamos a una forma formal
ÿ -Análisis de convergencia estimando la Ecuación (1.21) en este nuevo conjunto de datos.
Para empezar, la figura 1.11 muestra el diagrama de dispersión de la tasa de crecimiento con
respecto al nivel inicial de ingreso per cápita y corrobora aún más la hipótesis de convergencia.
De hecho, las regiones más pobres (correspondientes a Portugal) muestran mayores tasas de
crecimiento y las más ricas (correspondientes a los Países Bajos) crecen relativamente menos:
casi un 80% más lentamente que las más pobres.
Los principales resultados de los procedimientos de estimación de OLS se resumen en la Tabla 1.3.
Los resultados empíricos destacan la convergencia. La estimación del coeficiente
ÿ es negativa
y altamente significativa. La velocidad de convergencia implícita es del 1,87% y la vida media es
de 36,96 años. Este resultado está de acuerdo con la “ley empírica del 2%” observada por Barro
y Sala-i-Martin (1995) y Sala-i-Martin (1996)2 .
La Tabla 1.3 también muestra algunos diagnósticos para evaluar el desempeño del modelo de
regresión. Tanto la prueba de normalidad de Jarque-Bera como la prueba de heteroske dasticity
de Breusch-Pagan no son significativas.
2
En Barro y Sala-i-Martin (1995) y Sala-i-Martin (1996), los autores encontraron que, al analizar
las regiones europeas, norteamericanas y japonesas por separado, la velocidad de convergencia
fue sorprendentemente similar en diferentes regiones y midió aproximadamente aproximadamente
el 2%.
Machine Translated by Google
24 1 Motivación
(un)
(b)
Figura 1.9. Distribución del PIB per cápita (expresado en logaritmo natural) en las 129
regiones europeas NUTS-2 en (a) 1980 y (b) 1996.
Machine Translated by Google
Yo cuartil
II cuartil
III Cuartil
Cuartil IV
Figura 1.10. Distribución de las tasas de crecimiento del PIB per cápita (expresadas en logaritmo natural)
en las 129 regiones europeas NUTS-2 en el período 1980-1996.
1,8
1,6
1,4
1,2
0,8
0,6
0,4
0,2
Figura 1.11. ÿ-convergencia entre las regiones europeas. Diagrama de dispersión de la tasa de
crecimiento durante el período 1980-1996 versus el logaritmo natural del PIB per cápita (1980).
Machine Translated by Google
26 1 Motivación
Tabla 1.3. Estimaciones MCO de la regresión de convergencia ÿ de la renta per cápita en las 129 regiones europeas
(1980-1996). (Los números entre paréntesis se refieren a los valores p)
3.361
ÿ (Constante)
(0.000)
-0.273
ÿ
(0.000)
Bondad de ajuste
0.322
R2 ajustado
-154.545
criterio de swartz
Diagnóstico de regresión
3,014
Prueba de normalidad de Jarque-Bera
(0,222)
0,067
Prueba de heteroscedasticidad de Breusch-Pagan
(0,796)
( ÿ)
en 1 + = en (2) = 0,69b _
ÿ
1
(*) Velocidad de Convergencia b =ÿ
; (**) Vida media = vida media ÿ
T b
Figura 1.12. Mapa de los residuos empíricos estandarizados de la Ecuación (1.10) estimados sobre las 129 regiones a
nivel NUTS-2 durante el período 1980-95. Los residuos se clasifican en las 4 clases intercuartiles.
Machine Translated by Google
Es importante señalar, al final de este capítulo introductorio, que este volumen no pretende
cubrir todos los temas posibles en econometría espacial (tarea que se logra mejor en otros
libros como Anselin, 1988; Anselin y Bera, 1998). ; Anselin y Florax, 1995 y Anselin et al.,
2004). Más bien, está interesado en introducir el modelo básico de regresión lineal espacial
mostrando su relevancia en un caso particular: la prueba de convergencia regional del
ingreso per cápita.
Vemos esto como un ejemplo paradigmático que puede ayudar a comprender modelos más
complicados. Por lo tanto, el libro está limitado en términos de los temas cubiertos, incluso si
presenta de manera rigurosa todos los conceptos y herramientas estadísticos básicos para
que el lector interesado esté en condiciones de comprender métodos y técnicas más
avanzadas si es necesario.
Así, muchos temas importantes y aspectos específicos de la disciplina se han omitido
deliberadamente y no reciben consideración en este volumen.
En particular, incluso si hay muchas formas en que los datos espaciales pueden
manifestarse en el análisis económico (por ejemplo, puntos en un mapa, como en el caso de
las plantas, o líneas en un mapa, como en el caso de los flujos de transporte), este libro se
concentrará únicamente en el tratamiento de agregados geográficos, es decir, datos
recopilados a nivel regional, cen sus tract, condado o nacional. Hasta la fecha, este tipo
particular de datos espaciales ha sido claramente la tipología más utilizada tanto en el
análisis económico como en los debates políticos (ver Arbia y Espa, 1996a para una revisión
exhaustiva de los métodos disponibles para las otras tipologías de datos económicos espaciales). .
Machine Translated by Google
28 1 Motivación
Una segunda limitación de este libro radica en el hecho de que aquí solo considera los
problemas inferenciales que surgen en las fases de estimación y prueba de hipótesis. No se
presta atención al importante problema de la identificación del modelo oa la elección de la
mejor especificación entre los modelos espaciales en competencia (véase, por ejemplo,
Paelinck y Klaassen, 1979).
Un tercer tema importante que queda fuera del alcance de este libro es el de la agregación
espacial. Está claro que el resultado de cualquier análisis de regresión basado en datos
espaciales depende esencialmente del nivel de agregación geográfica elegido y no puede
extenderse simplemente de un nivel de agregación a otro. Por ejemplo (tomando de nuevo el
ejemplo elegido como hilo conductor de este libro), es perfectamente posible, al analizar el
proceso de convergencia económica de un conjunto de regiones, observar la convergencia al
nivel europeo NUTS-2, y, por el contrario, divergencia en otro nivel (por ejemplo, el nivel
NUTS-3). Esta indeterminación de los resultados estadísticos es una de las posibles
manifestaciones del llamado Problema de la Unidad Modificable (Yule y Kendall, 1950), o,
mejor, de su contraparte geográfica conocida como Problema de la Unidad del Área Modificable
(o MAUP; ver Openshaw y Taylor, 1981; Arbia, 1989) también denominada “segunda ley de la
geografía” (Arbia et al., 1996). La elección del nivel de agregación es, por lo tanto, de suma
importancia en cualquier análisis econométrico espacial. Por supuesto, este problema no es
típico de los estudios geográficos y generalmente se refiere a la posible inconsistencia entre
las relaciones micro y macro en economía, un problema que ha recibido mucha atención en
economía desde la contribución seminal de Theil (Theil, 1954). Sin embargo, como hemos
dicho, se ha dejado fuera del alcance del presente libro.
Una cuarta limitación de esta monografía está representada por el hecho de que sólo
considerará el caso de series de datos espaciales sincrónicas. De hecho, especialmente en
los últimos años, existe una creciente disponibilidad de datos espacialmente distribuidos
observados a través del tiempo y este hecho, a su vez, ha estimulado mucho el desarrollo de
técnicas y modelos que buscan capturar simultáneamente la dinámica espacial y temporal de
los fenómenos económicos. . En el Capítulo 6, al final del libro, se presenta una breve
descripción de los modelos estadísticos de espacio-tiempo y de los modelos de datos de panel
espacial, pero el tema no se considera en el resto de la monografía.
Habiendo (espero) motivado al lector al estudio de las relaciones económicas usando
datos espaciales, y habiendo aclarado los límites dentro de los cuales hemos planeado
confinarnos en la presente monografía, ahora podemos presentar la estructura del libro con
más detalle.
Los capítulos 2 y 3 proporcionan los antecedentes necesarios para introducir la teoría del
modelado lineal espacial. Más específicamente, el Capítulo 2 está dedicado a un tratamiento
riguroso de la teoría de campos estocásticos como marco natural para el análisis de datos
espaciales. Aquí presentaremos la definición de un campo aleatorio y las restricciones que
debemos considerar para realizar inferencias estadísticas. También discutiremos en detalle
las características de algunos campos aleatorios básicos que son particularmente útiles en el
análisis econométrico. Finalmente, discutiremos algunos teoremas limitantes importantes que
son útiles para evaluar los resultados de la teoría asintótica de campos aleatorios. En el
Capítulo 3 introduciremos el concepto de probabilidad y
Machine Translated by Google
2.1 Introducción
1. Hipótesis relacionadas con un modelo de probabilidad (PM) que postula una forma
plausible para la distribución conjunta de las variables aleatorias involucradas. Es
conveniente expresar dicho modelo en forma de una familia paramétrica de funciones de densidad.
ciones ÿ = { f (xxx
, 2 ,..., ;ÿ),ÿ ÿÿ} , con F
1,norte
X1X2X _ ,...,
_ norte
,..., X1 , 2x2 _ ( , ,...,X x1 x2 xn ÿ ; )
norte
(i) Una primera tipología está representada por datos transversales que se refieren a un
solo agente económico (hogar o empresa) oa grupos de ellos (como sectores
económicos). Al construir un modelo estadístico para tales datos económicos, la forma
más adecuada de modelo de muestreo es la que se basa en la noción de una muestra
aleatoria en la que suponemos que cada variable aleatoria se distribuye de forma
( ;ÿ) la. variable
independiente con una función de densidad. En este caso, función conjunta La de
de densidad
efectos especiales
X yo
i
norte
f (x2
, X1,X2
xn ÿ ;,...,X
) x1 ,..., ( ; ÿ)
efectos especiales
X yo
norte
= ÿ=i 1
i
Machine Translated by Google
(ii) Una segunda tipología de datos se relaciona con una serie de tiempo, refiriéndose una
vez más a agentes económicos individuales oa grupos de ellos, observados en
diferentes momentos del tiempo. En este caso, el modelo de probabilidad puede ti T
expresarse como ÿ = { f (xttt, 1xt
X
2
,X ,...,X
t 1
norte
2
,...,xt ;ÿ),en ÿel que
,ÿÿÿ} norte
norte
FXXX, t 1 ,...,
( xxx, t2
,..., t ÿ;) FXXX ( xxx , t1 t2
,...,X ÿ;)
= ÿ=i 1 ,..., yo
t1 t2 t norte i _
ÿ
1
norte
ti t2 Tennesse
(iii) Una tercera tipología de datos económicos se relaciona con las series espaciales, es
decir, la tipología a la que está dedicado el presente libro. Este tipo de datos surge al
observar agentes económicos individuales (o grupos de ellos), con información
adicional sobre su posición en el espacio. Esta es la primera vez que usamos la
palabra “espacio” en esta monografía y, dado que todo el libro está dedicado a este
tema, es importante dar una definición formal del mismo. De hecho, son posibles
varias definiciones según nos refiramos a un espacio geográfico, un espacio
económico, un espacio técnico u otras formas del mismo. Paelinck (1983) define un
“espacio” en los términos más generales como el par S { } O, R con O representando
ÿ
= O puede
los objetos de estudio y R las relaciones existentes
como
representar
puntos,
entrelíneas
cualquier
ellos.oElpolígonos
conjunto
figura geométrica
en
de ÿobjetos
. En
cuanto a la relación entre objetos, Paelinck (1983) considera diferentes definiciones y
enumera los tres casos notables de estructuras topológicas, estructura económica y
k
estructuras técnicas que conducen a diferentes
sobre estos conceptos en la Sección 2.2.1. definiciones de espacio. Volveremos
X
s1
, X s ,..., X
2 sn
representan una colección de variables aleatorias ordenadas con re
(iv) Finalmente, una cuarta tipología de información económica se relaciona con datos de
panel que se refieren a un solo agente económico o unidades espaciales como regiones
o estados. En este segundo caso nos referimos, más concretamente, a datos de panel espacial.
Esta tipología se origina por la combinación de las tipologías (i) y (ii) o, alternativamente,
(ii) y (iii) anteriores. Cuando disponemos de un conjunto de datos de panel espacial, la
muestra observada es generada por el PM especificado como:
La forma más natural de tener en cuenta los problemas de dependencia geográfica que surgen en
el modelo de probabilidad para datos espaciales está representada por la extensión de los conceptos
familiares relacionados con un proceso aleatorio temporal (ver, por ejemplo,
Hamilton, 1994) a la idea de un proceso aleatorio bidimensional (también denominado en la
literatura como campo aleatorio).
La idea de un campo aleatorio fue introducida por primera vez por Yaglom (1957; 1961; 1962) y
luego estudiada por Matern (1960) (reimpreso más recientemente en Matern, 1986) y Whittle (1954;
1963). Este capítulo proporciona una introducción a este tema concentrándose solo en aquellos
aspectos que son necesarios para especificar un modelo de regresión lineal estadístico basado en
datos espaciales. Para una revisión más completa ver Guyon (1995).
Hay dos características fundamentales de un campo aleatorio {X(s), sÿS}. El primero se relaciona
con la naturaleza de los índices sÿS, es decir, con la topología de las observaciones.
El segundo se refiere a la estructura de dependencia espacial que presenta el conjunto de variables
aleatorias que constituyen el campo. Estas dos características ahora serán discutidas a su vez en
las Secciones 2.2.1 y 2.2.2.
Machine Translated by Google
2.2.1.1 Generalidades
Los índices pertenecientes al conjunto S pueden ser continuos o discretos. En primera instancia,
el índice s representa las coordenadas de n puntos en R2 (ver Figura 2.1a); en el segundo caso,
representa las coordenadas en una cuadrícula regular (generalmente cuadrada) (ver Figura
2.1b) o una serie ordenada de valores relacionados con un conjunto finito de polígonos (o
“regiones” en geografía económica) (ver Figura 2.1c) . En esta última instancia, el
+
el vector s en realidad representa un escalar relativo a un número arbitrario asignado
sÿ I para cada polígono. Solo para dar una idea al lector, en las Figuras 2.2 y 2.3 se dan
algunos casos reales de datos espaciales de puntos y polígonos.
*
(1,1) (1,2) 1 2
*
(2,1) 3
4 5
* *
6
** *
7
** *
8
Figura 2.1. Tres posibles tipologías de datos espaciales discretos: (a) Puntos, (b) Red reticulada
regular y (c) Red reticulada irregular.
Figura 2.2. Ejemplo de datos puntuales: la ubicación de las empresas textiles dentro del área del
municipio de Prato. Cada punto representa una empresa. Tomado de Arbia y Espa (1996a).
Machine Translated by Google
Figura 2.3. Ejemplo de datos de polígonos: distribución espacial de teléfonos móviles en los estados de EE.
UU. en 2004.
re = re(syo,s ) = s (ÿ i s
yo j
)T (s i- sj _ )
con d la distancia entre el punto s y los campos . Por el contrario, en el caso de dis
yo i sj
aleatorios de parámetro creto del punto, la topología debe ser especificada exógenamente por
el investigador, lo que inevitablemente introduce un cierto grado de subjetividad en el análisis.
Una forma común de proceder es considerar la distancia entre los centroides de los
polígonos como representativa de la distancia entre ellos. Sin embargo, esta solución no es del
todo satisfactoria, especialmente en presencia de polígonos de forma muy irregular. Como
alternativa, se puede utilizar el concepto de Hausdorff de distancia entre polígonos que lleva el
nombre de Felix Hausdorff y se define como la distancia máxima de un polígono al punto más
cercano en el otro polígono. (Ver Hausdorff, 1914 y Edgard, 1995). Más formalmente, la
distancia de Hausdorff desde el polígono A y [ el polígono B es una función maxmin , definida
( , ) max min = { como] d( ), ab
HAB},
a ÿA b B ÿ
medida de la distancia entre estos puntos. Muchas otras definiciones alternativas han sido
sugeridas en la literatura. Para una revisión, véase, por ejemplo, Paelinck (1983).
En un contexto económico es cuestionable si una simple distancia euclidiana es la más
adecuada para captar los vínculos geográficos entre los agentes económicos y las regiones.
Las definiciones alternativas incluyen una distancia basada en el tiempo requerido para
llegar al sitio s algunos
desde elautores
al., 1993;sitio suna
Conleyosugieren
en el costo
ydefinición
Topa, económico
el2002).
uso
másdeamplia
Las involucrado
distancias
de distancia
distancias en
sociales ( el viaje.
Doreian
económica
medidas en Más
términosaún
,(Case
1980) o,
deet
i
flujos observados empíricamente (Murdoch et al, 1997) o en medidas de interacción basadas
en el comercio (Aten, 1996, 1997) también podrían tenerse en cuenta en la investigación
empírica.
Definición 3. Vecino más cercano. Se dice que dosi sitios s jy s son vecinos si d Min( ) d ÿ ik
yo
= , . yo
Definamos N(i) como el conjunto de todos los vecinos (sin embargo definidos) si y
ÿ i del sitio como la cardinalidad de este conjunto. Por definición si ÿ Es. que
tenemos
N(i)
necesario enfatizar aquí que el resultado de cualquier análisis econométrico
dependerá de la topología específica (y, por lo tanto, de la estructura vecina) elegida
para el campo aleatorio. En consecuencia, siempre es aconsejable probar la solidez de
los resultados obtenidos adoptando varias definiciones de vecindad.
Habiendo aclarado la idea de una distancia entre sitios tanto en el caso de parámetros
continuos como en los de parámetros discretos, y también el concepto de vecindario,
introduzcamos ahora una herramienta fundamental que se usará extensamente en el resto
del libro para Expresar estos conceptos de forma analítica. Esta es la llamada matriz de
conectividad (o matriz de pesos).
La forma general de una matriz de conectividad binaria W del elemento genérico wij
viene dada por:
ÿ1 si jn yo
ÿ ()
wij = ÿ
(2.1)
ÿ
0 de lo contrario
Machine Translated by Google
con N(i) especificada de acuerdo con cualquiera de las definiciones anteriores. Observe que
expresa formalmente los vínculos de proximidad existentes entre todos los pares de sitios que
constituyen un campo aleatorio según un concepto de vecindad preespecificado.
En lugar de una simple matriz de ponderaciones binarias, se puede introducir un conjunto
generalizado de ponderaciones que permita al investigador incorporar su conocimiento previo
sobre la geografía del fenómeno en estudio. Esto permite una mayor flexibilidad y la posibilidad
de introducir elementos como barreras naturales, dimensiones y formas de polígonos. Por otra
parte, sin embargo, cuanto más compleja sea la estructura de la matriz de conectividad, más
difícil será distinguir entre lo que es un efecto espacial genuino y un efecto forzado por el
investigador.
La expresión general para una matriz de ponderaciones generalizada viene dada por:
-ÿ
wd ij=ij ÿ 0> (2.3)
A veces es útil considerar matrices de ponderaciones que están estandarizadas por filas,
en el sentido de que cada fila suma 1. Esto se logra definiendo un conjunto de
ponderaciones * W* w ij ÿ tal que
* w yo w yo
w = = (2.4)
ÿ
yo
w yo ÿ i
j
así que eso * ÿ = wij 1 . Esta última definición es particularmente útil para introducir la
j
=
L( )Xt Xt i i 1
ÿ
Definición 5. Dado un campo aleatorio {X(s), sÿS}={X (s1 ); X (s dada 2 y );..., X (sn el
)},
la topología inducida por la definición de vecindad N(i) , el valor rezagado de espacialmente
la variable aleatoria ( ) X se define como: si
yo
1
LX[ s
( ) ]i ÿÿ
X ( )s j (2.5)
= ÿ i sj yo( )
]s ( )= ÿ1 *
norte norte
*
L [X s
] (=) WX s ( ) (2.7)
X ( s)1 X ( s) norte
ÿ ÿ
Tenga en cuenta que la continuidad de las variables aleatorias no debe confundirse con
la continuidad del índice s. Podemos tener variables aleatorias continuas distribuidas en
un espacio continuo o discreto y, de manera similar, podemos tener variables aleatorias
discretas distribuidas en un espacio continuo o discreto. Un ejemplo de variable aleatoria
discreta distribuida en un espacio continuo está representado por el número de
2
empleados en un conjunto de ubicaciones industriales en ÿ espacio
ver, por(para
ejemplo,
un ejemplo
Arbia,
2001a); un ejemplo de una variable aleatoria discreta en un espacio discreto está
representado por el número de empleados en un conjunto de regiones; un ejemplo
Machine Translated by Google
de una variable aleatoria continua en un espacio discreto está representado por el PIB
regional; y, finalmente, un ejemplo de variable aleatoria continua sobre un espacio continuo
está representado por el valor de la producción realizada en diferentes localizaciones
industriales.
La ventaja de operar con variables aleatorias distribuidas en el espacio está representada
por el hecho de que la posición geográfica de la variable aleatoria puede sugerir restricciones
a la función de densidad de probabilidad, como veremos en el futuro.
( ),..., X s1 ( ), 1,ser
Definición 6. Para cada secuencia de variables aleatorias nÿ norte
ÿ ÿ
[ fx ()=
x ( s1 )
s1
_
] ÿ ...ÿ F X ( s1 ),X (s2 ),...,X s( )norte
[s(xx), s( 1),...,
2 ( )] ( ),..., dX
xsn _ _
dX ( )
s2 _ sn
_
(2.10)
ÿÿ ÿÿ
MI[] X ( )
si = µ (si) ÿ i
Var[ ] X ( ) = ÿ
si
yo
2
()
si
yo
ÿ yo (
r
E[X ( )i s ]= rµ( ) si ÿi, ÿr ÿ1,sÿS
Como podemos ver, tales características de X (s), generalmente pueden expresarse como
funciones del índice s ya que, al menos en principio, cualquier variable aleatoria X ( )s tiene
s
una función de densidad de probabilidad fx (geográfico.
)X diferente en cualquier punto s del espacio
( s)
=
FX s( 1X ),s ( 2 ) [ xsxs
( ), 1( 2)]
ÿ ÿ
=
ÿ...ÿFs
ÿÿ ÿÿ
s
X ( 1 ),X ( 2 ),...,X () s norte
s2 _
s
[ s( xx), 1( ),..., ( )] x( dX
),..., dX (s)3
norte
s norte
(2.12)
Los diversos momentos conjuntos relacionados con las distribuciones conjuntas descritos
en la Definición 8 asumen un significado particular, dada la importancia del índice s ÿ S en un
contexto geográfico. En particular, consideremos la siguiente definición:
Machine Translated by Google
= ÿ ( ss
1 2) s1, s2ÿ R2
ÿ ( ss
1 2) (2.14)
ÿ ( ) ( ÿ s2 ) s1
_
Definición 10. Un campo aleatorio {X(s), sÿS} se llama gaussiano si, para cada subconjunto
finito en R2 , digamos (s1, s2,…,sn), (X(s1),…,X(sn)) = X(s) es tal que:
o:
X s =
FX ( 1s),X ( 2 ),...,X
s () s norte
[ s( xx
), 1( ),..., ( )] s2 _
norte
1/ 2
V ÿ
1
= det( ) exp ÿ
ÿ
ÿ
( X( )s(µ( )s (VX
ÿ
))
T
( ))ÿs µ s ÿ
ÿ
1 ÿ
ÿ
(2.15)
/2
(2 )
ÿ
norte
ÿ 2
con (ÿ [ ssyoÿV;
) =1,...,i ; =1,...,nj; V una matriz de autocovarianza de n por n y ]T n ( ), ( ),..., ( ) norte
mÿ µ s1
_ µ s2 _ µ s un vector n-by-1 de valores esperados.
Un campo gaussiano espacial se especifica completamente en términos de sus dos primeros
momentos que, a su vez, son funciones del índice s.
En el análisis econométrico, a menudo analizamos conjuntamente varios fenómenos que están
distribuidos espacialmente, por ejemplo, la tasa de crecimiento regional y el PIB regional, o los
precios y las cantidades vendidas en varios lugares del espacio. Para abordar este importante
aspecto es necesario introducir el concepto de campo aleatorio vectorial de dimensión k.
Definición 11. Un campo vectorial aleatorio {X(s), sÿS} se define como el campo X(s)=(X1(s),
X2(s),…,Xk(s))T en el que cada componente Xi(s) representa un campo aleatorio {Xi(s), sÿS}.
Machine Translated by Google
Tal definición introduce una dimensión extra al análisis porque un vector aleatorio X(s)
de dimensión k está asociado con cada sitio considerado, si, i=1,...,n. La función de
distribución de probabilidad conjunta acumulada del vector aleatorio se define como:
F [ xsxs
( ), (2),..., ( )] xsP{X(s1)
= ÿ x1, X(s2) ÿ x2,…, X(sn) ÿ xn} (2.16)
1 norte
Definición 12. Dado el campo aleatorio vectorial {X(s), sÿS} las cantidades:
ÿ ( ss )
yo soy
ÿ lm (si sj ) = ÿ ÿyo; s , s ÿ R2 (2.19)
yo
ÿ todos
( ss
) yoÿmm j ( )
Definición 13. Se dice que un campo aleatorio vectorial {X(s), sÿS} es gaussiano si:
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ ÿ
ÿ
MVN
ÿ
ÿ ÿ
ÿ
ÿ
(2.20)
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ ÿ
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ
ÿÿ ÿÿ
con vectores µ(si) k-by-1 de valores esperados, y V(si) y C(si, sj), respectivamente,
representan las matrices k-by-k de covarianza cruzada en el sitio si, y el k- Matrices by-k
de autocovarianza espacial y covarianza cruzada espacial entre pares de sitios, definidas
por:
Machine Translated by Google
ÿ ÿ
Vs( )i = ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿÿ () ,
ss ki 1 i ÿ ()ÿ
k yo
ss, i ÿ
ÿÿ
ÿ
11 (ss ij, ) ÿ 12 (ss ij, ) ÿ 1kij (ss, )ÿ ÿ
ÿ ÿ
y C (ss )= (2.21)
ÿ ÿ
,yo ÿ ÿ
ÿ ÿ
ÿÿ
ÿ
1 ()
ss ,kij ÿ k ij
()ÿ
ss,
ÿ
La definición de campos aleatorios dada hasta ahora es demasiado general para permitir
la construcción de modelos estadísticos estimables. De hecho, en el análisis econométrico,
el investigador tiene casi invariablemente una sola realización del campo, es decir, una
sola observación para cada sitio. Por tanto, el número de parámetros a estimar es mucho
mayor que el tamaño de la información disponible.
El propósito de las siguientes secciones es considerar algunas formas particulares de
campos aleatorios en los que se imponen una serie de restricciones, para obtener una
situación en la que el número de parámetros se reduce a un punto en el que su valor
puede inferirse de la realización única. disponible. Estas restricciones se refieren a:
Definición 14: Se dice que un campo aleatorio {X(s), sÿS} es estacionario (en sentido
estricto) si, para cada subconjunto de sitios (s1, s2, ..., sn) pertenecientes al espacio S , la
función de densidad de probabilidad conjunta f(X(s), sÿ S) no cambia cuando el subconjunto
se desplaza en el espacio.
Rotación
X(si )
Figura 2.4. Si las características del proceso no cambian durante la traducción, se dice que el proceso
es homogéneo. Si no cambian bajo rotación, se dice que el proceso es isotrópico.
Machine Translated by Google
=
F X ( 1s),X ( 2 ),...,X
s () s norte
[ s( ),
xx( 1),..., ( )]
s2 _
xs
norte
=
F X ( +s X + ÿ ), (X + ÿ ),..., ( X+ s ÿ )] ÿ ÿ R (2.22)
1
ÿ X ), ( +s2 _ ÿ X ),..., ( +s norte
ÿ )[ ( s1
_ s2 _ norte
Definición 15. Se dice que un campo aleatorio {X(s), sÿS} es estacionario de orden k si, para
cada subconjunto (s1, s2, ..., sn) de S, sus momentos hasta el orden k hacen no cambia
cuando el subconjunto está sujeto a traslaciones o rotaciones. Consideraremos dos casos
particulares:
Se dice que un campo aleatorio {X(s), sÿS} es estacionario de orden 1 si E(|X(s)|) < +
ÿ, ÿ sÿ S y, además,
Primera Ley de la Geografía: “Todo está correlacionado con todo lo demás, pero las cosas
cercanas están más correlacionadas que las cosas que están lejos” (Tobler, 1970).
Por ejemplo, si X(s) se refiere al precio de un bien producido por una empresa ubicada en el
sitio con coordenadas s, esperamos que la dependencia entre X(s1) y X(s2) sea más fuerte
cuando los dos sitios están cerca entre sí, y tiende a disminuir cuando aumenta la distancia.
Del mismo modo, los ingresos de una región dependerán mucho más de los ingresos de las
regiones vecinas que de las regiones distantes en el espacio geográfico. Además, es razonable
suponer que bloques de unidades espaciales suficientemente distantes en el espacio (por
ejemplo, grupos de individuos que viven en regiones muy alejadas) tienden a asumir un
comportamiento independiente.
Se puede derivar una descripción formal de tal fricción espacial en términos de la función
de densidad de probabilidad conjunta de un campo aleatorio a través de la siguiente definición.
Definición 16. Se dice que un campo aleatorio {X(s), sÿS} es asintóticamente independiente
si, tomando dos subconjuntos de sitios {s1, s2,..., sn}ÿS y {t1, t2, ..., tn}ÿS de tal forma que
d(si, ti) = d (con d(si, ti) una medida de distancia) se tiene:
ÿ } ÿ)]
Abs{ F[ ]] X(s1),...,X(sn ),X(t1),...,X(tn ) ÿF[X(s1),...,X(sn ) F [X(t1),...,X(tn ()ÿ
Se puede obtener una forma más débil de la restricción a través del concepto de
descorrelación asintótica resumido en la siguiente definición:
Machine Translated by Google
Definición 17. Se dice que un campo aleatorio {X(s), sÿS} no está correlacionado asintóticamente
si existe una secuencia de constantes {ÿ(dij)}, siendo dij la distancia entre el sitio ubicado
en si y el sitio ubicado en sj, definida por:
tal que 0 ÿ ÿ(dij) ÿ 1 yÿdij ÿ(dij) < + ÿ, con la suma extendida sobre todos
distancias posibles dentro del sistema espacial.
En otras palabras, la incorrelación asintótica se puede expresar mediante un límite
superior, en función de la distancia dij, que se impone a los coeficientes de autocorrelación.
Obviamente, en el caso de campos aleatorios gaussianos, el concepto de descorrelación
asintótica y el concepto de independencia asintótica coinciden.
Otra forma de restricción de la estructura de dependencia de un campo aleatorio que
resultará útil para desarrollar teorías asintóticas para campos espaciales se puede
derivar de la siguiente definición.
Definición 18. Se dice que un campo aleatorio {X(s), sÿS} se mezcla fuertemente si,
tomando dos subconjuntos de sitios (s1, s2,...,sn) ÿS y (t1, t2,. .., tn) ÿS, de tal manera
d , X(s1),...,X(sn),
que d(si, ti) = y definiendo A comoyelB ÿ-álgebra generada
como ÿ-álgebra por laspor
generada variables aleatorias
las variables
aleatorias X(t1), ...., X(tn), se tiene para cada evento AÿA y BÿB:
límite
d ÿ+ÿ ()ÿÿ= 0
con ÿ ()d= arriba [P( AÿB )-P(A)P(B)] (2.27)
UN
d
La cantidad () ÿrepresenta intuitivamente una medida de la dependencia entre dos grupos
de variables que constituyen los dos subconjuntos de sitios a una distancia dada ÿ.
De hecho, en el caso de la independencia, se tiene P(AÿB)=P(A)P(B) y, por tanto, () = 0
ÿÿ Joe, 1997).
(ver
Una medida alternativa de dependencia entre grupos de variables aleatorias es
suministrado por la cantidad:
Definición 19. Se dice que un campo aleatorio {X(s), sÿS} se mezcla uniformemente si,
tomando dos subconjuntos de sitios (s1, s2,..., sn) ÿS y (t1, t2,. .., tn) ÿS de tal forma que y
d ,y llamando
X(s1),...,X(sn), a B la ÿ- álgebra
A a la ÿ-álgebra
asociadaasociada
a las variables
a las variables
aleatoriasaleatorias
X(t1), ....,d(si,
X(tn),
ti)se
= tiene,
para cada evento AÿA e BÿB:
La forma más débil de restricción sobre la dependencia entre variables aleatorias que
pertenecen a un campo aleatorio, se deriva de la llamada propiedad de ergodicidad. La
ergodicidad es un término tomado de la mecánica estadística (Khinchin, 1949) usado
extensamente en la literatura de series de tiempo y extendido a campos aleatorios (Christakos, 1992).
En un proceso aleatorio temporal, es una condición que asegura que la memoria del proceso,
medida por las correlaciones por pares, "se debilita al promediar con el tiempo".
(Spanos, 1986; Hamilton, 1994). Esto implica que la media y covarianza de X(s) coinciden con
las calculadas mediante las únicas realizaciones disponibles.
Aplicar una idea similar a un campo aleatorio conduce a la siguiente definición.
Definición 20. Un campo aleatorio {X(s), sÿS} que es estacionario hasta el segundo orden se
dice que es ergódico si:
1
d
lím
ij ÿ+ÿ ÿ
ÿ ÿ ( =, i)0ssj (2.30)
d yo
con la suma extendida a todas las distancias posibles en el sistema espacial, y el número de ÿ
tales distancias.
Como consecuencia de la propiedad de ergodicidad tenemos que los promedios espaciales
convergen en probabilidad a los promedios establecidos (sobre el concepto de convergencia en
probabilidad, véase la Definición 35 en la Sección 3.2 a continuación). Por lo tanto:
1 norte
pag
X µ
i
n ÿ=
1i ÿ
1 norte
2
pag
2
( µ) ÿ (2.31)
x nÿ
i =1
ÿ ÿi
1 norte norte
pag
(x j µ )( ÿ ÿµ ) ÿ ( d)
ÿ
x
yo
nn( ÿ
1) ÿÿ=
yo
j 1= i 1
El más simple de todos los campos aleatorios es la extensión a dos dimensiones del
concepto de un proceso de tiempo de ruido blanco. Introduzcamos la siguiente definición:
Definición 21. Se dice que un campo aleatorio {u(s), sÿS} es un ruido blanco espacial si:
2 = s
ÿÿ por si
yo
es decir, si las variables aleatorias que lo constituyen tienen media cero y no están
correlacionadas por pares, sin importar cuál sea su posición en el plano. El ruido blanco
espacial obviamente no tiene interés per se en un contexto espacial donde necesitamos
modelar eventos dependientes. Sin embargo, representa la base para construir campos
más significativos.
Una clase importante de modelos de campos aleatorios paramétricos es la que se basa
en la propiedad bidimensional de Markov. Esta clase de modelos se presentará en la
siguiente sección.
2.4.2.1 Generalidades
Definición 22. Un campo aleatorio {X(s), sÿS} se llama campo de Markov si, para cada
siÿS se tiene:
E[ X ( ) si ] < ÿ
y (2.33)
=
MI[ ] X ( )B
si
yo ÿs
yo
MI[ X ( )ÿ ( X s(j ): s jÿ
si
yo
N(yo)] )
donde Bÿs representa el álgebra ÿ asociada con todas las X(sj) excluyendo X(si)
i
y (X ( sj):sj ÿ
ÿ
N(yo)) representa el álgebra ÿ asociada solo con el azar
variables X(sj) pertenecientes a la vecindad de X(si).
Un resultado importante útil para particularizar una familia de campos aleatorios
paramétricos de Markov está representado por el teorema de Hammersley y Clifford. Debido
a la suma importancia de este resultado, dedicaremos la siguiente sección a su discusión
antes de introducir algunos campos aleatorios paramétricos especiales de Markov.
Una forma en la que los campos aleatorios de Markov pueden especificarse en la práctica
consiste en asumir una forma funcional particular para la función de densidad condicional
de cada variable aleatoria y, posteriormente, derivar la función de densidad conjunta resultante.
Sin embargo, excepto en casos triviales, no existe una forma obvia de deducir la estructura
de probabilidad conjunta de un proceso derivado de un conjunto de distribución condicional.
Además, la estructura de probabilidad condicional está sujeta a una serie de condiciones
de coherencia interna y, como consecuencia, en algunos casos es imposible definir matrices
de varianza-covarianza bien condicionadas a partir de hipótesis sobre las distribuciones
condicionales.
Para garantizar que la función de densidad conjunta del campo aleatorio existe, es única
y está bien condicionada, es necesario imponer un conjunto de restricciones a las
densidades condicionales que están relacionadas con su forma funcional. Estas restricciones son
identificado por el teorema de Hammersey-Clifford, un resultado célebre que circuló durante
muchos años de forma privada (Hammersey y Clifford, 1971) antes de ser publicado por
otros autores (ver, por ejemplo, Besag, 1974; Preston, 1973; y Grimmett, 1973 para una
versión simplificada).
Comencemos por definir la cantidad
FX (X) (2.34)
Q(=
X) en
FX (0)
( un campo X(s), y (0) Xf el valor asumido por la función de densidad conjunta en el punto
x0 = ( 0,0,...... .0 ) La función Q(x) a veces se conoce como la “función de potencial negativo”.
Machine Translated by Google
q (x ) =
= ÿ ÿÿ
xi G x( i )+ xx G xx( ij,yoij ) + ÿÿÿ xxx G xxx jj ,
( jjjjjj , + ...
+ (2.35)
)
i =1 i = =11 j i ===
111
j k
<
yo jk< <
+ xxx
12
... xxx
G ( ,1 2 ,..., )
norte
1,2,...,
norte norte
donde los términos de interacción G(.) son distintos de cero solo si el conjunto de variables
aleatorias incluidas son vecinas. De tal manera, se pueden definir probabilidades condicionales
válidas. De hecho, de la Ecuación (2.35) se tiene:
fxxj
XX ij
n (yo ; ÿ ( ))
yo = Exp[ QQ
] ( x) ÿ (x ) i
fxjXX Ni
ij
(0 ; j ÿ ( ))
(2.36)
con x = yo (xxx,...,
1 yo 1 + yo 1ÿ
,0, ,...,X) . norte
La importancia del resultado anterior radica no solo en que garantiza la existencia de una
función de densidad conjunta dadas algunas restricciones sobre las densidades condicionales
de las variables aleatorias que interactúan espacialmente, sino también en que sugiere las
restricciones que deben imponerse a tales densidades condicionales para obtener
representaciones válidas. Mediante el teorema de Hammersley-Clifford, las densidades
conjuntas siempre se pueden descomponer en la interacción entre pares de variables, tripletes
de variables, etc. En la práctica, sin embargo, los campos markovianos se han estudiado
generalmente restringiendo solo la interacción por pares (Ripley, 1990). Esta es una
simplificación obvia, pero con algunos fundamentos empíricos. En física, por ejemplo, las
fuerzas gravitatorias y electrostáticas proporcionan dos ejemplos en los que la interacción entre
los diversos elementos del espacio es puramente por pares (Künsch, 1981). En las ciencias
naturales, además, muchas especies animales sólo tienen luchas por parejas cuando defienden
sus territorios (Ripley, 1990). Sin embargo, existen muchos otros casos, incluidas las situaciones
económicas, en los que sería interesante profundizar en nuestro conocimiento de la interacción
de orden superior. El caso de la competencia de precios espaciales (Haining, 1990) constituye
uno de esos casos. Los modelos de interacción espacial por pares de campos aleatorios
también se conocen como modelos automáticos, después de Besag (1974).
Para estos modelos, la Ecuación (2.35) se reduce a:
Machine Translated by Google
q(x) = ÿ x iG x ( ) i + ÿÿ ( xx
i G xx
j yo yo
) (2.37)
i=1 i = 11 j =
yo<
ÿ ÿ ÿÿ
ÿ
norte ÿ
QQ
(X) )+ ÿ
ÿ
i ÿ
i i x ÿ
ij j ÿ
ÿ
ÿ
j =1 ÿ
ÿ ÿ <
yo ÿÿ
donde las variables aleatorias X(si ) solo pueden asumir los valores 0 y 1. Sobre esta base,
por lo tanto, se pueden definir las probabilidades:
(2.40)
pag=pag [
X (si) 1X
]
i = sj( =) x( ); ÿ
sj sj N(i)
y
(2.41)
= X (si) 0= X
sj (=) sj
X sj
( );ÿ N(i)
]
qP
i [
q (x) = ÿ ÿÿ ÿ _
xii + ÿ xx ij ij (2.42)
i =1 i ==11 j
<
yo
F XX s yo ( s( xx ); ( ) s( j ) sj
) ( yo ÿ yo ( )) norte
sj ÿ
= exp ( xÿ ÿ i + ÿ yoXj ÿ)ÿ (2.43)
ÿ yo
F XX ( ) ( )
si
yo sj (0 (X); ss
j j
ÿ yo ( )) ÿ=
j 1 ÿ
Definición 23. Se dice que un campo aleatorio {X(s), sÿS} obedece a la ley de la
autologística (o ley de Ising), si la función de densidad condicional de cada variable
aleatoria con respecto a las demás se puede escribir como:
X s( ) Xs j ( )ÿx( =
F s i) x(s j)ÿ = f X s( ) Xs j ( )ÿx(
s i) x(s j); js ÿ N(i)ÿ
i i
X ÿ + ÿ X ( s))]
= Exp[( ( )(
si
yo i j yo
(2.44)
1 +exp[( ÿ
i
+ ÿ X ( s))]
j yo
Exp[ ( ÿ ÿ
i
+ ÿ X ( s))]
j yo
s yo( )
[ ( ) ]=
ÿ
N iyo= ( s) i 1 (=), p PX
j
s xj ÿ (2.45)
j
1 exp[ ( + ÿ ÿ
i
+ ÿ X ( s))]
j yo
s
j
ÿ yo( )
1
= x ([) 0 s
q iPX ( i), = ss ÿ yo ( ) ] = (2.46)
jj
1 exp[ ( + ÿÿ ÿ yo
+
ÿ X ( ))]
s
yo j
s
j
yo( )
Las ecuaciones (2.45) y (2.46) muestran cómo nuestra expectativa de la “presencia” del
fenómeno en el sitio si se modifica en función del número de presencias en los sitios
vecinos. El conjunto de parámetros representa la
ÿ interacción
vecinos. Los
por parámetros
pares entre son,
sitiospor el yo
exp[ÿ ] i
Pr[( ) s1i= (s ÿ), p X j
= yo
xji N ( )]= (2.47)
1+exp[ ]ÿ i
En aquellos casos en que ÿ ÿ 0, estos parámetros regulan la intensidad con la que la información
yo
y, además:
ÿ ÿ Si sj ÿ N(yo)
ÿ =
yo ÿ
ÿ
0 de lo contrario
=
o, equivalentemente, que ÿ yo ÿ con wij el elemento genérico de un contigu simple wij , ÿ 1if
ÿ N(yo)
sj
matriz de idad W tal que wij = .
_ ÿ
ÿ
0 de lo contrario
X(si ) = 1
si
X(sj ) = 0
exp[(1 + ÿ ÿ X ( s))]
yo j
s yo( )
[ yo ( ) ] =
ÿ
j
p PX
i
=x ( s) i = 1 ( ),ss ÿ
jj
1 +exp[(1 + ÿ ÿ X ( s))]
yo j
s
j
ÿ yo( )
En el caso de que no haya interacción espacial entre los sitios, simplemente tenemos:
[ exp[1] =
yo = ( ) 1 ( ), pi = PX si = x(sj) ]sj ÿ norte 0.73
+
1 experiencia[1]
para cada ubicación. Este valor representa la probabilidad que a priori (es decir, antes de observar lo
que sucede en el vecindario) atribuimos al evento X (si) =1, y depende únicamente del parámetro. En
ÿ
nuestro ejemplo, tres vecinos de cuatro presentan un valor igual a 1.
[ Exp[1 3] +
( )]
ÿ
( )sj1 ÿ( ),
PX si = x sj pi = yo =
norte + +
1 experiencia[1ÿ3 ]
Machine Translated by Google
En el caso de una dependencia espacial moderada (p. ej. con = 0,33), tenemos
ÿ que pi = 0,88, valor
que es mayor que el valor incondicional obtenido anteriormente (0,73). En el caso de un alto nivel de
interacción espacial (p. ej. = 1) tenemos, en cambio, que pi = 0,98 que es aúnÿmayor.
el caso
Finalmente,
de una en
interacción negativa (p. ej. = -0,33), la probabilidad condicional tomará el valor pi = 0,5, lo que muestra
cómo la probabilidad
ÿ incondicional (0,73) se reduce al condicionar los valores asumidos en la vecindad.
La extensión inmediata del campo autologístico está representada por el caso en que la variable
observada es categórica, con un número discreto de, digamos, c resultados desordenados. Esta
instancia es bastante común en economía y ocurre, por ejemplo, al modelar las elecciones discretas
de un agente individual. En este caso, de la Ecuación (2.37) se tiene:
C C C
Qx()
=
ÿ ÿÿ ÿ nkk _ ÿ
ÿ kl nkl
(2.48)
k =1 k = =11 yo
kl<
ÿ kl
parámetros. De (2.48) y recordando (2.38), se puede derivar la siguiente definición.
Definición 24. Se dice que un campo aleatorio {X(s), sÿS} obedece la ley de Strauss si la función de
densidad condicional de cada variable aleatoria con respecto a las demás se puede escribir como:
ÿ C
ÿ
Exp
ÿ
ÿ
ÿ
k
+ ÿ ÿ kl ulsi ( )
ÿ
=1
ÿ
yo
ÿ ÿ
PX[ kx
( s( )),= sj
s ÿ yo( ) ] = lkÿ
(2.49)
i j
C
ÿ C
ÿ
ÿ Exp
ÿ
ÿ
ÿ
k
+ ÿ ÿ kl
uls ( )
i
ÿ
yo
=1 yo
=1
ÿ lkÿ ÿ
En la hipótesis de que las clases son intercambiables y, además, que la expresión se simplifica
=
ÿ kl
ÿ , a:
(2.50)
[ÿ
ÿ
C C
ÿ
ÿ ÿExp ÿ
ÿ ulsi ( )
ÿ
yo
=1 yo
=1
ÿ
ÿ
lkÿ ÿ
ÿ
Tal modelo markoviano fue propuesto por primera vez por Strauss (1977) y obviamente se reduce
a la autologística cuando c = 2.
Una segunda extensión del campo de la logística automática está representada por el caso en el
que la variable observada puede asumir un conjunto discreto de resultados numéricos (por
ejemplo, el número de plantas industriales en una región o el número de personas empleadas por
una empresa).
En tal caso, el valor en cada sitio se puede representar como el resultado de, digamos, c
pruebas donde la probabilidad de éxito en cada prueba es p. En otras palabras, podemos suponer
que cada variable aleatoria que constituye el campo se distribuye condicionalmente con una
densidad binomial. Esto lleva a la siguiente definición.
Definición 25. Se dice que un campo aleatorio {X(s), sÿS} obedece a una ley autobinomial
(Besag, 1974), si la función de densidad condicional de cada variable aleatoria con respecto a las
demás se puede escribir como:
ÿÿ
Cÿ
PX[ kxnorte yo (s ) = (s ),s ÿ ( )]= ÿ
k
(1 i pp
ÿ
)
ck
ÿ
(2.51)
i i
ÿk ÿ
j j ÿ ÿ
ÿ pagi
norte
=ÿ +i X (2.52)
registro ÿ
ÿ
ÿÿ ÿ=1 ÿ yo j
1ÿ pagi ÿ j
y por lo tanto,
ÿ norte
ÿ
Exp ÿ
ÿ
i
+ ÿ ÿ X
yo j
ÿ
= ÿ j =1 ÿ
pag
i (2.53)
ÿ norte
ÿ
+
1 experiencia ÿ ÿ
i
+ ÿ ÿ X
yo j
ÿ
ÿ j =1 ÿ
Machine Translated by Google
con y =
ÿ
i ÿ yo
parámetros y, por ejemplo
ÿ de contigüidad
con wij ÿWpriada
una matriz
apro ÿ yo
Otro caso interesante ocurre cuando el campo aleatorio está constituido por variables
que representan conteos de eventos (tallies), pero donde estos eventos presentan
una probabilidad muy baja de ocurrencia. En este caso, es razonable suponer que la
distribución condicional de cada variable aleatoria en cada sitio sigue una ley de
ÿ i , las ocurrencias
probabilidad de Poisson con un valor esperado, digamos en el sitio i, que
en los
depende
sitios de
vecinos. En este caso, se cumple la siguiente definición.
Definición 26. Se dice que un campo aleatorio {X(s), sÿS} obedece a la ley de auto-
Poisson (Besag, 1974), si la función de densidad condicional de cada variable aleatoria
con respecto a las demás se puede escribir como:
X ÿ
ÿ
ÿ mi i
PX[ kx
( s)i(= ss
), ÿ yo( ) ] = i
(2.54)
j j !X
norte
ÿ ÿ
ÿ = exp ÿ
ÿ ÿ yoÿj ÿ (2.55)
i i
ÿ + ÿ=
j 1 ÿ
Besag (1974) demostró que las condiciones de consistencia derivadas del teorema de
Hammersley-Clifford imponen la restricción <0 en el parámetro
ÿ y para
j, y que
cada
porpar
lo tanto
de sitiosÿ i yo yo
dentro de este marco solo se puede modelar la dependencia espacial negativa. Este
hecho ha limitado fuertemente el uso de dicho modelo en el análisis económico donde
los fenómenos de dependencia espacial positiva son de suma importancia. Sin embargo,
más recientemente, Kaiser y Cressie (1997) desarrollaron un modelo que también
permite una dependencia espacial positiva al especificar distribuciones condicionales
basadas en un Poisson truncado (a menudo denominado Poisson winsorizado después
de Galambos, 1988). Este campo aleatorio Winsorizado de Poisson se puede usar para
modelar dependencias positivas o negativas entre variables aleatorias distribuidas
espacialmente y se ha usado en la literatura para describir el patrón de mortalidad y
morbilidad en estudios epidemiológicos (Clayton y Kaldor, 1987).
F XX(s)yo
() sj
[s (xx)yo( sj )] =
FXX ( ) ( )
i sj
[s xx( yo) (norte
); yo ss ÿ ss ÿ ; jj ( )]
j i
=
1
2
ÿ
ÿ 1 ÿ
ÿ
ÿ
2 ÿ
(2 ÿÿ i ) exp ÿÿ ÿ
ÿ
2 ÿ Xÿ (ÿÿ) ÿÿ
si
yo µ i ÿ yo
(X ( )s j
ÿ
µ j )ÿ ÿ (2.56)
2ÿ i yo
ÿ
ÿ ÿÿ
2
donde µi = E( ( ) X si ), esÿ un
i
= Var( ( ) de
conjunto X si constantes
), y ÿ tales que, por ejemplo, con wij yo
ÿ = de
ÿW y W una matriz ÿ conectividad
que: apropiada. wij , de estas definiciones se deduce
yo
(fYy i
= i X xi =
ÿ i ,)i (2.57)
yo X
_ yo
(2.58)
Var X[ s (=) xi ( X ] 2
), ss ÿ norte yo = j j () ÿ
yo
De las definiciones anteriores también se deduce que la función de densidad de probabilidad conjunta
del campo aleatorio es MVN(µ,V), con un vector de medias µ ÿ (µ1, µ2,..., µn) y una varianza-auto-
covarianza matriz V tal que:
V = (I – B)–1 ÿ (2.59)
ÿÿ 2 ÿ
1 000
ÿ ÿ
2
ÿ
0 ÿ
2
ÿ
con ÿ = ÿ ÿ
y B ={ ÿ }, con B simétrico, para
yo
ÿ ÿ
2
ÿ 0
ÿ ÿ
ÿ
norte
ÿ
garantizar la simetría de V.
El campo de Markov descrito es, con mucho, el más utilizado en la práctica en el
aplicaciones (ver Besag 1986; Mardia, 1990; y Ripley, 1988 para una revisión).
Besag et al. (1991) introdujeron una especificación diferente para un modelo autonormal
basado en la especificación directa de la función de densidad de probabilidad conjunta del
campo. Esto se expresa como
ÿ ÿ
cx( ) 1 norte norte
2
ÿ ; )= wxx
ÿ ÿ
FXXX
s 1 ,s 1s 2 ,...,
( XX , s ,..., 2 X
ÿ ÿÿ ÿ ÿ
Exp ÿ 2 yo (
j i ) ÿ (2.60)
sn sn _
2ÿ
norte
ÿ i =1 j 1
ÿ Ji=< ÿÿ
Machine Translated by Google
con wij ÿ W y W una matriz de conectividad. Tal función de densidad de probabilidad conjunta se
define mediante los valores esperados condicionales:
i i 1
( ) EX s)X=sj N( (i () )) =
j
EX( s resto ( ); ÿ
ÿÿ Xj (2.61)
i jn yo ( )
ÿ
con i
ya definido en la Sección 2.2.1.2, y
ÿ
2
i i ÿ
)X =s X sj N i =
j norte
(2.62)
( (s)resto
Var X ( ( ) ( Var
); ( )) ÿ
ÿ= w yo
j 1
norte
ÿ
ÿ= w yo
ÿ j 1
2 =
V =
ÿ
si yo (2.63)
ÿ ÿ
ÿ
w yo
2
ÿ
Si yoÿ
ÿÿ
Para obtener más detalles sobre el campo aleatorio gaussiano intrínseco, consulte también Molliè (1996).
Dada su importancia en la econometría espacial (como quedará patente en el Capítulo 4), en esta
sección y en la siguiente extenderemos la idea de un campo autonormal para abarcar el caso de
campos vectoriales aleatorios. Para empezar, en la presente sección definiremos el campo
aleatorio autonormal bivariado. En la siguiente sección ampliaremos más este concepto e
introduciremos el campo autonormal multivariante.
T T T
Definición 29. Un campo aleatorio {Z(s), sÿS}, Z(s) =(Y(s) , X(s) ) se ha dicho
autonormal bivariado (o CAR doble ; véase Kim et al., 2001) si la función de densidad condicional
de cada variable aleatoria con respecto a las demás viene dada por:
jj ( ) ]
=
FYYXX
( s ) ( ),),s(( ) sj s
ji ( ) ss( yyxx
[[ si
), ( ), ( ); norte
yo ss ÿ yo (2.64)
i i i
1
2
ÿ
ÿ 1 ÿ ÿ
ÿ
ÿ
= (2 ÿÿ )
2 ÿ
Y(s yo
) yÿyoÿÿµ ÿ (X (s )
ÿ
ÿ (Y(s )j Y j
ÿ
µ
i ÿ 2 ÿ
yo yo
)ÿ ÿ
ÿ
ÿÿ
yo ÿ ÿ
yo ÿ
yo ÿ ÿÿ
Machine Translated by Google
2 =
donde Xµi = E(X(si)), Yµi = E(Y(si)), fx X = i x( ÿi = Var(X(si))
i) y Var(Y(si)), Y
ÿ yo ,
i
(2.65)
= yo
+µ ÿ[ ÿ
yo
X s (j
X) j
ÿ
µ ]+ ÿ [Xs ( ) ÿ
yo X yo µ ]+ÿ [ÿ yo
Ys( ) ÿ
jYj µ ]
yo
ÿ yo
ÿ
es decir, como una función lineal tanto de ( )i X s como de los valores retrasados espacialmente
de las variables ( )j X s y ( )j Y s .
La función de densidad de probabilidad conjunta del campo aleatorio resultante viene dada por:
ÿÿ µ ÿ ÿ
Y
Z ÿMVN ÿ
ÿ ÿ
; q ÿ
(2.66)
µ ÿ
ÿ ÿ
ÿÿ X
ÿ ÿ
ÿ
1
ÿ ÿ ÿ primera guerra
ÿ + ÿ( ÿÿ)
mundial ÿ ÿÿ ÿ
ÿ
* ÿ
Q= ÿ yo
ÿ
ÿÿ WI + ÿ( ÿ) ÿW
ÿ ÿ
ÿ
ÿÿ ÿ ÿÿ
ÿ yoÿ 2 0 ÿ
X
constantes en las n observaciones, esto se simplifica como ÿ = ÿ ÿ ÿ
.
0 yoÿ
2 ÿ
ÿ y ÿ
F
Xs( Xs
),i ji ( ) j ÿ
ÿ µ +( ÿi
norte
: ÿ
( ( )ÿ µ j
CXjjjis ij ), V i ), (2.67)
Z ÿ N( ) µ,ÿ , (2.68)
ÿ CV 1 " CV 1 ÿ
ÿ ÿ
ÿ ÿ
1 11 1 1norte
1 =
ÿ ÿ
ÿ #%# . (2.69)
ÿ
ÿ ÿ
CV 1 " CV 1
ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿ nn 1 nn ÿ
V1 1 ÿ
" ÿ
V1 1ÿ ÿ
#%#
ÿ ÿ
ÿ ÿ
ÿ
ÿ
ÿ
1 " ÿ
ÿ
1 ÿ
ÿ vn vn ÿ
ÿ
ÿ
C 11 " ÿ
C1 norte
ÿ
ÿ
#%# ÿ
ÿ ÿ
ÿ
ÿ
ÿ
C norte 1
" ÿ
C nn ÿ ÿ
es definida positiva.
El resultado anterior se puede probar de la siguiente manera. Observe que la densidad conjunta
relacionado con las densidades condicionales
FX (s X(s
) ), ÿ ji i j
Zf es por la propiedad (ver, por ejemplo,
arroyo, 1964):
FZ (z) = norte
FX (s Xi )s ( ),j ji ÿ
(; xxx
yo yo…
1 ,, ÿ
1, µ yo 1 ,+
…, µ norte
)
ÿ=
(2.70)
FZ (µ) (; µi µ 1µ, …
i 1
FX (s )Xi s ( ), ji ÿj
µ, i 1 ÿ
,X yo + 1 , … , X ), norte
T =Z (x xn
donde xi representa una forma abreviada de ( )i xs y )Ecuación 1 (2.67)
,..., . Además, desde
podemos escribir
1/2 ÿ 1
)(= ) 2 k/2 ÿ
(; xxx d TV d 21
ÿ
(2.71)
ÿ
V
ÿ
F X (s X)s ( ), yo yo… , …µ
1 ,µ , ÿ Exp ,
ÿ
1, ÿ
i i i i
ÿ
ÿ
yo 1 , +
i ÿ jij norte
ÿ ÿ
donde
i 1
Cxyo(j
ÿ
dxi = i ÿ µi ÿÿ ÿµ ), (2.72)
j =1 j
Machine Translated by Google
(y ÿ)(Xÿˆ)W y ÿ Xÿ ˆ T
(2.73)
2
j ÿ
donde
ÿi = ÿÿ Ji= + jjC x (ÿ µ 1 ij
norte
). (2.74)
ÿf (y )ÿ Z ÿ ÿ T 1 1 T 1 ÿ ÿ
ÿ
norte ÿ ÿ
2ln ÿ ÿ
=ÿ
2ln ÿ
Exp ÿ
ÿ
1dV
i
di2 i
+ ÿ i
V i di
ÿ F Z (µ )ÿ
i =1
ÿ
ÿ =ÿ ÿ
ÿ ÿ
ÿ ÿ 2 ÿÿ
T 1 T 1
=
ÿ ÿ di =
norte ÿ
norte ÿ
d iv d i i
ÿ
di V i
i =1 i =1
(2.75)
T 1
ÿ ÿ1 (X i ) ( )
norte norte ÿ
=ÿ ÿ
µ i
CVi x ÿ=
µ
i= j =1 yo j j
T 1
()(),
ÿ
=ÿ
z ÿ zµ ÿ
nk / 2 1/ 2 T
) ( y ÿ y +) ÿ µ ÿ1µ(
ÿ
z
ÿ
ÿ (2.76)
ÿ
=ÿ
ÿ
),
ÿ
2ln( f Z ( ) ) () 2ln( 2
lo que implica
nk / 2 1/ 2 1 T
() ( )2 ÿ 1
ÿ
FZ z =
ÿ
ÿ ÿ exp ÿ
ÿ
ÿz()()
µ ÿ, zÿ µ ÿ
ÿ ÿ
(2.77)
ÿ 2
2 2 2
ÿ 1/ ÿ 1 ÿ
do /ÿ " ÿ
C /ÿ ÿ
12 1 1 norte 1
ÿ 2 2 2 ÿ
/ ÿ 2 1/ ÿ 2 " ÿ
C / ÿ 2
ÿ
1 21 _
=
2 norte
ÿ ÿ ÿ
, (2.78)
ÿ
# #%# ÿ
ÿ
2 2 2 ÿ
do /ÿ ÿ
C 2 /ÿ " 1/ ÿ
ÿ
ÿ
1
norte norte norte norte norte
ÿ
ÿ
1 1
(
ÿ ÿ
ÿ = MI ÿB ), (2.79)
que es formalmente equivalente a la Ecuación (2.59). Se pueden encontrar más detalles sobre
los campos MCAR en Banerjee et al. (2004) .
Una primera clase de campos aleatorios que no son de Markov se deriva de la extensión del
modelo autorregresivo temporal, haciendo uso del concepto de retraso espacial presentado en la
Definición 5. Tenemos la siguiente definición.
Definición 31. Se dice que un campo aleatorio {X(s), sÿS} es autorregresivo simultáneo (o SAR;
Whittle, 1954), si satisface la siguiente ecuación de diferencia estocástica:
X s( -) i= ÿ Xµ si - + tu sÿ ( ) yo yo
[() j µ j
] (2.80)
yo
ÿ
con ÿ = ÿ wij , wij ÿW y W una matriz de conectividad apropiada, y {u(si ), sÿS} un proceso
yo
de ruido blanco espacial. De esta forma, cada una de las variables aleatorias que constituyen el
campo se ve como una suma ponderada de las variables aleatorias vecinas.
a través de la matriz de ponderación W. En este sentido, el término ÿ [ ÿ yo
X (s )
j
ÿ
µ j
] como
yo
ÿ
2
0 ÿ
2 ÿ
2
ÿ
2
ÿ 0
ÿ ÿ
ÿ
norte ÿ
La matriz de varianzas y autocovarianzas espaciales derivadas de este modelo viene dada
por:
VIBIB = ( ÿ 1) ÿ( ÿ )
ÿ
ÿT
(2.82)
V= ÿ 2
[(yo
) (ÿBIT ÿB ) ]1 (2.83)
también que, en el caso gaussiano, cualquier modelo simultáneo definido por la matriz B
(llámese Bs) se puede expresar como un modelo autorregresivo condicional definido por el
T T
matriz Bc = Bs + Bs – BsBs . Sobre las relaciones entre la CAR y la SAR
modelos se remite al lector interesado a Brook (1964). Nótese, finalmente, que en este
contexto usamos el acrónimo SAR como se usa en la literatura de estadística espacial (ver,
por ejemplo, Cressie, 1991), con un significado diferente al usado en la literatura de
econometría espacial donde indica la regresión espacial mixta - modelo de autorregresión
(LeSage, 1999; véase el Capítulo 4.3.6 a continuación).
Se puede construir una segunda clase de modelos de campos aleatorios que no son de
Markov extendiendo el concepto de promedio móvil (o filtrado) a más de una dimensión.
Esto lleva a la siguiente definición.
Definición 32. Se dice que un campo aleatorio {X(s), sÿS} es una media móvil (SMA;
Haining, 1978), si la variable aleatoria X(si ) se puede expresar como:
Xs
( )yo
= µ i tu s + tu s (j ) ( )
i +ÿm yo
(2.84)
yo
ÿ
con mij un conjunto de constantes tales que mij = mwij , wij ÿW , es apropiado
matriz de conectividad y {u(si ), sÿS} un proceso de ruido blanco
ÿÿ 2
ÿ
1 0espacial.
00 ÿ
ÿ
2
ÿ
0 ÿ
2
ÿ
2
0
ÿ ÿ
ÿ ÿ norte
ÿ
[ + M)ÿ(yo + M)
V = (yo
]T (2.85)
V= ÿ 2
[( yo
)( ) + mi + m ]T (2.86)
Este campo representa el análogo espacial de los modelos de promedio móvil temporal.
Aquí, la dependencia se introduce filtrando un campo de ruido blanco de una manera que se
parece mucho al efecto Slutsky-Yule en el análisis de series temporales. Nuevamente, como
en el caso de los procesos autorregresivos espaciales, los elementos diagonales en la
Ecuación (2.85) no son constantes incluso si el término de error es un ruido blanco. El modelo,
por lo tanto, define campos que no son estacionarios en covarianza.
Machine Translated by Google
Definición 33. Se dice que un campo aleatorio {X(s), sÿS} es una media móvil autorregresiva
(o SARMA; véase Huang, 1984), si la variable aleatoria X(si ) se puede expresar como:
( )=
Xs i +ÿµX ÿ [ tu( sj + tuµsj ]) ( )yo
i s ÿ +ÿm yo yo
( )j (2.87)
ÿi yo
ÿ
ÿ =ÿ , W es un
donde mij es un conjunto de constantes tal que mij = yo wij , wij ÿW
mwij ; matriz de conectividad apropiada y {u(si ), sÿS} un campo de ruido blanco espacial.
ÿÿ 2
1
000 ÿ
ÿ ÿ
2
ÿ
0 ÿ
2
ÿ
2
ÿ 0
ÿ ÿ
ÿ
norte
ÿ
las varianzas y autocovarianzas espaciales resultantes para el modelo {X(s), sÿS} viene
dada por:
1
VIBIMIMIB
= (-)
ÿ
( + )ÿ( + )( ÿ )
ÿT
(2.88)
2 1
IBIMIMIB
V = (-)
ÿ
ÿ
( + )( + )( - )
ÿT
(2.89)
Definición 34. Un campo aleatorio {X(s), sÿS} se denomina componente de error espacial
(SEC), si la variable aleatoria X(si ) se puede expresar como:
X s( )=i +ÿm
µ i v s + tu s ( )yo
j
)
yo
(2.90)
ÿ
yo
Machine Translated by Google
con mij = mwij un conjunto de constantes, wij , W una matriz de conectividad adecuada
ÿW y {u(si ), sÿS} y {v(si ), sÿS} dos campos de ruido blanco espacial independientes. Él
“efecto regional” (Anselin, 2001a), mientras que el término u(si ) es un efecto de innovación
específico de la ubicación.
La matriz resultante de varianzas y autocovarianzas espaciales viene dada por
(Keleijan y Robinson, 1993; Anselin, 2001a):
V=ÿ 2 yo +
tu
ÿ
2
v
milímetro
T
(2.91)
2
y 2
ÿ son los componentes de las varianzas en relación con el
donde M ÿ { mij } e ÿ tu
v
Una forma alternativa de especificar un modelo de campo aleatorio consiste en expresar los
elementos de la matriz de covarianza de varianza de manera parsimoniosa como alguna
función de la distancia entre pares de sitios. Si adoptamos esta estrategia, podemos
introducir la siguiente definición.
Definición 35. Un campo aleatorio {X(s), sÿS} se representa directamente (DR) (Mardia,
1990; Anselin, 2001a; Anselin et al. 2004), si cada elemento de la matriz de varianzas y
auto- las covarianzas entre las variables aleatorias X(si ) se pueden expresar como:
2
ÿ(s1, s2) = ÿ
f dij
( , )ÿ (2.92)
con d la distancia entre el sitio i y el sitio j, f (.) una función de disminución de la distancia tal
yo
ese ÿF
< 0 , fd( ,ÿ) ÿ1 y ÿ representa un vector apropiado de parame
yo
ÿd yo
ÿ d ÿ4
2ÿ 1 yo
ÿ(s1, s2) = ÿ (2.93)
ÿ
ÿ
ÿ ÿ
ÿ ÿ
Utilizando la Ecuación (2.93) para definir cada elemento individual de covarianza, la matriz
completa de varianza y autocovarianzas espaciales viene dada por:
V= ÿ 2
( ÿ dij ÿ , ) (2.94)
Machine Translated by Google
que debe ser definida positiva con elementos ÿ ÿÿ tal que ij ÿ =1 yyo
2.5.1 Introducción
variables aleatorias fuera del límite del área observada. Alternativamente, se puede aplicar
una teoría asintótica de relleno considerando un área limitada y niveles de particiones
subregionales cada vez más detalladas al desagregar posteriormente las unidades
existentes. Es importante señalar, sin embargo, que incluso en este caso no siempre es
posible aplicar un criterio que asegure que las observaciones tiendan al infinito de manera
regular: esto se debe tanto a la forma como al tamaño diferente de las distintas unidades
espaciales. ya la arbitrariedad con la que puede ocurrir una desagregación posterior (ver
Arbia, 1989, para una discusión detallada de este tema).
Dada la importancia del tema, citaremos ahora algunos conceptos de convergencia útiles
para comprender los teoremas de límite en el análisis espacial.
Definición 36. Se dice que una secuencia de variables aleatorias {Xn(s), nÿN} converge
casi con seguridad (o con probabilidad 1) a la variable aleatoria X(s), y se indica
COMO
como X (s)
ÿ X (s) , Si:
norte
} =1
PAGS { s : limnÿ+ÿ Xn (s) = X (s) (2.95)
Definición 37. Decimos que una secuencia de variables aleatorias {Xn(s), nÿN}
converge en probabilidad a la variable aleatoria X(s), y se indica como
PAG
X (s) Xÿ (s)
norte
, Si:
Definición 38. Decimos que una secuencia de variables aleatorias {Xn(s), nÿN},
caracterizada por la función de distribución {Fn(X), nÿN}, converge en distribución a
D
la variable aleatoria X(s), y la indicamos Xn(s) ÿ X(s), si:
Ley Fuerte de los Grandes Números (Teorema de Kolmogorov 2): Sea {Xn, nÿ1} una
2
secuencia de variables aleatorias independientes tal que E(Xi) = µ i, y Var(Xi) = ÿ
i
ÿ
1
() < +ÿ , entonces:
existen para todo i = 1,2,… y que ÿ k2 Var Xk
k=1
norte
1 norte
COMO
1( ÿ ÿX i
ÿ
norte
µ i ) ÿ0 (2.98)
n 1 i= i =1
El SLLN establece las condiciones bajo las cuales los promedios de las variables aleatorias
convergen a sus valores esperados, y por lo tanto constituye la base para obtener la
distribución de estimadores y contrasta estadísticos que se construyen como combinaciones lineales de
los valores observados.
Una vez más, la hipótesis de independencia entre variables aleatorias considerada en
la formulación de la ley imposibilita su uso en el caso de datos espaciales. Sin embargo,
McLeish (1975) y White (1984) demostraron que la SLLN puede extenderse al caso de
variables aleatorias dependientes siempre que obedezcan formas particulares de
restricción. Más específicamente, el siguiente resultado es válido:
Ley Fuerte de los Grandes Números para Campos Mezclados: Sea {Xn, nÿ1} un campo
aleatorio mezclado (fuerte o uniformemente: vea las Definiciones 18 y 19) donde tenemos:
d
r
ÿ (m) = O(m- ) d> (2.99)
2r ÿ1
d
r
ÿ (m) = O(m- ) d>
r -1
para campos de mezcla uniforme, y tal que está dominado por el proceso {Zn, nÿ1}en el
sentido de que |Xn| ÿ Zn. Entonces:
Machine Translated by Google
norte
1 norte
COMO
1( ÿ ÿX i
ÿ
µ i ) ÿ0 (2.100)
n 1i = norte
i =1
ÿ
1
siempre que ÿ 2 Var (Xk ) < +ÿ , y además, E(|Zr+d|) < D < + ÿ, nÿ1,
k =1 k
Teorema del límite central (CLT): Sea {Xn, nÿ1} una secuencia de variables aleatorias
independientes e idénticamente distribuidas de modo que E(Xi) = y Var(Xi)
µ i, i=1,2...,n
Además,
= ÿ
2
NSE ( ) ÿ
norte
Y = norte norte
norte
ÿ= =i 1
Fn(Y). Entonces:
D
Sí ÿ Z ÿ N(0,1) (2.101)
Teorema del límite central para campos de mezcla. Sea {Xn, nÿ1} un campo
aleatorio de mezcla (fuerte o uniforme) donde tenemos:
d r
ÿ (m) = O(m- ) d >
2r ÿ1
o (2.102)
d r
ÿ (m) = O(m- ) d >
r -1
por lo que está dominado por el proceso {Zn, nÿ1} en el sentido de que |Xn| ÿ Zn, y así
+d
2r 1 norte
que E(Xn)=0, nÿ1, y E(|Xn| )ÿ k < + ÿ. Además, sea Sn( Xi d )=ÿ ser
norte i =d+ 1
S (0) D
norte
ÿ Z ÿ N(0,1) (2.103)
Nevada
y (2.104)
2+d
ii) E(|X(si)- µ yo| )ÿÿ (Condición de limitación de Lyapunov)
Definición 40. Se dice que un campo aleatorio {X(s), sÿS} con µ i, y Var(X(si)) = ÿ2 i
E(X(si))= < ÿ, es localmente covariante si:
*
ÿ 0 si ÿ dd < yo
con dij cualquier medida de distancia entre los sitios si y sj (ver Sección 2.2.1).
El concepto de un campo aleatorio localmente covariante (debido a Smith, 1980 y estudiado
en detalle por Arbia, 1989) se basa en una forma de restricción en la dependencia del proceso
análoga a la independencia asintótica de los procesos aleatorios temporales.
Al desarrollar estos conceptos, Smith (1980) demostró el siguiente resultado.
Teorema del límite central para campos regulares y localmente covariantes. Sea {Xn,
µ i,
nÿ1} un campo aleatorio regular y localmente covariante tal que E(Xi)= y Var(Xi) = ÿi=1,2,…,n.
2
ÿ < +ÿ
Además, considere la variable aleatoria yo
NSE ( ) ÿ
norte
Y = norte norte
norte
D
Sí ÿ Z ÿ N(0,1) (2.106)
Serfling (1980) amplió aún más la CLT a procesos que presentan formas de dependencia más
complejas que las consideradas en el presente contexto (ver también Wooldridge y White,
1988).
Machine Translated by Google
3.1 Introducción
densidad de probabilidad conjunta del con ÿÿÿ el conjunto de muestra se define como
Esta función representa la Fprobabilidad
XXX , ,..., (de , s ,...,
XX que, antes
s1
X del
s , parámetrostuviéramos
ÿ );experimento,
s2
a estimar.
s 1 2 norte
norte
L = L( ÿ ) = L(, x)
ÿ = ( ) cf X
XXX s, , s 1 ,...,
2 ( XX ,..., xÿs ; ) (3.1)
s1
_ s2 _ sn norte
ÿ l (Xÿ, ) ÿ
q (ÿ) = (3.2)
ÿ ()
Machine Translated by Google
2
ÿ ÿ( l,X)
j (ÿ)= ÿ ÿÿ yo , k
ÿ ÿ (3.3)
ÿÿ ÿÿ yo k
ÿ ÿ L ( ÿ;x
) = =
q ( ÿ) 0
ÿÿ
(3.6)
ÿÿ
ÿ 2
ÿ L ( ÿ;x
)
ÿ
2
< 0
ÿ
ÿ ÿÿ
norte
FX1 , ( , ,...,X x1
,..., x2 xn ÿ ; ) X yo ( ;ÿ) (3.7)
= ÿ=
2x2 efectos especiales
_ norte
i
i 1
Machine Translated by Google
3.1 Introducción 75
norte
ÿ
=
l (ÿ) en[ c (x)f XXX ( xx
, 1 2xn
] = c(x) + ln ÿ X yo
ÿ ( ;ÿ) = ÿ
1 ,2 ,..., norte
,..., ÿ ; )
ÿ
ÿ=
i 1
i
efectos especiales
ÿ
norte
= c(x) + ÿ [ en X yo
efectos yo
especiales ( ;ÿ)
] (3.8)
i =1
donde el término ln[ ( ;ÿ)] X yo representa el log-verosimilitud para una sola observación
efectos especiales
x
yo .
norte
t1 norte ÿ
_
Tennesse
tt 1 yo
=
l (ÿ)
= cfln[ (x) XXX
t1 , t2 ,..., Tennesse
(xxx
, _ ,..., ;ÿ] 1 2 norte
norte
C X
ÿ ( ) en ÿ F XXX es ( xxx t1
, t2
,..., X 1 ; ÿ) =ÿ
ÿ
,..., yo yo ÿ
t1 ti 1 _ _
= + ÿ=
ÿ
ÿ i 1 ÿ
norte
1 i t1 t2 yo
_
ÿ
1
ÿ ; ) ahora representa el log-verosimilitud para
eso ti ÿ
Una primera forma de proceder para derivar la función de verosimilitud a partir de muestras
espaciales es la denominada técnica de codificación sugerida por Besag (1972). La
técnica se basa en la consideración de que si un campo aleatorio es markoviano (consulte
la Sección 2.4.2), entonces los pares de variables aleatorias asociadas con dos
ubicaciones no vecinas (ya sean puntos o regiones) son mutuamente independientes
condicionalmente a las variables aleatorias restantes. En consecuencia, al seleccionar ad
hoc un subconjunto de ubicaciones que no son vecinas, la probabilidad puede derivarse
en términos del producto de las funciones de densidad de probabilidad condicional.
Para ilustrar mejor la técnica de codificación, observemos la Figura 3.1.
(un) (b)
Figura 3.1. Modelo de codificación para un campo de parámetros continuos (a) y para un campo de parámetros
discretos (b).
En la figura 3.1, cada ubicación está etiquetada con una cruz o con un círculo, de tal
manera que las ubicaciones etiquetadas con una cruz no se encuentran juntas. Llamemos
Q al conjunto de ubicación marcado con una cruz y supongamos que su cardinalidad es
#[ ] Q = q . De esta forma, si el campo observado es markoviano, las
variables aleatorias asociadas a la ubicación codificadas en cruz son todas mutuamente
Machine Translated by Google
q
FXXX s, 1s1 ,..., sn
( xxx
, s2 _
,..., sn _ ÿ ; ) = ÿ FXX (xxs
s
ni syo ,
i j
ÿ ( ); ÿ) (3.11)
_ s2 _
s j
es j
i=1
yo
ÿ q
ÿ ÿ
q
en ÿ
ÿ
( xxs Ns jyo, ( );ÿ)
ÿ
ÿ (x) cf ÿ si
XXes sj
yo j ÿ
i =1
ÿ
ÿ
yoÿ q ÿ ÿ
q
= Cÿ(X) + en f XX , j( );ÿ ÿ)
( xxs Ns j yo
si
yo
(3.12)
es sj
i=1
yoÿ q
Obviamente, en cualquier caso específico, hay muchas alternativas posibles para codificar
las ubicaciones y, como resultado, todas las conclusiones inferenciales dependerán de la
elección realizada. Es necesario, por tanto, comprobar en qué medida los resultados son
robustos a la elección realizada al aplicar esta metodología a casos empíricos.
La filosofía básica detrás de la técnica descrita es que es preferible descartar información
(en nuestro caso, las ubicaciones marcadas con círculos) en lugar de perder las propiedades
óptimas de las estimaciones y pruebas basadas en la probabilidad. En este sentido, la
técnica se aplica en los casos en que se dispone de un gran conjunto de datos (para que la
pérdida de información no comprometa el número de grados de libertad) de encuestas
completas (por ejemplo, encuestas relacionadas con agentes económicos individuales, o
encuestas de cobertura completa). de datos regionales). La técnica también se recomienda
en los casos en que los datos provienen de encuestas por muestreo y es posible controlar
el diseño del muestreo mediante la introducción de restricciones no vecinales entre las
ubicaciones (véanse, por ejemplo, los planes de muestreo sugeridos por Arbia y Switzer,
1994; Arbia, 1995a; y Arbia y Lafratta, 1997, 2002).
Definición 44. Dado un conjunto de ubicaciones (s1, s2,…, sn), si = (s1i, s2i), entonces, para cada
ubicación si definamos el conjunto de predecesores de si, digamos P(i), como el conjunto de posiciones
sj tal que:
Definición 45. Dado un conjunto de ubicaciones (s1, s2, ...., sn), si = (s1i, s2i), dada la estructura vecina
N(i) y la definición de predecesores P(i) , proporcionada por Definición 44, para cada ubicación si
(un) (b)
Figura 3.2. Predecesores de ubicación si ( P(i) ), vecinos de si ( N(i) ) y vecinos predecesores ( PN(i) ) de
si en el caso de campos de parámetros continuos (a) y de parámetros discretos (b).
Si suponemos que el campo aleatorio en estudio es isotrópico (ver Sección 2.3.1), entonces su estructura
de dependencia será idéntica en las cuatro direcciones originadas en las cuatro esquinas del área (NW,
NE, SE, SW). Por lo tanto, no es limitante estudiar el campo aleatorio basado en las variables aleatorias
que caen (p. ej.) en el cuadrante superior izquierdo de cada si (ver Figura 3.2).
Machine Translated by Google
yo
(ÿ) en= [cf( ) X XXX, s1
_ s2 _
,...., sn
( xxx
, 1,..., ss 2 norte
;ÿ)] =
ÿ
norte
( xx ss ij ÿ PN yo
ÿ ( );ÿ) ÿ=
ln (x)
ÿ cf ÿ XXs es j
;s j
ÿ i =1 ÿ
norte
C (X) en f XX es ( xx ss ij ;s j ÿ PN yo
( );ÿ) (3.15)
s
ÿ= +
i 1 j
vecina de si.
Si bien esta técnica brinda una excelente solución al problema de calcular una verosimilitud
en el caso de campos aleatorios de parámetros continuos, no parece aconsejable en el caso
de campos aleatorios de parámetros discretos, dada la necesaria arbitrariedad en la definición
de predecesores en casos donde la partición es particularmente compleja y los polígonos
son de forma y tamaño irregular.
Las aproximaciones discutidas anteriormente están sujetas a algunas limitaciones. Para los
datos derivados de encuestas completas o encuestas basadas en un diseño estadístico
riguroso y extraídas de un campo de Markov, la técnica de codificación parece ser la más
adecuada. Por el contrario, en el caso de campos isotrópicos de Markov especificados con
un parámetro continuo, se puede utilizar una aproximación unilateral.
Si no se da ninguna de estas condiciones, la única solución parece basarse en la
denominada pseudoverosimilitud (PL) de Besag . Como es bien sabido, una
pseudoverosimilitud es una función que, aunque no sea una verosimilitud propiamente
definida, satisface todas o algunas de las propiedades de una función de verosimilitud (Pace y Salvan, 1997). Besag (1974)
Machine Translated by Google
=
Pl (ÿ)
= cf ln[ (x) XXX, s sn,...,
s1
_ s2 _
(xxx
, ,..., ss 2
1 norte
;ÿ]
norte
ÿ
ln (x)
ÿ cf ÿ XX ij es s
( xx ss ÿ ; sj ÿ i s ;ÿ)=ÿ
ÿ i =1 j
ÿ
norte
Geman y Graffigne (1987) probaron que la técnica conduce a estimadores consistentes de los
parámetros desconocidos. Sin embargo, el elemento que parece estar más a favor de la
pseudoverosimilitud de Besag es la circunstancia muy práctica de que proporciona buenos
resultados en casos reales (Ripley, 1990).
Cuando se propusieron los métodos anteriores durante la década de 1970, todavía existían
enormes límites computacionales al usar el método de máxima verosimilitud para la estimación
de parámetros y la construcción de procedimientos de prueba de hipótesis. Estos problemas
ahora parecen estar obsoletos, ya que es posible resolver el problema bastante rápido usando
aproximaciones numéricas (ver Ripley, 1990).
Sin embargo, en el caso de que el número de ubicaciones que constituyen el campo sea
muy alto, aún es necesario considerar los posibles problemas de cálculo al derivar la función de
verosimilitud. A modo de ejemplo, consideremos el caso de un campo autonormal (CAR) (ver
Definición 28), que es un campo MVN(µ, V) con vector medio µ ÿ (µ1, µ2,…,µn) y matriz de
varianza-covarianza V, tal que ) ÿ VIB ÿ
1
=ÿ
( . Hasta hace unos años, el cálculo del determinante |I – B| se consideró
prohibitivo incluso con un pequeño número de ubicaciones. De hecho, en muchas aplicaciones
prácticas, la matriz B está dispersa y cuasi-singular (véase, por ejemplo, Arbia, 1986). Si
ÿ
definimos i como los valores propios de la matriz W, Ord (1975) sugirió usar el desglose:
norte
IBI ÿ=ÿ
ÿ W 1= ÿ( ) ÿ
ÿÿ i (3.17)
i=
1
Para otras aproximaciones ver Mead (1967) y Whittle (1954) y, más recientemente, Smirnov y
Anselin (2001), Griffith (2000, 2004), Pace y LeSage (2004), Pace y Zou (2000), Pace (1997) ,
Pace y Barry (1997b, 1997c).
Machine Translated by Google
ÿ LXÿ( , ) ÿ 2 L( ,ÿ X ) ÿ 3 L( ,ÿ x )
L '( ÿ) = ; L' '() ÿ= ÿ y L' ' '() = ÿ
ÿ ÿ ÿ2 ÿ ÿ3
ÿ L( ÿ , x )
(iii) L'() = ÿ <ÿ
ÿÿ
-1
Var(ÿ) = iÿ(ÿ) 1 = [limnÿÿ( en(ÿ))]-1 (3.18)
norte
Definición 46. Sea la función de verosimilitud L(ÿ; X ), ˆÿ0 el vector de los parámetros bajo la
hipótesis nula H0 y ÿ el estimador de máxima verosimilitud de
ÿ . El radio:
LX
( ÿ0
ÿ(X) = (3.19)
; ÿ) ; ) ˆ(
LX
se denomina razón de verosimilitud. Dado que una transformación monótona no altera las
conclusiones de la prueba, es equivalente considerar la transformación:
que representa la prueba de razón de verosimilitud. Se puede probar que, bajo las hipótesis de
regularidad requeridas para la optimalidad de los estimadores de máxima verosimilitud, la prueba
de razón de verosimilitud se distribuye asintóticamente bajo H0 como ÿ2
(m) con m grados de libertad, donde m es el número de restricciones bajo la hipótesis nula.
Definición 47. Bajo los supuestos habituales de regularidad, mediante laˆ expansión de la prueba
de razón de verosimilitud según la serie de Taylor alrededor de ÿ y deteniéndonos en el
segundo término, obtenemos:
ˆ 2
( ÿ - ÿ yo
LRT = norte ) (ÿ )+ o
0 0 pag
(1) (3.21)
ˆ 2
)()
( ÿ - ÿ0 yo ÿ0
WT = norte (3.22)
es una prueba alternativa llamada prueba de Wald. De la Ecuación (3.21) puede verse que WT es
asintóticamente equivalente a LRT y, como consecuencia, también se distribuye asintóticamente
como ÿ2 (m).
(ˆ ) q (ÿ)
0
(3.23)
ÿ ÿ- = 0
norte + op (1)
yo 0
norte
( )ÿ
2
( q ÿ0 )
PESO = + o (1) (3.24)
norte yo
( )ÿ
pag
El término
2
( q ÿ0 )
LMT = yo (3.25)
n ÿ( )
0
ˆ
norte - r [RSS ˆ(ÿ 1) ÿ
RSS ( ÿ 0 ) ] (3.26)
r RSS ) ÿˆ(0
y nr grados de libertad.
Machine Translated by Google
4.1 Introducción
T T T T T .
Zi = (Yi, Xi T) y las observaciones muestrales z(si) = [y(si), x(si) ] ]
como zi = [yi, xi
Ahora resumiremos los supuestos básicos en los que se basa un modelo de regresión
lineal. Agruparemos las hipótesis en tres bloques: (i) hipótesis sobre el modelo de
probabilidad (PM), (ii) hipótesis sobre el mecanismo generador de estadísticas (GM) e
(iii) hipótesis sobre el modelo de muestreo de datos (SM).
= ÿ ÿ ÿ ÿ ÿk 1+
} yZ ÿMVN
PM { ÿ = ÿ ; i ( , );i fZ Zi z ÿi i
PM1 (fYy = =
X xi ÿ ) ÿ norte
yo
_
X
yo
i i yo , i
PM4 ÿi ÿ (ÿ,ÿ²)= ÿ ÿi
PM1 a PM4 resumen todos los aspectos del Modelo de Probabilidad que son necesarios para
construir los procedimientos estadísticos inferenciales.
Machine Translated by Google
El supuesto básico detrás del mecanismo de generación de estadísticas es que está constituido
por un componente sistemático (predecible) y un componente no sistemático (no predecible). En
el modelo básico de regresión lineal, los dos componentes se combinan linealmente. Como es
obvio, esta linealidad no tiene nada que ver con la linealidad de la media condicional asumida
bajo PM2 como consecuencia de la multinormalidad postulada. En particular, el componente
sistemático (digamos µi) está representado por la expectativa condicional de yi dado xi , mientras
que el componente no sistemático es simplemente la parte no explicada del modelo, medida por
la diferencia entre el valor observado y el componente sistemático. Tenemos por lo tanto:
Yi = ÿTxi + ui _
De la normalidad postulada en el PM, también tenemos que los únicos parámetros de interés del
modelo están representados por el vector ÿ y la varianza condicional de y dada X (digamos ÿ2 ).
Por supuesto, la parametrización depende de las hipótesis específicas realizadas para el PM.
Cambiar el PM (como haremos al introducir algunos de los procedimientos para tratar datos
espaciales) dará como resultado, en general, una parametrización diferente.
El hecho de concentrarse en modelar la distribución condicional de Yi dada
Xi = xi (y, específicamente, el valor esperado de esta distribución) en lugar de
modelar directamente su distribución conjunta, implica que en la identidad:
fZ z( ,ÿi )=i ( fy i
X iX=ÿ ,i () Fi XX=ÿ
X yo yo i
, i )
i yo X
_ yo
contenida enfx(
i
, )i inferencialmente irrelevante con respecto al problema de
X =i x ÿ i es
estimando el vector de parámetros de interés ÿ. Esta hipótesis simplificadora conduce a la
siguiente suposición:
Finalmente, por razones relacionadas con los procedimientos de estimación y, en particular, para
evitar la singularidad de la matriz de varianzas-covarianzas, asumimos que la matriz de datos
observada es de rango completo, cualquiera que sea la muestra observada, es decir:
T
con X = (x1, x2,...,xn) , xi un vector k-by-1 de observaciones y X un n-by-k datos
matriz tal que n > k.
Las hipótesis GM1 a GM5 representan lo que llamamos el Mecanismo Generador de
Estadísticas.
La suposición básica detrás del modelo de muestreo es que los datos se extraen con un
criterio aleatorio simple de la distribución condicional de Y dada X. En otras palabras:
T
SM1 y ÿ (y1, y2,...,yn) es una muestra independiente extraída de la densidad
( fy i
X x ÿ=
i i , i ) , i = 1,.....,n
Yi X i
Una formulación equivalente del modelo de regresión lineal más comúnmente utilizado en los
manuales de econometría (y que utilizaremos en algunas circunstancias en este libro) se
concentra en el modelado de un componente de error estocástico y deriva de él todas las
hipótesis sobre el PM y el SM .
En esta segunda formulación, se supone a priori una relación lineal entre yi y xi (y no se
deriva del modelo de probabilidad como antes) y todas las suposiciones probabilísticas se
concentran en un término de error estocástico en lugar de directamente en la relación
T.
estocástica entre yi y el xi
En particular, la suposición de linealidad implica en primer lugar
Machine Translated by Google
A1 yi = ÿTxi + ui _
A1 y = Xÿ + tu
con u un vector de columna de n por 1 de los términos de error y X una matriz de datos de n por
k (n > k). El supuesto A1 es paralelo al supuesto GM1 en la especificación anterior.
Además, suponemos que el componente de error, condicionalmente a los valores observados
de X, se distribuye en una forma gaussiana con valor esperado cero y varianza constante
A2 (u X) uf ÿ N(0, ÿ2 In)
Rango A4 (X) = k
T
con X = (X1, X2, ....., Xn) una matriz n por k que contiene la información de la muestra (n
> k).
De acuerdo con nuestro objetivo propuesto de describir las metodologías básicas para probar
las relaciones espaciales, no vamos a discutir aquí todo el conjunto de supuestos en los que se
basa el modelo de regresión lineal en las dos formulaciones alternativas.
Por el contrario, nos vamos a limitar a considerar sólo aquellas violaciones que asumen un
significado preciso y de fácil interpretación en los casos en que los datos empíricos provienen de
observaciones espaciales.
En particular, no vamos a discutir los supuestos relacionados con el modelo estadístico de
generación de datos (GM). Las siguientes secciones de este Capítulo se concentrarán en los
supuestos relacionados solo con el Modelo de probabilidad (PM) y el Modelo de muestreo (SM).
Más específicamente, la Sección 4.3 discutirá la hipótesis más crucial (violada sistemáticamente
con los datos espaciales) de la independencia de las observaciones espaciales. La Sección 4.4
discutirá las violaciones de las hipótesis detrás del modelo de probabilidad y, en particular,
aquellas relacionadas con la homocedasticidad espacial y la invariancia espacial de los
parámetros que se encuentran con mayor frecuencia en instancias empíricas en el análisis
económico.
Machine Translated by Google
4.3.1 Introducción
El supuesto SM1 de muestreo aleatorio simple es sin duda el más importante entre aquellos
en los que se basa el modelo de regresión lineal. En la práctica, ninguno de los resultados
relacionados con la estimación y la prueba de hipótesis siguen siendo válidos si se rechazan
sobre la base de datos empíricos. Más precisamente, las implicaciones de la violación de la
hipótesis del muestreo aleatorio simple en SM son que las estimaciones de MCO de ÿ y ÿ2
son ineficientes e inconsistentes incluso si aún no están sesgadas.
Además, las varianzas de muestreo están sesgadas y, en la mayoría de los casos,
significativamente subestimadas. Como consecuencia, el coeficiente de determinación (R2 )
así como los estadísticos de prueba t y F tienden a estar inflados, lo que lleva a aceptar el
modelo con más frecuencia de la que debería (Maddala, 2001). Como se indicó en la Sección
1.1, muchos libros de texto de econometría son conscientes del problema de la falta de
independencia que surge al tratar con datos recopilados espacialmente. Kmenta (1997)
advierte que: “En muchas circunstancias, la suposición más cuestionable […] es que las
unidades transversales son mutuamente independientes […] cuando las unidades transversales
son regiones geográficas […] no esperaríamos esta suposición estar bien satisfecho”. De
manera similar, Maddala (2001) señala que: “En datos de sección transversal [correlación]
puede surgir entre unidades contiguas […] De manera similar, si nuestros datos son sobre
estados, los términos de error para estados contiguos tienden a estar correlacionados”.
Woolridge (2002a), también es consciente del problema cuando dice que “… los datos de
corte transversal que no son el resultado de un muestreo independiente pueden ser difíciles
de manejar. La correlación espacial, o, más generalmente, la dependencia espacial,
generalmente ocurre cuando […] los datos se recopilan a nivel de condado, estado, provincia
o país. Es probable que los resultados de las unidades adyacentes estén correlacionados”. A
este respecto, conviene recordar también las citas de Baltagi (2001), Gujarati (2003), Johnston (1991) y Kennedy (2003) citadas en
En el nivel al que se ha mantenido este libro, nos limitaremos al paradigma gaussiano.
Así, el estudio de cómo se viola la situación ideal de independencia en el espacio se reduce
al estudio más simple de la correlación entre unidades espaciales o correlación espacial.
Históricamente, el estudio de la correlación espacial (o autocorrelación espacial, como la
llamamos en el Capítulo 2) fue el primer tema abordado por la estadística espacial (ver
Whittle, 1954; Besag; 1974; Cliff y Ord, 1981). Condujo a la especificación de una primera
prueba de independencia espacial que sigue siendo muy popular en la literatura econométrica
espacial. Esta es la llamada prueba de autocorrelación espacial I de Moran, que lleva el
nombre del estadístico que la introdujo en la década de 1950 (Moran, 1950).
La I de Moran tiene varias desventajas. En primer lugar, no es un coeficiente de correlación
en el sentido de que no oscila entre –1 y 1. En segundo lugar, no es una prueba estadística
propiamente dicha porque, aunque se basa en la hipótesis nula implícita de independencia
espacial, no considera un hipótesis alternativa explícita. Otras críticas al I de Moran se pueden
encontrar en Arbia (1989). Por otro lado, el I de Moran representa la estadística de prueba
más simple y más utilizada en la literatura econométrica espacial. Además, el hecho de que
no requiera la especificación de una alternativa
Machine Translated by Google
La hipótesis alternativa puede resultar una ventaja cuando se abordan inicialmente los problemas de
forma exploratoria, antes de especificar un modelo de campo aleatorio definido como alternativa a los
supuestos básicos. Finalmente, Burridge (1980) demostró que la prueba I de Moran es asintóticamente
equivalente a una prueba del multiplicador de Lagrange si la alternativa a la hipótesis nula de
independencia espacial se expresa mediante un modelo de campo aleatorio SAR o SMA.
Por estas razones, dedicaremos la próxima sección a una discusión de esta prueba.
Mientras estudiaban la autocorrelación espacial, Moran (1950) y Cliff y Ord (1972) propusieron una
prueba que se puede aplicar al estudio del patrón de dependencia de los residuos de un modelo de
regresión lineal al menos en un análisis exploratorio. La prueba asume la forma:
norte norte
ÿÿ ˆˆ
ij ij
pequeñito
i = =1 j 1
ˆi ˆT
con n el número de observaciones espaciales, ey ÿ x los residuos dei la regresión
i OLS, wij ÿW y W una =ÿ
wij
ÿÿ=
i 1=j 1
(eee ˆ1 ( T ˆ)
) ˆnosotros
T
ÿ
=
Yo h
(4.2)
con eˆ = y – X ÿ
ˆ y X una matriz de datos n por k .
De manera equivalente, al referirse a la matriz de conectividad estandarizada W* (consulte la Sección
2.2.1.2), la estadística de prueba se simplifica como:
T
ÿ
1 T *
yo= (4.3)
(ˆ)) eee
ˆˆ(We
En primer lugar, observemos que la prueba de series temporales análogas más célebre para la
autocorrelación temporal, la prueba de Durbin-Watson, puede expresarse de manera similar. Es suficiente
mostrar este punto para definir una matriz de conectividad apropiada que dé cuenta del patrón de
dependencia temporal.
Machine Translated by Google
* T
En particular, si sustituimos la matriz tal que: =
W LL en la Ecuación (4.3) con L
ÿ0 ÿ
1000 . . 0ÿ
ÿ ÿ
ÿ
01ÿ ÿ
100 . . 0 ÿ
00ÿ 1 ÿ
10 . . 0 ÿ
. . .
L=
ÿ ÿ
(4.4)
.
ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿ ÿ
ÿ
. ÿ
ÿ0 0 0 0 0
ÿ
. 1 ÿ
1ÿ
ÿ
T
ˆ ˆ
( ÿ ee tt
ÿ
1
)2
= t=2
yo
T
(4.5)
ˆ2
ÿ mi
t
t =2
k ÿ
1
IE( ) = MW*
( ) 1 tr (4.6)
nk ÿÿ
y varianza
( MW
)( MW
* MW ) [( tr
* T MW tr + tr +* )2 1 ( nknk *
)]
2
() =
Var yo IE( ) 2 (4.7)
ÿ
( ÿÿÿ+ 1)
con el símbolo tr(.) denotando la traza de una matriz, M la matriz de proyección idempotente
T 1 T
derivada de la matriz de datos X de tal manera que ) ÿ MIX(XXX =ÿ
,
y k el número de variables independientes del modelo incluyendo la constante
término.
Cuando no se puede suponer normalidad para los residuos, Cliff y Ord (1972) han
probado la normalidad de la prueba utilizando un argumento permutacional no paramétrico.
Machine Translated by Google
4.3.3.1 Introducción
ÿX 1ÿ ÿ µ 1 ÿ ÿ CV1 ÿ 12
. . C
1 norte
ÿ
ÿ ÿ ÿ ÿ
ÿ
X µ2 . V .
ÿ
2 ÿ ÿ ÿ ÿ
2 ÿ
ÿ ÿ
ÿ
MVN ÿ ÿ ÿ
. . . ÿ
(4.8)
ÿ ÿ ÿ ÿ ÿ ÿ
ÿ ÿ ÿ ÿ ÿ
. . . ÿ
ÿ ÿ ÿ ÿ
ÿµ ÿ ÿC . . . V
ÿ ÿ
ÿÿ . ) ÿ
( yo
11 ( yo
) ÿ 12 ( ) . yo ÿ 1k
ÿ ÿ
ÿ
. . . ÿ
V = ÿ
. . . ÿ
(4.9)
i ÿ ÿ
ÿ
. . ÿ
ÿ ÿ
ÿÿ ( yo
) . . . ÿ ( yo
) ÿ
k1 k
ÿÿ
ÿ
11 ( ) ()ÿ ij ij 12 ÿ 1k yo( )ÿ ÿ
ÿ ÿ
C
= ÿ ÿ
(4.10)
ij ÿ ÿ
ÿ ÿ
() ()ÿÿ
ÿ
ÿÿ k1
ÿ k yo
modelo de probabilidad
Una primera forma de redefinir el modelo de regresión lineal para tener en cuenta la naturaleza
espacial de los datos es redefinir el modelo de probabilidad de tal manera que se suponga que
el vector de variables aleatorias involucradas obedece a un campo autonormal, es decir:
2(k1)
{ ( fZi Z=z ÿ i ÿ, ÿi ÿ);ÿ ÿ ÿ ; }
PM ÿ= + yZ ÿMVN
i i
PM1 ( YY
fyXyo, x ix= yo
= N i ( );
, Y yj ;j
ÿ ÿ
i ) ÿ norte
i yo
norte norte
PM2 ey( Xx ;
i i
=
i
= ÿ ;j
Yj yj N i ( );ÿ) ÿ
= T
ÿ w
ij jx ÿ+
x
T
i
+ ÿ ÿ wyj ij
j =1 j =1
T
norte
ÿ
norte norte
ÿ
donde ÿ ÿ (ÿ1, ÿ2,…, ÿk)
T = wx 1 ,..., wx ij y ÿ, ÿ y ÿ son
, ÿÿÿ wÿij jx ÿ
yo j kj
ÿ
j ===
111 ÿj j ÿ
los parámetros a estimar. En particular, ÿ y ÿ son los parámetros que
Machine Translated by Google
También derivamos la constancia de todos los parámetros con respecto al espacio, es decir:
Modelo estadístico
Yi = µi + ui (4.11)
norte norte
T T
GM1
Yi = ÿÿ w+x
ij j ÿ x i + wy ÿ
ÿ + tu yo j i
j =1 j =1
El modelo considerado aquí impone algunas restricciones sobre los parámetros relacionados
con la simetría de la matriz de varianza-covarianza. En particular, tenemos:
Modelo de muestreo
T
Finalmente, en el modelo de muestreo, supondremos que y ÿ (y1, y2,...,yn) es una muestra
extraído de un campo aleatorio estacionario caracterizado por la distribución condicional
( YfyyXiij, i x ix= yo
= N i ÿ ÿ( ); )decir:
, Y yj ;j es
T
SM1 y ÿ (y1, y2, …, yn) se extrae independientemente de
El modelo así especificado se denominará modelo de regresión lineal espacial CAR multivariado.
A pesar de sus sólidos fundamentos probabilísticos, no se encuentra en la literatura econométrica
espacial aplicada. También se debe señalar que parte del problema puede residir en el hecho de
que actualmente no existe una rutina disponible para la estimación y la prueba de hipótesis
basadas en este marco de modelado (consulte el Capítulo 6 a continuación).
En esta sección nos limitaremos simplemente a campos autonormales bivariados Zi = (Yi, Xi)
T
. La extensión a campos de dimensiones superiores es más complicada en su
formalismo y se describe en la siguiente sección.
Si Y y X se distribuyen conjuntamente como un campo aleatorio bivariado, sabemos (de
Sección 2.4.2.8) que podemos expresar el valor esperado condicional de Yi como:
[ Xj ;Yj ;Xi=Y+µ i
EYi ]ÿ ÿ
ij( XjXj ) µ
ÿ
+ ÿ (X ÿ + yo
µ X) yo ÿÿ (Y
ij j Y j
ÿ
µ )
(4.12)
yo
ÿ yo
ÿ
Para simplificar una notación que corre el riesgo de volverse demasiado engorrosa, expresaremos
(sin perder la generalidad) cada variable aleatoria como una desviación de su respectivo valor
esperado. La ecuación (4.12) ahora se convierte en
E [Yi Xj ; Yj ; xi = ]ÿ ÿ x + + ÿX
yo ji ÿ ÿ ij Y
j
(4.13)
yo
ÿ yo
ÿ
Machine Translated by Google
con ÿ =ÿ =ÿ
yo Wij , ÿ yo wij , ÿ, ÿ y una ÿ parámetros y wij ÿW . los elementos de
matriz de contigüidad propiamente definida.
Esta expresión del valor condicional esperado proporciona una forma operativa para
el componente sistemático del modelo. Así, si definimos el componente no sistemático
como:
=ÿ
ui Yi E Yi X j ;Yj ; xi yi[ ]ÿ =ÿ
ÿ
j
X ij ÿÿ
ÿ Xi ÿ ÿ ij jY
(4.14)
yo
ÿ yo
ÿ
[ i ;Yj ; jX + i tu
] (4.15)
Yi = EYX i
tenemos:
ÿ
Yi = ÿw + jÿw Y ÿ+ tu i
X + X yo ÿ yo j i
(4.16)
ÿi yo
ÿ
1
ÿ primera guerra + ÿ( ÿÿ
mundial
* ÿ )
ÿ ÿ ÿ ÿÿ ÿ
=(,
QQ ÿ ÿ ÿ, ÿ ,
2
, ÿ
2
) =ÿ
ÿ
ÿ yo ÿ (4.17)
X
ÿW
y
ÿÿ WI + ÿ( ÿ
ÿ ÿ
ÿÿ
ÿ ) ÿ ÿÿ
2
ÿ yo ÿ 0 ÿ 2
nx 2
con ÿ = ÿ ÿ
1
22 1 T 1 ÿ
ÿ
ÿ
(4.18)
ÿ
; z) = C ( z) Q
L ( ÿ, ÿ ÿ, ÿ, ÿ
2
Exp ÿ zQz
ÿ
, xy ÿ
ÿ 2 ÿ
1
ÿ ,ÿ ÿ, 2
,ÿ 2
; z) C (z) Q z Q zT2 1
ÿ
yoÿ( ,
=ÿ
1 en ÿ
(4.19)
X y 2
Esta expresión es altamente no lineal en los parámetros y, por lo tanto, solo puede maximizarse
utilizando algoritmos numéricos (ver, por ejemplo, LeSage, 1998) para obtener estimadores de
máxima verosimilitud. La probabilidad así derivada también constituye la base para construir
varios procedimientos de prueba de hipótesis, como mostraremos en la siguiente sección.
Como dijimos en la Sección 3.4, las pruebas generales más populares utilizadas en econometría
se basan en las tres estadísticas asintóticamente equivalentes derivadas del concepto de
verosimilitud, a saber, la razón de verosimilitud (LRT), la prueba de Wald (WT) y la prueba del
multiplicador de Lagrange. (LMT). Ahora que hemos especificado completamente la hipótesis
alternativa a la hipótesis nula de independencia espacial en el modelo de regresión, estamos en
condiciones de aplicar estos procedimientos generales a este caso particular.
Este es el objetivo de la presente sección.
En efecto, una vez reespecificado el modelo (como se indicó en la Sección 4.3.3.1 anterior),
el sistema de hipótesis puede obtenerse explícitamente contrastando la hipótesis nula H0 : con
= ÿ =0 ÿ ÿ0
0 : En ,términos de la probabilidad que tenemos, bajoÿel0;
ÿ ÿ
la hipótesis alternativa
0 H1 nulo:
1
2 2
ÿ
ÿ 1 T ÿ
1 ÿ
; z) = C ( z) Q
2
L ( ÿ, 0 ÿ X ,0 ,ÿ y ,0 0 exp ÿ
ÿ
ÿ z Q z0 (4.20)
ÿ 2 ÿ
2
siendo Q0 la matriz de varianzas-covarianzas que, en este caso, es Q0 = Q ÿ( 0, ÿ ,ÿ
2x ,0 y ,0
)
ÿ
1
ÿ ÿ0ÿ ÿI ÿ ÿ
=ÿ
ÿ
yo
* ÿ
ÿ
ÿ ÿ , lo que implica independencia entre las observaciones.
0 ÿ
ÿ
ÿÿ ÿ ÿI ÿÿ
1 1 en 1
2 2 T
; z) = C ( z)
ÿ
ÿ ,ÿ Q z0 Q z
ÿ ÿ
yo ( ÿ 0, X ,0 y ,0 0 (4.21)
2 2
1
22
ÿ
ÿ 1 T 1 ÿ
L (ÿ, ÿ ÿ, ÿ, ; z) = C ( z) Q
ÿ
2
xy
ÿ , exp ÿ
ÿ
ÿ zQz (4.22)
ÿ 2 ÿ
2 2
con Q = Q ( , ÿla ÿ ,ÿ ÿ, X
,ÿ y ) proporcionada por la Ecuación (2.62). En consecuencia, bajo
hipótesis alternativa, la log-verosimilitud se convierte en:
Machine Translated by Google
22 1 1 en T 1
) = ( z)
ÿ
ÿ , ÿ ÿ, ÿ , ,ÿ ; zc QzQz2 (4.23)
ÿ ÿ
yo (
xy
2
Por lo tanto, se puede derivar fácilmente una prueba de independencia espacial a partir del
criterio de prueba de razón de verosimilitud, simplemente restando la diferencia logarítmica entre
(4.20) y (4.22). Esto lleva a:
Lÿ
( ;z)0 2ln
LRT = ÿ
(4.24)
L ( ÿz
; )1
con ÿ 0ÿ (ÿ 0 , ÿ 2
X ,0 ,ÿ ) 2, y
y ,0
ÿ1 ÿ
( ÿ, ÿ ÿ, ÿ ,
2
X ,ÿ
2
y ; z) . Sustituyendo (4.21) y
(4.23) en (4.24) obtenemos:
LRT = 2[ ÿ] ln
L ÿ0
( ; )Xlnÿ (L; ÿ1
) X=2[(
2 2 2 =
yo
ÿ 0,
ÿ
X ,0 ,ÿ y2 ,0 ; z) - yo (ÿ , ÿ ÿ, , ÿ X ,ÿ y ; z)]
= en [ Q +z Q z Q
en z Q z]
0
T
0
ÿ
1
ÿ ÿ
T ÿ
1
(4.25)
Yi = ÿ x yo
+ ui (4.26)
ÿ
Yi = ÿwx + x +yoÿwy
j + ÿu i ÿ yo j i (4.27)
ÿ ÿ
yo yo
0
]
(4.28)
r RSS0
A partir de la Ecuación (2.77), la probabilidad del modelo CAR multivariante viene dada por:
1
ÿ 1 T 1 ÿ
L ( ) ,µ ÿ z ;= C ( zÿ
ÿ
2
) Exp ÿ zµÿzµ (4.29)
ÿÿ ÿ
ÿ 2 ()()ÿ ÿ
1 1 en T 1
(µ , ÿz ; )
ÿ
yo
=ÿ
C( z
) ÿ z ÿÿ ()()
z ÿ ÿµ
µ2 (4.30)
2
1 1 1
ÿ ,
ÿ ÿ ÿ
norte
(4.31)
(ÿ ÿ, , Vz ; )= C( z
) + 1 en ÿ - ÿ +1
IVWV 1
ÿ
ÿ ÿ
yo
2
norte
1
ÿ 1(x )(
V x)
T 1
norte
ÿ ÿ +ÿ
ÿ
i
ÿ
i
(4.32)
2 i=
1
+ ÿ ÿ1
norte
i=
(x iV ÿ ÿ )wTÿ
ÿ
1
(X j ÿ
ÿ ).
2 jji : ÿ yo
A1 T
yi= ÿ x +yo ui
A1 y = Xÿ + u
Si usamos tal especificación, sabemos (de la Sección 4.2.2) que la hipótesis del muestreo
aleatorio simple se incorpora en el componente de error al suponer que se distribuye
condicionalmente como un ruido blanco espacial gaussiano:
A2 (u X) uf ÿ N(0, ÿ2In)
T
yo y = ÿ xi + ei (4.29)
norte
yo
_
= ÿ
ÿ weu ij ji + (4.30)
j =1
yo
ÿ
donde ui es un ruido blanco espacial gaussiano, wij ÿ W y W una matriz de pesos correctamente
definida.
En notación de matriz compacta, las Ecuaciones (4.29) y (4.30), se convierten respectivamente
y = Xÿ + e (4.31)
mi = ÿ nosotros + tu (4.32)
Dado que u es un campo de ruido blanco gaussiano, e también es gaussiano. Bajo estos supuestos,
el problema se transforma en una situación donde es necesario hacer inferencia sobre el vector de
parámetros desconocidos ÿ ÿ (ÿ, ÿ2 , ÿ) y, con la
característica adicional de normalidad introducida por la hipótesis sobre el campo aleatorio u, la
violación de la hipótesis del muestreo aleatorio se reduce al estudio de la autocorrelación espacial
presente en la componente no sistemática.
Sabemos (de la Sección 2.4.3.1) que un proceso SAR se caracteriza por un
matriz de varianza-covarianza:
1 ÿ
T
VIB=ÿIB
(-)(-) (4.33)
2=
con B ÿ ÿ ij}, ÿij = ÿ wij y ÿ una matriz diagonal del elemento genérico ÿi
{ Var(ui ).
2
Nos referiremos a esta matriz como V (ÿ, ÿi ) para hacer referencia explícita a = ÿ2
2
los parámetros de interés inferencial. En el caso de varianzas constantes ÿi ,
la matriz V en la Ecuación (4.33) se convierte en
VV( = ÿ ÿ,
2
ÿ
2
IBIB ) = 1( ÿ ) ( ÿ )
ÿ
ÿT
(4.34)
e = y – Xÿ (4.35)
y, dado que se supone que e se distribuye como un campo aleatorio SAR gaussiano, obtenemos
fácilmente la función de verosimilitud dada por:
1
2 2
ÿ
1 2 1 mi ÿ
ÿe ,; ) = C ( e) (V
2
ÿ
TE ( ÿ, ÿ ) ÿ (4.36)
ÿ V2 ÿ
1
ÿ
ÿ 1 T ÿ
, ) (=, ) (cy ( y Xÿ V ( ),
2 2 21 (4.37)
L ( ÿ, ÿ 2
ÿ
, ÿ ;y XXV , )ÿexp ÿÿ ÿÿ ) ( y Xÿ ) ÿ
ÿÿ ÿ
ÿ ÿ
2
2 =
L ( ÿ, ÿ , ÿ ;y X, )
1
(4.38)
1
()
norte
ÿ
[ ) ] 1 ( y Xÿ ÿ
ÿ
= C ( y, )X 2 1 T T 1 T
ÿ ÿ
( IBIB
)( ) 2
ÿ ÿ ÿ ÿ
ÿ 2 ÿ ÿ
Exp ÿ
ÿ
( ) ( ) ( y XÿIBIB
ÿ ÿ ÿ ÿ
) ÿ
2
ÿ 2ÿ ÿ
2
yoÿ( ÿ, , ÿ;y ,X ) = (4.39)
1
]( 1
norte ÿ
2 ÿ
1 ÿT T ÿ
1 ÿT
y XC (ÿ ,2) = en(ÿ) 1 en ( 2yo ÿBI) ÿB
( ÿ2 ) ( Xÿ
) ( y) ÿ Xÿ
) [(I ÿBI ÿB y ÿ )
ÿ
2
ÿ
y i= ÿx + ei i
(4.40)
*
norte
yo
= ÿÿ + =
weu leu
yo i ÿ [ ] yo
+ i
(4.41)
_ j
j =1
yo
ÿ
mi - yo ÿL [e ]= uii
(4.42)
y finalmente:
(1 ÿ
ÿ ly ) =ÿ
(1 ÿ L )ÿx (1
+ ÿ yo ÿ le ) =
i i
y Ly=ÿxÿ ÿLx u+ ÿ ÿ +
i i i i i
* *
norte norte
y= ( ÿ + ÿx + ÿwyj + tu )
i ÿ ÿ ÿwx yo i ÿ yo j i
(4.45)
j =1 j =1
Bajo la hipótesis alternativa, la verosimilitud del modelo se obtuvo en la Ecuación (4.38) y está
dada por:
2
L ( ÿ, ÿ ,ÿ
; ,y X ) =
1 (4.46)
norte
ÿ
1 1 ÿ
(ÿ 2 ) 2 ( IBIB 1 T ÿ
[ ) T 1 T
]
ÿ ÿ
= C ( y, )X 2
ÿ ÿ ÿ ÿ
)( ) Exp ÿ ( ) ( ) ( y XÿIBIB ( y Xÿ
ÿ ÿ ÿ ÿ ÿ ÿ ÿ
2 ) ÿ
ÿ 2ÿ ÿ
2
yoÿ( ÿ, , ÿ;y, )X=
n 1 1
( y ÿ Xÿ I )ÿBI
[ (ÿB ) ) ( ]
ÿ
2 ÿ
1 ÿT T ÿ
1 ÿT
y XC (ÿ ,2) = en ÿ 1 en (yo
) ( ÿBI
) ÿB ÿ 2 ÿ Xÿ ) (4.47) ( y
ÿ
2
2ÿ
norte
1
, ÿ Xy ; , ) = ( , )Xcy(ÿ )2
2 2 T ÿ
ÿ
ÿ
L 0 (ÿ exp ÿ
ÿ
( Xÿ
) ( y) ÿXÿ y
ÿ ÿ
ÿ
(4.48)
2
ÿ 2ÿ
2 n 2 1 T
yo
( , ; , cy
0 ÿ )(,)ÿyX=X- en ÿ ÿ
( y) ÿ( yXÿ
ÿ Xÿ
) (4.49)
2
2 2ÿ
A partir de las ecuaciones (4.47) y (4.49), se puede obtener fácilmente una prueba de razón de
verosimilitud para la hipótesis de independencia espacial como:
LRT= ÿ l 2[ (ÿ ÿ, 2
,ÿ; y, X) ( ,ÿl,ÿ;0 y,
ÿ ÿX)]
2
(4.50)
LRT =
1
] 1( y Xÿ )
ÿ norte
2 1 T
[ T 1 T
ÿ
=ÿÿ
2ÿ en ÿ ÿ
1 en ( IBIB )) 2
ÿ
(
ÿ
ÿ
ÿ
( ) ( ) ( y XÿIBIB
ÿ
)
ÿ
ÿ
ÿ
ÿ
+
2
ÿ 2 2ÿ
n 1 T (4.51)
+ en ÿ 2+
2 (ÿÿy) Xÿ
ÿ y Xÿ ( ÿ )
2 2 ÿ ÿ
Machine Translated by Google
1 1
]
ÿ
1 ÿT T 1 ÿT
LRT en
= ÿ(yo
) (ÿBI
) ÿB ÿ
ÿ ÿ
2
( ÿB) ()
( y ÿ Xÿ) I[ ÿBI ( y ÿ Xÿ )
ÿ
1 T (4.52)
+ 2 (Xÿ
) ( y ÿ Xÿ )
ÿ
2
PESO = ˆ 2 [a + b – c / norte] (4.53)
ÿ
LMT = (y ÿ)(Xÿˆ)W y ÿ Xÿ ˆ
T
(4.54)
2
j ÿ
con J = tr +[(W W )W] T . Al igual que el LRT, tanto el WT como el LMT son asintomáticos.
distribuida tóticamente como una ÿ2 con un grado de libertad.
Hemos visto en las páginas anteriores que, siguiendo el enfoque basado en el modelado
SAR del componente no sistemático, es posible obtener estimadores de máxima
verosimilitud utilizando la función de verosimilitud derivada de la Ecuación (4.36). En este
caso, sin embargo, también es posible utilizar los estimadores basados en los Mínimos
Cuadrados Generalizados (GLS) como alternativa.
Primero, recordemos que, en este caso, el modelo se especifica como:
yi = ÿTxi + ei _ (4.55)
y = Xÿ + e (4.57)
Machine Translated by Google
mi = segundo mi + tu (4.58)
T
gls (ÿ) = (y ÿ ÿX) V (yÿ1 ÿ ÿX) (4.59)
ˆ
T T
] 1 (yo
T
ÿ B)T(yo ÿ B)y
ÿ
*
X = (I- B)X (4.61)
*
Y = (I- B)Y (4.62)
ˆ
= ( *T * )1 *T *
ÿ
y = Xÿ + e (4.64)
e = ser + tu (4.65)
y = Xÿ + e (4.69)
(4.70)
En un segundo paso, los residuos así obtenidos se utilizan para derivar una estimación de ÿ
(el parámetro que define la autocorrelación espacial del componente no sistemático en la
ˆ
ecuación suplementaria), digamos (1) , a través de la ecuación:
ÿ
)( 1 T
ÿ
ˆ (1) = (camiseta
( 1 ) (1)
e Nosotros
) (4.72)
ÿ (1) (1)
T T 1 T
ˆ ]
ÿ
(2)
(4.73)
ÿ = [ XI ÿ( BI ÿ )BX
( [X (I) ÿ) B)y]
con B = ˆ(1)W .
ÿ
Luego, los tres pasos se iteran de modo que, en el k-ésimo paso, tenemos:
ÿˆ kf ( ) = [ÿˆ ( kÿ 1)
] (4.74)
ÿˆ k (1)
+
[ˆ k ( )] (4.75)
=gÿ
ˆ ˆ (4.76)
k() ( kÿ 1)
ÿ ÿÿ
Machine Translated by Google
ˆ ˆ
ÿ k ( ) ÿ ÿ ( kÿ
1) (4.77)
ˆ ˆ
En cada paso, por lo tanto, los nuevos ÿ (k) y ÿ k()
son los que minimizan
valores de las sumas de los cuadrados de los residuos condicionan el valor
anterior. Se puede probar que la técnica eventualmente converge a un mínimo
local (para la prueba en el análisis de series de tiempo ver Sargan, 1964 y
Oberhofer y Kmenta, 1971). Cabe señalar, sin embargo, que no hay garantía de
que este mínimo local sea también el mínimo absoluto deseado.
4.3.5.1 Introducción
Los dos modelos presentados en las secciones anteriores (es decir, el modelo CAR bivariado
y el SAR residual) representan una forma formal de abordar el problema de la dependencia
de datos espaciales reemplazando el paradigma clásico de muestreo aleatorio con dos
modelos alternativos de campo aleatorio. En este sentido, los dos modelos proporcionan un
trasfondo probabilístico sólido para un modelo de regresión lineal espacial.
Otra alternativa, particularmente popular en la literatura econométrica espacial, no se
basa en ningún modelo de campo aleatorio específico. Consiste más bien en un recurso
técnico que busca dar cuenta de la dependencia espacial entre los datos agregando el
valor retrasado espacialmente de y como una variable independiente adicional de manera
similar a la inclusión de un término serialmente autorregresivo en un contexto de serie
de tiempo. Este modelo a menudo se denomina modelo de retraso espacial (p. ej., en
Anselin y Bera, 1998), modelo autorregresivo espacial regresivo mixto (Anselin, 1988) o,
por último, modelo autorregresivo espacial o modelo SAR (LeSage, 1999). ). Como ya
se observó en la Sección 4.3.4.1, esta última definición es particularmente engañosa
porque el acrónimo SAR se usa en estadísticas espaciales para indicar un campo
aleatorio específico: el campo AutoRegresivo Simultáneo (ver Sección 2.4.3.1). Debido
a la popularidad de este modelo, esta sección se centrará en describir esta especificación
alternativa de un modelo de regresión espacial.
norte
A1 T
yo y =ÿ x i +ÿ ÿwy + u yo j i
j =1
A2 (u X) uf ÿ N(0, ÿ2 In)
y = Xÿ + ÿ wy + tu (4.78)
y = ÿ Wy + ÿ (4.79)
Machine Translated by Google
como:
y(
=ÿ
IW ÿÿ ) ÿ1
(4.80)
Ahora es posible derivar las propiedades del campo aleatorio y así generado (y, en
consecuencia, la probabilidad asociada con un conjunto de observaciones empíricas) de
la siguiente manera.
Para empezar, el valor esperado del campo aleatorio y está dado por:
1 1 (4.81)
)
ÿ ÿ
mi(=) mi - y [(IWÿ ÿ] () =ÿ
IW Xÿ
ÿ
T 2
, ÿ) =
2
(yo - ÿ WI )- ( 1
ÿW)
T
ÿ ÿ
mi yy
()=V( ÿ ÿ (4.82)
2
L (ÿ , ÿ, ; )ÿ y =
(4.83)
1
1
][ T
ÿ
2 ÿ
= CV 2 ÿ
[) y IW( Xÿ ÿV y IW 1Xÿ 1 1
ÿ ÿ ÿ
ÿ
( y) ( , ) Exp ÿ ÿ
ÿÿÿ ÿÿ
( ÿ )
ÿ 2 ]ÿ ÿ
2
yo
(ÿ , ÿ, ÿ ;y) =
(4.84)
1 1
=ÿ
C( y
) V ln ÿ
2
,ÿ )
ÿÿÿ
[) y IW( Xÿ Vÿ y IW 1Xÿ
ÿ
][ T ÿ
1
ÿÿ
( ÿ )
ÿ
1
]
(2 2
2
V Recordando la Ecuación (4.82), el determinante de la matriz (ÿ , ÿ ) puede ser
Escrito como:
,ÿ ) = (yo - ÿ WI )- ( ÿ W =) (yo - ÿ WI )- ( )
2 2 1 ÿT 2 1 ÿT
V (ÿ
ÿ ÿ
ÿW
norte
ÿ ÿ
Machine Translated by Google
)( 1 ÿT
) )( 1 ÿT
)
ÿ ÿ
expresado como:
2
ÿ
2
V (ÿ , ÿ) = ÿ
2 norte
(yo - ÿ W ) (4.85)
ÿy =
2
yo
(ÿ ,ÿ ,;)
= C( y
)
ÿ
1 en ÿ ( 2 norte
IW ÿ
ÿ
ÿ
2
)+
2
1 1
][
T 2 1 T
][ 1 1
]=
ÿ
ÿ ÿ ÿ ÿ
ÿÿ
( y IW Xÿ ÿ ) ÿ ( IWIW
ÿ
) ( ÿy IW Xÿ
ÿ
ÿ )
ÿÿ
( ÿ )
ÿ[
2
= C( y
ÿ
norte
en ÿ
2
+ ÿen
+ IW
) ÿ
2
1
ÿ
2ÿ 2
[]( y IW[]( Xÿ IWIW) y IW Xÿ (
ÿÿ
ÿ
ÿ
1 T
ÿ
ÿ )
T ÿ
ÿ )
ÿÿ
( ÿ )
ÿ
( ÿ ) ÿ 1) -
( IW Xÿ] = (yo - ÿ W)y ÿ Xÿ , finalmente obtenemos:
ÿ ÿÿ
y, desde IW [y
2
yo (
ÿ , ÿ, ; ) ÿ= y
2 1 T
[(I][ÿ ]W)y (4.86)
norte
= yCÿ( ) en ÿ en ÿ W ÿÿ 2
+ yo ÿ ÿ Xÿ (I ÿ W)y ÿ Xÿ ÿ
2
2 ÿ
4.3.5.3 Estimación
Una vez que se ha obtenido el log-verosimilitud del modelo de regresión lineal de retraso
espacial , podemos maximizarlo para obtener estimaciones de máxima verosimilitud de los
parámetros de interés. Desafortunadamente, esto no se puede lograr analíticamente porque la
Ecuación (4.86) es altamente no lineal en los parámetros y no existe una solución exacta para
el problema de maximización. Además, no se puede utilizar un algoritmo de optimización
simplex univariante simple porque esto deja sin resolver el problema de encontrar una estimación
2
del parámetro, como lo señaló LeSage (1999).
ÿ
Machine Translated by Google
(4.87)
y = Xÿ0 + u0
1 tonelada
.
=( y )
En un segundo paso, construimos un segundo modelo parcial haciendo una regresión de la
variable espacialmente rezagada Wy solo en las variables X
Wy = Xÿ L (4.88)
+ uL
Wyˆ En
T 1 T . ÿ
ˆ (4.89)
0 0
uˆ = y ÿ Xÿ
y
ˆ ˆ (4.90)
uL Wy= ÿXÿ L
En el cuarto paso, usamos los residuos estimados obtenidos en las Ecuaciones (4.89) y (4.90)
para construir el logaritmo de verosimilitud parcial:
ˆ ˆ ˆ 1 ˆ ˆ ˆ ˆ
)( T
norte
yo ( ÿ ; tu 0, L ) = C (ˆ,
tu 0
L )
ÿ
ÿ en (
tu
0
ÿ
ÿ uuL 0
ÿ
ÿ ÿ )L tu ÿ +en
yo ÿ ÿ
W (4.91)
2 ÿ
ÿ norte
ÿ
ˆ
y lo maximizamos para obtener una estimación de , say .
ˆ ÿ 2 ÿ
Finalmente, usamos para obtener las estimaciones finales de ÿ y ÿ , dado por:
ÿ
Machine Translated by Google
ˆ 1
ÿ
2 = (tu 0 ÿ
ÿˆuˆ L )(T tu
0
ÿ
ÿˆuˆ ) L (4.92)
norte
ˆˆ
ÿˆ( =ˆ ÿ0 ÿ ÿ ÿ L ) (4.93)
respectivamente.
2
yo (
ÿ ,ÿ , ; ) = ÿ y
norte
2
1 T
C( ) ln = y ÿ 2 ÿ en ÿ W ÿÿ 2
+ yo
2
[(I][ÿ ]W)y
ÿ ÿ Xÿ (I ÿ W)y ÿ Xÿ (4.94)
ÿ
ÿ
Bajo la hipótesis nula, por otro lado, tenemos que H0 : por lo tanto, la ÿ = 0 y,
probabilidad logarítmica se puede expresar como:
1
ÿÿ y ( , ; )
l0 =
2
C ( y) ÿ2
norte
enÿ 2 ÿ
2ÿ 2 [ ] y ÿ Xÿ y ÿ Xÿ][
T
(4.95)
1
ÿ ÿ Xÿ (I ÿ W)y][ÿ Xÿ ÿ
ÿ norte
2 T
LRT =ÿÿ
2ÿ en ÿ en ÿ W ÿÿ 2
+ yo 2
[(I]+ÿ W)y
ÿ 2 ÿ
n 1 T ÿ
+ en ÿ + 2 [y][ÿyXÿ
ÿ Xÿ (4.97)
2 2 ÿ ]ÿ ÿ
ÿ 1 T
1 ÿ
LRT 2=en
ÿÿ yo ÿ W + ÿ ÿ
2
[ ] yo
()) ÿÿW y ÿ Xÿ yo ÿ][W( y ÿ ÿXÿ
ÿ
2
ÿ
y XÿT
[y][Xÿ ÿ
(4.98)
ÿ ÿ ]ÿ ÿ
Machine Translated by Google
norte
A1 yi =ÿÿij _ (1) + wy j x
T
i
+ mii (4.99)
j =1
yo
ÿ
estandarizada por filas) y e es una matriz espacial autorregresiva campo aleatorio tal que:
norte
A1 yo
_
= ÿ
ÿ (2)
+ _
wij euj i (4.100)
j =1
yo
ÿ
A2 (u X) uf ÿ N(0, ÿ2 In)
y = Xÿ + Wÿ y +(1)e (4.101)
(1) + nosotros+ tu
(2) y = Xÿ +ÿW y ÿ (4.103)
(1)
y, sustituyendo e = y – Xÿ + W y enÿla Ecuación (4.101), tenemos:
(1)
y = Xÿ + W ÿy ÿ [y (2)
+W
ÿÿ
Xÿ W y] ÿ
(1) + tu =
(1) (2) (2) (1) (2)
= Xÿ + Wÿy + W y ÿ Wÿ Xÿ ÿ WW yÿ + u ÿÿ (4.104)
Se pueden analizar dos casos notables. La primera se refiere al caso donde W(1)
y W(2) no tienen ningún elemento en común (por ejemplo, cuando se refieren a diferentes
órdenes de contigüidad). En tal caso, tenemos que W(1) W(2) = 0. La ecuación (4.104) se
convierte entonces en:
2
ÿ ÿÿWXÿ ÿ Wÿy + u
y = Xÿ + ( + )Wy ÿÿ (4.106)
(1)
(Yo ÿÿ W )y = Xÿ + e (4.107)
(2) 1
=ÿ
ÿ tu
( ) ÿ e IW (4.108)
(1) (2) 1
(IW yÿXÿ IW )u
ÿ
=+ÿ ( ÿ )- (4.109)
y finalmente:
Machine Translated by Google
(2) (1)
(4.110)
1
2 ÿ1u
T V u1
) = C ( uV
ÿ
L (ÿ ; tu
ÿ
) 2 ÿ exp
ÿ
(4.111)
ÿ
ÿ
2 ÿ
ÿ
2
con V la matriz de varianza-covarianza del campo aleatorio u. Desde VI = ÿ , nosotros
2n 2n
tener esa V= ÿ yo = ÿ . Además, la inversa de la varianza-covarianza
ÿ1 = ÿ2
matriz es V ÿ yo . Por lo tanto
1
1
(ÿ ) 2 Exp ÿ ÿ
ÿ
2 2 T
L (ÿ ) = C ( tu
; tu tu 2
norte
) (4.112)
ÿ
ÿ ÿ
ÿ 2ÿ ÿ
ÿ tu (2)
J= =ÿ
IWI ÿ ÿ
ÿ W(1) (4.113)
ÿy
1
2
yÿ, ; ) = C ( y) (ÿ 2
)
ÿ
L ( ÿ, ÿ ÿ , norte
2 ÿ
IWIW (2) (1)
ÿ
ÿ ÿ
(4.114)
ÿ 1 T
{( IWIW (2) [ (1) } ] {( (2) [ (1)
Exp ) ( ÿ y Xÿ IWIW
)( yÿXÿ ) ÿ ÿ )
ÿ ÿ ÿ ÿ ÿ ÿ ÿ
2 ÿ } ]ÿ
ÿ
ÿ 2ÿ ÿ
2 norte
2 (2) (1)
yo ( , ÿ ÿ, ÿ yÿ, ; ) = C( y
)
ÿ
en ÿ + ÿ IWIW
+ ÿen ln ÿ ÿ
2
(4.115)
{( IW [ IW [
1 T
ÿ
2ÿ 2
ÿ ÿ
(2)
)( IW y Xÿ {
ÿ
ÿ
(1)
)
ÿ
]} (
ÿ
ÿ
(2)
)( IW yÿ Xÿ
ÿ
(1)
)
ÿ
]}
Como en el caso del modelo de rezago espacial considerado en la Sección 4.3.5, la Ecuación
(4.115) no puede maximizarse analíticamente para propósitos de estimación, debido al alto grado
de no linealidad en los parámetros contenidos en la expresión. Como consecuencia, una vez más
tenemos que confiar en un enfoque de verosimilitud de perfil obtenido
Machine Translated by Google
(2)
(Yo ÿÿ W )y = Xÿ + ÿ (4.116)
T
( ÿ ÿ WI (1)
usando ÿ = yo - )( ÿ W(1) ) como matriz de pesos, obteniendo así:
ˆ
ÿ= ()(
X ÿX)X ÿ IW y
T
ÿ
1 T ÿ
ÿ (2)
(4.117)
En segundo lugar, definimos los residuos estimados del modelo (4.116) como:
ˆ ˆ
ÿ(
=ÿ
IW yÿXÿ
(2) ) ÿ
(4.118)
2
ÿˆTÿˆ
ÿ = (4.119)
norte
l ( ÿ, , )ÿ( )yy =c
ln ln +ÿ ÿ
IWIW (2)
+ ÿ
ÿ
(1)
+
(4.120)
1 ˆ T ˆ
ˆ 2 {( IW [ ÿ
(2) (1) ]} (2) (1) ]}
) (IW yÿXÿ { ) ( IW [ ÿ ) (IW yÿXÿ )
ÿ ÿ ÿ ÿ ÿ ÿ ÿ
2ÿ
2
n
2
1 T
ÿ yÿ, ; ) = C ( y) - 2 en ÿ ÿ
(4.121)
l0 ( [ ][ ] y ÿ Xÿ y ÿ Xÿ
2ÿ 2
Machine Translated by Google
2
LRT= ÿ l 2[ ( ,ÿ,ÿ;y)
ÿ ( ,ÿ;y)] 2ÿl ÿ
0
1 T
=ÿ
2ln 2ln ÿ
(2)
IWIW ÿy Xÿ y Xÿ
ÿ ÿ
ÿ
(1) ÿ
2 [ ÿ
][ ÿ
]+
ÿ
(4.122)
{( IW [ IW [
T
+
ÿ
1
2
ÿ
ÿ
(2)
)( IW y Xÿ {
ÿ
ÿ
(1)
)
ÿ
]} (
ÿ
ÿ
(2)
) (IW y Xÿÿ
ÿ
(1)
)
ÿ
]}
2
una cantidad que, como es sabido, se distribuye asintóticamente como x con dos grados
de libertad.
4.4.1 Introducción
Esta sección se centrará en las violaciones relacionadas con el modelo de probabilidad que pueden
surgir en el modelo de regresión básico presentado en la Sección 4.2.
Como dijimos en la Sección 4.2.1, la suposición fundamental sobre el modelo de probabilidad
es la de normalidad, todas las demás hipótesis se siguen como meras consecuencias. Esta
hipótesis puede expresarse en forma de multinormalidad de la distribución conjunta (si usamos la
especificación condicional del modelo de regresión lineal como en la Sección 4.2.1) o,
alternativamente, en forma de normalidad de la distribución condicional de el componente no
sistemático dado el conjunto de valores observados de las variables independientes (si adoptamos
la especificación de libro de texto estándar como en la Sección 4.2.2). Dada su importancia, es
sensato analizar las violaciones de las hipótesis del modelo de probabilidad a partir de este
supuesto básico (Sección 4.4.2). Las dos secciones restantes de este capítulo (4.4.3 y 4.4.4) se
ocuparán de la violación de la hipótesis de la homocedasticidad y la violación de la hipótesis de la
invariancia espacial de los parámetros, respectivamente.
4.4.2 Normalidad
4.4.2.1 Generalidades
parece ser la única alternativa viable a los estimadores de máxima verosimilitud ya que los
estimadores MCO no pueden explotarse (como es habitual en las regresiones no espaciales)
debido a la presencia de términos espacialmente rezagados entre las variables explicativas. Esta
sección considerará primero el problema de probar la normalidad en una regresión espacial
(Sección 4.2.2.2) y luego pasará a considerar posibles soluciones a la violación de esta hipótesis
(Sección 4.2.2.3).
La prueba de Kolmogorv-Smirnov es una prueba general para medir qué tan bien se ajusta un
conjunto de observaciones empíricas a una distribución de probabilidad dada. Se basa en la
estadística de Kol mogorov dada por:
k = sorber F z( F) z ( )0
norte
ÿ
(4.123)
ÿÿ< <+ÿz
2
ÿ norte
ÿ
ÿÿ
ÿ Arizona
i (i ) ÿ
ÿ
SUDOESTE
= ÿ i =1 ÿ
(4.124)
norte
ÿ ( zz i
ÿ
)
2
i =1
siendo
(i) z el estadístico de i-ésimo orden, z la media muestral de la variable Z y ai a
conjunto de coeficientes tabulados. Los valores pequeños de las estadísticas SW son críticos en el
procedimiento de prueba (Kendall y Stuart, 1979).
La prueba de Bera-Jarque utiliza la familia de distribuciones de Pearson como
alternativa paramétrica al campo aleatorio gaussiano de ruido blanco. La familia de
funciones de densidad de Pearson (Kendall y Stuart, 1979) se caracteriza por el valor
esperado, la varianza y por el tercer y cuarto momentos estandarizados definidos
ÿ = µ3 y ÿ = µ 4 como , respectivamente,
µ estandarizado
siendo el momento
de orden r-ésimo.
central no
3
ÿ
3 4
ÿ
4 r
ˆ
Consideremos ahora el análogo de muestreo de y definido como: ÿ y ÿ
4 , di 3
ÿ
ˆ ˆ 3
ÿ
4 , basado en los residuos de regresión, digamos ui ,
1 norte
ˆ3
ˆ
ÿ tu
i
=
norte
i=1
ÿ
3
(4.125)
3
ÿ1 norte
ˆ2ÿ
ÿ
ÿ
ÿ tu
i ÿ
ÿ
ÿ norte
i =1 ÿ
1 norte
ˆ4
ˆ
ÿ tu
i
=
norte
i=1
ÿ
4 2
(4.126)
ÿ1 norte
ˆ2ÿ
ÿÿ
ÿ tu
i ÿ
ÿ
ÿ norte
i =1 ÿ
ˆ ˆ
Se sabe que, bajo la hipótesis nula de normalidad,
norte
ÿ y norte
( ÿ 4 -3)
3
6 24
son asintóticamente independientes y ambos asintóticamente distribuidos como
distribuciones normales estandarizadas (Kendall y Stuart, 1979). Como consecuencia,
su suma al cuadrado se distribuye asintóticamente, bajo el nulo, como un ÿ² con 2 grados
de libertad. Esto proporciona a la prueba de Bera-Jarque una forma operativa:
ˆ ˆ 2
2
(ÿ
norte norte
ÿ
BJ = ÿ + 4
ÿ
3 (4.127)
ÿ 3
24 ÿ)ÿ
ÿ6 ÿ
Machine Translated by Google
ÿ
3k {[zi][- mi
= mi (]} 3
) (zi
T 1
) V z -i mi z i
ÿ
(4.128)
T 1
= mi
{[ ][ ]}zi
4 - mi
( ) zi V z -i mi (z)i
ÿ
ÿ
4k (4.129)
siendo
i z las observaciones n-dimensionales de la variable Zi y V la matriz de varianza-
covarianza espacial.
El autor también deriva el resultado de que, bajo la hipótesis nula de multinormal
norte
2 k(k +1)(k + 2) con grados de
idad, la distribución limitante de
6
ÿ
3k
es un x libre
6
norte [ÿ 4, k
+ k ( 2) ÿ ]
dom, mientras que la distribución limitante de es el estándar normal
8k(2) +
distribución. En el caso univariante, estos se reducen a la prueba habitual de asimetría y
curtosis (ver también Mardia, 1986, para referencias).
Las pruebas anteriores de multinormalidad de k-variante suponen que podemos
disponer de más de una réplica de la variable aleatoria en cada ubicación. Sin embargo,
en econometría espacial, casi invariablemente, tenemos una única observación en cada
ubicación en el espacio. Por lo tanto, los métodos descritos no son aplicables y la única
alternativa para probar la normalidad en un modelo de regresión condicionalmente
especificado es aplicar una de las pruebas mencionadas anteriormente para la normalidad
univariante al componente no sistemático del modelo proporcionado por ui = Yi – E (Yi| Xi = xi).
Transformaciones a la Normalidad
La transformada de Box-Cox (Box y Cox, 1964) proporciona una expresión general para una
clase de transformaciones de datos a la normalidad, dada por:
d
* Z ÿ1
Z = (4.130)
d
ÿ ÿ
logit( ) lni ÿ=
pag i T
ÿ ÿ
=+
ÿ ÿ x ÿ i
(4.131)
pag 1 ÿ
ÿ
pag i ÿ
Machine Translated by Google
T
Exp ÿ +x i
pag i
= E (Yi| ) Xi = P (Yi = 1| X i ) = (4.132)
[ +
1 experiencia ÿ
(( + x ) )yo T]
ÿ ÿ ÿÿ
Exp y i ÿ + ÿ ÿ yoyj
ÿ
ÿ + xT i
ÿ
ÿ ÿ
= = = ÿ ÿ jn yo ( )
ÿ ÿ ÿÿ ÿ
pr( Yi y Y yj , ÿ X
( ); i ) (4.133)
yo N yo j
ÿ ÿ ÿÿ
+ ÿ + ÿ ÿ + xT
1 experiencia
y
ÿ ÿ
ÿ
yo j i ÿ
ÿ
ÿ
ÿ
ÿ jnÿ yo ( ) ÿÿ ÿ
ÿ = un
donde, además de la notación anterior, representa ÿ Wijparámetro
, ÿ autorregresivo yo
ÿ pr( 1YY ==
i yj N ij , ÿ ( ); x
yo
ÿ
j T
logit( ) lni p ÿ=
ÿ
==
ÿ
= +ÿ ÿ ÿ j y + ij x i (4.134)
1 Pr( 1 YY
i yj N ij , ÿ ( ); X i
ÿ ÿ
jnÿyo
()
ÿ j ÿ
modelo, no hay forma cerrada disponible para la probabilidad resultante (Besag, 1974). Para
resolver este problema, Besag (1975) sugirió estimar los parámetros del modelo mediante el
procedimiento de máxima pseudoverosimilitud presentado en la Sección 3.2.3.
En este caso, Strauss e Ikeda (1990) demostraron que las estimaciones de máxima verosimilitud
del vector de parámetros ) son formalmente equivalentes aÿlasÿ estimaciones
( ÿ,ÿ, ÿ verosimilitud
de máxima de los
parámetros de una regresión logística donde una nueva variable retrasada espacialmente ( )
*
ly ÿ y , ij j con ÿ = ÿ introducción
es la
i yo wij ,
ÿÿjn=yo ( )
entre las variables independientes. Este resultado formal se obtiene aplicando un método iterativo
de mínimos cuadrados reponderados (ver Cressie, 1991). Como consecuencia, para estimar los
parámetros del modelo (4.134) en un contexto autologístico logístico, uno puede simplemente usar
las opciones de regresión logística disponibles en los paquetes de computadora estándar.
Tÿ1
l (V) y( )ÿ(Xÿ
ÿ =) y ÿ Xÿ (4.135)
2
ÿÿ 1 0 ÿ
ÿ 2 ÿ
0 ÿ 2 2
V = ÿ ÿ
= ÿ ÿ (4.136)
ÿ
0 ÿ
ÿ
2 ÿ
ÿ
ÿ
0 ÿ norte
ÿ
ÿ
T ÿ1 T ÿ1 T ÿ1 T ÿ1
ÿ1
ÿ H HT = (4.138)
*
y = Hy (4.139)
*
X = HX (4.140)
* * *
y X=ÿ tu + (4.141)
Al sustituir las Ecuaciones (4.139) y (4.140) en la Ecuación (4.142) se obtiene la Ecuación (4.137).
Por otro lado, si V es desconocido (como ocurre en la mayoría de los casos empíricos en aplicaciones
económicas) necesitamos estimarlo sobre la base de nuestra muestra.
Machine Translated by Google
White (1980) propuso una salida a este problema al sugerir que, para fines inferenciales,
no necesitamos una estimación de la matriz
ˆ V, sino una estimación de la matriz de
T
varianza-covarianza de ÿ , dado por el producto X VX tent . Una consistencia
estimador de esta cantidad es proporcionado por:
norte
T
1 2Posada
ÿ=
i
tu XX (4.143)
n1
RSS3 nk1 ÿ
GQ = (4.144)
RSS1 nk3 ÿ
Machine Translated by Google
ción es exacta en el caso de que podamos aceptar la normalidad y se cumple asintóticamente en el caso
de que la normalidad deba ser rechazada.
Un segundo procedimiento de prueba posible es la prueba de White (White, 1980).
Este autor sugiere que podemos usar el estimador consistente de la matriz de varianza-
covarianza de las estimaciones (reportado en la Ecuación (4.143)) para construir una
prueba de desviación de la homocedasticidad. Aunque la prueba de White es consistente
con respecto a una amplia gama de alternativas paramétricas, puede no ser muy poderosa
en muestras finitas (Davidson y MacKinnon, 1993).
Las regresiones artificiales ofrecen una tercera opción para probar la heteroscedasticidad
en la regresión lineal. Presentemos este enfoque refiriéndonos a la especificación de libro
de texto estándar del modelo de regresión lineal presentado en la Sección 4.2.2, donde
tenemos:
T
yi = ÿx +i tu i
uf X
(tuÿi N(0,
i
ÿ2 ) ) (4.145)
o equivalente,
mi(tú)2 Xÿ2 _
= (4.146)
i
2
E(uXi ) = h (ÿ + ÿQ
)eso
(4.147)
2 T ÿ
i ) = ÿX (
E(uX ) (4.148)
ÿ
i
2
mi (tú) X= ÿ X +1 ÿ X + +... ÿ (4.149)
i 1 yo 2 2 yo k Xki
con ÿT ÿ(ÿ1, ÿ2,... ÿk) un conjunto de constantes, X1 el término constante de la regresión y los
regresores. En el caso de la homocedasticidad, obviamente, tenemos: X Xk ,..., 2
T
1ÿ ÿ ÿ norte norte
Tÿÿ
norte
ÿ
PA = ÿ ÿÿ ÿ ÿ x yo F i ÿ xxii
_ xii _F ÿ (4.151)
2 ÿ i =1 ÿ
ÿ
ÿ ÿÿ
i =1 ÿÿ
ÿÿ ÿÿ
i =1 ÿ
ÿ
ˆ ˆ
ÿ tu ˆ ˆ
norte
ˆ
con f i
=ÿ
ÿ ˆi 1;ÿ (ÿ uy
i= ÿ ÿ i x
T
i )y ÿ
2
2 tu .
i
ÿÿ ÿ ÿ= =i 1
LMT =
ÿ ÿyÿ ÿ
( )(XW)ÿ
yÿX T
ÿ
2
j
ÿ
T
ÿ
(4.152)
ÿ ÿ
con J =estadísticas
tr + dure
[(Wsugerido
Wcontenidas
)W] Tpor Anselin
en
y se
lasdistribuye
Ecuaciones
(1987b)asintóticamente
considera
(4.151) la
y (4.152)
suma
como
deque
ÿ2
lasconducen
(1).
dosEl
pruebas
procedimiento
a la prueba
conjunta de heteroske dasticidad espacial e independencia expresada como:
2
T 1 T
ÿ ÿy ÿÿ x W
ÿ
T T
( )( ) ÿ ÿ y ÿ x
norte norte norte
1 ÿ
ÿ
ÿ ÿ ÿ ÿ
T
SHI xii _F ÿ ÿ
xxii _
ÿ ÿ xii _F +ÿ ÿ (4.153)
= ÿ2ÿÿÿ=
ÿ
2
i =1 ÿ ÿ i=1 ÿ ÿ i 1 ÿ ÿ j
ÿ
ÿ
ÿ
ÿ
Machine Translated by Google
Debido a los vínculos entre los dos problemas, las soluciones estándar al problema de
heterocedasticidad están estrechamente relacionadas con las de no normalidad ya discutidas.
En particular, se podrían considerar un par de alternativas.
La primera alternativa consiste en aplicar una transformación de normalización apropiada
del tipo discutido en la Sección 4.4.2.3. Como se señaló anteriormente, esto tiene el efecto
secundario de estabilizar la varianza. Las transformaciones inversa y logarítmica son ejemplos
de este tipo.
Una segunda alternativa es la de postular un campo aleatorio diferente, no normal, en el
modelo de probabilidad que capte mejor las peculiaridades de los datos empíricos.
Si seguimos esta estrategia, el siguiente paso es derivar una formulación explícita para el valor
esperado condicional E(Yi | Xi = xi) y la varianza condicional Var(Yi | Xi
= xi) y sustituya estas expresiones en los supuestos de PM2 y PM3 en el modelo de probabilidad.
Debe observarse, sin embargo, que los resultados en esta dirección hasta ahora han sido muy
limitados en la literatura debido a la complejidad de especificar campos aleatorios multivariados
(ya discutidos en el Capítulo 2) y debido a los problemas para derivar expresiones explícitas para
el condicional. media y varianza cuando nos alejamos del supuesto de normalidad.
Una suposición importante que se mantiene detrás del modelo de regresión lineal es que el
vector de los parámetros ÿ = (ÿ, ÿ2 ) es constante con respecto a las observaciones. En un
contexto espacial, esto implica la constancia de los parámetros cuando cambia la ubicación.
Claramente, esta hipótesis ocurre rara vez en casos prácticos: típicamente, diferentes sitios en
el espacio reaccionan de manera diferente a estímulos similares.
Machine Translated by Google
En este caso, el modelo estadístico (GM) se puede especificar a través de las ecuaciones:
T
yo y= ÿ1 X +i tu
1, yo
yo ÿ S1 (4.154)
T
yo y= ÿ2 X +i tu
2, yo
yo ÿ S2 (4.155)
para el segundo. En las Ecuaciones (4.154) y (4.155) los conjuntos S se definen como S1
={ }1 1,2,...,n
, y S2 = { } n1
y +1,n1
los vectores
+ 2,...,n
de los parámetros de ( ) 2
interés como ÿ1ÿ ÿ ,1 ÿ 1 y ÿ2ÿ ÿ(, 2 2ÿ )2. En una notación matricial más compacta,
Las ecuaciones (4.154) y (4.155) se pueden reescribir como:
y1 = X1ÿ1 + u1 yo ÿ S1 (4.156)
y2 = X2ÿ2 + u2 yo ÿ S2 (4.157)
ÿy X ÿ ÿ ÿ X ÿ ÿ ÿ 2 yo 0 ÿÿ
1 1 11 1
ÿ ÿ
ÿMVN ; ÿ
norte
1 ÿ
(4.158)
T 2
ÿ ÿ
X ÿ 0
ÿ
ÿy 2 2 ÿ
ÿ ÿ ÿÿ ÿÿ
Xÿ yo
ÿ ÿ
ÿÿ 2 2 ÿ ÿ
ÿ 2 norte
2 ÿÿ ÿ
donde, una
no matriz unitaria de dimensión ni - por - ni ntal- por
marco,
no
- nhay
(imatriz
la=hipótesis
cambios
1,2),
deyceros.
0 an
de Ique
En
es
estructurales
1 2 puede especificarse mediante el sistema de hipótesis:
Machine Translated by Google
H :ÿ = ÿ1 2
0
contra
H :1ÿ ÿ ÿ1 2
En el contexto del análisis de series de tiempo, Chow (1960) propuso una prueba basada en la
estadística:
1 nk 2
CH = SQRT SQR SQR 2 ÿ
ÿ ÿ
(4.159)
SQR SQR 2
1 + k
donde SQRT , SQR1 y SQR2 representan la suma total de cuadrados, la suma de cuadrados se
refiere solo a iÿS1 y la suma de cuadrados se refiere a iÿS2 respectivamente. Esta cantidad se
distribuye bajo H0 como una Fisher-F con k y (n-2k) grados de libertad.
T T
EN = e0ve ve1 ve 1
ÿ ÿ
(4.160)
ÿ
0 1 1
ˆ2
V =1 yoÿ ÿBI
ÿ
ˆ2
con ÿ la estimación de máxima verosimilitud de la varianza del campo u.
Machine Translated by Google
Por analogía con el análisis de series de tiempo, para estimar los cambios estructurales podemos utilizar
el procedimiento de prueba propuesto por Quandt (1958).
Consideremos primero la formulación presentada en la sección anterior y permítasenos
introducir la siguiente notación:
ÿX ÿ0 ÿ mi
* = ÿy 1
ÿ ÿ ÿ ÿ ÿ
x ;* = 1 * = 1 ; mi
* = 1 (4.163)
y ÿ ÿ ÿ ÿ
ÿ ÿ ÿ ÿ ÿ
0 X mi
ÿy 2ÿ ÿ 2ÿ ÿÿ 2ÿ ÿ 2ÿ
Con estas definiciones, podemos escribir el modelo estadístico de forma compacta como:
* ** *
y = X ÿ + tu (4.164)
* **
mi = segundo mi + tu (4.165)
2
yo 0
ÿ = 1 norte
1
tu
ÿ ÿ0 2
yo (4.166)
2 norte
2
siendo B* una matriz de conectividad que también puede asumir una estructura de dos regímenes.
Por ejemplo, podemos suponer
* ÿ W 10 ÿ
B = ÿ
1
ÿ
(4.167)
ÿ ÿ ÿ 0 vatios2 2ÿ
yo
(ÿ 2 ,ÿ 2 , ÿ ,ÿ
*
, ÿ X; ) =
1 2 1 2
(4.168)
=ÿ
n1
en ÿ 2 ÿ
nº
2 en ÿ ÿ BI
2 + ÿ en * *
)T(y X ÿ
1 ( )( y X ÿ IB ÿ IB
ÿ ** ÿ
)
* T ÿ
1
(
ÿ * * ÿ **
)
2 1 2 2 2 tu
La ecuación (4.168) se puede emplear para derivar las estimaciones de máxima verosimilitud siguiendo
los procedimientos habituales.
Machine Translated by Google
5.1 Introducción
Tabla 5.1. Pruebas de dependencia espacial para los residuos OLS de la convergencia ÿ en las 92 provincias italianas
(1950-1999) (las cifras entre paréntesis se refieren a los valores de p).
7.226
I de Moran
(0,000)
LMT (modelo de error espacial 45,866
Tabla 5.2. Convergencia del ingreso per cápita en las 92 provincias italianas (1950-1999) – Modelos de dependencia espacial –
Estimaciones ML (los números entre paréntesis se refieren a los valores p).
0.122 0.110
ÿ (Constante)
(0.046) (0.003)
-0.608 -0.5955
ÿ
(0.000) (0.000)
0,437
ÿ (ver Ecuación (4.30))
(0,000)
0,265
ÿ (ver Ecuación (4.78))
(0,001)
Bondad de ajuste
Diagnóstico de regresión
1. Heterocedasticidad espacial
1,107 0,682
Prueba de heteroscedasticidad de Breusch-Pagan
(0,575) (0,711)
2. Dependencia espacial
10,973
LRT (modelo de error espacial frente a OLS)
(0,000)
0,307
LMT (modelo de retraso espacial como hipótesis alternativa)
(0,578)
8.759
LRT (modelo de retraso espacial frente a OLS)
(0.003)
2.167
LMT (modelo de error espacial como hipótesis alternativa)
(0.141)
T b
Machine Translated by Google
modelo y a 37 años en el modelo de rezago espacial . Cabe señalar, sin embargo, que en esta
nueva especificación no podemos asignar a los parámetros de velocidad y vida media exactamente
el mismo significado que tenían en la especificación original de Barro y Sala-i-Martin. Sobre la
interpretación de los parámetros en diferentes modelos de convergencia regional ver Arbia et al.
(2005).
Una segunda característica que surge de la Tabla 5.2 es que las nuevas especificaciones no
inducen problemas desde el punto de vista de la heteroscedasticidad: las pruebas de Breusch-
Pagan no son significativas en ambos casos.
Desde el punto de vista de la dependencia espacial, podemos observar una reducción general
del problema. De hecho, según las pruebas del multiplicador de Lagrange, los residuos ya no
muestran un patrón espacial (los valores p ahora son 0,578 y 0,141, respectivamente). Sin
embargo, la prueba de razón de verosimilitud aún reporta valores significativos, lo que muestra
que todavía podría haber un componente de dependencia espacial en los residuos empíricos de
los dos modelos de regresión.
Las pruebas empíricas de convergencia ÿ entre las provincias italianas a menudo toman en
cuenta la posibilidad de diferentes intersecciones al incluir variables ficticias en la especificación
de la regresión, típicamente, variables que indican si la región o la provincia pertenece al Sur o
al Norte-Centro ( véase, por ejemplo, Fabiani y Pellegrini, 1997). En términos generales, sin
embargo, no consideran ninguna de las especificaciones de régimen espacial discutidas en la
Sección 4.4.4.
Aquí se desea contrastar la hipótesis de la existencia de dos regímenes espaciales distintos:
el primero correspondiente a la zona Centro-Norte y el segundo a la zona sur del país. Las
provincias que caen dentro de las dos subáreas se muestran en la Figura 5.1. Se refieren al
programa político específico (conocido en Italia como Cassa del Mezzogiorno) que proporcionó
a las regiones del sur de Italia recursos financieros adicionales durante el período considerado.
Provincias italianas
Norte
Sud
Figura 5.1. Clasificación de las 92 provincias italianas dentro de los dos regímenes geográficos.
Machine Translated by Google
Tabla 5.3. Convergencia de la renta per cápita en las 92 provincias italianas (1950-1999). Invariancia espacial de los parámetros.
Tabla 5.4. Convergencia de la renta per cápita en las 92 provincias italianas (1950-1999). Modelos de dependencia espacial con
regímenes espaciales (estimaciones ML) (los números entre paréntesis se refieren a los valores p).
Norte-Centro
0,421
ÿ (ver Ecuación (4.30))
(0,000)
0,259
ÿ (ver Ecuación (4.78))
(0,002)
Bondad de ajuste
Diagnóstico de regresión
1. Heterocedasticidad espacial
0,977 0,504
Prueba de heteroscedasticidad de Breusch-Pagan
(0,322) (0,477)
2. Dependencia espacial
12,961
LRT (modelo de error espacial frente a OLS)
(0,000)
LMT (modelo de retraso espacial como hipótesis 0,249
alternativa) (0,617)
8.159
Prueba LRT (modelo de retraso espacial frente a OLS)
(0.004)
LMT (modelo de error espacial como hipótesis 2.183
alternativa) (0.139)
(
en 1 + ÿ ) ; (**) Vida media =
(*) Velocidad de Convergencia b =ÿ
vida media
ÿ
= en (2) .
T b
Machine Translated by Google
1
Los resultados empíricos presentados aquí se basan en parte en Postiglione et. Alabama. (2002).
Machine Translated by Google
Tabla 5.5. Pruebas de dependencia espacial para los residuos OLS de la convergencia ÿ en las 129 regiones europeas
NUTS-2 (1950 – 1999). (Las cifras entre paréntesis se refieren a los valores p).
5.055
I de Moran
(0.000)
22.235
LMT (modelo de error espacial como hipótesis alternativa)
(0.000)
14.757
LMT (modelo de retraso espacial como hipótesis alternativa)
(0.000)
los residuos se reportan en la Tabla 5.5. Aquí, nuevamente, examinamos la prueba I de Moran
junto con dos versiones de la prueba del multiplicador de Lagrange, considerando el rezago
espacial y el modelo de error espacial como alternativas a la hipótesis de independencia espacial.
En el cálculo de la prueba (y en todos los análisis subsiguientes) consideramos la topología de
datos espaciales incorporada en una simple definición de pesos basada en la contigüidad.
Nuevamente, las definiciones más sofisticadas de vecindario no dieron lugar a diferencias
significativas.
Como se desprende de la tabla 5.5, las tres pruebas son altamente significativas y conducen
al rechazo de la hipótesis de independencia entre los residuos. Esta conclusión nos lleva a tratar
de eliminar los efectos perturbadores causados por la dependencia espacial usando uno de los
modelos de regresión espacial discutidos en el Capítulo 4.
Los resultados de los procedimientos de estimación se dan en la Tabla 5.6. Los parámetros
se estiman mediante el procedimiento de pseudoverosimilitud máxima. Todos los parámetros
son altamente significativos en ambas especificaciones. Conducen a una velocidad de
convergencia de 0,015 y 0,025, respectivamente, en los dos modelos (fue de 0,019 en el modelo
a-espacial presentado en la Sección 1.3.3) y, en consecuencia, a un tiempo de vida media de 44
y 27 años, respectivamente. en los dos modelos (fueron 34 años en el modelo a-espacial). Así,
la introducción de efectos espaciales conduce a una mayor velocidad de convergencia entre las
regiones.
En cuanto al diagnóstico del modelo, observamos que la prueba de Breusch-Pagan lleva a
aceptar la hipótesis de varianzas constantes.
En cuanto al problema de la dependencia espacial entre residuos en el modelo de rezago
espacial, tanto el test de razón de verosimilitud como el del multiplicador de Lagrange nos llevan
a rechazar la hipótesis de independencia espacial mientras que, en el caso del modelo de error
espacial, existe un contraste entre el resultados de la prueba de la razón de verosimilitud (que
nos lleva a rechazar la independencia espacial) y los proporcionados por la prueba del
multiplicador de Lagrange (que, por el contrario, lleva a la aceptación).
Las conclusiones generales no son, pues, muy diferentes de las del análisis anterior referente
a las provincias italianas. Cuando se detecta un alto grado de autocorrelación espacial positiva
entre los residuales, las velocidades de convergencia estimadas a través de la regresión lineal a-
espacial están fuertemente sesgadas con respecto a las obtenidas a través de las regresiones
espaciales. En este caso, sin embargo, el modelo no es del todo satisfactorio porque deja un alto
grado de dependencia espacial residual.
Machine Translated by Google
Tabla 5.6. Convergencia de la renta per cápita en las 129 regiones europeas NUTS-2 (1950-
1999)– Modelos de dependencia espacial – Estimaciones de máxima verosimilitud (los números entre paréntesis se refieren
a los valores de p).
2,539 3,623
ÿ (Constante)
(0,000) (0,000)
-0,222 -0,302
ÿ
(0,002) (0,002)
0,501
---
ÿ (ver Ecuación (4.30))
(0,000)
0,385
---
ÿ (ver Ecuación (4.78))
(0,000)
Bondad de ajuste
Diagnóstico de regresión
1. Heterocedasticidad espacial
0.776 0.692
Prueba de heteroscedasticidad de Breusch-Pagan
(0.378) (0.452)
2. Dependencia espacial
21.259
---
Prueba LRT (modelo de error espacial frente a OLS)
(0.000)
0.074
---
LMT (modelo de retraso espacial como hipótesis alternativa)
(0.785)
14.400
---
Prueba LRT (modelo de retraso espacial frente a OLS)
(0.000)
5.598
---
LMT (modelo de error espacial como hipótesis alternativa)
(0.018)
(
en 1 + ÿ ) ; (**) Vida media = vida
(*) Velocidad de Convergencia b =ÿ
media = en (2) .
T
ÿ
Para mejorar nuestros modelos, consideraremos el área de estudio dividida en dos zonas, cada
una caracterizada por diferentes regímenes. Observemos de nuevo la Figura 1.9, donde presentamos
la distribución del logaritmo natural del PIB per cápita en las regiones de la UE al nivel NUTS 2 tanto
en 1980 (el período inicial de observación) como en 1996 (el período final de observación). El análisis
gráfico sugiere la existencia de al menos dos clubes diferentes con una clara distinción geográfica: las
regiones más ricas ubicadas en el centro del continente y las regiones más pobres ubicadas en la
periferia.
Para contrastar la hipótesis de la existencia de dos regímenes caracterizados por dos velocidades
de convergencia diferentes, clasificamos a la región de la UE como “pobre” si el nivel de PIB per cápita
está por debajo de la mediana europea y “rica” si la supera.
La clasificación puede basarse en el año inicial 1980 (Figura 1.9a) o, alternativamente, en el año final
1996 (Figura 1.9b). En esta sección intentamos ambas especificaciones. Los resultados de la prueba
de Chow de la invariancia de los parámetros (ver la Ecuación (5.159) en la Sección 4.4.4.1) se reportan
en la Tabla 5.7 para las cuatro especificaciones consideradas. Los resultados de las pruebas de Chow
son altamente significativos para tres de los cuatro modelos analizados, con la única excepción del
modelo de rezago espacial que adopta la clasificación de 1980.
Tabla 5.7. Convergencia de la renta per cápita en las 129 regiones europeas NUTS-2 (1980-
1996) – Invariancia espacial de parámetros.
Modelo de error espacial Modelo de error espacial Modelo de retraso Modelo de rezago
(clasificación de 1980) (clasificación de 1996) espacial (clasificación de 1980)
espacial (clasificación
prueba de 5,990 (0,050) 65.175 1.344 de 1996) 64,475 (0,000)
comida (0.000) (0.511)
Habiendo encontrado suficiente evidencia de la existencia de dos regímenes, ahora podemos proceder
a una estimación de los parámetros y la verificación diagnóstica de los distintos modelos. La Tabla 5.8
muestra los resultados de la estimación de máxima verosimilitud de los parámetros de retraso espacial
y error espacial para los dos regímenes espaciales.
Las estimaciones de los parámetros son siempre significativas y las estimaciones de ÿ son del
signo esperado (ver Tabla 5.8). La velocidad de convergencia oscila entre 1,489% y 5,089% al emplear
los cuatro modelos diferentes. De acuerdo con la hipótesis de la convergencia teórica, el modelo de
cambio estructural identifica una mayor velocidad (5,089%) para las regiones “pobres” y una menor
velocidad (1,489%) para las regiones “ricas”.
Tabla 5.8. Convergencia de la renta per cápita en las 119 regiones europeas NUTS-2 (1950-
1999). Modelos de dependencia espacial con regímenes espaciales (estimaciones ML) (los números entre paréntesis se refieren
a los valores de p).
ÿ (Constante) 1980) 2,815 (0,000) 1996) 4.380 1980) 2.475 1996) 4.313
13.62 18.77
Media vida (**) 17.57 33.76
0,369 0,205
ÿ (ver Ecuación (4.30))
(0,000) (0,023)
0.369 0.205
ÿ (ver Ecuación (4.78))
(0.000) (0.023)
Bondad de ajuste
Criterio de Schwartz
-176.792 -219.507 -163.447 -213.801
Diagnóstico de regresión
1. Heterocedasticidad espacial
espacial
(
en 1 + ÿ ) ; (**) Vida media = vida
(*) Velocidad de Convergencia b =ÿ
media ÿ
= en (2) .
T b
Machine Translated by Google
Finalmente, nótese que las especificaciones alternativas de dos regímenes consideradas también
eliminan el problema de la dependencia espacial residual en tres de las especificaciones
consideradas si basamos nuestras conclusiones en la prueba del multiplicador de Lagrange,
aunque la prueba de la razón de verosimilitud proporciona algunos resultados contrastantes.
Machine Translated by Google
6.1 Introducción
1
Este capítulo está escrito conjuntamente con Gianfranco Piras.
Machine Translated by Google
148 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
Se pueden encontrar revisiones más exhaustivas de los datos del panel espacial en Anselin (2001a)
y Anselin et al. (2004b).
Como queda claro a partir de los ejemplos de este libro, la teoría del crecimiento y la convergencia
económica son sin duda los campos en los que la econometría espacial se ha aplicado con mayor
frecuencia durante las últimas décadas. Dentro de este amplio campo, se han propuesto en la literatura
muchos modelos diferentes que se apartan sustancialmente del modelo de regresión lineal espacial
simple de los capítulos anteriores y requieren un tratamiento econométrico espacial adecuado.
Un enfoque que puede considerarse un importante paso adelante con respecto al marco de
modelado de convergencia de crecimiento neoclásico es el basado en el concepto de club de
convergencia desarrollado por Durlauf y Johnson (1995) y Quah (1993a; 1993b; 1996a; 1996b). Véase
Baumont et al. (2003) para una revisión. Tal concepto puede ayudar a explicar por qué observamos la
polarización económica y la persistencia de la pobreza en los estudios empíricos. La idea se basa en
modelos de crecimiento endógeno que conducen a una situación de múltiples equilibrios de estado
estacionario como la descrita en Azariadis y Drazen (1990). Según esta teoría, algunas economías
pueden converger, pero solo si sus condiciones iniciales caen dentro de la cuenca de atracción del
mismo estado estacionario. Galor (1996) demuestra que tal concepto de convergencia es, de hecho,
consistente con los modelos de crecimiento neoclásico estándar, si permitimos la heterogeneidad
individual.
En la misma línea, Quah (1993a) introdujo un enfoque original basado en matrices de transición de
cadenas de Markov. El enfoque de Quah se basa en la idea de que la convergencia es un tema tan
complicado que no puede estudiarse simplemente observando el
Machine Translated by Google
150 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
correlación lineal entre las tasas de crecimiento y los niveles iniciales del PIB, como en el
análisis estándar de convergencia ÿ. Más bien, tenemos que observar la distribución bivariada
completa de las dos variables involucradas (estimadas con densidades kernel) y también sus
desarrollos temporales para poder comprender completamente todas las fuerzas motrices y la
dinámica. Al desarrollar tal enfoque, Quah (1993a; 1993b) revela la existencia de una
polarización en dos clubes de países ricos y pobres en la distribución regional europea del
ingreso (ver Capítulo 5.3). Él llama a estos "picos gemelos".
Baumont et al. (2003) abordan el mismo problema en forma de inestabilidad estructural
entre clubes de convergencia espacial en la estimación del proceso de convergencia ÿ entre
138 regiones europeas durante el período 1980-1995. La estimación de los modelos de error
de régimen espacial apropiados muestra que el proceso de convergencia es diferente entre
los regímenes. Además, los autores también estiman un efecto de desbordamiento espacial
muy significativo: la tasa de crecimiento promedio del PIB per cápita en una región determinada
parece verse afectada positivamente por la tasa de crecimiento promedio de las regiones
vecinas. Rey (2001, 2003) analiza otras especificaciones particulares de la convergencia del
club y trata, en particular, de modelos espaciales de Markov y modelos de desigualdad espacial.
Como ya se señaló, la mayor parte del análisis empírico utiliza tradicionalmente técnicas
econométricas transversales para probar hipótesis de convergencia. Sin embargo, como
sugirieron Bernard y Durlauf (1995, 1996), estos procedimientos plantean varios problemas.
Los autores proponen una nueva definición de convergencia basada en el concepto de raíz
unitaria desarrollado en el contexto del análisis de series temporales. Si el progreso tecnológico
(que impulsa el crecimiento económico a largo plazo) contiene una tendencia estocástica, la
convergencia implica que los componentes permanentes del PIB son los mismos en todas las regiones.
En este contexto, la convergencia se presenta como un “ponerse al día durante un cierto
período de tiempo” (Bernard y Durlauf, 1996). La convergencia estocástica se puede probar
realizando pruebas de raíz unitaria de panel (ver Evans y Karras, 1996a,b; Bernard y Jones,
1996; Fleissig y Strauss, 2001; Arbia y Costantini, 2004). Sin embargo, hasta ahora, no se ha
considerado, en este campo, los problemas relacionados con la naturaleza espacial de las
observaciones que requerirían un modelo econométrico espacial explícito.
Es notable, sin embargo, que algunos de los conceptos en el análisis de series de tiempo
relacionados con las raíces unitarias y la cointegración han sido investigados en el contexto
de la econometría espacial (Fingleton, 1999; Mur y Trìvez, 2003). Getis y Griffith (2002), notan
que este importante tema aún falta en el tratamiento de otros problemas espaciales, siendo la
única excepción notable los trabajos de Griffith y Tiefelsdford (2002) y Getis y Aldstadt (2004).
regiones hacia estados estacionarios comunes, pero no sobre el camino que siguen para
alcanzar dicha convergencia, los autores consideran un marco de tiempo continuo basado en
el sistema clásico de dos ecuaciones Lotka-Volterra depredador-presa (Lotka, 1956 y Volterra,
reimpreso en Chapman, 1931) propuesto por primera vez en un contexto económico por
Samuelson (1971). (Sobre modelos econométricos de tiempo continuo ver Bergstrom, 1990 y
Gandolfo, 1990). Extienden dicho marco de modelado al caso de más de dos regiones e
introducen explícitamente una modelización de la dependencia espacial que muestran las
regiones vecinas. El modelo así obtenido puede verse como una versión generalizada del
modelo de convergencia ÿ, en el que un sistema de regiones, bajo ciertas condiciones, se
mueve hacia un punto de convergencia matemáticamente estable. También consideran la
inferencia estadística e introducen una solución aproximada discreta basada en Mínimos
cuadrados dinámicos simultáneos (Paelinck, 1996) para estimar los parámetros del modelo.
Por lo tanto, al generalizar el modelo tradicional depredador-presa a un sistema multirregional,
muestran que cada región puede seguir su propia trayectoria, lo que lleva a una serie de
caminos de convergencia distintos. Los autores ilustran su enfoque comparando los resultados
empíricos generados por una ecuación de convergencia tradicional y por una ecuación de
convergencia condicionada espacialmente con los del modelo Lotka-Volterra para 119 regiones
europeas durante el período 1980-1994.
Al igual que Arbia y Paelinck (2003), Harvey y Carvalho (2002) también están interesados
en la dinámica de la convergencia más que en su ocurrencia dentro de un cierto período de
tiempo. Proponen un mecanismo de corrección de errores de segundo orden integrado en un
marco de convergencia estocástica que proporciona un desglose informativo en componentes
de tendencia, ciclo y convergencia. También muestran que las pruebas de series temporales
de convergencia económica pueden formularse dentro de este marco. Sin embargo, no se
presta atención en el documento citado a los efectos espaciales.
Fingleton (2004) propone un nuevo modelo de crecimiento económico que va más allá del
esquema neoclásico al incorporar (i) rendimientos crecientes (en lugar de constantes) a
escala, (ii) la difusión de innovaciones tecnológicas, (iii) ponerse al día y (iv) spa externalidades
potenciales. El modelo es una extensión de la ley de Verdoorn (Verdoorn, 1949) empleada en
el análisis económico por Kaldor (1957; 1970) y aumentada para incluir retraso espacial,
errores espaciales y otros efectos espaciales.
Ya hemos tratado el tema del modelado de datos de panel en la Sección 6.2.1. Las
aplicaciones de tales metodologías se pueden encontrar en el estudio de la convergencia
regional a partir del trabajo de Islam (1995, 1998). Para una aplicación reciente, véase, por
ejemplo, Arbia y Piras (2005) y Arbia et al. (2005).
Finalmente, Arbia et al. (2003) y Arbia y Basile (2005) proponen un non paramet
marco rico para estudiar el crecimiento y la convergencia en la UE.
A menudo, uno de los puntos más críticos en el análisis econométrico espacial es la necesidad
de considerar simultáneamente la dependencia espacial y temporal presente en las
observaciones bajo examen. En la literatura son pocos los artículos que consideran la
Machine Translated by Google
152 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
simultaneidad de estos hechos. Aquí sigue una breve reseña de algunos de los trabajos
recientes en esta dirección. La base para el modelado del espacio-tiempo fue fundada en los
años setenta por Bennett (1979) y Pfeiffer y Deutsch (1980), quienes introdujeron la clase de
procesos autorregresivos y de promedio móvil del espacio-tiempo (STARMA).
Estos procesos todavía representan el punto de partida para conceptualizaciones más
complicadas.
Pace et al. (1998) observaron que no existe una forma óptima obvia de incorporar las
dependencias espaciales y temporales en modelos de precios empíricamente factibles.
Para capturar mejor el efecto de la información espacial y temporal en los precios de los
bienes raíces, al superar los problemas asociados con los modelos de variables indicadoras,
introdujeron un modelo espacio-temporal que usa información de propiedades cercanas
vendidas recientemente al predecir el valor de una propiedad determinada. . En otras
palabras, en lugar de asumir que cada región tiene sus propios efectos modelados por
parámetros separados, la formulación de STARMA asume que las propiedades cercanas
tienen la misma relación con las observaciones en toda la muestra. Usando datos sobre los
precios de la vivienda, muestran los beneficios sustanciales obtenidos al modelar la
dependencia espacial y temporal de los datos. Más detalladamente, la autorregresión
espacio-temporal redujo significativamente el error absoluto mediano con referencia a un
modelo basado en indicadores. El rendimiento mejorado de su especificación se confirma
mediante el análisis del pronóstico de un paso adelante.
Giacomini y Granger (2003) comparan la eficiencia relativa de diferentes métodos para
pronosticar la agregación de series temporales espacialmente correlacionadas. Utilizando
aproximaciones asintóticas y los resultados de algunos estudios de simulación, muestran
que el rendimiento de la previsión puede mejorarse imponiendo restricciones a priori sobre
la cantidad de correlación espacial en el sistema. Una forma de hacerlo es agregar
pronósticos de un modelo autorregresivo de espacio-tiempo, ya que este último ofrece una
solución al problema de la maldición de la dimensionalidad que surge cuando se pronostica
con la metodología VAR. La importancia de su artículo radica en su prueba de que ignorar la
correlación espacial, incluso si es débil, conduce a pronósticos muy inexactos. Sin embargo,
es importante enfatizar que los resultados se basan en una simulación de muestra muy
pequeña (basada en un máximo de 16 observaciones colocadas en una red regular de 4x4)
y, por lo tanto, se ven afectados por fuertes efectos de borde. Además, los autores restringen
sus simulaciones al caso de autocorrelación espacial positiva y no dicen nada sobre el
desempeño del pronóstico en el caso de autocorrelación espacial negativa.
Recientemente se han registrado algunos avances en la construcción de modelos ARCH
espaciales y espacio-temporales derivados directamente de la serie temporal análoga.
Los desarrollos en este campo requieren una especificación y una comprensión completa de
la noción de “riesgo espacial” (Arbia, 2003) que tiene una relevancia importante en campos
como la desigualdad económica y el análisis de la pobreza. Algunas de las ideas y desarrollos
en este campo se informan en Florax et al. (2004). Para una revisión reciente de los modelos
de espacio-tiempo, véase Arbia (2004). Sobre la relación entre los componentes temporal y
espacial del modelo espacio-tiempo ver Arbia (1992).
Machine Translated by Google
El modelo básico de correlación espacial desarrollado por Cliff y Ord (1981) y Anselin (1988)
permite la dependencia espacial en la variable dependiente o en el componente de error
referido a variables cuantitativas. Sin embargo, muchos estudios empíricos tienen un interés
explícito en modelar la dependencia espacial en los casos en que intervienen variables
categóricas. Fleming (2004) incluye el concepto de correlación espacial en modelos que
involucran variables dependientes limitadas en un contexto de elección discreta. De manera
similar, el modelo probit espacial ha sido investigado en algunos trabajos recientes por
Pinkse y Slade (1998), LeSage (2000), Beron et al. (2003), Murdoch et al. (2003) y Beron y
Vijverberg (2004).
Garret et al. (2003) adoptan un marco similar a las técnicas econométricas espaciales
estándar, pero su especificación se modifica para tener en cuenta la naturaleza discreta de
la variable dependiente y la estructura del panel de datos. Usan un probit espacial para
modelar la elección de un estado de sucursales bancarias y regímenes bancarios
interestatales como una función de las elecciones de régimen hechas por otros estados.
Extienden el modelo básico al permitir que la correlación espacial varíe en diferentes regiones geográficas.
154 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
revisión fechada. Este autor formula un modelo probit bayesiano con efectos individuales
que exhibe dependencias espaciales. Dado que los modelos probit a menudo se utilizan
para explicar la variación en las elecciones de los individuos, estos modelos bien pueden
explicar los efectos de interacción espacial debido a la ubicación espacial variable de los
tomadores de decisiones. El modelo propuesto por LeSage permite un vector de parámetros
de efectos de interacción espacial que toma la forma de una autorregresión espacial. Este
modelo es una extensión de los modelos espaciales probit/logit presentados en LeSage
(2000) y se aplicó a los resultados de las elecciones presidenciales de 1996 para los
condados de EE. UU. En LeSage (2001), el autor argumentó que el uso de métodos
Bayesianos en la estimación de regresiones geográficas puede ayudar a resolver los
problemas que pueden surgir con la estimación clásica, produciendo notables ventajas sobre
la estimación por Mínimos Cuadrados Ordinarios en métodos de regresión ponderados
geográficamente. . Finalmente, en LeSage (2004), el autor propone una familia de modelos
de regresión evaluados localmente (denominados Regresión ponderada geográficamente,
GWR) que se basan en el suavizado kernel obtenido a través de funciones de disminución
de la distancia espacial. También extiende este marco de trabajo a la llamada Regresión
ponderada geográficamente bayesiana (BGWR) utilizando estimadores robustos y suavizado
de parámetros para tratar los valores atípicos espaciales y la heterogeneidad espacial,
respectivamente. Finalmente, hace uso de los métodos MCMC con fines de estimación.
La comparación y selección de modelos es un punto central en la econometría. La teoría
bayesiana proporciona un marco integral para la elección de este modelo. Hepple (2003)
desarrolla este marco bayesiano para la familia de modelos econométricos espaciales.
Obtiene el factor de Bayes y la verosimilitud marginal para cada una de las principales
especificaciones espaciales y construye la forma computacional relativa. Este marco se
aplica luego a dos conjuntos de datos diferentes para ilustrar las ventajas de los métodos.
Baumont et al. también proporcionan una aplicación de los métodos bayesianos. (2003) que
utilizan técnicas econométricas espaciales bayesianas para controlar la autocorrelación
espacial, la heterogeneidad espacial y los valores atípicos en el análisis empírico del empleo
y la densidad de población en el área de Dijon.
Dowde y LeSage (1997) y LeSage y Krivelyova (1999), entre otros, también utilizan
antecedentes espaciales para el modelado del espacio-tiempo, así como Holloway et al.
(2002) y LeSage (1997, 2000) en el análisis probit espacial.
enfoque para modelar la dependencia espacial. En el artículo citado, el autor propone el uso
de un estimador del Método Generalizado de Momento (GMM; véase Hansen, 1982) que
demuestra ser consistente, como en el caso de los datos de series de tiempo. Sin embargo,
dado que la teoría de la distribución de los estimadores es diferente, propone además estimar
la matriz de covarianza de forma no paramétrica, permitiendo la dependencia espacial
mediante el uso de métodos análogos a los empleados por, por ejemplo, Newey y West
(1987), Andrews (1991) White (1984) y White y Domowitz (1984) dentro del contexto de
series temporales. Sugiere un estimador de covarianza que se basa en una secuencia de
promedios ponderados de autocovarianzas de muestra calculadas para subconjuntos de
pares de observación que caen dentro de un umbral de distancia dado de una manera similar
a la de otros campos de las estadísticas espaciales como la geoestadística (ver Cressie,
1991, pág. 69). Finalmente, el autor prueba que las matrices de covarianza así obtenidas son
estimadores consistentes de la verdadera aún cuando se asume que las distancias verdaderas
están distorsionadas por errores de medición.
De manera similar, Driscoll y Kraay (1998) proponen un método de estimación de
covarianza consistente para datos de panel espacialmente dependientes, y Keleijan y Prucha
(1999) analizan el uso de GMM en un modelo espacial. Pueden encontrarse ejemplos de
estimación semiparamétrica de la dependencia espacial en Chen y Conley (2001) y Pace y
LeSage (2002).
Otra contribución importante en esta área la ha hecho Gress (2003), quien parte de la
simple consideración de que los modelos espaciales no son una extensión directa de los
modelos de series temporales, incluso si muestran muchas características compartidas.
El artículo citado combina estimadores no paramétricos de la media con los estimadores
paramétricos habituales de los parámetros de retraso espacial. Esto se hace para los tres
modelos de principal interés en la literatura: el modelo de error autorregresivo espacial, el
modelo autorregresivo espacial con variables exógenas y el modelo autorregresivo espacial
con variables exógenas y errores autorregresivos espaciales. A continuación, se analizan las
propiedades de pequeñas muestras con simulaciones de Monte Carlo y se realizan algunos
análisis empíricos para comparar el resultado obtenido utilizando los métodos econométricos
habituales.
Los modelos de regresión parsimoniosos que utilizan datos espaciales a menudo
producen residuos no normales, heterocedásticos y espacialmente dependientes. Pace et al.
(2004) desarrollan un modelo que realiza simultáneamente transformaciones de forma
espacial y funcional para mitigar los efectos de este problema. Muestran que una mejor
especificación de la forma funcional podría reducir la autocorrelación espacial de errores
dado el agrupamiento espacial de observaciones similares y también puede reducir
simultáneamente la heteroscedasticidad y la no normalidad de los residuos. Los autores
aplican este marco a los datos de mercado de los precios de la vivienda y obtienen un buen
ajuste del modelo con un patrón de residuos significativamente mejorado con respecto al marco de modelado estándar.
McMillen y McDonald (2004) proponen un método no paramétrico para tratar la
heterogeneidad espacial dentro del marco de un modelo probit. El rendimiento se evalúa a
través de experimentos de Monte Carlo.
Machine Translated by Google
156 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
Una vez que se han explotado las propiedades y características del conjunto de datos en uso, el
enfoque de los trabajos empíricos en un contexto de regresión espacial se concentra
principalmente en las pruebas de especificación errónea. Desde el trabajo de Anselin (1988), el
desarrollo de pruebas de especificación errónea dentro de un marco de máxima verosimilitud y la
derivación de las propiedades asintóticas de estas pruebas y las propiedades asociadas de
muestras pequeñas han sido de interés. La gama de pruebas disponibles en tal contexto ha
mejorado significativamente en las últimas décadas, particularmente en relación con los casos
más simples considerados en el cuerpo principal de este libro.
En el contexto de la prueba de la hipótesis nula de la independencia espacial, muchos
autores han dedicado su atención al estudio de las propiedades de la prueba de correlación
espacial de Moran en condiciones variables y a ampliar sus posibles aplicaciones. Muchas
pruebas de dependencia espacial se basan, de hecho, en la estadística de Moran o se pueden
escribir de forma similar (p. ej., la prueba del multiplicador de Lagrange (LMT); véase Burridge,
1980). Algunos autores han explorado el uso de LMT en el contexto de modelos de regresión
espacial (ver Anselin y Rey, 1991; Anselin y Florax, 1995; Anselin, et al., 1996). Sin embargo,
Anselin y Rey (1991) y Anselin y Florax (1995) usaron simulaciones para demostrar que la I de
Moran tiene una potencia ligeramente mejor que la LMT en muestras pequeñas, aunque las
diferencias desaparecen cuando se trata de muestras medianas y grandes.
Entre las nuevas pruebas disponibles, recordamos la variante del I de Moran concebida por
Kelejian y Prucha (2001) y una prueba de muestra grande derivada por Kelejian y Rob inson
(1992, 1997). También se han desarrollado en la literatura un gran número de pruebas de
multiplicadores de Lagrange (LMT) unidireccionales, multidireccionales y robustos (Anselin y
Griffith, 1988; Anselin y Florax, 1995; Anselin et al., 1996; de Graaff et al., 2001; Anselin y Moreno,
2003, Florax y de Graaf, 2004 y Saavedra, 2003). La vasta literatura sobre las pruebas de
dependencia espacial incluye el trabajo de Anselin y Kelejian (1997) y Kelejian y Robinson (1992).
Estas pruebas se centran en la detección de residuos espacialmente correlacionados. Por lo
tanto, pueden usarse para probar especificaciones erróneas bien definidas, como un proceso de
error autorregresivo espacial o una variable dependiente retrasada espacialmente omitida.
Tiefelsdorf y Boots (1995) han demostrado que, en lugar de asumir la normalidad para derivar
la distribución aproximada de la prueba de Moran, es posible construir una prueba exacta basada
en la integración numérica (ver también Tiefelsdorf, 2002). Anselin y Keleijan (1997) han extendido
la aplicación del I de Moran para probar la hipótesis de dependencia entre los residuos del
procedimiento de mínimos cuadrados espaciales en dos etapas (S2STLS) (ver Anselin, 1980;
1988), mientras que Pinkse (1998) la extiende a residuos generalizados en un modelo probit. De
particular relevancia en este contexto son dos trabajos de Pinkse (1999, 2004). En su primer
artículo (Pinkse, 1999), el autor establece condiciones débiles bajo las cuales la prueba de
correlación espacial de Moran (o una variante de correlación cruzada de la misma) tiene una
distribución normal límite bajo la hipótesis nula de independencia. Para ambas pruebas, se
obtiene un resultado basado en un parámetro molesto.
Machine Translated by Google
siempre que permita aplicar la prueba a proxies de las variables cuya independencia se
quiere probar. Pinkse utiliza la estadística de prueba para determinar si tres pruebas del
multiplicador de Lagrange para la correlación espacial son válidas en un contexto de modelo
probit. En su segundo artículo (Pinkse, 2004), el autor ilustra las condiciones generales bajo
las cuales las pruebas de correlación espacial y correlación cruzada espacial con sabor a
Moran tienen una distribución normal limitante en presencia de un parámetro molesto en seis
modelos espaciales encontrados con frecuencia. . Las condiciones que deben imponerse son
más débiles que las consideradas en un trabajo relacionado del autor (Pinkse, 1999) y la
clase de problemas de parámetros molestos permitidos es mucho más amplia.
En términos generales, los diagnósticos de la dependencia del error espacial pueden
clasificarse como pruebas frente a una alternativa no especificada a la correlación espacial y
pruebas frente a procesos espaciales específicos. En el segundo caso, la típica alternativa a
la autocorrelación espacial se expresa bajo la forma de un proceso espacial autorregresivo.
En la literatura se han propuesto muchas pruebas de especificación y métodos de estimación
para este modelo. Kelejian y Robinson (1993) sugirieron un tipo diferente de proceso espacial
que combina un componente de error local o específico de la ubicación con un componente
regional o indirecto en lo que denominan proceso de componente de error espacial. Anselin y
Moreno (2003) propusieron una interesante alternativa basada en la siguiente formulación del
modelo. Consideraron una serie de pruebas de especificación frente a esta alternativa,
basadas tanto en un marco de máxima verosimilitud como en un enfoque de métodos
generalizados de estimación de momentos. Además, compararon el desempeño de estas
pruebas en una serie de experimentos de simulación de Monte Carlo para un rango de diseños
espaciales diferentes y bajo varias distribuciones de error diferentes, y encontraron que las
nuevas estadísticas funcionan mejor en términos de potencia, particularmente con referencia
a aquellos casos que no estén cubiertos por el supuesto de normalidad. De manera similar, la
variante de las estadísticas de Kelejian-Robinson, que se sugirió en este documento para dar
cuenta de los vecinos de segundo orden, también funciona bien. Así, el grado de generalidad
de los resultados del artículo está limitado por el diseño que se tiene en cuenta en los
experimentos de simulación.
En un trabajo reciente, Baltagi y Li (1999) observaron que ninguna de las pruebas LM de
dependencia espacial disponibles en la literatura ha sido calculada ejecutando una regresión
artificial. El objetivo principal de su artículo es mostrar que se puede obtener una LMT simple
tanto para la dependencia del retraso espacial como para la dependencia del error espacial
mediante el uso de la regresión de doble longitud (DLR) propuesta por Davidson y MacKinnon
(1993). Las regresiones de doble longitud son herramientas econométricas útiles para derivar
LM y estadísticas de prueba equivalentes. Además, se pueden aplicar a modelos que son
más generales que algunas de las otras contrapartes de regresión artificial y tienen mejores
propiedades de muestra finita que sus contrapartes de regresión de gradiente de producto externo.
Baltagi y Li (1999) obtienen las pruebas DLR tanto para la dependencia del retraso espacial
como para la dependencia del error espacial utilizando únicamente los residuos de mínimos
cuadrados del modelo restringido. Usan dos ejemplos simples para ilustrar estas pruebas:
uno se basa en la relación delictiva simple considerada por Anselin (1988) y el otro usa los
datos irlandeses considerados por Ord (1975). Además, los experimentos de Monte Carlo son
Machine Translated by Google
158 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
realizado para estudiar el rendimiento de muestra pequeña de estas pruebas y, como era de
esperar, tienen un rendimiento similar al de sus contrapartes LMT correspondientes.
Pesaran (2004a) está interesado en probar la dependencia transversal en paneles
dinámicos. Él parte de la consideración de que la forma tradicional de probar la dependencia
entre unidades de sección transversal espacial en datos de panel depende demasiado de la
elección subjetiva de una matriz de conectividad. Además, una conectividad puramente
geográfica no es apropiada en muchas aplicaciones económicas donde los factores económicos
y sociopolíticos podrían explicar mejor el patrón de dependencia. Como alternativa, propone
una prueba basada en un promedio simple de todos los coeficientes de correlación por pares
de los residuos de MCO de las regresiones simples contenidas en el panel. Para la prueba de
dependencia de la sección transversal así obtenida, las propiedades asintóticas y de muestra
pequeña se prueban y comparan con la prueba LMT estándar usando experimentos de Monte
Carlo. Una prueba de correlación espacial adecuada se deriva como una generalización para
los casos en los que tenemos un orden espacial a priori para las unidades de sección
transversal.
Se pueden encontrar contribuciones más recientes sobre la prueba de hipótesis en el
contexto espacial en Kelejian y Robinson (2004), donde los autores amplían su trabajo anterior
para tratar las estadísticas de prueba para múltiples fuentes de errores de especificación en
modelos de regresión lineal.
Finalmente, se han introducido algunas herramientas para probar la dependencia espacial
de forma no paramétrica. Se puede encontrar una prueba no paramétrica de independencia
espacial en Brett y Pinkse (1997) basada en una prueba similar de independencia serial
presentada por Pinkse (1998)
En el contexto de las pruebas de heteroscedasticidad en un modelo espacial, Baltagi et al.
(2003) extendieron la prueba LM de Breusch y Pagan al caso de un modelo de componente
de error espacial y derivaron varias pruebas del multiplicador de Lagrange (LMT) para el
modelo de regresión de datos de panel con correlación de error espacial. El punto de partida
es permitir tanto la correlación de errores espaciales como los efectos regionales en los
modelos de regresión de datos de panel y probar su significancia conjunta. Los autores usan
algunos experimentos de Monte Carlo para mostrar claramente que la literatura econométrica
espacial no debe ignorar la heterogeneidad entre las unidades transversales al probar la
presencia de correlación de error espacial. De manera similar, la literatura econométrica de
datos de panel no debe ignorar la correlación de error espacial al probar la presencia de efectos
regionales aleatorios. Baltagui et al. (2003) derivan pruebas LM conjuntas y condicionales que
son fáciles de implementar y más poderosas que la prueba LM unidimensional. El tamaño de
muestra utilizado en el análisis de Monte Carlo es pequeño, como es típico en los micropaneles.
En términos generales, la búsqueda de especificaciones en econometría espacial se ha
centrado en la detección de autocorrelación espacial y heteroscedasticidad espacial.
No se ha abordado la ocurrencia conjunta de autocorrelación y heteroscedasticidad, aun
cuando es un concepto central en la econometría espacial, como ya se comentó en el Capítulo
4.4.3. Anselin y Griffith (1988) sugieren que las pruebas tradicionales de autocorrelación
espacial pueden tener cierto poder contra la heteroscedasticidad, pero Kelei jan y Robinson
(1992) llegan a conclusiones opuestas. Aún no hay resultado teórico
Machine Translated by Google
existe para mostrar cómo la heterogeneidad afecta las pruebas de correlación espacial. Para una
revisión reciente y nuevos resultados en este campo, ver Keleijan y Robinson (2004).
Los procedimientos de prueba de especificación disponibles en la literatura consisten en
expandir un modelo de regresión lineal espacial con variables dependientes retrasadas
espacialmente, condicionado a los resultados de una prueba de especificación errónea. Florax et al.
(1998) reúnen una serie de nuevas estrategias de búsqueda de especificaciones. En particular,
investigan una estrategia de especificación similar a la de Hendry, a partir del modelo de factor
común espacial y, posteriormente, reducen el número de variables retrasadas espacialmente sobre
la base de pruebas de significancia. Su simulación experimental se refiere a diferentes muestras de
diferentes tamaños de muestra y el campo espacial se modela en superficies reticulares regulares.
Concluyen que el enfoque paso a paso hacia adelante clásico supera a la estrategia de Hendry en
términos de encontrar el verdadero proceso de generación de datos, así como en la precisión
observada de los estimadores para parámetros espaciales y no espaciales. También domina el
enfoque escalonado concurrente sugerido en la literatura. Florax y Rey (1995) investigaron los
rendimientos de una muestra pequeña de una secuencia de pruebas unidireccionales y
multidireccionales y pruebas de errores de especificación local, tanto en términos de la probabilidad
de encontrar el proceso real de generación de datos como en términos del error cuadrático medio
de los parámetros estimados. Establecieron la existencia de una estrategia dominante que es muy
relevante para los practicantes del modelado de regresión espacial.
Finalmente, de Graaff et al. (2001) sugirió una prueba muy particular. Su artículo se ocupa de un
análisis metodológico y empírico del caos en los sistemas espaciales. Su objetivo es crear un vínculo
entre las herramientas de diagnóstico clásicas desarrolladas en econometría espacial y las pruebas
de no linealidad para series de datos empíricos, con especial atención a la llamada prueba BDS
(Brock et al., 1987). Desarrollaron una variante espacial de esta prueba y posteriormente la aplicaron
al caso de un modelo shift-share para los mercados laborales regionales holandeses durante el
período 1987-1992.
Hasta hace unos años, los métodos de estimación predominantes se basaban básicamente en
estimadores GLS y ML para el modelo de error espacial y rezago espacial, como se discutió en
capítulos anteriores. Recientemente, se han logrado avances significativos en el desarrollo de
alternativas.
Kelejian y Robinson (1997), Kelejian y Prucha (1998; 1999) y la ya citada contribución de Conley
(1999) han dado un gran paso adelante en la dirección de proporcionar una alternativa viable a los
estimadores tradicionales GLS y ML. quien introdujo el uso de estimadores GMM en un contexto
econométrico espacial. En particular, Kelejian y Prucha (1999) desarrollan un conjunto de condiciones
de momento que producen ecuaciones de estimación para el parámetro de un modelo de error SAR
y sugieren el uso de mínimos cuadrados no lineales para derivar un método generalizado consistente
de estimador de momentos. Conley (1999) estudia en detalle las propiedades de los estimadores
GMM y proporciona las condiciones formales para su consistencia y asunción.
Machine Translated by Google
160 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
Los modelos de datos de panel espaciales (pero no dinámicos) pueden producir estimaciones
sesgadas cuando estos métodos se consideran conjuntamente. Para superar este problema,
primero se diferencian los modelos para eliminar los efectos fijos y luego se deriva la función de
verosimilitud incondicional teniendo en cuenta la función de densidad de las primeras
observaciones diferenciadas en cada unidad espacial. Este procedimiento produce un estimador
consistente tanto de los parámetros de respuesta como del coeficiente de autocorrelación
espacial cuando la dimensión transversal tiende a infinito y esto es independiente del tamaño de
la dimensión temporal. Las filas y las columnas de la matriz de ponderación espacial no divergen
hasta el infinito a una tasa igual (o más rápida que) la tasa del tamaño de la muestra en el
dominio de la sección transversal. El único problema que queda por resolver radica en la
estimación del efecto fijo. Este último no se puede estimar de manera consistente, ya que el
número de estos coeficientes aumenta a medida que aumenta el número de observaciones (el
problema de la maldición de la dimensionalidad ). Además, existe evidencia de que, cuando se
omiten las variables exógenas, se puede especificar la función de verosimilitud exacta, pero,
cuando, por el contrario, se incluyen variables exógenas, los valores premuestra de esta variable
(y por tanto la función de verosimilitud) solo se puede aproximar. El trabajo citado considera dos
casos para modelar los valores premuestra de las variables exógenas para las observaciones en
primeras diferencias de cada unidad espacial: la aproximación de Bhargava y Sargan (1983) y la
de Balestra y Nerlove (Balestra y Nerlove, 1966). ). La decisión de excluir variables explicativas
exógenas se basa en el hecho de que la presencia de tales variables complica aún más el
análisis, aunque en la literatura econométrica se han sugerido diferentes enfoques para tratar
los valores previos a la muestra de estas variables en un contexto dinámico.
162 6 Mirando hacia el futuro: una revisión de temas más avanzados en econometría espacial
A.1 Introducción
1
Este Apéndice ha sido escrito conjuntamente con Gianfranco Piras.
Machine Translated by Google
164 Apéndice: Una revisión del software disponible para el análisis econométrico espacial
A.3 GeoDa
2
http://www.terraseer.com/products/spacestat.html.
Machine Translated by Google
El programa está pasando por una fase muy rápida de evolución. La primera versión fue
lanzada en febrero de 2003 y fue seguida por una segunda en junio de 2003. La edición más
reciente estuvo disponible en enero de 2004. Al momento de escribir este artículo, el paquete
puede descargarse de su sitio web3 sin cargo.
Hasta ahora, el programa se ha centrado principalmente en herramientas gráficas y análisis
espacial descriptivo simple, como estadísticas de autocorrelación espacial, análisis de valores
atípicos espaciales y una amplia gama de funciones relacionadas con datos espaciales explicativos.
En este sentido, permite evaluar la autocorrelación espacial global y local mediante el estadístico
de autocorrelación espacial I de Moran y la herramienta gráfica conocida como Scatter Plot de
Moran (Anselin, 1996; véase también el Capítulo 6.5).
Las rutinas de regresión econométrica espacial, por otro lado, son todavía muy limitadas en
su rango y actualmente solo permiten la estimación de la regresión lineal a-espacial clásica vía
OLS y estimadores de Máxima Verosimilitud de los parámetros asociados con el error espacial y
el rezago espacial. modelos El diagnóstico básico para la dependencia espacial, la
heteroscedasticidad espacial y la normalidad están disponibles para los residuos de regresión
OLS estándar. La inferencia asintótica se basa en el Like lihood Ratio Test y en una estimación
de la matriz de covarianza asintótica utilizando el algoritmo desarrollado por Smirnov (2003).
SpaceStat y GeoDa son los únicos productos dedicados disponibles para el análisis de datos
espaciales. Recientemente, sin embargo, un número creciente de iniciativas puestas en marcha
por investigadores individuales o grupos han puesto a disposición rutinas específicas. Estos han
sido escritos en varios lenguajes de programación y pueden ser invaluables para aquellos que
trabajan en el campo de la econometría espacial aplicada.
3
Su rutina de instalación está disponible en la dirección de Internet: http://sal.geoda.uiuc.edu/default.
Php y contiene todos los archivos y bibliotecas necesarios.
Machine Translated by Google
166 Apéndice: Una revisión del software disponible para el análisis econométrico espacial
Quizás las cajas de herramientas más conocidas para el análisis econométrico espacial son
las desarrolladas por Pace4 (ver Pace y Barry, 1998) y por LeSage5 . Ambos hacen uso de
rutinas de Matlab. La caja de herramientas de Kelly Pace está más orientada hacia la estimación
de modelos espaciales para grandes muestras de datos (p. ej., las que se encuentran en
aplicaciones ambientales y físicas). La caja de herramientas de James LeSage, por otro lado,
está más orientada hacia el modelado económico, con especial atención a los métodos espaciales
bayesianos (incluidas las rutinas del muestreador de Gibbs) discutidas en el Capítulo 6.2.7.
Además, proporciona rutinas para los procedimientos clásicos de prueba de hipótesis y estimación
relacionados con el modelo de retardo espacial , el modelo de error espacial y el modelo espacial
general de Anselin (ver Capítulo 4.3.7.1), así como los modelos espaciales probit, logit y tobit .
(ver Capítulo 6.2.4) y sus versiones robustas. Además, algunas rutinas también están disponibles
para estimar rápidamente modelos espaciales utilizando la técnica GMM (consulte la Sección
6.2.8) y probar la precisión a través de simulaciones de Monte Carlo. La biblioteca también cuenta
con procedimientos especializados de matriz dispersa para manejar grandes conjuntos de datos.
En total, la caja de herramientas econométricas de LeSage contiene alrededor de 50 funciones
de Matlab y las funciones econométricas espaciales constituyen solo una parte.
La caja de herramientas de Stata muestra características similares. Esta biblioteca contiene
diagnósticos de regresión, estimación de máxima verosimilitud y rutinas para implementar el
estimador Conley GMM (Conley, 1999). Véase Pisati (2001)6 para una descripción detallada.
Existen muchas comunidades web que ponen a disposición programas y rutinas para la
econometría espacial. Uno que merece especial atención es el basado en el lenguaje de
programación R7 y vinculado a la iniciativa R-Geo. Esta biblioteca tiene muchas funciones nuevas
para analizar datos espaciales, incluidas estadísticas de autocorrelación espacial descriptivas y
un conjunto completo de funciones econométricas espaciales.
SPDEP (herramientas de análisis espacial)8 de Bivand también está escrito en el lenguaje R y
proporciona programas para el análisis de regresión y autocorrelación espacial (ver Bivand y
Gebhardt, 2000; Bivand, 2002, y Bivand y Portnov, 2004).
Por último, pero no menos importante, la extensión S+SpatialStats del paquete estadístico S-
PLUS (Kaluzny et al., 1997) incluye algunas rutinas de regresión espacial9 y la extensión
Geobugs del programa Winbugs10 contiene rutinas específicamente dedicadas a Gibbs sampler
y Monte Carlo . Estimación del modelo espacial Markov Chain (MCMC).
4
Disponible en el sitio web http://www.spatial-statistics.com/.
5
La caja de herramientas de econometría de LeSage se puede descargar sin cargo desde el sitio web: http://
www.spatial-econometrics.com/.
6
Para la caja de herramientas de Stata, consulte el sitio web http://www.faculty.econ.nwu.edu/faculty/conley/
statacode.html.
7
Consulte el sitio web http://sal.uiuc.edu/csiss/Rgeo/.
8
Consulte el sitio web http://cran.r-project.org/src/contrib/packages.html.
9
Consulte el sitio web http://www.insightful.com/products/splus/default.asp.
10
Consulte http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml.
Machine Translated by Google
Referencias
Aitkin M., Anderson DA, Francis BJ y Hinde JP, 1989. Modelo estadístico
ling en GLIM, Clarendon Press, Oxford.
Ali MM y Giacotto C., 1984. Un estudio de varias pruebas nuevas y existentes para
heterocedasticidad en el modelo lineal general, Journal of the American Statistical
Association, 80: 730-735.
Anselin L., 1980. Estimation Methods for Spatial Autoregressive Structures, Ithaca, NY,
Universidad de Cornell, Disertación científica regional y serie de monografías, no. 8.
Anselin L., 1987b. Dependencia espacial y heterogeneidad espacial: una mirada más cercana a
los enfoques de modelado alternativos, documento de trabajo, Departamento de Geografía,
Universidad de California, Santa Bárbara, CA.
Anselin L., 1992a. SpaceStat: un programa para el análisis de datos espaciales, Centro Nacional
de Información y Análisis Geográfico, Universidad de California, Santa Bárbara, CA.
Anselin L., 1992b. Tutorial de SpaceStat: un libro de trabajo para usar SpaceStat en el análisis
de datos espaciales, Centro Nacional/er* para Información y Análisis Geográficos,
Universidad de California, Santa Bárbara, CA.
Machine Translated by Google
168 Referencias
Anselin L., 1995a. Guía del usuario de la versión 1.80 de SpaceStat, Instituto Regional de Investigación,
Universidad de West Virginia, Morgantown, Virginia Occidental.
Anselin L., 1995b. Indicadores locales de asociación espacial – LISA, Análisis Geográfico, 27(2): 93-115.
Anselin L., 1996. El diagrama de dispersión de Moran como herramienta exploratoria de análisis de datos
espaciales para evaluar la inestabilidad local en la asociación espacial, en MM Fischer, HJ
Scholten y D. Unwin (eds.), Perspectiva analítica espacial sobre SIG, Taylor & Francis, Londres,
111-125
Anselin L., 2001a. Econometría espacial, en BH Baltagi (ed.), A Companion to Theoretical Econometrics,
Basil Blackwell, Oxford: 310-330.
Anselin L., 2001b. Prueba de puntaje de Rao en econometría espacial, Journal of Statistical
Planificación e Inferencia 97(1): 113-139.
Anselin L., 2002. Bajo el capó: problemas en la especificación e interpretación de modelos de regresión
espacial, Agricultural Economics, 17: 247-267.
Anselin L., 2003b. Guía de Usuario de GeoDa 0.9, Laboratorio de Análisis Espacial (SAL).
Departamento de Economía Agrícola y del Consumidor, Universidad de Illinois, Urbana-Champaign,
IL.
Anselin L., 2004. Notas de versión de GeoDa 0.95, Laboratorio de análisis espacial (SAL).
Departamento de Economía Agrícola y del Consumidor, Universidad de Illinois, Urbana-Champaign,
IL.
Anselin L. y Bera AK, 1998. Dependencia espacial en modelos de regresión lineal con una introducción a
la econometría espacial, en A. Ullah y D. Giles (eds.), Handbook of Applied Economic Statistics,
Marcel Dekker, Nueva York: 237-
289.
Anselin L. y Griffith DA, 1988. ¿Realmente importan los efectos espaciales en el análisis de regresión?
Documento de la Asociación Regional de Ciencias, 65: 11-34
Anselin L. y Hudak S., 1992. Econometría espacial en la práctica: una revisión de opciones de software,
Regional Science and Urban Economics, 22: 509-536.
Anselin L. y Moreno R., 2003. Propiedades de las pruebas para componentes de error espacial, Regional
Science and Urban Economics, 33, 5: 595-618.
Anselin L. y Rey S., 1991. Propiedades de las pruebas de dependencia espacial en lineal
modelos de regresión, Análisis Geográfico, 23: 110-131.
Machine Translated by Google
Referencias 169
Anselin L., Bera AK, Florax RJGM y Yoon MJ, 1996. Pruebas de diagnóstico simples para la
dependencia espacial, Regional Science and Urban Economics, 26: 77-
104.
Anselin L., Florax RJGM y Rey S., 2004. Avances en econometría espacial: metodología,
herramientas y aplicaciones, Springer-Verlag, Nueva York.
Anselin L., Syabri I. y Kho Y., 2004c. GeoDa: una introducción a los datos espaciales
análisis, Análisis Geográfico. Próximo.
Anselin L., Varga A. y Acs Z., 1997. Efectos indirectos geográficos locales entre la investigación
universitaria y las innovaciones de alta tecnología, Journal of Urban Economics, 42: 422-448.
Arbia G., 1992. Sulla verifica empirica di teorie economiche: serie storiche o serie spaziali,
Rassegna di Statistiche del Lavoro, Centro Studi Confindustria, 3: 97-105, Roma.
Arbia G., 1993. Recenti sviluppi nella modellistica spaziale, en S. Zani (ed) Meto di statistici per
le analisi territoriali, Franco Angeli Editore, Milán: 193-217.
Arbia G., 1995a. Actualización de los diseños de muestreo existentes en estudios ambientales
repetidos. Documento de trabajo, Padua, 6.
Arbia G., 1995b. Le relazioni degli aggregati economici nel tempo e nello spazio, en G. Alvaro
(ed), Contabilita' Nazionale e Statistica Economica, Cacucci edi tore, Segunda edición, Bari:
883-958.
Arbia G., 2001a. Modelando la geografía de las actividades económicas en un espacio continuo,
Papers in Regional Sciences, 80: 411-424.
Arbia G., 2001b. El papel de los efectos espaciales en el análisis empírico de la concentración
regional, Journal of Geographical Systems, 3: 271-281.
Arbia G., 2004. Enfoques alternativos a la convergencia regional explotando información espacial
y temporal. Para aparecer en Estudios de Economía Aplica da, 22(2): 429-448.
170 Referencias
Arbia G. y Costantini M., 2004. Prueba de la convergencia estocástica de las regiones italianas
utilizando datos de panel. Ponencia presentada en la Conferencia y Taller "Ciencias de la
Gestión Computacional" sobre "Econometría y Estadística Computacional", abril, Neuchâtel,
Suiza. Para aparecer en Applied Economics Letters, Routledge.
Arbia G. y Lafratta G., 1997. Evaluación y actualización del diseño muestral: el caso de la
concentración de SO2 en Padua, Journal of Agricultural, Biological and Environmental
Statistics, 2(4): 451-466.
Arbia G. y Lafratta G., 2001. Diseños de muestreo espacial optimizados bajo modelos
unisotrópicos de superpoblación, Journal of the Royal Statistical Society, Series C – Applied
Statistics, 51, 2: 223-241.
Arbia G. y Piras G., 2005. Convergencia del PIB per cápita en las regiones EU-NUTS2 utilizando
modelos de datos de panel extendidos a efectos de autocorrelación espacial, documento
de trabajo REAL T03-05, Universidad de Illinois en Urbana-Champain.
Arbia G. y Switzer P., 1994. Diseños óptimos de muestreo espacial paso a paso, Trabajo
ing Paper, Universidad de Padua.
Arbia G., Basile R. y Piras G., 2005. Uso de datos de panel espacial para modelar el crecimiento
y la convergencia regionales, ISAE Working Paper, no. 51-2005.
Arbia G., Basile R y Salvatore M., 2002. Convergencia regional en Italia 1951-
1999: una perspectiva econométrica espacial, ISAE Working Paper, 29/02.
Arbia G., Basile R. y Salvatore M., 2003. Efectos espaciales en el crecimiento regional. Un
enfoque paramétrico y no paramétrico. Documento presentado en la conferencia Analytical
Frontiers in Spatial Aspects of Economic Development, mayo, WIDER, Helsinki.
Arbia G., Benedetti R. and Espa G., 1996. Effects of MAUP on image classifica
ción, Geographical Systems, 3: 123-141.
Referencias 171
Baltagi BH, 2001. Análisis econométrico de datos de panel (segunda edición), John Wiley and
Sons, Chichester, Inglaterra.
Baltagi BH y Li D., 1999. Regresiones artificiales de doble longitud para probar la dependencia
espacial, Econometric Review, 20: 31-40.
Baltagi BH, Song SH y Koh W., 2003. Prueba de modelos de regresión de datos de panel con
correlación de error espacial, Journal of Econometrics, 117: 123-150.
Banerjee S., Carlin Bp y Gelfand AE, 2004. Modelado y análisis jerárquico de datos espaciales,
Chapman & Hall/CRC, Boca Raton.
Barro RJ y Sala-i-Martin X., 1995. Crecimiento económico, McGraw-Hill.
Bartels C., 1979. Métodos estadísticos operativos para analizar datos espaciales. Cª.
Bartels y R. Ketellapper (eds.), Análisis exploratorio y explicativo de datos espaciales,
Martinus Nijhoff, Boston: 5-50.
Bartlett MS, 1963. El análisis espectral de los procesos puntuales, Journal of the Royal
Statistical Society, B, 25: 264-281.
Bartlett MS, 1971. Modelos físicos del vecino más cercano y series temporales no lineales,
Revista de Probabilidad Aplicada, 8: 222-232.
Bartlett MS, 1975. El análisis estadístico del patrón de puntos, Advances in Applied Probability,
6: 336-358.
172 Referencias
Bates C. y White H., 1985. Una teoría unificada de estimación consistente para modelos
paramétricos, Econometric Theory, 1: 151-78.
Baumont C., Ertur C. y Le Gallo J., 2003. Los clubes de convergencia espacial y el proceso
de crecimiento regional europeo, 1980-1995, en B. Fingleton (ed.), Crecimiento regional
europeo, Springer-Verlag, Berlín.
Baumont C., Ertur C. y Le Gallo J., 2004. Análisis espacial del empleo y la densidad de
población: el caso de la aglomeración de Dijon, 1999, Análisis geográfico, 36, 2, 146-176.
Bennett RJ, 1979. Análisis espacial de series de tiempo, pronóstico y control, Pion,
Londres.
Beron KJ y Vijverberg WP, 2004. en L. Anselin, RJGM Florax y S. Rey (eds.), Advances in
Spatial Econometrics: Methodology, Tools and Applications, Springer-Verlag, Berlín.
Beron KJ, Murdoch JC y Vijverberg WP, 2003. ¿Por qué cooperar? Bienes públicos, poder
económico y el protocolo de Montreal, The Review of Economics and Statistics, 85:
286-297.
Besag J., 1972. Sobre el análisis estadístico de los sistemas de vecinos más cercanos,
Actas de la Reunión Europea de Estadísticos, Budapest.
Besag J., 1974. Interacción espacial y análisis estadístico en sistemas de celosía, Journal of
Royal Statistical Society, Serie B, 36: 192-236.
Besag J., 1975. Análisis estadístico de datos sin celosía, The Statistician, 24: 179-195.
Besag J., 1986. Sobre el análisis estadístico de imágenes sucias, Journal of the Royal
Sociedad de Estadística, Serie B, 36: 192-236.
Machine Translated by Google
Referencias 173
Besag, J., York J. y Mollié A., 1991. Restauración de imágenes bayesianas con dos
aplicaciones en estadísticas espaciales, Ann. Inst. Estadística Matemática, 43: 1-21
Bivand RS, 2002. Funciones de econometría espacial en R: clases y métodos,
Revista de Sistemas Geográficos, 4: 405–421.
Bivand RS y Gebhardt A., 2000. Implementación de funciones para el análisis estadístico
espacial utilizando el lenguaje R, Journal of Geographical Systems, 2: 307–317.
Bivand RS y Portnov BA, 2004. Exploración de técnicas de análisis de datos espaciales
usando R: el caso de observaciones sin vecinos, en L. Anselin, RJGM
Florax y S. Rey, 2004, Advances in Spatial Econometrics, Springer-Verlag, Berlín.
Box GEP y Cox DR, 1964. Un análisis de la transformación, Journal of the Royal Statistical
Society, Serie B, 26: 211-243.
Box GEP y Jenkins GM, 1970. Análisis de series de tiempo, pronóstico y contra
trol, Wiley.
Box GEP y Pierce DA, 1970. La distribución de la autocorrelación residual en modelos de
series de tiempo de promedio móvil integrado autorregresivo, Journal of the American
Statistical Association, 65: 1509-1526.
Brock WA, Dechert WD y Scheinkman J., 1987. Una prueba de independencia basada en
la dimensión de correlación, Documento de trabajo 8702 de SSRI, Madison:
Departamento de Economía, Universidad de Wisconsin, Brook D., 1964. Sobre la
distinción entre la dimensión condicional probabilidad y los enfoques de probabilidad
conjunta en la especificación de sistemas de vecinos más cercanos, Biometrika, 51,
481-3.
Burridge P., 1980. Sobre la prueba de Cliff-Ord para la autocorrelación espacial, Journal of
the Royal Statistical Society, Serie B, 42: 107-108.
Caso AC, Rosen H. y Hines JR, 1993. Desbordamientos presupuestarios e interdependencia
de la política fiscal: evidencia de los Estados, Journal of Public Economy, 52: 285-307.
Chapman RN, 1931. Ecología animal con referencia particular a los insectos,
McGraw-Hill, Nueva York.
Chen X. y Conley TG, 2001. Un nuevo modelo espacial semiparamétrico para series de
tiempo de panel, Journal of Econometrics, 105: 59-80.
Machine Translated by Google
174 Referencias
Chow G., 1960. Pruebas de igualdad entre conjuntos de coeficientes en dos regresiones lineales,
Econometrica, 28: 591-605.
Clayton D. y Kaldor J., 1987. Estimaciones empíricas de Bayes de riesgos relativos estandarizados
por edad para su uso en el mapeo de enfermedades, Biometrics, 43: 671-681.
Cliff AD y Ord JK, 1972. Pruebas de autocorrelación espacial entre residuos de regresión,
Geographical Analysis, 4: 267-84.
Cochrane D. y Orcutt GH, 1949. Aplicación de la regresión de mínimos cuadrados a las relaciones
que contienen términos de error autocorrelacionados, Journal of the American Statistical
Association, 44: 32-61
Collett D., 1991. Modelado de datos binarios, Chapman and Hall, Nueva York.
Conley TG, 1999. Estimación GMM con dependencia transversal, Journal of Econometrics, 92: 1-45.
Consigliere I., 1981. La prueba de Chow con errores correlacionados en serie, Rivista Inter
nazionale di Scienze Sociali, 89: 125-37.
Corsi P., Pollock R. y Prakken J., 1982. La prueba de Chow en presencia de errores
correlacionados en serie, en Chow y Corsi (eds.), Evaluating the Reliability of Macro-economic
Models, Nueva York, Wiley: 163 -87.
Cox DR y Snell EJ, 1989. Analysis of Binary Data (segunda edición), Londres:
Chapman y Hall.
Cressie N., 1991. Estadísticas para datos espaciales, Wiley, Nueva York.
Cross GR y Jain AK, 1983. Modelos de textura de campos aleatorios de Markov, IEEE Transaction
on Pattern Analysis and Machine Intelligence, PAMI, 1-5, 1: 25-39.
Christakos G., 1992. Modelos de campo aleatorio en ciencias de la tierra, Academic Press,
San Diego.
de Graaff T., Florax RJGM, Nijkamp P. y Reggiani A., 2001. Una prueba general de mala
especificación para modelos de regresión espacial: heteroscedasticidad, dependencia y no
linealidad, Journal of Regional Sciences, 41: 255-276.
Machine Translated by Google
Referencias 175
Doreian P., 1980. Modelos lineales con datos distribuidos espacialmente, ¿perturbación
espacial o efectos espaciales?, Sociological Methods and Research, 9: 29-60.
Driscoll JC y Kraay AC, 1998. Estimación de matriz de covarianza consistente con datos de
panel espacialmente dependientes, The Review of Economics and Statistics, 80: 549-560.
Durbin J., 1973. Teoría de distribución para pruebas basadas en la función de distribución de
muestra, SIAM, Filadelfia.
Durlauf SN y Quah D., 1999. The new empirics of economic growth, en: J. Taylor y M.
Woodford (eds), Handbook of Macroeconomics, Elsevier Science, North Holland, New
York and Oxford: 235-308.
Elhorst JP, 2001. Modelos dinámicos en el espacio y el tiempo, Análisis geográfico, 33:
119-140.
Machine Translated by Google
176 Referencias
Unión Europea. 2005. Tercer informe de situación sobre la cohesión: hacia una nueva
asociación para el crecimiento, el empleo y la cohesión, Comunicación de la Comisión
de la Comunidad Europea, SEC (2005), 632, mayo, Luxemburgo.
Ertur C. y Le Gallo J., 2003. Un análisis exploratorio de datos espaciales de las disparidades
regionales europeas, 1980-1995, en B. Fingleton (ed), Crecimiento regional europeo,
Sprinter, Berlín.
Eurostat, 2002. Estadísticas regionales europeas, Guía de referencia, Comunidad
Europea, Luxemburgo.
Evans MA y King ML, 1988. Otra clase de pruebas de heterocedasticidad, Journal of
Econometrics, 27: 163-178.
Evans P. y Karras G., 1996a. ¿Convergen las economías? Evidencia de un panel de
estados de EE. UU., Review of Economics and Statistics, : 384-388.
Evans P. y Karras G., 1996b. Convergence Revisited, Journal of Monetary
Economía, 37: 249-265.
Referencias 177
Florax RJGM y de Graaff T., 2004. El rendimiento de las pruebas de diagnóstico para la
dependencia espacial en modelos de regresión lineal: un metanálisis de estudios de
simulación, en L. Anselin, RJGM Florax y S. Rey (eds.), Advances in Econometría
espacial: metodología, herramientas y aplicaciones, Springer-Verlag, Nueva York.
Florax RJGM y Rey S., 1995. El impacto de la estructura espacial mal especificada en modelos
de regresión lineal, en L. Anselin y RJGM Florax (eds.), New Di rections in Spatial
Econometrics, Springer-Verlag, Nueva York: 111- 135.
Florax RJGM y van de Vlist A., 2003. Análisis de datos econométricos espaciales: ir más allá
de los modelos tradicionales, International Regional Science Review, 26: 233-243.
Florax RJGM, De Dominicis L. y De Graaff T., 2004. Procesos ARCH espaciales: una prueba
LM, resultados de simulación experimental e ilustraciones empíricas.
Documento presentado en la 50.ª Conferencia Norteamericana de la Regional Science
Association International (RSAI), Filadelfia, noviembre de 2003.
Fujita M., Krugman P. y Venables AJ, 1999. La economía espacial: ciudades, regiones y
comercio internacional, MIT Press, Nueva York.
Garrett TA, Wagner GA y Wheelock DC, 2003. Un análisis probit espacial de la regulación
bancaria estatal, documento de trabajo 044A, Banco de la Reserva Federal de St.
Louis, St. Louis, MO.
Geman S. y Graffigne C., 1987. Campos aleatorios de Markov y sus aplicaciones a la visión
por computadora, en A. Gleason (ed), Actas del Congreso Internacional de Matemáticas,
American Mathematical Society, Providence.
Gentle JE, 1998. Factorización de Cholesky. §3.2.2 en Álgebra Lineal Numérica para
Aplicaciones en Estadística. Springer-Verlag, Berlín: 93-95.
178 Referencias
Getis A. y Ord JK, 1992. El análisis de la asociación espacial mediante estadísticas de distancia.
tics, Análisis Geográfico, 24: 189-206.
Glejser H., 1969. Una nueva prueba de heterocedasticidad, Journal of the American Statistical
Association, 64: 316-323.
Granger CWJ, 1969. Datos espaciales y análisis de series temporales, en A. Scott (ed), Stud
ies en Regional Science, Pion, Londres.
Granger CWJ, 1974. Aspectos del análisis e interpretación de los datos temporales y
datos espaciales, The Statistician, 24: 197-210.
Greene WH, 2003. Análisis econométrico (quinta edición), Nueva York, Macmillan.
Griffith, DA, 2003. Autocorrelación espacial y filtrado espacial, Springer Verlag, Berlín.
Griffith DA 2004. Funciones propias extremas de matrices de adyacencia para gráficos planos
empleados en análisis espaciales, Linear Algebra and its Applications, 388: 201-219.
Grimmett GR, 1973. Un teorema sobre campos aleatorios, Bulletin of the London
Sociedad Matemática, 79: 5.
Referencias 179
Haining RP, 1978. El modelo de promedio móvil para la interacción espacial, Transac
Instituto Nacional de Geógrafos Británicos, NS 3: 202-225.
Haining RP, 1990. Análisis de datos espaciales en las ciencias sociales y ambientales, Cambridge
University Press, Cambridge.
Haining RP, 2003. Análisis de datos espaciales, Cambridge University Press, Cam
puente.
Hamilton JD, 1994. Análisis de series temporales, Princeton University Press, Princeton,
New Jersey.
Hansen LP, 1982. Propiedades de muestras grandes de la estimación generalizada del método de los
momentos, Econometrica, 1029-1054.
Harrison MJ y McCabe BP, 1979. Una prueba de heterocedasticidad basada en residuos de mínimos
cuadrados ordinarios, Journal of the American Statistical Association, 74: 494-499.
Harvey A. y Carvalho V., 2002. Modelos para economías convergentes, Cambridge Working Paper,
marzo.
Hausdorff F., 1914. Gundzüge der Mengenlehre, Von Vent, Leipzig, Alemania.
Reimpreso como Teoría de conjuntos, (segunda edición), Chelsea, Nueva York, 1962.
Heijmans R. y Magnus J., 1986. Estimación consistente de máxima verosimilitud con observaciones
dependientes: el caso general (no normal) y el caso normal, Journal of Econometrics, 32: 253-285.
Hepple LW, 2003. Elección del modelo bayesiano en econometría espacial, Documento para LSU,
Conferencia de econometría espacial, Baton Rouge, noviembre.
Holloway G., Shankar B. y Rahman S., 2002. Estimación probit espacial bayesiana: una cartilla y una
aplicación para la adopción de arroz HYV, Agricultural Economics, 27: 383-402.
Holly S. y Weale M., 2000. Modelado econométrico, Cambridge University Press, Cambridge.
Hordijk L., 1974. Correlación espacial en la perturbación de modelos lineales interregionales, Regional
Science and Urban Economics, 4: 117-40.
Hsiao C., 1986. Análisis de datos de panel, Cambridge University Press, Cambridge.
Huang JS, 1984. El modelo de promedio móvil autorregresivo para el análisis espacial,
Diario australiano de estadísticas, 26: 169-178.
Machine Translated by Google
180 Referencias
Isard W., 1960. Methods of Regional Analysis, Technology press of MIT and
Wiley, Nueva York.
Islam N., 1995. Growth empirics: a panel data approach, Quarterly Journal of
Economía, 110: 1127-1170.
Islam N., 1998. Crecimiento empírico: un enfoque de datos de panel. Una respuesta, Trimestral
Revista de Economía, 113(1): 325-329.
Ising E., 1925. Beitray sur theorie des ferromagnetismus, Zeitschrift Physic, 31:
253-258.
Judge GG, Griffiths WE, Hill RE, Luetkepohl H. and Lee TC., 1988. Introducción a la teoría y
práctica de la econometría, John Wiley and Sons, Nueva York.
Kaiser MS y Cressie N., 1997. Modelado de variables de Poisson con dependencia espacial
positiva, Statistics and Probability Letters, 35: 423-432.
Kaldor N., 1957. Un modelo de crecimiento económico, Economic Journal, 67: 591-624
Kaldor N., 1970. El caso de las políticas regionales, Scottish Journal of Political Economy, 17:
37-48.
Kaluzny S., Vega S., Cardoso T. y Shelly A., 1997. (S+)SpatialStats User's
Manual, Springer-Verlag, Nueva York, NY.
Kelejian HH y Prucha L., 2001. Sobre la distribución asintótica del estadístico de prueba Moran
I con aplicaciones, Journal of Econometrics, 104: 219-257.
Referencias 181
Keleijan HH y Robinson DP, 1995. Correlación espacial: una alternativa sugerida al modelo
autorregresivo, en L. Anselin y RJGM Florax (eds.), New Directions in Spatial Econometrics,
Springer-Verlag, Berlín: 5-95.
Kendall M. y Stuart A., 1979. The Advanced Theory of Statistics, vol. 2 (cuarto
edición), Charles Griffin & Co, Londres.
Kim H., Sun D. y Tsutaka RK, 2001. Un método Bayesiano bivariado para mejorar las estimaciones
de las tasas de mortalidad con un modelo autorregresivo condicional doble, Journal of the
American Statistical Association, 96: 1506-1521.
Klaassen LH, Paelinck JHP y Wagenaar S., 1979. Sistemas espaciales, Saxon House, Farnborough.
Klevmarken NA, 1989. Estudios de panel: ¿qué podemos aprender de ellos? una introducción
ducción, European Economic Review, 33: 523-529.
Kmenta J., 1997. Elements of Econometrics, (segunda edición), Macmillan, Nueva York.
Künsch H., 1981. Termodinámica y análisis estadístico de campos aleatorios gaussianos, Whar.
versión Geb., 58: 401-421.
Land K. y Leane G., 1992. Sobre la estimación de muestras grandes de modelos de regresión
con términos de efectos de redes espaciales: un enfoque de mínimos cuadrados en dos
etapas, en P. Mars den (ed.), Sociological Methodology, Jossey–Bass, San Francisco: 221-248.
Machine Translated by Google
182 Referencias
Lee LF, 2002. Consistencia y eficiencia de la estimación por mínimos cuadrados para
modelos autorregresivos espaciales regresivos mixtos, Econometric Theory, 18: 252-277.
LeSage J., 1997. Estimación bayesiana de modelos autorregresivos espaciales, Interna
Revista científica regional nacional, 20: 113-129.
LeSage J., 1999. Spatial Econometrics: The Web Book of Regional Science, Regional
Research Institute, West Virginia University, Morgantown, WV.
LeSage J., 2000. Estimación bayesiana de autore espacial de variable dependiente limitada
modelos progresivos, Análisis Geográfico, 32: 19-35.
LeSage J., 2004. Una familia de modelos de regresión ponderados geográficamente, en L.
Anselin, RJGM Florax y S. Rey (eds.), Advances in Spatial Econometrics: Methodology,
Tools and Applications, Springer-Verlag, Nueva York.
LeSage J. y Krivelyova A., 1999. Una previa espacial para los modelos autorregresivos
vectoriales bayesianos, Journal of Regional Science, 39: 297-317.
Ljung GM y Box GEP, 1978. Sobre una medida de falta de ajuste en series de tiempo mod
els, Biometrika, 65: 297-303.
Lotka AJ, 1956. Elements of Mathematical Biology, Dover, Nueva York (reimpresión del libro
original de 1924).
Maddala G., 2001. Econometría, McGraw-Hill, Nueva York.
Mankiw NG, 1995. El crecimiento de las naciones, Brooking Papers on Economic Activ ity,
1: 275-326.
Mankiw NG, Romer D. y Weil D., 1992. Una contribución a los datos empíricos del crecimiento
económico, Quarterly Journal of Economics, 107: 407-437.
Mardia KV, 1970. Medidas de asimetría multivariada y curtosis con aplicaciones, Biometrika,
57: 519-530.
Referencias 183
McLeish D., 1975. Una desigualdad máxima y una ley fuerte dependiente, The Annals of Probability,
3: 827-39.
Mead R., 1967. Un modelo matemático para la estimación de la competencia entre plantas,
Biometrics, 30: 295-307.
Mood AM, Graybill FA y Boes DC, 1974. Introducción a la Teoría de la Estadística, McGraw-Hill,
Nueva York.
Mur J. y Trìvez FJ, 2003. Raíces unitarias y tendencias deterministas en modelos econométricos
espaciales, International Regional Science Review, 26: 289-312.
Murdoch JC, Sandler T. y Sargent K., 1997. Una historia de dos colectivos: reducción de emisiones
de azufre versus óxido de nitrógeno en Europa, Public Finance Quarterly, 21: 334-350.
Newey W. y West K., 1987. Una matriz de covarianza coherente con autocorrelación y
heteroscedasticidad semidefinida positiva simple, Econometrica, 55: 703-708.
Oberhofer J. y Kmenta J., 1974. Procedimiento general para obtener estimaciones de máxima
verosimilitud en modelos de regresión generalizados, Econometrica, 42: 579-90.
Olmo JC, 1995. Estimación espacial de precios de vivienda y rentas locativas, Estudios Urbanos,
32: 1331-1344.
Machine Translated by Google
184 Referencias
Ord JK, 1975. Métodos de estimación para modelos de interacción espacial, Journal of the
American Statistical Association, 70: 120-126.
Ord JK y Getis A., 1995. Estadísticas de autocorrelación espacial local: problemas de distribución
y una aplicación, Geographical Analysis, 27, 4: 286-306.
Ottaviano GMIP y Puga D., 1998. Aglomeración en la economía global: un estudio de la 'nueva
geografía económica', World Economy, 21 (6): 707-731.
Pace RK y Barry R., 1998. Spatial Statistics Toolbox 1.0, Real Estate Research
Instituto, Universidad Estatal de Luisiana, Baton Rouge, LA.
Pace RK, Barry R., Clapp JM y Rodiquez M., 1998. Modelos autorregresivos espacio-temporales
de efectos de vecindad, Journal of Real Estate Finance and Economics, 17: 15-33.
Pace RK, Barry R., Slawson VC y Sirman CF, 2004. Transformaciones simultáneas de formas
espaciales y funcionales, en L.Anselin, RJGM Florax y SJ
Rey (eds), Avances en econometría espacial: metodología, herramientas y aplicaciones,
Springer-Verlag, Berlín.
Paelinck JHP, 1967. L'efficacité de la politique économique régionale, Namur, Faculté des Sciences
Economiques.
Referencias 185
Paelinck JHP y Klaassen LH, 1979. Econometría espacial, Gower, West Mead, Farnborough.
Paelinck JHP y Nijkamp P., 1975. Teoría y métodos operativos en economía espacial, Saxon House
y Lexington, Farnborough y Massachusetts.
Pesaran MH, 2004b. A pair-wise approach to testing for output and growth convergence, Mimeo,
Universidad de Cambridge, agosto.
Pinkse J., 1998. Una prueba no paramétrica consistente para la independencia de series, Journal
of Econometrics, 84: 205-231.
Pinkse J., 1999. Asintótica de la prueba de Moran y una prueba de correlación espacial en modelos
probit, documento de trabajo del Departamento de Economía, Universidad de British Columbia,
Vancouver, BC.
Pinkse J., 2004. Pruebas con sabor a Moran con parámetros molestos: ejemplos en L.
Anselin, RJGM Florax y S. Rey (eds.), Advances in Spatial Econometrics: Methodology, Tools
and Applications, Springer-Verlag, Nueva York.
Pinkse J. y Slade ME, 1998. Contacto en el espacio: una aplicación de estadísticas espaciales a
modelos de elección discreta, Journal of Econometrics, 85: 125-154.
Pinkse J., Shen L. y Slade M., 2003. Probit espacial dinámico con efectos fijos utilizando GMM de
un paso: una aplicación a las decisiones operativas de la mina. Bajo envío al Journal of
Econometrics.
Pinkse J., Slade ME y Brett C., 2002. Competencia espacial de precios: una semi
enfoque paramétrico, Econometrica, 70: 1111-1153.
Pirandello L., 1921. Sei personaggi in cerca d'autore, R. & F. Bemporad, Floren
Ce.
Pisati M., 2001. Herramientas para el análisis de datos espaciales, Boletín técnico de Stata, 60: 21–
37.
Postiglione P., Arbia G. y Salvatore M., 2002. Empíricos para la convergencia regional: el papel de
la dependencia espacial. Documento presentado en la reunión nacional de la Sociedad Italiana
de Estadística, Milán, junio.
Press, WH, Flannery BP, Teukolsky SA y Vetterling, WT, 1992. LU Descomposición y sus
aplicaciones. §2.3 en Recetas numéricas en FORTRAN: The Art of Scientific Computing,
(segunda edición), Cambridge University Press, Cambridge, Inglaterra: 34-42.
Preston CJ, 1973. Estados de Gibbs generalizados y campos aleatorios de Markov, Avances
en Probabilidad Aplicada, 5: 242-261.
Machine Translated by Google
186 Referencias
Quah D., 1993a. Dinámica transversal empírica en el crecimiento económico, European Economic
Review, 37:426-434.
Quah D., 1996b. Clústeres de convergencia regional en toda Europa, European Eco
Revista económica, 40: 951-958.
Quah D., 1997. Empirics for growth and distribution: estratification, polarization and convergence
clubs, Journal of Economic Growth, 2: 27-59.
Quandt R., 1958. La estimación de parámetros de un sistema de regresión lineal que obedece
a dos regímenes separados, Journal of the American Statistical Association, 53: 873-880.
Rao CR, 1948. Pruebas de gran muestra de hipótesis estadísticas relativas a varios parámetros
con aplicaciones a problemas de estimación, Procedimientos de la Sociedad Filosófica de
Cambridge, 44: 50-57.
Rey SJ, 2001. Empírica espacial para el crecimiento económico y la convergencia, Análisis
geográfico, 33: 195-214.
Rey SJ, 2003. Análisis espacial del crecimiento económico regional, la desigualdad y el cambio,
en M. Goodchild y D. Janelle (eds.), Spatially Integrated Social Science, Oxford University
Press, Nueva York, NY.
Rey SJ y Montouri BD, 1998. Convergencia de ingresos regionales de EE. UU.: una perspectiva
econométrica espacial, Regional Studies, 33: 143-156.
Ripley BD, 1988. Inferencia estadística para procesos espaciales, Cambridge University Press,
Cambridge.
Ripley BD, 1990. Modelos de interacción gibbsiana, en D. Griffith (ed), Estadística espacial:
pasado, presente y futuro, Monografía no. 12, Instituto de Geografía Matemática.
Saavedra LA, 2003. Prueba de dependencia del retardo espacial basada en la estimación del
método de momentos, Regional Science and Urban Economics, 33: 27-58.
Referencias 187
Shapiro SS y Wilk MB, 1965. Un análisis de las pruebas de varianza para la normalidad
(muestras completas), Biometrika, 52: 591.
Silvey SD, 1959. La prueba del multiplicador de Lagrangian, Annals of Mathematical Statis
tics, 30, 389-407.
Smith T., 1980. Un teorema del límite central para muestras espaciales, Geographical
Analysis, 12: 299-324.
Solon GS, 1989. El valor de los datos de panel en la investigación económica, en D. Kasprzyk,
GJ Duncan, G. Calton y MP Singh (eds), Panel Surveys, John Wiley, Nueva York: 486-496.
Solow RM, 1956. Una contribución a la teoría del crecimiento económico, Quarterly Journal of
Economics, 70, 1: 65-94.
188 Referencias
Temple J., 1999. La evidencia del nuevo crecimiento, Journal of Economic Literature, 37,
112-156.
Tiefelsdorf M., 2002. La aproximación del punto de silla de las distribuciones de referencia de
Moran's I's y Moran's Ii's local y su evaluación numérica, Geo graphical Analysis, 34:
187-206.
Tiefelsdorf M. and Boots BN, 1995. La distribución exacta de Moran's I. Envi ronment and
Planning A, 27: 985-99.
Tobler W., 1970. Una película de computadora que simula el crecimiento urbano en Detroit re
gion, Suplemento de Geografía Económica, 46: 234-40.
Upton G. y Fingleton B., 1985. Análisis de datos espaciales mediante el ejemplo: patrón de
puntos y datos cuantitativos, volumen 1, Wiley, Nueva York.
Upton G. y Fingleton B., 1989. Análisis de datos espaciales por ejemplo: categórico
y Directional Data, Volumen 2, Wiley, Nueva York.
Verbeek M., 2000. Una guía para la econometría moderna. John Wiley e hijos, Nueva
York.
Verdoorn P., 1949. Fattori che regolano lo sviluppo della produttività del lavoro, L'industria, 1:
3-10.
Wall MM, 2004. Una mirada cercana a la estructura espacial implícita en los modelos CAR y
SAR, Journal of Statistical Planning and Inference, 121: 311-324.
Referencias 189
Whittle PJ, 1954. Sobre procesos estacionarios en el plano, Biometrika, 41: 434-49.
Whittle PJ, 1962. Correlación topográfica, funciones de covarianza de ley de potencia y difusión,
Biometrika, 49: 305-314.
Whittle PJ, 1963. Procesos estocásticos en varias dimensiones, Boletín del Instituto Internacional
de Estadística, 40(2): 975-994.
Woolridge JM y White H., 1988. Algunos principios de invariancia y teoremas del límite central
para procesos heterogéneos dependientes, Econometric Theory, 4: 210-230.
Yaglom AM, 1961. Campos aleatorios homogéneos de segundo orden, Actas del 4º Simposio de
Berkeley sobre Matemáticas, Estadística y Probabilidad, University of California Press,
Berkeley, 2: 593-622.
Lista de tablas
Tabla 1.1. Estadísticas descriptivas de los ingresos per cápita y tasas de crecimiento en
las 92 provincias italianas (años 1951 y 1999). ..........................17
Tabla 1.2. OLS Estimaciones de la regresión de convergencia ÿ del ingreso per cápita
en las 92 provincias italianas (1950-1999). (Los números entre paréntesis
se refieren a los valores p). .................................................... ........20
Tabla 5.2. Convergencia del ingreso per cápita en las 92 provincias italianas
(1950-1999) – Modelos de dependencia espacial – Estimaciones ML
(los números entre paréntesis se refieren a los valores p). ....................................137
Tabla 5.6. Convergencia de la renta per cápita en los 129 países europeos
Regiones NUTS-2 (1950-1999) – Modelos de dependencia espacial –
Estimaciones de máxima verosimilitud (los números entre paréntesis se
refieren a los valores p). .................................................... ..........................143
Tabla 5.7. Convergencia de la renta per cápita en los 129 NUTS-2 europeos
regiones (1980-1996) – Invariancia espacial de parámetros. ..........144
Tabla 5.8. Convergencia de la renta per cápita en las 119 regiones europeas NUTS-2
(1950-1999). Modelos de dependencia espacial con regímenes espaciales
(estimaciones ML) (los números entre paréntesis se refieren a los valores
p). .................................................... ..........................................145
Machine Translated by Google
Machine Translated by Google
Lista de Figuras
Figura 1.3. Distribución del PIB per cápita (expresado en logaritmo natural) en las 92
provincias italianas; (a) año 1951 y (b) año 1999. ................17
Figura 1.4. Distribución de las tasas de crecimiento del PIB per cápita (logaritmo) de
las provincias para las 92 provincias italianas durante el período 1951-1999 ........... 18
Figura 1.6. ÿ-convergencia entre las provincias italianas. Diagrama de dispersión de la tasa
de crecimiento durante el período 1951-1999 versus el logaritmo natural del
PIB per cápita (1951).................................... .......................19
Figura 1.7. Mapa de los residuos estandarizados empíricos de la Ecuación (1.21) estimados
en las 92 provincias italianas. Las tasas de crecimiento se han medido para el
período 1950-1999. Los residuos grandes se identifican como aquellos que
exceden más o menos una desviación estándar y se muestran en blanco y
negro respectivamente. ..........21
Figura 1.8. Convergencia ÿ de la renta per cápita de las regiones europeas durante
el período 1980-1996 (coeficiente de variación) ................................23
Figura 1.9. Distribución del PIB per cápita (expresado en logaritmo natural) en las 129
regiones europeas NUTS-2 en (a) 1980 y (b) 1996. ..........24
Figura 1.10. Distribución de las tasas de crecimiento del PIB per cápita (expresadas en
logaritmo natural) en las 129 regiones europeas NUTS-2 en el período
1980-1996.................................................... ..........................................25
Figura 1.11. ÿ-convergencia entre las regiones europeas. Diagrama de dispersión de la tasa
de crecimiento durante el período 1980-1996 versus el logaritmo natural del
PIB per cápita (1980).................................... .......................25
Figura 1.12. Mapa de los residuos empíricos estandarizados de la Ecuación (1.10) estimados
sobre las 129 regiones a nivel NUTS-2 durante el período 1980-95. Los
residuos se clasifican en las 4 clases intercuartiles. ........26
Figura 2.1. Tres posibles tipologías de datos espaciales discretos: (a) Puntos,
(b) Red de celosía regular y (c) Red de celosía irregular. ..........................34
Machine Translated by Google
Figura 2.2. Ejemplo de datos puntuales: la ubicación de las empresas textiles dentro del
área del municipio de Prato. Cada punto representa una empresa. Tomado
de Arbia y Espa (1996a)................................................ ...................35
Figura 2.4. Si las características del proceso no cambian durante la traducción, se dice
que el proceso es homogéneo. Si no cambian bajo rotación, se dice que el
proceso es isotrópico. .............................44
Figura 3.1. Modelo de codificación para un campo de parámetros continuos (a) y para un
campo de parámetros discretos (b) ........................................... .....................76
Índice de nombres
UN Basu S. 68
Bates C. 81
Agresti A. 124
Aitchinson J. 83 Baumont C. 138, 149, 150, 154
Clayton D. 57 Edgard GA 36
Acantilado AD 3, 90, 91, 92, 153 Elhorst JP 148, 160
Cressie N. 3, 51, 57, 65, 68, 101, 126, Fingleton B. 3, 7, 8, 150, 151
155 Fisher R. 73, 74, 81, 82, 84, 99, 133
Cruz GR 55 Fleissig A. 150 Fleming MM 153 Florax
RJGM 4, 147, 152, 156,
D
De Vlist A. 4
Alemán JS 152 Galámbos J. 57
Douglas PH 9 Alemán S. 80
Branquia M. 5
yo
Graffigne C. 80 j
Granger CWJ 4, 152 Jainista AK 55
Greene WH 4, 81
Jarque CM 20, 23, 26, 121, 164
Gress B 155
Jenkins Gerente General 4
H
k
Haining RP 3, 51, 55, 65, 161, 162
Káiser MS 51, 57
Hamilton JD 33, 48, 64
Kaldor J. 57, 151
Hammersey JM 50
Kaldor nº 57, 151
Hansen LP 155
Kaluzny S. 166
Harrison MJ131
Karras G. 150
Harvey A. 151
Kelejian HH 128, 156 – 160
Hausdorff F. 36
Kendall MS 121, 122 Kennedy
Hayashi F. 4
P. 5, 17, 90
Heijmans R. 81
Khinchín A. 48
Hendry DF 4, 159
Kim H. 59
Hepple LW 154
Rey ML 131
Heráclito 1
Klaassen LH 3
Holloway G. 154
Klevmarken NA 148
Holly S. 4 Hordijk
Kmenta J. 5, 17, 90, 110
L. 108
Kobayashi M. 21
Hsiao C. 148
Kolmogorov A. 121
Huang JS 66
Kraay AC 155
Hudak S. 161
Krivelyova A. 154
Machine Translated by Google
Lagrange J.-L. 81, 83, 91, 98, 106, Moreno R. 156, 157
129, 130, 136, 138, 142, 146, 156, Morgan MS 4
157, 158, 164 Mur J. 150
Terreno K. 160
Murdoch JC 37, 153
El Gallo J. 162
Leane G. 160 norte
Ottaviano GMIP 7
MacKinnon JG 4, 126, 128, 129,
157
PAG
Pirandello L. 3 Slutsky EE 65
Piras G. 147, 151, 163 Smirnov O. 80, 121, 162, 165
Pisati M. 166 Herrero T. 72
Veneno SD 57 Snell EJ 124
Portnov BA 166 Solon GS 148
Verdoorn pág. 151 Blanco Alt. 49, 70, 72, 81, 128 – 130,
155
Vijverberg WP 153, 160
Whittle PJ 3, 33, 63, 80, 90, 101
W Wilk MB 121
Índice de materias
Consistencia 51, 57, 69, 74, 80, 81, 111, 114, Elasticidad de la salida 9
117, 119, 126, 128, 129, 138, 149, 155, Ley empírica del 2% 23
159 – 161
Endogeneidad 160
Rendimientos constantes a escala 8, 9, 151
Crecimiento endógeno 149
Barrio basado en contigüidad 37
Aplicaciones medioambientales 166
Campo aleatorio de parámetros continuos 34,
Estudios epidemiológicos 57
36, 37, 45, 76, 78, 79
Epidemiología 3
Clubes de convergencia 138, 149, 150
Ergodicidad 48
Convergencia en la distribución 70 Mecanismo de corrección de errores 151
Convergencia en probabilidad 48, 69, distancia euclidiana 36
71
Unión Europea 7, 14, 15, 16, 18, 22, 138,
Núcleo-periferia 16, 22
144, 151
Estimador de covarianza 155, 160
Corte crítico 37 F
Datos transversales 5, 6, 31, 90, 148, 160
Ferromagnetismo, ley del 55
Geografía 3, 5, 6, 14, 15, 16, 18, Campo aleatorio isotrópico 44, 45, 78,
21, 22, 27, 32 – 34, 37, 38, 40, 46, 68, 90, 96, 79
136, 138, 139, 144, 153, 154, 158, 164 Métodos iterativos 108, 109
Geoestadística 155
L
Heterocedasticidad-Consistente
Estimador de matriz de covarianza Operador de retardo 38, 63
(HCCME) 128
Prueba del multiplicador de Lagrange 81, 83, 91,
Homocedasticidad 20, 86, 89, 95, 120, 126 – 98, 106, 129, 130, 136, 138, 142, 146, 156,
131, 135 157, 158, 164
Machine Translated by Google
Lyapunov condición 72
norte
METRO
Componente no sistemático 14, 20, 27, 87, Modelo de probabilidad 14, 31, 32, 33,
95, 97, 101, 102, 104, 105, 106, 108, 68, 73, 74, 81, 86 – 89, 93 – 95, 120,
109, 111, 112, 120, 121, 123, 133 126, 131, 132, 138, 143
Función de producción 8, 9, 11
Distribución normal 14, 57, 68, 92, 122, 123,
pseudoverosimilitud 79, 80, 103, 114
156
Paridades del poder adquisitivo (PPA) 22
Transformaciones de normalización 123,
131
q
Prueba de normalidad 20, 23, 26, 92, 121
Procedimiento Quandt 134
Parámetros molestos 114, 119, 156
Algoritmos numéricos 98
R
Integración numérica 156
Campos aleatorios 31, 33, 34, 36 – 60,
Maximización numérica 103, 119
62, 63, 65, 66 – 72, 75 – 79, 81, 83,
TUERCAS 15, 16, 22, 24 – 26, 141 – 145
85, 91, 93, 94, 96, 98, 99, 101 – 105,
110 – 112, 116, 118, 121, 122, 125,
O 126, 131
Concentración regional 6
aproximaciones 162
Crecimiento de la población 8
S
Análisis de pobreza 149, 152 S+166
Propiedades de muestras pequeñas 155, 156, Invariancia espacial de los parámetros 89, 140, 144
158
Enfoque de Solow-Swan 8
Logit espacial 154, 166
SpaceStat 135, 136, 163, 164, 165
Campo de media móvil espacial (SMA) 65, 66, 68,
Modelos de espacio-tiempo 152, 154 91
Matriz dispersa 161, 162, 166 Multiplicador espacial 153
Herramientas de análisis espacial 166 Valores atípicos espaciales 154, 162, 165
Autocorrelación espacial 5, 41, 90, Modelos de datos de panel espacial 148, 161
91, 102, 109, 134, 141, 142, 148, 149, 152,
Competencia espacial de precios 51, 160
154, 155, 157, 158, 160, 165, 166
Prioridades espaciales 154
Autocovarianza espacial 41, 42, 64 – 67, Modelo espacial de efectos aleatorios 148
Modelo de factor común espacial 159 Campo de ruido blanco espacial 66, 67, 112,
116
Correlación cruzada espacial 42, 156
Variable rezagada espacialmente 38, 39, 60, 97,
Covarianza cruzada espacial 42, 93
104, 110, 111, 114, 117, 121, 126, 148, 156,
Dependencia espacial 4 – 6, 17, 33, 43, 46, 159, 160
55, 57, 69, 90, 95, 110, 116, 128, 130, 136
Estadísticas Espaciales 166
– 138, 140 – 143, 145, 146, 148, 151, 153,
155 – 158, 161, 164, 165 Espacio-temporal ARCO 152
Velocidad de convergencia 10 – 13, 18, 20, Modelos espaciales que requieren mucho tiempo
23, 26, 137, 138, 140 – 145 162
Mecanismo generador de estadísticas 86 – Mezclar uniformemente los campos 47, 48, 70,
89, 94, 132 71
Componente sistemático 13, 87, 95, 97, 125 Ley de Verdoorn 151
W
T
Prueba de Wald 81 – 83, 98, 106, 133
Cuentas 57
exogeneidad débil 87, 95
Progreso tecnológico 10, 150
Estacionariedad de sentido débil 45, 46
Dependencia temporal 20, 91, 151,
Matriz de pesos 111, 161
152
Disparidades de bienestar 7
Mínimos cuadrados de tres etapas (3SLS)
Prueba blanca 129
160
Winbugs 166
Serie temporal 4 – 6, 15, 20, 32, 38, 48, 64, 65,
66, 68, 75, 79, 108, 110, 111, 133, 134, 148, Campo de Poisson windsorizado 57
150 – 152, 155, 160