Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dependencia Espacial
La dependencia espacial es multidireccional, es decir, una región puede estar afectada no solamente por otra región contigua
o vecina sino por otras que la rodean, al igual que ella puede afectar a las otras. Para la medición de dependencia espacial se
han propuesto numerosos estadísticos, uno de los más utilizados es el índice de Moran (1948).
Modelos Espaciales
En el dado caso de que los estadísticos de dependencia espacial indiquen asociación de este tipo, será necesario un modelo
de regresión espacial que tome en cuenta dicha dependencia
Prácticamente todas las formulaciones estadísticas pueden aplicarse a datos geográficos de igual forma que se aplican a datos
no espaciales. No obstante, la particular naturaleza de la información geográfica hace que algunas de estas formulaciones
puedan adaptarse de forma específica para obtener resultados más correctos. En este capítulo, intentaremos profundizar
sobre el empleo de estas herramientas estadísticas dentro del ámbito de un SIG, como son los métodos de regresión, sean
estos simples o múltiples, que consideran explícitamente el componente espacial de los datos.
Regresión espacial
El análisis de regresión permite modelar, examinar y explorar relaciones espaciales que puede ayudar a explicar los factores
detrás de los patrones espaciales observados. Probablemente sea la estadística que se utiliza con mayor frecuencia en las
ciencias sociales. La regresión se utiliza para evaluar las relaciones que existen entre dos o más atributos de entidades.
La identificación y medición de las relaciones permite comprender mejor lo que sucede en un lugar, prever el lugar donde es
probable que suceda algo o comenzar a examinar las causas que hacen que algo suceda en un lugar determinado. Sin
embargo, al modelar las relaciones espaciales, el análisis de regresión también se puede utilizar para la predicción.
Regresión lineal
Para comenzar esta sección, recordaremos el modelo de regresión lineal que será nuestro punto de partida para estudiar los
principales modelos de regresión espacial. Las relaciones lineales son positivas o negativas. Por ejemplo, si se descubre que el
número de contagiados por COVID aumenta cuando aumentan las aglomeraciones, se dice que hay una correlación positiva.
Otra forma de expresar una correlación positiva es decir que los contagios por COVID disminuyen a medida que disminuyen
las aglomeraciones. Por el contrario, si se descubre que la cantidad de delitos disminuye a medida que la cantidad de agentes
de policía que patrullan un área aumenta, se dice que la relación es negativa. También puede expresar esta relación negativa
al establecer que la cantidad de delitos aumenta a medida que la cantidad de agentes de policía que patrullan disminuye.
Regresión espacial
Razones principales por las que puede desear utilizar el análisis de regresión:
• Para modelar algún fenómeno, para entenderlo mejor y posiblemente utilizar ese entendimiento para llevar a cabo la
política o tomar decisiones sobre las medidas apropiadas a tomar. El objetivo básico es medir la extensión que cambia en
una o más variables que en conjunto afectan los cambios en la otra.
• Para modelar algún fenómeno para prever valores en otros lugares u otros tiempos. El objetivo básico es crear un modelo
de predicción que sea consistente y preciso.
• Para explorar las hipótesis, supongamos que modela los delitos residenciales para entenderlos mejor e implementar con
optimismo la política que podría prevenirlos. A medida que comience su análisis, es probable que tenga preguntas o
hipótesis que desee examinar.
Conceptos básicos
Es imposible discutir el análisis de regresión sin familiarizarse primero con algunos términos y conceptos básicos específicos
de la estadística de regresión:
Regresión espacial
Ecuación de regresión: es la fórmula matemática que se aplica a las variables explicativas para prever mejor la variable
dependiente que intenta modelar. Desafortunadamente para aquellos geocientíficos que piensan en X e Y como
coordenadas, la anotación en las ecuaciones de regresión para la variable dependiente es siempre Y, y para la variable
independiente o explicativa es siempre X.
Regresión espacial
Variable dependiente/ de respuesta (Y): es la variable que representa el proceso que se intenta predecir o entender.
Variables independientes/explicativas (X): son las variables utilizadas para modelar o predecir los valores de la variable
dependiente
Coeficientes de regresión (β): coeficientes que calcula la herramienta de regresión. Son valores, uno para cada variable
explicativa, que representan la fortaleza y el tipo de relación que tiene la variable explicativa con la variable dependiente.
Valores P: La mayoría de los métodos de regresión realizan una prueba estadística para calcular una probabilidad, llamada
valor P, para los coeficientes asociados a cada variable independiente. Las variables con coeficientes cercanos a cero no
ayudan a prever o modelar la variable dependiente; casi siempre se quitan de la ecuación de regresión, a menos que haya
razones teóricas fuertes para mantenerlos.
R2/R cuadrado: R cuadrado múltiple y R cuadrado ajustado son estadísticas derivadas de la ecuación de regresión para
cuantificar el rendimiento del modelo. El valor de R2 va desde 0 a 100 por ciento (0 a 1). Lo más probable es que se observe
valores de R2 = 0,49, por ejemplo, que se puede interpretar de la siguiente forma: "Este modelo explica el 49 por ciento de la
variación en la variable dependiente".
Regresión espacial
Residuales: estos son la porción sin explicar de la variable dependiente, representada en la ecuación de regresión con
el término de error aleatorio ε. Los valores conocidos de la variable dependiente se utilizan para crear y calibrar el modelo
de regresión. Al utilizar valores conocidos para la variable dependiente (y) y valores conocidos para todas las variables
explicativas (X), la herramienta de regresión construye una ecuación que preverá esos valores conocidos y posibles. Sin
embargo, los valores previstos raramente coinciden exactamente con los valores observados. La diferencia entre los valores
observados y los valores previstos se llama residual.
Las áreas en rojo son ubicaciones donde los valores reales son más grandes que el modelo estimado. Las áreas en azul son
ubicaciones donde los valores reales son más pequeños que el modelo estimado.
Regresión espacial
Modelos de regresión
Técnica MCO
MCO (OLS, ordinary least squares) atribuído a Carl Friedrich Gauss, es la más conocida de todas las técnicas de regresión.
También es el punto de inicio adecuado para todos los análisis de regresión espacial. Proporciona un modelo global de la
variable o proceso que intenta entender o prever; crea una ecuación de regresión simple para representar ese proceso.
Los datos espaciales exhiben dos propiedades que hacen difícil (pero no imposible) cumplir con las presuposiciones y los
requisitos de los métodos estadísticos (no espaciales) tradicionales, como la regresión de MCO:
• En general, las entidades geográficas están autocorrelacionadas espacialmente; esto significa que las entidades cercanas
tienden a ser más similares que las entidades que están más lejos. Esto crea un tipo de influencia que cuenta más para los
métodos de regresión (no espaciales) tradicionales.
• La geografía es importante y a veces los procesos más importantes para lo que está modelando son no estacionarios; estos
procesos se comportan de manera diferente en distintas partes del área de estudio. Esta característica de los datos
espaciales se puede denominar variación regional o no estacionariedad.
Regresión espacial
La función de regresión
Ŷ = β 1 + β2 X
Ecuaciones normales
ß1 = y 2 x
β2 =
xy n x y
x nx 2 2
Regresión espacial
-1≤ r ≤ 1
r
n ( xy) ( x)( y)
n x ( x) n y ( y)
2 2 2 2
Regresión espacial
Es una medida de la bondad de ajuste, indica qué ta bien se ajusta la recta de regresión
estimada con los auténticos valores de Y
0 ≤ r2 ≤ 1
n xY ( x)( Y )
2
r
2
• Los modelos económicos nunca describen con perfección la relación entre las variables
debido a que los procesos que generan los datos son demasiado complejos para ser
descritos por un simple modelo matemático.
Se = Y 2
1 Y 2 XY
n2
Mientras mas grande sea el error estándar de la estimación, mayor será la dispersión de
los puntos alrededor de la línea de regresión . De manera inversa, si Se = 0, se espera
que la ecuación de estimación sea un estimador perfecto de la variable dependiente
Regresión espacial
Regresión múltiple
Tiene la ventaja de que permite utilizar más información para estimar una variable
dependiente.
Regresión espacial
Ŷ = ϐ1 + ϐ 2 X1 + ϐ 3 X2 + ……+ ϐ k Xk
Ecuaciones normales para tres variables
Y n X X
1 2 1 3 2
1
X Y 1
X 1
2
X 1
2
3 X1 X 2
2
X Y 1
X 2
2
X 1
X 2
3
X 2
2
Regresión espacial
Técnica GWR
La regresión ponderada geográficamente (GWR, Geographically weighted regression) es una de varias técnicas de regresión
espacial, que se utiliza cada vez más en geografía y otras disciplinas. GWR proporciona un modelo local de la variable o
proceso que intenta entender/prever al ajustar una ecuación de regresión a cada entidad en el dataset. Este modelo realiza
una regresión ponderada geográficamente (GWR), una forma local de regresión lineal que se utiliza para modelar las
relaciones que varían espacialmente.
Por lo general, comience el análisis de regresión con MCO. Un enfoque común para el análisis de regresión es identificar el
mejor modelo MCO posible antes de pasar a GWR. Para obtener los mejores resultados, aplique la técnica GWR a datasets
con varios cientos de entidades. No es un método adecuado para datasets pequeños. La herramienta no funciona con datos
de multipunto.
Regresión espacial
¿La relación entre resultados académicos e ingresos es uniforme en toda el área de estudio?
¿La aparición de determinadas enfermedades aumenta con la proximidad a entidades de agua?
¿Cuáles son las variables clave que explican la alta frecuencia de incendio forestal?
¿Qué hábitats se deben proteger para alentar la reintroducción de una especie en peligro?
¿Dónde se encuentran los distritos en los que los niños están alcanzando las notas de examen más altas? ¿Qué
¿características parecen estar asociadas? ¿Dónde es más importante cada característica?
¿Los factores que influyen en las tasas de cáncer más elevadas son uniformes en toda el área de estudio?
Cuando se utilizan correctamente estos modelos (MCO y GWR), proporcionan estadísticas poderosas y confiables para
examinar y calcular las relaciones lineales.
Los análisis de correlación y sus gráficos asociados que se muestran a continuación prueban la fortaleza de la relación entre
las dos variables. Los análisis de regresión, por su parte, van más allá e intentan demostrar el grado hasta el cual una o más
variables pueden favorecer un cambio positivo o negativo en otra variable.
Tipos de relaciones
Reglas prácticas acerca de la fuerza de los coeficientes de
correlación
1995 7888 4 320 0 0 0
897251 0 0 0 0 0
.81 a 1.00 Muy fuerte
1234 0 0 0 1
.61 a .80 Fuerte
Hipótesis: es común que la hipótesis nula de interés sea que la correlación en la población es igual a cero. Si se
rechaza esta hipótesis a un nivel especificado, se concluirá que existe una relación entre las variables.
Intervalos de confianza:
• Si deseamos evitar inexactitudes ocasionadas por el tamaño de la muestra, necesitamos usar la distribución t.
Recuerde que esta distribución es apropiada cuando n es menor que 30 y la desviación estándar de la
población no se conoce .
• Recuerde que una ecuación de estimación es válida sólo para el mismo rango dentro del cual se tomó la
muestra inicialmente.
Regresión Espacial
• Existe una relación lineal. Es decir, existe una relación directa entre la variable dependiente
y el conjunto de variables independientes.
• La variación entre los residuos es la misma tanto en el caso de valores grandes como pequeños de En otras palabras,
no está relacionada, ya sea que sea grande o pequeña.
• Los residuos siguen la distribución de probabilidad normal. Estos se calculan para cada observación del conjunto de
datos. Estos residuos deberán seguir de manera aproximada una distribución de probabilidad normal. Además, la media
de los residuos debe ser 0.
• Las variables independientes no deben estar correlacionadas. Es decir, conviene seleccionar un conjunto de variables
independientes que no estén correlacionadas entre sí.
• Los residuos son independientes. Esto significa que las observaciones sucesivas de la variable dependiente no están
correlacionadas. Esta suposición con frecuencia se viola cuando se comprende el tiempo con las observaciones
muestreadas.
Regresión Espacial
La evaluación de una ecuación de regresión múltiple siempre debe incluir un diagrama de dispersión en el que se trace la
variable dependiente contra cada variable independiente. Estos diagramas ayudan a visualizar las relaciones y proporcionan
una información inicial respecto de la dirección (positiva o negativa), la linealidad y la fuerza de la relación.
La mejor recta de regresión pasa por el centro de los datos de un diagrama de dispersión. En este caso, aparece un número
grande de observaciones arriba de la recta de regresión (estos residuos tendrían un signo positivo), y un número grande de
observaciones debajo de ella (estos residuos tendrían un signo negativo). Además, las observaciones estarían dispersas
arriba y debajo de la recta, sobre todo el rango de la variable independiente.
Regresión Espacial
Gráficas de residuos
Gasto en N° de Venta de
Mes publicidad vendedores softw ares
Enero 460 6 29
Febrero 420 4 24
Marzo 440 5 27
Abril 440 3 25
Mayo 445 3 26
Junio 460 4 28
Julio 440 6 30
Agosto 450 6 28
Septiembre 440 5 28
Octubre 440 5 27
Bibliografía
• Bohórquez, I. A., & Ceballos, H. V. (2008). Algunos conceptos de la econometría espacial y el análisis exploratorio
de datos espaciales. Ecos de Economia: A Latin American journal of applied economics, 12(27), 9-2.
• R. Levin & d. Rubin, Estadística para administración y Economía, Editorial Pearson, 7ma edición, 2011.
• Probabilidad y estadística para ingeniería y ciencias, Walpole Ronald et all, Pearson, 2012