Está en la página 1de 27

Regresión espacial

Dependencia Espacial

La dependencia espacial es multidireccional, es decir, una región puede estar afectada no solamente por otra región contigua
o vecina sino por otras que la rodean, al igual que ella puede afectar a las otras. Para la medición de dependencia espacial se
han propuesto numerosos estadísticos, uno de los más utilizados es el índice de Moran (1948).

Modelos Espaciales

En el dado caso de que los estadísticos de dependencia espacial indiquen asociación de este tipo, será necesario un modelo
de regresión espacial que tome en cuenta dicha dependencia

Prácticamente todas las formulaciones estadísticas pueden aplicarse a datos geográficos de igual forma que se aplican a datos
no espaciales. No obstante, la particular naturaleza de la información geográfica hace que algunas de estas formulaciones
puedan adaptarse de forma específica para obtener resultados más correctos. En este capítulo, intentaremos profundizar
sobre el empleo de estas herramientas estadísticas dentro del ámbito de un SIG, como son los métodos de regresión, sean
estos simples o múltiples, que consideran explícitamente el componente espacial de los datos.
Regresión espacial

El análisis de regresión permite modelar, examinar y explorar relaciones espaciales que puede ayudar a explicar los factores
detrás de los patrones espaciales observados. Probablemente sea la estadística que se utiliza con mayor frecuencia en las
ciencias sociales. La regresión se utiliza para evaluar las relaciones que existen entre dos o más atributos de entidades.

La identificación y medición de las relaciones permite comprender mejor lo que sucede en un lugar, prever el lugar donde es
probable que suceda algo o comenzar a examinar las causas que hacen que algo suceda en un lugar determinado. Sin
embargo, al modelar las relaciones espaciales, el análisis de regresión también se puede utilizar para la predicción.

Regresión lineal

Para comenzar esta sección, recordaremos el modelo de regresión lineal que será nuestro punto de partida para estudiar los
principales modelos de regresión espacial. Las relaciones lineales son positivas o negativas. Por ejemplo, si se descubre que el
número de contagiados por COVID aumenta cuando aumentan las aglomeraciones, se dice que hay una correlación positiva.
Otra forma de expresar una correlación positiva es decir que los contagios por COVID disminuyen a medida que disminuyen
las aglomeraciones. Por el contrario, si se descubre que la cantidad de delitos disminuye a medida que la cantidad de agentes
de policía que patrullan un área aumenta, se dice que la relación es negativa. También puede expresar esta relación negativa
al establecer que la cantidad de delitos aumenta a medida que la cantidad de agentes de policía que patrullan disminuye.
Regresión espacial

Razones principales por las que puede desear utilizar el análisis de regresión:

• Para modelar algún fenómeno, para entenderlo mejor y posiblemente utilizar ese entendimiento para llevar a cabo la
política o tomar decisiones sobre las medidas apropiadas a tomar. El objetivo básico es medir la extensión que cambia en
una o más variables que en conjunto afectan los cambios en la otra.

• Para modelar algún fenómeno para prever valores en otros lugares u otros tiempos. El objetivo básico es crear un modelo
de predicción que sea consistente y preciso.

• Para explorar las hipótesis, supongamos que modela los delitos residenciales para entenderlos mejor e implementar con
optimismo la política que podría prevenirlos. A medida que comience su análisis, es probable que tenga preguntas o
hipótesis que desee examinar.

Conceptos básicos

Es imposible discutir el análisis de regresión sin familiarizarse primero con algunos términos y conceptos básicos específicos
de la estadística de regresión:
Regresión espacial

Ecuación de regresión: es la fórmula matemática que se aplica a las variables explicativas para prever mejor la variable
dependiente que intenta modelar. Desafortunadamente para aquellos geocientíficos que piensan en X e Y como
coordenadas, la anotación en las ecuaciones de regresión para la variable dependiente es siempre Y, y para la variable
independiente o explicativa es siempre X.
Regresión espacial

Variable dependiente/ de respuesta (Y): es la variable que representa el proceso que se intenta predecir o entender.

Variables independientes/explicativas (X): son las variables utilizadas para modelar o predecir los valores de la variable
dependiente

Coeficientes de regresión (β): coeficientes que calcula la herramienta de regresión. Son valores, uno para cada variable
explicativa, que representan la fortaleza y el tipo de relación que tiene la variable explicativa con la variable dependiente.

Valores P: La mayoría de los métodos de regresión realizan una prueba estadística para calcular una probabilidad, llamada
valor P, para los coeficientes asociados a cada variable independiente. Las variables con coeficientes cercanos a cero no
ayudan a prever o modelar la variable dependiente; casi siempre se quitan de la ecuación de regresión, a menos que haya
razones teóricas fuertes para mantenerlos.

R2/R cuadrado: R cuadrado múltiple y R cuadrado ajustado son estadísticas derivadas de la ecuación de regresión para
cuantificar el rendimiento del modelo. El valor de R2 va desde 0 a 100 por ciento (0 a 1). Lo más probable es que se observe
valores de R2 = 0,49, por ejemplo, que se puede interpretar de la siguiente forma: "Este modelo explica el 49 por ciento de la
variación en la variable dependiente".
Regresión espacial

Residuales: estos son la porción sin explicar de la variable dependiente, representada en la ecuación de regresión con
el término de error aleatorio ε. Los valores conocidos de la variable dependiente se utilizan para crear y calibrar el modelo
de regresión. Al utilizar valores conocidos para la variable dependiente (y) y valores conocidos para todas las variables
explicativas (X), la herramienta de regresión construye una ecuación que preverá esos valores conocidos y posibles. Sin
embargo, los valores previstos raramente coinciden exactamente con los valores observados. La diferencia entre los valores
observados y los valores previstos se llama residual.

Las áreas en rojo son ubicaciones donde los valores reales son más grandes que el modelo estimado. Las áreas en azul son
ubicaciones donde los valores reales son más pequeños que el modelo estimado.
Regresión espacial

Modelos de regresión

Técnica MCO

MCO (OLS, ordinary least squares) atribuído a Carl Friedrich Gauss, es la más conocida de todas las técnicas de regresión.
También es el punto de inicio adecuado para todos los análisis de regresión espacial. Proporciona un modelo global de la
variable o proceso que intenta entender o prever; crea una ecuación de regresión simple para representar ese proceso.

Los datos espaciales exhiben dos propiedades que hacen difícil (pero no imposible) cumplir con las presuposiciones y los
requisitos de los métodos estadísticos (no espaciales) tradicionales, como la regresión de MCO:

• En general, las entidades geográficas están autocorrelacionadas espacialmente; esto significa que las entidades cercanas
tienden a ser más similares que las entidades que están más lejos. Esto crea un tipo de influencia que cuenta más para los
métodos de regresión (no espaciales) tradicionales.

• La geografía es importante y a veces los procesos más importantes para lo que está modelando son no estacionarios; estos
procesos se comportan de manera diferente en distintas partes del área de estudio. Esta característica de los datos
espaciales se puede denominar variación regional o no estacionariedad.
Regresión espacial

La función de regresión

Ŷ = β 1 + β2 X

Ecuaciones normales

ß1 = y  2 x

β2 =
 xy  n x y
 x  nx 2 2
Regresión espacial

Coeficiente de correlación (r)

Mide la fuerza o el grado de asociación lineal entre dos variables

-1≤ r ≤ 1

r
n ( xy)  ( x)( y)
n x  ( x) n y  ( y) 
2 2 2 2
Regresión espacial

Coeficiente de determinación (r2)

Es una medida de la bondad de ajuste, indica qué ta bien se ajusta la recta de regresión
estimada con los auténticos valores de Y

0 ≤ r2 ≤ 1

n xY  ( x)( Y )
2

r
2

n x  ( x) . nY  (Y ) 


2 2 2 2
Regresión espacial

Error estándar de la regresión

• Los modelos económicos nunca describen con perfección la relación entre las variables
debido a que los procesos que generan los datos son demasiado complejos para ser
descritos por un simple modelo matemático.

• El error estándar de la regresión es una estimación de la distancia promedio entre la línea


verdadera y los datos. Simplemente es la desviación estándar de los valores de Y
alrededor de la recta de regresión estimada

• Al añadir el término error a un modelo económico lo convierte en un modelo


econométrico.
Regresión espacial

Se = Y 2
 1  Y   2  XY
n2

Mientras mas grande sea el error estándar de la estimación, mayor será la dispersión de
los puntos alrededor de la línea de regresión . De manera inversa, si Se = 0, se espera
que la ecuación de estimación sea un estimador perfecto de la variable dependiente
Regresión espacial

Regresión múltiple

 Modelo de regresión lineal con más de una variable explicativa

 Es múltiple debido a las múltiples influencias que pueden afectar a la variable


dependiente.

 Está basado en las mismas suposiciones y procedimientos que en la regresión


simple

 Tiene la ventaja de que permite utilizar más información para estimar una variable
dependiente.
Regresión espacial

La función de regresión con K variables

Ŷ = ϐ1 + ϐ 2 X1 + ϐ 3 X2 + ……+ ϐ k Xk
Ecuaciones normales para tres variables

 Y  n    X    X
1 2 1 3 2

 1
X Y   1
X 1
  2
X 1
2
 3  X1 X 2

 2
X Y   1
X 2
  2
X 1
X 2
  3
X 2
2
Regresión espacial

Interpretación de la función de regresión de tres variables

• ϐ1 es la intersección. Este término nos da el valor medio de Y cuando X2 y X3 se igualan a


cero.

• ϐ2 y ϐ3 Se conocen como los coeficientes de regresión parcial.

• ϐ2 mide el cambio en el valor de la media de Y por unidad de cambio en X2, permaneciendo


X3 constante.

• ϐ3 mide el cambio en el valor medio de Y por unidad de cambio en X3, permaneciendo X2


constante
Regresión espacial

Técnica GWR

La regresión ponderada geográficamente (GWR, Geographically weighted regression) es una de varias técnicas de regresión
espacial, que se utiliza cada vez más en geografía y otras disciplinas. GWR proporciona un modelo local de la variable o
proceso que intenta entender/prever al ajustar una ecuación de regresión a cada entidad en el dataset. Este modelo realiza
una regresión ponderada geográficamente (GWR), una forma local de regresión lineal que se utiliza para modelar las
relaciones que varían espacialmente.

Por lo general, comience el análisis de regresión con MCO. Un enfoque común para el análisis de regresión es identificar el
mejor modelo MCO posible antes de pasar a GWR. Para obtener los mejores resultados, aplique la técnica GWR a datasets
con varios cientos de entidades. No es un método adecuado para datasets pequeños. La herramienta no funciona con datos
de multipunto.
Regresión espacial

Aplicaciones potenciales de la técnica GWR:

¿La relación entre resultados académicos e ingresos es uniforme en toda el área de estudio?
¿La aparición de determinadas enfermedades aumenta con la proximidad a entidades de agua?
¿Cuáles son las variables clave que explican la alta frecuencia de incendio forestal?
¿Qué hábitats se deben proteger para alentar la reintroducción de una especie en peligro?
¿Dónde se encuentran los distritos en los que los niños están alcanzando las notas de examen más altas? ¿Qué
¿características parecen estar asociadas? ¿Dónde es más importante cada característica?
¿Los factores que influyen en las tasas de cáncer más elevadas son uniformes en toda el área de estudio?

Cuando se utilizan correctamente estos modelos (MCO y GWR), proporcionan estadísticas poderosas y confiables para
examinar y calcular las relaciones lineales.

Los análisis de correlación y sus gráficos asociados que se muestran a continuación prueban la fortaleza de la relación entre
las dos variables. Los análisis de regresión, por su parte, van más allá e intentan demostrar el grado hasta el cual una o más
variables pueden favorecer un cambio positivo o negativo en otra variable.

Tipos de relaciones
Reglas prácticas acerca de la fuerza de los coeficientes de
correlación
1995 7888 4 320 0 0 0

Rango de coeficiente Descripción de la fuerza

897251 0 0 0 0 0
.81 a 1.00 Muy fuerte

1234 0 0 0 1
.61 a .80 Fuerte

.41 a .60 Moderada

.21 a .40 Débil

.00 a .20 Ninguna


1-2
Copyright © 2003 by The McGraw-Hill Companies, Inc. All rights reserved.
Regresión espacial

Hipótesis: es común que la hipótesis nula de interés sea que la correlación en la población es igual a cero. Si se
rechaza esta hipótesis a un nivel especificado, se concluirá que existe una relación entre las variables.

Ho: ϐ1, ϐ2, ϐ3 …… ϐn = 0


H1: ϐ1, ϐ2, ϐ3 …… ϐn ≠ 0

Intervalos de confianza:

• Si deseamos evitar inexactitudes ocasionadas por el tamaño de la muestra, necesitamos usar la distribución t.
Recuerde que esta distribución es apropiada cuando n es menor que 30 y la desviación estándar de la
población no se conoce .

• Recuerde que una ecuación de estimación es válida sólo para el mismo rango dentro del cual se tomó la
muestra inicialmente.
Regresión Espacial

Suposiciones necesarias para la regresión:

• Existe una relación lineal. Es decir, existe una relación directa entre la variable dependiente
y el conjunto de variables independientes.

• La variación entre los residuos es la misma tanto en el caso de valores grandes como pequeños de En otras palabras,
no está relacionada, ya sea que sea grande o pequeña.

• Los residuos siguen la distribución de probabilidad normal. Estos se calculan para cada observación del conjunto de
datos. Estos residuos deberán seguir de manera aproximada una distribución de probabilidad normal. Además, la media
de los residuos debe ser 0.

• Las variables independientes no deben estar correlacionadas. Es decir, conviene seleccionar un conjunto de variables
independientes que no estén correlacionadas entre sí.

• Los residuos son independientes. Esto significa que las observaciones sucesivas de la variable dependiente no están
correlacionadas. Esta suposición con frecuencia se viola cuando se comprende el tiempo con las observaciones
muestreadas.
Regresión Espacial

Uso de los diagramas de dispersión

La evaluación de una ecuación de regresión múltiple siempre debe incluir un diagrama de dispersión en el que se trace la
variable dependiente contra cada variable independiente. Estos diagramas ayudan a visualizar las relaciones y proporcionan
una información inicial respecto de la dirección (positiva o negativa), la linealidad y la fuerza de la relación.

Uso de gráficas de residuos

La mejor recta de regresión pasa por el centro de los datos de un diagrama de dispersión. En este caso, aparece un número
grande de observaciones arriba de la recta de regresión (estos residuos tendrían un signo positivo), y un número grande de
observaciones debajo de ella (estos residuos tendrían un signo negativo). Además, las observaciones estarían dispersas
arriba y debajo de la recta, sobre todo el rango de la variable independiente.
Regresión Espacial

Diagrama de dispersión Gráficas de residuos


Regresión Espacial

Gráficas de residuos

• Gráfica de residuos con estructura definida


• El gráfico ideal sería de residuos repartidos alrededor del cero, que se dispersan en igual modo (tanto por encima como
por debajo del cero) a medida que se avanza en el eje x (de valores predichos).
Regresión Espacial
Regresión Espacial

N° de familia Consumo Ingresos


1 70 80
2 65 100
3 90 120
4 95 140
5 110 160
6 115 180
7 120 200
8 140 220
9 155 240
10 150 260
Regresión Espacial

Gasto en N° de Venta de
Mes publicidad vendedores softw ares
Enero 460 6 29
Febrero 420 4 24
Marzo 440 5 27
Abril 440 3 25
Mayo 445 3 26
Junio 460 4 28
Julio 440 6 30
Agosto 450 6 28
Septiembre 440 5 28
Octubre 440 5 27
Bibliografía

• Bohórquez, I. A., & Ceballos, H. V. (2008). Algunos conceptos de la econometría espacial y el análisis exploratorio
de datos espaciales. Ecos de Economia: A Latin American journal of applied economics, 12(27), 9-2.

• R. Levin & d. Rubin, Estadística para administración y Economía, Editorial Pearson, 7ma edición, 2011.

• Probabilidad y estadística para ingeniería y ciencias, Walpole Ronald et all, Pearson, 2012

También podría gustarte