Está en la página 1de 75

ESTADISTICA ESPACIAL

Martha Patricia Bohorquez Castaneda

Universidad Nacional de Colombia


Departamento de Estadstica
2009
TABLA DE CONTENIDO

1 Introduccion a la estadstica espacial 1

2 Geoestadstica 9

2.1 Supuesto de Estacionariedad . . . . . . . . . . . . . . . . . . . . 9

2.1.1 Estacionariedad fuerte . . . . . . . . . . . . . . . . . . . 9

2.1.2 Estacionariedad de segundo orden . . . . . . . . . . . . . 10

2.1.3 Estacionariedad intrnseca . . . . . . . . . . . . . . . . . 11

2.1.4 Isotropa . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.1.5 Elementos del semivariograma . . . . . . . . . . . . . . . 12

2.2 Semivariograma . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3 Metodos de estimacion mas usados . . . . . . . . . . . . . . . . 18

2.4 Ilustracion metodo de maxima verosimilitud . . . . . . . . . . . 23

2.5 kriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

i
2.6 Metodos estadsticos de interpolacion . . . . . . . . . . . . . . . 26
2.6.1 Generalidades sobre el kriging . . . . . . . . . . . . . . . 27
2.6.2 Introduccion a la teora del kriging . . . . . . . . . . . . 28
2.6.3 Kriging ordinario . . . . . . . . . . . . . . . . . . . . . . 30
2.6.4 Kriging Simple . . . . . . . . . . . . . . . . . . . . . . . 32
2.6.5 El enfoque robusto . . . . . . . . . . . . . . . . . . . . . 34
2.6.6 El enfoque bayesiano . . . . . . . . . . . . . . . . . . . . 37

3 Modelos de regresion espaciales 43

3.1 Efectos espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . 43


3.2 Matrices de Pesos Espaciales . . . . . . . . . . . . . . . . . . . . 44
3.3 Contrastes de Autocorrelacion Espacial . . . . . . . . . . . . . . 49
3.3.1 Estadsticos Globales . . . . . . . . . . . . . . . . . . . . 49
3.3.2 Estadsticos Locales . . . . . . . . . . . . . . . . . . . . . 50
3.4 Analisis de Cooordenadas Principales de Matrices de Pesos Espaciales(PCNM) 51
3.5 Modelos de Regresion Espacial . . . . . . . . . . . . . . . . . . . 51
3.5.1 Regresion geogracamente ponderada . . . . . . . . . . . 54
3.6 Aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.6.1 Eleccion de la Matriz de Pesos Espaciales (PCNM) . . . 56
3.6.2 Analisis Univariado del NBI . . . . . . . . . . . . . . . . 56
3.6.3 Modelos de Regresion Espacial . . . . . . . . . . . . . . . 58

4 Algunos topicos basicos sobre procesos puntuales


61

4.1 Clases de patrones . . . . . . . . . . . . . . . . . . . . . . . . . 62


4.2 Pruebas de CSR . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.2.1 Conteo por cuadros . . . . . . . . . . . . . . . . . . . . . 65
4.2.2 Metodos de distancia . . . . . . . . . . . . . . . . . . . . 66
4.2.3 Funcion de intensidad de segundo orden . . . . . . . . . 68

i
CAPITULO 1

Introduccion a la estadstica espacial

La rama de la estadstica que analiza las variables de interes teniendo en


cuenta su ubicacion espacial, es conocida como Estadstica Espacial.
En muchos fenomenos de la naturaleza, los atributos de interes, se pueden
ubicar temporal o espacialmente. En este caso, no es correcto estudiarlos bajo
el supuesto de independencia entre observaciones, pues muy posiblemente la
componente temporal, la espacial o ambas generen un efecto de correlacion. Por
lo tanto, es fundamental determinar la estructura de dicha correlacion, y con
base en esta, encontrar predicciones de la variable de interes para determinado
momento y/o determinado lugar.

Denicion 1. Proceso Espacial


Sea la variable de interes, y sea s la ubicacion espacial donde existe .
El proceso espacial es el conjunto

{() : }

Donde se reere a la variable de interes en la ubicacion , es llamado


el conjunto ndice y esta formado por todas las ubicaciones . La ubicacion
espacial puede estar en una, dos o mas dimensiones segun el estudio.

1
2 CAPITULO 1. INTRODUCCION A LA ESTADISTICA ESPACIAL

A continuacion se mostraran unos ejemplos, que ilustraran tanto las


aplicaciones de la estadstica espacial, como los elementos de un proceso
espacial.
1.1 Ejemplo. Existen varias formas de estimar la cantidad de madera muerta
en un bosque. Una de ellas es llamada el metodo del transecto lineal y consiste
en recolectar datos sobre troncos o ramas cadas a lo largo de un camino. Este
camino se puede ver como el eje de los numeros reales; ver gura 1.1. En este
caso,
(): Diametro del tronco ubicado en la coordenada , a la altura del pecho.
= ; , con un punto de origen arbitrario, jado en el momento en
el que se inicia el camino.

Figura 1.1. Proceso espacial en

1.2 Ejemplo. En el marco de un proyecto de conservacion del medio ambiente,


se requiere revisar y vericar en el terreno los informes relacionados con los
calculos de las reservas explotables y el avance del fenomeno de intrusion
marina en un reservorio acufero, con el n de establecer las recomendaciones
necesarias para denir un programa de manejo.
Los datos recolectados son ubicados mediante coordenadas bidimensionales,
(Este, Norte). En una notacion mas universal se puede pensar en un plano
cartesiano en el cual dichas coordenadas se notan (x,y). Ver gura 1.2
(): Altura piezometrica por debajo del nivel del mar en la ubicacion .
= 2 ; 2 , = (, ) con un punto de origen arbitrario en (0, 0),
jado en el momento en el que se disena el muestreo.

As, en general, es un elemento de un conjunto , el cual es a su vez un


subconjunto de . Esto es = 2
3
Este Norte (): Altura
42,782 127,622 1464
-27,396 90,787 2553
-1,1628 84,896 2158
-18,618 76,451 2455
96,465 64,580 1756
108,562 82,923 1702
88,363 56,453 1805
90,042 39,258 1797
93,172 33,058 1714
97,610 56,278 1466

Cuadro 1.1. Proceso espacial en 2


200

200
150

150
Y Coord
Y Coord
100

100
50

50
0

150 100 50 0 50 100 1000 1500 2000 2500 3000 3500


X Coord data
3500
3000

4000
2000 2500

3500
data

3000
data
2500

Y Coord
2000
1500

200
1500

150
100
50
1000
1000

0
15010050 0 50 100 150
150 100 50 0 50 100
X Coord
X Coord

Figura 1.2. Altura piezometrica georeferenciacion en 2

El conjunto ndice D, puede ser continuo, discreto o aleatorio. La ubicacion


es un concepto que puede variar, una posibilidad es la ubicacion geograca; un
punto puede ser indexado con respecto a cualquier sistema de referencia bien
denido, por ejemplo el tiempo.
4 CAPITULO 1. INTRODUCCION A LA ESTADISTICA ESPACIAL

Se requiere una teora especial para este tipo de datos ya que:

Los datos espaciales no cumplen con los supuestos del analisis clasico; en
particular la independencia; la primera ley de Toblers de las condiciones
de la geografa dice que todo esta relacionado con todo lo demas,
pero cosas cercanas estan mas relacionadas que cosas distantes. Los
datos espaciales, estan correlacionados a menos que esten sucientemente
lejanos.

observaciones espaciales Z(si) no representan una muestra aleatoria


de tamano de n en el sentido tradicional. Representan una muestra de
tamano 1 de un proceso estocastico que se extiende en d dimensiones;
esta caracterstica es compartida en una serie de tiempo.

La aleatorizacion, la repeticion, y los bloques no son posibles en muchas


ciencias de tierra en las que se generan grandes cantidades de datos
espaciales. El diseno experimental clasico es de poca ayuda.

Muchos problemas en estadstica espacial, son unicos a este cuerpo de


aplicacion y no tienen similitud con ningun problema de la estadstica
clasica.

Una muestra de tamano en la que se evidencia correlacion espacial


contiene menos informacion que una muestra del mismo tamano pero
de observaciones independientes. Por lo tanto, cuando las observaciones
estan correlacionadas, es necesario determinar con cuantas observaciones
de los datos correlacionados sera posible encontrar la misma precision
que se hubiera obtenido si las observaciones fueran independientes. La
solucion dependera del patron y de la intensidad de esta correlacion.
5
Clases de datos espaciales

Datos geoestadsticos: Son los datos espaciales con variacion continua,


donde es un subconjunto jo de ; esto es, es continuo y jo
y () es una variable aleatoria con ubicacion , ( ).
Un ejemplo de datos geoestadsticos es un tipo de contaminacion del
aire llamado material particulado (MP). Un ejemplo de la distribucion
continua del MP en la ciudad de Mexico se puede observar en la gura
1.3

Figura 1.3. Material particulado en la ciudad de Mexico

Datos de areas (Lattices): Son los datos espaciales con variacion discreta.
es un subconjunto contable y jo de ; esto es, es discreto y jo y
() es una variable aleatoria con ubicacion , ( ).
Por ejemplo, al medir la tasa de mortalidad infantil en Colombia por
departamento, se tiene una dominio discreto que consiste del conjunto
formado por los 33 departamentos de Colombia. Ver gura 1.4
6 CAPITULO 1. INTRODUCCION A LA ESTADISTICA ESPACIAL

Figura 1.4. Tasa de mortalidad infantil (por cuantiles)

Procesos espaciales puntuales: es un proceso puntual en o en un


subconjunto aleatorio de . puede ser discreto o continuo, () es
una variable aleatoria con ubicacion ( ). Aqu el interes no recae
en el valor de un atributo , sino en la ubicacion en la cual ocurre un
evento de interes.
Por ejemplo, en cuestiones de seguridad, se ubican en un plano los lugares
donde han sido denunciados robos. Ver gura 1.5

Se puede observar que el interes en cada uno de los casos anteriores, es


distinto. En el primer caso, se requiere la prediccion de la cantidad de material
particulado en forma continua en todos los lugares de la ciudad; mientras
que en el segundo caso el interes en cambio radica en determinar relaciones
de vecindad, identicar si la tasa de mortalidad infantil existente en un
departamento es inuenciada o inuye sobre las tasas de mortalidad de los
departamentos vecinos, de que factores adicionales depende este fenomeno y
como se pueden modelar estas distintas relaciones. En el caso de los robos, se
7

80
60
cardiff$y

40
20

0 20 40 60 80

cardiff$x

Figura 1.5. Lugares donde se han denunciado robos

quieren identicar zonas de mas alto o mas bajo riesgo, encontrar si existen
patrones de ocurrencias de estos actos con el n de establecer polticas de
seguridad acordes con las caractersticas por zonas. Por lo tanto, los metodos
de la estadstica espacial cambian de acuerdo al dominio en el que ocurre el
fenomeno de interes.
8 CAPITULO 1. INTRODUCCION A LA ESTADISTICA ESPACIAL
CAPITULO 2

Geoestadstica

El campo aleatorio espacial (variable regionalizada) en este caso es continuo


{() : }; en general, no existen replicas de los datos, a menos que se
tomaran medidas repetidas en cada una de las ubicaciones, lo cual es muy
poco frecuente en la recoleccion de datos espaciales. Esto hace preciso, crear
un mecanismo para generar estas replicas y poder hacer inferencia sobre los
datos. Los dos componentes estructurales del campo aleatorio que permiten
incorporar replicas son la estacionariedad y la isotropa.

2.1. Supuesto de Estacionariedad

2.1.1. Estacionariedad fuerte

Este supuesto se reere a que la estructura probabilstica del campo


aleatorio es similar en diferentes partes de D, es decir que el proceso alcanza
un estado de equilibrio. Esto ocurre cuando las coordenadas absolutas no
muestran ninguna inuencia sobre la ocurrencia de la variable. Si el campo
aleatorio es estacionario y se va a estimar la covarianza, por ejemplo, se puede
usar una funcion que dependa solamente de la distancia absoluta = ,
sin importar donde estan localizados los puntos. Para que diferentes pares de

9
10 CAPITULO 2. GEOESTADISTICA

puntos puedan contribuir a la estimacion, solo se necesita que tengan la misma


distancia . De manera formal, una variable regionalizada es estacionaria si su
funcion de distribucion no vara con la traslacion del vector , esto es, si para

() = [(1 ), ..., ( )]
y
( + ) = [(1 + ), ..., ( + )]

se tiene que

() = (+)

La estacionariedad fuerte, sin embargo, es una propiedad muy restrictiva,


y existen metodos que pueden modelar los fenomenos aun cuando no se
cumpla esta propiedad. En particular para los algunos metodos geoestadsticos
puede bastar con el cumplimiento de algunos supuestos que involucren los dos
primeros momentos:

2.1.2. Estacionariedad de segundo orden

Si se cumple que

() = ,
((), ( + )) = ()

para toda pareja (), (+), es decir, la covarianza existe y es funcion unica
del vector de separacion . Entonces, se dice que es un proceso debilmente
estacionario o estacionario de segundo orden. () es la funcion de covarianza
o covariograma del proceso espacial.
En geoestadstica es muy comun usar la variable llamada incrementos
( + ) (), haciendo una analoga con la diferenciacion de una serie
de tiempo cuando no se tiene estacionariedad en (). En este caso se
puede interpretar la variable incrementos como el cambio de la variable de
interes despues de un desplazamiento ; as modelar la varianza de la variable
incrementos es una forma alternativa de modelar dependencia espacial. Esta
clase de estacionariedad se suele llamar estacionariedad intrnseca.
2.1. SUPUESTO DE ESTACIONARIEDAD 11
2.1.3. Estacionariedad intrnseca

El proceso () es intrnsecamente estacionario si satisface:

(( + ) ()) = 0, ,
1
2
(( + ) ()) = ()

para toda pareja (), (+), es decir, la varianza existe y es funcion unica del
vector de separacion ; () es la funcion de semivarianza o el semivariograma
del proceso espacial. En presencia de estacionariedad de segundo orden las
funciones de covarianza y semivarianza cumplen la siguiente relacion:

() = (0) () (2.1)

Esta relacion se ilustra en la gura 2.1, para el caso particular donde la


funcion de covarianza corresponde a la funcion exponencial

() = 3 exp(/50)

y por lo tanto la funcion de semivarianza es

() = 3(1 exp(/50))

Funciones de covarianza y semivarianza exponencial


3.0
2.5
2.0
3 * (1 exp(x/50))

Covarianza
Semivarianza
1.5
1.0
0.5
0.0

0 50 100 150 200 250

Figura 2.1. () y (), = (0, 3, 50)


12 CAPITULO 2. GEOESTADISTICA

2.1.4. Isotropa

Si ademas () y/o () son funciones unicas de la magnitud , esto es,

((), ( + )) = ()

y/o

1
(( + ) ()) = ()
2

El proceso posee funcion de covarianza y/o semivarianza isotropica. La


estacionariedad permite combinar pares de datos con la misma diferencia
de coordenadas, pero si ademas, los vectores de diferencias pueden ser
reemplazados con distancias escalares, por ejemplo una distancia euclidiana
para calcular medidas como la covarianza, entonces el campo aleatorio se dice
isotropico. Esto es, la correlacion entre los datos no depende de la direccion
en la que esta se calcula. As, un campo aleatorio que es estacionario pero no
isotropico se desarrolla de manera diferente segun las diferentes direcciones del
espacio; no solo basta con conocer cuanto estan separados un par de puntos,
sino tambien se necesita conocer la orientacion de dicha distancia.
En terminos geometricos la estacionariedad y la isotropa son propiedades
de invarianza. La estacionariedad es invarianza bajo la traslacion. La isotropa
es invarianza bajo rotaciones y reexiones.

2.1.5. Elementos del semivariograma

En un proceso es estacionario de segundo orden la funcion de covarianza


cumple las siguientes propiedades:

() 0

() (0)

() 0, cuando
2.1. SUPUESTO DE ESTACIONARIEDAD 13
Ademas, el semivariograma de un proceso estacionario de segundo orden tiene
una asntota, (0). Esto provee una herramienta para vericar estacionariedad.
Se estima el semivariograma, si tiende a una lnea horizontal cuando se
incrementa la separacion de los puntos, el proceso es estacionario de segundo
orden, mientras que si el semivariograma no se estabiliza, sino por el contrario
continua creciendo aun puede ser al menos intrnsecamente estacionario si
cumple que
()
0
2
cuando . Esto es, para utilizar los modelos y la metodologa clasicos,
el semivariograma no debe crecer mas rapido que una ecuacion de segundo
grado. Los parametros de los cuales depende un semivariograma de un proceso
estacionario de segundo orden son los siguientes, ver gura 2.2:

Silla es la asntota superior del semivariograma. Unicamente los procesos


estacionarios de segundo orden tienen silla. En estos casos la silla es
(0); tambien es conocida como meseta.

Rango de un proceso espacial es la distancia a la cual los puntos ya


no se consideran correlacionados. Los puntos separados por una
distancia inferior al rango se consideran espacialmente correlacionados:
Observaciones espaciadas por mas que el rango se consideran
independientes. Algunos procesos alcanzan correlacion cero solo
asintoticamente, mientras que otros tienen un rango nito

Efecto pepita . De la denicion de semivariograma, se puede ver que para


= 0, debera ocurrir que () = 0. Sin embargo, en general se
presenta el comportamiento observado en la gura 2.2, existiendo una
discontinuidad en el origen, () 0 cuando 0. La primera posible
causa para esto es la presencia de un error de medida (EM); cuando no
es posible repetir una medida en la ubicacion sin error, entonces all se
evidencia su variabilidad. La segunda causa posible es el llamado efecto
de micro-escala, el cual se genera debido a que existe un proceso espacial
que opera a distancias mas pequenas que las que fueron tenidas en cuenta
para los valores de que a su vez dependen de las distancias a las que
fue realizado el muestreo. Este proceso de micro-escala, tiene silla CMS.
Por lo tanto, si cualquiera de las dos componentes (error de medida
o micro-escala) es diferente de cero, el semivariograma presentara una
discontinuidad puntual en el origen; la magnitud de esta discontinuidad
14 CAPITULO 2. GEOESTADISTICA

es llamada el efecto pepita y se representa 0 .


2 2
0 = +

Silla parcial : Si un semivariograma tiene efecto pepita 0 y silla (0), la


diferencia (0) 0 es llamada la silla parcial del semivariograma.

Figura 2.2. Pepita, silla y rango en presencia de estacionariedad de segundo orden

Con la existencia del efecto pepita, se altera la relacion entre el


covariograma y el semivariograma. El semivariograma se puede expresar como

() = 0 + ()

y el covariograma {
(1 ()), > 0
() = (2.2)
0 + =0
2
2.1 Ejemplo. Con pepita () = 2 + 3(1 3(/19) )

la varianza esta formada por la pepita mas la silla parcial


(0) = 2 + 3,
() = (0) ()
2
en general, entonces() = 2 + 3 (2 + 3(1 3(/19) ))
2
() = 3 3(1 3(/19) ))
2
() = 3(1 (1 3(/19) ))
2.2. SEMIVARIOGRAMA 15
Bajo estacionariedad de segundo orden, es posible estimar tanto la funcion
de covarianza como la funcion de semivarianza; si no se tiene esta propiedad
pero existe estacionariedad intrnseca aun se puede estimar la funcion de
semivarianza. Aunque esto hace al semivariograma mas general para estimar
la dependencia espacial, existen razones por las cuales es preferible cuando sea
posible estimar la funcion de covarianza. Ver seccion 2.3.

2.2. Semivariograma

El semivariograma () se dene como la varianza de la variable


incrementos 12 (( + ) ()). Por lo tanto, un estimador muy natural
es el conocido como el estimador clasico, y consiste de la estimacion de esta
varianza por el metodo de los momentos:
1

() = (( + ) ())2
2 ()
()

Este estimador presenta los inconvenientes ya conocidos de la varianza


muestral, principalmente su sensibilidad a datos atpicos. De aqu que
(Cressie, 1985) ha propuesto los siguientes dos estimadores robustos:
)
1/2 4
1 () ( + ) ()
() = (2.3)
2(0.457 + 0.494/ ()) ()

( )4
( + ) ()1/2
() = (2.4)
2(0.457)

En los denominadores se puede apreciar en cada caso la correccion por


sesgo. (Cressie, 1993) muestra ademas que los estimadores robustos son
menos dependientes entre si; los sumandos ( + ) ()1/2 estan menos
correlacionados que los (( + ) ())2 .
Si se opta por la estimacion de la funcion de covarianza, se puede recurrir
a la denicion clasica de covarianza muestral as:

1
() = (( + ) )(() )
()
()
16 CAPITULO 2. GEOESTADISTICA

A partir de los semivariogramas (o covariogramas) empricos ahora se debe


ajustar un modelo parametrico; en la siguiente seccion se hace un recorrido
por los metodos de estimacion mas usados.

Modelos validos de semivariogramas

La funcion (; ) debe ser denida negativa para ser un modelo valido


de semivariograma. Esto es, para cualquier numero nito m de ubicaciones
espaciales
1 , 2 , . . . ,

y cualquier real,1 , 2 , . . . , con + , (; ) debe satisfacer



( ) 0 (2.5)
=1 =1

El cumplimiento de esta propiedad garantiza que las varianzas de las


predicciones sean positivas. A continuacion algunos ejemplos de modelos
validos de semivariograma:

Efecto pepita Lineal Esfrico


20
25

15

15
gamma

gamma

gamma
20

10

10
15

0 50 100 150 200 0 5 10 15 20 0 10 20 30 40 50

dist dist dist

Matern Efecto Hueco Exponencial


20
20

20

15
15
gamma

gamma

gamma

10
10

10

5
5

0 50 100 150 200 0 100 300 500 0 10 30 50

dist dist dist

Gaussiano Potencial logartmico


110
250000
20
15
gamma

gamma

gamma

90
100000
10

80
5

70
0

0 10 30 50 0 50 100 150 200 0 50 100 150 200

dist dist dist

Figura 2.3. Algunos modelos validos de semivariogramas


2.2. SEMIVARIOGRAMA 17
Modelo efecto pepita

Si el semivariograma ajustado es un efecto pepita hay evidencia de alguna


de las siguientes dos situaciones;

un problema de microestructura; es decir que la variacion espacial ocurre


a menores distancias y por lo tanto fue incorrecta la distancia de muestreo
elegida.

No existe autocorrelacion espacial

{
0 si = 0
(; ) =
si = 0

Modelo lineal

Este es un ejemplo de modelo bajo estacionariedad intrnseca, la


semivarianza espacial no se estabiliza.
{
0 si = 0
(; ) =
0 + si = 0

Modelo esferico

El modelo esferico muestra un alcance nito; la funcion se estabiliza


perfectamente en . Se considera que este comportamiento puede ser un poco
irreal, ya que la dependencia espacial va decreciendo pero es difcil que se vaya
a cero exactamente en un punto.



0 si = 0

[ ( )3 ]
(; ) = 0 + 32

12

si 0 <



+
0 si >
18 CAPITULO 2. GEOESTADISTICA

Modelo Matern

Este modelo es muy exible segun va cambiando el parametro como se


puede ver en la gura 2.4. El caso = 0.5 coincide con el modelo exponencial.

{
0 ( )( ) si = 0
(; ) = 1
0 + 1 21 ()
(/) si 0

donde (/) es la funcion de Bessel modicada de la tercera clase de


orden . Este modelo es valido siempre que > 0 y > 0.

kappa=0.2 kappa=0.5

20
20

15
15
gamma

gamma

10
10

5
5

0 50 100 150 200 0 50 100 150 200

dist dist

kappa=1 kappa=2
20
20

15
15
gamma

gamma

10
10

5
5

0 50 100 150 200 0 50 100 150 200

dist dist

Figura 2.4. Modelo Matern

Como ocurre en cualquier estimacion de parametros para un modelo, es


fundamental que el modelo propuesto sea el correcto, esto se logra haciendo
un buen analisis del comportamiento de los semivariogramas empricos.

2.3. Metodos de estimacion mas usados

La estimacion de parametros de la funcion de covarianza usando


los metodos de Maxima verosimilitud (ML) y maxima verosimilitud
2.3. METODOS DE ESTIMACION MAS USADOS 19

0.0 0.2 0.4 0.6 0.8 1.0

0.0 0.2 0.4 0.6 0.8 1.0


semivariance

semivariance
0.0 0.2 0.4 0.6 0.8 1.0 1.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2

distance distance

0.0 0.2 0.4 0.6 0.8 1.0

0.0 0.2 0.4 0.6 0.8 1.0


semivariance

semivariance
0.0 0.2 0.4 0.6 0.8 1.0 1.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2

distance distance

Figura 2.5. Semivariograma emprico y posibles modelos

restringida (REML), requieren la especicacion de la distribucion del vector


= ((1 ), . . . , ( )); en general, se asume normalidad multivariada. Para
el caso ML se tiene que Z (, ()), donde () = (Z) es una
matriz de dimension y es una matriz de dimension con < ,
de variables explicativas, dentro de las cuales comunmente se encuentran las
coordenadas geogracas; el negativo de la funcion logverosmil es

1 1
(, ) = (2) + () + (Z ) 1 ()(Z )
2 2 2

El elemento de la matriz ()corresponde a la covarianza espacial entre


las variables ( ) y ( ), esto es, ( ; )=(; ). El estimador es
sesgado pero asintoticamente eciente; sin embargo, paradojicamente, tener
una muestra grande genera el inconveniente de tener que realizar gran cantidad
de operaciones debido al calculo tanto del determinante como de la inversa
de la matriz de covarianza en forma iterativa. Una variacion del estimador
ML que reduce el sesgo de las estimaciones es el estimador REML, el cual
sustituye la maximizacion de la verosimilitud del vector Z por la del vector
A Z que satisface (A Z) = 0 1 . La matriz A es una matriz de dimension
( ), de rango columna completo. Con esta modicacion y dado que

1
Se usa el modelo de funcion aleatoria intrnseca de orden
20 CAPITULO 2. GEOESTADISTICA

(A Z) = A ()A, el negativo de la funcion logverosmil queda:


1 1
() = (2) + (A ()A) + Z (A ()A)1 A Z (2.6)
2 2 2
En la funcion desaparece , ahora depende solamente de ; de tal manera
que este metodo no usa el modelamiento de la supercie de tendencia, sino que
se basa directamente en un vector de incrementos de media 0. Sin embargo, a
pesar de reducir el sesgo en las estimaciones de , aun requiere una cantidad
muy grande de operaciones. (?) presenta algunas propuestas para hacer mas
ecientes estos metodos computacionalmente, pero sus desarrollos se reeren
al caso en el que las observaciones conforman una grilla regular.
En geoestadstica es muy popular el metodo de mnimos cuadrados
ponderados utilizando la matriz de ponderacion () propuesta en
(?); aunque este metodo se suele expresar en terminos del variograma 2(),
para un proceso estacionario de segundo orden existe equivalencia con la
covarianza debido a la relacion 2.1.3. Este metodo se puede generalizar al
caso espacio temporal de la siguiente forma: Se estima para un variograma
minimizando
2()) 1 ()(2
(2 2())
La matriz de ponderacion esta dada por
( )
2(2( ))2
() = ( (2
( )))
( )
con
( ) = {(, ) : = }
Para las ubicaciones , = 1, . . . , , que generan los primeros rezagos
espaciales = 1, ..., ; en general se usan los rezagos espaciales hasta la
mitad de la maxima distancia entre cualquier par de ubicaciones, debido
a que para ubicaciones muy separadas disminuye notoriamente la cantidad
de puntos incluidos en la estimacion del variograma. Cuando las muestras
no son tomadas en una grilla regular, es difcil encontrar sucientes pares
de puntos con separacion exacta = ; por lo tanto se acostumbra
denir una tolerancia tanto de longitud como de angulo; de tal forma que
( , + ) y el angulo entre y esta entre y
+ . La aproximacion de (2 ( ), se obtiene bajo el supuesto de que
(s) (; 2 ) s , y que por lo tanto

Z(s + h) Z(s)2 = 2(h) 21


2.3. METODOS DE ESTIMACION MAS USADOS 21
Existen otras opciones de ponderacion pero esta es la mas frecuentemente
usada; en ocasiones funciona mejor que los metodos basados en la verosimilitud
de Z. La desventaja que presenta el uso de los metodos de mnimos cuadrados,
es la necesidad de denir clases de rezagos para realizar una estimacion
emprica de la covarianza o del semivariograma; cuando no se tienen muchas
observaciones, la cantidad de datos en cada una de estas clases es muy pequena,
de tal forma que para los menores rezagos se pueden tener sucientes datos
para la estimacion de cada ( ) pero no as para los rezagos mayores. Estos
inconvenientes se pueden obviar usando metodos de verosimilitud compuesta.
El metodo que se usa en este caso (?) para estimar , consiste en
sumar componentes individuales de logverosimilitud, correspondiendo a las
marginales de las variables de interes. Por lo tanto, este metodo no requiere
el conocimiento de la distribucion multivariada de ; solo se requieren las
marginales (( ), ); se asume que existen tanto el gradiente como la matriz
Hessiana de .
Supongamos conocidas (( ), ), excepto por el parametro ; entonces
(( ), ) = ( (( ), )) es una funcion logverosmil y la funcion de
verosimilitud compuesta es


() = (( ), )
=1

A su gradiente () = () se le llama la funcion score compuesta. As,


para encontrar el estimador se resuelve el sistema de ecuaciones


() = (( ), ) = 0
=1

Una implementacion de este metodo para la estimacion del semivariograma


es la siguiente:

1. El objetivo es estimar los parametros del semivariograma, y por lo tanto


es muy natural la construccion de la variable incrementos, la cual se va
a notar :
(, ) = ( ) ( )

La variable se logra efectuando todas las combinaciones posibles. La


variable tiene entonces (1)
2
realizaciones, lo cual representa una
22 CAPITULO 2. GEOESTADISTICA

inmensa cantidad de datos; por tanto, es logico ingresar a la estimacion


solo aquellos datos que involucran informacion sobre la dependencia
espacio-tiempo, as que pueden omitirse aquellos pares de observaciones
que se encuentren muy alejados en ambos, segun un criterio denido tal
como el alcance espacial observado en el semivariograma experimental
y/o en el covariograma, respectivamente.

2. Se requieren las funciones de verosimilitud marginales de las variables de


interes. Asumiendo normalidad para las distribuciones marginales de ;
esto es,
() (; 2 ), ()
se tiene que
(, ) (0, 2( , ))
As que el negativo de la funcion logverosmil es

1 1 2 (, )
( (, ), ) = 2 + + ( , ) +
2 2 4( , )

3. Determinar la funcion de verosimilitud compuesta, sumando todas las


funciones logverosmil marginales de la variable ;
1

(, , )
=1 >

4. Para un modelo valido de semivarianza 2( , ) se determina la


funcion score compuesta
1

(, , )
=1 >
()

la cual bajo el supuesto de normalidad queda


1

( , ) 1
(2 2( , ))
=1 >
() 4 2 ( , )

La cual realmente es una estimacion por mnimos cuadrados ponderados del


modelo 2 = 2( , ) + .
2.4. ILUSTRACION METODO DE MAXIMA VEROSIMILITUD 23
2.4. Ilustracion metodo de maxima
verosimilitud

La capacidad de aprender esta hecha de muchas preguntas y


de algunas respuestas; de busquedas personales y no de hallazgos
institucionalmente decretados; de critica y puesta en cuestion en
lugar de obediencia satisfecha con lo comunmente establecido.
En una palabra, de actividad permanente del alumno y nunca de
aceptacion pasiva de los conocimientos

Fernando Savater

Relacion entre covariograma y semivariograma

Sea () = ((1 ), . . . , ( )) un proceso estacionario de segundo


orden, del cual se tiene un vector de n observaciones ((1 ), . . . , ( )); entonces
existe (( ), ( )) la cual es funcion de , representa la relacion entre la
variable ( ) y la variable ( ); esta funcion es fundamental para determinar
la dependencia espacial existente en el proceso. Por otro lado, se dene una
nueva variable llamada incrementos = ( ) ( ), que representa el
cambio en la variable cuando se realiza un desplazamiento del lugar al lugar
(o viceversa). Por lo tanto, la varianza de la variable tambien es una
medida de dependencia espacial; aunque son dos formas distintas de medir
dependencia espacial, basicamente ofrecen la misma informacion, como se ve
a continuacion:

[( ) ( )] = [( )] + [( )] 2[( ), ( )]

Si [( )] = [( )] = [()], , y [( ) ( )] es
tambien una funcion de , se tiene

2[( ), ( )] = 2 [()] [( ) ( )]

24 CAPITULO 2. GEOESTADISTICA

2( ) = 2 2 2( ) ( ) = 2 ( )

Nota 1. Se ha adoptado la notacion [( )( )] = 2( ), por


simplicidad de escritura y dado que la multiplicacion por una constante
no afecta el comportamiento de la funcion.

Si = , entonces se puede escribir () = (0) ()

( ) = 2 ( )

{
0 si = 0
() =
0 + [1 exp(3/)] si > 0
{
0 + si = 0
(0) =
[1 exp(3/)] si > 0

Si = 2, = ((1 ), (2 ))

( )
(0, ) (1 2 ; )
() =
(2 1 ; ) (0, )

2 1 1
(, ; ()) = (2) + () + (() )1 ()(() )
2 2 2

() = 2 (0, ) (2 1 ; )(1 2 ; ) = 2 (0, ) 2 (1 2 ; )

( )
1 1 (0, ) (2 1 ; )
() = 2
(0, ) 2 (1 2 ; ) (1 2 ; ) (0, )

( )
(1 )
z() =
(2 )
2.5. KRIGING 25

(() )1 ()(() ) =
1
(((1 ))2 (0, )+((2 ))((1 ))((1 2 ; ))
(0, ) 2 (1 2 ; )
2

+ ((1 ) )((2 ) )((1 2 ; ) + ((2 ) )2 (0, ))


(2.7)

Si el modelo de covarianza propuesto es el exponencial

( ; ) = (3/), = 2, = ((1 ), (2 )) = (3, 4), = 3.5, 12 = 5

1
(, ; ()) = (2) + (2 (15/))+
2
1
(0.25 + 2 0.25 ((15)/) + 0.25 ) =
2
1 1
(, ; ()) = (2)+ (2 (15/))+ (0.5 +0.5((15))/))
2 2

2.5. kriging

Uno de los objetivos principales del analisis espacial es la prediccion


o interpolacion, esto consiste en obtener valores de la variable de interes
en
{ sitios no muestreados. } Dicho de otro modo, sea el campo aleatorio
() : donde se ha observado el atributo en las ubicaciones
1 , 2 , . . . , y se desea predecir dicho atributo en una ubicacion no observada
0 , es decir, (0 ) basandose en los valores obtenidos en las muestras hechas.
Son muchos los metodos que en la actualidad se emplean para realizar
interpolacion espacial, ellos pueden dividirse en:

1. Metodos estadsticos. En estas tecnicas se emplean las propiedades


estadsticas de los datos para generar las predicciones. Los metodos
estadsticos de interpolacion son modalidades de una familia de metodos
llamada kriging, en los cuales se cuentan el ordinario, el simple, el
26 CAPITULO 2. GEOESTADISTICA

universal, el probabilstico, el indicador y el disyuntivo, entre otros. El


nombre se debe al Ingeniero minero D.G. Krige, quien desarrollo en la
decada de los 50, metodos empricos para predecir caractersticas de una
mina en alguna ubicacion de interes donde no se conocan datos, usando
las caractersticas conocidas en lugares cercanos donde si haban sido
tomados. El kriging aparece en muchas formas de acuerdo a si se conocen
la media, la distribucion de probabilidad de (), si las predicciones
son hechas para puntos o areas y as sucesivamente. El kriging no es el
unico metodo de prediccion espacial, pero tiene la ventaja que al usar
propiedades estadsticas de los datos, es posible obtener estimaciones
de la varianza del error de prediccion, lo cual permite ademas estimar
intervalos de conanza para dicha prediccion y por tanto, evaluar la
calidad de las estimaciones. El kriging se realiza en dos partes: la
cuaticacion de la estructura espacial de los datos y la elaboracion de la
prediccion. La cuanticacion de la estructura de dependencia espacial se
realiza por alguno de los metodos presentados en la seccion anterior para
ajustar el semivariograma. Para la prediccion en un punto no muestreado
se utiliza el modelo ajustado y los puntos muestreados en torno al sitio
de la prediccion.

2. Metodos determinsticos. En estos no se le asigna ningun


comportamiento aleatorio o estocastico a la variable de interes. Las
predicciones son obtenidas por el grado de similitud o por suavizamiento
entre los puntos. Los metodos determinsticos de interpolacion pueden
clasicarse en dos grupos: globales y locales. Las tecnicas globales usan
todo el conjunto de puntos para realizar las predicciones, mientras que
las tecnicas locales usan los puntos dentro de un entorno mas pequeno
de la area de estudio.

2.6. Metodos estadsticos de interpolacion

La prediccion espacial estadstica tambien llamada kriging es sinonimo


de prediccion optima y consiste en hacer inferencias sobre los valores no
observados de un proceso aleatorio. El kriging encierra un conjunto de
metodos que se fundamentan en la minimizacion del error cuadratico medio
de prediccion. En el cuadro 2.1 se mencionan algunos tipos de kriging y sus
propiedades.
2.6. METODOS ESTADISTICOS DE INTERPOLACION 27

Cuadro 2.1. Algunos tipos de Kriging.


Tipo de predictor Nombre Propiedades
Simple Son optimos si hay normalidad multivariada
Lineal Ordinario Independiente de la distribucion son MELI
Universal
Indicador Son predictores optimos
No Probabilstico
Lineal Transgaussiano
Disyuntivo

2.6.1. Generalidades sobre el kriging

La toma de muestras da la informacion de lo que ocurre en cada punto.


Sin embargo, no da informacion acerca de la relacion que pueda existir entre
dichos puntos. Se requiere de una forma precisa de estimar valores en puntos
intermedios o en el caso de bloques, por ejemplo, estimar el promedio sobre el
bloque. La precision del estimador usado depende de varios factores:

El numero de muestras tomadas

La calidad de la medicion en cada punto

Las ubicaciones de las muestras en la zona; si las muestras son igualmente


espaciadas se alcanza una mejor cobertura, dando mayor informacion
acerca de la zona que aquella que se obtendra de muestras muy
agrupadas en unos sectores y separadas en otros. Sin embargo, en la
practica, debido a las caractersticas de las regiones de estudio, muchas
veces es preciso tomar muestras irregularmente espaciadas.

Las distancias entre las muestras; para la prediccion es mas conveniente


usar muestras vecinas que muestras distantes, esto es, la precision mejora
cuando la cercana de las muestras aumenta, y se deteriora cuando esta
disminuye. La extrapolacion no es aconsejable.

La continuidad espacial de la variable o atributo en estudio; es mas facil


estimar el valor de una variable bastante regular en una region que una
que presenta grandes uctuaciones.
28 CAPITULO 2. GEOESTADISTICA

2.6.2. Introduccion a la teora del kriging

2.2 Ejemplo. Supongamos que se tienen las mediciones (1 ), (2 ), (3 )


y (4 ), en los puntos 1 , 2 , 3 y 4 respectivamente (vease Figura 2.6), y se
requiere predecir el valor (0 ). El valor a predecir se ubica mas cerca de 2
que de cualquier otra ubicacion donde se tenga medicion; por lo tanto, es logico
pensar que (0 ) es mas parecido a (2 ) que a cualquiera de los otros tres
valores medidos. De acuerdo a lo anterior, se puede optar para la prediccion,
por una media ponderada de las cuatro mediciones, en la cual (2 ) tiene
mayor peso que cualquier otra, seguida en su orden por (4 ), (3 ) y por
ultimo (1 ). Asi,

Figura 2.6. Ilustracion kriging

(0 ) = 1 (1 ) + 2 (2 ) + 3 (3 ) + 4 (4 )

Donde los , = 1,
2, 3, 4 son los factores de ponderacion o pesos tales que
2 > 4 > 3 > 1 y 4=1 = 1

Para obtener una estimacion de (0 ), el estimador debe cumplir con las


siguientes condiciones:

Lineal. El estimador es una combinacion lineal de los valores de las


variables en los puntos muestreados

(0 ) = Z (2.8)

Donde Z = ( (1 ) , (2 ) , . . . , ( )) y = (1 , 2 , . . . , ) es el
vector de factores o coecientes de ponderacion y son calculados de
acuerdo a las dos condiciones siguientes.
2.6. METODOS ESTADISTICOS DE INTERPOLACION 29
Insesgamiento. El valor esperado del estimador es igual al valor esperado
de la variable en el punto de medicion2 .
[ ]
(0 ) = [ (0 )] (2.9)

( )
Varianza mnima. El estimador satisface que (0 ) (0 ) es
mnima.

Notese que la varianza puede ser escrita de la siguiente manera por la condicion
de insesgamiento
( ) ( )2 [ ( )]2
(0 ) (0 ) = (0 ) (0 ) (0 ) (0 )
( )2

= (0 ) (0 )
[( ) ( )]
= Z (0 ) Z (0 )
[( )( )]
= Z (0 ) Z (0 )
[ ]
= ZZ (0 ) Z (0 ) Z + ( (0 ))2
[ ]
= ZZ 2 (0 ) Z + ( (0 ))2
[ ] [ ] [ ]
= ZZ 2 (0 ) Z + ( (0 ))2
[ ] [ ] [ ]
= ZZ 2 (0 ) Z + ( (0 ))2
(2.10)

Si ha estimado el semivariograma o bien se conoce la funcion de covarianza,


tambien se tendran los valores
[ ] [ ] [ ]
ZZ , (0 ) Z , ( (0 ))2

Por lo tanto, se encontrara minimizando esta varianza. Del respectivo proceso


de minimizacion se obtendra un sistema de ecuaciones, que cambiara de
acuerdo a las hipotesis que se tengan sobre la media y la covarianza del
proceso, y la distribucion de la variable en estudio. En la proxima seccion
se mencionaran algunos de estos casos.
2
Observese que en este caso no se habla del insesgamiento como la igualdad con respecto
al parametro de una distribucion
30 CAPITULO 2. GEOESTADISTICA

2.6.3. Kriging ordinario

El kriging ordinario se usa cuando la variable es estacionaria con covarianza


conocida y media desconocida, es decir, se asume que el proceso espacial asume
la descomposicion siguiente:

() = + () , , y desconocida (2.11)

Al no conocer la media es necesario garantizar la propiedad de insesgamiento,


es decir, [ ]

(0 ) = [ (0 )] =
Donde es la media del proceso. Entonces
[ ] [ ]
Z = Z
= 1 = 1 = 1 = 1 (2.12)

Por tanto, es indispensable que se cumpla la condicion 2.12 para obtener un


estimador insesgado. Para la segunda condicion de varianza mnima, se tiene
lo siguiente:
[ ]
ZZ = + = + 2 11 (2.13)
[
] 2
(0 ) Z = 0 + 1 (2.14)
[( 2 )] 2
(0 ) = (0) + (2.15)

Donde es la matriz de varianzas y covarianzas de Z,


0 = ( (1 0 ) , (2 0 ) , . . . , ( 0 )) , es decir, un vector en el cual
cada una de sus componentes es la covarianza entre cada punto observado y
el punto donde se va a realizar la prediccion y 1 = (1, 1, . . . , 1) . Sustituyendo
2.13, 2.14, 2.15 en 2.10 y empleando la condicion de insesgamiento 2.12 se
tiene:
( ) [ ] [ ]
(0 ) (0 ) = + 2 11 2 0 + 2 1 + (0) + 2
[ ( ) ]
= 20 + (0) + 2 11 2 1 + 1
= 20 + (0) + 2 [(1)(1) 2(1) + 1]
= 20 + (0) (2.16)

Luego, se debe minimizar 2.16 bajo la resticcion 2.12, para lo cual se emplea
el metodo de los multiplicadores de Lagrange que consiste en minimizar el
2.6. METODOS ESTADISTICOS DE INTERPOLACION 31
lagrangiano (, ):

1 ( ) ( )
(, ) = (0 ) (0 ) 1 1
2
1 1 ( )
= 0 + (0) 1 1 (2.17)
2 2
respecto a y al multiplicador de Lagrange . Para llevar a cabo la
minimizacion de (, ) se deriva respecto a los parametros y obteniendo:

(, )
= 0 1

(, )
= 1 1 (2.18)

Luego, se igualan a cero las ecuaciones 2.18, lo cual conduce a:

1 = 0 (2.19)
1 = 1 (2.20)

sistema lineal de + 1 ecuaciones llamadas ecuaciones del kriging ordinario,


a partir de las cuales se encuentran los valores de los factores de ponderacion
para llevar a cabo la prediccion. Multiplicando 2.19 por 1 1 se tiene que

1 1 1 1 = 1 1 0 1 1 1 1 = 1 1 0
1 1 1 0
= (2.21)
1 1 1

Ahora, multiplicando por 1 a 2.19 y reemplazando 2.21


( )
1 1 1 1 1 0
1 = 0 1 1 1 = 1 0
1 1
( )
1 1 1 1 0
= 0 + 1 (2.22)
1 1 1

El vector de ponderaciones del kriging tambien pueden ser obtenido por


medio de la funcion de semivarianza del proceso espacial usando la relacion
con la funcion de covarianza, entonces se tiene que

= (0) 11 (2.23)
32 CAPITULO 2. GEOESTADISTICA

Ahora, sustituyendo 2.23 en 2.16 y usando la restriccion de insesgamiento 2.12


se llega a
( ) ( )
(0 ) (0 ) = (0) 11 2 ( (0) 1 0 ) + (0)
= (0) 11 2 (0) 1 + 20 + (0)
= (0) (1)(1) 2 (0) (1) + 20 + (0)
= + 20 (2.24)

Al igual que en el caso de la covarianza se debe minimizar 2.24 usando el


metodo de los multiplicadores de Lagrange, de lo cual se tiene que

1 ( ) ( )
(, ) = (0 ) (0 ) 1 1
2
1 ( )
= + 0 1 1 (2.25)
2
derivando con respecto a y e igualando a cero se tiene que

(, )
= + 0 1 + 1 = 0

(, )
= 1 1 1 = 1 (2.26)

que es el sistema de ecuaciones normales para el kriging ordinario, pero a traves
de la funcion de semivarianza. La solucion de 2.26 es
( )
1 1 1 0 1
= 0 1 (2.27)
1 1 1
1 1 0 1
= (2.28)
1 1 1

2.6.4. Kriging Simple

El kriging simple se puede considerar como un caso particular del kriging


ordinario en el cual la media es conocida. Se asume que el proceso espacial se
puede expresar de la siguiente manera

() = + () , , y conocida (2.29)
2.6. METODOS ESTADISTICOS DE INTERPOLACION 33
Se tiene que ( ()) = o lo que es lo mismo ( ()) = 0. De otro lado, la
prediccion en un punto particular 0 se puede expresar de la siguiente manera
como
(0 ) = + (0 ) (2.30)
donde (0 ) es la prediccion del error aleatorio en el punto 0 . Luego, se debe
tener un predictor lineal del error que se dene como

(0 ) = e (2.31)

donde e = (1 , 2 , . . . , ) y como en 2.8 con lo cual el predictor de la


variable en el punto 0 es
(0 ) = + e (2.32)
Bajo este escenario la condicion de insesgamiento se expresa como
( ) ( ) ( )
(0 ) = ( (0 )) = + e = + e =
( )
e = 0
( )
e = 0
0 = 0

indicando que no es necesario realizar ninguna restriccion sobre el vector de


ponderaciones. Finalmente, la estimacion debe ser de varianza mnima, para
ello tenemos lo siguiente:
( )
ee = e (2.33)
(
)
(0 ) e = 0e (2.34)
( 2)
( (0 )) = (0) (2.35)

reemplazando 2.33, 2.34 y 2.35 en 2.10 tenemos que

(0 ) (0 )) = e 20e + (0)
( (2.36)

derivando respecto a e igualando a cero


(0 ) (0 ))] = 2e 20e
[ (

e = 0 e (2.37)
34 CAPITULO 2. GEOESTADISTICA

que es el sistema de ecuaciones normales para el kriging simple. El vector de


ponderaciones es
= 1
e 0 e (2.38)

Los mapas de prediccion generados con kriging se acompanan, de los


respectivos mapas de residuos para poder determinar cuales zonas tienen
predicciones mas precisas. Ademas, se usan las medidas generales para calidad
de prediccion, tales como los estadsticos de los residuos, el MAPE, el CME, el
coeciente de correlacion lineal entre los valores observados y sus respectivas
predicciones.

Mapas de prediccion y residuos

[4.78,5.308] [0.09692,0.1746]
(5.308,5.837] (0.1746,0.2523]
(5.837,6.365] (0.2523,0.33]
(6.365,6.893] (0.33,0.4077]
(6.893,7.421] (0.4077,0.4854]

2.6.5. El enfoque robusto

Kriging con Pulimiento de Medianas

Es una metodologa a aplicar cuando () no es conocida y se asume que se


puede descomponer aditivamente en componentes direccionales. Fue planteada
originalmente para datos en grilla regular (igualmente espaciados en el
terreno) as:
( ) = + + + 3 (2.39)
donde es un punto ubicado en la columna y la la de la
grilla, es el efecto global, denota el efecto de la la = 1, . . . , ,
3
Si existe interaccion entre la y columna, en este modelo tambien se puede incluir la
interaccion .
2.6. METODOS ESTADISTICOS DE INTERPOLACION 35
el efecto de la columna = 1, . . . , y denota el residuo en
. Las estimaciones de y se obtienen mediante un proceso iterativo de
sustraccion de las medianas de la y luego de medianas de columnas hasta
que las medianas de las y columnas converjan a cero, usualmente de 2 a
4 iteraciones son sucientes para que esto ocurra, sin embargo en algunas
situaciones el algoritmo puede no converger por la naturaleza de los datos. El
modelo en la i-esima iteracion esta dado por:
() () ()
modelo : = () + + + (2.40)

A continuacion se presenta el algoritmo para obtener la estimacion de los


efectos en la iteracion:

En la primera iteracion es necesario tener en cuenta

(0) (0) (0)


(0) = 0, = 0, = 0 y =

En primer lugar se realizan las operaciones la

() (1)
= ( ; = 1, .., ); = 1, . . . ,
() ()
= ( ; = 1, ..., )
() (1) ()
= ; = 1, .., ; = 1, ...,

En segundo lugar se realizan las operaciones columna

() ()
= ( ; = 1, .., ); = 1, .., )
() ()
= ( ; = 1, ..., )
() () ()
= ; = 1, .., ; = 1, ...,

Finalmente se obtienen los efectos estimados para el modelo dado en


(2.40):

() ()
() = (1) + +
() (1) () ()
= + ; = 1, . . . ,
() (1) () ()
= +
36 CAPITULO 2. GEOESTADISTICA

Las predicciones de () son realizadas con la siguiente ecuacion:



( = (, )) =
+ + (
+1 ) + + (
+1 ) (2.41)
+1 +1

con = 1, . . . , 1; = 1, . . . , 1, los puntos ( , ), .(+1 , ), ( , +1 )


y (+1 , +1 ) son los nodos mas cercanos al punto .
Los residuales del modelo pueden ser tomados como un nuevo conjunto
de observaciones espaciales a los que se les aplica kriging ordinario. Este
procedimiento es llamado kriging con pulimiento de medianas, y la varianza
de las predicciones corresponde a la varianza de kriging ordinario.

Kriging Robusto

A continuacion se presenta en forma resumida el algoritmo propuesto por


Cressie y Hawkins en dos de sus artculos ((?), (?)), para realizar predicciones
robustas en presencia de datos atpicos. Se asume en este caso que (.) es
intrnsecamente estacionario, pero no necesariamente gaussiano:

1. Estimacion robusta del semivariograma experimental: para corregir el


sesgo generado por los datos atpicos se dene en la ecuacion (2.42)
un estimador resistente a datos atpicos y se estiman los parametros
de dependencia espacial () por .
4
1 1
/ 2(0.457 + 0.494)
() = () ( + ) 2 (2.42)
() ()
()

2. Con base en los parametros estimados en 1, se obtienen las ponderaciones


asociadas la prediccion de cada punto muestral ( ), teniendo
en cuenta que las ponderaciones se calculan extrayendo la
observacion (2.43), en este paso tambien se calcula la varianza asociada
a dicha prediccion ( ).


( ) = ( ) (2.43)
=1;=
2.6. METODOS ESTADISTICOS DE INTERPOLACION 37
3. Usando las ponderaciones obtenidas en 2, se calcula una version
robusta de ( ) con su mediana ponderada4 :

( ) = ( ; ( ); = ) (2.44)

4. Se editan las observaciones reemplazandolas por su media Winsorizada:



( ) + ( ) si ( ) ( ) > ( )

( ) = ( )
si ( ) ( ) ( )
) < ( )
( ) ( ) si ( ) (
(2.45)
la constante controla la intensidad del suavizamiento aplicado. As, si
toma valores muy pequenos se perdera mucha variabilidad y por el
contrario si toma un valor muy grande, algunos atpicos no quedaran
suavizados. Lo ideal es encontrar un punto intermedio; al respecto se
aconseja usar valores entre 1.5 y 2.5 (segun el teorema de Chebyshev
se recortara aproximadamente entre 22 % y el 8 % de la variabilidad
original, a cada extremo de la distribucion)(?).

5. Usando los parametros estimados en el paso 1 () y las observaciones


originales, con kriging ordinario, se obtienen las ponderaciones
{0 ); = 1, . . . , } asociadas a cada punto de prediccion 0 . Finalmente
la prediccion robusta esta dada por:

() (0 ) = =1 (
) (2.46)

2.6.6. El enfoque bayesiano

La diferencia fundamental entre la teora clasica y la bayesiana, es que en la


segunda, el parametro de interes () es tratado como una variable aleatoria; as,
la inferencia bayesiana se basa en la distribucion del parametro implementando
tanto informacion previa como muestral. esta es denominada distribucion a
posteriori ( ). Para su obtencion, es necesario especicar una distribucion
a priori (), la cual representa el conocimiento que se tiene sobre (), previo a
la obtencion de los datos. La informacion suministrada por los datos muestrales
( ) es denominada verosimilitud del parametro dado y se denota ( ).
4
La denicion de mediana ponderada se encuentra en Cressie 1993, pag. 148
38 CAPITULO 2. GEOESTADISTICA

El teorema de Bayes es utilizado para combinar esta informacion mediante la


siguiente relacion:
( ) ()( ) (2.47)
La distribucion a posteriori para en el modelo (??) con (.) gaussiano:
1 { }
( ) () () 2 exp ( ) 1 ()( ) (2.48)

La base para la prediccion bayesiana es la distribucion predictiva a posteriori :



(0 ) = (0 , )( ) (2.49)

La distribucion predictiva toma en cuenta la verosimilitud de todo el modelo


en general, en lugar de enfocarse solo en la verosimilitud de los parametros de
covarianza(?). De esta forma el metodo bayesiano requiere los siguientes pasos:

1. Especicar la forma de la distribucion a priori


2. Encontrar la verosimilitud de los datos observados
3. Combinar la distribucion a priori con la verosimilitud para obtener la
distribucion a posteriori
4. Obtener estimaciones de la distribucion a posteriori
5. Obtener la distribucion predictiva a posteriori.

La eleccion de la distribucion a priori es muy importante, existen


dos casos extremos, el primero de ellos es cuando los parametros son
perfectamente conocidos, las distribuciones a priori pueden ser consideradas
como distribuciones degeneradas en los valores de los parametros, y el segundo,
es cuando el conocimiento previo acerca de los parametros es muy vago,
entonces son llamadas distribuciones a priori no informativas.
En el presente trabajo no se tiene informacion a priori y se utilizan
distribuciones a priori no informativas de tipo () para variando
en un conjunto de los reales, este tipo de distribuciones indican que no hay
un valores particulares de preferidos para el parametro(?). Tomando como
referencia Diggle y Ribeiro 2000(?, Captulo 5), a continuacion se presentan
las distribuciones a priori elegidas para los parametros de interes = (, 2 , )
asumiendo el modelo (??) con efecto pepita 2 = 0.
2.6. METODOS ESTADISTICOS DE INTERPOLACION 39
Para se elige la distribucion a priori () 1, la distribucion a
posteriori de con los demas parametros jos esta dada por:
2 )
( , 2 , ) (, (2.50)

Para 2 se elige ( 2 ) 12 , esta distribucion equivale a una distribucion


ji cuadrado inversa con parametros = 0 y 2 = 2 una estimacion
previa de la varianza. con la diferencia que no es necesario especicar los
parametros y 2 . As la distribucion a posteriori con parametros jos
restantes es:
2)
( 2 , , ) 2 (, (2.51)

La eleccion de la distribucion a priori asociada al parametro del rango


es muy importante, en principio el rango puede variar en el intervalo
[0, ) , sin embargo el investigador debe acotar este intervalo, existen
varias distribuciones a priori, sin embargo, la mas utilizada en el caso de
no tener informacion es una uniforme en un intervalo especco donde
todos los valores de en el intervalo son igualmente probables.

Si y 2 se asumen desconocidos la distribucion a posteriori se encuentra


utilizando las distribuciones a priori ya seleccionadas, y se obtiene como
el producto de una distribucion normal con una ji cuadrado inversa

(, 2 , ) (, 2 )( , 2 , ) (2.52)
2 )2 (,
(, 2 , ) (, 2) (2.53)

El caso mas general, se presenta cuando todos los parametros son


desconocidos. La distribucion a priori para los parametros de interes se puede
notar as:
(, 2 , ) = ()(, 2 ) (2.54)
Sin especicar una a priori para , se puede considerar una distribucion a priori
at para (, 2 ) 12 . La distribucion a posteriori esta dada por:

(, 2 , ) (, 2 , )( ) (2.55)

el primer termino es dado por la ecuacion (2.52), y el segundo hace referencia a


la distribucion a posteriori ( ) que puede ser obtenida usando la siguiente
relacion
(, 2 , )( , 2 , )
( ) (2.56)
( , 2 , )( 2 , )
40 CAPITULO 2. GEOESTADISTICA

donde las distribuciones del numerador corresponden a la distribucion a priori


dada en (2.54) y la verosimilitud expresada en (2.48), y las distribuciones a
posteriori del denominador estan dadas por (2.50) y (2.51).
La expresion (2.56) no tiene una distribucion de probabilidad conocida,
por lo que es necesario recurrir a metodos de simulacion, entonces se utilizan
muestras de la distribucion a posteriori para estimar los parametros. El
algoritmo utilizado para esta tarea es el Metodo de Montecarlo con Cadenas
de Marcov (MCMC)5 .

Algoritmo MCMC para calcular las distribuciones a posteriori

1. Dar valores discretos a la distribucion de ( ). Es decir, escoger un


conjunto de valores para en un intervalo adecuado teniendo en cuenta la
naturaleza del problema y planteando una distribucion a priori uniforme
discreta.
2. Obtener una distribucion a posteriori aproximada de , ( ) usando
(2.56).
3. Obtener un valor muestral de ( )
4. Fijar el valor de obtenido en el paso 3 a (, 2 , ) dada en (2.52)
y obtener una muestra de esta distribucion.
5. Iterar los pasos 3 y 4 tantas veces como muestras de = (, 2 , ) se
deseen de los parametros de la distribucion a posteriori.

De esta forma, se obtiene una muestra de la distribucion a posteriori de


y los parametros pueden ser estimados con alguna de las medidas de tendencia
central como la moda, mediana o media. El siguiente paso es obtener la
distribucion predictiva a posteriori como se presenta en (2.57). Usualmente
esta no es conocida y la integral se resuelve por metodos numericos MCMC es
utilizado para obtener la distribucion predictiva, el algoritmo es practicamente
el mismo; simplemente en el paso 4 se ja el valor muestreado de en
( , ) y se obtiene realizacion de la distribucion predictiva.

(0 ) = (0 , , 2 , ) 2
= (0 , , 2 , ) 2 ( ) (2.57)
= (0 , )( )
5
Algoritmo que permite generar de manera iterativa muestras de distribuciones
multivariadas que difcilmente podran simularse por metodos directos
2.6. METODOS ESTADISTICOS DE INTERPOLACION 41
Incorporacion del efecto pepita al modelo: notese que la matriz de
covarianzas asociada a puede escribirse como () = 2 + 2 (), donde
denota una matriz identidad y () es una matriz cuadrada de
1
dimension con entradas = ( 2 ; ). Adicionalmente se puede
reducir la dimensionalidad de extrayendo un factor escalar y expresandola
como sigue () = 2 { 2 + ()} , donde 2 = 2 / 2 , este parametro es
denominado efecto pepita relativo. Y en el caso en el que se desee incorporar el
efecto pepita en el modelo, se incorpora 2 y el algoritmo puede ser adaptado
cambiando el primer paso por:

1. Dar valores discretos a la distribucion de (, 2 ). Es decir escoger un


conjunto de valores para (, 2 ) en un intervalo adecuado teniendo en
cuenta la naturaleza del problema y planteando una distribucion a priori
uniforme discreta.

El metodo mas usado para vericar la calidad de los resultados as como la


validez de los supuestos hechos para la prediccion es el de validacion cruzada.
Consiste en extraer de la muestra los datos pero uno a la vez, para con los
1 restantes predecir el valor de la variable en la ubicacion extrada; as, se
elimina la la correspondiente a ( ), se encuentra ( ) con los 1 datos
) para cada una de
restantes, y se calcula el residual de prediccion ( ) (
las ubicaciones. Tambien se puede llevar a cabo un diagrama de dispersion de
los datos observados contra cada una de sus respectivas predicciones; esto es,
)); si las predicciones son aceptables esta
gracar todas las parejas (( ), (
nube de puntos debera tender a una lnea recta de pendiente 45o .
42 CAPITULO 2. GEOESTADISTICA
CAPITULO 3

Modelos de regresion espaciales

3.1. Efectos espaciales

heterogeneidad espacial,
heterocedasticidad
inestabilidad estructural en los parametros
autocorrelacion espacial
luego hay q desarrolar cada uno de los temas, el primer comentario es lo q
se puede resolver por metodos econometricos estandar tales como las pruebas
de heterocedasticidad y la estimcion por MCP, ya sea o no en el contexto de
regresion.
fuera de regresion puede ser por ej la prueba de bartlet
La F sirve para comparar solo dos varianzas pero requiere normalidad
Batlett compara multiples varianzas pero tambien requiere normalidad Cuando
los datos en una muestra son de corte transversal y aun as en el modelo se
evidencia invalido el supuesto de independencia entre las observaciones de

43
44 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

la muestra, puede estar presente el fenomeno de autocorrelacion espacial,


que esta indicando que la ubicacion de cada una de las observaciones se
debe incorporar como un factor adicional importante en la estimacion del
modelo. Sin embargo, los conceptos dieren notoriamente si se buscara una
analoga con las series de tiempo, pues en primer lugar no se esta en
presencia de una dependencia unidireccional sino al contrario la dependencia
puede ser multidireccional. Si se desea analizar la similitud existente entre
la tasa de mortalidad infantil de un departamento Colombiano con la de
aquellos departamentos que lo rodean, no existe una unica direccion en la
cual podemos medir distancias, incluso se puede realizar este mismo analisis
con departamentos que esten dentro de un determinado radio, aun cuando
no limiten con aquel en cuestion. Por lo tanto, no es posible generalizar de
manera directa el operador de retardo temporal al caso espacial, se requiere
antes denir la matriz de pesos o ponderaciones espaciales:

3.2. Matrices de Pesos Espaciales

La caracterstica multidireccional de los datos espaciales, puede ser


plasmada en esta matriz, donde se involucran todos los posibles pares de
observaciones y a traves de la cual se debe decidir la inuencia que tienen entre
si cada una de estos. Esta matriz se supone conocida, no hace parte en principio
de los elementos a estimar dentro del modelo, sino que tiene que estar denida
previamente pues ingresa a dicho proceso de estimacion como una constante.
En consecuencia, es un factor muy importante la correcta especicacion que
se haga de la importancia relativa entre los individuos.
Anselin(1988) dene la matriz de pesos espaciales como la estructura que
concreta la longitud de las interacciones posibles entre las unidades dentro de
un sistema espacial y establece sus relaciones de interdependencia . Sea una
matriz de pesos espaciales como:


0 12 . . . 1
21 0 . . . 2
.. ..
= .. (3.1)
. . .
..
1 2 . 0
3.2. MATRICES DE PESOS ESPACIALES 45
es una matriz cuadrada, no estocastica, con entradas no negativas
y nitas que representan la interdependencia espacial entre las unidades
geogracas. Las entradas no nulas corresponden a unidades espaciales con
relaciones de contiguidad.
Inicialmente, suponganse una grilla regular de muestreo en una sola
direccion, esto es un transecto:

Figura 3.1.

En este caso cada uno de los puntos tiene dos vecinos excepto el primero
y el ultimo que tiene solamente uno. O una grilla de muestreo regular en dos
dimensiones

Figura 3.2.

Para la cual existen varias formas de denicion de la contiguidad fsica, es


decir, debe existir algun tipo de contacto.
46 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

Criterio Maxima cantidad de vecinos Denicion


lineal 2 Compartir lado izquierdo o derecho
Torre 4 Compartir un lado cualquiera
All 4 Compartir un vertice
Reina 8 Compartir lado o vertice

Figura 3.3. Criterios reina y torre

Si la grilla de muestreo es irregular, es necesario recurrir a otros tipos de


deniciones de vecino, tales como la de denir un umbral de distancia o el
metodo del vecino mas cercano o algun metodo de triangulacion.

Figura 3.4. Vecinos mas cercano, k=1 y k=2 respectivamente

Si los puntos de muestreo son regiones, los criterios aun se pueden usar
utilizar de acuerdo a un punto clave de cada region, por ejemplo la capital.
Para denir los pesos de la matriz se pueden usar posteriormente criterios
de distancia, los umbrales segun la distancia euclidiana o proporciones de la
distancia total

= 1 /( )

Cli y Ord (1973,1981) propusieron la siguiente denicion:


3.2. MATRICES DE PESOS ESPACIALES 47

Figura 3.5. Vecindad para polgonos

= (1/ )

Donde es la distancia entre las unidades y la longitud relativa de la


frontera entre las regiones y con respecto al permetro de . Los parametros
y se suponen conocidos, el investigador debe estar en capacidad de darlos a
priori. Anselin propone la matriz inversa de las distancias al cuadrado, logrando
con esto que se cumpla una premisa basica de los datos georreferenciados que es
el hecho de que entre mas cerca se encuentren las cosas tienen mayor similitud,
y que por tanto esta similitud es inversamente proporcional a la distancia.
Tomando como base para las ponderaciones medidas de distancia, en
general, la matriz W sera simetrica; pero hay que notar que en este contexto
la simetra de la matriz no tiene ninguna justicacion conceptual e incluso en
muchas ocasiones va en contrava con el signicado de la variable medida; esto
hace que sea conveniente para gran numero de casos realizar la asignacion de
ponderaciones de tal forma que se involucre el valor de la variable de interes.
Por ejemplo

= 1/( )

donde la variable se encuentra altamente relacionada con la variable de


interes.
Otra de las funciones de la matriz de pesos espaciales mencionada
48 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

por Anselin(1988), es incorporar la multidireccionalidad de las relaciones


geogracas a partir del concepto del cambio espacial. Este concepto se calcula
como la suma ponderada de todos los valores a lo largo de una clase
de contiguidad. Los terminos de la suma son obtenidos al multiplicar las
observaciones con sus correspondientes
ponderaciones de la matriz de pesos
espaciales, como: = o matricialmente de la forma = ,

donde es el operador de rezago asociado con la clase de contiguidad , es


el conjunto de observaciones a lo largo de y son los pesos espaciales.
No existe una algoritmo para denir los pesos o ponderaciones espaciales;
por el contrario se deja libertad al experto en el fenomeno en estudio para su
manipulacion. Por lo tanto, uno de los puntos crticos en el analisis espacial
es la eleccion de , ya que existen multiples criterios para generar el valor
de las entradas. Las matrices de pesos binarias asignan el valor de uno a las
unidades contiguas y cero a las demas1 . Las matrices de pesos estandarizadas se
contruyen a partir de las relaciones binarias y en donde cada se pondera por
la suma de la la a la que pertenece, esta transformacion incorpora asimetra
en .
Existen medidas extendidas de interrelaciones espaciales, asociadas a las
matrices generalizadas de pesos. Dray, Peres y Legendre(2006) consideran
un conjunto amplio de matrices de pesos espaciales. As, = [ ] puede
descomponerse como el producto Hadamard entre una matriz de conectividad
= [ ] y una matriz de pesos = [ ] , como = . Los criterios de
conectividad se asocian a matrices binarias y se dene partir de funciones
decrecientes con la distancia (lineales, concavas hacia abajo y concavas hacia
arriba).
A continuacion algunos criterios con especicaciones binarias y
estandarizadas de:

Triangulacion Delaunay:
Considera como vecino de a aquellas unidades que pueden ser
conectadas mediante triangulos, tal que sea al menos un vertice.

Criterio Gabriel: Dene (, ) mn((, )2 , (, )2 )1/2 , , ,


como el conjunto total de unidades geogracas.
1
Las Crticas a las relaciones binarias de contiguidad para denir la matriz de pesos
espaciales, son la simetra que impone en las relaciones espaciales y el uso de la adyacencia
fsica como unico criterio
3.3. CONTRASTES DE AUTOCORRELACION ESPACIAL 49
Vecinos Relativos: A diferencia del anterior, este criterio considera
(, ) mn(max (, ), (, ))1/2 .

Esfera de Inuencia: Resulta al denir un conjunto de puntos nitos


y la distancia entre el punto y su vecino mas cercano en , sea
una circunferencia centrada en , bajo este criterio las unidades e se
consideran vecinos si y intersecan en el menos dos puntos.

K-Vecinos mas cercanos: En este caso se consideran relaciones de


distancia no simetricas bajo matrices de pesos estandarizadas. El criterio
de vecindad de sobre -unidades mas cercanas se dene a partir de
distancias euclidianas, las demas + 1, + 2, ..., + se consideran no
vecinas de

3.3. Contrastes de Autocorrelacion Espacial

Con una matriz de pesos espaciales denida, se puede comprobar si existe


autocorrelacion espacial en una variable, as como determinar el signo de la
relacion. Los contrastes son de dos tipos, los globales y los locales. Los primeros
indagan sobre la hipotesis de estacionariedad de una variable sobre la totalidad
de la muestra, mientras que las pruebas locales verican estacionariedad
intraregional.

3.3.1. Estadsticos Globales

Uno de los estadsticos mas utilizados para detectar autocorrelacion


espacial es el contraste global I de Moran. Moreno y Vaya(2000) denen este
contraste como medida de la correlacion entre cada region y sus vecinas . El
estadstico I de Moran se expresa como:




( )( )
=1=1
() =
(3.2)
( )2
=1=1 =1

donde es el valor de la variable en la region , es su media, es la


50 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

entrada de la matriz de pesos de espaciales y el numero de observaciones,


= .
En el proceso inferencial, la hipotesis nula asociada es la ausencia de
autocorrelacion espacial. Segun Moreno y Vaya(2000), un valor positivo y
signicativo de () indica concentracion de datos similares en las regiones
vecinas, mientras que valores negativos que rechacen la hipotesis nula revela
que en unidades vecinas se presenta disparidad.
Otro criterio para comprobar autocorrelacion espacial es el test de Geary,
dado por:



( 1) ( )2
=1 =1
() =

(3.3)
2 ( )2
=1 =1 =1

En este contraste la hipotesis nula tambien es la ausencia de autocorrelacion


espacial, sin embargo el valor estandarizado de () es de signo contrario al
esquema de autocorrelacion espacial encontrado.

3.3.2. Estadsticos Locales

Los criterio locales permiten detectar aglomeraciones de unidades vecinas


con valores extraordinariamante altos o bajos con relacion al promedio. El
estadstico local mas utilizado es el de Moran, de la forma:


= 2 (3.4)


donde es el valor de la variable bajo la normal estandar y es el conjunto


indexado de unidades que dene a los vecinos de . Los contrastes locales
permiten identicar en un mapa los clusters regionales y los valores atpicos
de una variable en el espacio.
3.4. ANALISIS DE COOORDENADAS PRINCIPALES DE MATRICES DE PESOS
ESPACIALES(PCNM) 51
3.4. Analisis de Cooordenadas Principales de
Matrices de Pesos Espaciales(PCNM)

El criterio de autocorrelacion global de Moran () puede ser escrito


matricialmente de la forma:


() = , = ( 11 /) ( 11 /) (3.5)
1 1 ( 11 /)

La metodologa PCNM consiste en la descomposicion espectral de ,


denida a traves de una matriz de pesos espaciales. El maximo valor que puede
tomar () es ( ) = (/1 1) max y el mnimo ( ) = (/1 1) mn ,
donde max y mn son el maximo y mnimo valor propio de . Con esta
metodologa se garantiza que los vectores propios maximizan ().
El conjunto de los se conocen como Mapas de Eigenvectores de
Moran(MEM) y estos pueden ser utilizados como variables explicativas en un
modelo de regresion o en un analisis de correlacion canonica. Con el objetivo
de encontrar la mejor matriz de pesos espaciales se realiza una regresion entre
la variable de estudio2 y los vectores propios asociados a cada . De acuerdo
a Dray, Legendre y Peres-Neto(2006), se selecciona el modelo que presente
menor criterio de Akaike.

3.5. Modelos de Regresion Espacial

Para vericar la existencia de estructura espacial en un modelo de regresion


se debe comprobar si esta se presenta en la variable objetivo rezagada
espacialmente, en otras variables exogenas, en el termino del error o en
combinaciones de estas. Se genera un conjunto de especicaciones posibles
para comprobar la existencia espacial a nivel multivariado.
El modelo general se expresa como:
2
Una alternativa como variable explicativa es tomar los residuos de la regresion entre la
variable de estudio y las coordenadas geogracas
52 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

= 1 + 1 + 2 2 + , = 2 + 3 (3.6)

con (0, ), matriz de covarianza generalizada con elementos en la


diagonal dados por = () .
Donde es el vector de la variable explicada, 1 es el retardo espacial de la
variable de estudio, es una matriz de variables independientes no rezagadas
espacialmente, es una matriz de variables explicativas no necesariamente
con los mismos elementos de rezagadas espacialmente. Los parametros y
miden el grado de la dependencia espacial.
Esta especicacion base genera un conjunto de modelos, como:

Modelo Mixto autoregresivo regresivo-espacial o del rezago


espacial(SAR-LAG)4
= 1 + 1 + (3.7)

Modelo del error espacial autoregresivo (SAR-ERR)5

= 1 + ( 2 )1 (3.8)

Modelo Mixto autoregresivo regresivo espacial con error espacial


autoregresivo
= 1 + 1 + ( 2 )1 (3.9)

Modelo Mixto Regresivo-Regresivo Espacial

= 1 + 1 + 2 2 + (3.10)

Modelo Mixto regresivo cruzado-regresivo espacial.

= 1 + 2 2 + (3.11)
3
Serrano y Vaya tambien consideran modelos con estructura de medias moviles espaciales,
denominados SMA
4
Los modelos con estructura espacial en la variable explicada se denominan procesos de
difusion contagiosa.
5
Los modelos autoregresivos en el termino se denominan procesos de difusion jerarquica.
3.5. MODELOS DE REGRESION ESPACIAL 53
La estimacion mediante mnimos cuadrados no es adecuada en modelos de
regresion espacial, debido a que genera estimadores sesgados de :

) = ( )1 ( + ) = + ( )1
( (3.12)

La inconsistencia de los estimadores MCO se presenta dentro de un modelo


autorregresivo espacial del error, denido como = ( 2 )1 donde
la matriz ( 2 )1 genera una serie innita de la forma ( + +
2 2 + ...). El termino esta correlacionado con y los errores de otras
unidades geogracas. Debido a esta condicion de dependencia se viola el
supuesto de consistencia del estimador MCO, dado por lm 1 ( ) =
lm 1 ( ), excepto en el caso trivial de = 0.
La mejor estimacion en los modelos de regresion espacial esta dada por el
metodo de maxima versosimilitud, que asume multinormalidad en los residuos.
Para los modelos de rezago espacial la funcion Log-Verosmil toma la siguiente
forma:
( ) ( )
= ln(1 ) ln(2) ln( 2 )

2 2 2 2
(3.13)
donde son los valores propios de la matriz de pesos espaciales asociada.
Para los modelos con errores espaciales autoregresivos la especicacion
log-verosiml es la siguiente:
( ) ( )
= ln(1 ) ln(2) ln( 2 )

2 2 2 2
(3.14)
A partir de las propiedades asintoticas de los estimadores de maxima
verosimilitud se dene el Test del Multiplicador de Lagrange (LM) para
vericar la existencia de dependencia espacial en un modelo de regresion
estimado por mnimos cuadrados ordinarios.
Para comprobar dependencia espacial en el rezago de la variable explicada
(SAR-LAG) el test LM se dene como:
[ ]1
2
= [ ] ( ) ( )

+ ( + 2 )
(3.15)
donde N es el numero de observaciones, es el vector de residuos de mnimos
cuadrados, = ( )1 , el estimador de mnimos cuadrados de ,
54 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

es el operador traza y W es la matriz de pesos seleccionada. Esta prueba se


distribuye asintoticamente 2(1) . Se rechazara la hipotesis nula de no existencia
de dependencia espacial sustantiva o de autocorrelacion espacial de la variable
en estudio para valores altos del estadstico.
De la misma forma se puede construir un test del Multiplicador de Lagrange
para vericar la existencia de errores autocorrelacionados espacialmente, como:
2[ ]1
= [ ] ( + 2 ) (3.16)

El test se distribuye asintoticamente 2(1) . El estadstico rechazara la hipotesis


nula de no existencia del componente espacial autorregresivo en el error
para valores que superen el valor crtico elegido. Un criterio alternativo para
vericar dependencia espacial
en los residuos MCO es el test de Moran, como

= , donde = .

En Anselin(1988) se denen otros criterios de seleccion de modelos, como el


Test de Wald, el Test de la Razon de Verosimilitud y la prueba Breusch-Pagan
espacial. Las dos primeras pruebas verican la signicancia conjunta de los
parametros en un modelo de regresion espacial. El test de Breusch-Pagan
comprueba la existencia de heterogeneidad espacial.

3.5.1. Regresion geogracamente ponderada

En un contexto espacial es comun la ausencia de estacionariedad. Por


tal razon, es necesario utilizar especicaciones exibles que se adapten a
los diferentes comportamientos. Hay que tener cuidado principalmente con
la inestabilidad de los parametros como elemento fundamental para modelar
la ausencia de estacionariedad en el espacio. El objetivo de las regresiones
geogracamente ponderadas es estimar un vector de parametros distinto para
cada una de las observaciones, haciendo que este vector de parametros depende
de la ubicacion espacial de cada observacion. El modelo de partida es el
siguiente:

= ( , ) +

para = 1, 2, ..., , con , y siendo las coordenadas geogracas. La


estimacion de queda en este caso
3.6. APLICACION 55

, ) = [ ( , )]1 ( , )
(

para ( , ) = ( ), donde es la ponderacion denida en


terminos de la distancia de la observacion espacial a la observacion espacial
con = 1, ...

3.6. Aplicacion

Para 1078 unidades (municipios de Colombia)con informacion disponible


de Necesidades Basicas Insatisfechas se proponen los siguientes pasos con el
n de obtener una estimacion adecuada de los determinantes geogracos de la
pobreza.

Seleccion de algunos criterios de contiguidad para la evaluacion de


matrices de pesos espaciales. Se consideran los casos binarios y
estandarizados de Triangulacion Delaunay, Graca Gabriel, Vecinos
Relativos y Esfera de Inuencia y los estandarizados de K-Vecinos mas
cercanos con k de 4 a 10.

Calculo de los vectores propios de todas la matrices de pesos espaciales


construidas bajo diferentes criterios.

Obtencion del estadstico I de Moran para cada uno de los vectores


propios de una matriz de pesos espaciales.

Seleccion de la matriz de pesos espaciales con el menor AIC , entre el


NBI y cada uno de los vectores propios calculados.

Analisis de los contrastes globales (Moran y Geary) y locales (Moran) de


autocorrelacion espacial.

Aplicacion del test de especicacion del Multiplicador de Lagrange para


diferenciar modelos de regresion espacial.

Estimacion del mejor modelo de regresion.


56 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

3.6.1. Eleccion de la Matriz de Pesos Espaciales


(PCNM)

Para los criterios de contiguidad evaluados, el que presenta mayor cantidad


de ponderaciones no nulas entre municipios es 10-vecinos mas cercanos con
un 92 % sobre el total de conexiones. El criterio mas restrictivo es Vecinos
Relativos con un 24 % de relaciones no nulas (Anexo, tablas 5a y 5b).
Se calcularon los vectores propios de cada uno de los criterios de contiguidad
evaluados bajo la metodologa PCNM y las correspondientes estadsticos
estandarizados de Moran. En la tabla 6 del anexo se presenta la distribucion
de Moran la descomposicion espectral del criterio k-vecinos mas cercanos 6 .
En todos los escenarios se encuentran valores de autocorrelacion de Moran
concentrados en los valores negativos de la distribucion, por lo tanto hay
indicios para armar que la variable de estudio presenta una estructura local de
autocorrelacion, es decir que existen municipios vecinos que concentran valores
de NBI mas altos o bajos.
Se elige el criterio de contiguidad k(6) vecinos mas cercanos ya que es el
de menor Akaike entre todas las regresiones del NBI y los vectores propios por
criterio considerado y sera utilizado como matriz de pesos espaciales. Se estima
que los primeros 450 vectores ortogonales maximizan la varianza explicada del
modelo.
El criterio de k(6) vecinos mas cercanos elegido sobre los polgonos
generados en el mapa de Colombia se muestra como:

3.6.2. Analisis Univariado del NBI

Con la matriz de pesos espaciales elegida, se calcula el graco de


autocorrelacion de Moran, que relaciona la variable NBI con su rezago espacial.
Se identica un patron tpico de dependencia espacial positiva, municipios
pobres estan rodeados de otros municipios pobres y municipios ricos tienen
vecinos ricos.
Las pruebas globales de autocorrelacion ratican la existencia de
dependencia espacial positiva, con el valor positivo y signicativo para la I
de Moran y negativo y signicativo para la C de Geary.
6
B corresponde a una matriz binaria y W a una estandarizada
3.6. APLICACION 57
k(6)vecinos mas cercanos

1500000
1000000
YCOO

500000
0

0 500000 1000000 1500000 2000000

XCCO

Figura 3.6. Criterio de contiguidad elegido

Moran Plot NBI


1e+05
8e+04
6e+04
WNBI

4e+04
2e+04

2e+04 4e+04 6e+04 8e+04 1e+05

NBI

Figura 3.7. Diagrama de dispersion de Moran

Tabla 2. Pruebas Univariadas de Autocorrelacion Espacial


Prueba I de Moran C de Geary
Estadstico 36.8041 -35.1178
p-valor 2.2e-16 2.2e-16
Estimado 0.6068 0.3769
Valor esperado -0.0009 -0.0009
Varianza 0.0003 0.0003
Kurtosis 3.1856 3.1856
58 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

El comportamiento de dependencia espacial en el NBI se replica en


conjuntos de municipios, para los cuales se presentan niveles de pobreza
similares. El contraste de autocorrelacion local de Moran detecta clusters de
pobreza, principalmente en regiones como el Choco y el sur del Pacco, la
Amazorinoqua y gran parte de la Region Caribe. Las aglomeraciones con
bajo nivel de pobreza se ubican en el corredor conformado por el Valle del
Cauca, Eje Cafetero y Valle de Aburra y la Sabana de Bogota. Los municipios
no signicativos no conforman aglomeraciones espaciales o comportamientos
atpicos a traves del contraste local 7 .

Mapa Cluster

Sin Informacin

Alto-Alto

Bajo-Bajo

Bajo-Alto

Alto-Bajo

Figura 3.8. Distribucion espacial del I de Moran

3.6.3. Modelos de Regresion Espacial

Mediante el analisis exploratorio se determino la existencia de


autocorrelacion espacial del NBI a nivel municipal, sin embargo este no permite
decidir sobre la estructura esta dependencia espacial; si se incorpora como
rezago, en el termino del error o en rezagos espaciales de otras variables
explicativas.
8
A partir de la estimacion mnimo cuadratica de la pobreza explicada por
7
Los datos atpicos son los municipios con NBI con vecinos con niveles bajos de pobreza
y los municipios con NBI bajo rodeado de municipios pobres
8
La variable explicada en logaritmos
3.6. APLICACION 59
las variables Desempeno Fiscal, Tasa de Desercion Promedio, Uso Agrcola
y Densidad Vial se determina la mejor estructura espacial. Se identica un
modelo SAR-LAG como el mas adecuado, dado que alcanza el mayor valor
en el diagnostico del Multiplicador de Lagrange. Segun Moreno y Vaya(2000),
la existencia de una estructura AR en el NBI implica que las perturbaciones
sera n de tipo contagioso, donde las demas variables explicativas no determinan
el avance o retroceso de la pobreza en los municipios y solo el hecho de tener
un foco de pobreza es suciente para que esta se propague. El valor de la I de
Moran para los residuos de un modelo MCO ratica el problema de variable
omitida, que se corrige a traves de la inclusion del rezago espacial en el modelo.

Tabla 3. Contrastes de dependencia espacial para los residuos MCO


Prueba LM LM RLM RLM Moran I
Valor 926.71 921.68 75.01 80.04 0,502***
Signicancia *0.05 **0.01 ***0.001

El mejor modelo9 es un SAR(1) en el rezago con variables exogenas, o


modelo del rezago espacial. Se identica que en promedio el 73 % de las
perturbaciones de la pobreza se transmiten a los vecinos e incluso hacia los
municipios no contiguos. Incrementos marginales del Desempeno Fiscal, Uso
Agrcola y Densidad Vial reducen la pobreza, as como un aumento de la Tasa
de Desercion Escolar estimula el crecimiento en la pobreza. Los valores de las
pruebas de Wald y Log-Verosmil, rechazan la hipotesis de no signicancia
conjunta de las variables incluidas en el modelo.

9
En la tabla7 del anexo se presentan la estimacion de un modelo SAR-ERR, un modelo
SAR-LAG con componente mixto espacial y la regresion por MCO
60 CAPITULO 3. MODELOS DE REGRESION ESPACIALES

Tabla 4. Modelo SAR(1). NBI en logaritmos


Variables Coecientes
Constante 3.280***
IDF -9.07e-06***
TD 1.669e-05***
UA -1.537e-04***
DV -3.945e-05*
0.732***
Test de Wald 1079***
Log Verosimilitud -274.80
AIC (AIC lm) 563.6 (1211.1)
Breusch-Pagan 15.627***
Signicancia *0.05**0.01***0.001

La estadstica de Breusch-Pagan, al 1 % rechaza la hipotesis nula de


homocedasticidad de los residuos del modelo espacial ajustado, lo cual permite
identicar un comportamiento de heterogeneidad espacial del NBI. Para
corregir esta inestabilidad estructural se proponen diversos metodos, como los
ltros espaciales, regresiones ponderadas geogracamente, entre otros.
CAPITULO 4

Algunos topicos basicos sobre procesos puntuales

En los captulos anteriores tanto en el caso geoestadstico como el caso de


datos de area, se ha considerado el conjunto jo.
Un proceso espacial puntual es un mecanismo estocastico que genera un
conjunto contable de eventos en el espacio.
Un patron espacial puntual se caracteriza porque el dominio en el cual
esta denido es un conjunto de ubicaciones aleatorias en las cuales ciertos
eventos de interes ocurre; por lo tanto, un el conjunto de datos para el
analisis puede estar formado unicamente por las coordenadas geogracas donde
ocurren los eventos. En este tipo de problema el interes radica en analizar si
la distribucion de los eventos es aleatoria o posee algun patron; si los eventos
tienden a agruparse en el espacio, se podra proponer un modelo que describa
esta tendencia. Se pueden registrar todos los eventos o simplemente tener una
muestra de ellos; en el primer caso se hablara de patron proyectado en el
segundo de patron muestreado.

61
62 CAPITULO 4. ALGUNOS TOPICOS BASICOS SOBRE PROCESOS PUNTUALES

4.1. Clases de patrones

Los eventos pueden o no comportarse siguiendo un patron; se consideran


los tres siguientes casos:

Proceso espacial completamente aleatorio, CSR

La aleatoriedad espacial completa implica que los eventos estan


uniformemente distribuidos y ademas que los eventos son independientes entre
si. La uniformidad se interpretar como el hecho de que el numero de eventos
por unidad de area sea constante a traves de toda la region. No se muestra
tendencia a ocupar regiones particulares en el espacio. Una forma de medir
esta uniformidad es a traves de la funcion de intensidad de primer orden.

Figura 4.1. Proceso espacial completamente aleatorio

Funcion de intensidad de primer orden

Si el proceso es univariado () es la funcion de intensidad de primer orden.


Note que ahora el parametro depende de la ubicacion espacial. Esta funcion
se dene como

( ())
() = lm (4.1)
0

se considera una region innitesimal que contiene a . Esta funcion de


intensidad describe como cambia en numero de eventos por area a traves del
4.2. PRUEBAS DE CSR 63
espacio; es una funcion acotada y no negativa. Ademas se dira que el proceso
es homogeneo si se tiene que () = ; es decir, si el numero de eventos por
unidad de area no depende de la ubicacion espacial.
Si los puntos no son CSR, pueden ser dependientes y/o no uniformes. Se
tienen los siguientes casos

Un patron puntual se llama agregado si eventos separados por distancias


cortas ocurren mas frecuentemente de lo que se espera bajo CSR.

Un patron puntual se llama regular si eventos separados por distancias


cortas ocurren mas frecuentemente que en un proceso homogeneo.

Figura 4.2. Patrones agregado y regular respectivamente

4.2. Pruebas de CSR

La hipotesis de proceso espacial completamente aleatorio requiere que el


numero de eventos en una region con area sea una variable aleatoria de
Poisson con media y que los eventos en sean una muestra aleatoria
independiente de la distribucion uniforme de . Esto es

La intensidad del proceso no vara sobre la region , es decir, el proceso


es homogeneo
64 CAPITULO 4. ALGUNOS TOPICOS BASICOS SOBRE PROCESOS PUNTUALES

density.ppp(ej, 5)

3.5
3.45
3.4
3.35
Figura 4.3. Graco de densidad del proceso

Clasificacion por genero

Figura 4.4. Con un factor

()
( ( = )) =
!
No existe interaccion entre los eventos.

Por lo tanto, para determinar si un proceso puntual se puede suponer


CSR(completamente aleatorio espacialmente), se puede recurrir ya sea a
los metodos de conteo por cuadros para despues compararlos contra una
distribucion de Poisson mediante una prueba 2 de bondad de ajuste. Sin
embargo, este enfoque es afectado por la subjetividad de la eleccion del tamano
y cantidad de los cuadros. Una alternativa consiste en utilizar metodos basados
en distancias; por ejemplo, la distancia promedio entre un evento y su vecino
4.2. PRUEBAS DE CSR 65

Figura 4.5. Ejemplo de una generacion de zonas de inuencia

mas cercano en un patron agregado es mas pequena que esta misma en un


patron aleatorio. Como no se tiene una forma cerrada para la distribucion
muestral de algunas pruebas basadas en distancias, es necesario recurrir a
los metodos de simulacion de Montecarlo. A continuacion algunos de estos
metodos:

4.2.1. Conteo por cuadros

En este caso se realiza una division de la zona en cuadros, cada uno de


area , y se dene la variable () as:
(): numero de eventos en la region B
Bajo CSR, () () y asumiendo que los conteos 1 , 2 , ...,
son independientes en los cuadros y por tanto

()
( ( = )) =
!

El parametro es el numero medio de eventos media por unidad de area,


por lo tanto un estimador natural es


= =1

66 CAPITULO 4. ALGUNOS TOPICOS BASICOS SOBRE PROCESOS PUNTUALES

donde es el area total.

quadratcount(ej, nx = 4, ny = 3)

2 14 11 1

2 8 21 5

4 15 13 4

Figura 4.6. Conteo por cuadros

4.2.2. Metodos de distancia

Bajo CSR, se ha visto que para el metodo del vecino mas cercano se tiene
que la funcion de distribucion de la distancia es

() = 1 (2 ) (4.2)

para 0. De aqui sepude armar que, 2 (), y por lo tanto


22 22 , de donde 2 2 2 1
=1 2

Por otro lado, sean las distancias


al evento mas cercano para eventos
muestreados aleatoriamente 2
=1
2
. Se puede
llevar a cabo una prueba
2 de
2 2
CSR comparando el comportamiento de 2 =1 2 con 2 =1
22 , mediante la siguiente prueba .

2

= =1
2
(2,2) (4.3)
=1

Valores signicativamente grandes o signicativamente pequenos llevaran


al rechazo de la hipotesis CSR, ya que si es grande se tiene un patron
Si ( 2 ; ) 2 2 , (Demuestre usando las funciones generadoras de
1

momentos)
4.2. PRUEBAS DE CSR 67
agregado, debido a que existe una distancia grande entre grupos y si es
pequeno se tendra un patron regular; en caso de ser cercano a 1 se encuentra
bajo la hipotesis de CSR. Se suele utilizar para mayor facilidad de lectura el
llamado Indice de patronpara expresar la medida con un numero entre 0 y

1 con el calculo de +1

Sin embargo, esta no es la unica distribucion que se puede proponer


para las distancias en procesos puntuales. A continuacion se ilustrara otro
enfoque que permite trabajar con un procedimiento alternativo.

Sea la distancia de un punto (o evento) a su k-esimo vecino mas


cercano dentro de un sector circular de angulo 0 < 2; y sea el area
maxima que puede alcanzar dicho sector, la cual esta dada por:


= 2 = 2 (4.4)
2

Para el vecino mas cercano, la probabilidad de que el vecino mas cercano


este a una distancia mayor que 1 es la misma probabilidad de que en esa
region no haya ningun otro punto.

(1 > 1 ) = ( (1 ) = 0) = 1 (4.5)

ya que (1 ) (1 ). Para el segundo vecino mas cercano 2 con


2 > 1 , se tiene

(2 > 2 1 = 1 ) = ( (2 1 ) = 0) = (2 1 ) (4.6)

A partir de 4.5 y 4.6 se tiene que 1 1 y 1 (2 1 ) son las


distribuciones marginal y condicional respectivamente para 1 y 2 . Por lo
tanto, la densidad conjunta es

(1 , 2 ) = 2 (2 ) (4.7)

y en general la densidad conjunta incluyendo hasta el k-esimo vecino mas


cercano es
68 CAPITULO 4. ALGUNOS TOPICOS BASICOS SOBRE PROCESOS PUNTUALES

(1 , 2 , ..., ) = ( ) (4.8)

2
con 0 < 1 < 2 < ... < .

4.2.3. Funcion de intensidad de segundo orden

Para determinar si los eventos interactuan entre si, esto es, si existe algun
tipo de contagio ya sea positivo o negativo, se requiere analizar la funcion de
intensidad de segundo orden, 2 (1 , 2 ). En datos geoestadsticos se analizan la
funcion media y la funcion de covarianza o de semivarianza del proceso con el
n de obtener toda la informacion de los dos primeros momentos; en procesos
puntuales las intensidades de primer y segundo orden juegan ese mismo papel.

( (1 ) (2 ))
2 (1 , 2 ) = lm (4.9)
1 0,2 0 1 2

Si el proceso puntual es estacionario de segundo orden, entonces () =


y 2 (1 , 2 ) = 2 (1 2 ) ademas, si el proceso es isotropico, la intensidad
de segundo orden no depende de la direccion sino unicamente de la distancia
entre los puntos y 2 (1 , 2 ) = 2 (1 2 ) = ().

La funcion de intensidad de segundo orden depende de la esperanza del


producto cruzado del conteo en dos regiones, de forma similar a la covarianza
entre dos variables aleatorias; sin embargo su interpretacion no es sencilla,
por lo cual se usan como alternativas como la funcio .

Funcion de Ripley

La funcion mas usada para estudiar la interaccion entre eventos en un


proceso estacionario e isotropico es la funcion de Ripley, la cual para una
distancia se dene como

= (Cantidad de eventos adicionales dentro de una distancia h de


un evento seleccionado al azar)
2
Estime por maxima verosimilitud
4.2. PRUEBAS DE CSR 69

La funcion tiene varias ventajas sobre la funcion 2 (1 , 2 ):

Su denicion sugiere un metodo de estimacion () es el numero medio


de eventos con una distancia menor que

En un patron agregado, es probable que un evento dado este rodeado


por eventos del mismo grupo. El numero extra de eventos dentro de una
distancia pequena de un evento sera mayor y por lo tanto () tambien
lo es; mientras que en un patron regular, el numero de eventos extra
sera pequeno para pequena y por tanto () sera tambien pequena.

Para un proceso homogeneo de Poisson el numero esperado de eventos


por unidad de area es , el numero esperado de eventos extra dentro de
una distancia es 2 y () = 2 .

LA funcion () puede ser obtenida de la funcion de intensidad de


segundo orden:
2
() = 2 2 ()
0

La funcion () puede usarse tanto si se tiene un patron proyectado


como si se tiene un patron muestreado.

Esta funcion hace las veces del semivariograma en un proceso


geoestadstico. Por lo tanto, no es unica. Existen otras opciones para medir
esta interaccion.

Figura 4.7. Proceso no homogeneo y su respectiva funcion de intensidad


70 CAPITULO 4. ALGUNOS TOPICOS BASICOS SOBRE PROCESOS PUNTUALES

Figura 4.8. Deteccion de dependencia espacial

También podría gustarte