Está en la página 1de 37

DEPENDENCIA

ESPACIAL

C
Concepcin
i G
Gonzlez
l Garca
G
(2008)

DEPENDENCIA ESPACIAL
Anlisis Exploratorio de Datos Espaciales:
OBJETIVO:
> Revisar las herramientas para el anlisis de
dependencias de las variables de las que se han
obtenido datos,
datos
Como paso previo a la aplicacin de tcnicas de
interpolacin espacial.

Anlisis
l
de
d dependencias
d
d

Los procesos con variables dependientes


que evolucionan en el tiempo y/o espacio
requieren tcnicas propias de anlisis para
modelizarlas y obtener predicciones de
valores futuros, (modelos dinmicos)
dinmicos).

Teora estadstica para el estudio de


modelos dinmicos ((i))
Procesos estocsticos, aleatorios o
probabilsticos.
Estocstico (del griego stokhastes = adivino) ~ lo
que est
t ligado
li d all azar.

Estudio de dependencias
p
Estudio de la variacin del proceso entre dos puntos de T

Teora estadstica para el estudio de


modelos dinmicos ((ii))
Un p
proceso estocstico es un conjunto
j
(o
familia) de variables aleatorias(1) indexadas
por un conjunto T,
{ Xt X(t) / t T }, T de R n }
Si T es de R, ser variacin en una dimensin.
((caso de las series de tiempo)
p )
(1) una variable aleatoria (VA) es una variable que puede tomar
ciertos valores de acuerdo a cierta distribucin de probabilidades.

Trminos en el tratamiento de la variacin espacial


Procesos estacionarios:
Atendiendo a su comportamiento al movernos sobre el
conjunto de ndices:
Bajo traslaciones : La covarianza slo depende de h
(vector que une s y t)

Bajo rotaciones o istropo: la variacin entre

dos variables Xs y
entre s y t.

Xt slo depende
p
de la distancia

No estacionaridad: por variaciones de la dependencia


segn la direccin : anisotropa

Dependencia
p
espacial
p
> La dependencia
p
espacial
p
se considera,, desde el p
punto
de vista de la Geoestadstica, como la prctica de la
teora de las variables regionalizadas.
Variable regionalizada:
-Es una variable aleatoria caracterizada,, adems de por
p
el conjunto de valores que puede tomar, por su posicin
en el espacio.
-Desde el punto de vista matemtico, una variable
regionalizada, es, simplemente una funcin f(x) que toma
valores en todos los puntos x de coordenadas (xi, yi, zi)
en el espacio tridimensional.

Variable regionalizada (muestra)


El valor medido en cada punto xi
es considerado como una realizacin z(xi)
de una VA Z(xi) cuya media es m(xi).
El conjunto
j
de todas las mediciones z(x)
( ) en el rea de
estudio de la variable regionalizada se considera como
una realizacin particular del conjunto de variables
aleatorias:
l t i
(Z(x), x rea de estudio)

Conceptos de Variable regionalizada (i)


Regin: se refiere al espacio en el cual existe y se estudia
el fenmeno natural, geogrfico o sociolgico.
Localizacin: Es el punto de una regin en la cual se
define una variable aleatoria regionalizada.
regionalizada
Soporte Geomtrico: determinado por el elemento fsico
sobre el cual se realiza la determinacin de la variable
aleatoria regionalizada,
regionalizada esto es
es, la muestra unitaria
unitaria, sobre
la cual estudiaremos el atributo de inters.

Conceptos de Variable regionalizada (ii)


Momentos de primer orden:
Si la funcin de distribucin de Z(xi) tiene una media
d fi id ser
definida,
una ffuncin
i d
de lla llocalizacin
li
i xi
m(xi) = E{Z(xi)}
Momento de segundo orden:
Si la varianza (Var) de Z(xi) existe, entonces se define
como el momento de segundo orden y ser tambin una
funcin de la localizacin xi
Var {Z(xi)} = E{[Z(xi) - m(xi)] 2}

Conceptos de Variable regionalizada (iii)


Si la varianza de las variables Z(xi) y Z(xj) existe entonces
su covarianza (Cov) tambin existe y es funcin de las
localizaciones xi y xj
Cov[Z(xi),
) Z(xj)] = E{[Z(xi) - m(xi)][Z(xj) - m(xj)]}
si xi = xj ;

Cov[Z(xi), Z(xj)] = Var {Z(xi)}

Conceptos de Variable regionalizada (iv)


La funcin variograma o funcin estructural se define
como la varianza de la diferencia Z(xi) - Z(xj)
2 (xi,
( i xj)
j) = Var{Z(x
V {Z( i) - Z(x
Z( j)} = 2 (x
( i, xj)

El semivariograma (xi, xj) se define como:

1
2
( x i , x j) = E [Z(x i) - Z(x j) ]
2
O bien,

(xi, xj} = Var{Z(xi) - Z(xj)}

Conceptos de Variable regionalizada (v)


Cuando
C
d la
l funcin
f
i es estrictamente
ti t
t estacionaria
t i
i (la
(l
funcin de distribucin del vector aleatorio es invariante
respecto a cualquier traslacin h del vector),
vector)
el semivariograma tambin es estacionario y se cumple
que:

1
(x + h, x) = (h) = E [Z(x + h) - Z(x) ]2 = V[Z] - C(h)
2
h = distancia entre puntos (lag)

Conceptos de Variable regionalizada (vi)


Tambin se puede definir el correlograma
estandarizando, la covarianza para los valores
xi - xj = h = 0 como:
((h)) = C(h)/C(0)
( ) ( )

-1 1

donde:
C(h) es la covarianza a la distancia h,
C(0) es la covarianza en el origen.
Existen relaciones entre estas medidas de dependencia:
(h}} = C(0)
(
( ) - C(h)
( )
con (
(0)) = 0
(h) = 1 - (h)/C(0)

Conceptos de Variable regionalizada (vii)

Cuando la covarianza se expresa en


puntos))
funcin de h ((distancia entre dos p
se llama autocovarianza:

(h) = C(si , si+h ), i T


La distancia h de separacin se llama
retardo (lag).
(lag)

Hiptesis de la Geoestadstica (i)


La Geoestadstica se construye
y asumiendo condiciones
de estacionaridad, debido a que la forma en que se
presenta la informacin es muy diversa.
Estacionaridad Estricta: si la funcin de distribucin de
probabilidades de las variables aleatorias regionalizadas
Z(xi) es la misma, independiente de la localizacin xi
Estacionaridad de Segundo Orden:
ms frecuente en la prctica, supone que
1) E{Z(xi)} = m,
m existe y no depende de la localizacin xi.
2) La funcin covarianza, Cov{Z(xi) - Z(xj)}, exista y slo
dependa de la longitud del vector h = xi - xj o sea
sea.
C(h) = Cov{Z(xi), Z(xj)} = E{Z(xi), Z(xi+h)} - m2

Hiptesis de la Geoestadstica (ii)


Estacionaridad de Segundo Orden (cont.)
(cont )
Esta hiptesis requiere la estacionaridad slo para la
media y para la funcin de covarianza de la variable
aleatoria regionalizada.
La segunda condicin implica,
implica estacionaridad de la
varianza y del variograma.
S d
Se
demuestra
t que,

(h) = C(0) - C(h)

De aqu que (h) y C(h), son dos herramientas que


permiten expresar
p
p
la correlacin entre las variables
aleatorias regionalizadas Z(xi) y Z(xi+h), separadas por
el vector h.

Concepto de Estacionaridad: Ejemplos grficos en R (i)


Proceso no estacionario en sentido estricto
Cuatro realizaciones de un proceso estocstico
Temperatura

1 2

t+k

480

Tiempo
(d )
(das)

Concepto de Estacionaridad: Ejemplos grficos en R (ii)


Serie no estacionaria:

Serie de demanda semanal de plstico


8400

plastic

7400
6400
5400
4400
0

20

40

60

80

100

Concepto de Estacionaridad: Ejemplos grficos en R (iii)


Serie no estacionaria:
Ventas en IBM
610

ibm

570
530
490
450
1/85

1/87

1/89

1/91

1/93

1/95

Serie no estable: Con tendencia (positiva)

Concepto de Estacionaridad: Ejemplos grficos en R (iv)

Series estacionarias:
Los valores de la serie oscilan alrededor de un valor
constante

adjjusted evvapmilk

Serie estable = estacionaria


80
50
20
-10
-40
-70
1/02

1/05

1/08

1/11

1/14

1/17

Hiptesis de la Geoestadstica (iii)


Procesos Cuasiestacionarios:
En la prctica la funcin estructural
estructural, covarianza o
semivariograma, es slo usada por lmites |h| b
El lmite b representa la extensin de la regin en la
que el fenmeno estudiado conserva cierta
homogeneidad del comportamiento de Z(xi).
)
En otros casos,
casos b pudiera ser la magnitud de una zona
homognea y dos variables Z(x) y Z(x+h) no pueden ser
consideradas en la misma homogeneizacin de su
variabilidad si |h| > b.

Hiptesis de la Geoestadstica (iv)


Estas condiciones de estacionaridad se asumen en el
desarrollo terico,
en la prctica deben ser verificadas en los datos antes
d comenzar un estudio
de
t di geoestadstico
t d ti
para lo
l que se puede
d realizar
li
un anlisis
li i estadstico
t d ti d
de
la informacin, de modo que se pueda tener cierto
grado de confiabilidad en la aplicacin de estos
mtodos.

El anlisis estructural
Est compuesto por:
El clculo del semivariograma experimental.
experimental
El ajuste a este de un modelo ter
terico
co conocido.
conoc do.
El clculo
l l del
d l semivariograma
i i
experimental
i
t l es la
l
herramienta geoestadstica ms importante en la
determinacin de las caractersticas de variabilidad y
correlacin espacial del fenmeno estudiado.

El semivariograma experimental (i)


El variograma se define como la media aritmtica de
todos los cuadrados de las diferencias entre pares de
valores experimentales
p
separados
p
una distancia h
o lo q
que es lo mismo,,
Var{Z(x+h)-Z(x)} = 2(h)
La varianza de los incrementos de la variable
regionalizada en las localizaciones separadas una
distancia h.

El semivariograma experimental (ii)


La funcin
L
f
i *(h) se denomina
d
i semivariograma
i
i
emprico,
i
puede obtenerse por la expresin.
N(h)

1
2
[Z(xi ) Z(xi + h)]
(h) =

2N(h) i=1
*

donde:
d
d
N(h)
h
Z(xi)
xi

es el nmero de pares a la distancia h.


es el incremento (lag).
(lag)
son los valores observados
localizaciones donde son medidos los
valores z(xi)

El semivariograma experimental: Ejemplo


Para ilustrar el proceso de clculo se considera un ejemplo
sencillo (de Samper y Carrera,
Carrera 1990): Sea Z la variable definida
sobre un dominio unidimensional que toma los valores :

x
h=1;

[Z(x+1)-Z(x)]2=39

x
1
2
3
4
5
6
7
8
9
10
11
12

Z(x)
7
10
11
13
12
14
12
13
10
11
9
8

Z(x+1) [Z(x+1)
[Z(x+1)-Z(x)]
Z(x)]2
10
9
11
1
13
4
12
1
14
4
12
4
13
1
10
9
11
1
9
4
8
1
N(1)=11

39

El semivariograma experimental: Ejemplo


El valor estimado del semivariograma, para h=1, resulta ser:
1/2(39/11) = 1,78.
El proceso se repite para las parejas distantes dos unidades, etc.
El clculo
l l se resume en la
l siguiente
i i t tabla:
t bl
N(h )

N(h) [ Z(x

+ h) Z(x i ) ]

*(h)
(h)

9
8

11

39

1,78

10

46

2,30

88

4,89

89

5,56

108

7,71

73

6,08

*(h)

6
5
4
3
2
1
0
1

El semivariograma experimental (iii)


El grfico de (h) tiene las siguientes caractersticas
Pasa por el origen (para h=0, (h)=0)
Es en general una funcin creciente de h.
h
(h)

meseta

alcance
l
Forma clsica del semivariograma

En la mayor parte de los casos (h) crece hasta cierto lmite llamado
meseta, en otros casos puede crecer indefinidamente.

El semivariograma experimental (iv)


El comportamiento en el origen puede tener diferentes formas, las cuales
son segn
g distintos autores:
Parablico: Caracteriza a una variable muy regular, siendo continua y
diferenciable (a).
Lineal: Caracteriza a una variable continua,
continua pero no diferenciable,
diferenciable es decir
menos regular (b).
Discontinuidad en el origen: Efecto de pepita (c), es el caso en que (h)
no tiende a cero cuando h tiene a cero.
cero Representa a una variable muy
irregular.
Discontinuo puro: o ruido blanco(d), representa el caso de mayor
discontinuidad es el caso lmite de ausencia de estructura,
discontinuidad,
estructura donde los valores
de dos puntos cualesquiera no tienen correlacin alguna.

(h)

(h)

(h)

(h)

El semivariograma experimental (v)


En la prctica, y especialmente cuando se trabaja en dos o tres
dimensiones, las distancias entre los puntos de cada pareja son
distintos y puede no haber dos parejas de puntos situados a la
misma
i
di t i Por
distancia.
P
l tanto,
lo
t t no es posible
ibl aplicar
li
con
fiabilidad la frmula anterior.
Lo que se hace es definir una serie de valores hj y asignar para
el clculo de *(hj) todas las parejas cuya distancia est
contenida en el intervalo (hj-hj,
(hj-hj hj+hj).
hj) Lo ms comn es
repetir el clculo con varias amplitudes y elegir aqulla que
permita una buena definicin del semivariograma, de forma que
l hj no estn
los
t tan
t separados
d que no se pueda
d discernir,
di
i nii tan
t
juntos que el nmero de parejas sea pequeo y las oscilaciones
g
experimental
p
resulten excesivas.
del semivariograma

Construccin del semivariograma experimental en 2D


(i)
Para datos distribuidos en dos dimensiones.
Z(x) una funcin aleatoria con N variables aleatorias regionalizadas Z(xi)
donde x = {x, y} es la localizacin y Z(xi) es el valor medido correspondiente.

Aunque el programa lo va a calcular automticamente, los primeros pasos del


proceso son:
p
1.- Clculo de la cantidad de pares de datos posibles por: Np = N(N-1)/2
2.- Para cada par, clculo de la distancia entre las localizaciones
correspondientes
2
2
i = 1, . . . , Np
d = X X + Y Y
i

almacenando para cada i:


- P1: Nmero
N
d l primer punto del
del
d l par,
- P2: Nmero del segundo punto del par,
- d: Valor de la distancia entre los dos puntos del par.
- Angulo
A
l
que fija
fij la
l direccin
di
i de
d la
l recta
t que pasa por los
l dos
d
puntos del par.

Construccin del semivariograma experimental en 2D


(ii)
Se evala la expresin del semivariograma para todos los pares de
l
localizaciones
li
i
separadas
d a lla di
distancia
i h y que cumplan
l las
l condiciones
di i
siguientes :
11.- La distancia entre las localizaciones xi y xi+h sea mayor que h
h-dh
dh y menor
que h+dh, o lo que es lo mismo, el segundo punto del par est incluido en el
espacio definido por h-dh y h+dh encontrndose el primer punto del par en el
origen 0 este origen se mueve entre las muestras a analizar.
analizar

dh

Espacio definido por la


tolerancia lineal

h
0

dh

00

Construccin del semivariograma experimental en 2D


(iii)
2.- El ngulo formado entre la lnea que une los dos puntos del par y la
di
direccin
i 0 debe
d b estar incluido
i l id entre -d
d y +d
d (figura
(fi
A ).
)
3.- La distancia entre el segundo punto del par y la lnea que define la
direccin de clculo del semivariograma no debe superar el ancho de banda
(Deutsch y Journel, 1998) (figura B).
Ancho de banda

dh

d
d
h
0

dh

A) Espacio definido por la


tolerancia lineal y angular

00

Construccin del semivariograma experimental en 2D


(iv)
Finalmente se representan
p
grficamente
g
los valores de (
(h)) en
funcin de h, en un grfico X-Y donde en la abscisa se
representan los valores de h y en la ordenada los de (h).
Obt ni nd as
Obteniendo
s ell ssemivariograma
mi i
m experimental
xp im nt l o emprico
mp i
para una direccin, incremento y tolerancias definidas.

(h)
C
Ct
C0
a
h
Parmetros del semivariograma

Problemas ms comunes encontrados en el clculo


de semivariograma
g
El valor idneo del incremento h
Distribuciones con valores extremos
La
La existencia de poblaciones mixtas
Por ello
ello, es necesario el anlisis exploratorio descriptivo
inicial de la informacin.

Fuentes
http://descargas.cervantesvirtual.com/servlet/SirveObr
as/46860175104026839600080/006458 8 pdf
as/46860175104026839600080/006458_8.pdf
Cap.7: Sistemas de Informacin Geogrfica:
Pasado,, presente
p
y futuro (tesis
(
doctoral))
www.geogra.uah.es/~joaquin/curso-quito/SIG-OdelT.pdf
www.monografas
www
monografas .com.
com Elementos de Geoestadstica.
Geoestadstica
CUADOR GIL, J.Q. Universidad de Pinar del Ro (Cuba).

También podría gustarte