Está en la página 1de 9

1.

Geoestadística (Sacado de: Geoestadística y los sistemas de información geográfica)

“La geoestadística consiste en diversos procedimientos de estimación y simulación los cuales


sirven para estudiar variables distribuidas espacialmente.”

2. Introducción a los métodos Geoestadísticos


2.1 Análisis de Variabilidad
El objetivo de la geoestadística es obtener valores desconocidos a partir de los conocidos,
mediante estadística. “Una variable regionalizada es una función numérica con
distribución espacial, que varia de un punto a otros, con continuidad clara, pero cuyas
variaciones no pueden ser representadas por una función matemática simple” (pág. 246)
Los modelos geoestadísticos están planteados de manera que reconozcan la variación a
escala macro (tendencia) y a una escala menor, conocida como correlación espacial.
Ya que la geoestadística, estudia procesos con información muy diversa, generalmente
deben tomarse las siguientes suposiciones:
2.1.1 Estacionariedad estricta
Supone que la media de variable aleatoria es constante en toda región, independiente
de los puntos tomados.
2.1.2 Estacionariedad de segundo orden
Hipótesis común en la práctica. Supone que la esperanza (la esperanza matemática o
valor esperado de una variable aleatoria discreta es la suma del producto de la
probabilidad de cada suceso por el valor de dicho suceso.
https://aprendoestadistic.blogspot.com/2013/05/esperanza-matematica.html) de la
variable aleatoria existe y no depende de la localización del punto, y que la función de
covarianza (Medida estadística que muestra la relación entre dos variables. Una
covarianza de cero indica que no hay relación, mientras valores altos de covarianza
indican que el valor de una está muy ligado al valor de la otra.
http://www.kramirez.net/ProbaEstad/Material/Presentaciones/IntroducionEstadistica
_AnalisisDatos.pdf)
2.1.3 Hipótesis intrínseca
Asumen que los incrementos son débilmente estacionarios. Supone que la esperanza
existe y supone que la varianza (la varianza es una medida de la variación de un valor
respecto al promedio) de los incrementos es finita.
2.1.4 Procesos cuasi estacionarios
Esta hipótesis no es más que estacionariedad local para distancias menores que
determinado limite. El límite representa la extensión de la región donde el fenómeno
conserva cierta homogeneidad. Esta hipótesis se asume durante el análisis teórico y
debe ser verificada durante la práctica, mediante un análisis exploratorio de datos.

2.2 Análisis estructural


“En la mayoría de los datos de las geociencias existe continuidad espacial, es decir, datos
de puntos cercanos tienen más probabilidad de ser similares que datos de puntos lejanos.
(pág. 246)”

2.2.1 Semivariograma Experimental


El cálculo del Semivariograma es una de las herramientas más útiles de la
geoestadística, pues permite determinar como cambia una variable de una dirección a
otra. El Semivariograma es una medida de desemejanza, es decir, un y(h) grande
significa que se tiene una relación pequeña, su confiabilidad depende del numero de
datos involucrados.
2.3 Estimación: Krigeaje (kriging) (pág. 247. Geoestadística y los sistemas…)
La diferencia entre el kriging y otros métodos de interpolación radica en la manera como
se atribuyen los pesos a las diferentes muestras. En la interpolación simple los pesos son
todos iguales a 1/N, en donde N es el número de muestras. En el kriging, el procedimiento
es similar al de estimación por medias móviles ponderadas, solo que aquí los pesos son
determinados a partir de análisis espacial, basado en el Semivariograma experimental.
Además, el kriging proporciona, en promedio, estimaciones con la mínima variación.

3. (Sacado de: INTRODUCCION A LA GEOESTADISTICA. Teoría y Aplicación. UNIVERSIDAD


NACIONAL DE COLOMBIA. Pág. 17)

“La geoestadística es una rama de la estadística que estudia fenómenos espaciales. Su interés
principal es la estimación, predicción y simulación de dichos fenómenos”. (pág. 17)

Cuando la intención de la geoestadística es hacer predicción, se basa en dos etapas. La primera el


análisis estructural, en la que se define la correlación entre puntos en el espacio. En la segunda
fase se hace predicción en sitios de la región no muestreados por medio de la técnica kriging.

3.1 Variable regionalizada


Es una variable medida en el espacio de manera tal que presente una estructura de
correlación. Se puede definir matemáticamente como:
Z( x): x ∈ D ⊂ Rd
“Un proceso estocástico con dominio contenido en un espacio euclidiano d-dimensional
Rd . Si d=2, Z ( x )puede asociarse a una variable medida en un punto x del plano.” Pág. 17
En términos prácticos Z(x) se puede ver como la medición de una variable aleatoria (p.ej.
concentración de un contaminante) en un punto x de una región de estudio.
3.2 Estacionariedad
La variable regionalizada es estacionaria si su función de distribución conjunta es
invariante respecto a cualquier translación del vector h, es decir, la función de distribución
T
del vector aleatorio Ź ( x )=[ Z ( x 1 ) , Z ( x 2) , … ; Z ( x n ) ] es idéntica a la del vector
T
Ź ( x )=[ Z ( x 1 +h ) , Z ( x 2 +h ) , … ; Z ( x n +h ) ] para cualquier h.
La teoría de la geoestadística se basa en los momentos de la variable regionalizada y en la
hipótesis de la estacionariedad y puede definirse en los siguientes términos:
3.2.1 Estacionariedad de Segundo Orden
Se dice que Z(x) es estacionario de segundo orden si cumple:
a. E [ Z ( x ) ] =m , k ∈ R , ∀ x ∈ D⊂ R d
El valor esperado de la variable aleatoria es finito y contante para todo punto en le
dominio.
b. COV [ Z ( x ) , Z ( x+ h ) ] =C ( h ) <∞
Para toda pareja de Z(x), Z(x+h), la covarianza existe y es función única del vector
de separación h.
De lo anterior se puede obtener la siguiente relación entre la función de
semivarianza y la de autocovarianza:
γ ( Z ( x+ h ) , Z ( x ) )=σ 2−C ( h )

3.2.2 Estacionariedad Débil o Intrínseca (pág. 19)


Algunos de los fenómenos físicos reales no tienen varianza finita. Entonces se debe
trabajar con la hipótesis de que los incrementos [Z(x+h) – Z(x)] son estacionarios, esto
es:
a. Z(x) tiene una esperanza finita y contante para todo punto en el dominio. Lo que
implica que la esperanza de los incrementos es cero.
E [ Z ( x+ h )−Z (x) ] =0
b. Para cualquier vector h, la varianza del incremento esta definida y es función única
de la distancia.
2
V [ Z ( x+ h )−Z (x)] =E [ Z ( x +h )−Z ( x ) ] =2 γ ( h )
(pág. 20 https://geoinnova.org/blog-territorio/wp-
content/uploads/2015/05/LIBRO_-DE-_GEOESTADISTICA-R-Giraldo.pdf)

3.3 Funciones de correlación espacial (pág. 21)


El primer paso en un análisis de geoestadística es el análisis estructural que se lleva a cabo
mediante tres funciones: el Semivariograma, el covariograma y el correlograma.
3.3.1 Variograma y Semivariograma
La función Variograma se denota por 2 γ (h),
2 γ ( h )=V ( Z ( x+ h )−Z ( x ) )
2 2
¿ E (( Z ( x ++h )−Z ( x ) ) )−(⏟
E ( Z ( x+ h )−Z ( x ) ) )

2
¿ E (( Z ( x ++h )−Z ( x ) ) )

A la mitad de Variograma γ (h), se conoce como semivarianza. La función de


semivarianza es estimada por el método de los momentos, mediante:

γ́ ( h )=
∑ ( Z ( x +h ) −Z ( x ) )2
2n
Donde Z(x) es el valor de la variable en un punto x, Z( x+h) es otro valor a una
distancia h del anterior y n es el numero de parejas que se encuentra separada por
dicha distancia. La función de semivarianza se calcula para varias distancias de h. En la
practica debido a la irregularidad del muestreo, se toman intervalos de distancia
{[o,h], (h,2h]…} y el Semivariograma corresponde a una distancia promedio de parejas
y no a una distancia h determinada.
Es claro, que a menor distancia entre los sitios mayor la correlación espacial entre los
datos.

3.3.2 Covariograma y Correlograma


La covarianza muestral se halla con la siguiente formula:
n

∑ ( Z ( x +h )−m ) ( Z ( x )−m )
C ( h )=COV ( Z ( x+ h ) , Z ( x ) ) = i=1
n
n

∑ ( Z ( x+ h )−m ) ( Z ( x ) )
i=1
¿ −m2=C (h)
n
donde m representa el valor promedio en todo punto de la región de estudio.

Bajo las hipótesis de fenómeno estacionario, el correlograma muestral está dado por:
COV ( Z ( x +h ) , Z ( x ) ) C ( h ) C ( h )
r ( h )= = 2 =
S x+h∗S x Sx C (0 )

En la práctica se emplea, generalmente, la función de semivarianza, ya que es la única


de las tres mencionadas que no requiere hacer estimación de parámetros.
“…para obtener un semivariograma experimental en el que sólo se tenga en cuenta la
distancia y no la orientación (semivariograma omnidireccional), se requeriría calcular
la distancia euclidiana para un número considerablemente alto de parejas de puntos.”
(pág.22). Por eso se realiza generalmente tomando un solo sentido. P.ej. (izquierda-
derecha)
3.4 Modelos Teóricos de Semivarianza
Se hace necesario el uso de modelos que generalicen el semivariograma a cualquier
distancia. Todos esos modelos hallados en la literatura tienen tres parámetros comunes:
a. Efecto Pepita
Denotado como C_o y representa una discontinuidad puntual del semivariograma en
el origen. Puede ser debido a errores de medición de la variable, escala o ser indicativo
de que la parte de la estructura espacial se concentra a distancias inferiores a las
observadas.
b. Meseta
Denotada por C 1 o por ( C o +C1 ) cuando la pepita es diferente de cero. Es la cota
superior del semivariograma y puede ser o no finita. Los que tienen meseta finita
cumplen con la hipótesis de estacionariedad fuerte, de lo contrario, el semivariograma
define un fenómeno que solo cumple con la hipótesis intrínseca.
c. Rango
Denotado por la letra a. Es la distancia a partir de la cual dos valores medidos son
independientes. En algunos fenómenos, el semivariograma no alcanza una distancia
finita a partir de la cual los datos sean independientes, entonces se asume el rango
efectivo como la distancia a la cual el semivariograma alcanza el 95% de la meseta.
Figura 1 Parámetros básicos de semivariograma.

Fuente. Figura 9. Comportamiento típico de un semivariograma acotado con una


representación de los parámetros básicos. SEMEXP corresponde al semivariograma
experimental y MODELO al ajuste de un modelo teórico. https://geoinnova.org/blog-
territorio/wp-content/uploads/2015/05/LIBRO_-DE-_GEOESTADISTICA-R-Giraldo.pdf

3.4.1 Modelo esférico


Tiene un crecimiento rápido cerca del origen, pero los crecimientos marginales van
decreciendo para distancias iguales, hasta que para distancias superiores al rango los
incrementos son nulos. Su expresión matemática es (https://geoinnova.org/blog-
territorio/wp-content/uploads/2015/05/LIBRO_-DE-_GEOESTADISTICA-R-Giraldo.pdf
pág. 25):
3 h 1 h 3

3.4.2
{
Modelo exponencial
+C ( ( ) ( ))
γ ( h )=f ( x ) = 0 1 2 a − 2 3 ,∧h ≤ a
C

C 0 +C1 ,∧h>a

Se aplica cuando la dependencia espacial tiene un comportamiento exponencial con


relación a la distancia entre mediciones. El valor del rango es igual a la distancia en el
que el semivariograma toma el valor del 95% de la meseta. Este modelo es
ampliamente usado. Su expresión matemática es la siguiente:
−3 h
(
γ ( h )=C 0 +C1 1−e a )
3.4.3 Modelo Gaussiano
Al igual que en el modelo exponencial se debe tomar el rango efectivo, ya que la
dependencia se mantiene con la distancia tendiendo a infinito. En el origen tiene
forma parabólica. Su expresión matemática es la siguiente:
2
−h
(
γ ( h )=C 0 +C1 1−e a
2
)
Los modelos anteriores se representan en la siguiente figura:
Figura 2 Comparación de los modelos exponencial, esférico y Gaussiano.

Fuente. Figura 10. Comparación de los modelos exponencial, esférico y Gaussiano. La línea
punteada vertical representa el rango en el caso del modelo esférico y el rango efectivo en el
de los modelos exponencial y gaussiano. Este tiene un valor de 210, respecto a una escala
simulada entre 0 y 300. El valor de la meseta es 30 y el de la pepita 0. El 95% de la meseta es
igual a 28.5. (Introducción a la Geoestadística. Teoría y Aplicación. Universidad Nacional de
Colombia. Sede Bogotá. Facultad de Ciencias. Departamento de Estadística. pág. 26

Un alto valor en el rango permite obtener curvas de predicción más suavizadas


reduciendo las magnitudes en varianzas de predicción (Díaz-francés, 1993)

3.5 Predicción espacial optima


“…el predictor optimo es el que minimice la esperanza condicional.” ( Introducción a la
Geoestadística. Teoría y Aplicación. Universidad Nacional de Colombia. Sede Bogotá. Facultad de
Ciencias. Departamento de Estadística, pág. 32)
Si Z o es una cantidad aleatoria y Z o es su predictor, entonces L(Z o ; Z o) representa la
¿ ¿

pérdida que se incurre cuando se predice Z o con Z o y el mejor predictor será el que
¿

¿
minimice E { L ( Z o ; Z o ) }

3.6 Kriging

Encierra un conjunto de métodos de predicción espacial que se fundamentan en la


minimización del error cuadrático medio de predicción.

3.7 Kriging Ordinario


Cuando se tienen mediciones en diferentes puntos de una zona de estudio y se desea
conocer un valor en un punto en el que no hubo medición, el kriging ordinario propone
que el valor se puede predecir como una combinación lineal de las n variables aleatorias:
n
Z¿0=∑ λi Z ( x i )
i=1
Donde λ i representan los pesos de los valores medidos. Dichos pesos se calculan en
función de las distancias entre los puntos muestreados y el punto en que se hará la
predicción. La suma de los pesos debe ser igual a la esperanza de la variable, esto se
conoce como requisito de insesgamiento, matemáticamente:
E ( Z ¿ ( x o ) ) =E ( Z ( x 0 ) )

Asumiendo fenómeno estacionario, se demuestra que la suma de las ponderaciones debe


ser igual a 1,

∑ λi=1
i=1

¿
Se dice que Z ( xo ) es el mejor predictor, porque los pesos se obtienen de manera tal que
minimizan la varianza del error de predicción, es decir se minimiza la siguiente expresión:

V ( Z¿ ( x o )−Z ( x o ) )

Usando la siguiente notación:


COV [ Z ( x i ) ; Z ( x j ) ] =Cij y V [ Z ( x o ) ] =σ 2

Entonces,

n
COV [ Z¿ ( x0 ) ; Z ( x 0 ) ] =∑ λi Ci 0
i=1
Además,

n n n
V ( Z¿ ( x o )−Z ( x o ) ) =∑ ∑ λi λ j Cij −2 ∑ λ i C i 0+ σ 2
i=1 j=1 j=1

n
Luego se debe minimizar la función anterior sujeta a ∑ λi=1. Este problema se soluciona
i=1
mediante el método de multiplicadores de Lagrange. De este proceso, resulta un sistema
de (n+1) ecuaciones con (n+1) incógnitas que puede representarse matricialmente como
se muestra a continuación:
Figura 3 Forma matricial del sistema de ecuaciones.

Fuente. Introducción a la Geoestadística. Teoría y Aplicación. Universidad Nacional de Colombia.


Sede Bogotá. Facultad de Ciencias. Departamento de Estadística.

los pesos que minimizan el error se determinan mediante la función de covariograma así:

ij ⋅C i 0
λ=C−1
Determinados los pesos se calcula la predicción en el punto x 0. Se procede de manera
análoga para los demás puntos que se quieran predecir.

3.8 Validación del kriging

Existen varios métodos para verificar lo cercano a la realidad de la predicción de las


variables a partir del kriging, “El más empleado es el de validación cruzada, que consiste
en excluir la observación de uno de los n puntos muestrales y con los n-1 valores restantes
y el modelo de semivariograma escogido, predecir vía kriging el valor de la variable en
estudio en la ubicación del punto que se excluyó” (Introducción a la Geoestadística. Teoría
y Aplicación. Universidad Nacional de Colombia. Sede Bogotá. Facultad de Ciencias.
Departamento de Estadística. pág. 38). Si la diferencia entre el valor de predicción
obtenido y el valor observado excluido es mínimo, se comprueba que el modelo de
semivarianza escogido describe de manera acertada la estructura de correlación espacial.
Este procedimiento se repite para cada uno de los datos de observación, de modo que se
obtiene una cantidad n de errores de predicción.
Se hace el mismo análisis anterior con varios modelos de semivarianza con el fin de
obtener el que optimice algún criterio, por ejemplo, el mínimo error cuadrático medio
(MECM). Este proceso se puede visualizar a traves de un gráfico de dispersión de valores
observados contra valores predichos, hasta obtener una dispersión que más se acerque a
una línea recta que pase por el origen.

3.9 Representación de las predicciones

Una vez hallados los valores desconocidos, debe generarse un mapa que muestre la
distribución de la variable en la región de estudio. Es conveniente que el mapa se
acompañe de isolíneas de errores y de las varianzas de predicción, para hacer posible la
identificación de zonas de mayor incertidumbre en las predicciones.

También podría gustarte