Está en la página 1de 20

INTRODUCCIN A LA GEOESTADSTICA

Nociones de geoestadstica

Juan Carlos Usandivaras


Diciembre 2006

1. Introduccin .................................................................................................................... 3
2. Anlisis estructural ......................................................................................................... 5
2.1.

Funciones aleatoria estacionarias...................................................................................... 6

2.1.1.
2.1.2.
2.1.3.
2.1.4.

2.2.

Estacionariedad estricta .............................................................................................................. 6


Estacionariedad de segundo orden.............................................................................................. 6
Funcin aleatoria intrnseca........................................................................................................ 6
Representacin espectral ............................................................................................................ 7

Variograma de una funcin estacionaria intrnseca........................................................ 7

2.2.1.
2.2.2.
2.2.3.
2.2.4.
2.2.5.
2.2.6.

Variogramas limitados y estacionariedad ................................................................................... 7


Variograma y varianza de la muestra ......................................................................................... 8
Interpretando el variograma........................................................................................................ 9
El variogrma terico ............................................................................................................... 11
Ajuste del variograma muestral ................................................................................................ 14
Una generalizacin del variograma .......................................................................................... 14

3. Kriging........................................................................................................................... 16
3.1.

Notacin y supuestos......................................................................................................... 16

3.2.

Kriging simple................................................................................................................... 17

3.3.

Kriging ordinario.............................................................................................................. 19

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

1. Introduccin
Para la escritura de este apunte se ha recurrido largamente al libro Geostatistics, Modeling
Spatial Uncertainty, Jean-Paul Chils, Pierre Delfiner, Wiley Series in Probability and Statistics, John Wiley and sons, Inc. New York, 1999.
La geoestadstica intenta modelar, con herramientas estadsticas propias, hechos de la naturaleza. Estas herramientas deben permitir dejar de lado las limitaciones que se han ido estableciendo a lo largo de este apunte. En la estadstica bsica todas las herramientas surgen de
operadores en el espacio de la variable aleatoria. En el anlisis de series de tiempo y en el
mtodo de la colocacin por mnimos cuadrados los operadores se trasladan al espacio de
otras variables, tiempo o espacio, con los condicionamientos fuertes de que las variables
sean estacionarias o inclusive ergdicas. De la naturaleza no se puede esperar tales limitaciones. Sobrepasarlas constituye la fuerza y la debilidad de la geoestadstica, la fuerza en la
medida en que un gran nmero de problemas puede ser resuelto, la debilidad, en que todo
reposa sobre operadores estadsticos cuya obtencin est lejos de ser trivial.
Los hechos de la naturaleza no tienen un origen aleatorio, la cuantificacin de la incertidumbre espacial requiere de un modelo que especifique el mecanismo por el cual se genera
la aleatoriedad espacial.
A la variable que describe el hecho de la naturaleza se la designa variable regionalizada.
La aproximacin ms simple es tratar a la variable regionalizada como determinista y a la
posicin de la muestra como aleatoria. Es el mismo planteo que se us en series de tiempo.
Si se supone por ejemplo que estas posiciones son seleccionadas en forma independiente y
uniforme sobre un rea, entonces las reglas comunes de la estadstica pueden aplicarse para
determinar por ejemplo la media y la varianza. Si las muestras son tomadas sobre una grilla
regular dejan de ser independientes pero an en este caso es posible pensar en la aleatoriedad del origen de la grilla. Sin embargo aunque los operadores pudieran ser determinados
numricamente faltara saber si tienen sentido desde el punto de vista estadstico, es decir si
el supuesto subyacente de la ergodicidad se cumple.
La solucin de la geoestadstica es ms drstica, asocia la aleatoriedad con la variable regionalizada misma. Para ello piensa en un modelo estocstico segn el cual se ve a la variable regionalizada como una de las posibles realizaciones de una funcin aleatoria.
Pero los objetos que se requiere analizar, depsitos minerales, reservorios de petrleo, etctera, son nicos y perfectamente deterministas.
Las probabilidades y sus fundamentos experimentales en la ley de los grandes nmeros
requieren la posibilidad de repeticin, pero esta es imposible con objetos que son esencialmente nicos.
La clave entonces es distinguir cuidadosamente el modelo de la realidad que este intenta
captar. La probabilidad no existe en la naturaleza sino slo en nuestros modelos. No elegimos modelos estocsticos porque pensemos que la naturaleza es aleatoria sino simplemente

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

porque son tiles para su anlisis. Tengamos en cuenta que los modelos tienen sus limitaciones y representan a la realidad slo hasta un cierto punto.
Finalmente, sin importar lo que hagamos ni cuan bien trabajemos, siempre existe la posibilidad de que nuestras predicciones y nuestros clculos de la incertidumbre sean completamente errneos porque por alguna razn inexplicable el fenmeno que estudiamos, en algn lugar desconocido, es completamente distinto a cualquier cosa observada.
Habiendo observado que la variabilidad espacial es una fuente de incertidumbre espacial
tenemos que cuantificar y modelar la variabilidad espacial.
Qu dice la observacin en un punto acerca de los puntos cercanos? Podemos esperar
continuidad en sentido matemtico, estadstico o no podemos en absoluto esperar continuidad? Cul es la relacin seal ruido? Son las variaciones similares en toda direccin o
hay anisotropa? Muestran los datos cualquier tendencia espacial? Son los histogramas
simtricos o sesgados?
La respuesta a estas interrogantes est dada por el anlisis estructural.
La herramienta fundamental es el variograma que describe estadsticamente como los valores en dos puntos se vuelven diferentes a medida que aumenta la distancia que los separa.
El variograma es la forma ms simple de relacionar la incertidumbre con la distancia a partir de una observacin. Si el fenmeno es espacialmente homogneo y densamente muestreado sera posible ir ms all de las funciones estructurales y determinar las distribuciones
bivariables completas. En estadstica multipunto hay rara vez informacin suficiente para ir
ms all de dos puntos, salvo en el caso en que la informacin provenga de imgenes.
Para entender estos conceptos adelantamos una definicin del variograma:

E {z ( x + h) z ( x )} = 2 (h )
2

La esperanza matemtica supone un promedio entre una gran cantidad de determinaciones


individuales, aqu del cuadrado de la diferencia entre los valores para dos puntos distintos.
Cuando se habla de dos puntos lo que se quiere indicar es un nmero suficientes de pares
de puntos que permitan calcular correctamente esos promedios.
Se presentan dificultades cuando los datos presentan tendencias, no porque la teora no
permita incluirlas sino porque es muy difcil distinguir entre lo que es una deriva local y
una global.
Un problema fundamental es que el esquema de muestreo asegure la mejor precisin. El
variograma permite una comparacin entre esquemas de muestreo aleatorios, aleatorios
estratificados y sistemticos. Pero el problema es congeniar el aspecto econmico con la
precisin.
Qu densidad de grilla? La informacin esperable de un nuevo muestreo justifica la prdida econmica y el tiempo de espera? Mediante la simulacin estadstica estas preguntan
pueden responderse antes de realizar el levantamiento.
Uno de los problemas importantes a los que intenta responder la geoestadstica es el de conocer el valor de la variable regionalizada en un punto donde esta no fue medida. Se espera
que la estimacin sea precisa, sin sesgo y que se puedan conocer estimadores de la precisin de ese valor. Es el procedimiento de Kriging.
Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

Este tiene una variante fundamental que se da cuando una variable puede ser medida en
forma fcil y otra, la de mayor inters con dificultad. El procedimiento es el Cokriging.
Aqu el concepto de facilidad a menudo est ligado a consideraciones econmicas.

2. Anlisis estructural
Los fenmenos espaciales que nos interesan son generalmente:

nicos e irreproducibles
Definidos en dominios bi o tridimensionales
Demasiado complejos para una descripcin determinista precisa
Conocidos en puntos de muestreo distribuidos en forma no uniforme.

Estos fenmenos se describen mediante variables regionalizadas tales que:


z ( x) : x D R n a las que decidimos tratarlas como realizaciones de funciones aleatorias.
En un caso terico se debera tener k realizaciones distintas de esas variables con cuyos
valores y toda la distribucin espacial x1 , x 2 ,....., x n se podran calcular los estimadores.
Cuando se dispone de una sola realizacin como es casi siempre el caso, slo se puede hacer uso del carcter estacionario de la variable. Esto es repeticin en el espacio. Dos configuraciones de puntos que son idnticas, salvo una translacin, son consideradas estadsticamente equivalentes.
Como los puntos de muestreo son tomados en general en forma no uniforme slo se cuenta
con un par de puntos para calcular la estadstica.
La herramienta principal es el variograma, de su buena determinacin dependen todos los
pasos posteriores. Se distinguen tres tipos de variogramas:

El variograma de la funcin aleatoria o variograma terico


El variograma de la variable regionalizada o variograma regional, que podra ser calculado s se conociera el valor de la variable regionalizada en cada punto de su dominio de
estudio.
El variograma de la muestra, el que puede ser calculado a partir de los datos.

La tarea a realizar puede resumirse a dos pasos:

Calcular un variograma de la muestra. Si los puntos de muestreo han sido bien elegidos
este variograma se aproximar al variograma regional.
Ajustar un modelo terico a esta variograma de la muestra.

Para entender este procedimiento hay que pensar que la nica fuente de informacin con
que se cuenta es el variograma, tenerla expresada mediante una funcin, permite calcular su
valor para cualquier distancia, es decir permite relacionar a un punto desconocido con todos
los puntos medidos.

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

2.1. Funciones aleatoria estacionarias


2.1.1. Estacionariedad estricta
En la prctica, un caso particular importante se presenta cuando una distribucin de dimensiones finitas permanece invariante para cualquier translacin arbitraria de los puntos por
medio de un vector h Esto se expresa por medio de la probabilidad de:
Pr{Z ( xi ) < z i ,......Z ( x k ) < z k } = Pr{Z ( xi + h) < z i ,......Z ( x k + h) < z k }
Tal funcin aleatoria se llama estacionaria. Fsicamente esto significa que el fenmeno es
homogneo en el espacio y, por decirlo as, se repite a s mismo en todo el espacio. En trminos espaciales esto implica isotropa.
2.1.2. Estacionariedad de segundo orden
Cuando una funcin aleatoria es estacionaria, sus momentos, si existen, son invariantes ante
cualquier translacin. Si consideramos slo los momentos de primer orden para los puntos
x y x + h de R n tenemos:
E [Z ( x)] = m
E [{Z ( x) m}{Z ( x + h) m}] = C ( h)

En la primera ecuacin tenemos la expresin de la media que es constante y en la segunda,


la de la covarianza que depende slo de h.
Por definicin una funcin que satisfaga las condiciones anteriores es una funcin dbilmente estacionaria o estacionaria de segundo orden o estacionaria en el sentido amplio. En
general no se cuenta con elementos como para hacer una afirmacin ms fuerte.
Una funcin aleatoria estacionaria es istropa si su covarianza slo depende del vector h y
no de la orientacin.
2.1.3. Funcin aleatoria intrnseca
Una hiptesis ms suave consiste en suponer que para cada vector h el incremento
Yh ( x) = Z ( x + h) Z ( x) es una funcin aleatoria estacionaria en x En ese caso Z (x ) es
llamada funcin aleatoria intrnseca y es caracterizada por las relaciones:

E[Z ( x + h) Z ( x)] = a, h

Var[[Z ( x + h) Z ( x)]] = 2 (h)

a, h es la deriva lineal de la funcin aleatoria intrnseca y (h) su funcin variograma.


Si la deriva es 0, esto es la media es constante, tenemos la forma usual del modelo intrnseco:

E [Z ( x + h) Z ( x)] = 0

E [Z ( x + h) Z ( x)] = 2 (h)
2

La denominacin dada aqu al variograma, en parte de la bibliografa corresponde al semivariograma.


Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

2.1.4. Representacin espectral


La representacin espectral de funciones aleatorias estacionarias juega un papel importante
en el anlisis de series de tiempo. Establece que una seal estacionaria es una combinacin
de componentes sinusoidales estadsticamente independientes de diferentes frecuencias.
Estas componentes armnicas bsicas pueden ser identificadas fsicamente mediante filtros
numricos que dejan pasar oscilaciones en un intervalo de frecuencia dado y eliminan otras.
Esto puede hacerse tambin numricamente usando transformadas de Fourier discretas o la
transformada dela autocorrelacin, es decir mediante el power spectrum.
En este caso es preferible utilizar las tcnicas del anlisis funciones peridicas ya sean en
una o dos dimensiones.
2.2. Variograma de una funcin estacionaria intrnseca
Para analizar si la deriva es lineal recordemos las definiciones bsicas:
m(h) = E [Z ( x + h) Z ( x)] = a, h
1
2

(h) = Var [[Z ( x + h) Z ( x)]]


Si tomamos

Z ( x + h + h' ) Z ( x) = [Z ( x + h) Z ( x)] + [Z ( x + h + h' ) Z ( x + h)]


Pasando a la esperanza matemtica: m( h + h' ) = m( h) + m( h' )
Esto significa que m es una funcin lineal del vector

h = ( h1 , h2 ,..., hn ) t a saber

m(h) = a, h = a1h1 + a 2 h2 + ..... + a n hn para algn vector gradiente: a = ( a1 , a 2 ,..., a n ) t


El variograma muestra como la disimilitud entre Z (x ) y Z ( x + h) evoluciona con la separacin h. Como la covarianza, el variograma en general es anistropo.
Evidentemente el variograma es una funcin par, no negativa, con valor 0 para h = 0

( h) = ( h)
(h) 0
( 0) = 0
Del variograma (h) se dice a menudo que es terico para recordar que es una construccin terica que no depende ni de una realizacin particular ni de una regin particular.
Ms adelante volveremos sobre aquellas funciones que pueden ser usadas como variogramas tericos.
2.2.1. Variogramas limitados y estacionariedad
Una funcin aleatoria estacionaria es tambin una funcin estacionaria intrnseca y por lo
tanto tiene un variograma
En este caso el variograma est ligado a la covarianza por la relacin:

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

( h ) = C ( 0) C ( h )
En efecto:

2 (h) = Var [Z ( x + h) Z ( x)] = E {Z ( x + h) Z ( x)}

= E {Z ( x + h)} 2 Z ( x + h) Z ( x) + {Z ( x)} = C (0) 2C (h) + C (0) = 2C (0) 2C (h)


(h) = C (0) C (h)
2

As el variograma tiene como lmite 2C (0)


Esta ecuacin muestra que si la covarianza es conocida tambin lo es el variograma.
Inversamente si el variograma de una funcin aleatoria intrnseca est limitado por un valor
finito, (h) tiene la forma dada por esta ecuacin para una covarianza estacionaria C (h) y
una funcin aleatoria intrnseca slo difiere de una funcin aleatoria estacionaria en una
constante aleatoria. Es entonces equivalente conocer (h) o C (h)
El variograma tiene entonces una mayor generalidad que la covarianza.
2.2.2. Variograma y varianza de la muestra
La varianza terica de Z (x ) es igual a C (0) s Z es una funcin aleatoria estacionaria o no
existe (es decir es infinita) si Z es una funcin aleatoria intrnseca no estacionaria.
Pero la varianza de la muestra de un nmero finito de valores siempre tiene una esperanza
finita. Consideremos una realizacin particular z (x ) de la funcin aleatoria intrnseca Z (x )

Si los N valores z ( x ) : = 1,2,....., N son conocidos, se puede definir la varianza de la

muestra, que caracteriza la dispersin de z ( x ) alrededor de su media, como:


s 2 (0 N ) =
donde: z =

1
N

1
N

[z ( x ) z ]
=1

z ( x )

=1

La notacin 0 significa que las muestras unitarias son consideradas puntuales (volumen 0) y
N recuerda que la varianza est relacionada al esquema de muestra x : = 1,2,....., N
Considerando la posibilidad de mltiples realizaciones esta varianza podra ser escrita como:
1
s (0 N ) = 2
N
2

[z ( x ) z ( x )]

=1

=1

Si las variables z ( x ) no estn disponibles s 2 no puede ser calculada. Pero considerando


la aleatoriedad con respecto a la realizacin se puede escribir:
1 N N
2 (0 N ) = 2 (x x )
N =1 =1
Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

En el caso de una funcin aleatoria estacionaria esta expresin es equivalente a:

2 (0 N ) = C (0)
2 (0 N ) = C (0)

1
N2

C (x x )

=1

=1

1
1
Var
2
N
N

Z ( x )

=1

La esperanza matemtica de la muestra es siempre menor que la varianza terica. Si los x


estn tan alejados como para que los Z ( x ) no estn mutualmente correlacionados esta
1

expresin vale: 2 (0 N ) = 1 C (0) . As la discrepancia entre la esperanza matemtica


N

de la varianza de la muestra y la varianza terica se vuelve despreciable para N

2.2.3. Interpretando el variograma


El variograma es un promedio:

( h) =

1
2N h

[Z ( x ) Z ( x )]

x x h

De este promedio de los cuadrados de la diferencia de la variable regionalizada para distintos valores de h se debera esperar sea 0 para distancias pequeas traduciendo as la persistencia espacial de la variable. Dicho de otra manera se espera que los valores de la variable
para puntos muy cercanos sean muy similares. Al aumentar esa distancia, la persistencia
espacial disminuye y por lo tanto el valor de (h) aumenta. Sin embargo para alguna distancia es esperable que exista una meseta ya que el promedio de N valores cuya variabilidad mxima est dada por la tcnica de medicin, est acotado.

Figura 1: Nmero de valores para el clculo del promedio para diferentes distancias

Debera poder distinguirse entonces 2 valores caractersticos, el mximo al que alcanzan los
promedios y la distancia a la que se llega a este valor.

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

La terminologa para esos dos valores no es uniforme, los ms usuales son range (distancia)
y sill (escaln) o width y Cutoff, en el programa pblico GSTAT y length y scale en el muy
difundido programa SURFER.

Figura 2, propuesta de modelo esfrico para los datos

Si se deseara aplicar directamente la frmula:

( h) =

1
2N h

[Z ( x ) Z ( x )]

x x h

en una situacin normal de muestreo es posible que para un h dado, no exista ningn par de
puntos a esa distancia particular o tan pocos que hagan al promedio no significativo.
Debe sealarse la diferencia con la estructura normal de series de tiempo equiespaciadas
para las que es siempre posible definir un intervalo mnimo x dado por el intervalo de
muestreo y mltiplos kx Tambin es posible fijar un mximo emprico para estos mltiplos. Esta situacin difcilmente se d en el clculo de un variograma.
Es necesario calcular un promedio de valores al interior de un intervalo de distancias h
de forma tal de tener un nmero significativo de valores a promediar. Aunque en la literatura se suele indicar un mnimo de 50 valores, est claro que este nmero depender del comportamiento de la variable y de las posibilidades reales de obtencin de datos.

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

Tambin es posible que la variable regionalizada en estudio no tenga caractersticas de isotropa, en ese caso ante una distribucin de puntos sobre una superficie el variograma depende de la direccin. El mismo razonamiento que se hace sobre los posibles valores de la
distancia debe hacerse con respecto al acimut de las direcciones posibles.
Pero antes de encarar el clculo de un variograma se impone como en todo anlisis estadstico un anlisis previo de los datos. Se debe poder plantear preguntas como: Existen outliers en tanto que errores de medicin? Los datos corresponden a una nica variable (estructura), es decir la definicin clsica de outlier? Existe isotropa? Existe deriva?
Los datos para la construccin de cada promedio individual constituyen una nube de valores. El nmero de mediciones por intervalo es similar o muy diferente? Es posible cambiar los intervalos para obtener un nmero de mediciones ms semejante?
A partir de esta nube de mediciones es posible establecer un grfico de barras de error. Estas barras son muy distintas para diferentes distancias?
2.2.4. El variograma terico
La expresin (h) =

1
2N h

[Z ( x ) Z ( x )]

suministra un conjunto de valores discretos

x x h

para las h distancias que permiten obtener un nmero razonable de promedios. A menudo
es necesario conocer el valor del variograma para distancias diferentes a ellas. Se necesita
entonces una representacin analtica del variograma, esa representacin es una variograma
terico cuyos parmetros se han ajustado al variograma experimental.
Se dijo que el variograma terico deba satisfacer las condiciones siguientes:

(h) = ( h)
(h) 0
( 0) = 0
Estas propiedades son satisfechas por un buen nmero de funciones matemticas cuyo estudio trasciende los objetivos de este apunte. Nos limitamos entonces a las funciones ms
usadas.
En el caso estacionario es ms fcil calcular formula de la covarianza y luego la del variograma recordando la relacin: ( h) = C (0) C ( h)
Se da a continuacin la expresin de las covarianzas ms usuales
En un espacio unidimensional el modelo ms simple es el triangular:
1.2
1
0.8
0.6

r
ra
1
C1 (r ) = a
0 ra

Apuntes para el curso de Geoestadstica

0.4
0.2
0

Juan Carlos Usandivaras

En dos dimensiones el modelo circular es el ms empleado


2
r2
r r
1 2 r a
arccos

a
a a
C 2 (r ) =

ra
0

1.2
1
0.8
0.6
0.4
0.2
0

En tres dimensiones el modelo esfrico es el ms empleado


3r
r3
1

+
ra

3
C 3 ( r ) = 2a 2a
0
ra

En estos tres casos la escala es 1 y el range a.


Se puede usar un modelo exponencial con factor de escala a > 0 cuya funcin de covarian r
za es: C (r ) = exp la que la para el variograma la forma:
a
1
0.8
0.6
0.4
0.2
0

El modelo gaussiano con factor de escala a > 0 cuya funcin de covarianza es:
r2
C (r ) = exp 2 la que la para el variograma la forma:
a
1.2
1
0.8
0.6
0.4
0.2
0

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

El modelo de Cauchy con factor de escala a > 0 y exponencial > 0 cuya funcin de co
r2
varianza es: C (r ) = 1 + 2
a

la que la para el variograma la forma:


0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0

En el grfico superior se muestran dos posibles valores de 1 para la curva inferior y


2
3 para la curva superior.
4
El modelo logartmico para el variograma tiene la forma:
3.5
3
2.5
2
1.5
1
0.5
0

y su expresin matemtica es (r ) = log r . En la grfica = 1


Este modelo tiene la caracterstica que si se toman muestras a partir de volmenes de forma
similar pero de diferente tamao, la expresin de sus varianzas tiene la forma:
v
V
2 = log esto es la varianza de pequeos bloques v al interior de grandes bloV
v
ques V depende solamente de la relacin inversa de sus volmenes cualquiera sea el factor
de escala.
Variograma de una funcin peridica.

En el captulo de series de tiempo se vio que la covarianza de una funcin peridica coseno
era una funcin coseno en consecuencia el variograma de tipo de datos podra tener la forma indicada en el grfico anterior. La caracterstica a sealar es la presencia de un descenso
importante del valor de conocido como (hole effect) Como se seal anteriormente el uso
de anlisis espectral puede dar resultados ms satisfactorios en este caso.
Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

Existe una gran cantidad de otras funciones que cumplen con las propiedades antes citada,
para casos especiales acudir a la bibliografa especializada.
2.2.5. Ajuste del variograma muestral
No existe ningn procedimiento totalmente automtico para ajustar el variograma. La intervencin humana va desde un trazado manual completo del variograma hasta la mera eleccin del modelo que ser ajustado por mnimos cuadrados.
Es importante recordar que una funcin del variograma es la de interpolador, a los fines del
clculo esa tarea se cumplir ms sencillamente si el variograma est descrito por una funcin analtica cuyos parmetros han sido ajustados a los datos observacionales. Lo que no
impide que en casos especiales en los que se quiere aprovechar al mximo la experiencia de
un especialista se pueda realizar esta interpolacin manualmente a partir de un variograma
producto de su trazado.
En el caso ms comn, con la ayuda de programas especficos, se ha citado anteriormente a
GSTAT, se puede proponer diferentes modelos y por medio de sus posibilidades grficas,
comparar su comportamiento con el de los datos experimentales. Esta primera etapa est
mostrada en la figura 2.
Paralelamente con los datos que aportan los valores puntuales calculados para el variograma existe un conjunto de datos que el especialista conoce. Uno de esos datos se refiere a la
ordenada en el origen, efecto pepita, cual es la varianza de las observaciones o del observable. Por ejemplo en el caso de anomalas gravimtricas, no es suficiente considerar el error
del gravmetro sino tambin el de la determinacin de alturas y de posiciones de las estaciones. En el caso de mediciones de porosidad de rocas o de contenidos mineralgicos el
especialista podr incorporar su conocimiento personal para tomar una decisin sobre el
valor razonable de esa ordenada en el origen.
Pensando siempre al variograma como interpolador es importante poder nfasis en el comportamiento de la curva en los puntos cercanos al origen. A estos puntos puede atribuirse
mayor peso en la medida en que representan con mayor seguridad el comportamiento de la
estructura que se analiza, en detrimento de los puntos alejados en los que el concepto mismo de variograma reconoce correlaciones menores. Para elegir la funcin que se desea
ajustar se tendrn en cuenta esos factores.
Una vez definida la funcin y comprobado que la misma describe adecuadamente los puntos experimentales, es posible ajustar los parmetros de la funcin por mnimos cuadrados.
2.2.6. Una generalizacin del variograma
Los variogramas tericos que se mostraron en un punto anterior son deducidos todos a partir de la covarianza, esto implica que se supone a la variable regionalizada estacionaria. No
es posible en este caso admitir la existencia de una deriva. En algunos casos es posible sustraer un polinomio simple representativo de la deriva sobre la base de informacin externa.
Por ejemplo en el caso de anomalas de la gravedad en nuestro pas se encontrar siempre
una influencia de los Andes. Para regiones suficientemente alejadas es posible modelar esta
influencia con un polinomio simple y sustraerla de los datos.
En series de tiempo se vio que era posible eliminar a una deriva lineal mediante simples
diferencias y a derivas ms complejas con diferencias sucesivas. Esto es posible porque en
Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

general se cuenta con datos equiespaciados y en nmero suficiente. Con datos superficiales
normalmente este no es el caso.
En vez de sacar la deriva es posible proceder de otro modo. Este es una extensin del concepto mismo del variograma. Al realizar la diferencia entre valores separados por una distancia h el variograma elimina la necesidad de conocer la media o en general cualquier
constante sobre la que se describa a la variable. Extendiendo este concepto a una segunda
diferencia, se puede calcular: {Z ( x + 2h) Z ( x + h)} {Z ( x + h) Z ( x)} Dando lugar al
variograma:
1
1 (h) = Var {Z ( x + 2h) 2 Z ( x + h) + Z ( x)}
6

El coeficiente 1 6 se introduce para lograr que el valor para h = 0 corresponda con el efecto pepita para un variograma completamente plano.
Este variograma tiene sin embargo la dificultad de encontrar el nmero adecuado de puntos
para efectuar las diferencias sucesivas.
El concepto puede tericamente generalizarse para derivas ms complejas pero las dificultades prcticas aumenta.
En resumen ante la presencia de deriva:
El variograma de datos crudos es inutilizable porque la deriva enmascara el variograma
de la variable regionalizada.
En el caso en que se haga una sustraccin de la deriva el variograma resultante puede
presentar sesgos importantes
Con el variograma generalizado se puede filtrar la deriva y obtener el variograma de la
variable buscado.

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

3. Kriging
Razones econmicas y operativas hacen imposible medir una variable regionalizada en ms
que un conjunto limitado de puntos a partir de los cuales se desea calcular el valor de la
variable en cualquier otro punto. Esta operacin puede llamarse estimacin, prediccin o
interpolacin segn el contexto en que se realiza.
La ubicacin de esos puntos de toma de muestra se elige en funcin del conocimiento que
el operador tiene del observable. Por ejemplo si se desea determinar la altura de la superficie topogrfica en un rea importante, el topgrafo elegir puntos en crestas y valles de
forma tal que la interpolacin entre ellos pueda ser lineal y la descripcin aceptable con un
nmero limitado de mediciones.
A diferencia de otros mtodos en los que se intenta describir a la variable mediante una
ecuacin matemtica prefijada, cuyos parmetros se encuentran por algn criterio de minimizacin, aqu la informacin es completamente estadstica y se obtiene ya sea a travs del
variograma o de la covarianza.
El objetivo es encontrar un operador lineal que vincule l o los puntos en los que se desea
conocer el valor de la variable con los valores medidos.
Se conocen tres tipos de mtodos cuyas caractersticas se resumen en la tabla siguiente:
Tipo

Media

Requisito mnimo

Covarianza

Modelo estadstico

Kriging simple

Constante y conocida

Kriging ordinario

Constante y desconocida Variograma

Intrnseco

Kriging Universal

Variable y desconocida

Kriging Universal

Variograma

Estacionario

3.1. Notacin y supuestos

El problema de la notacin es bastante complicado en la bibliografa sobre el tema.


La variable regionalizada
Existe una variable regionalizada terica de la que slo se accede a una realizacin y esta
realizacin se limita en general a puntos discretos. En algunos tipos de levantamientos se
podra contar con un registro analgico, pero en lo que sigue se tratar el caso puntual discreto. En un prrafo anterior se describi a la variable regionalizada como:
Z ( x) : x D R n
Se introdujo como notacin z ( x ) para indicar la realizacin particular de la variable en el
punto Sin embargo en lo que sigue se conservar la mayscula para el valor de la variable ya que slo se dispone de una nica realizacin.
Puntos medidos
Consiste en un conjunto finito de puntos en los que se ha medido:
Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

S = {x : = 1,2,...., N }
Valores de las funciones
En cada punto de muestra se definen los siguientes valores:
Z = Z ( x ) que constituyen los datos
m = m( x ) el valor de la media en cada punto medido

= (x , x ) la covarianza entre Z ( x ) y Z ( x )
Hay que notar que esta covarianza no es un hecho puntual referido a esos dos puntos especficos sino una caracterstica de la variable regionalizada para los puntos que estn a la
distancia que hay entre x y x
El valor estimado
El estimador buscado por Kriging Z * es un estimador lineal de la forma:
N

Z * ( x0 ) = ( x0 ) Z ( x ) + 0 ( x0 )
=1

Se desprende de la formula que el estimador es un promedio pesado de las mediciones realizadas en las que los pesos dependen del lugar donde se encuentra el punto para el que se
desea la estimacin y de donde se encuentra el punto medido mas una constante que depende slo del punto de la estimacin.
Una forma ms simple para esta relacin es:
Z * = Z + 0

Z * = t Z + 0

En la que se supone que la suma se realiza sobre todos los puntos disponibles y es un
vector que contiene coeficientes que dependen de indirectamente de la distancia entre el
punto en que se desea conocer el valor de la variable y los puntos medidos.
3.2. Kriging simple

En este modelo la media se supone conocida y la relacin estadstica viene dada por la matriz de varianza covarianza de las observaciones. Suponer la media conocida significa que
al no ser necesario su clculo el algoritmo buscado supone que la variable regionalizada
est centrada. Este planteo es idntico al descrito en el mtodo de prediccin por mnimos
cuadrados en el prrafo 4.1 del fascculo sobre series de tiempo. En ese prrafo se brind
con todos los detalles la presentacin dada por H. Moritz en su libro Advanced Physical
Geodesy, Herbert Wichmann Verlag, Karlsruhe, 1980.
Es interesante sealar como, en este tema de encontrar el mejor estimador lineal, se encuentran planteos de origen diferente como son el tratamiento de series de tiempo, colocacin
por mnimos cuadrados para el clculo del potencial terrestre y la geoestadstica.
En ese prrafo el estimador lineal se defini como:
Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

H = C sl C ll1

Que lleva a la solucin del problema bajo la forma


s = C sl C ll1l

Traducida a la nomenclatura de este captulo:


z 0* = 0t 1 z = t z

t = 0t 1
En la que:
El vector z corresponde a los valores medidos de dimensin N ,1
La matriz 1 es la matriz varianza covarianza de las observaciones de dimensiones
N, N

0 es el vector de las covarianzas entre la posicin del punto en que se desea conocer la variable y los puntos medidos de dimensin N ,1 Este vector se encuentra a
partir de la funcin de covarianza (variograma) introduciendo la distancia entre el
punto desconocido y los puntos medidos.
En el caso en que se desee determinar el valor de un punto la expresin
Z * = Z

Corresponde al producto:
z1
z * = t z = 1

2 .... N

z2
..

= z

zn
En el caso en que la media sea distinta de 0 y conocida, slo hay que sumarla al valor calculado.
La varianza de la estimacin con Kriging simple se calcula como:
2
SK
= 00 t 0

Ntese que las magnitudes con doble subndice son nmeros mientras que aquellas con un
nico subndice son vectores cuyo producto da otro nmero. Esta formula corresponde a las
desarrolladas en mnimos cuadrados en las que la varianza se calcula siempre como la diferencia entre la suma del cuadrado de los residuales llamados all y el valor de la funcin
calculada con los estimadores de las variables.
Sin embargo, en esta expresin del error no intervienen los valores medidos sino slo la
posicin del punto estimado con relacin a los puntos medidos.

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

Una forma de comprender porque el mtodo de Kriging simple es un interpolador exacto es


pensar que si se desea calcular el valor de la variable en un punto medido la correlacin
entre esa medicin y si misma es 1 y con todas las otras mediciones por definicin es nula.
Los valores de la variable estn correlacionados pero no las mediciones.
El vector 0 para el punto medido toma la forma:

1i ... ii ... Ni = 0 ... 1... 0


*

Con lo que Z i = Z i
3.3. Kriging ordinario
En este caso se supone que la variable es estacionaria, la media de la variable es constante
pero desconocida. Para encontrarla dentro de un algoritmo nico similar al anterior se hace
uso de una condicin muy difundida para las medias pesadas.
La forma buscada es:

Z * = Z
La condicin citada es

=1

Para analizar el significado de esta condicin se puede comparar la esperanza matemtica


de la variable tal como determinada a partir de las mediciones por el operador Z * y la esperanza matemtica de la variable en todo su dominio.

[ ]

N
N

E Z * E [Z ] = E Z E [Z ] = E [Z ] E [Z ]
=1
=1

Si se desea que la esperanza de la variable obtenida mediante una media pesada sea igual a
la esperanza de la variable.

E Z Z = 0

=1

N
E [Z ] 1 = 0

=1

Si se quiere que los adems de las condiciones dadas en el prrafo anterior cumplan con
la condicin de brindar la media, se puede plantear un sistema de ecuaciones normales en la
que esta condicin se incluya. Como se vio en el fascculo de mnimos cuadrados el sistema
de ecuaciones normales con condiciones se escribe:

F 0
. =
f0
0

Esta forma tiene alcances ms amplios que los de este caso como se ver despus.
Aqu F es un vector de dimensin N de la forma:

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

1
1
F=
..
1
y es un nico coeficiente de Lagrange proveniente de la nica condicin impuesta.
La solucin formal del sistema es:
x=
Con

Ft

= Q 1 L

.=Q y 0 = L
0
1

En la matriz Q sin embargo es necesario conocer la matriz de varianza covarianza de las


observaciones. En el caso general esta matriz est contaminada por la ignorancia de la media y no as el variograma. En el supuesto de que el fenmeno en estudio sea estacionario
de segunda especie es posible calcular las covarianzas a partir del variograma.
3.4. Kriging universal
El Kriging universal permite tratar el caso que exista una tendencia o deriva. De esta deriva
se debe conocer su expresin matemtica, es decir las ecuaciones que la describen y slo
ignorar los coeficientes que le asignan valores numricos.
El planteo matemtico de este caso es similar al anterior, en el sentido en que se deben
agregar condiciones que describan a la deriva.

Apuntes para el curso de Geoestadstica

Juan Carlos Usandivaras

También podría gustarte