Geoe Stadi Stica

FUNDAMENTOS DE GEOESTADSTICA
Fernando Garca Bastante- Universidad de Vigo
El trmino geoestadstica fue acuado por G. Matheron (1962), definindolo como la

aplicacin del formalismo de las funciones aleatorias al reconocimiento y estimacin de
los fenmenos naturales. Dichos fenmenos los caracterizamos por la distribucin
espacial de una o ms variables (v.g. las leyes de un depsito o las cotas de una
superficie topogrfica), que denominamos como variables regionalizadas.
Si z(xi) es el valor de una variable z en un punto xi, intentamos representar la
variabilidad de z en el espacio de inters o dominio D, partiendo del hecho de que la
realidad nos muestra que existe una similitud estadstica, una correlacin, entre pares de
valores (z(xi), z(xj+h)), al menos cuando la distancia entre ellos (h) no supera un cierto
valor. El inters en representar dicha variabilidad, surge porque nos permite hacer
estimaciones del valor de la variable en los puntos que nos interesen dentro del dominio.
La geoestadstica interpreta cada valor z(xi) como una realizacin particular de una
variable aleatoria Z(xi), y el conjunto de stas dentro del dominio D, constituye una
funcin aleatoria (Z(x)={Z(xi), xiD}). El problema de caracterizar la variabilidad
espacial de z(x) se reduce entonces, a caracterizar la correlacin entre las variables
aleatorias que integran la funcin aleatoria. Esta funcin incorpora tanto el carcter
aleatorio que percibimos en la variable, como la estructura espacial de la variabilidad de
los valores que observamos en la realidad.
Esta interpretacin fundamental se justifica a posteriori, si produce soluciones
coherentes y aceptables a los problemas variados que aparecen en la prctica, (Journel
y Huijbregts, 1978). Al igual que ocurre en el resto de los modelos matemticos que
intentan reflejar algn aspecto de la realidad, la geoestadstica establece un conjunto de
hiptesis, y las desarrolla hasta obtener unas conclusiones. Si stas se ajustan a lo que
observa en la realidad estipulamos que el modelo es vlido.
Cualquier conjunto de n variables de la funcin aleatoria, localizados en n puntos
diferentes, se caracteriza por su funcin de distribucin de probabilidad mltiple (nvariable), esto es: Fx1,x2...xn (z1, z2,...zn) = Prob[Z(x1) z1, Z(x2) z2,...Z(xn) zn], con zi
= z(xi), y siendo n cualquier nmero entero positivo. Nuestro problema en general es

calcular el valor esperado (E{Z(xk)}) de una variable (Z) en un punto de inters (xk),
conocida una realizacin de la funcin aleatoria en una serie de puntos (x1,x2...xl con
Z(xi) = zi, i= 1,...l). El problema tiene solucin inmediata si conocemos Fx1,x2...xl,xk, mas
como no es el caso (slo disponemos de una realizacin de la funcin aleatoria),
necesitamos establecer una serie de hiptesis que nos permitan cierta inferencia
estadstica, y debemos proponer, adems, algn criterio de seleccin del estimador a
utilizar (las hiptesis no permiten el clculo directo del valor buscado).
Para medir el grado de similitud entre dos variables aleatorias se emplean los momentos
de segundo orden, en particular la funcin covarianza definida como: C{Z(xi),Z(xj)} =
E{[Z(xi)-m(xi)][Z(xj)-m(xj)]}, representando E{.} la esperanza matemtica o valor
esperado como vimos anteriormente, y siendo m(xk)= E{Z(xk)}. Como quiera que la
estimacin y utilizacin de la funcin covarianza presenta algunos incovenientes, en
geoestadstica, se sustituye aquella por la funcin variograma definida como: 2 (xi,xj)
= Var{Z(xi)-Z(xj)}, representando Var la varianza definida como: Var{Z(xi)} =
E{[Z(xi)-m(xi)]2}.
Estos momentos son importantes ya que nos servirn para llevar a cabo la estimacin, y
de hecho las hiptesis que vamos a establecer respecto a la funcin aleatoria son de
estacionariedad de 2 orden (de los dos primeros momentos). En general una funcin
aleatoria es estrictamente estacionaria, si para cualquier conjunto de n puntos y para
cualquier vector h cumple: Fx1,x2...xn (z1, z2,...zn) = Fx1+h,x2+h...xn+h (z1, z2,...zn), lo que
significa que la funcin de distribucin mltiple es invariante a la translacin.
La geoestadstica parte bien de la hiptesis de invariabilidad a la translacin de los dos
primeros momentos (media y covarianza) de la funcin aleatoria:
-
E{Z(x)} = E{Z(x+h)} = m, xD
C{Z(x),Z(x+h)} = C(h), x, x+hD
bien de la hiptesis de estacionariedad intrnseca de la funcin aleatoria (invariabilidad

a la translacin de la funcin variograma):
-
E{Z(x+h) - Z(x)} = 0, xD
Var{Z(x+h) - Z(x)} = 2 (h), x, x+hD
(Ntese que bajo la primera hiptesis se cumple la relacin: 2 (h) = 2 [C(0)-C(h)], al

ser: 2 (h) = E{[Z(x+h)-Z(x)]2}, y tambin: C{0,0} = C(0) = () = Var{Z(x)}. Bajo
cualquiera de las hiptesis se cumple: 2 (0) = 0).
La segunda hiptesis es ms general que la primera, y es suficiente para resolver nuestro
problema, utilizando para ello el siguiente estimador, e(h), de la funcin variograma
(Matheron, 1962):
2 e (h)
1
[z ( x + h) z ( x)]2
N (h) N ( h )
en donde N(h) es el nmero de pares de valores que tenemos separados por el vector h.
Este estimador, al no precisar del conocimiento de la media m, presenta la ventaja de no
ser sesgado a diferencia del estimador de la funcin covarianza, que s lo es. Tambin
ocurre que cuando existe en la realidad una pequea tendencia lineal (E{Z(x)} = m(x)),
el estimador de la covarianza de la funcin resulta mucho ms afectado (con el cuadrado
de la dimensin del dominio), que el del variograma (con el cuadrado de h) (Cressie,
1993).
Consideremos algunos conceptos importantes relacionados con el variograma. Sean V y
v dos soportes (puntos, reas o volmenes). El valor esperado del error cuadrtico
cometido al estimar el valor medio de la variable regionalizada (ZV) sobre V, con el
valor medio (Zv) sobre v (por ejemplo cuando extendemos o extrapolamos el valor de la
ley obtenido a partir de una pequea muestra en el frente de una galera, al resto de la
seccin de la galera), es lo que se llama varianza de extensin, y su valor es igual a:
2E(v,V) = E{[ZV-Zv]2}= 2 (v,V) - (V,V) - (v,v) ( es el valor medio de la funcin

variograma entre los soportes v y V). Segn esto, bajo nuestras hiptesis podemos
considerar el variograma como la varianza del error cuando estimamos e igualamos el
valor de una variable (v.g. la ley) en un punto x+h, con el valor de la variable en otro
punto x.
Otro concepto interesante es el de la varianza de dispersin. Si tenemos N soportes vi,
iguales, que conforman un soporte V = ivi, se define aquella (D2(v,V)) como el valor
medio sobre V de la varianza de extensin de v sobre V. Dicho de otro modo, es la
fluctuacin esperada de los valores Zvi respecto al valor ZV en V, elevada al cuadrado y

promediada. Se cumple: D2(v,V) = (V,V) - (v,v).
Asumiendo una de las hiptesis de estacionariedad podemos abordar la tarea de
estimacin conforme al modelo planteado. Sea ZV(xk) la variable a estimar sobre un
soporte V centrado en xk (ZV(xk) = (1/V) V(xk)Z(x) dx), a partir de un conjunto de n
variables Zv(xi) cuyas realizaciones zv(xi) sobre otro soporte v conocemos; entonces, en
general, Z*k (el estimador de ZV(xk)) ser una funcin de dichas variables. De todas las
funciones existentes nos interesan aquellas que no introduzcan sesgo (E{ZV(xk) Z*k}
= 0), y tambin aquellas que nos permitan calcular la varianza de la estimacin (2k =
E{[ZV(xk) Z*k]2}, e imponerla la restriccin de que su valor sea mnimo. Esto nos
limita la posibilidad de bsqueda a la clase de estimadores lineales. Podemos escribir
Z*k = ii Zi, llamando Zi = Zv(xi), y siendo i cada uno de los n pesos que vamos a
calcular con las dos restricciones mencionadas.
De la primera restriccin es inmediato que se debe cumplir que: ii = 1. La segunda
impone que: E{[ZV(xk) Z*k]2} sea mnimo. Con cualquiera de la hiptesis de
estacionariedad esto implica que la derivada de 2k respecto a cada i debe ser igual a 0.
Esto da lugar a un sistema lineal de ecuaciones de manera que si se introduce la
ecuacin de ligadura (ii = 1) obtenemos:
Para la hiptesis de estacionariedad de 2 orden:
C(v,v) = C(v,V), , = 1 a n
1 = 0, con = 1 a n
Con C(a,b) igual al valor medio de la covarianza cuando un extremo del vector h
recorre el soporte a y el otro el b. El parmetro de Lagrange de la ecuacin de
ligadura es y el valor de la varianza es: 2ko = C(V,V) + - C(v,V).
Para la hiptesis de estacionariedad intrnseca:
(v,v) + = (v,V), , = 1 a n
1 = 0, con = 1 a n
Con (a,b) igual al valor medio del variograma cuando un extremo del vector h
recorre el soporte a y el otro el b. En este caso obtenemos que el valor de la varianza
es: 2ko = (v,V) + - (V,V).
Estas ecuaciones representan lo que Matheron (1963) denomin Krigeage o Kriging, en
honor de D.G. Krige, un ingeniero de minas que preconiz este procedimiento en los
aos 50, trabajando en las minas de oro de frica del Sur. Comparando la informacin
real sobre leyes medias de paneles de explotacin, con las estimadas ponderando
muestras prximas a cada panel, con objeto de lograr un estimador ptimo, deduca el
valor de las ponderaciones obligando a que la varianza de la estimacin fuese mnima
(Azcrate, 1982).
El krigeage obtiene como resultados los mejores estimadores lineales no sesgados y hoy
en da, el trmino est referido a toda una familia de tcnicas de estimacin e incluso de
simulacin. As por ejemplo, en caso de conocer E{Z(x)} = m, se emplea el krigeage
simple; a veces se hacen transformaciones no lineales de las variables objeto de estudio:
krigeage lognormal, disyuntivo, indicador, probabilstico, y otras veces se incorpora la
tendencia en caso de existir: krigeage universal. Aqu hemos desarrollado las ecuaciones
del krigeage ordinario.
Si nos centramos en la hiptesis de estacionariedad intrnseca, para que el sistema de
ecuaciones tenga solucin y sea nica, el variograma ha de ser una funcin
condicionalmente definida negativa. Esta condicin proviene del hecho de que la
varianza del krigeage no puede ser negativa, y de la necesidad de existencia de un nico
mnimo global. Ya vimos que la funcin variograma poda ser estimada con el
variograma experimental e(h), pero en la realidad sta se ajusta a una combinacin
lineal de modelos tericos que garanticen la existencia de solucin y su unicidad.
Algunos de estos, estandarizados, se muestran en la fig. n 1.
VARIOGRAMAS TERICOS
Esfrico
Gaussiano
Exponencial
Potencial (a<1)
1.2
1
g
0.8
0.6
0.4
0.2
0
0
50
100
150
200
250
300
h (m)
fig. n 1. Semivariogramas tericos
Los tres primeros corresponden a modelos con capacidad de dispersin espacial

limitada, presentando un valor mximo o meseta de valor igual a C(0). Sus ecuaciones
estandarizadas (divididas por la constante C(0)), son las siguientes:
Modelo esfrico:
t(h) = 1.5 (h/a) - 0.5 (h/a)3, h [0,a]

t(h) = 1 (= meseta), h > a
Modelo exponencial:
t(h) = 1 - exp (-3h/a), h [0,]
Modelo gaussiano:
t(h) = 1 - exp (-3h2/a2), h [0,]

El parmetro a se denomina rango o alcance, y representa la distancia a partir de la cual
no existe similitud estadstica entre las variables (t(a) C(0)).
El cuarto modelo tiene una capacidad de dispersin ilimitada (no presenta meseta), y
corresponde a un modelo monmico de la forma t(h) = hb con b (0,2). Este aparece,
por ejemplo, en el caso de fenmenos no estacionarios, cuando existe una tendencia

lineal (b es cercano a 2).
Si b es igual a cero t(h) = 1, con h > 0. Este modelo representa el efecto pepita puro,
indicativo de fenmenos sin ninguna autocorrelacin espacial.
En la prctica, el efecto pepita aparece combinado con algunos de los modelos
anteriores, originando una discontinuidad en el origen. Este efecto caracteriza, la
influencia de la variabilidad a pequea escala (entre puntos muy cercanos), y es debido
a que las distancias entre las observaciones son demasiado grandes como para percibir
la estructuracin espacial a esta escala.
Vistos los fundamentos sobre los que descansa la geoestadstica, podemos asegurar que
el coste del esfuerzo en trabajo que se necesita para realizar una estimacin mediante
krigeage (determinacin del variograma experimental, su ajuste a una combinacin de
los modelos tericos y resolucin de las ecuaciones), es mucho mayor que el empleado
utilizando otras tcnicas (v.g. inverso de la distancia, triangulacin o polgonos de
influencia). Entonces cabe preguntarse: Hasta qu punto interesa utilizar el krigeage en
la evaluacin de los recursos?
Si tenemos en cuenta que el principal activo de la empresa minera son precisamente
dichos recursos, la respuesta es sencilla: siempre; siempre que al utilizar estas tcnicas,
aprovechemos la informacin disponible de una manera ms eficiente que con el uso de
las tcnicas tradicionales; lo que viene a decir, siempre que exista una ordenacin
espacial de los datos. Y en qu consiste esa eficiencia?: en aprovechar precisamente, la
informacin sobre dicha estructuracin espacial, a la hora de establecer las funciones de
extensin (ii Zi), en vez de crearlas de manera arbitraria, tal como lo hacen los
mtodos clsicos de estimacin.
Si escribimos en forma matricial las ecuaciones del krigeage en trminos de
covarianzas, tenemos: [C] [] = [D], siendo [C] la matriz de covarianzas entre los n
soportes que utilizaremos en la estimacin, ms una fila y una columna de n unos y un
cero para introducir la ecuacin de ligadura. [] es la matriz de los n pesos buscados y
el multiplicador de Lagrange. [D] es la matriz de covarianzas entre el soporte a estimar
y cada uno de los n soportes, y un uno. Reordenando trminos obtenemos:
[] = [C]-1 [D]
Esta sencilla ecuacin muestra que los pesos vienen afectados por la distancia
estadstica [D] en vez de por la distancia geomtrica h. Los pesos se definen por la
estructuracin espacial del fenmeno que a su vez depende de la distancia geomtrica.
En general, cuanto ms alejado est un dato conocido del soporte a estimar, menor ser
la covarianza entre ellos dos, y menor peso se le aplicar a ese dato.
El efecto de la matriz [C]-1 es siquiera ms notable: ajusta los pesos que se obtienen con
[D], la distancia estadstica, para tener en cuenta la posible redundancia entre las
muestras (Srivastava, 1989). De nuevo se trabaja en trminos estadsticos, ya que la
redundancia entre datos depende de no slo de su distancia geomtrica y disposicin
espacial, sino tambin de la continuidad del fenmeno estudiado. Todo ello queda
reflejado en esta matriz.
Si observamos las ecuaciones de la varianza de la estimacin, la varianza del error de
nuestro modelo, podemos deducir que es un buen indicador de la incertidumbre del
error real, al incluir todos los elementos que intuitivamente le relacionamos: nmero y
disposicin espacial de las muestras, y variabilidad del fenmeno.
El modelo planteado por la geoestadstica muestra mayor coherencia que los modelos
clsicos. Es fcilmente perceptible que cuando variamos el tamao del soporte de la
muestra (v.g. de un trozo de testigo a un banco de explotacin), la funcin de
distribucin de la variable (v.g. leyes), cambia. Este hecho lo introduce de forma natural
la geoestadstica mediante la varianza de dispersin, presentada anteriormente. La
variacin de la varianza de la funcin de distribucin de la variable Z sobre el dominio
V, al variar el soporte de v a v, se refleja con el cambio del valor (v,v) a (v,v). Si
ves mayor que v entonces (v,v) ser mayor que (v,v), disminuyendo la varianza de
la distribucin.
El modelo incorpora tambin, la posible anisotropa que pudiera manifestar el fenmeno
estudiado. Cuando establecimos las hiptesis de estacionariedad, escribimos que la
covarianza o el variograma slo dependa del valor de h, distancia entre los soportes
considerados. En realidad h representa un vector, y como tal debe ser interpretado en las
ecuaciones.
De todas estas anotaciones y del hecho cierto del gran desarrollo y utilizacin prctica
de la geoestadstica, se concluye que, en general, los estimadores utilizados por sta,
dan mejores resultados que los estimadores clsicos.
Referencias
CRESSIE, N.A. (1985) Fitting variogram models by weighted least squares. Journal of
the International Asosciation for Matematical Geology, 17, pp. 563-586.
CRESSIE, N.A. (1993) Statistics for spacial data. USA. Jonh Wiley & Sons, INC.
JOURNEL, A.G. y HUIJBREGTS, Ch. J. (1978) Mining geostatistics. London,
Academic Press.
MATHERON, G. (1962) Trait de Gostatistique Applique. Tome 1. Pars, Edit.
Technip.
MATHERON, G. (1963) Trait de Gostatistique Applique. Tome 2. Pars, Editions
Technip.

Geoe Stadi Stica

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Geoe Stadi Stica

Cargado por

Copyright:

Formatos disponibles

FUNDAMENTOS DE GEOESTADSTICA

Fernando Garca Bastante- Universidad de Vigo

El trmino geoestadstica fue acuado por G. Matheron (1962), definindolo como la

= z(xi), y siendo n cualquier nmero entero positivo. Nuestro problema en general es

C{Z(x),Z(x+h)} = C(h), x, x+hD

bien de la hiptesis de estacionariedad intrnseca de la funcin aleatoria (invariabilidad

Var{Z(x+h) - Z(x)} = 2 (h), x, x+hD

(Ntese que bajo la primera hiptesis se cumple la relacin: 2 (h) = 2 [C(0)-C(h)], al

2E(v,V) = E{[ZV-Zv]2}= 2 (v,V) - (V,V) - (v,v) ( es el valor medio de la funcin

fluctuacin esperada de los valores Zvi respecto al valor ZV en V, elevada al cuadrado y

Para la hiptesis de estacionariedad de 2 orden:

Para la hiptesis de estacionariedad intrnseca:

fig. n 1. Semivariogramas tericos

Los tres primeros corresponden a modelos con capacidad de dispersin espacial

t(h) = 1.5 (h/a) - 0.5 (h/a)3, h [0,a]

t(h) = 1 - exp (-3h/a), h [0,]

t(h) = 1 - exp (-3h2/a2), h [0,]

por ejemplo, en el caso de fenmenos no estacionarios, cuando existe una tendencia

También podría gustarte