Está en la página 1de 9

FUNDAMENTOS DE GEOESTADÍSTICA

Fernando García Bastante- Universidad de Vigo

El término “geoestadística” fue acuñado por G. Matheron (1962), definiéndolo como “la
aplicación del formalismo de las funciones aleatorias al reconocimiento y estimación de
los fenómenos naturales”. Dichos fenómenos los caracterizamos por la distribución
espacial de una o más variables (v.g. las leyes de un depósito o las cotas de una
superficie topográfica), que denominamos como variables regionalizadas.

Si z(xi) es el valor de una variable z en un punto xi, intentamos representar la


variabilidad de z en el espacio de interés o dominio D, partiendo del hecho de que la
realidad nos muestra que existe una similitud estadística, una correlación, entre pares de
valores (z(xi), z(xj+h)), al menos cuando la distancia entre ellos (h) no supera un cierto
valor. El interés en representar dicha variabilidad, surge porque nos permite hacer
estimaciones del valor de la variable en los puntos que nos interesen dentro del dominio.

La geoestadística interpreta cada valor z(xi) como una realización particular de una
variable aleatoria Z(xi), y el conjunto de éstas dentro del dominio D, constituye una

función aleatoria (Z(x)={Z(xi), ∀xi∈D}). El problema de caracterizar la variabilidad


espacial de z(x) se reduce entonces, a caracterizar la correlación entre las variables
aleatorias que integran la función aleatoria. Esta función incorpora tanto el carácter
aleatorio que percibimos en la variable, como la estructura espacial de la variabilidad de
los valores que observamos en la realidad.

“Esta interpretación fundamental se justifica a posteriori, si produce soluciones


coherentes y aceptables a los problemas variados que aparecen en la práctica”, (Journel
y Huijbregts, 1978). Al igual que ocurre en el resto de los modelos matemáticos que
intentan reflejar algún aspecto de la realidad, la geoestadística establece un conjunto de
hipótesis, y las desarrolla hasta obtener unas conclusiones. Si éstas se ajustan a lo que
observa en la realidad estipulamos que el modelo es válido.

Cualquier conjunto de n variables de la función aleatoria, localizados en n puntos


diferentes, se caracteriza por su función de distribución de probabilidad múltiple (n-
variable), esto es: Fx1,x2...xn (z1, z2,...zn) = Prob[Z(x1)≤ z1, Z(x2)≤ z2,...Z(xn)≤ zn], con zi
= z(xi), y siendo n cualquier número entero positivo. Nuestro problema en general es
calcular el valor esperado (E{Z(xk)}) de una variable (Z) en un punto de interés (xk),
conocida una realización de la función aleatoria en una serie de puntos (x1,x2...xl con
Z(xi) = zi, i= 1,...l). El problema tiene solución inmediata si conocemos Fx1,x2...xl,xk, mas
como no es el caso (sólo disponemos de una realización de la función aleatoria),
necesitamos establecer una serie de hipótesis que nos permitan cierta inferencia
estadística, y debemos proponer, además, algún criterio de selección del estimador a
utilizar (las hipótesis no permiten el cálculo directo del valor buscado).

Para medir el grado de similitud entre dos variables aleatorias se emplean los momentos
de segundo orden, en particular la función covarianza definida como: C{Z(xi),Z(xj)} =
E{[Z(xi)-m(xi)][Z(xj)-m(xj)]}, representando E{.} la esperanza matemática o valor
esperado como vimos anteriormente, y siendo m(xk)= E{Z(xk)}. Como quiera que la
estimación y utilización de la función covarianza presenta algunos incovenientes, en
geoestadística, se sustituye aquella por la función variograma definida como: 2 γ(xi,xj)
= Var{Z(xi)-Z(xj)}, representando Var la varianza definida como: Var{Z(xi)} =
E{[Z(xi)-m(xi)]2}.

Estos momentos son importantes ya que nos servirán para llevar a cabo la estimación, y
de hecho las hipótesis que vamos a establecer respecto a la función aleatoria son de
estacionariedad de 2º orden (de los dos primeros momentos). En general una función
aleatoria es estrictamente estacionaria, si para cualquier conjunto de n puntos y para
cualquier vector h cumple: Fx1,x2...xn (z1, z2,...zn) = Fx1+h,x2+h...xn+h (z1, z2,...zn), lo que
significa que la función de distribución múltiple es invariante a la translación.

La geoestadística parte bien de la hipótesis de invariabilidad a la translación de los dos


primeros momentos (media y covarianza) de la función aleatoria:

- E{Z(x)} = E{Z(x+h)} = m, ∀x∈D

- C{Z(x),Z(x+h)} = C(h), ∀x, x+h∈D

bien de la hipótesis de estacionariedad intrínseca de la función aleatoria (invariabilidad


a la translación de la función variograma):

- E{Z(x+h) - Z(x)} = 0, ∀x∈D


- Var{Z(x+h) - Z(x)} = 2 γ(h), ∀x, x+h∈D

(Nótese que bajo la primera hipótesis se cumple la relación: 2 γ(h) = 2 [C(0)-C(h)], al


ser: 2 γ(h) = E{[Z(x+h)-Z(x)]2}, y también: C{0,0} = C(0) = γ(∞) = Var{Z(x)}. Bajo
cualquiera de las hipótesis se cumple: 2 γ(0) = 0).

La segunda hipótesis es más general que la primera, y es suficiente para resolver nuestro
problema, utilizando para ello el siguiente estimador, γe(h), de la función variograma
(Matheron, 1962):

2 ⋅ γe (h) ≡
1
∑ [z ( x + h) − z ( x)]2
N (h) N ( h )

en donde N(h) es el número de pares de valores que tenemos separados por el vector h.
Este estimador, al no precisar del conocimiento de la media m, presenta la ventaja de no
ser sesgado a diferencia del estimador de la función covarianza, que sí lo es. También
ocurre que cuando existe en la realidad una pequeña tendencia lineal (E{Z(x)} = m(x)),
el estimador de la covarianza de la función resulta mucho más afectado (con el cuadrado
de la dimensión del dominio), que el del variograma (con el cuadrado de h) (Cressie,
1993).

Consideremos algunos conceptos importantes relacionados con el variograma. Sean V y


v dos soportes (puntos, áreas o volúmenes). El valor esperado del error cuadrático
cometido al estimar el valor medio de la variable regionalizada (ZV) sobre V, con el
valor medio (Zv) sobre v (por ejemplo cuando extendemos o extrapolamos el valor de la
ley obtenido a partir de una pequeña muestra en el frente de una galería, al resto de la
sección de la galería), es lo que se llama varianza de extensión, y su valor es igual a:
σ2E(v,V) = E{[ZV-Zv]2}= 2 Γ(v,V) - Γ(V,V) - Γ(v,v) (Γ es el valor medio de la función
variograma entre los soportes v y V). Según esto, bajo nuestras hipótesis podemos
considerar el variograma como la varianza del error cuando estimamos e igualamos el
valor de una variable (v.g. la ley) en un punto x+h, con el valor de la variable en otro
punto x.

Otro concepto interesante es el de la varianza de dispersión. Si tenemos N soportes vi,


iguales, que conforman un soporte V = ∑ivi, se define aquella (D2(v,V)) como el valor
medio sobre V de la varianza de extensión de v sobre V. Dicho de otro modo, es la
fluctuación esperada de los valores Zvi respecto al valor ZV en V, elevada al cuadrado y
promediada. Se cumple: D2(v,V) = Γ(V,V) - Γ(v,v).

Asumiendo una de las hipótesis de estacionariedad podemos abordar la tarea de


estimación conforme al modelo planteado. Sea ZV(xk) la variable a estimar sobre un
soporte V centrado en xk (ZV(xk) = (1/V) ∫V(xk)Z(x) dx), a partir de un conjunto de n
variables Zv(xi) cuyas realizaciones zv(xi) sobre otro soporte v conocemos; entonces, en
general, Z*k (el estimador de ZV(xk)) será una función de dichas variables. De todas las
funciones existentes nos interesan aquellas que no introduzcan sesgo (E{ZV(xk) – Z*k}
= 0), y también aquellas que nos permitan calcular la varianza de la estimación (σ2k =
E{[ZV(xk) – Z*k]2}, e imponerla la restricción de que su valor sea mínimo. Esto nos
limita la posibilidad de búsqueda a la clase de estimadores lineales. Podemos escribir
Z*k = ∑iλi Zi, llamando Zi = Zv(xi), y siendo λi cada uno de los n pesos que vamos a
calcular con las dos restricciones mencionadas.

De la primera restricción es inmediato que se debe cumplir que: ∑iλi = 1. La segunda


impone que: E{[ZV(xk) – Z*k]2} sea mínimo. Con cualquiera de la hipótesis de
estacionariedad esto implica que la derivada de σ2k respecto a cada λi debe ser igual a 0.
Esto da lugar a un sistema lineal de ecuaciones de manera que si se introduce la
ecuación de ligadura (∑iλi = 1) obtenemos:

• Para la hipótesis de estacionariedad de 2º orden:

∑βλβ C(vα,vβ) – µ = C(vα,V), ∀ α, β = 1 a n

∑βλβ – 1 = 0, con β = 1 a n

Con C(a,b) igual al valor medio de la covarianza cuando un extremo del vector h
recorre el soporte a y el otro el b. El parámetro de Lagrange de la ecuación de
ligadura es µ y el valor de la varianza es: σ2ko = C(V,V) + µ - ∑αλα C(vα,V).

• Para la hipótesis de estacionariedad intrínseca:

∑βλβ Γ(vα,vβ) + µ = Γ(vα,V), ∀ α, β = 1 a n

∑βλ β – 1 = 0, con β = 1 a n
Con Γ(a,b) igual al valor medio del variograma cuando un extremo del vector h
recorre el soporte a y el otro el b. En este caso obtenemos que el valor de la varianza
es: σ2ko = ∑αλα Γ(vα,V) + µ - Γ(V,V).

Estas ecuaciones representan lo que Matheron (1963) denominó Krigeage o Kriging, en


honor de D.G. Krige, un ingeniero de minas que preconizó este procedimiento en los
años 50, trabajando en las minas de oro de África del Sur. Comparando la información
real sobre leyes medias de paneles de explotación, con las estimadas ponderando
muestras próximas a cada panel, con objeto de lograr un estimador óptimo, deducía el
valor de las ponderaciones obligando a que la varianza de la estimación fuese mínima
(Azcárate, 1982).

El krigeage obtiene como resultados los mejores estimadores lineales no sesgados y hoy
en día, el término está referido a toda una familia de técnicas de estimación e incluso de
simulación. Así por ejemplo, en caso de conocer E{Z(x)} = m, se emplea el krigeage
simple; a veces se hacen transformaciones no lineales de las variables objeto de estudio:
krigeage lognormal, disyuntivo, indicador, probabilístico, y otras veces se incorpora la
tendencia en caso de existir: krigeage universal. Aquí hemos desarrollado las ecuaciones
del krigeage ordinario.

Si nos centramos en la hipótesis de estacionariedad intrínseca, para que el sistema de


ecuaciones tenga solución y sea única, el variograma ha de ser una función
condicionalmente definida negativa. Esta condición proviene del hecho de que la
varianza del krigeage no puede ser negativa, y de la necesidad de existencia de un único
mínimo global. Ya vimos que la función variograma podía ser estimada con el
variograma experimental γe(h), pero en la realidad ésta se ajusta a una combinación
lineal de modelos teóricos que garanticen la existencia de solución y su unicidad.
Algunos de estos, estandarizados, se muestran en la fig. nº 1.
VARIOGRAMAS TEÓRICOS
Esférico Gaussiano Exponencial Potencial (a<1)
1.2

0.8


g
0.6

0.4

0.2

0
0 50 100 150 200 250 300
h (m)

fig. nº 1. Semivariogramas teóricos

Los tres primeros corresponden a modelos con capacidad de dispersión espacial


limitada, presentando un valor máximo o meseta de valor igual a C(0). Sus ecuaciones
estandarizadas (divididas por la constante C(0)), son las siguientes:

• Modelo esférico:

γt(h) = 1.5 (h/a) - 0.5 (h/a)3, ∀ h ∈ [0,a]

γt(h) = 1 (= meseta), ∀ h > a

• Modelo exponencial:

γt(h) = 1 - exp (-3h/a), ∀ h ∈ [0,∞]

• Modelo gaussiano:

γt(h) = 1 - exp (-3h2/a2), ∀ h ∈ [0,∞]

El parámetro a se denomina rango o alcance, y representa la distancia a partir de la cual

no existe similitud estadística entre las variables (γt(a) ≃ C(0)).

El cuarto modelo tiene una capacidad de dispersión ilimitada (no presenta meseta), y

corresponde a un modelo monómico de la forma γt(h) = hb con b ∈ (0,2). Este aparece,


por ejemplo, en el caso de fenómenos no estacionarios, cuando existe una tendencia
lineal (b es cercano a 2).

Si b es igual a cero γt(h) = 1, con h > 0. Este modelo representa el efecto pepita puro,
indicativo de fenómenos sin ninguna autocorrelación espacial.

En la práctica, el efecto pepita aparece combinado con algunos de los modelos


anteriores, originando una discontinuidad en el origen. Este efecto caracteriza, la
influencia de la variabilidad a pequeña escala (entre puntos muy cercanos), y es debido
a que las distancias entre las observaciones son demasiado grandes como para percibir
la estructuración espacial a esta escala.

Vistos los fundamentos sobre los que descansa la geoestadística, podemos asegurar que
el coste del esfuerzo en trabajo que se necesita para realizar una estimación mediante
krigeage (determinación del variograma experimental, su ajuste a una combinación de
los modelos teóricos y resolución de las ecuaciones), es mucho mayor que el empleado
utilizando otras técnicas (v.g. inverso de la distancia, triangulación o polígonos de
influencia). Entonces cabe preguntarse: ¿Hasta qué punto interesa utilizar el krigeage en
la evaluación de los recursos?

Si tenemos en cuenta que el principal activo de la empresa minera son precisamente


dichos recursos, la respuesta es sencilla: siempre; siempre que al utilizar estas técnicas,
aprovechemos la información disponible de una manera más eficiente que con el uso de
las técnicas tradicionales; lo que viene a decir, siempre que exista una ordenación
espacial de los datos. ¿Y en qué consiste esa eficiencia?: en aprovechar precisamente, la
información sobre dicha estructuración espacial, a la hora de establecer las funciones de
extensión (∑iλi Zi), en vez de crearlas de manera arbitraria, tal como lo hacen los
métodos clásicos de estimación.

Si escribimos en forma matricial las ecuaciones del krigeage en términos de


covarianzas, tenemos: [C] [λ] = [D], siendo [C] la matriz de covarianzas entre los n
soportes que utilizaremos en la estimación, más una fila y una columna de n unos y un
cero para introducir la ecuación de ligadura. [λ] es la matriz de los n pesos buscados y
el multiplicador de Lagrange. [D] es la matriz de covarianzas entre el soporte a estimar
y cada uno de los n soportes, y un uno. Reordenando términos obtenemos:
[λ] = [C]-1 [D]

Esta sencilla ecuación muestra que los pesos vienen afectados por la distancia
estadística [D] en vez de por la distancia geométrica h. Los pesos se definen por la
estructuración espacial del fenómeno que a su vez depende de la distancia geométrica.
En general, cuanto más alejado esté un dato conocido del soporte a estimar, menor será
la covarianza entre ellos dos, y menor peso se le aplicará a ese dato.

El efecto de la matriz [C]-1 es siquiera más notable: ajusta los pesos que se obtienen con
[D], la distancia estadística, para tener en cuenta la posible redundancia entre las
muestras (Srivastava, 1989). De nuevo se trabaja en términos estadísticos, ya que la
redundancia entre datos depende de no sólo de su distancia geométrica y disposición
espacial, sino también de la continuidad del fenómeno estudiado. Todo ello queda
reflejado en esta matriz.

Si observamos las ecuaciones de la varianza de la estimación, la varianza del error de


nuestro modelo, podemos deducir que es un buen indicador de la incertidumbre del
error real, al incluir todos los elementos que intuitivamente le relacionamos: número y
disposición espacial de las muestras, y variabilidad del fenómeno.

El modelo planteado por la geoestadística muestra mayor coherencia que los modelos
clásicos. Es fácilmente perceptible que cuando variamos el tamaño del soporte de la
muestra (v.g. de un trozo de testigo a un banco de explotación), la función de
distribución de la variable (v.g. leyes), cambia. Este hecho lo introduce de forma natural
la geoestadística mediante la varianza de dispersión, presentada anteriormente. La
variación de la varianza de la función de distribución de la variable Z sobre el dominio
V, al variar el soporte de v a v´, se refleja con el cambio del valor Γ(v,v) a Γ(v´,v´). Si
v´es mayor que v entonces Γ(v´,v´) será mayor que Γ(v,v), disminuyendo la varianza de
la distribución.

El modelo incorpora también, la posible anisotropía que pudiera manifestar el fenómeno


estudiado. Cuando establecimos las hipótesis de estacionariedad, escribimos que la
covarianza o el variograma sólo dependía del valor de h, distancia entre los soportes
considerados. En realidad h representa un vector, y como tal debe ser interpretado en las
ecuaciones.
De todas estas anotaciones y del hecho cierto del gran desarrollo y utilización práctica
de la geoestadística, se concluye que, en general, los estimadores utilizados por ésta,
dan mejores resultados que los estimadores clásicos.

Referencias

CRESSIE, N.A. (1985) — “Fitting variogram models by weighted least squares”. Journal of
the International Asosciation for Matematical Geology, 17, pp. 563-586.

CRESSIE, N.A. (1993) — “Statistics for spacial data”. USA. Jonh Wiley & Sons, INC.

JOURNEL, A.G. y HUIJBREGTS, Ch. J. (1978) — “Mining geostatistics”. London,


Academic Press.

MATHERON, G. (1962) — “Traité de Géostatistique Appliquée”. Tome 1. París, Edit.


Technip.

MATHERON, G. (1963) — “Traité de Géostatistique Appliquée”. Tome 2. París, Editions


Technip.

También podría gustarte