Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Geoestadistica Aplicada PDF
Geoestadistica Aplicada PDF
APLICADA
MARTN A. DAZ VIERA
Instituto de Geofsica, UNAM
Instituto de Geofsica y Astronoma, CITMA, Cuba
e-mail: mdiaz@tonatiuh.igeofcu.unam.mx
2002
NDICE
Pgs.
Captulos
1 INTRODUCCIN 1
2 CONCEPTOS BSICOS 3
3 ANLISIS ESTRUCTURAL 9
4 KRIGING 31
ii
4.8.4 Kriging con mediana suavizada 47
4.8.5 Kriging Residual 49
4.9 Kriging Indicador 51
4.9.1 La Funcin Indicador 52
4.9.2 Variograma Indicador 54
4.9.3 Estimacin de la funcin de distribucin de probabilidad acumulativa 55
4.10 Kriging logartmico 57
5 GEOSTADISTICA MULTIVARIADA 59
5.1 Introduccin 59
5.2 Definiciones de los momentos cruzados de segundo orden 59
5.3 Propiedades de los momentos cruzados de segundo orden 60
5.4 Cokriging en el caso estacionario 60
5.5 Cokriging en el caso de funciones aleatorias intrnsecas 63
5.6 Cokriging en el caso no estacionario 64
5.7 Estimacin de los momentos cruzados de segundo orden 65
5.8 Modelacin de los momentos cruzados de segundo orden 66
5.9 Modelo de corregionalizacin lineal 68
5.10 Anlisis estructural multivariado 69
5.11 Validacin del modelo de semivariograma cruzado 71
5.12 Ejemplos de Aplicaciones del Cokriging 71
5.12.1 El caso de dos variables correlacionadas 71
5.12.2 Estimacin de combinaciones lineales de variables 73
5.12.3 El problema de variables pobremente muestreadas 75
5.13 Modelo de correlacin intrnseco 76
5.14 Anlisis de Componentes Principales basado en el Modelo Lineal de 79
Corregionalizacin
5.15 Dificultades y Aspectos Prcticos del Cokriging 80
5.16 Algunos mtodos alternativos al Cokriging 80
5.16.1 Kriging combinado con Regresin Lineal 80
5.16.2 Kriging con una Deriva Externa 81
5.17 Kriging Factorial 82
5.18 Esquema General del Anlisis de Corregionalizacin 85
5.19 Manejo de procesos espacio-temporales 86
6 SIMULACIN CONDICIONAL 88
6.1 Introduccin 88
6.2 Objetivos de la simulacin 89
6.3 Condicionamiento 90
6.4 Simulacin o estimacin ? 91
6.5 La teora de la simulacin condicional 92
6.6 Mtodos de simulacin de funciones aleatorias ms conocidos 94
6.7 Mtodos del tipo Gaussiano 95
6.8 Mtodo matricial 96
6.9 Mtodo espectral 98
6.10 Mtodo de bandas rotantes 101
6.11 Mtodos secuenciales 103
6.12 Mtodos del tipo Recocido Simulado 104
Anexos
A CONCEPTOS BSICOS DE ESTADSTICA 106
iii
A.2 Estadstica multivariada 116
A.3 Regresin lineal y mnimos cuadrados 122
iv
Martn A. Daz Viera
CAPITULO 1: INTRODUCCIN
1
Martn A. Daz Viera
En resumen, a grosso modo un anlisis geoestadstico est compuesto por tres etapas: (a) el
anlisis exploratorio de los datos, (b) el anlisis estructural y (c) las predicciones (kriging o
simulaciones)
La primera etapa, conocida como anlisis exploratorio de datos, est basada en tcnicas
estadsticas convencionales que nos permiten obtener todo un conjunto de informacin,
desconocida a priori sobre la muestra bajo estudio, que es imprescindible para realizar
correctamente cualquier anlisis estadstico y en particular un anlisis geoestadstico.
2
Martn A. Daz Viera
x = ( x1 , x2 , x3 ) .
aleatoria Z ( x ) .
variable regionalizada Z .
3
Martn A. Daz Viera
{Z ( x ) , Z ( x ) ,..., Z ( x )}
1 2 n se caracteriza por su funcin de distribucin de probabilidad n-
variada:
FZ ( x1 ),Z ( x2 ),...,Z ( xn ) ( z1 , z2 ,..., zn ) = Pr Z ( x1 ) z1 , Z ( x 2 ) z2 ,..., Z ( x n ) zn (2.1)
El conjunto de todas las distribuciones para todo valor de n y para cualquier seleccin de
puntos en \ 3 constituye la ley espacial de probabilidad de la funcin aleatoria Z ( x ) . Esta
lineal resulta suficiente estimar los momentos hasta de segundo orden, no obstante en la
mayora de los casos la informacin disponible no permite inferir momentos de orden
superior.
Momentos de la distribucin de Z ( x )
m ( x ) = E Z ( x ) (2.2)
i) La varianza de Z ( x )
2 ( x ) = Var Z ( x ) = E {Z ( x ) m ( x )}
2
(2.3)
{
C ( x i , x j ) = E {Z ( x i ) m ( x i )} Z ( x j ) m ( x j )
} (2.4)
4
Martn A. Daz Viera
2 ( xi , x j ) = Var Z ( xi ) Z ( x j ) (2.5)
( xi , x j ) =
1
{
E Z ( xi ) Z ( x j ) }
2
(2.6)
2
Se debe notar que tanto la varianza como el variograma son siempre positivos, mientras que
la covarianza puede tomar valores negativos.
Puesto que, como se plante anteriormente, usualmente se trabaja slo con los momentos
hasta de segundo orden resulta prctico limitar la hiptesis de estacionaridad a estos
primeros momentos.
Se dice que una funcin aleatoria es estacionaria de segundo orden si se cumple que:
5
Martn A. Daz Viera
E Z ( x ) = m; x (2.7)
C ( h ) C ( x + h, x ) = E Z ( x + h ) Z ( x ) m 2 (2.8)
2 = C ( 0 ) = Var Z ( x ) (2.9)
En este caso resulta suficiente usar una de las dos funciones para caracterizar la
dependencia espacial.
Existen funciones aleatorias Z ( x ) que representan a fenmenos fsicos que muestran una
capacidad casi ilimitada de variacin, por lo que para estas funciones no estn definidas la
varianza ni la covarianza. Sin embargo existen casos en que sus incrementos o diferencias
Z ( x + h ) Z ( x ) tienen una varianza finita. En otras palabras, esto quiere decir que las
6
Martn A. Daz Viera
E Z ( x + h ) Z ( x ) = 0 (2.12)
Es evidente que una funcin aleatoria estacionaria de segundo orden es siempre intrnseca.
Lo contrario no se cumple. A las funciones que cumplen con la hiptesis intrnseca se les
considera como dbilmente estacionarias.
Las funciones aleatorias no estacionarias son aquellas cuya esperanza matemtica depende
de x :
E Z ( x ) = m ( x ) (2.14)
Z ( x) = m ( x) + R ( x) (2.15)
1
( x + h, x ) = R ( h ) + { m ( x + h ) m ( x )}
2
(2.16)
2
7
Martn A. Daz Viera
x
1
(h) = R (h) + ( m1 h )
2
(2.17)
2
pero crece con el cuadrado de h , lo cual puede servir de indicador para la deteccin de la
existencia de tendencia.
8
Martn A. Daz Viera
( h ) = 12 Var Z ( x ) Z ( x + h ) = 12 E {Z ( x ) Z ( x + h )}
2
(3.1)
9
Martn A. Daz Viera
N ( h)
( h ) = Z ( x + h ) Z ( x i )
2
1
2 N ( h) i (3.2)
i =1
Debido a que ( h ) es esencialmente una media muestral, tiene todas las desventajas
- Es un estimador no paramtrico.
- Es ptimo cuando se dispone de una malla regular de muestreo que sea representativa y
la distribucin sea normal. En estas condiciones el sesgo es el mnimo posible.
- Desviaciones en la distribucin.
- Heterocedasticidad.
10
Martn A. Daz Viera
Se dice que los datos son heterocedsticos, si el diagrama del valor medio m contra la
desviacin estndar , calculadas en vecindades mviles, muestra que la dispersin de
los valores (medidos por ) est relacionada con su magnitud (medida por m ). Por la
tanto, por ser el semivariograma una medida de la dispersin, su magnitud est ligada a
la magnitud de los valores de los datos. Cuando se da este tipo de fenmeno, se dice
que existe un efecto proporcional.
- Desviaciones en el muestreo.
11
Martn A. Daz Viera
Para el cmputo del semivariograma es necesario tener en cuenta algunas reglas prcticas
que permiten elevar la eficiencia y la calidad de la estimacin, independientemente del
tipo de estimador que se utilice.
12
Martn A. Daz Viera
- El largo de los intervalos debe ser elegido de forma tal que el nmero de pares en cada
intervalo sea lo suficientemente grande para que el estimado del semivariograma
sea relativamente estable. Se considera que entre 30 y 50 pares satisfacen este
requerimiento.
- Los valores estimados para cada intervalo se deben graficar contra la distancia
promedio de todos los pares que se encuentran dentro de dicho intervalo.
En sentido amplio se considera por su forma que hay dos tipos principales de
semivariogramas. En el primer tipo, la semivarianza se incrementa con el
incremento del valor absoluto del intervalo |h| hasta alcanzar un valor mximo a partir
del cul se mantiene relativamente constante y oscila alrededor del mismo. Estos
semivariogramas son conocidos como de tipo transitivo. El valor del intervalo a partir del
cual el semivariograma no se incrementa es conocido como alcance o rango (radio de
correlacin) y marca el lmite de la dependencia espacial de la propiedad. La varianza
mxima es conocida como "sill" o meseta del semivariograma y tericamente debe
coincidir con la varianza a priori 2 de la muestra de la funcin aleatoria Z ( x ) .
13
Martn A. Daz Viera
Una variable con este tipo de semivariograma no slo cumple la hiptesis intrnseca, sino
tambin es estacionaria de segundo orden. Esto significa que su valor esperado es
constante
E Z ( x ) = m; x (3.4)
( h ) = C ( h ) C ( 0) = 1 ( h) C ( 0) (3.7)
de la funcin aleatoria Z ( x ) .
necesariamente se anula.
Esto es conocido como efecto "nugget" o pepita, y el valor del semivariograma en cero
( 0 ) es conocido como la varianza "nugget" o microvarianza. En principio esto puede
14
Martn A. Daz Viera
15
Martn A. Daz Viera
C ( x1 , x1 ) C ( x1 , x 2 ) ... C ( x1 , x n )
C ( x 2 , x1 ) C ( x 2 , x 2 ) ... C ( x 2 , x n )
(3.10)
... ... ... ...
C ( x n , x1 ) C ( x n , x 2 ) ... C ( x n , x n )
debe ser definida positiva, es decir, el determinante y todos sus menores principales son
positivos o cero. Aqu las covarianzas estn definidas como
C ( x i , x j ) = Cov Z ( x i ) , Z ( x j ) ; i, j = 1,..., n.
n n n n
Var [Y ] = C ( 0 ) i j i j ( x i , x j ) (3.11)
i =1 j =1 i =1 j =1
n
Si los pesos i suman 0, es decir
i =1
i = 0 entonces:
n n
Var [Y ] = i j ( x i , x j ) (3.12)
i =1 j =1
negativa semidefinida.
16
Martn A. Daz Viera
( h)
lim =0 (3.13)
h h 2
Cuando no se satisface esta condicin puede ser un indicador de que la funcin aleatoria no
sea estacionaria.
Por otro lado de la definicin de semivariograma se infiere que ste debe anularse en el
origen, es decir ( 0 ) = 0 .
Las funciones que cumplen las condiciones anteriores son conocidas como modelos
autorizados del semivariograma.
El hecho de probar si una funcin dada es aceptable o no, est relacionado con el
examen de su Transformada de Fourier. Christakos [1984] obtuvo las condiciones que
el espectro de la funcin debe reunir para ser un modelo autorizado.
Como una propiedad importante se debe destacar que cualquier combinacin lineal de
modelos autorizados es un modelo autorizado.
17
Martn A. Daz Viera
En una dimensin los bloques son simplemente lneas. Supongamos que estos son de
longitud a y la distancia entre sus centros es h. Su solapamiento es entonces ah, el cual,
cuando se expresa como una proporcin de a es 1-(h/a), siendo h a.
(h) = 1 h a (3.14)
S ( h a ) para 0 h a
(h) = (3.15)
S para h>a
Modelo Circular
a2 h h 2
A= cos 1 a h 2 ; para h a (3.16)
2 a 2
Expresado como una fraccin del rea del disco obtenemos la funcin de
autocorrelacin
2 1 h h
( )
2
( h) = cos 1 h (3.17)
a a a
y el semivariograma
18
Martn A. Daz Viera
2
( )
2
1 h 2h h
S
1 cos 1 para 0 h a
(h) =
a a a (3.18)
S para h>a
gradiente=4S/(a)
Modelo Esfrico
gradiente=3S/(2a)
Debe sealarse que el modelo esfrico es apropiado para el caso de tres dimensiones
aunque se puede aplicar para casos de una y dos dimensiones. Lo inverso no se cumple.
El modelo circular slo es apropiado para una y dos dimensiones. El lineal solamente
para el caso unidimensional. Esto se debe a que solamente en estos casos estos modelos
son funciones condicionalmente negativas semidefinidas.
19
Martn A. Daz Viera
Modelo Exponencial
h
(h) = S 1 e r para h0 (3.22)
gradiente = S/r
Modelo Gaussiano
20
Martn A. Daz Viera
sin(h)
(h) = S 1 para h>0 (3.24)
h
Este puede ser usado para representar procesos regularmente continuos y que muestran
un comportamiento peridico, el cual es frecuentemente encontrado, donde existe una
sucesin de zonas ricas y pobres. Es un modelo negativo definido en tres dimensiones.
Modelo Potencia
Su semivariograma es:
1
(h) = h ; para 0 < < 2 (3.27)
2
21
Martn A. Daz Viera
D = 2 ( 2 ) (3.28)
Con frecuencia notamos que muchos semivariogramas aparentan ser de varianza nugget
pura. Esto ocurre porque toda la varianza est dentro de un intervalo de muestreo mas
pequeo.
Se define como:
(h) = k log(h) (3.31)
22
Martn A. Daz Viera
Combinacin de modelos
aleatorias independientes Yi ( x ) ,
n
Z ( x ) = iYi ( x ) (3.32)
i =1
n
C ( h ) = i2Ci ( h ) (3.34)
i =1
Yi ( x ) .
decir
n
Z ( x ) = Yi ( x ) (3.35)
i =1
23
Martn A. Daz Viera
n n
( h ) = Ci ( 0 ) Ci ( h ) (3.37)
i =1 i =1
A partir de estas dos propiedades se pueden encontrar modelos mas complejos mediante la
combinacin de los modelos simples antes estudiados.
Por ejemplo:
( h) = 0 ( h) + 1 (h) + 2 ( h) (3.39)
donde
0 (h) = S0 (1 (h) ) (3.40)
S h h 3
1 3 ; h a1
1 (h) = 2 a1 a1 (3.41)
S1 ; h > a1
24
Martn A. Daz Viera
S h h 3
2 3 ; h a2
2 (h) = 2 a2 a2 (3.42)
S 2 ; h > a2
( ) = ( A2 cos 2 ( ) + B 2 sen 2 ( ) )
1
2
(3.43)
Esta funcin puede ser aplicada como un factor al argumento h de la funcin semivarianzas
en el caso de los modelos transitivos o al gradiente en los modelos no acotados.
En caso de anisotropa si se desea disear una red ptima de muestreo se debe hacer en
forma rectangular haciendo coincidir los lados con las direcciones de los ejes
25
Martn A. Daz Viera
principales y las longitudes de los mismos deben estar en la proporcin , donde el lado
menor le correspondera a la direccin del eje B.
Algunos geoestadsticos ajustan los modelos de forma visual, pero esta prctica no es
fiable y es preferible usar algn procedimiento estadstico para estos fines. Con
frecuencia es usada la aproximacin por Mnimos Cuadrados.
Asume que los residuos estn normalmente distribuidos y son independientes y que las
semivarianzas estimadas poseen igual varianza.
Se evitan muchos de los problemas de los MCO, pero requiere de la inversin de grandes
matrices, lo que hace el procedimiento muy complicado.
donde
26
Martn A. Daz Viera
y estos son actualizados en cada iteracin del proceso cuando (hj, ) es reestimada.
Tericamente esta forma de ponderacin debe dar mejor convergencia y en la prctica se
ha encontrado que as es.
27
Martn A. Daz Viera
Debido a que la cantidad que se encuentra entre llaves en la expresin anterior Ec.(3.47) es
constante ( n ln ( 2 n ) + n + 2 = const ) independientemente del tipo de modelo, entonces
1 n
a)
n i =1
{ Z ( x i ) Z * ( x i )} cercano a 0.
28
Martn A. Daz Viera
1 n
{ Z ( x i ) Z * ( x i )}
2
b) pequeo.
n i =1
1 n Z ( x i ) Z ( x i )
* 2
c) cercano a 1.
n i =1 i
d) La correlacin muestral de Z ( x i ) , Z * ( x i ) sea cercana a 1.
e) La correlacin muestral de Z ( x i ) , {Z ( x ) Z * ( x )}
i i i es cercana a cero.
Siendo:
Z ( x i ) - los valores muestrales de la propiedad en xi,
Mediante el histograma de los errores normalizados se compila una lista con los puntos
que poseen grandes errores. Esto es til para la identificacin de valores atpicos
(outliers), datos sospechosos o anomalas de otra naturaleza.
El procedimiento de leave one out es un caso particular del mtodo conocido como
Jacknifing, ya que de disponer de suficientes datos espacialmente distribuidos de forma
homognea de la funcin aleatoria Z ( x ) , stos se podran dividir en dos muestras: Z1 ( x )
para validarlo. Es decir, se estimaran como en el mtodo anterior los valores empleando
29
Martn A. Daz Viera
30
Martn A. Daz Viera
CAPITULO 4: KRIGING.
El kriging es un trmino que ha sido acuado para designar al "mejor estimador lineal
insesgado" de un punto y al mejor promedio lineal mvil ponderado de un bloque.
Este nombre apareci alrededor de 1960 para nombrar una tcnica creada en Francia por
Matheron a partir de los trabajos de D. G. Krige quin fue probablemente el primero
que hizo uso de la correlacin espacial y del mejor estimador lineal insesgado en el
campo de la evaluacin de yacimientos minerales.
El kriging es una tcnica de estimacin local que ofrece el mejor estimador lineal
insesgado de una caracterstica desconocida que se estudia. La limitacin a la clase de
estimadores lineales es bastante natural ya que esto significa que solamente se requiere
el conocimiento del momento de segundo orden de la funcin aleatoria (la covarianza
o el variograma) y que en general en la prctica es posible inferir a partir de una
realizacin de la misma.
- un valor esperado,
E Z ( x ) = m; x (4.1)
31
Martn A. Daz Viera
C ( h ) = E Z ( x + h ) Z ( x ) m 2 (4.2)
- un variograma
donde al menos uno de estos dos momentos de segundo orden se supone conocido.
considera intrnseca.
casi puntuales, en otros casos son los valores medios ZVi ( x i ) definidos en los soportes
Vi centrados en los puntos xi , donde los n soportes pueden ser todos diferentes.
ZVi ( x i ) = V1i Z ( x ) d x
Vi
Es bueno destacar que bajo la hiptesis de estacionaridad el valor esperado de cada uno de
estos datos es E Z ( x i ) = m, i .
32
Martn A. Daz Viera
n
Z * ( x k ) = i Z ( x i ) ,
i =1
donde Z k* = Z * ( x k ) .
Los n coeficientes i son calculados de manera tal que el estimador sea insesgado y que
- La condicin de insesgadez.
Para obtener un valor esperado del error igual a cero resulta suficiente imponer la
condicin:
n
E Z k* = E i Z ( x i ) = m; (4.4)
i =1
E Z ( x ) = E Z
i =1
i i
*
k (4.5)
33
Martn A. Daz Viera
entonces
n
m = m
i =1
i (4.6)
y finalmente
i =1
i =1 (4.7)
n
F = e2 2 i 1 (4.8)
i =1
donde
e2 - es la varianza de la estimacin,
- un multiplicador de Lagrange.
e2 = Var Z k Z k* = E ( Z k Z k* )
2
(4.9)
34
Martn A. Daz Viera
n
n
e2 = Var [ Z k ] 2Cov Z k , i Z ( xi ) + Var i Z ( xi ) (4.11)
i =1 i =1
desarrollando obtenemos
n n n
e2 = Z2 2 i Z Z + i j Z Z
k k i i j
(4.12)
i =1 i =1 j =1
F n
i
= 2 Z k Zi + 2
j =1
j Zi Z j 2 = 0, i = 1,..., n
(4.13)
F = 1 = 0
n
i =1
i
n
j Zi Z j = Z k Zi , i = 1,..., n
j =1
n (4.14)
=1
i =1
i
35
Martn A. Daz Viera
11 12 ... 1n 1 1 k1
... 2 n 1 2 k 2
21 22
... ... ... ... ... ... = ... (4.16)
n1 n 2 ... nn 1| n kn
1 1 ... 1 0 1
donde ij = Zi Z j
Ntese que bajo la hiptesis intrnseca las covarianzas pueden ser reemplazados por las
semivarianzas, usando la expresin:
ij = 2 ij (4.17)
donde
2 = C( 0) , es la varianza total o a priori de la muestra.
0 12 ... 1n 1 1 k1
... 2 n 1 2 k 2
21 0
... ... ... ... ... ... = ... (4.18)
n1 n 2 ... 0 1| n kn
1 1 ... 1 0 1
36
Martn A. Daz Viera
n
e2 = i ki + (4.19)
i =1
Estas ltimas expresiones resultan ser la formulacin del Kriging ms comn puesto que se
aplica en el caso cuando la variable regionalizada cumple la hiptesis intrnseca la cual es
una condicin menos exigente que la estacionaridad de segundo orden.
- no lineales:
Disyuntivo
Indicador
Probabilstico
- paramtrico:
37
Martn A. Daz Viera
Multigaussiano
Disyuntivo
Lognormal
- no paramtrico:
Simple
Ordinario
Universal
Residual
Indicador
Probabilstico
Sistema de ecuaciones:
n
j ij = i 0 , i = 1,..., n
' '
j =1
n
(4.20)
= m ( x ) m ( x )
0 0
i =1
i i
Estimador:
n
Z 0* = 0 + i Z ( x i ) (4.21)
i =1
Varianza de la estimacin:
38
Martn A. Daz Viera
n
K2 = 00' i i' 0
S
(4.22)
i =1
donde
m( x i ) = E Z ( x i ) es el valor esperado en el punto xi,
Requisitos:
Z ( x) .
4.6.2 Kriging lineal con valor esperado estacionario pero desconocido: Kriging
Ordinario
Sistema de ecuaciones:
n
j ij = 0i , i = 1,..., n
j =1
n (4.23)
=1
i =1
i
Estimador:
n
Z 0* = i Z ( xi ) (4.24)
i =1
Varianza de la estimacin:
39
Martn A. Daz Viera
n
K2 = 00 i i 0 +
O
(4.25)
i =1
Requisitos:
Z ( x) .
Sistema de ecuaciones:
n L
j ij ll ( x i ) = 0i , i = 1,..., n
j =1 l =1
n (4.26)
( x ) = ( x ), l = 1,..., L
i =1
i l i l 0
Estimador:
n
Z 0* = i Z ( x i ) (4.27)
i =1
Varianza de la estimacin:
n L
K2 = 00 i i 0 + ll ( x 0 )
U
(4.28)
i =1 l =1
Requisitos :
40
Martn A. Daz Viera
n
ZV*k = i Z ( x i ) (4.29)
i =1
En las ecuaciones del Kriging puntual el vector del miembro derecho las semivarianzas ij
son reemplazadas por las semivarianzas promedios con respecto al bloque Vk que se
expresan como:
1
V ,i =
k
Ak ( x x )d x
VK
i (4.30)
41
Martn A. Daz Viera
0 12 ... 1n 1 1 Vk ,1
... 2 n 1 2 Vk ,2
21 0
... ... ... ... ... ... = ... (4.31)
n1 n 2 ... 0 1| n Vk ,n
1 1 ... 1 0 1
n
V2 = i V ,i + V ,V
k k k k
(4.32)
i =1
donde
1
Ak2 VK VK
V V =
K K
( x y )d xd y (4.33)
42
Martn A. Daz Viera
o deriva.
Han sido propuestas dos vas del kriging en presencia de deriva no constante :
El primer mtodo es conocido como Kriging Universal (Matheron 1969), mientras que
el segundo es el de las Funciones Aleatorias Intrnsecas de orden k (Matheron 1973).
En este mtodo deben ser conocidos a priori el orden k del polinomio que mejor describe o
explica la tendencia y la funcin de semivarianzas o variograma de la funcin aleatoria
Z ( x ) sin tendencia.
43
Martn A. Daz Viera
Matheron seal (1971) que tales estimadores son sesgados y que a menos que el
variograma de los residuos sea conocido, digamos que a partir de su estimacin en una
direccin donde no se perciba la deriva, el kriging universal tiene serias
dificultades operacionales.
Como ya se ha visto el kriging universal puede ser expresado de manera muy simple. El
problema real es que cuando existe una sola realizacin de la funcin aleatoria no
estacionaria Z ( x ) resulta imposible estimar el variograma. Lo que uno puede hacer
cuales son estacionarios o al menos intrnsecos. Esto significa que la deriva tiene que ser
estimada a partir de los valores muestrales. Aqu comienzan las dificultades.
Debido a que este estimador tiene que ser no sesgado y de varianza mnima uno obtiene
un conjunto de ecuaciones para calcular los coeficientes de la deriva expresada como un
polinomio. Pero para reducir las ecuaciones que dan este estimador ptimo es necesario
conocer el variograma de la funcin aleatoria, lo cual es precisamente el ltimo
propsito del estudio. Sin embargo, un estimador no sesgado simple es valido y puede
ser derivado a partir de los mtodos de mnimos cuadrados del anlisis de superficie de
tendencia.
44
Martn A. Daz Viera
Se puede ver que en la estimacin del variograma es donde est la clave del problema. No
hay solucin directa conocida, uno puede solo hacer un conjunto de suposiciones y
tratar de verificarlos mediante el mtodo de prueba y error, por lo que entonces el
Kriging Universal se transforma en un procedimiento heurstico.
Los coeficientes del polinomio de la deriva son estimados haciendo una suposicin
del tipo del variograma R ( h ) .
Con los coeficiente de la deriva podemos obtener los residuos R ( x i ) en los puntos
muestrales xi .
45
Martn A. Daz Viera
algoritmo es simple, pero desde el punto de vista prctico puede consumir una gran
cantidad de tiempo y no ofrece ninguna garanta de que exista convergencia.
Otro criterio que permitira discriminar en qu medida son correctos o no los supuestos del
procedimiento podra ser el empleo del mtodo de validacin cruzada (ver seccin 3.del
modelo (combinacin de variograma y deriva) que se obtiene en cada paso. En este sentido
una eleccin razonable sera tomar el modelo que arroje el mejor resultado en trminos de
los estadgrafos (valor medio y desviacin estndar) de los errores Z ( xi ) Z * ( xi )
producto de la validacin cruzada de los valores estimados Z * ( x i ) con los valores reales
Z ( x i ) de la muestra.
c) el orden k de las diferencias tiene que ser adivinado (se toma usualmente 2).
d) los efectos de frontera conducen a una reduccin drstica de aquellos puntos que
pueden ser estimados por este mtodo.
46
Martn A. Daz Viera
El enfoque de trabajo propuesto es dejar que la posicin espacial de los datos determine la
escala de variacin (la deriva es a gran escala). Esto concuerda con el anlisis
exploratorio de datos, en que las decisiones sobre el modelo se basan ms en lo que se
ve que en lo que pudiera haberse visto.
Se puede ajustar con exactitud una superficie a travs de los puntos observados, pero
hay poco poder predictivo en este enfoque. Se quiere extraer la deriva aparente y tratar de
modelar el resto mediante estacionaridad dbil.
Los residuos son tomados como datos originales y se realiza el mismo proceso :
47
Martn A. Daz Viera
y as sucesivamente.
Cressie (1984) sugiri que el ajuste ij en la localizacin (i,j) sea obtenido mediante la
mediana de los valores observados:
ij = a + ri + cj
Rij = Zij ij
donde :
ri - efecto fila, cj - efecto columna, Rij - residuos.
Zij = ij + Rij
donde:
ij - es la deriva estimada por la interpolacin mediante Mediana suavizada.
Rij - es una variable regionalizada (error de la estimacin).
48
Martn A. Daz Viera
La hiptesis principal del kriging residual propuesto por Gambolati y Volpi (1978 y 1979)
consiste en considerar conocido el orden de la deriva o tendencia m(x), la cual se estima
usando mnimos cuadrados ordinarios m*(x), y a partir de sta se obtienen los residuos R(x)
a los que se le aplica el kriging ordinario.
49
Martn A. Daz Viera
directo.
Existen otras modificaciones, como la de Samper (1986), propuestas al mtodo del kriging
residual que consisten esencialmente en estimar la matriz de covarianzas no a partir del
variograma muestral, sino directamente a partir de los residuos. Para efectos prcticos, estas
modificaciones pueden convertir al procedimiento en impracticable. Incluso, en la mayora
de los casos resulta suficiente la estimacin con mnimos cuadrados ordinarios, obviando
los pasos 6-10 del algoritmo anterior.
50
Martn A. Daz Viera
La mayor diferencia entre estos dos tipos de estimadores est en el estimado de las
variables y en los tipos de datos usados. Una variable aleatoria puede ser definida en
cada y cualquier locacin xi dentro de la regin de inters. El conjunto de estas variables
aleatorias determina una funcin aleatoria. Como un conjunto de variables aleatorias,
la funcin aleatoria expresa el comportamiento local y regional de la variable de
inters. En un punto dado en el espacio, la funcin aleatoria Z ( x ) es una variable
Debido a que los datos son de slo una realizacin y porque cualquier propiedad de la
funcin aleatoria no puede ser inferida a partir de una realizacin simple sin un modelo,
un supuesto de estacionaridad debe ser incluido en el modelo para permitir la
inferencia de las propiedades de la funcin aleatoria. El tipo de estacionaridad invocada
para la estimacin no paramtrica de distribuciones espaciales es la estacionaridad de la
distribucin bivariada de Z ( x ) y Z ( x + h ) para varios valores del vector de distancia
h , que es:
FZ ( x1 ),Z ( x2 ) ( z1 , z2 ) = Fx , x + h ( z1 , z2 ) = Fh ( z1 , z2 ) (4.34)
51
Martn A. Daz Viera
magnitud del vector h que separa a estas variables aleatorias y no depende de las
localizaciones particulares: x1 = x y x 2 = x + h .
donde
( A, zc ) - es la distribucin espacial de valores puntuales dentro de la regin A para
un valor umbral zc , es decir la proporcin de valores dentro de la regin A menores que
1, si Z ( x) zc
i ( x, zc ) = (4.36)
0, si Z ( x) > zc
donde
Z ( x ) - es el valor observado en el punto x ,
52
Martn A. Daz Viera
1
( A, zc ) = I ( x, zc ) d x
A xA
(4.37)
donde
I ( x, zc ) - es la funcin indicador aleatoria definida como:
1, si Z ( x) zc
I ( x, zc ) = (4.38)
0, si Z ( x ) > zc
1 1
E [ ( A, zc ) ] = E I ( x, zc ) d x = E [ I ( x, zc ) ] d x (4.39)
A xA A xA
1
E [ ( A, zc ) ] =
A xA
{(1) Pr [ Z ( x) zc ] + (0) Pr [ Z ( x) > zc ]}d x (4.40)
E [ ( A, zc ) ] = Pr [ Z ( x) zc ] = FZ ( zc ) (4.41)
donde
FZ ( zc ) - funcin de distribucin acumulativa univariada de Z estacionaria.
La funcin de distribucin espacial ( A, zc ) puede ser vista como una realizacin de una
indicador en los puntos muestrales i ( x, zc ) , ser la misma con slo dos valores 0 y 1. Si
el valor observado es menor que el valor de corte, el valor indicador ser 1, en caso
contrario, este ser 0. Claramente, la variable indicador i ( x, zc ) , cambiar con el
53
Martn A. Daz Viera
incremento del valor de corte. Ms muestras tienen valores menores que el valor de corte,
por lo tanto mas variables indicador tienen el valor 1.
(4.43)
= Fx , x + h ( zc , zc ) { FZ ( zc )}
2
c) varianza
Var [ I ( x, zc )] = C ( 0, zc ) = FZ ( zc ) [1 FZ ( zc )] (4.44)
d) y la funcin de dsemivarianzas
I ( h, zc ) = CI ( 0, zc ) CI ( h, zc ) = FZ ( zc ) Fx , x + h ( zc , zc ) (4.45)
i ( x, zc ) = 1, Z Z max
(4.46)
I (h, zc ) = 0, Z Z max
54
Martn A. Daz Viera
Los variogramas de indicador I (h, zc ) son estimados para cada valor de corte dado zc , de
El propsito de transformar los datos originales mediante las variables indicador es para
usar las variables indicador para estimar la funcin de probabilidad acumulativa
FZ ( zc ) . Las funciones de probabilidad estimadas * ( A, zc ) se obtienen mediante
combinaciones lineales de la funcin indicador. Esta funcin es la proporcin exacta de
valores, dentro de cualquier rea A, de una variable Z ( x ) , menores que el valor de corte
como la probabilidad de que un parmetro estimado sea menor que el valor de corte.
( z ) = 1
=1
c (4.51)
55
Martn A. Daz Viera
El kriging simple puede ser aplicado para hallar los pesos usando las variables
indicador i ( x, zc ) y el variograma indicador.
y
1
A2 A A
I ( A, A, zc ) =
I ( x y, zc )d xd y (4.54)
Para cada regin, * ( A, zc ) es una funcin del valor de corte zc . Si es aplicada una serie
de valores de corte, ser obtenida una serie de estimados. Con el incremento del valor de
corte, * ( A, zc ) se incrementa, debido a que el porcentaje de los puntos con valores
a) * ( A, ) = 0, y * ( A,+ ) = 1,
b) 0 * ( A, zc ) 1 A, zc
c) * ( A, zc ) no es decreciente, es decir
* ( A, zc ) * ( A, zc' ) si zc zc'
56
Martn A. Daz Viera
Las ecuaciones del Kriging indicador se resuelven en la prctica para un nmero finito N ,
usualmente menor que 10, de valores de corte zc . Si la estimacin de cada valor de
cumple esta condicin se requiere realizar una transformacin sobre Z ( x ) de manera tal
que siga una distribucin normal. Por fortuna los estimadores asociados a la distribucin
normal son bastante robustos, es decir que su propiedad de optimalidad no se ve
fuertemente afectada en el caso en que la distribucin se aleje ligeramente de la normal.
57
Martn A. Daz Viera
3.- Aplicar las ecuaciones del Kriging a la variable Y para obtener Y * y Var [Y Y *] .
y su varianza
~
Existen las siguientes dificultades segn Journel y Huijbregts (1978). En la prctica Z no
siempre satisface la condicin de sesgo nulo, ya que puede diferir fuertemente de la media
obtenida a partir de las valores observados de Z. Para evitar esta dificultad se propone el
estimador
1 2
Z = K exp Y * + KY (4.57)
2
~
donde K se determina imponiendo que la media aritmtica de los valores estimados de Z
coincida con el valor esperado mZ .
58
Martn A. Daz Viera
5.1 Introduccin.
Las aplicaciones que han recibido una mayor atencin en la geoestadstica de minas son los
casos donde dos o ms variables estn muestreadas, pero una est menos muestreada que
las otras o existe la presencia de errores de muestreo.
Bajo la hiptesis de estacionaridad de segundo orden, se puede definir para cada par de
variables Zi ( x ) y Z j ( x ) la covarianza cruzada como:
{
Cij ( h ) = E Z i ( x + h ) mi Z j ( x ) m j } (5.1)
ij ( h ) =
1
{ }
E Z i ( x + h ) Z i ( x ) Z j ( x + h ) Z j ( x )
2
(5.2)
59
Martn A. Daz Viera
En el caso en que la covarianza cruzada Cij ( h ) sea simtrica, entonces resulta sta
equivalente al semivariograma cruzado.
Cij ( 0 )
ij = (5.8)
Cii ( 0 ) C jj ( 0 )
60
Martn A. Daz Viera
{Zi }i =1
n
Esto quiere decir que son funciones estacionarias de segundo orden
conjuntamente.
m n
Z i* ( x ) = ijk Z j ( x k ) (5.11)
k =1 j =1
convierte en:
m
Z
*
( x ) = k Z ( x k ); donde k = ijk (5.12)
k =1
Para que Z
*
( x) sea un estimador no sesgado de Z ( x ) se debe cumplir que:
k =1
k
=I (5.13)
k
ij = ij =
1, i = j
(5.14)
k =1
Se toma que la varianza de la estimacin sea:
{ }
n T
Var Z *j ( x ) Z j ( x ) = E Z ( x ) Z ( x ) Z ( x ) Z ( x )
* *
(5.15)
j =1
61
Martn A. Daz Viera
m
j C ( xi x j ) + = C ( x i x )
j =1
m (5.16)
= I,
k
i = 1,..., m
k =1
K = D (5.18)
Donde
C ( x1 x1 ) ... C ( x1 x m ) I
... ... ... ...
K = (5.19)
C ( x m x1 ) ... C ( x m x m ) I
I ... I 0
1 C ( x1 x )
... ...
= , D= (5.20)
C ( x m x )
m
I
62
Martn A. Daz Viera
Observaciones prcticas:
( )
- A pesar de la asimetra de C x y , la matriz de coeficientes K es simtrica.
- Todas las entradas son invertibles (excepto 0 ) de forma tal que puede ser reducida a una
matriz triangular mediante la operacin con matrices de menor dimensin y as simplificar
el cmputo.
( )
- Si C x y tiene forma diagonal, es decir, las componentes no estn
correlacionadas entonces el sistema se convierte en n sistemas de ecuaciones
independientes separadas.
Como con el Kriging de una variable es ms simple usar covariogramas que covarianzas
cruzadas, pero esto no siempre es posible; la hiptesis intrnseca anloga es:
i) E Z i ( x + h ) Z i ( x ) = 0 , i=1,, n
( h ) = ij ( h ) =
1
2
{
E Z ( x + h ) Z ( x ) Z ( x + h ) Z ( x )
T
} (5.23)
( x1 x1 ) ... ( x1 x m ) I 1 ( x x1 )
... ... ... ... ... ...
x x = (5.24)
( m 1 ) ... ( x m x m ) I m ( x x m )
I ... I 0 I
La varianza de la estimacin se expresa como:
63
Martn A. Daz Viera
( x x1 )
...
CK
2
= Tr 1 ... m (5.25)
( x xm )
I
1, i = i0 , j = j0
B = bij ; donde bij =
0, en otro caso
y escribiendo Fl ( x j ) = f l ( x j )I entonces la expresin anterior se convierte
m
j =1
j
Fl ( x j ) = Fl ( x); l = 1,..., p (5.28)
64
Martn A. Daz Viera
m p
j C ( xi x j ) + l Fl ( x ) = C ( xi x )
j =1 l =1
m (5.29)
F ( x ) = F ( x ) ; l =1,...,p i =1,...,m
j =1
j l j l
En forma matricial
C ( x1 x1 ) ... C ( x1 x n ) F1 ( x1 )... Fp ( x1 )
... ... ... ... ... ...
C ( x n x1 ) ... C ( x n x n ) F 1 ( x n ) ... Fp ( x n )
W= (5.30)
F1 ( x1 ) ... F 1( xn ) 0 ... 0
... ... ... ... ... ...
Fp ( x1 ) ... Fp ( x n ) 0 ... 0
1 C ( x1 x)
... ...
C ( x n x )
X = ,
n
H = F ( x) (5.31)
1
1
... ...
Fp ( x)
p
WX =H (5.32)
1 N (h)
( h) =
*
ij [ Zi ( x k + h) Zi ( x k )] Z j ( x k + h) Z j ( x k )
2 N (h) k =1
(5.34)
a una distancia h = h .
65
Martn A. Daz Viera
El cual es una generalizacin del estimador del semivariograma simple y por lo tanto
adolece de los mismos problemas y limitaciones.
Es una prctica muy comn ajustar modelos desarrollados para una variable como son:
esfrico, exponencial, etc, al semivariograma cruzado, aunque en este caso no se pueda
asegurar que estos modelos sean vlidos.
Myers (1984), propuso una metodologa para el ajuste de los semivariogramas cruzados, la
cual consiste en definir para cada par de variables Z i ( x) y Z j ( x) una nueva variable como
una combinacin lineal de stas, es decir:
Z ij+ ( x) = aZ i ( x) + bZ j ( x) (5.35)
ij+ (h) =
1
2
{
E aZ i ( x + h) + bZ j ( x + h) aZ i ( x) bZ j ( x)
2
} (5.36)
= a 2 ii (h) + b 2 jj ( h) + 2ab ij (h)
entonces
1
ij (h) = ij+ (h) a 2 ii (h) b 2 jj (h) (5.37)
2ab
Z ij ( x) = aZ i ( x) bZ j ( x) (5.38)
ij (h) =
1
2
{
E aZi ( x + h) bZ j ( x + h) aZi ( x) + bZ j ( x)
2
} (5.39)
= a 2 ii (h) + b 2 jj ( h) 2ab ij (h)
y por lo tanto
1
ij (h) = ij (h) a 2 ii (h) b 2 jj (h) (5.40)
2ab
1
ij (h) = ij+ (h) ij (h) (5.41)
4ab
66
Martn A. Daz Viera
2
ij+ (h) ii (h) jj (h) (5.42)
donde
ij+ (h) - es el semivariograma de la suma de Zi y Zj.
ii (h) y jj (h) - son los semivariogramas de Zi y Zj respectivamente.
En resumen, para modelar el variograma cruzado hay que calcular los variogramas
muestrales para Zi, Zj , Zi+Zj y ZiZj. Para cada miembro de la cuarteta se selecciona uno
de los modelos estndar tales como: esfrico, exponencial, gaussiano, etc., entonces el
modelo para ij (h) se determina como una combinacin de stos usando la expresin
anterior, pero con la condicin de que satisfaga la desigualdad de Cauchy-Schwartz. En el
caso en que no se cumpla esta condicin ltima se deben realizar modificaciones a cada
uno de los modelos ajustados a ii (h), jj (h), ij+ (h) y ij (h) ,de manera tal que sta sea
satisfecha.
La condicin que se requiere para que el modelo sea vlido es la anloga al caso
univariado, es decir
i C ( xi x j ) j 0
T
(5.43)
i j
67
Martn A. Daz Viera
S
Z ( x ) = Ak Y k ( x ) (5.48)
k =0
S p
Z i ( x ) = aijk Y jk ( x ); i = 1,.., n (5.49)
k = 0 j =1
Una va para determinar los coeficientes del modelo de corregionalizacin lineal (MCL), a
partir de un modelo multivariado de funciones de covarianzas anidadas es mediante la
aplicacin del mtodo de componentes principales basado en la descomposicin en valores
propios de las matrices de corregionalizacin V k .
68
Martn A. Daz Viera
Por definicin, una matriz V k es positiva semidefinida (Golub y Van Loan, 1989) si
T
b V k b 0, b (5.50)
donde b es un vector cualquiera. Cuando una matriz es positiva semidefinida sus valores
propios y los determinantes de ella y de todos sus menores principales son no negativos.
S S
C ( h ) = V k k ( h ) Cij ( h ) = ijk k ( h ) (5.51)
k =0 k =0
El nombre de modelo lineal de corregionalizacin se origina del hecho de que las matrices
de covarianzas o semivarianzas de las Ecs. (5.51) y (5.52) se obtienen considerando la
transformacin lineal de funciones aleatorias Ec.(5.48).
69
Martn A. Daz Viera
Una condicin suficiente para que el modelo de corregionalizacin lineal sea vlido
consiste en que todas las matrices de corregionalizacin V k sean positivas semidefinidas.
11k > 0 y 22
k
> 0, k = 0,..., S
(5.55)
12k 11k 22
k
, k = 0,..., S
70
Martn A. Daz Viera
Goulard (1989) y Goulard y Voltz (1992), propusieron un algoritmo iterativo para el ajuste
de los coeficientes mediante mnimos cuadrados bajo restricciones de positividad.
Supongamos que tenemos dos variables que son estacionarias de segundo orden, entonces
se cumple que:
71
Martn A. Daz Viera
C12 ( x y ) = E Z1 ( x) Z 2 ( y ) (5.57)
n
Z ( x) = k Z ( x k )
*
(5.58)
k =1
n 2
Z i* ( x) = ijk Z j ( x k ), i = 1, 2 (5.59)
k =1 j =1
11k 12k n
donde k = k k
, =I, I - matriz identidad.
21 22
k
k =1
n 0, i j
k
ij = ij =
1, i = j
(5.60)
k =1
C11 ( x y ) C12 ( x y )
C ( x y) = (5.61)
C21 ( x y ) C22 ( x y )
72
Martn A. Daz Viera
K = D (5.64)
2 n
CK
2
j
= C jj (0) C
i =1 k =1
ij ( x x k )ijk jj (5.65)
Otro enfoque consiste en estimar cada variable y luego construir la combinacin lineal.
Este puede ser llevado a cabo mediante la estimacin de cada variable por separado o
mediante la estimacin conjunta por Cokriging. La diferencia de estos mtodos se refleja
en las varianzas de la estimacin.
a) Estimacin directa.
T
El objetivo es estimar la combinacin lineal W ( x) = A Z ( x) considerndola como una
nueva funcin aleatoria.
73
Martn A. Daz Viera
b) Estimacin conjunta.
Una condicin suficiente para que coincidan ambos estimadores es que se cumpla:
T T
j A = j A , j (5.71)
74
Martn A. Daz Viera
c) Comentarios generales
En contraste con los problemas donde el inters es estimar varias funciones aleatorias
simultneamente mediante el uso del estimador Cokriging para todas las variables en
todas las ubicaciones muestrales, pocas veces los datos muestrales en otras variables es
usado para mejorar la estimacin de la variable primaria o ms comnmente para
compensar muestras perdidas de la variable primaria.
Deseamos estimar Z1 ( x1 ) usando todos los datos disponibles suponiendo que (h) es
conocido.
El estimador lineal del cokriging Z1* ( x1 ) puede ser escrito en la forma usual:
n
Z 1 ( x1 ) = k Z ( x k )
* 1
(5.73)
k =1
75
Martn A. Daz Viera
11k
1
donde k = ... y se requiere que 111 = 0. La condicin de universalidad est dada por:
1km
1
n 0
k =
1
(5.74)
k =1 ...
0
C ( h) = V ( h) (5.75)
donde V es la matriz de covarianzas cruzadas en h = 0 , es decir
ij = Cij ( 0 ) = Cov {Zi ( x ) , Z j ( x )} = E ( Z i ( x ) mi ) ( Z j ( x ) m j ) (5.76)
y ( h ) es la funcin de correlacin directa.
Cij ( h )
ij ( h ) = (5.77)
Cii ( h ) C jj ( h )
y empleando el modelo de covarianzas cruzadas introducido en la Ec. (5.75), es decir,
Cij ( h ) = ij ( h ) (5.78)
entonces resulta que el coeficiente de correlacin entre dos funciones aleatorias Z i ( x ) y
Z j ( x ) est dado por
ij ( h ) ij
rij = = (5.79)
ii ( h ) jj ( h ) ii jj
76
Martn A. Daz Viera
y no depende de la escala espacial. Por este motivo, el modelo propuesto es conocido como
modelo de correlacin intrnseco.
ij ( h )
ccij ( h ) = (5.80)
ii ( h ) jj ( h )
77
Martn A. Daz Viera
Sean 1 2 ... n > 0 los valores propios y q1 , q 2 ,..., q n los correspondientes vectores
T
propios asociados de la matriz V , donde se cumple que q i q j = ij . Las mayores varianzas
estn directamente relacionadas con los mayores valores propios i de la matriz de
covarianzas de los datos V ,
n p
Z2 = Tr V = ii = j (5.83)
i =1 j =1
por los que se escogen las primeras p componentes ordenadas de mayor a menor en orden
decreciente del por ciento de la varianza total que explican.
donde qij es la componente i del vector propio q j y j es el valor propio asociado a ste.
YY = BZY = BZ ( BZ ) = BZ Z B
T T T T T
(5.89)
aplicando el operador valor esperado a ambos miembros se obtiene
E YY = BE Z Z B
T T T
(5.90)
T
D = BV B (5.91)
78
Martn A. Daz Viera
Una vez conocidos los valores de las componentes Y j ( x ) en los puntos de medicin
usando Ec.(5.88), se puede estimar sus valores en cualquier otro punto usando Kriging
ordinario y a partir de stos se obtienen los valores estimados de las variables originales
Z i ( x ) empleando la Ec. (5.82).
Los valores estimados de las componentes principales Y jk* ( x ) son obtenidos mediante la
aplicacin de Cokriging y pueden ser graficados como mapas.
79
Martn A. Daz Viera
La mayora de los problemas encontrados en la prctica del Cokriging son los mismos
que los encontrados en la prctica del Kriging pero quizs magnificados por el
nmero de variables incorporadas, por una parte, exigiendo un tiempo de clculo
considerable en la modelacin de los semivariogramas cruzados mediante la modelacin y
validacin de mltiples semivariogramas y por otra en la estimacin de las variables
debido al aumento de la complejidad de los sistemas de ecuaciones a resolver.
Z ( x ) = aY ( x ) + b (5.94)
donde a y b son los parmetros de la recta de regresin determinados a partir de l pares de
datos {Z ( x i ) , Y ( x i )} si las variables regionalizadas Z y Y estn muestreadas en l puntos
simultneamente, y adems consideremos que Z est muestreada en los l puntos mientras
que Y en m puntos, donde m>l, es decir Y est ms densamente muestreada que Z.
Entonces podemos estimar a Z en los m-l puntos restantes a travs de Y usando el modelo
de regresin lineal anteriormente obtenido como sigue:
Z ( x j ) = aY ( x j ) + b, j = l + 1,..., m (5.95)
y las varianzas de los errores de la prediccin por regresin estn dadas por
(Y j Y ) ,
2
1
2j = e2 + N j = l + 1,..., m (5.96)
N
( Yi Y )
2
i =1
80
Martn A. Daz Viera
N
1 1 N
Yi , ( Z i aY j b ) ,
2
donde Y = e2 =
N i =1 N 2 i =1
Con los l datos originales de Z se estima el variograma y usando todos los m datos se
realiza mediante Kriging su estimacin espacial.
Para su aplicacin se requiere que el valor esperado de una variable Z sea una funcin
lineal conocida dependiente de otra variable Y, como sigue:
E Z ( x i ) Y ( x i ) = c1Y ( x i ) + c2 (5.97)
donde c1 y c2 son dos constantes, que no se requieren conocer.
Adems se necesita que la segunda variable Y haya sido muestreada en un gran nmero de
puntos y que ofrezca una informacin bastante buena acerca de la estructura de correlacin
de la primera variable Z.
N
Z * ( x k ) = i Z ( x i ) (5.98)
i =1
sesgo nulo
E Z * ( x k ) Z ( x k ) Y ( x k ) = 0 (5.99)
y varianza del error mnima
{
min E Z * ( x k ) Z ( x k ) Y ( x k ) = 0
2
} (5.100)
obtenemos:
N
jij + 1 + 2Y ( x i ) = ik , i = 1,..., N
j =1
N
j = 1 (5.101)
j =1
N
jY ( x j ) = Y ( x k )
j =1
81
Martn A. Daz Viera
N
e2 = Var Z * ( x k ) Z ( x k ) Y ( x k ) = iik + 1 + 2Y ( x k ) (5.102)
i =1
R ( x i ) = Z ( x i ) c1Y ( x i ) c2 (5.103)
Ne
C ( h ) = D ge ( h )
e
(5.104)
e =1
o equivalentemente
Ne
Cij ( h ) = Dije g e ( h ) (5.105)
e =1
son matrices n n positivas definidas que en principio deben ser conocidas. Esta
descomposicin obedece a su vexz a la descomposicin de cada variable Zi ( x ) como la
suma de una serie de factores Fi e ( x ) , es decir
Ne
Z i ( x ) = Fi e ( x ) + mi ( x ) (5.106)
e =1
82
Martn A. Daz Viera
D e g ( h ) , si e = e
E Fi e ( x + h ) Fi e ( x ) = ij e (5.107)
0, si e e
Estos factores se expresan como combinaciones lineales de una serie de variables Y je ( x )
independientes entre s
m
Fi e ( x ) = aijeY je ( x ) (5.108)
j =1
e T
D = Ae Ae , e = 1,..., N e (5.109)
e
que siempre es factible puesto que las matrices D son positivas definidas. Las variables
Zi ( x ) se relacionan con las componentes Y je ( x ) mediante
Ne m
Z i ( x ) = aijeY je ( x ); i = 1,.., n (5.110)
e =1 j =1
Las componentes Yke ( x ) pueden estimarse mediante Kriging ordinario a partir de los datos
de las variables originales Zi ( x ) , es decir
n N
Yke ( x 0 ) = ie Z i ( x ); k = 1,.., m; e = 1,..., N e (5.111)
i =1 =1
n N e
j Cij ( x x ) + i = aik g e ( x x 0 ) , i = 1,..., n
e e
j =1 =1
N (5.112)
e = 0,
i = 1,..., N
=1
83
Martn A. Daz Viera
n n N N n N (5.113)
= 1 + Cij ( x x ) 2 a g e ( x x 0 )
e
i
e
j
e
i
e
ik
i =1 j =1 =1 =1 i =1 =1
84
Martn A. Daz Viera
Se ajusta un Modelo de
NO Corregionalizacin Lineal (MCL)
Existe correlacin S
Intrnseca? C ( h ) = V k k ( h )
k =0
SI
85
Martn A. Daz Viera
86
Martn A. Daz Viera
87
Martn A. Daz Viera
6.1 Introduccin
funcin aleatoria Z ( x ) . Esta funcin aleatoria Z ( x ) puede ser caracterizada por una
mismas propiedades estadsticas que se esperan que posea la funcin aleatoria Z ( x ) . Pero
cuando ms lo que podemos hacer es inferirlas a travs de una sola realizacin o muestra de
la funcin aleatoria, entonces lo que se hace es intentar obtener realizaciones simuladas
Z S ( x ) que sean estadsticamente equivalentes a la muestra que se posee de la funcin
aleatoria.
La equivalencia estadstica en un sentido estricto significa que todas las realizaciones
Z S ( x ) tengan la misma distribucin de probabilidad de la funcin aleatoria Z ( x ) que se
simula, pero en la mayora de los casos nos tenemos que conformar con que al menos
posean los mismos momentos de primer y segundo orden que inferimos a partir de una
muestra de Z ( x ) .
fenmeno regionalizado Z ( x ) .
88
Martn A. Daz Viera
Una idea simple es simular esta realidad en base a un modelo, por lo que la realidad y
la simulacin son variables diferentes de un mismo fenmeno.
probabilidad o por sus dos primeros momentos, los cuales son estimados a partir de
datos experimentales.
89
Martn A. Daz Viera
6.3 Condicionamiento
Existe un nmero infinito de realizaciones que cumplen con la condicin de que sus valores
simulados coinciden con los valores experimentales, es decir
Z SC ( xi ) Z M ( xi ) ; i = 1,..., n (6.1)
donde Z M ( xi ) es el valor muestral de la funcin aleatoria Z ( x ) en el punto x i .
suficiente de datos muestran una tendencia local entonces la simulacin condicional que
est basada incluso en un modelo estacionario reflejar la tendencia local en la misma zona.
90
Martn A. Daz Viera
Los fenmenos simulados tienen los mismos valores experimentales en las localizaciones
muestrales y tienen las mismas medidas de dispersin (al menos hasta de orden 2) que
el depsito real.
Z * ( x ) el cual es tan cercano como sea posible del valor real desconocido Z ( x ) .
min E {Z * ( x ) Z ( x )}
2
(6.3)
x
91
Martn A. Daz Viera
debe estar condicionada a los datos experimentales o sea que en los puntos
experimentales los valores simulados deben coincidir con los valores observados.
Z SC ( xi ) Z M ( xi ) ; i = 1,..., n (6.4)
desconocido
Z ( x ) = Z K* ( x ) + {Z ( x ) Z K* ( x )} (6.5)
92
Martn A. Daz Viera
valores interpolados
( )
E Z K* y {Z ( x ) Z K* ( x )} = 0; x, y (6.6)
datos {Z ( x ) , i = 1,..., n}
S i el error del Kriging resultar Z S ( x ) Z SK
*
( x) e
Z SC ( x ) = Z K* ( x ) + {Z S ( x ) Z SK
*
( x )} (6.7)
entonces
E Z SC ( x ) = E Z ( x ) (6.9)
kriging de la simulacin Z S ( x ) Z SK
*
( x) es isomorfo al error verdadero
93
Martn A. Daz Viera
Esto se obtiene del hecho que en los puntos de observacin los valores
interpolados por Kriging son iguales a los valores medidos
Z K* ( xi ) = Z M ( xi ) y Z SK
*
( xi ) = Z S ( xi ) xi , i = 1,..., n (6.10)
94
Martn A. Daz Viera
En la tabla anterior se resumen las tres caractersticas antes mencionadas de los mtodos de
simulacin que revisaremos a continuacin con cierto detalle.
En el caso de los mtodos del tipo Gaussiano haremos un parntesis, y nos detendremos
brevemente en ellos antes de abordar en detalle cada uno de los mtodos en especfico ya
que requieren de un tratamiento especial.
sea Gaussiana.
La primera condicin necesaria para que una funcin aleatoria posea una distribucin
normal multivariada es que su distribucin univariada sea normal. Esto nos dice que
necesitamos transformar a la funcin aleatoria Z ( x ) de manera que resulte su FDP normal.
FY ( y p ) = FZ ( z p ) = p; p [ 0,1] (6.11)
y por lo tanto la transformacin que se requiere sera
y = FY 1 ( FZ ( z ) ) (6.12)
valores:
z (1) z (2) ... z ( n ) (6.13)
95
Martn A. Daz Viera
Distribucin Si
Gaussiana ?
No
Transformacin Gaussiana
Anlisis Estructural:
Obtencin del variograma
Simulacin Gaussiana
Si
Condicional ?
No
Condicionamiento: Kriging
Simulacin Condicional
de la F.A. original Z SC ( x )
96
Martn A. Daz Viera
correspondiente sera
y ( k ) = G 1 ( k n ) (6.14)
A este tipo de transformacin se le conoce como anamorfosis.
Pero esto an sera insuficiente puesto que se requerira verificar la normalidad al menos de
la distribucin bivariada. Aunque en muchos casos para fines prcticos no se lleva tan lejos
el anlisis y se toma la decisin de considerar a la distribucin gaussiana o por el contrario
se rechaza esa hiptesis y se elige otro mtodo de simulacin no gaussiano.
m ( x ) = E Z ( x ) (6.15)
97
Martn A. Daz Viera
como:
{ }
C ( xi , x j ) = E {Z ( xi ) m ( xi )} Z ( x j ) m ( x j )
(6.16)
E [ Z ] = {m ( x1 ) , m ( x 2 ) ,..., m ( x n )} m
T
(6.17)
{ }
Var [ Z ] = C ( xi , x j ) C (6.18)
ZS = m+ M (6.20)
donde L es una matriz n n triangular inferior (todos los elementos por encima de la
98
Martn A. Daz Viera
Es bueno hacer notar que usualmente el vector se toma como realizaciones de variables
aleatorias con distribucin gaussiana y por lo tanto esto implica que Z S es una realizacin
Para que la simulacin sea condicional basta con tomar al vector de valores esperados m
*
igual a la estimacin por kriging Z y a C como la matriz de covarianza de dicha
estimacin, resultando:
Z SC = Z + M
*
(6.25)
Este mtodo clsico fue introducido en aplicaciones geoestadsticas por Davis (1987), y es
aplicable hasta lmite que sea factible la descomposicin de Cholesky, es decir, hasta unos
cuanto cientos de puntos simulados.
99
Martn A. Daz Viera
depende de x , es decir
2 = C (0) (6.27)
Ha sido demostrado (Bochner, 1955) que cualquier funcin positiva definida y simtrica
C ( h ) corresponde a la funcin de covarianzas de una funcin aleatoria Z ( x ) estacionaria
100
Martn A. Daz Viera
y funcin de covarianzas C ( h )
N N
E Z N ( x + h ) Z N ( x ) = ( 2 2 / N ) E cos ( k x + k ) cos (l ( x + h ) + l )
k =1 l =1
= 2 E cos ( k x + k ) cos ( k ( x + h ) + k )
2
(6.31)
+
= cos ( h ) f ( )d = C ( h )
lim Z N ( x ) Z ( x ) ; x [ a, b ] (6.32)
N
Este mtodo se puede generalizar fcilmente para el caso de varias dimensiones cuando
Z ( x ) , para x 3
y tambin puede ser aplicado para simular procesos aleatorios
vectoriales.
Como en general se simulan funciones aleatorias Z ( x ) con valor esperado no nulo,
El mtodo espectral tiene como ventaja que permite producir simulaciones en cualquier
punto dada la funcin de covarianzas C ( h ) siempre que se pueda calcular su
101
Martn A. Daz Viera
3
Considere una lnea L1 en el espacio tridimensional y una funcin aleatoria
unidimensional, estacionaria de segundo orden Y ( xL1 ) definida sobre dicha lnea L1 , con
102
Martn A. Daz Viera
Z1 ( x ) Y ( xL1 ) ; x 3
(6.33)
Esta funcin aleatoria es estacionaria de segundo orden, con valor esperado cero y funcin
de covarianzas tridimensional
procede asignando el valor simulado y ( xL1 ) en el punto xL1 de la lnea L1 a todos los
puntos que se encuentran dentro de una banda centrada en el plano xL1 = const. ,
103
Martn A. Daz Viera
simulada en cada una de las N lneas se obtiene a partir de la primera usando la expresin
C (1) ( r ) =
d
dr
{ }
rC (3) ( r ) (6.38)
Sin embargo no existe unas expresin directa para obtener la C (1) ( h ) a partir de la funcin
Es uno de los mtodos mas eficientes para producir simulaciones en varias dimensiones
puesto que reduce su complejidad al orden de las simulaciones en una dimensin. Como
dificultades prcticas se le debe apuntar que requiere del conocimiento o del clculo de
C (1) ( h ) y de un algoritmo de simulacin en una dimensin que reproduzca esta funcin de
104
Martn A. Daz Viera
modelo del semivariograma basado en los datos transformados y cada vez que se
obtienen los valores estimado son transformados hacia atrs a su escala original. Su
dificultad principal estriba en el grado de conocimiento que se posea de la funcin
distribucin de probabilidad, lo cual puede ser suplido en parte por la experiencia previa
sobre la naturaleza del fenmeno que se simula. Hay programas, como el de GSLIB que
permite extrapolar valores de la FDP, usando modelos potencia, hiperblico y lineal.
Los umbrales yi son elegidos de manera que concuerden con las proporciones pi de los
indicadores
i
yi = G 1 p j (6.40)
j =1
manera que los variogramas tericos de los indicadores deducidos a partir de las relaciones
(6.41) o (6.42) se ajusten bien a los variogramas muestrales.
( h)
1 z 2 du
C ( h; z ) = exp (6.41)
2 0 1+ u 1 u2
o
n 1 ( y ) n 1 ( y )
C yy ( h ) = g ( y ) g ( y ) (h)
n
(6.42)
n =1 n
105
Martn A. Daz Viera
1.- Anlisis estructural global de los variogramas directos y cruzados de los diferentes
indicadores, ajustando un modelo derivado a partir del correlograma ( h ) .
indicador.
3.- Simulacin de toda la malla condicionada en estos valores duros simulados.
4.- Transformacin de la simulacin de Y ( x ) a la simulacin de los indicadores.
106
Martn A. Daz Viera
vector de p gaussianas:
El mtodo computacional inicia con una imagen aleatoria y requiere de los datos
observados y del modelo del variograma a reproducir.
Durante su ejecucin el algoritmo intenta modificar la imagen inicial de manera tal que
reproduzca el variograma y al mismo tiempo mantenga la misma distribucin de
probabilidad de los datos observados.
107
Martn A. Daz Viera
1) Crea imagen inicial asignando a cada nodo de las malla de simulacin valores de
manera aleatoria generados a partir de la funcin distribucin de probabilidad
(FDP) suministrada por el usuario. Cuando el nodo de la malla de simulacin
coincide con el nodo de una observacin o es cercano a ste con cierto error de
tolerancia, se le asigna el valor observado a ste. Este imagen inicial as obtenida no
tiene que reflejar ningn modelo de variograma especfico.
2) En una segunda etapa el algoritmo intenta reproducir el variograma modelo
intercambiando valores en los nodos de la malla de simulacin elegidos de manera
aleatoria. Se aceptan como permanentes los intercambios que reduzcan la diferencia
entre el variograma suministrado ( h ) y el que refleja los datos simulados * ( h ) .
2
* ( hi ) ( hi )
FO1 = (6.44)
i ( hi )
Para evitar caer en un mnimo local, son aceptados algunos intercambios que incrementan
el valor de la funcin objetivo, es decir la aceptacin del intercambio es probabilstica. Se
espera que para un nmero elevado de iteraciones la funcin objetivo tienda al mnimo
global y consecuentemente los valores simulados posean una estructura espacial cercana al
variograma de los datos observados.
Una alternativa a la funcin objetivo arriba propuesta puede incluir restricciones y tener la
siguiente forma:
FO2 = w1 * ( hi ) ( hi ) + w2 *j j
2 2
(6.45)
i j
108
Martn A. Daz Viera
109
Martn A. Daz Viera
- Variable Aleatoria (V.A.): Es una variable Z (propiedad) que puede tomar una serie
de valores o realizaciones (zi, i=1,...,N) con un conjunto dado de probabilidad de
ocurrencia (pi, i=1,...,N)
1.- F( ) = 0
106
Martn A. Daz Viera
2.- F( + ) = 1
3.- Pr{Z > z} = 1 F ( z )
1.- f ( ) = f ( + ) = 0
+
2.- f ( z )dz = 1
z1
3.- F ( z1 ) = f ( z )dz
b
4.- Pr{a Z b} = f ( z )dz
a
5.- f(z) 0
107
Martn A. Daz Viera
M = F 1 (0.5) (A.6)
Cuartiles
p=0.25 (primer cuartil o inferior)
z0.25 = F 1 (0.25) (A.7)
p=0.75 (tercer cuartil o superior)
z0.75 = F 1 (0.75) (A.8)
Es el valor ms probable que puede tomar la VA. Se conoce tambin como valor medio o
media.
1.- VA discreta
N
m = E [ Z ] = pi zi (A.10)
i =1
2.- VA continua
+ +
m = E [Z ] = zdF ( z ) = zf ( z )dz (A.11)
De manera anloga se puede definir el valor esperado de cualquier funcin de una VA. Por
ejemplo si tenemos la funcin ( Z ) de la VA Z, entonces su valor esperado se define
como:
1.- VA discreta
N
E ( Z ) = pi ( zi ) (A.12)
i =1
108
Martn A. Daz Viera
2.- VA continua
+ +
E ( Z ) = ( z ) dF ( z ) = ( z ) f ( z )dz (A.13)
E ak Z k = ak E {Z k } (A.14)
k k1
2.- Para cualquier par de funciones 1 ( Z ) y 2 ( Z ) de la VA Z
E 1 ( Z ) + 2 ( Z ) = E 1 ( Z ) + E 2 ( Z ) (A.15)
2 = Var [ Z ] = E ( Z m ) 0
2
(A.18)
2 = E ( Z m ) = E Z 2 2mZ + m 2
2
(A.19)
= E Z 2mE [ Z ] + m 2 = E Z 2 m 2
2
109
Martn A. Daz Viera
1.- VA discreta
N
Var [ Z ] = pi ( zi m )
2
(A.20)
i =1
2.- VA continua
+ +
Var [ Z ] = ( z m) dF ( z ) = ( z m ) f ( z )dz
2 2
(A.21)
- Desviacin Estndar
= Var [ Z ] (A.22)
- Signo de Simetra
cuando >0, m > M y se dice que hay asimetra positiva
Sign ( m M ) = (A.26)
cuando <0, m < M y se dice que hay asimetra negativa
Ver figura 1.
110
Martn A. Daz Viera
- Estimadores muestrales
- Valor medio(media)
El promedio es un estimador insesgado del valor medio de la poblacin
N
1
m* = z =
N
z
i =1
i (A.29)
- Varianza
1 N
( 2 ) = S 2 =
*
( zi z )
2
(A.30)
N 1 i =1
-Distribucin Normal o Gaussiana. Caractersticas.
Esta distribucin est completamente caracterizada por sus dos parmetros: media m y
varianza 2 y se designa mediante N ( m, 2 ) .
1 1 z m 2
g ( z) = exp (A.31)
2 2
111
Martn A. Daz Viera
1 z2
g0 ( z ) = exp (A.32)
2 2
La correspondiente FDP no tiene una expresin analtica, pero est bien tabulada:
z
G0 ( z ) = g (u )du
0 (A.33)
y correspondientemente
z
zm
G( z) = g (u )du = G
0
(A.34)
Una de las razones de la popularidad de la distribucin gaussiana se debe a los teoremas del
lmite central que dice:
Si n VAs Z i independientes tienen la misma FDP y media cero, entonces la variable
aleatoria
1 n
Y= Zi tiende a tener una distribucin Normal cuando n
n i =1
(A.37)
112
Martn A. Daz Viera
logartmicos.
ln y
Pr {Y y} = FY ( y ) = G0 (A.39)
Y su correspondiente fdp es
1 ln y
fY ( y ) = FY' ( y ) = g0 (A.40)
y
Relacin entre los parmetros aritmticos y logartmicos:
2
m = e + 2 / 2 = ln m
2
2 (A.41)
= m e 1 2 2
2 2
= ln 1 + 2
m
La fdp lognormal tiene asimetra positiva.
distribuidas cuando n es grande. Usando el teorema del lmite central, tenemos que
n n
Y = Yi ln Y = ln Yi Normal cuando n (A.42)
i =1 i =1
113
Martn A. Daz Viera
= E [ ] = m
m = E (A.43)
E [ ] = 0
= E
E e = E (A.44)
Def: Se considera el estimador ms eficiente a aquel que tiene la menor varianza de todos
los estimadores insesgados posibles de un parmetro de una poblacin
Estimador puntual:
114
Martn A. Daz Viera
N
1
z=
N
z
i =1
i (A.45)
E Z = m (A.46)
Var Z = 2 / N (A.47)
Intervalo de estimacin:
Z =Z / N .
Sabemos que una VA Z S con una distribucin normal estndar se encuentra en el intervalo
[-1.96,1.96] con una probabilidad de 0.95,
Pr {1.96 < Z S < 1.96} = 0.95 (A.48)
Z mZ
donde Z S =
Z / N
Z mZ
Pr 1.96 < < 1.96 = 0.95 (A.49)
Z / N
1.96 Z 1.96 Z
Pr Z < mZ < Z + = 0.95 (A.50)
N N
1.96 Z 1.96 Z
donde Z < mZ < Z + intervalo de confianza para 95 %.
N N
Generalizando, tenemos que un intervalo de confianza para la media con una probabilidad
de (1-)100% para N>30 esta dado por
z / 2 Z z
z < mZ < z + / 2 Z (A.51)
N N
donde Pr { z / 2 < Z < z / 2 } = 1 .
115
Martn A. Daz Viera
( Z )
*
correspondientes, resultando
z / 2 ( Z ) z / 2 ( Z )
* *
m
*
Z < mZ < m + *
Z (A.52)
N N
116
Martn A. Daz Viera
z1 z2 zn
FZ1 , Z2 ,..., Zn ( z1 , z2 ,..., zn ) = " f Z1 , Z2 ,..., Zn ( z1 , z2 ,..., zn ) dz1dz2 " dzn (A.55)
variada o conjunta.
De manera anloga al caso de una variable aleatoria se pueden definir los momentos de la
funcin de distribucin n-variada. En particular, nos interesa estudiar el caso bivariado.
117
Martn A. Daz Viera
x y
FXY ( x, y ) =
f XY (u, v)dudv (A.57)
d 2 FXY ( x, y )
donde f XY ( x, y ) = es la funcin de densidad de probabilidad (fdp)
dxdy
bivariada.
El grado de dependencia entre las dos variables aleatorias X y Y puede ser caracterizado
por el diagrama de dispersin alrededor de cualquier lnea de regresin.
Semivariograma
El momento de inercia del diagrama de dispersin con respecto a una lnea de 45o de
pendiente, permite caracterizar la carencia de dependencia, ver Fig. 2.
N N
1 1
[ di ] = [ x y ]
2 2
XY = i i (A.58)
N i =1 2N i =1
Este momento de inercia se conoce como semivariograma. Mientras mayor sea el valor del
semivariograma ms dispersos estarn los valores en el diagrama de dispersin y menor
ser la dependencia entre las dos variables aleatorias X y Y .
118
Martn A. Daz Viera
xi yi
di
yi
( xi , yi )
45D x
xi
Se define como:
1.- VA discreta
N M
mXY = E { XY } = pij xi y j (A.59)
i =1 j =1
2.- VA continua
+ + + +
mXY = E { XY } = xyd
2
FXY ( x, y ) = xyf XY ( x, y ) dxdy (A.60)
119
Martn A. Daz Viera
Covarianza centrada
Cov ( X , Y ) = E {( X mX )(Y mY )}
+ + (A.62)
= ( x mX )( y mY ) f XY ( x, y ) dxdy
Y se estima como:
N N
1 1
XY =
N
( x m )( y m ) = N x y m
i =1
i X i Y
i =1
i i X mY (A.64)
{
X2 = Var { X } = Cov { X , X } = E [ X mX ] 0
2
} (A.65)
Y no estn correlacionadas.
Coeficiente de correlacin
Se define como:
XY Cov { X , Y }
XY = = [ 1,1] (A.66)
XY Var { X }Var {Y }
120
Martn A. Daz Viera
puede afirmar que no puede ser descrita su dependencia mediante un modelo lineal. Para el
caso en que X y Y posean una distribucin normal bidimensional si es cierto el recproco.
entonces
1 N
1 N
1 N
x y m mY + ( mX mY ) (A.69)
2
2 XY = xi2 mX2 + yi2 mY2 2 i i X
N i =1 N i =1 N i =1
y por lo tanto
2 XY = X2 + Y2 2 XY + ( mX mY ) 0
2
(A.70)
Si XY XY y viceversa.
X mX Y mY
Si tomamos las variables X y Y estandarizadas: X = y Y = , donde
X Y
correlacin XY
X mX Y mY
X Y = E = XY (A.71)
X Y
Aplicando la Ec. (A.70), se obtiene la relacin
X Y = 1 XY (A.72)
121
Martn A. Daz Viera
m = b0 + b1 X 1 + b2 X 2 + ... + bp 1 X p 1 = b X (A.74)
donde
( b , b , b ,..., b ) de manera que sea mnima la suma de los cuadrados de los errores:
0 1 2 p 1
n
Se = ei
2
(A.75)
i =1
b = ( b0 , b1 , b2 ,..., bp 1 ) (A.77)
1 X 11 ... X 1 p
1 X ... X 2 p
X=
21
(A.78)
# # ... #
1 X n1 ... X np
122
Martn A. Daz Viera
2 Ce , (A.80)
( )
* T 1 T
b = X X X Y (A.81)
( )
T 1
Cb = 2 X X (A.84)
( )
1
* T 1 T 1
b = X Ce X X Ce Y (A.85)
(
Se = Y Xb )
* T
Ce
1
( Y Xb ) *
(A.86)
( )
1
T 1
Cb = 2 X Ce X (A.87)
123
Martn A. Daz Viera
Alcance (range): Para el modelo esfrico, la distancia en la que el modelo alcanza el valor
mximo, o sill (meseta). Para los modelos gausianos y exponencial, que se aproximan a la
meseta asintticamente. Se usa el trmino alcance para designar el alcance prctico o
efectivo donde la porcin alcanza aproximadamente el 95 % del mximo. El modelo
Nugget tiene una meseta con un rango de cero; el modelo lineal usa meseta/alcance
simplemente para definir la pendiente.
Deriva (drift): El valor esperado de una funcin aleatoria puede ser constante o depender de
las coordenadas de la posicin. La deriva es una caracterstica de la funcin aleatoria y no
de los datos.
124
Martn A. Daz Viera
Funcin Aleatoria: Puede ser vista como una coleccin de variables aleatorias que
dependen de la posicin.
125
Martn A. Daz Viera
Kriging de bloques: Estimacin del valor de un bloque a partir de los valores de una
muestra continua usando Kriging. El rea de un bloque es un arreglo de aproximadamente
2x2, 3x3, 4x4 puntos con centro en cada nodo de la malla especificada. Se dice que se
obtiene un valor suavizado de la estimacin.
Kriging Ordinario: Es un tipo de Kriging que asume que la media local no est
necesariamente cercana a la media de la poblacin, y que usa solamente para el estimado la
muestra para la vecindad local. Es el mtodo usado mas comnmente por su robustez.
Kriging Puntual: Estimacin del valor de un punto de los valores de la muestra cercana
usando kriging. El estimado para un punto ser casi similar al estimado por un bloque
relativamente cercano centrado en el punto, pero la desviacin estndar del kriging
calculada ser alta. Cuando el punto del Kriging coincide con el lugar de la muestra, el
estimado tendr un valor igual al de la muestra.
Kriging Simple: Variedad de kriging que asume que las medias locales son relativamente
constantes e iguales a la media de la poblacin, la que es bien conocida. La media de la
poblacin es usada como un factor en cada estimado local, con todas las muestras en la
misma vecindad. No es un mtodo muy usado.
Kriging: Mtodo de interpolacin del valor medio ponderado donde los pesos asignados a
las muestras minimizan la varianza del error, la que se calcula como una funcin del
modelo de variograma y localizaciones de las muestras relacionadas unas con las otras, y
del punto o bloque que est siendo estimado.
126
Martn A. Daz Viera
Meseta (sill): Lmite superior de cualquier modelo de variograma acotado, al que tiende
asintticamente para grandes distancias. Para el modelo lineal, la relacin sill/rango se usa
para definir la pendiente.
Modelo Esfrico: Es una de las funciones autorizadas que es usada frecuentemente como
modelo de variograma, en combinacin con el modelo Nugget.
Modelo Lineal: Es una de las funciones autorizadas que es usada frecuentemente como
modelo de variograma, en combinacin con el modelo Nugget.
Modelos de variograma anidado: Aquel que es la suma de dos o mas modelos tales como
Nugget, esfrico, etc. Agregando el componente Nugget a uno de los otros modelos se
obtiene el modelo anidado mas comn, aunque muy pocas veces se usan combinaciones
muy complejas.
127
Martn A. Daz Viera
Soporte: El trmino es usado en ambos sentidos: matemtico y fsico. Con frecuencia los
valores experimentales estn definidos en soportes puntuales o casi puntuales, en otros
casos son los valores medios ZVi ( x i ) definidos en los soportes Vi centrados en los
128
Martn A. Daz Viera
variogramas relativos son usados en Kriging, la desviacin estndar del Kriging resultante
representa fracciones decimales de los valores estimados.
Vecindad de bsqueda: Es el rea elptica centrada en un punto o bloque que est siendo
analizado por el Kriging. Solamente las muestras dentro de la elipse sern usadas para el
clculo de la estimacin por Kriging.
129
GLOSSARY OF GEOSTATISTICAL TERMS
BLOCK KRIGING: Estimating the value of a block from a set of nearby sample
values using kriging. In Geo-EAS, the block area is
approximated by a 2x2, 3x3, or 4x4 array of points centered on
each specified grid node.
1
structure. Also includes the various techniques such as
kriging, which utilize spatial correlation model.
KRIGING VARIANCE: The minimized value of the estimation variance, i.e., the
variance of the error of estimation. This variance is not
data dependent but rather is determined by the variogram and
the sample location pattern as well as the location of the
point to be estimated relative to the sample locations.
2
"reasonable", but the kriging standard deviations will be
meaningless.
NESTED VARIOGRAM MODEL: A model which is the sum of two or more component
models such as nugget, spherical, etc. Adding a nugget
component to one of the other models is the most common nested
model, but not more complex combinations are occasionally
used.
NUGGET MODEL: A constant variance model most often used in combination with
one or more other functions when fitting mathematical models
to experimental variograms.
ORDINARY KRIGING: A variety of kriging which assumes that local means are not
necessarily closely related to the population mean, and which
therefore uses only the samples in the local neighborhood for
the estimate. Ordinary kriging is the most commonly used
method for environmental situations.
POINT KRIGING: Estimating the value of a point from a set of nearby sample
values using kriging. The kriged estimate for a point will
usually be quite similar to the kriged estimate for a
relatively small block centered on the point, but the computed
kriging standard deviation will be higher. When a kriged point
happens to coincide with a sample location, the kriged
estimate will equal the sample value.
RANDOM FUNCTION: A random function may be seen in two different forms; it may
be thought of as a collection of dependent random variables
with one for each possible sample location. Alternatively it
may be thought of as a "random variable" whose values are
functions rather than numbers.
SILL(of a variogram): The value of the variogram for distances beyond the
range of the variogram. The Power model does not have a sill.
The upper limit of any variogram model which has such a limit,
i.e., which tends to "level off" at large distances. In
Geo-EAS, the spherical, gaussian, exponential, and nugget
models have sills. For the linear model, "sill/range" is used
merely to define the slope.
SIMPLE KRIGING: A variety of kriging which assumes that local means are
relatively constant and equal to the population mean, which is
well-known. The population mean is used as a factor in each
local estimate, along with the samples in the local
neighborhood. This is not usually the most appropriate method
for environmental situations.
SPATIAL CORRELATION: Used both as a generic term to denote that data at two
locations is correlated in some sense as a function of their
locations and also to denote the value of a spatial structure
4
function such as a variogram or (auto)covariance for a pair
of locations.
5
Martn A. Daz Viera
BIBLIOGRAFA
130
Martn A. Daz Viera
131