Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GEOESTADISCTICA
GEOESTADISCTICA
GEOESTADISTICA
7 30' W
MAR CARIBE
Boca de la
Barra
300
280
C. Clarn
260
240
220
R. Sevilla
C. Grande
200
180
160
R.
Ar
ac
at
ac
a
140
10 45' N
R. Fundacion
Teora y Aplicacin
UNIVERSIDAD
NACIONAL
DE COLOMBIA
Sede Bogot
Facultad de Ciencias
Departamento de Estadstica.
120
INTRODUCCION A LA
GEOESTADISTICA
7 30' W
MAR CARIBE
Boca de la
Barra
300
280
C. Clarn
260
240
220
R. Sevilla
C. Grande
200
180
160
R.
Ar
a
140
ca
ta
ca
10 45' N
120
R. Fundacion
Teora y Aplicacin
Ramn Giraldo Henao.
Profesor Asistente
Departamento de Estadstica
Universidad Nacional de Colombia
Sede Bogot
2
Contenido
Prefacio
Introduccin
1. Datos Espaciales y Anlisis Exploratorio.
1.1
1.2
1.3
1.4
1.5
1.6
Estadstica Espacial.
Geoestadstica, Lattices y Patrones Espaciales
Datos Georreferenciados
Justificacin del AED
Grficos Exploratorios
Aplicacin
4. Prediccin Espacial
4.1.
4.2.
4.3.
4.4.
4.5.
5. Temas Especiales.
5.1.
5.2.
5.3.
5.4.
5.5.
Cokriging Ordinario
Kriging sobre Ejes Factoriales
Diseo de Redes de Muestreo.
Simulacin
Aplicaciones.
6. Apndice
6.1.
6.2.
6.3.
6.4.
Indicador IGCi(P)
lgebra de Matrices
Conceptos de Probabilidad
Revisin de Algunos Mtodos Estadsticos.
7. Referencias.
Prefacio
La necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas
las reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas
metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son
especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre
otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene
actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica
encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de
informacin enmarcada dentro de este contexto. Como consecuencia de este impulso
surgi una nueva rama de la estadstica, denominada environmetrics (estadstica
ambiental). Dentro de esta ltima, los mtodos geoestadsticos juegan un papel
preponderante.
El presente documento tiene como propsito servir de consulta a gelogos,
bilogos, eclogos, agrnomos, ingenieros, meteorlogos y todos aquellos profesionales
que se encargan del estudio de informacin ambiental georreferenciada. Se toma como
base para las aplicaciones informacin de variables fisicoqumicas y biolgicas medidas en
un estuario ubicado en la costa norte de Colombia. La razn fundamental para lo anterior,
es que este escrito es uno de los resultados centrales de un proyecto de investigacin1, cuyo
objetivo fundamental fue el de evaluar la aplicabilidad de algunos procedimientos
estadsticos en el anlisis de datos medidos en este tipo de ecosistemas.
El documento tiene un enfoque terico-prctico. Para el seguimiento completo de la
teora descrita se requiere tener conocimientos bsicos de lgebra de matrices y de
estadstica matemtica. Sin embargo aquellas personas que estn poco familiarizadas con
estos temas, podrn obviar la lectura de algunas secciones en las que se hacen desarrollos
tericos y centrar su atencin en la filosofa de los mtodos presentados y en las
aplicaciones mostradas en cada uno de los captulos del documento. Una resumen no
exhaustivo de conceptos de lgebra lineal y de estadstica es hecho al final en el apndice.
No obstante en el escrito se cubren diversos temas geoestadsticos y se hacen
aplicaciones de mtodos recientes, es necesario acudir a la lectura de artculos cientficos y
textos avanzados para lograr un buen dominio de esta metodologa. Un libro formal desde
el punto de vista matemtico con aplicaciones en diversas disciplinas es Cressie (1993).
Otras referencias pueden ser tomadas de la bibliografa.
Introduccin
El estudio de fenmenos con correlacin espacial, por medio de mtodos
geoestadsticos, surgi a partir de los aos sesenta, especialmente con el propsito de
predecir valores de las variables en sitios no muestreados. Como antecedentes suelen
citarse trabajos de Sichel (1947; 1949) y Krige (1951). El primero observ la naturaleza
asimtrica de la distribucin del contenido de oro en las minas surafricanas, la equipar a
una distribucin de probabilidad lognormal y desarroll las frmulas bsicas para esta
distribucin. Ello permiti una primera estimacin de las reservas, pero bajo el supuesto de
que las mediciones eran independientes, en clara contradiccin con la experiencia de que
existen zonas ms ricas que otras. Una primera aproximacin a la solucin de este
problema fue dada por gelogo G. Krige que propuso una variante del mtodo de medias
mviles, el cual puede considerarse como el equivalente al krigeado simple que, como se
ver ms adelante, es uno de los mtodos de estimacin lineal en el espacio con mayores
cualidades tericas. La formulacin rigurosa y la solucin al problema de prediccin
(estimacin en muchos textos geoestadsticos) vino de la mano de Matheron (1962) en la
escuela de minas de Pars. En los aos sucesivos la teora se fue depurando, ampliando su
campo de validez y reduciendo las hiptesis necesarias (Samper y Carrera, 1990). De la
minera las tcnicas geoestadsticas, se han "exportado" a muchos otros campos como
hidrologa, fsica del suelo, ciencias de la tierra y ms recientemente al monitoreo
ambiental y al procesamiento de imgenes de satlite.
Aunque la aplicacin de la herramienta geoestadstica es bastante reciente, son
innumerables los ejemplos en los que se ha utilizado esta tcnica en estudios ambientales
con el nimo de predecir fenmenos espaciales (Robertson, 1987; Cressie y Majure, 1995;
Diggle et al., 1995). La columna vertebral del anlisis geoestadstico es la determinacin
de la estructura de autocorrelacin entre los datos y su uso en la prediccin a travs de las
tcnicas conocidas como kriging y cokriging. Otros temas importantes dentro del estudio
de informacin georreferenciada son el diseo de redes de muestreo (McBratney et al.,
1981), la geoestadstica multivariada (Wackernagel, 1995) y la simulacin (Deutsh y
Journel, 1992).
La geoestadstica es solo una las reas del anlisis de datos espaciales. Es
importante reconocer cuando la informacin georreferenciada es susceptible de ser
analizada por medio de dicha metodologa. Por ello en el documento se hace inicialmente
una definicin global de estadstica espacial y se describen las caractersticas especiales
que enmarcan cada una de sus reas.
En el estudio de informacin georreferenciada, de forma anloga a como se procede
en la aplicacin de muchos procedimientos estadsticos, la primera etapa que se debe
cumplir es la del anlisis exploratorio de datos (AED). Esta busca identificar localizacin,
variabilidad, forma y observaciones extremas. Por ello en el primer captulo del escrito se
hace una revisin de mtodos empleados en el AED y se describen algunos particularmente
tiles en el contexto del anlisis de informacin georreferenciada. Posteriormente en el
segundo captulo, entrando en materia, se hace definicin de conceptos bsicos dentro de la
teora geoestadstica.
6
Captulo Uno
Datos Espaciales y Anlisis Exploratorio
En las secciones 1.1 y 1.2 se define estadstica espacial y se mencionan sus
subdivisiones. Lo anterior se hace con el propsito nico de que el lector identifique el
alcance del tema considerado dentro del escrito. Por ello a partir de la seccin 1.3 de este
captulo y en los captulos siguientes se consideran slo temas referentes a geoestadstica
1.1. Estadstica Espacial.
Estadstica espacial es la reunin de un conjunto de metodologas apropiadas para el
anlisis de datos que corresponden a la medicin de variables aleatorias en diversos sitios
(puntos del espacio o agregaciones espaciales) de una regin. De manera ms formal se
puede decir que la estadstica espacial trata con el anlisis de realizaciones de un proceso
estocstico {Z ( s) : s D}, en el que s R d representa una ubicacin en el espacio euclidiano ddimensional, Z(s) es una variable aleatoria en la ubicacin s y s vara sobre un conjunto de
ndices D R d .
1.2. Areas de la Estadstica Espacial.
La estadstica espacial se subdivide en tres grandes reas. La pertinencia de cada una
de ellas est asociada a las caractersticas del conjunto D de ndices del proceso estocstico
de inters. A continuacin se mencionan dichas reas y se describen las propiedades de D
en cada una de stas.
Geoestadstica: Las ubicaciones s provienen de un conjunto D continuo y son
seleccionadas a juicio del investigador (D fijo). Algunos ejemplos de datos que pueden ser
tratados con esta metodologa son: Niveles de un contaminante en diferentes sitios de una
parcela, contenidos aurferos de una mina, valores de precipitacin en Colombia medida en
las diferentes estaciones meteorolgicas en un mes dado o los niveles piezomtricos de un
acufero. En los ejemplos anteriores es claro que hay continuidad espacial, puesto que en
cualquier sitio de la parcela, de la mina, de Colombia o del acufero pueden ser medias las
correspondientes variables. Es importante resaltar que en geoestadstica el propsito
esencial es la interpolacin y si no hay continuidad espacial pueden hacerse predicciones
carentes de sentido. Por ejemplo si la variable medida es produccin de caf en las fincas
cafeteras del departamento del Quindo, hacer interpolacin espacial y realizar un mapa de
distribucin de la produccin cafetera puede ser carente de sentido porque podran hacerse
predicciones sobre reas urbanas o no cultivadas con caf. Adems de lo anterior las
mediciones, no obstante sean georreferenciadas, corresponden a una agregacin espacial
(finca) ms que a un punto del espacio. En la parte de arriba, al comienzo de este prrafo,
se mencion que D deba ser fijo. A este respecto cabe aclarar que el investigador puede
hacer seleccin de puntos del espacio a conveniencia o puede seleccionar los sitios bajo
algn esquema de muestreo probabilstico.
Latitud
Norte
Longitud
Este
X1
X2
Xp
x11
x21
x31
x41
.
.
.
xn1
x12
x22
x32
x42
.
.
.
xn2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x1p
x2p
x3p
x4p
.
.
.
xnp
pueden estar ms intensamente muestreadas que las otras (xij faltantes). Las coordenadas
pueden ser planas, geogrficas (grados, minutos y segundos) o cartesianas. Sin embargo la
posible utilizacin de unas u otras depende del software empleado para los anlisis.
1.4. Justificacin del Anlisis Exploratorio de Datos Espaciales .
En la aplicacin de la geoestadstica es de suma importancia, al igual que en otros
procedimientos estadsticos (por ejemplo los modelos ARIMA dentro de la teora de series
de tiempo), el anlisis grfico. La identificacin de valores extremos y su ubicacin
geogrfica, la evaluacin de la forma de la distribucin y el clculo de medidas de
localizacin, variabilidad y correlacin es muy importante para establecer si algunos
supuestos necesarios para la aplicacin de la teora geoestadstica son vlidos o para definir
que procedimiento de prediccin es el ms conveniente. Por ejemplo, como se ver en el
captulo cuatro, la decisin de usar kriging ordinario o kriging universal se fundamenta en
identificar si la media es o no constante en la regin. El uso de kriging log-normal se basa
en un criterio emprico relacionado con la forma asimtrica de la distribucin de los datos
muestrales. La decisin de emplear cokriging depende de la deteccin de asociaciones
entre las variables.
1.5. Grficos Exploratorios
Al igual que en un estudio exploratorio clsico, cuando se dispone de informacin
georreferenciada se pueden emplear histogramas, diagramas de tallos y hojas y de caja y
bigotes (Hoaglin et al., 1983) con el propsito de identificar localizacin, variabilidad,
forma y observaciones extremas. Adicionalmente los grficos de dispersin son muy tiles
tanto para la deteccin de relaciones entre las variables como para la identificacin de
tendencias en el valor promedio de la variable en la regin (relacin entre la variable
medida y las coordenadas geogrficas). Un supuesto fundamental en el anlisis
geoestadstico es que el fenmeno es estacionario, para lo cual, entre otros aspectos, el
nivel promedio de la variable debe ser constante en todos los puntos del rea de estudio.
Una deteccin de tendencia en el grfico de dispersin puede ser una muestra de que no se
satisface dicho supuesto. El grfico se construye tomando como eje de las abcisas la
variable que representa la coordenada geogrfica y en el eje de las ordenadas la variable
cuantitativa de estudio. La observacin de la nube de puntos resultante, incluso el ajuste de
una lnea de regresin, permite establecer de manera emprica si existe dicha tendencia. Un
grfico de dispersin entre valores de la variable separados por una distancia espacial dada
(dispersograma rezagado) es til en la deteccin de autocorrelacin espacial. Otro grfico
que tradicionalmente se emplea en la descripcin de datos espaciales es el de datos
clasificados segn puntos de referencia (media, mediana, cuartles). Este permite comparar
zonas del sistema de estudio respecto a las magnitudes de las variables.
10
Figura 1. rea de estudio y cuadrculas en que fue subdividido el sistema Cinaga Grande de Santa Marta
para realizar la toma de muestras. Cada una de las 115 cuadrculas tiene un rea de 4 km2. Los datos fueron
tomados en el centro de cada una de ellas.
Medida Estandarizada
7
5
3
1
-1
-3
-5
Figura 2. Diagramas de caja de algunas variables medidas en la superficie de la columna de agua del estuario
Cinaga Grande de Santa Marta en Marzo de 1997. Las variables fueron estandarizadas antes de construir los
diagramas.
13
a). Salinidad
2
4
11
18
30
46
(13)
55
43
30
17
5
Bajo
13
14*
14
15*
15
16*
16
17*
17
18*
18
19*
Alto
b). Seston
127
5
14
6677889
0011224
566888899999
0011222333333334
5555666777899
011112233344
5556777788889
0000122233344
555556777888
01
283,332,342
c). Nitritos
5
0
26
1
43
2
(19) 3
50
4
34
5
29
6
17 7
13
8
10
9
7 10
6 11
Alto
2
3
5
15
36
20)
47
27
19
6
4
Bajo
1*
1T
1F
1S
1o
2*
2T
2F
2S
2o
3*
10
1
2
55
6667777777
888888888899999999999
00000001111111111111
2222222222222333333
44555555
6666777777777
99
0011
d). Silicatos
16888
000022555777779999999
11113333555558888
0000022244444666699
1133355555777777
02248
000033355599
1668
027
366
2
3
120,126,131,141,161
6
11
22
43
(24
45
27
15
6
2
Bajo
1S
1o
2*
2T
2F
2S
2o
3*
3T
3F
Alto
1,1,1,1,2
6
88999
00000111111
222222223333333333333
444444444555555555555555
666666666666677777
888888889999
000000111
2223
4
35
e). Clorofila a.
Bajo
8
9
10 10
21 11
41 12
(18) 13
47 14
26 15
10 16
6 17
Alto
2,11,17,43,54,58,75
7
04
01233334579
00033444666677788899
001124444556788889
001111123334444567899
0011333444467788
0266
00138
198
Figura 3. Diagramas de tallos y hojas de algunas variables medidas en la superficie de la columna de agua
del estuario Cinaga Grande de Santa Marta en Marzo de 1997.
14
Salinidad (o/oo)
35
30
25
20
15
10
5
0
1675000 1680000 1685000 1690000 1695000 1700000 1705000 1710000
Latitud Norte
Salinidad (o/oo)
35
30
25
20
15
10
5
0
950000
955000
960000
965000
970000
975000
980000
Longitud Este
Figura 4. Grficos de dispersin de valores de salinidad respecto a las coordenadas geogrficas de medicin.
Datos tomados en la superficie de la columna de agua del estuario Cinaga Grande de Santa Marta en Marzo
de 1997.
15
7 30' W
MAR CARIBE
Boca de la
Barra
C. Clarn
13.00
16.40
17.30
18.40
to
to
to
to
16.40
17.30
18.40
35.00
R. Sevilla
C. Grande
R.
Ar
ac
at
ac
a
10 45' N
R. Fundacion
Salinidad
Seston
Nitritos
Silicatos
Clorofila a
Salinidad
1
Seston
-0.09
1
Nitritos
-0.10
-0.33
1
Silicatos
-0.60
0.06
-0.08
1
Clorofila a
-0.47
0.45
-0.23
0.46
1
16
Captulo Dos
Definiciones Bsicas de Geoestadstica
2.1. Definicin de Geoestadstica
17
E (Z ( xi )) = m(xi )
V (Z ( xi )) = E [Z ( xi ) m( xi )] = i2
(Z ( xi ), Z (x j )) =
1
2
E Z ( xi ) Z (x j ) : Funcin de semivarianza
2
2.4. Estacionariedad
a. E [ Z(x)] = m, k R, x D Rd .
El valor esperado de la variable aleatoria es finito y constante para todo punto en el
dominio.
b. COV [ Z(x) , Z(x+h)] = C(h) <
Para toda pareja {Z ( x ), Z ( x + h )} la covarianza existe y es funcin nica del vector de
separacin h.
18
(Z ( x + h ), Z ( x )) = (h ) =
1
2
E [Z ( x + h ) m Z ( x ) + m]
2
1
2
2
E (Z ( x + h ) m ) + E (Z ( x ) m ) 2 E (Z ( x + h ) m )(Z ( x ) m )
2
1
1
= 2 + 2 E{(Z ( x + h ) m )(Z (x ) m )}
2
2
2
= C (h ) .
Figura 6. Representacin de una superficie interpolada para una variable regionalizada estacionaria
Existen algunos fenmenos fsicos reales en los que la varianza no es finita. En estos
casos se trabaja slo con la hiptesis que pide que los incrementos [Z(x+h) - Z(x)] sean
estacionarios, esto es (Clark, 1979):
a. Z(x) tiene esperanza finita y constante para todo punto en el dominio. Lo que implica que
la esperanza de los incrementos es cero.
E [Z (x + h ) Z ( x)] = 0
b. Para cualquier vector h, la varianza del incremento est definida y es una funcin nica
de la distancia.
2
19
Es claro que si una variable regionalizada es estacionaria fuerte entonces tambin ser
estacionaria dbil. El concepto de estacionariedad es muy til en la modelacin de series
temporales (Box & Jenkins, 1976). En este contexto es fcil la identificacin, puesto que
slo hay una direccin de variacin (el tiempo). En el campo espacial existen mltiples
direcciones y por lo tanto se debe asumir que en todas el fenmeno es estacionario. Cuando
la esperanza de la variable no es la misma en todas las direcciones o cuando la covarianza o
correlacin dependan del sentido en que se determinan, no habr estacionariedad. Si la
correlacin entre los datos no depende de la direccin en la que esta se calcule se dice que
el fenmeno es isotrpico, en caso contrario se hablar de anisotropa. En Isaaks y
Srivastava (1989) se definen los posibles tipos de anisotropa y se proponen algunas
soluciones. Cressie (1993) discute cual debe ser el tratamiento en caso de que la media no
sea constante.
En casos prcticos resulta compleja la identificacin de la estacionariedad. Suelen
emplearse grficos de dispersin de la variable respecto a las coordenadas, de medias
mviles y de valores clasificados segn puntos de referencia, con el propsito de identificar
posibles tendencias de la variable en la regin de estudio. L a isotropa es estudiada a travs
del clculo de funciones de autocovarianza o de semivarianza muestrales (captulo3) en
varias direcciones. Si estas tienen formas considerablemente distintas puede no ser vlido el
supuesto de isotropa. Finalmente una variable regionalizada ser no estacionaria si su
esperanza matemtica no es constante, esto es si E [Z ( x )] = m( x ) . En la figura 7 se
representa una variable regionalizada en la que existe tendencia en el valor promedio de la
variable, lo cual es claro indicador de no estacionariedad.
Figura 7. Representacin de una superficie interpolada para una variable regionalizada no estacionaria
20
Captulo Tres
Correlacin Espacial Muestral y Ajuste de Modelos
3.1. Funciones de Correlacin Espacial
(
)
= E ((Z ( x + h) Z ( x ) ) ).
= E (Z ( x + h) Z ( x ) )2 (E (Z ( x + h) Z ( x ) ))2
14442444
3
0
(Z ( x + h) Z ( x))
( h) =
2n
donde Z(x) es el valor de la variable en un sitio x, Z(x+h) es otro valor muestral separado
del anterior por una distancia h y n es el nmero de parejas que se encuentran separadas por
dicha distancia. La funcin de semivarianza se calcula para varias distancia h. En la
prctica, debido a irregularidad en el muestreo y por ende en las distancias entre los sitios,
se toman intervalos de distancia {[0, h], (h, 2h], (2h, 3h], L} y el semivariograma experimental
corresponde a una distancia promedio entre parejas de sitios dentro de cada intervalo y no a
una distancia h especfica. Obviamente el nmero de parejas de puntos n dentro de los
intervalos no es constante.
Para interpretar el semivariograma experimental se parte del criterio de que a menor
distancia entre los sitios mayor similitud o correlacin espacial entre las observaciones. Por
ello en presencia de autocorrelacin se espera que para valores de h pequeos el
21
semivariograma experimental tenga magnitudes menores a las que este toma cuando las
distancias h se incrementan.
3.1.2. Covariograma y Correlograma.
C (h ) = COV (Z ( x + h), Z ( x) ) =
( Z ( x + h)m)(Z ( x) m)
i =1
n
n
(Z ( x + h) Z ( x ) )
=
i =1
m 2 = C (h)
22
44
40
42
40
39
37
36
42
43
42
39
39
41
40
38
37
35
38
37
37
33
34
35
37
36
36
35
35
34
33
32
29
28
29
30
32
37
37
35
38
36
35
36
38
37
35
30
200
100
(100) = (38 - 37) + (37 - 35) + (29 - 30) + ... + (37 - 36) /2* 36 = 1.458
Distancia Semivarianza
Sentido Izquierda-Derecha
100
1.45
200
3.30
300
4.31
400
6.69
Semivarianza
Sentido Inferior-Superior
5.34
9.87
18.88
27.53
23
Semivarianza
30
25
20
15
10
5
0
Izq.-Der.
Inf.-Sup.
100
200
300
400
500
Distancia
Figura 8. Funcin de semivarianza experimental en dos direcciones para un conjunto de datos hipotticos.
Como se ver a partir del captulo cuatro la solucin del problema de prediccin
espacial kriging requiere del conocimiento de la estructura de autocorrelacin para
cualquier posible distancia entre sitios dentro del rea de estudio. En la presentacin del
semivariograma experimental dada anteriormente se indic que este es calculado slo para
algunas distancias promedios particulares. Por ello se hace necesario el ajuste de modelos
que generalicen lo observado en el semivariograma experimental a cualquier distancia.
Existen diversos modelos tericos de semivarianza que pueden ajustarse al semivariograma
experimental. En Samper y Carrera (1990) se presenta una discusin respecto a las
caractersticas y condiciones que stos deben cumplir. En general dichos modelos pueden
dividirse en no acotados (lineal, logartmico, potencial) y acotados (esfrico, exponencial,
gaussiano) (Warrick et al., 1986). Los del segundo grupo garantizan que la covarianza de
los incrementos es finita, por lo cual son ampliamente usados cuando hay evidencia de que
presentan buen ajuste. Todos estos modelos tienen tres parmetros comunes (Fig. 9) que
son descritos a continuacin:
Efecto Pepita
Es la cota superior del semivariograma. Tambin puede definirse como el limite del
semivariograma cuando la distancia h tiende a infinito. La meseta puede ser o no finita. Los
semivariogramas que tienen meseta finita cumplen con la hiptesis de estacionariedad
fuerte; mientras que cuando ocurre lo contrario, el semivariograma define un fenmeno
natural que cumple slo con la hiptesis intrnseca. La meseta se denota por C1 o por (C0 +
C1) cuando la pepita es diferente de cero. Si se interpreta la pepita como un error en las
mediciones, esto explica porque se sugiere que en un modelo que explique bien la realidad,
la pepita no debe representar mas del 50% de la meseta. Si el ruido espacial en las
24
Semivarianza
2,0
1,6
1,2
SEMEXP
MODELO
0,8
0,4
Rango (a)
Pepita (C0)
0,0
10000
20000
30000
Distancia
Figura 9. Comportamiento tpico de un semivariograma acotado con una representacin de los parmetros
bsicos. SEMEXP corresponde al semivariograma experimental y MODELO al ajuste de un modelo terico.
Rango
Tiene un crecimiento rpido cerca al origen (Fig. 10), pero los incrementos marginales
van decreciendo para distancias grandes, hasta que para distancias superiores al rango los
incrementos son nulos. Su expresin matemtica es la siguiente:
3 h 1 h 3
C 0 + C1 h a
( h )=
2a 2a
C
+
C
h>a
1
0
3h
a
(h) = C0 + C1 1exp
h2
(h)= C 0 + C1 1exp 2
30
Semivariograma
25
20
Esfrico
Exponencial
15
Gaussiano
10
5
0
0
50
100
150
200
250
300
Distancia(h)
Figura 10. Comparacin de los modelos exponencial, esfrico y Gaussiano. La lnea punteada vertical
representa el rango en el caso del modelo esfrico y el rango efectivo en el de los modelos exponencial y
gaussiano. Este tiene un valor de 210, respecto a una escala simulada entre 0 y 300. El valor de la meseta es
30 y el de la pepita 0. El 95% de la meseta es igual a 28.5.
26
Semivarianza
140
120
100
1<Theta <2
80
Theta = 1
60
0<Theta < 1
40
20
0
0
10
15
20
25
30
35
Distancia (h)
h=0
h>0
, donde C0 >0
C0
h
Figura 12. Modelo de semivarianza terico para variables sin correlacin espacial.
27
La estimacin de los parmetros de los modelos tericos descritos puede ser llevada a
cabo, entre otros mtodos, por mxima verosimilitud (Cressie, 1993) o regresin no lineal
(Gotway, 1991). Algunos paquetes de computo geoestadsticos como GS+ (Gamma Design
Software, 1999) traen incorporados procedimientos iterativos como el de Gauss-Newton
para llevar a cabo la estimacin. Otros como GeoEAS (Englund y Sparks, 1988) slo
permiten el ajuste a sentimiento por el mtodo de ensayo y error.
Como se mencion en la seccin 4.2. cuando la autocorrelacin no es igual en todas las
direcciones entonces se dice que hay anisotropa. Esa puede ser geomtrica o zonal. La
primera se presenta cuando los semivariogramas calculados en varias direcciones tienen
igual meseta pero varan en el rango. En el segundo caso todos los semivariogramas
direccionales tiene igual rango pero diferente meseta. Algunas transformaciones apropiadas
para solucionar la anistropa y hacer vlida la construccin de un semivariograma
omnidireccional se pueden encontrar en Isaaks y Srivastava (1989), Samper y Carrera
(1990) y Cressie (1993) .
3.3. Aplicacin: Estimacin de Modelos de Semivarianza para algunas variables
fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta.
(a )
( b)
Semivarianza
Semivarianza
25
20
15
10
5
0
0
5000
1 0 0 00
1 5 00 0
2 0 00 0
16
14
12
10
8
6
4
2
0
0
2000
4000
D is t a n c ia (m )
60 0 0
8 0 00
1 0 0 00
12000
(c )
( d)
Semivarianza
Semivarianza
2500
2000
1500
1000
500
0
0
5 0 00
1 0 00 0
1 5 00 0
2 0 00 0
0 .1 4
0 .1 2
0 .1
0 .0 8
0 .0 6
0 .0 4
0 .0 2
0
2 5 00 0
5 00 0
D is t an c ia ( m )
1 00 0 0
15 0 0 0
20 0 0 0
25000
D is ta n c ia ( m )
(e )
( f)
0 .2
1200
1000
Semivarianza
Semivarianza
14 0 0 0
D is ta n c ia ( m )
800
600
400
200
0
0 .1 5
0 .1
0 .0 5
0
5 0 00
1 0 00 0
D is t an c ia ( m )
1 5 00 0
2 0 00 0
5 00 0
1 00 0 0
15 0 0 0
20 0 0 0
25000
D is ta n c ia ( m )
Figura 13. semivariogramas experimentales (calculados con los datos muestrales) y ajustes de modelos tericos para las variables medidas en la superficie de la
columna de agua de la Cinaga Grande de Santa Marta en marzo de 1997. a) salinidad; b)oxgeno; c) slidos en suspensin; d) nitritos; e) clorofila a;
f)profundidad.
29
(a)
(b)
6
12
10
Semivarianza
Semivarianza
14
8
6
4
2
5
4
3
2
1
0
0
0
5000
10000
15000
20000
2000
4000
6000
8000
10000
12000
(d)
(c)
0.2
Semivarianza
Semivarianza
2500
2000
1500
1000
500
0
0.15
0.1
0.05
0
5000
10000
15000
20000
5000
Distancia (m)
10000
15000
(f)
Semivarianza
1400
1200
1000
800
600
400
200
0
0
5000
10000
Distancia (m)
20000
Distancia (m)
(e)
Semivarianza
14000
Distancia (m)
Distancia (m)
15000
20000
0.0016
0.0014
0.0012
0.001
0.0008
0.0006
0.0004
0.0002
0
0
5000
10000
15000
20000
25000
Distancia (m)
Figura 14. Semivariogramas experimentales (calculados con los datos muestrales) y ajustes de modelos tericos para las variables medidas en el fondo de la
columna de agua de la Cinaga Grande de Santa Marta en marzo de 1997. a) salinidad; b)oxgeno; c) slidos en suspensin; d) nitritos; e) clorofila a; f)
transparencia.
30
Salinidad
Oxgeno
Slidos en suspensin
Nitritos
Clorofila a
Profundidad
Transparencia
Superficie
Fondo
Superficie
Fondo
Superficie
Fondo
Superficie
Fondo
Superficie
Fondo
Lineal
Lineal
Gaussiano
Esfrico
Lineal
Lineal
Lineal
Lineal
Lineal
Lineal
Gaussiano
Gaussiano
0.179
0.627
1.830
1.080
1087
1408
0.071
0.073
389.2
710
0.073
0.0069
12.309
11.752
14.320
4.211
1138
557
0.043
0.077
623.2
616.4
0.121
0.0019
20000
20000
12940
11650
22000
20000
22000
20000
18000
18000
24850
25000
0.89
0.99
0.99
0.99
0.90
0.67
0.87
0.70
0.91
0.91
0.99
0.85
31
Capitulo Cuatro
Prediccin Espacial
4.1. Prediccin Espacial Optima.
TIPO DE
PREDICTOR
LINEAL
NO LINEAL
NOMBRE
PROPIEDADES
Simple
Ordinario
Universal
Indicador
Probabilstico
Log Normal, TransGaussiano
Disyuntivo
Son
ptimos
si
hay normalidad
multivariada.
Independiente de la distribucin son los
mejores predictores linealmente
insesgados.
Son predictores ptimos.
La palabra estimacin es utilizada exclusivamente para inferir sobre parmetros fijos pero desconocidos;
prediccin es reservada para inferencia sobre cantidades aleatorias.
3
Algunos textos indican que en espaol la palabra adecuada sera krigeado.
32
Los mtodos kriging se aplican con frecuencia con el propsito de prediccin, sin
embargo estas metodologas tienen diversas aplicaciones, dentro de las cuales se destacan
la simulacin y el diseo de redes ptimas de muestreo (captulo 5).
4.3. Kriging Ordinario
i Z ( xi )
i =1
en donde los i representan los pesos o ponderaciones de los valores originales. Dichos
pesos se calculan en funcin de la distancia entre los puntos muestreados y el punto donde
se va a hacer la correspondiente prediccin. La suma de los pesos debe ser igual a uno para
que la esperanza del predictor sea igual a la esperanza de la variable. Esto ltimo se conoce
como el requisito de insesgamiento.
Estadsticamente la propiedad de insesgamiento se expresa a travs de:
E Z * (x 0 ) = E (Z (x 0 ))
Asumiendo que el proceso es estacionario de media m (desconocida) y utilizando las
propiedades del valor esperado, se demuestra que la suma de las ponderaciones debe ser
igual a uno:
n
E
i Z ( x i ) = m
i =1
E (Z (x )) = m
i
i =1
m = m
i
i =1
n
i =1
=m
=1
i =1
Se dice que Z*(x0) es el mejor predictor, lineal en este caso, porque los pesos se obtienen
de tal manera que minimicen la varianza del error de prediccin, es decir que minimicen la
expresin:
V Z * ( x 0 ) Z (x 0 )
33
Esta ltima es la caracterstica distintiva de los mtodos kriging, ya que existen otros
mtodos de interpolacin como el de distancias inversas o el poligonal, que no garantizan
varianza mnima de prediccin (Samper y Carrera, 1990). La estimacin de los pesos se
obtiene minimizando V [Z * (x0 ) Z(x0 )] sujeto a
=1 .
i =1
i =1
i COV [ Z ( x i ), Z ( x 0 )] =
i =1
C
i
i0
i =1
V [ Z * ( x0 ) Z ( x0 )] = i j Cij 2 i Ci0 + 2
i =1 j =1
(0)
i =1
i =1 . Este problema
i =1
k2 = i j Cij 2 iCi0 + 2 +
i =1 j =1
i =1
i 1
i =1
Multiplica dor 1
4
2
4
3
de Lagrange
0
2{
( k2 )
=
1
(12 C11 + 21
j =2
j C1 j +
i j C ij )2
i = 2 j =1
i 1
i =1
i C i 0 + 2 + 2
i =1
= 21C11 + 2 j C1 j 2C10 + 2
j =2
1444
424444
3
n
=2
j =1
j C1 j 2C10 +2 = 0
C
j
1j
+ = C10 (1)
j =1
34
C
j
2j
+ = C 20 (2)
j =1
M
n
( k2 )
= 2 j C nj 2C n 0 + 2 = 0
n
j =1
C
j
nj
+ = C n 0 (3)
j =1
i =1
i =1
De (1), (2), (3), (4) resulta un sistema de (n + 1) ecuaciones con (n + 1) incgnitas, que
matricialmente puede ser escrito como:
C11
.
.
C n1
1
C1n
.
.
.
.
C nn
Cij
1 1 C10
. . .
. . .
=
. . .
1 n C n0
0 1
= Ci0
por lo cual los pesos que minimizan el error de prediccin se determinan mediante la
funcin de covariograma a travs de:
= Cij -1 Ci0.
Encontrando los pesos se calcula la prediccin en el punto xo. De forma anloga se procede
para cada punto donde se quiera hacer prediccin.
Varianza de Prediccin del Kriging Ordinario
ij
j =1
+ = i C i0
i, i = 1, 2, L , n.
i =1
n
i C ij +
j =1
i =1
C
i
i =1 j =1
i =
C
i
ij
C
i
i =1
io
i =1
n
io
i =1
k2 = 2 +
i C i0
i =1
k2 = 2
i 2
i =1
C
i
i0
i0
i =1
(5)
i =1
Los pesos pueden ser estimados a travs de la funcin de semivarianza, para lo cual se
requiere conocer la relacin entre las funciones de covariograma y de semivarianza. Antes
de esto conveniente tener en cuenta la siguiente notacin:
2 = V(Z(x)), ij = (h), donde h es la distancia entre los puntos i y j y anlogamente
Cij = C(h).
La relacin entre las dos funciones en cuestin es la siguiente:
1
2
ij = E ( Z ( x j ) Z ( x i )) 2
1
= E ( Z ( x j )) 2 2( Z ( x j ) Z ( x i ) + ( Z ( x i )) 2
2
1
1
= E ( Z ( x j ) 2 E Z ( x j ) Z ( x i ) + E ( Z ( x i )) 2
2
2
] [
1
1
E ( Z ( x j )) 2 k 2 + E ( Z ( x j )) 2 k 2 E Z ( x j ) Z ( x i ) k 2
2
2
1
[V (Z ( x))] + 1 [V (Z ( x))] COV Z ( x j )Z ( x i )
2
2
] [
] [(
= V [Z ( x)] COV Z ( x j ) Z ( x i )
= 2 C ij C ij = 2 ij
(6)
Reemplazando (6) en (1), (2) y (3) se determinan los pesos ptimos en trminos de la
funcin de semivarianza:
( k2 ) n
= j C1 j + C10 =
1
j =1
= 2
j =1
= 2
j =1
j 1j
j (
1 j ) + ( 2 10 )
j =1
+ 2 + 10
j =1
j 1 j + 2 + 10
j 1j
= 10
j =1
36
Similarmente,
( k2 )
=
2
2j
= 20
nj
= n0
j =1
( k2 )
=
n
j =1
El sistema de ecuaciones se completa con (4). De acuerdo con lo anterior los pesos se
obtienen en trminos del semivariograma a travs del sistema de ecuaciones:
11
.
.
n1
1
.
.
.
.
.
.
.
.
1n
.
.
.
.
. nn
. 1
1 1 10
. . .
. . .
. . .
1 n n 0
0 1
k2 = 2
i =1
k2 = 2 2
ij +
i +
i =1
i ij
i =1
k2 =
i io +
i =1
Los pesos de kriging ordinario tambin pueden ser estimados mediante el uso del
correlograma aplicando la siguiente relacin: ij = C ij 2 , caso en el que la correspondiente
varianza de prediccin estara dada por (Isaaks y Srivastava, 1989):
k2 = 2 1
i io +
37
Asumiendo que los errores de prediccin siguen una distribucin normal estndar y que
son independientes, un intervalo de confianza del 100(1-)%, 0< <1, para Z(x) es:
z * (x ) z
k , z * ( x ) + z1 k
1
2
2
38
Ilustracin
Suponga que se tiene una configuracin de datos como la que se presenta en el
esquema de abajo. Con base en siete datos observados (valores al lado del signo + por fuera
de los crculos numerados de 1 a 7) se quiere predecir un valor de la variable en el punto
donde se encuentra el signo de interrogacin, por fuera del circulo con el nmero cero.
6
2
+696
+477
+791
+606
0
3
+227
+783
39
C11
C 21
C
31
C
C ij = 41
C 51
C 61
C 71
1
C ij1
C io
C12
C13
C14
C15
C16
C17
C 22
C 23
C 24
C 25
C 26
C 27
C 32
C 33
C 34
C 35
C 36
C 37
C 42
C 43
C 44
C 45
C 46
C 47
C 52
C 53
C 54
C 55
C 56
C 57
C 62
C 63
C 64
C 65
C 66
C 67
C 72
C 73
C 74
C 75
C 76
C 77
0.127
0.077
0.013
0.009
=
0.008
0.009
0.012
0.136
1 10
1 5.11
1 0.44
1 0.20
=
1 0.49
1 0.26
1 0.05
0 1
0.008 0.042
0.077 0.012
0.126
0.013
0.156
0.139
0.118
0.141
0.085
0.188
0.136
0.121
0.156
0.139
0.118
0.141
0.188
2.180
1
0.173
C10 2.61
2
0.318
C10 3.39
0.129
C 0.89
3
10
41
0.086
C10 0.58
1
=
= C ij C io =
.
=
, de donde =
5
0.151
C10 1.34
6
0.057
C10 0.68
7
0.086
C10 0.18
0.907
1 1
Z
i
i =1
7
40
Suponga que hay una variable regionalizada estacionaria con media (m) y covarianza
conocidas. De manera anloga a como se define en modelos lineales (por ejemplo en
diseo de experimentos) el modelo establecido en este caso es igual a la media ms un error
aleatorio con media cero. La diferencia es que en este caso los errores no son
independientes.
Sea Z(x) la variable de inters medida en el sitio x.
E [Z ( x )] = m
Z ( x ) = m + ( x ) , con E [ ( x )] = 0 .
El predictor de la variable de inters en un sitio x0 donde no se tiene informacin se define
como:
Z * (x0 ) = m + * (x0 ) ,
con * ( x0 ) que corresponde a la prediccin del error aleatorio en el sitio x0. Despejando de
la ecuacin anterior * ( x0 ) = Z * ( x0 ) m .
El predictor del error aleatorio se define por:
n
i =1
i =1
* ( x 0 ) = i ( x i ) = i (Z ( x i ) m ) .
de donde el predictor de la variable de estudio es:
n
n
Z * ( x0 ) = m + i (Z ( xi ) m ) = m + i ( xi )
i =1
i =1
i =1
i =1
41
La estimacin de los pesos del mtodo kriging ordinario se obtiene de tal forma que
se minimice V ( * ( x0 ) ( x0 )) .
= E i ( xi ) ( x0 )
i =1
n
n
2
= E i ( xi ) j (x j ) 2 E i ( xi )( ( x0 )) + E ( ( x0 ))
j =1
i =1
i =1
2
i j E ( (xi ) (x j )) 2 i E ( (xi ) (x0 )) + E ( (x0 ))
i =1 j =1
i =1
usando:
i. E [ ( x0 )] = 0
ii. E ( ( xi ) (x j )) = COV ( ( xi ), (x j )) = C ij
2
iii. E ( ( xo )) = 2
) C
V * ( x0 ) (x 0 ) =
ij
2 i C i 0 + 2
i =1 j =1
(7)
i =1
n
n
n
n
V * (x 0 ) ( x0 )
2
1 C11 + 21 j C1 j + i j C ij 21C10 2 i C i 0 + 2
=
1
1
j =2
i= 2 j =2
i=2
= 21C11 + 2 j C1 j 2C10
j=2
n
= 2 i C1i 2C10
i =1
igualando a cero
n
C
1
1i
= C10 .
i =1
= j C ij = C i 0
i
j =1
Con las n ecuaciones resultantes se construye el siguiente sistema de ecuaciones:
(8)
42
C11 C12
C 21 C 22
M
M
C
n1 C n 2
L C1n 1 C10
L C 2 n 2 C 20
=
O M M M
L C nn n C n 0
) C
V * ( x0 ) (x 0 ) =
ij
i =1 j =1
2 i C i 0 + 2
i =1
i =1
j =1
i =1
i j Cij 2 i Ci 0 + 2
k2 =
k2 =
i C i 0 2 i C i 0 + 2
i =1
k2 =
i =1
n
2 i C i 0
i =1
En los dos mtodos kriging hasta ahora descritos el objetivo ha estado centrado en la
prediccin puntual. A menudo, sin embargo, se requiere estimar un bloque, o ms
precisamente, estimar el valor promedio de la variable dentro de un rea local.
Z ( A) = i Z ( xi )
i =1
43
.
.
C n1
1
1 1 C10
. . .
. . .
=
. . .
1 n C n0
0 1
C1n
.
.
.
.
C nn
.
.
.
C
n1
1
.
.
C1n
.
.
.
C nn
1 1 C1 A
. . .
. . .
=
. . .
1 n C nA
0 1
2
kB
= C AA i C iA + , con C AA = 2 C ij igual a la covarianza entre
A i / iA j / jA
i =1
44
En los supuestos hechos hasta ahora respecto a los mtodos kriging se ha asumido que
la variable regionalizada es estacionaria (al menos se cumple con la hiptesis intrnseca).
En muchos casos, la variable no satisface estas condiciones y se caracteriza por exhibir una
tendencia. Por ejemplo en hidrologa los niveles piezomtricos4 de una acufero pueden
mostrar una pendiente global en la direccin del flujo (Samper y Carrera, 1990). Para tratar
este tipo de variables es frecuente descomponer la variable Z(x) como la suma de la
tendencia, tratada como una funcin determinstica, ms una componente estocstica
estacionaria de media cero. Asuma que:
Z ( x ) = m( x ) + ( x )
con E ( ( x )) = 0 , V ( (x )) = 2 y por consiguiente E (Z ( x )) = m( x ) .
La tendencia puede expresarse mediante:
P
m( x ) = a l f l ( x )
l =1
Z * ( x0 ) = i Z ( xi )
i =1
n
E i Z ( x i ) = m( x 0 )
i =1
n
i m( x i ) = m( x 0 )
i =1
n
P
p
i a l f l ( x i ) = a l f l ( x 0 )
i =1
l =1
l =1
p
n
p
a l i f l ( x i ) = a l f l ( x 0 )
l =1
i =1
l =1
f (x ) = f (x )
i
i =1
l =1
Piezmetro: Instrumento utilizado para medir coeficientes de compresibilidad de slidos, lquidos y gases
45
i =1
n
n
= E i m( xi ) m( x0 ) + i ( xi ) ( x0 )
i =1
i =1
2
n
= E i ( xi ) ( x0 )
i =1
n
E ( (x ) (x )) 2 E ( (x ) (x )) + E ( (x ))
i
i =1 j =1
i =1
Usando
C ij = COV ( ( xi ), (x j ))
2 = E ( ( x0 ))2
se tiene
V Z * ( x0 ) Z ( x0 ) = i j C ij 2 i C io + 2 .
i =1 j =1
i =1
ku2 = i j C ij 2 i C io + 2 + l i f l ( xi ) f l ( x0 )
i =1 j =1
i =1
l =1
i =1
ku2 = i j ij + 2 i io + l i f l ( xi ) f l (x 0 )
i =1 j =1
i =1
l =1
i =1
ij
+ l f l ( xi ) = i 0 i = 1, 2, ..., n
j =1
l =1
f (x ) = f (x )
j
j = 1, 2, ..., p
j =1
46
en trminos matriciales
11
21
M
n1
f
11
M
f p1
12
22
M
n2
f 12
M
f p2
L 1n
L 2n
O M
L n2
L f1n
O M
L f pn
f 11
f 12
M
f 1n
0
M
0
L
L
O
L
L
O
L
f p1 1 10
f p 2 2 20
M M M
f pn n = n 0
0 1 f 10
M M M
0 n f p 0
ku2 = i i 0 +
f (x ) .
l
i =1
l =1
La tcnica kriging residuales empleada bajo las mismas circunstancias del kriging
universal, es decir en aquellos casos en que la variable regionalizada no es estacionaria
debido a la presencia de tendencia espacial en el valor promedio de la variable. La hiptesis
central del kriging residual consiste en suponer conocida la tendencia m(x). A partir de ella
se calculan los residuos con base en los cuales se aplica kriging ordinario. La estimacin de
la tendencia es generalmente llevada a cabo por medio de mnimos cuadrados. La
prediccin en un sitio no muestreado es igual a la tendencia estimada ms la prediccin del
error, es decir:
Z * ( x0 ) = m ( x0 ) + e * ( x0 )
n
e * ( x 0 ) = i e( x i )
i =1
los pesos o ponderaciones son estimados por kriging ordinario como se muestra en la
seccin 4.2. La varianza de prediccin de la variable de inters coincide con la varianza de
prediccin de los errores. En la figura 15 se muestra un esquema con el procedimiento
kriging residual en el caso de una tendencia lineal.
47
Figura 15. Representacin del procedimiento kriging residual. La superficie interpolada (arriba) es igual a la
suma de la tendencia lineal (centro) ms la prediccin de los errores (abajo).
48
I * (x 0 , z l ) = i ( z l )I ( xi , z l )
i =1
(z )E (I (x , z )) = F (z )
i
i =1
n
i (zl )F (z l ) = F (z l )
(z ) = 1
i =1
i =1
49
(z )
i
= 1.
i =1
n
ij
+ = i 0 i=1, 2, ..., n
i =1
Y * ( x 0 ) = i Y ( xi ) .
i =1
2
Z * ( x0 ) = exp Y * ( x0 ) + ko , donde ko2 es la varianza de prediccin obtenida en el
2
50
Prob. Acumulada
U ( x ) = 1 (Fn (Z ( x ))) .
1.20
1.2
1.00
1.0
0.80
0.8
0.60
0.6
0.40
0.4
0.20
0.2
0.00
0.0
0
20
40
60
80
-3
-2
Z(x)
-1
U(x)
iii.
51
Los valores medidos oscilaron entre 13.02 y 34.9 en el nivel superficial de la columna
de agua y entre 13.94 y 33.9 en el fondo de la misma, con valores promedios de 17.6 y
18.04, respectivamente (tabla 6). De los mapas de isolneas de distribucin de dicha
variable (Fig. 17), es posible concluir que existe gran homogeneidad en todo el cuerpo de
agua, con excepcin de la zona nororiental, puesto que los valores mximos y mnimos
predichos varan slo alrededor de 14 y 19 unidades.
En los dos mapas (superficie y fondo) de la figura 17, se evidencia la influencia que
tienen las entradas de agua dulce y marina sobre la magnitud de la variable dentro del
sistema. Las salinidades mximas se encuentran en la zona nororiental (zona estuarina)
donde hay entrada de agua marina a travs del sitio denominado Boca de la Barra (Fig. 1),
encontrndose all valores superiores a 30 unidades. Hacia la zona centro del cuerpo de
agua se presentan las menores magnitudes de la variable, valores entre 15 y 16 unidades, lo
que parece ser consecuencia del aporte de agua dulce que se da en la desembocadura de uno
de los tres ros (Ro Sevilla) que baja de la Sierra Nevada de Santa Marta (SNSM). As
mismo se puede observar que en el sector occidental del sistema se presentan valores
intermedios a los de las zonas antes mencionadas (alrededor de 19 unidades). Lo anterior
puede deberse al efecto de intercambio de aguas, por medio de los canales Grande y Clarn,
con el ecosistema Complejo Pajarales (Fig. 1), en donde se da un proceso de lavado de
suelos hipersalinos en poca de lluvias o cuando hay inundaciones. Dada la similitud en
magnitud y forma de distribucin que se observa en los mapas de superficie y fondo (Fig.
17), se podra pensar que para la poca seca del ao, no existe estratificacin de la columna
de agua respecto a esta variable.
Los valores de salinidad observados y predichos a travs de la tcnica kriging, resultan
bajos respecto a los registrados para esta misma poca en otros estudios (Giraldo et al.,
1995). Lo anterior podra deberse a un posible aumento en los caudales de los ros que
desembocan en la CGSM, durante los meses de lluvia precedentes al muestreo, como
consecuencia del efecto del fenmeno del nio en la regin a finales del ao 1996. No
obstante lo anterior, puede pensarse, dada la gran homogeneidad en la distribucin, que
para la fecha del muestreo no se estaban presentando aportes considerables de agua dulce,
por parte de los ros que desembocan en la CGSM, lo que significa un perodo de relativa
calma para los organismos que dependen de la salinidad para sus funciones y distribucin
(Reid y Wood, 1976).
Oxgeno Disuelto.
Los valores medidos de esta variable oscilaron entre 3.03 (mg/l) y 16.2 (mg/l) en la
superficie de la columna de agua y entre 2.09 (mg/l) y 13.4 (mg/l) en el fondo de la
misma, con valores promedios de 8.8 (mg/l) y 5.68 (mg/l), respectivamente (tabla 6).
Las correspondientes isolneas (Fig. 18), indican que en el fondo de la columna de agua se
presenta mayor homogeneidad en la distribucin, puesto que los valores predichos varan
entre 4.5 mg/l y 6.5 mg/l, con excepcin de una pequea zona en el sector nororiental frente
a la desembocadura del ro Sevilla (valores entre 6.5 y 9.5 mg/l), mientras que en superficie
52
existe considerable diferencia entre los valores ajustados en el centro del sistema (entre 9
mg/l y 13 mg/l) y los estimados para la zona sur y noroccidental del mismo (magnitudes
alrededor de 4 mg/l). Lo anterior sugiere la ocurrencia de procesos de estratificacin en el
sistema hacia la zona central del espejo de agua, donde la productividad se concentra
aportando grandes volmenes de oxgeno al agua durante el da (Reid y Wood, 1976;
Welch, 1992; Mancera y Vidal, 1994). Las isolneas, para ambos niveles de la columna de
agua, muestran que hacia las fronteras del sistema los valores del gas disminuyen. Este
comportamiento podra ser explicado al considerarse que en estas zonas existe intercambio
de flujos entre el sistema y otros cuerpos de agua, adems de aportes de hojarasca y
material orgnico, provenientes del manglar.
Slidos en suspensin.
Los valores para la variable, presentan algunas diferencias entre los dos planos de
muestreo. Los mnimos y mximos fueron de 103 mg/l y 318 mg/l en la superficie de la
columna de agua y de 86 mg/l y 310 mg/l en el fondo de la misma, con promedios de 218.2
mg/l y 215.3 mg/l, respectivamente (tabla 6).
El mapa de distribucin superficial (Fig. 19), revela la influencia que tienen los aportes de
agua sobre la magnitud de esta variable en el sistema. Se observa que las mayores
concentraciones se presentan en las zonas de las desembocaduras de los ros Fundacin y
Aracataca adems de la del cao Clarn (por medio del cual se da el aporte de agua del ro
Magdalena) y que las menores magnitudes se dan en el sector de intercambio de agua dulce
y marina (desde la zona centro y nororiental hacia el sitio denominado Boca de la Barra).
Una excepcin a este comportamiento se da en la desembocadura del ro Sevilla y del cao
Grande en donde las concentraciones de los slidos en suspensin son muy similares a las
observadas en el resto del cuerpo de agua.
El patrn de comportamiento de la variable en el fondo de la columna de agua es muy
similar al descrito en el prrafo de arriba respecto a los valores superficiales; es decir
mayores concentraciones hacia las desembocaduras de los ros y caos (zonas sur y noroccidental) y menores magnitudes en la zona nororiental. Sin embargo, la diferencia entre
los valores predichos en estas fronteras y los del resto del sistema (valores entre 220 mg/l y
210 mg/l), no resultan significativos como en el caso de la distribucin superficial (valores
entre 245 mg/l y 175 mg/l).
Una posible explicacin a la diferencia en magnitud de los valores de superficie y
fondo es que los flujos de agua dulce son menos densos y presentan mayores
concentraciones de slidos en suspensin, por lo cual al ingresar al sistema y encontrarse
con las aguas salobres del mismo (ms pesadas), tienden a permanecer en la superficie (lo
cual puede causar estratificacin. (Wheaton, 1977; Welch, 1992 ; Jay et al, 1997; Nixon,
1997).
Nitritos.
El in nitrito present valores entre 0.01 mol/l y 1.61 mol/l para la superficie de la
columna de agua y entre 0.01 mol/l y 2.39 mol/l en el fondo de la misma. Los valores
promedios fueron de 0.43 mol/l y 0.42 mol/l, respectivamente (tabla 6).
53
Los valores medidos de clorofila a oscilaron entre 2.91 g/l y 198.35 g/l en la
superficie de la columna de agua y entre 2.91 g/l y 194.75 g/l en el fondo de la misma.
Los valores promedios fueron 132.44 g/l y 136 g/l, respectivamente. Los bajos
coeficientes de variacin (menores del 30%), en ambos casos (superficie y fondo), indican
relativa homogeneidad en las mediciones de esta variable (tabla 6). Las isolneas de
distribucin calculadas con los datos predichos (Fig. 21) presentan algunos aspectos
comunes. En ambos mapas (superficie y fondo) se observa que los valores mximos
(alrededor de 160 g/l) se dan en el sur del sistema hacia la desembocadura del ro
Fundacin y las menores concentraciones se presentan en el sector ms nororiental (valores
menores de 50 g/l). La diferencia radica en el comportamiento en la zona centro del
espejo de agua. Mientras que en la superficie se presenta alta variabilidad (valores entre 90
y 160 g/l), en el fondo de la columna de agua los valores son muy homogneos (entre 130
g/l y 150 g/l) y se ajustan claramente a una tendencia creciente en sentido sur nororiente. El comportamiento distribucional representado en los mapas de isolneas puede
estar de acuerdo con las condiciones climticas de la poca. Bula-Meyer (1989) y Snchez
(1996), indican que en la poca ms seca del ao (poca en la que se realiz el muestreo)
predominan los vientos Alisios y que la circulacin de las masas de agua en el sistema
obedece a la fuerza del viento y a los cambios de marea en el Mar Caribe. Esto hace pensar
que los flujos de agua son ms lentos en la zona centro del sistema y por consiguiente, al no
presentarse un recambio de agua muy fuerte, se favorece el desarrollo de las comunidades
fitoplanctnicas, puesto que estas consumen los nutrientes que se liberan desde el
sedimento por accin de los vientos (Welch, 1992).
Giraldo (1996), encontr un comportamiento similar en la distribucin de esta variable
con datos promedios de la poca, calculados con informacin de varios aos anteriores a
1995. Sin embargo en la zona de la desembocadura de los ros, especficamente en la del
Fundacin, los valores reportados por dicho autor resultaron considerablemente ms bajos a
los encontrados en el presente estudio. Lo anterior puede estar indicando, como se
mencion en la interpretacin de los resultados obtenidos con la salinidad, una disminucin
54
55
7 30' W
7 30' W
MAR CARIBE
MAR CARIBE
Boca de la
Barra
Boca de la
Barra
C. Clarn
C. Clarn
R. Sevilla
R. Sevilla
C. Grande
C. Grande
R.
R. Fundacion
Ar
ac
at
ac
a
R.
10 45' N
Ar
ac
at
ac
a
10 45' N
R. Fundacion
Figura 17. Distribucin espacial de la salinidad del agua en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa de
la izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.
56
7 30' W
7 30' W
MAR CARIBE
MAR CARIBE
Boca de la
Barra
C. Clarn
Boca de la
Barra
C. Clarn
R. Sevilla
R. Sevilla
C. Grande
C. Grande
R.
A
R. Fundacion
ra
ca
ta
ca
R.
Ar
ac
at
ac
a
10 45' N
10 45' N
R. Fundacion
Figura 18. Distribucin espacial del oxgeno disuelto (mg/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa
de la izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.
57
7 30' W
7 30' W
MAR CARIBE
MAR CARIBE
Boca de la
Barra
C. Clarn
Boca de la
Barra
C. Clarn
R. Sevilla
R. Sevilla
C. Grande
C. Grande
R.
R. Fundacion
Ar
ac
at
ac
a
R.
10 45' N
Ar
ac
at
ac
a
10 45' N
R. Fundacion
Figura 19. Distribucin espacial de los slidos en suspensin (mg/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997.
El mapa de la izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.
58
7 30' W
7 30' W
MAR CARIBE
MAR CARIBE
Boca de la
Barra
C. Clarn
Boca de la
Barra
C. Clarn
R. Sevilla
R. Sevilla
C. Grande
C. Grande
R.
A
R. Fundacion
ra
ca
ta
ca
R.
10 45' N
Ar
ac
at
ac
a
10 45' N
R. Fundacion
Figura 20. Distribucin espacial de nitritos (mol/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa de la
izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.
59
7 30' W
7 30' W
MAR CARIBE
MAR CARIBE
Boca de la
Barra
Boca de la
Barra
C. Clarn
C. Clarn
R. Sevilla
R. Sevilla
C. Grande
C. Grande
R.
R. Fundacion
Ar
ac
at
ac
a
R.
10 45' N
Ar
ac
at
ac
a
10 45' N
R. Fundacion
Figura 21. Distribucin espacial de clorofila a (g/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa de la
izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.
60
7 30' W
7 30' W
MAR CARIBE
MAR CARIBE
Boca de la
Barra
C. Clarn
Boca de la
Barra
C. Clarn
R. Sevilla
R. Sevilla
C. Grande
C. Grande
R.
A
R. Fundacion
ra
ca
ta
ca
R.
10 45' N
Ar
ac
at
ac
a
10 45' N
R. Fundacion
Figura 22. Distribucin espacial de la profundidad (m) (izquierda) y transparencia (m) (derecha) en la Cinaga Grande de Santa Marta durante una jornada de muestreo
realizada en marzo de 1997.
61
Capitulo Cinco
Temas Especiales
En este captulo se presentan algunos temas que no aparecen explcitamente en libros
clsicos de geoestadstica, tales como el diseo de redes muestrales o el anlisis de
componentes principales sobre variables regionalizadas. As mismo se revisa la teora del
anlisis cokriging y de simulacin de fenmenos espaciales, bajo el supuesto de normalidad
multivariada.
5.1. Cokriging Ordinario
Si se tienen dos variables regionalizadas Zv1(x) y Zv2 (x) tomadas en sitios de la regin de
estudio, no necesariamente iguales, entonces el semivariograma cruzado entre ellas, se
estima por:
1
v1v2 ( h)=
2 nh
nh
{Z
v1 ( x
}{
+ h ) Z v1 ( x ) Z v2 ( x + h ) Z v2 ( x )
(9)
v1 ( h)= 0 0 ( h)+...+ m m ( h )
v2 ( h)= 0 0 ( h )+...+ m m ( h)
v1v2 ( h)= 0 0 ( h )+...+ m m ( h )
(10)
donde v1(h) y v2(h) son los semivariogramas simples, v1v2(h) es el semivariograma cruzado.
0(h), 1(h), . . ., m(h) son los modelos bsicos de semivariograma y , y son constantes.
Matricialmente:
v1 (h) v1v2 (h) m
= Bs s (h) , donde
(h)=
h
(
)
v
v
h
v
(
)
2
12
s=0
s
B s =
s
0
s (h)
(
h
)
s
s ( h )=
(11)
62
Predictor Cokriging
El mtodo de prediccin espacial cokriging consiste en hacer prediccin espacial de una
variable con base en su informacin y en la de algunas variables auxiliares que este
correlacionadas espacialmente con ella. El predictor cokriging tiene la siguiente expresin en
el caso en el que se considera una sola variable auxiliar:
n1
n2
a Z (x )+b Z
Zv*1 (xo)=
i =1
i v1
j v2 (x j )
(12)
j =1
v1(1,1)
M
(1,n)
v1
v1v2(1,1)
M
v1v2(1,m)
1
0
L v1( n,1)
M
M
L
L
M
L
L
L
M M M M
v1(n,n) v1v2(1,n) L v1v2( m,n) 1 0 an v1(0,n)
1
0
0
0 0 1 1
L
0
1
1
0 0 2 0
L
M
(13)
La matriz del lado izquierdo contiene los valores de las funciones de semivarianza y de
semivarianza cruzada calculadas para todas las distancias entre las parejas de puntos
consideradas. Las dos ultimas filas de dicha matriz son las correspondientes a la restriccin
de insesgamiento del predictor. ai y bj con i = 1, 2, ..., n y j = 1, 2, ...., m, son los parmetros
a estimar, 1 y 2 son los multiplicadores de Lagrange empleados para la restriccin de
insesgamiento y el vector del lado derecho contiene los valores de la funciones de
semivarianza y semivarianza cruzada evaluados para las distancia entre los sitios de
muestreo (de ambas variables) y el sitio donde se desea hacer la prediccin. Las dos ltimas
filas del vector estn asociadas a la condicin de insesgamiento. La correspondiente
varianza de prediccin del mtodo cokriging se calcula como (Bogaert et al, 1995):
n
i =1
j =1
(11)
63
de insesgamiento ai = 1 .
i =1
2
Cov(Z vi ( x k ), Z vi ( xl )) = vi vivi (k ,l ) es la funcin de covarianza espacial de la variable i,
i=1,2, evaluada para la distancia entre los sitios de muestreo k, l.
La ventaja del mtodo cokriging frente al kriging radica en el hecho de que cuando la
variable auxiliar est ampliamente correlacionada con la variable de inters se puede obtener
un disminucin en la varianza de prediccin, no obstante dicha variable tenga menor
densidad de muestreo. En situaciones en las que la variable objetivo tiene costos altos de
muestreo se recomienda la aplicacin de esta metodologa (Bogaert et al., 1995).
Kriging Probabilstico
Es un predictor basado en cokriging que utiliza como variables predictoras una variable
indicadora y una variable generada a travs de la transformacin uniforme.
Sea Z(xi) la variable observada, i = 1,2, . . ., n, entonces se definen las siguientes
transformaciones:
1 Si Z ( x i ) z
I ( xi , z) =
0 Otro caso
U ( xi ) =
R( Z ( x i )
n
con R( Z ( x i )) igual al rango (posicin que ocupa dentro de los datos ordenados de menor a
mayor) la i-sima observacin muestral. La prediccin de probabilidad de xito en el sitios
de inters est dada por:
*
I ( x0 ) =
I ( x , z) + v U ( x )
i
i =1
Los pesos i y
i =1
64
variables involucradas en el estudio. Esto puede ser una limitante computacional del
mtodo, cuando se incremente el nmero de variables. En la prctica se acostumbra a
seleccionar grupos de pocas variables (alrededor de 5, consideradas como las ms
relevantes) que estn muy relacionadas espacialmente y con base en la informacin de estas
hacer el anlisis para dos o tres matrices de corregionalizacin (incluyendo la de distancia
cero).
Correlacin Intrnseca.
Se dice que un conjunto de variables regionalizadas tiene correlacin intrnseca cuando
la estructura de correlacin de las variables es independiente de la distancia espacial (puede
haber correlacin para distancia cero), es decir cuando las funciones de semivarianza
cruzada, covarianza cruzada o correlacin cruzada, entre las variables, son constantes en
funcin de la distancia. La deteccin de correlacin intrnseca puede hacerse a travs de las
variables originales o por medio de los componentes principales generados. En la seccin
6.4.2., se menciona que los ejes principales deben ser independientes, luego se espera que
para cualquier distancia la funcin de semivarianza cruzada entre cualquier para de
componentes principales est alrededor de cero. En caso contrario habr relacin espacial
entre las variables. Existen dos formas de llevar a cabo el ACPR dependiendo de si las
variables tienen o no correlacin intrnseca.
ACPR en Presencia de Correlacin Intrnseca.
El algoritmo en este caso se inicia con el clculo de la matriz de corregionalizacin para
distancia cero (matriz de correlacin clsica) (en las otras distancias no hay correlacin entre
las variables). Posteriormente se aplica el ACP clsico se generan ejes factoriales que
explican, se espera que en un alto porcentaje, la variabilidad contenida en el conjunto total
de variables (idealmente dos o tres componentes deberan explicar ms del 90% de la
varianza total). Con base en la magnitud y le signo de los vectores propios se identifica el
peso de cada variable original en los correspondientes ejes. Finalmente se obtiene un mapa
de distribucin espacial, cumpliendo con las etapas bsicas del anlisis geoestadstico, que
permita dar una interpretacin simultnea del comportamiento de las variables involucradas
en el anlisis.
ACPR sin Correlacin Intrnseca.
En este caso se debe establecer en primer lugar un modelo lineal de corregionalizacin
entre las variables originales. Con base en este se calculan varias matrices de
corregionalizacin (una para cada distancia h fijada) y con cada una de ellas se realiza un
ACP clsico. Los resultados obtenidos en cada anlisis permiten establecer relaciones entre
las variables que no son observados en anlisis clsicos de correlacin .
65
Seleccin de Variables
Cuando se va a iniciar el estudio de un ecosistema natural, deben establecerse aspectos
referentes a su ubicacin geogrfica, a las condiciones climticas, hdricas y geolgicas del
mismo. La revisin debe incluir los antecedentes histricos de las variables ecolgicas e
incluso los factores econmicos, socio-culturales y demogrficos que enmarcan a la regin
de estudio. Todos estos aspectos permiten planear, desde un punto de vista logstico la
realizacin del muestreo.
Podra decirse que existen dos tipos de variables que deben tenerse en cuenta cuando se
realiza un estudio ambiental. Aquellas que estn directamente relacionadas con el fenmenos
ecolgico de estudio (contaminacin, calidad del agua, manglar, bentos, plancton, etc.) y
aquellas que permiten decidir respecto a aspectos relacionados con las frecuencia del
muestreo (variables climticas) y la ubicacin estratgica de sitios de muestreo (por ejemplo
variables hdricas como direccin y velocidad de las masas de agua, fuentes de entrada y
salida, etc)
As mismo la seleccin de las variables es consecuencia del tipo de estudio que se quiere
llevar a cabo. Estos pueden ser de lnea base, monitoreo y evaluacin. En el primero de estos
no hay antecedentes histricos respecto al fenmeno de inters, se asume total
desconocimiento respecto a la relacin, comportamiento y distribucin de las variables en
el ecosistema y por consiguiente se debe evaluar un nmero grande de variables, con amplia
intensidad de muestreo en la que se cubra toda la regin de estudio, de forma tal que se
pueda caracterizar de manera general el sistema. Si existe conocimiento de la regin de
estudio, hay estudios preliminares que posibilitan el planteamiento de estructuras de
correlacin espacial y temporal de las variables y se quieren establecer los cambios que se
estn dando en el ecosistema, por ejemplo por actividades antrpicas, es entonces un estudio
de monitoreo. En este caso debe establecerse con base en la informacin disponible tanto la
frecuencia como la ubicacin de los puntos de muestreo. Por ltimo cuando hay
conocimiento del ecosistema respecto al fenmeno de inters y se quieren observar posibles
variaciones muy puntuales respecto al patrn temporal o espacial tradicionalmente
observado, el estudio se denomina de evaluacin. En este ltimo caso el objetivo puede ser
el de conservar o mitigar posibles daos ms que el de hacer diagnstico como en el caso del
monitoreo.
Seleccin de la Red Optima de Muestreo
Como en cualquier procedimiento estadstico en el que se hace inferencia, en
geoestadstica cuando se hace prediccin en sitios o puntos de la regin de estudio no
observados, a travs de cualquiera de las tcnicas kriging, es necesario evaluar la precisin
de tal prediccin. Lo anterior se realiza, como se estableci en el capitulo 4 y en la seccin
5.1, por medio del clculo de la varianza del error de prediccin. De la seccin 4.2, para el
caso del kriging ordinario, la varianza de prediccin se calcula por:
66
= ii io +
2
i =1
Z ( x1 )
r
Z ( x 2 )
Z (x ) =
correspondiente
M
Z ( x )
n
a n variables
aleatorias en n sitios de muestreo de inters x1, x2, ..., xn. Asuma que el proceso estocstico
tiene vector de medias y matriz de varianzas y covarianzas
(x1 )
r
r
( x 2 )
E Z (x ) = (x ) =
,
M
( x )
n
( )
12
C
= 21
M
C
n1
C12
22
M
C n2
L C1n
L C 2n
, con C ij = COV Z ( x i ), Z x j
O
M
L C nn
( )) .
( )
67
5.5. Aplicaciones
5.5.1. Comparacin de los mtodos Kriging y Cokriging con base en resultados de anlisis
espaciales de Variables Fisicoqumicas y Biolgicas Medidas en el Estuario Cinaga
Grande de Santa Marta.
Semivarianza Cruzada
0
-10
-20
-30
-40
-50
0
5000
10000
15000
20000
25000
Distancia (h)
Figura 23. Semivariograma experimental cruzado entre las variables clorofila "a" (54 datos) e IGCi(4).
Informacin tomada en marzo de 1997 en la Cinaga Grande de Santa Marta.
v 2 (h )
v1v 2 (h )
69
Tabla 8. Varianzas de prediccin mnima, mxima y promedio ((g)2 /l) para la variable clorofila "a", usando
los mtodos kriging y cokriging (con base en informacin auxiliar de la variable IGC(4)). Entre parntesis se
encuentran la ganancia en precisin respecto al mtodo kriging con informacin incompleta.
MTODO
VARIANZA DE
VARIANZA DE
VARIANZA DE
PREDICCIN
PREDICCIN
PREDICCIN
MXIMA
MNIMA
PROMEDIO
Kriging con datos en 107 sitios de
379 (25%)
0
muestreo (informacin completa)
Kriging con datos en 54 sitios de
506 (0%)
0
194.147(0%)
muestreo (informacin reducida)
Cokriging con datos en 54 sitios de
488 (4%)
0
190.06 (2.1%)
muestreo para la variable clorofila
"a" y 114 datos para la variable
IGCi(4)
2.23
44.610
44.610
1.34
26.962
71.562
0.70
14.124
85.746
0.37
7.426
93.172
0.34
6.828
100.000
VARIABLE
COMPONENTE 1 COMPONENTE 2
Salinidad
0.5060
0.4150
Slidos en Suspensin
-0.3468
0.5668
Nitritos
0.2084
-0.6219
Silicatos
-0.5049
-0.3334
Clorofila "a"
-0.5703
0.9140
71
Figura 24. Funcin de semivarianza cruzada entre los dos primeros componentes principales generados con
informacin de algunas variables fisicoqumicas y biolgicas medidas en marzo de 1997 en el estuario Cinaga
Grande de Santa Marta.
7 30' W
MAR CARIBE
Boca de la
Barra
2.00
C. Clarn
1.00
R. Sevilla
0.00
C. Grande
-1.00
R.
Ar
ac
at
ac
a
10 45' N
-2.00
R. Fundacion
Figura 25. Distribucin espacial del primer componente principal generado con informacin de variables
fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta en marzo de 1997.
72
7 30' W
MAR CARIBE
Boca de la
Barra
C. Clarn
1.50
0.50
-0.50
R. Sevilla
C. Grande
-1.50
R.
Ar
ac
at
ac
a
R. Fundacion
-2.50
10 45' N
-3.50
Figura 26. Distribucin espacial del segundo componente principal generado con informacin de variables
fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta en marzo de 1997.
5.5.3. Diseo de una Red de Muestreo para el Estuario Cinaga Grande de Santa Marta.
73
Figura 27. Redes de muestreo bajo las cuales se hicieron las estimaciones de las varianzas de prediccin de
cada una de las variables consideradas, asumiendo los modelos de semivarianza estimados. Distancias entre
puntos de muestreo: a) 2000 m; b) 3000 m; c) 4000 m; d) 5000 m y e) 6000 m.
Resultados y Discusin
Si bien es posible que en la fecha del muestreo se estuviese dando un fenmeno de
intervencin debido a los cambios climatolgicos dados en el ao inmediatamente anterior a
este, para los propsitos del trabajo esto no resulta ser un inconveniente puesto que de hecho
se asume que el establecimiento del conjunto ptimo de puntos de muestreo no depende de
74
75
1200000
Costo ($)
1000000
800000
Red 6000
600000
Red 5000
400000
Red 4000
Clorofila "c"
Clorofila "a"
Silicatos
Nitritos
Seston total
Oxgeno dis.
Red 2000
Salinidad
0
Temperatura
Red 3000
Profundidad
200000
Figura 28. Costos de muestreo de variables fisicoqumicas y biolgicas en la Cinaga Grande de Santa Marta,
segn diferentes espaciamientos entre sitios de muestreo (se asumen muestreos sistemticos de cuadrculas).
De otro lado si se estudian los costos de muestreo asociados a cada variable bajo cada
una de las densidades muestrales (Fig. 28), se observa que existe considerable diferencia,
con excepcin de las variables temperatura, profundidad y salinidad, entre la red de 2000 m
y las restantes respecto a dichos costos. Para algunas de las variables (oxgeno disuelto,
silicatos y clorofilas) pasar de la red de 3000 m a la 2000 m, implica incrementar el costo de
muestreo de cada una de ellas en ms de $300000
En conclusin para las variables temperatura y salinidad sera mucho ms conveniente
hacer un muestreo intensivo (red ms densa) dado que se consigue, comparando con la red
menos densa, aumentar la eficiencia en
porcentajes considerables (23 y 35%,
respectivamente, tabla 12), con costos netos que se incrementan slo alrededor de $100000
(Fig. 28). En la variable profundidad, si bien los costos de muestreo no se incrementan
significativamente (Fig. 28), es ms aconsejable muestrear en la red menos densa dado que
la eficiencia se incrementa en mximo un 7% al compararla con las restantes redes (tabla
12). En las variables nitritos, seston total y clorofilas "a" y "c" hay poco aumento de la
eficiencia al pasar de la red de 6000 m a otras con mayor nmero de puntos (tabla 12) y por
el contrario los costos, especialmente en la red de 2000 m, tienen aumentos considerables,
lo que hace que se planteen las redes menos densas (5000 m y 6000 m entre puntos de
muestreo) como las ms adecuadas para el seguimiento de estas variables. En las restantes
variables (oxgeno disuelto, silicatos y clorofila a) es un poco ms compleja la decisin
dado que se obtienen aumentos considerables en los costos (Fig. 28), pero tambin
incrementos de eficiencia (tabla 12). De todas formas es claro que se debe descartar en este
caso la red con distancias entre puntos de muestreo de 2000 m dado que entre esta y la red de
3000 m, la eficiencia relativa aumenta en un mximo del 8 % (tabla 12) con costos que se
duplican o triplican para algunas variables (Fig. 28).
76
Apndice
6.1. Indicador IGCi(P).
Sitio
V1
V2
VP
1
2
3
M
n
x1
x2
x3
M
xn
y1
y2
y3
M
yn
01
01
01
M
01
01
01
01
M
01
L
L
L
M
L
01
01
01
M
01
11 12
21 22
M M
n1 n2
L 1P
L 2P
,
M M
L nP
= i , i , i = 1, L , n
ij
j =1
ij
= j , j , j = 1,2 ,L , P
j =1
77
Adems sea:
P
Siij = 1
j
Ki = ij , donde ij =
j =1
i P Siij = 0
donde:
Si i = 0
2P
h(P , i ) =
0
Si i = 1
(a b P ) Si m = 2 y = 2 , 3, L , P
m
i
i
m
a0 = 0
con :
am = am1 + (m 2 + m)
b0 = 1
bm = bm1 + (m 1)
m = 1, 2 ,L
m = 1, 2 ,L
(am
bm P )
am
bm
m
0
-1
3
4
1
2
2
8
-1
0
(2 + p )
(20 2 p )
(40 5 p )
(70 9 p )
20
40
70
112
14
168
20
10
240
27
11
330
35
12
10
440
44
13
11
572
54
14
12
728
65
15
13
910
77
(112 14 p )
(168 20 p )
(240 27 p )
(330 35 p )
(440 44 p )
(572 54 p )
(728 65 p )
(910 77 p )
78
ARREGLO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
i1
i2
i3
i4
i1
i2
i3
i4
0
1
0
0
0
1
1
0
1
0
0
1
1
1
0
1
0
0
1
0
0
1
0
1
0
1
0
1
1
0
1
1
0
0
0
1
0
0
1
1
0
0
1
1
0
1
1
1
0
0
0
0
1
0
0
0
1
1
1
0
1
1
1
1
0
1
1
1
1
2
2
2
2
2
2
3
3
3
3
4
-4
1
-3
-3
-3
1
1
-2
1
-2
-2
1
1
1
-1
1
-4
-3
2
-3
-3
2
-2
2
-2
2
-2
2
2
-1
2
2
-4
-3
-3
3
-3
-2
3
3
-2
-2
3
3
-1
3
3
3
-4
-3
-3
-3
4
-2
-2
-2
4
4
4
-1
4
4
4
4
Ki
-16
-8
-7
-6
-5
-1
0
1
1
2
3
5
6
7
8
10
P( P 2 ) IGC ( P )i
8
0
8
1
8
2
8
3
8
4
8
5
8
6
8
7
8
7
8
8
8
9
8
10
8
11
8
12
8
13
8
14
6.2.1. Matriz
a 21 a 22
.
.
A=
.
.
.
.
a m1 a m2
.
.
.
.
.
.
a1n
a 2n
.
.
.
a mn
A + D = a 21 a 22 + d 21
a 31 a 32 d 32
d 12
d 22
d 23
a 11 + d 11 a 12 + d 12
= a 21 + d 21 a 22 + d 22
a 31 + d 31 a 32 + d 32
b11
A B = a 21 a 22
b 21
a 31 a 32
b12
b 22
a 1i b i1
b13
= a 2i b i1
b 23
a 3i b i1
a1i b i2 a1i b i3
a 2i b i2 a 2i b i3
a 3i b i2 a 3i b i32
1 2
1 / 3 2 / 3
1 2 1 / 3 2 / 3 0 1
80
la inversa de una matriz 2x2, si existe, puede determinarse fcilmente por medio del
siguiente clculo:
1 a 22
a11 a12
= a
a 21 a 22
21
a 12
a 11
Dada una matriz A de orden (n x n), si existe un vector x (n x 1) y un nmero tal que
Ax = x. (A - I)x = 0
donde I es la matriz idntica de orden (n x n) y 0 es un vector (n x 1), entonces se llama a
y x, respectivamente, valor y vector propio de la matriz A. Pueden encontrarse hasta n
valores propios y hay tantos vectores propios como valores propios se encuentren. Los
valores de deben satisfacer que el determinante de A - I = 0. Los vectores propios se
calculan despus de reemplazar los valores propios encontrados en la expresin Ax = x. Al
igual que con la inversa, para matrices grandes se debe emplear un software especializado
para su obtencin. A continuacin, a manera de ilustracin, se realiza el clculo de los
vectores y valores propios de una matriz de orden 2 x 2.
6 3
Sea A =
, entonces
3 4
6 3
1 0
A I = 0
=0
3 4
0 1
6 3 0
=0
3 4 0
(6 )
(4 )
= 0
(6 )(4 ) 9 = 0
2 10 + 15 = 0
b b 2 4ac
2a
81
2
= 81623
.
, = 18377
.
10 40
2
Para cada valor propio existe un vector propio, el cual se obtiene reemplazando el valor
propio correspondiente en la primera expresin de la pgina anterior y usando la condicin
de que los respectivos vectores propios estn normalizados.
x1
Un vector x = se dice que est normalizado si satisface que
x2
x12 + x 22 = 1 .
=
(4 ) x 2 0
3
(6 ) x1 + 3x 2 = 0
3x1 + (4 ) x 2 = 0
Restando las dos ecuaciones anteriores y factorizando, obtenemos:
x1 (6 3) + x 2 (3 4 + ) = 0
x1 (3 ) + x 2 ( 1 + ) = 0
x1 =
(1 ) x 2
(3 )
x12 = (13847
.
) 2 1 x12
.
) 2 x12 = (13847
.
)2
x12 + (13847
2 = (13847
x12 1 + 13847
.
.
)2
x12 =
(13847
.
)2
2
.
1 + 13847
x1 =
.
13847
2
1 + 13847
.
= 0.8107
x1
0.8107
=
= 0.5855 .
13847
.
13847
.
82
x1 0.8107
Luego el vector propio asociado al valor propio = 8.1623 es =
x 2 0.5855
Efectuando un procedimiento similar se puede comprobar que el vector propio asociado al
x1 0.5847
valor propio = 1.8377 es =
x 2 0.8113
81623
.
0.5855 0
3 4 0
y, con el segundo valor y vector propio, que
.
0 0.5847 0
6 3 18377
=
18377
.
0.8113 0
3 4 0
6.3. Conceptos de Probabilidad
A continuacin se presenta una revisin no exhaustiva y a manera introductoria de conceptos
bsicos de la teora de probabilidades. Un estudio profundo y formal de estos se puede hacer
en Mood et al (1963) .
6.3.1. Variable Aleatoria
Si X es una funcin que le asigna a cada uno de los resultados de un experimento aleatorio
(aquel cuya respuesta no puede ser establecida de antemano) un nmero real, entonces X se
llama una Variable Aleatoria. Estas pueden ser discretas o continuas.
6.3.2. Funcin de Probabilidad
Si X es una variable aleatoria discreta. Se llamar a f(x) = P (X = x) funcin de probabilidad
de la variable aleatoria X, si satisface las siguientes propiedades:
i. f (x ) 0 x R X
ii.
f (x ) = 1 .
x
f (x )dx = 1
b
iii. P(a < X b ) = a f (x )dx para cualquier a y b, entonces f(x) es la funcin de densidad de
probabilidad de la variable aleatoria continua X.
83
g (x ) f (x )
E (g ( X )) = x
g (x ) f (x )dx
X discreta
X continua
E ( X ) = = x
xf (x )dx
X discreta
X continua
V ( X ) = 2 = E ( X )2
(x )2 f (x )
= x
(x )2 f (x )dx
X discreta
X continua
( )
V ( X ) = E X 2 [E ( X )]2
Modelo Normal
El modelo de probabilidad normal (Gaussiano) es til para encontrar las probabilidades
asociadas a eventos de variables aleatorias cuyas distribuciones de frecuencias son simtricas
alrededor del valor promedio. Algunos ejemplos de este tipo de variables aleatorias son los
siguientes:
Sea el valor promedio de la variable (E(X)) y 2 su correspondiente varianza (V(X)), entonces
las probabilidades de ocurrencia de eventos asociados a los posibles resultados de la variable
estudiada pueden ser encontrados usando la siguiente expresin, llamada modelo de
probabilidad normal:
b
P(a X b ) =
a
x 2
1 / 2
1
e
2
dx .
Obviamente resultara muy dispendioso tener que calcular estas integrales para cada valor de
a, b, y . Por esta razn se acude a un procedimiento llamado estandarizacin, el cul
consiste en hacer la transformacin Z = X . La variable anterior tendr (si la distribucin
z2
z1
1
2
1
z2
2
La ecuacin anterior tambin puede resultar difcil de evaluar, sin embargo para cualquier
valor de a, b, y las correspondientes probabilidades pueden hallarse, sin necesidad de
resolver la integral, empleando la tabla de distribucin acumulada normal estndar que
aparece en los textos de estadstica.
6.3.3. Funcin de Probabilidad Bivariada.
Si X y Y son dos variables aleatorias discretas. La probabilidad de X = x y Y = y est
determinada por la funcin de probabilidad bivariada f (x , y ) = P[X = x , Y = y ] donde :
i. f (x , y ) 0 , x , y RX , RY
ii.
f (x , y ) = 1
x
85
b d
f (x , y )dydx
a c
f (x , y )dydx = 1
f ( y ) = f (x , y )
x
por
f (x ) =
f (y) =
f (x , y )dy
f ( x , ydx )
f (x , y )
,
f ( y)
86
f (y / x) =
f (x ) > 0
f (x , y )
,
f (x )
x
y
E (g ( X ,Y )) =
g (x , y ) f (x , y )dydx si X y Y son continuas
Cov( X ,Y )
XY
3. V ai X i =
i =1
ai a j Cov (X i , X j ) .
i =1 j =1
Cov( X i , X i ) = V ( X i )
Si E ( X ) = E (Y ) , entonces
1
1
1
E ( X Y )2 = V ( X ) + V (Y ) Cov( X ,Y ) .
2
2
2
Yi = 0 + 1 xi + i
E (Y / X i ) = Yi = 0 + 1 xi
Yi : i-simo valor de la variable respuesta o dependiente en la poblacin
xi :i-simo valor de la variable predictora o independiente en la poblacin
0 y 1 son parmetros poblacionales que representan el intercepto y la pendiente,
respectivamente
i : i-simo error aleatorio en la poblacin.
Supuestos del Modelo.
1. E ( i ) = 0
2
2. V ( i ) =
3. Cov i , j = 0
4. i N (0 , 2 )
Modelo Muestral
yi = 0 + 1 xi + ei
yi = yi + ei
i =1
n
i =1
i2 = (Yi Yi )
i2
i =1
= (Yi 0 1 x i )2
i =1
i =1
i2 = Yi Yi
i =1
n
= 2 (Yi 0 1 x i ) = 0
i =1
i2
i =1
= 2 X i (Yi 0 1 x i )
= 0.
i =1
Yi = n 0 + 1 x i
i=1
i =1
i =1
i =1
i =1
xi Yi = 0 xi + 1 xi2
Las dos ecuaciones anteriores se conocen como ecuaciones normales. Dadas las
realizaciones y 1 , y 2 , K , y n las ecuaciones pueden resolverse para encontrar los estimados de
los parmetros:
n
i =1
i =1
yi = n 0 + 1 xi
y = 0 + 1 x
= y x
0
i =1
i =1
i =1
xi yi = (y 1 x ) xi + 1 xi2
n
n
yi
xi
n
i =1
xi yi = n 1 i=1n
i =1
n
n
2
x
+
1 xi
i
i =1
i =1
89
n
xi
y
i
i
n
n
i =1
xi yi = i =1 n i=1 1 n + 1 xi2
i =1
i =1
n
y i xi
x i y i i =1
1 =
(x i x )( y i y )
i =1
i =1
xi
n
i =1
2
x
i
n
i =1
n
i =1
n
( x i x )2
i =1
Se puede demostrar que los errores estndar estimados de los estimadores de los parmetros
corresponden a:
( )
s 1 =
s
n
(x i x )2
i =1
y s( 0 )
x i2
i =1
=s
n
2
n ( x i x )
i =1
ei2
con s =
i =1
n2
90
donde :
Y: Matriz cuyas columnas representan las nuevas variables (componentes principales).
Estas tienen la propiedad de ser no correlacionadas.
X: Matriz de datos originales
L: Matriz de vectores propios de: a) XTX, si X es la matriz de datos originales; b) S (matriz
de varianzas y covarianzas) si X es centrada; c) R (matriz de correlacin) si X est
estandarizada.
D: Matriz diagonal con valores en la diagonal iguales a la raiz cuadrada de los valores
propios de XTX , S o R.
La transformacin lineal para generar los componentes principales (matriz Y) se fundamenta
en el proceso de diagonalizacin de una matriz, XTX , S o R., segn el caso, a travs del
teorema de descomposicin del valor singular
91
Referencias
Anderson, T. W. 1984. An Introduction to Multivariate Statistical Analysis.
John Wiley & Sons, New York.
Biau, G., E. Zorita, H. von Storch & H. Wackernagel. 1997. Estimation of
precipitation by kriging in EOF space. GKSS, 97, E45.
Box, G. E. P. y G.M. Jenkins. (1976). Time Series Analysis Forecasting and
Control. Holden -Day, San Francisco.
Bogaert, P., P. Mahau & F. Beckers. 1995. The Spatial Interpolation of
Agroclimatic Data. Cokriging Software and Source Code. FAO, Rome.
Bula-Meyer, G. 1985. Un nuevo ncleo de surgencia en el Caribe colombiano
detectado en correlacin con las macroalgas. Bol. Ectrpica 12:3-25.
Carr, J. , D. Myers y Ch. Glass. 1985. Cokriging - A Computer Program.
Computers & Geosciences. 11(2), 111-127.
Clark, I. 1979. Practical Geostatistics. Elsevier Publishing, New York.
Cressie, N. 1989. Geostatistics. The American Statistician. 43(4): 611(23).
Cressie, N. 1993. Statistical for Spatial Data. John Wiley & Sons, New York.
Cressie, N. & M. M. Majure. 1995. Non-Point Source Pollution of Surface Waters
over a Watershed. Programme Abstracts of the third SPRUCE International
Conference. Merida, Mexico.
Day, J., C. Hall, M. Kemp, & A. Ynez-Arancibia. 1989. Estuarine Ecology. John
Wiley & sons, New York.
Deutsch , C. V. & A. G. Journel. 1992. GSLIB: Geostatistical Software Library
and Users Guide. Oxford University Press, New York.
Daz- Francs, E. (1993). Introduccin a Conceptos Bsicos de Geoestadstica.
Memorias Seminario Estadstica y Medio Ambiente. Centro de Investigacin
en Matemticas, CIMAT. Guanajuato, Mxico.
Diggle, P., L. Harper y S. Simon. (1995). Geoestatistical Analysis of Residual
Contamination from Nuclear Weapons Testing. Programme Abstracts of the
third SPRUCE International Conference. Merida, Mexico.
Englund, E. & A. Sparks. 1988. GeoEAS, Users Guide. EPA, Las Vegas.
Evangelos A. & G. T. Flatman. 1988. On Sampling Nonstationary Spatial
Autocorrelated Data. Computers and Geosciences. 14(5): 667(86).
Gamma Design. 1995. GS+. Geostatistical software for the Agronomic and
Biological Science, version 2.3. Plainwell, Michigan.
Garmin International, Inc. 1993. Garmin Communication and Navigation. GPS
100 SRVY II personal surveyor. Owners manual. Lenexa..
Giraldo, R., D. Ospna & N. Mndez. 2001. Design of a Sampling Network for an
Estuary in the Colombian Caribbean. Rev. Acad. Col. Cienc. 25(97):509-518
Giraldo, R. 2002. Construccin de un Indicador para el Estudio Conjunto de la
Distribucin Espacial de Mltiples Variables Binarias. Tesis de Maestra en
92
94