Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MS PedroPacheco PDF
MS PedroPacheco PDF
FACULTAD DE CIENCIAS
ESCUELA DE MATEMÁTICA
Caracas, Venezuela
Diciembre de 2008
AGRADECIMIENTO
A Dios por estar siempre a mi lado, darme salud, paz, amor, fortaleza e
iluminación para vencer todos los obstáculos y poder así alcanzar esta meta.
A mi tutor y amigo, Dr. José Rafael León, muchas gracias por todo su
tiempo invertido en la dirección de este trabajo y por confiar en mí.
ii
RESUMEN
iii
contaminación ambiental que presenta el Lago de Valencia. Estos resultados
pueden ser considerados por los organismos competentes en el área, al
momento de buscar soluciones que ayuden a mantener el equilibrio
ambiental del Lago de Valencia.
iv
ÍNDICE
LISTA DE FIGURAS…………………………………………………….... ix
INTRODUCCIÓN..………………………………………………………... 1
1 GEOESTADÍSTICA
v
1.8 Validación del modelo teórico……………………………………... 25
1.10 Estimación………………………………………………………….. 27
2 ANÁLISIS GEOESTADÍSTICO
2.6 Predicciones………………………………………………………… 70
2.6.2 Nitrato…………………………………………………………. 74
vi
2.7.4 Clorofila “a”, año 2002………………………………………. 81
SERIES TEMPORALES
vii
4.2 Metodología………………………………………………………….. 104
BIBLIOGRAFÍA…………………………………………………………… 129
viii
LISTA DE FIGURAS
Figura N° Página
9 Modelo Esférico………………………………………………………... 22
10 Modelo Exponencial…..…………………………………………….... 23
11 Modelo Gaussiano.………………………………………………….... 24
12 Modelo Potencia.…………………………………………………….... 24
14 Efecto Proporcional………………………………………………….... 27
18 Gráficos de caja para las variables nitrato y fósforo total………..... 37
x
33 Posiciones de las observaciones en el espacio para la variable
fósforo total……………………………………………………………… 50
xi
46 Estructura del semivariograma omnidireccional para la variable
nitrógeno total (tomando como incremento inicial h = 2.36 y
eliminando los valores extremos)…………………………………….. 62
xii
56 Rejilla de datos estimados para la variable nitrógeno total...…….. 71
xiii
66 Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año
1999)…………………………………………………………………...... 78
xiv
74 Imagen de contornos idóneo para la variable clorofila “a” con la
superficie del Lago de Valencia y su tabla de niveles de
concentración.………........................................................................ 84
xv
86 Función de autocorrelación parcial de la serie temperaturas
para la estación Tacarigua……………………………………………. 115
xvi
LISTA DE TABLAS
Tabla N° Página
xvii
INTRODUCCIÓN
Gran parte de los desechos que contaminan las aguas son consecuencia
de las actividades económicas, y a pesar del significado social que ellas
tienen en la generación de riquezas, se debe tomar conciencia sobre la
contaminación ambiental que ellas causan y así buscar soluciones que
ayuden a mantener el equilibrio ambiental.
1
mediciones de las sustancias muestreadas en el Lago de Valencia sin tener
en cuenta su distribución geográfica, en segundo lugar, calcular el
semivariograma experimental, en tercer lugar, ajustar al mismo el
semivariograma teórico que mejor explica la variabilidad espacial de los
datos, y por último se toma en consideración los modelos ajustados para
predecir los valores de las sustancias en posiciones no muestreadas, usando
el método de krigeaje puntual.
2
CAPÍTULO 1
GEOESTADÍSTICA
3
el éxito de esta técnica es la determinación de la función de correlación
espacial de los datos (Zhang, 1992). Su estimador, el Krigeaje, tiene como
objetivo encontrar la mejor estimación posible a partir de la información
disponible, y en efecto, el valor estimado obtenido Z*(x) de un valor real y
desconocido Z(x), consiste en una combinación lineal con pesos asociados a
cada localización donde fue muestreado un valor Z(xi) (i = 1,…,n) del
fenómeno estudiado. Observando dos condiciones fundamentales: 1.- que el
estimador sea insesgado. E(Z* - Z) = 0, y 2.- que la varianza Var(Z* - Z) sea
mínima, consiguiéndose de este modo minimizar la varianza de error de
estimación.
4
1.1 Variables aleatorias regionalizadas
5
como E(Z(xi)2) = Var(Z(xi)) + [E(Z(xi)]2 y será también una función
de la localización xi.
ρ(h) = 1 - γ(h)/C(0).
6
1.2 Hipótesis de la geoestadística
7
• Número de casos: Es el número de valores muestreados del
fenómeno en estudio, representados por n y los datos por xi,
i = 1,…,n. El conjunto de valores lo llamamos muestra. Este
conjunto permite construir la distribución empírica.
1 n
x= ∑ xi
n
i =1
⎧ xn + 1 si n es impar
⎪ 2
⎪
⎪⎪
M= ⎨
⎪ xn + xn
⎪ 2 +1
⎪
2
si n es par
⎪⎩ 2
La mediana es también llamada percentil 50, además los
datos no sólo se dividen en dos grupos, sino que se pueden
dividir en cuatro partes, cuartiles, donde Q1 = percentil 25,
Q2 = Mediana y Q3 = percentil 75, si los datos se dividen en 10,
8
tenemos los deciles. De forma general estas medidas se
pueden calcular por: [p(n+1)/100] ésima observación de los
datos ordenados ascendentemente, donde p es el percentil que
se desea calcular.
1 n
S = ( xi − x )
2
2
n −1
∑
i =1
n
∑ ( xi − x )
1 3
n
α3 = i =1
3
S
9
En la distribución normal la asimetría tiene valor
asintóticamente cero, un valor negativo indica una cola a la
izquierda y un valor positivo indica una cola a la derecha.
n
∑ ( xi − x )
1 4
n
α4 = i =1
4
S
La distribución normal tiene curtosis igual a tres, y es
llamada mesocúrtica. A las distribuciones más agudas, con
colas relativamente anchas, se les llama leptocúrticas, tienen
valores de curtosis mayores que tres, y las distribuciones más
bien achatadas en el centro se llaman platicúrticas, tienen
valores menores que tres, en ocasiones se acostumbra a definir
la curtosis como α4 - 3.
ε= S
n
• Coeficiente de variación: Es una medida de la variación
S
relativa de los datos y está dada por: CV = y en
x
S
porcentaje como: 100 CV = 100 % .
x
10
Proporciona una comparación entre la variación de grandes
valores y la variación de pequeños valores. Las técnicas de
Geoestadística Lineal que predominan en el campo de las
geociencias producen los mejores resultados cuando el
coeficiente de variación es menor que uno, CV < 1. Para CV > 1
se recomiendan técnicas de Geoestadística no Lineal (Cuador,
2004).
11
las abscisas aparecen los límites de las clases y en las
ordenadas las frecuencias correspondientes a cada clase.
12
N p (h)
1
γˆ(h) = ∑ (Z ( xi ) − Z ( xi + h))
2
2N p ( h ) i =1
13
• Una distancia, que representa la distancia máxima a que pueden
estar alejados los segundos puntos del par con respecto a la línea
que define la dirección de cálculo, conocido como ancho de banda.
14
b. El ángulo formado entre la línea que une los dos puntos del par y
la dirección 0o debe estar incluido entre α-dα y α+dα (figura 3).
15
Finalmente se representan gráficamente los valores de γˆ(h) en función
de h.
En la mayor parte de los casos γ(h) crece hasta cierto límite llamado
meseta, en otros casos puede crecer indefinidamente. El comportamiento en
el origen puede tener diferentes formas, las cuales son según Journel y
Huijbregts (1978), Armstrong y Carignan (1997), Chica (1987) (figura 6):
16
Discontinuidad en el origen: “Efecto de Pepita”, es el caso en
que γ(h) no tiende a cero cuando h tiende a cero. Representa a
una variable muy irregular.
17
• El valor idóneo del incremento h: Una inadecuada selección de
h puede proporcionar un semivariograma experimental errático,
aunque no se puede dar un criterio exacto o aproximado sobre
cuál es el mejor valor de h, es recomendable calcular γˆ(h) para
En Krajewski y Gibbs (1993) se presentan otras razones por los que los
semivariogramas son erráticos, las cuales son: 1.- No hay suficientes
muestras, 2.- Las muestras no son representativas del fenómeno, 3.- Las
clasificaciones de las muestras no son válidas, 4.- El área estudiada es no
homogénea, 5.- Pequeños o largos conjuntos de datos son necesarios, 6.-
18
Pequeñas o largas distancia deben ser calculadas, 7.- Más o menos
distancias deben ser calculadas, 8.- Pequeñas tolerancias son necesarias,
9.- Las muestras pueden tener localizaciones incorrectas, 10.- Los valores
muestreados pueden ser erróneos.
19
• El Efecto de Pepita (Nugget Effect): El semivariograma por
definición es nulo en el origen, pero en la práctica las funciones
obtenidas pueden presentar discontinuidad en el origen, a esta
discontinuidad se le llama efecto de pepita, en ingles (nugget
effect). Puede ser obtenido trazando una línea recta entre los
primeros puntos del semivariograma empírico y extender ésta
hasta que se intercepte con el eje Y. Si esta intersección ocurre
por debajo de cero, el valor asumido por este efecto es cero, pues
valores negativos de γ(0) no tienen significado y no son comunes.
El efecto de pepita se representa como Co.
20
1.7 Modelos teóricos de semivariogramas
⎧0
⎪ si h = 0
γ (h) =
⎪⎪
⎨
⎪
⎪C
⎪⎩
si h ≠ 0
21
a cierta distancia finita del origen se alcanza una estabilización, la
meseta. La tangente en el origen encuentra a la meseta en el
punto de abscisa (2/3)a, donde a representa el valor del alcance.
⎧ ⎛ 3⎞
⎪ ⎜3 h 1 h ⎟
⎪ C⎜ − ⎟ si h ≤ a
⎪ ⎜2
⎪ ⎝
a 2 a3 ⎟
⎠
⎪⎪
γ (h) = ⎨
⎪
⎪ C si h >a
⎪
⎪
⎪
⎪⎩
22
parámetro de escala. La tangente en el origen encuentra a la
meseta en el punto a = (1/3)a’.
⎛ h ⎞
⎜ − ⎟
γ (h) = C ⎜1 − e a ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠
⎛ h 2 ⎞⎟
⎜ −
γ (h) = ⎜ 2 ⎟
C ⎜1 − e a ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠
23
Figura 11. Modelo Gaussiano
α
γ (h) = m h con α ∈( 0, 2) y m ≥ 0 es el factor de escala
24
Se han presentado los modelos más usados en la práctica, aunque se
debe señalar que existen otros modelos.
25
decisivo, independiente de la forma utilizada en la elección del modelo
teórico y sus parámetros, es sin lugar a dudas, emplear los métodos de
mínimos cuadrados, bondad de ajuste u otras variantes.
26
Figura 13. Anisotropía Geométrica y Zonal respectivamente
1.10 Estimación
27
El krigeaje, es un interpolador de la geoestadística, que utiliza los
resultados discutidos en el análisis estructural. Inicialmente, Matheron
denominó a esta técnica Krigeage (en francés) que en ingles se convierte en
Kriging y en español se escribe Krigeaje. Este término que tiene su origen
en el apellido de D.G. Krige, reconociendo de esta forma su aporte. El
krigeaje es una técnica de estimación que proporciona el mejor estimador
lineal imparcial (BLUE, en ingles, Best Linear Unbiased Estimator), (Schaug
et al.,1993; Christensen et al.,1993; Abasov et al., 1990), y que además
proporciona un error de estimación conocido como varianza de krigeaje que
depende del modelo de semivariograma obtenido y de las localizaciones de
los datos originales (Armstrong y Carignan, 1997; Journel y Huijbregts, 1978;
David, 1977; Abasov et al., 1990). Esto brinda la posibilidad de hacer análisis
sobre la calidad de las estimaciones (Weerts y Bierkens, 1993; Haas, 1992).
28
teórico que refleje fielmente las características de variabilidad y correlación
espacial de la información disponible.
= ∑ λi Z ( xi ) + m ⎜1− ∑ λi ⎟⎞ ,
⎛
n n
Estimador: Z *(v) donde
i =1 ⎝ i =1 ⎠
E(Z(v)) = m y m es conocida
n
Sistema: C ( x j −v ) = ∑ λi C ( xi − x j ) , j = 1,…,n
i =1
n
Varianza de Krigeaje: σ k2 = C ( 0 ) − ∑ λiC ( xi −v)
i =1
• En términos de la covarianza
n
Estimador: Z * ( v ) = ∑ λi Z ( xi )
i =1
29
( )
n
Sistema: C ( x j −v ) = ∑ λiC xi − x j − ρ , j = 1,…,n
i =1
n
donde ρ es el multiplicador de Lagrange y ∑ λi = 1
i =1
n
Varianza de Krigeaje: σ k2 = C ( 0 ) − ∑ λiC ( xi −v ) + ρ
i =1
n
Estimador: Z * ( v ) = ∑ λi Z ( xi )
i =1
γ ( x j −v ) = ∑ λiγ ( xi − x j ) + ρ
n
Sistema: , j = 1,…,n
i =1
n
donde ρ es el multiplicador de Lagrange y ∑ λi = 1
i =1
n
Varianza de Krigeaje: σ k2 = ∑ λiγ ( xi −v ) + ρ
i =1
Γ0λ0 = γ 0 (1)
λ0 = ( λ1 ,K, λn , ρ ) , ρ
t
Donde es el multiplicador de Lagrange que
n
asegura que ∑ λi = 1, γ 0 = (γ (v − x1),K, γ (v − xn ),1)t ,
i =1
30
⎧γ ( x − x ) si i =1,..., n , j =1,K, n
⎪ i j
⎪⎪
Γ0 = ⎨ 1 si i = n +1 , j =1,K, n y Γ0 es una
⎪
⎪ 0 si i = n +1 , j = n +1
⎪⎩
⎡ 0 γ (x1 − x 2 ) K γ ( x1 − x n ) 1 ⎤ ⎡ λ 1 ⎤ ⎡ γ (v − x1 )⎤
⎢γ (x − x ) 0 K γ (x2 − xn ) 1 ⎥ ⎢λ ⎥ ⎢γ (v − x )⎥
⎢ 2 1 ⎥⎢ 2⎥ ⎢ 2 ⎥
⎢ M M K M M ⎥⎢ M ⎥ =⎢ M ⎥
⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢ γ ( x n − x1 ) γ (x n − x 2 ) K 0 1 ⎥ ⎢ λ n ⎥ ⎢γ (v − x n )⎥
⎢⎣ 1 1 1 1 0 ⎥⎦ ⎢⎣ ρ ⎥⎦ ⎢⎣ 1 ⎥⎦
P(Z(v) є A) = 95%.
31
CAPÍTULO 2
ANÁLISIS GEOESTADÍSTICO
32
Figura 16. Superficie del Lago de Valencia con sus estaciones de monitoreo
y tributarios
33
átomos libres en su estado basal. La cantidad de energía es medible y es
proporcional a la concentración de átomos que la absorben” (Loon V. y
Barfoot, 1989. Laboratorio de Geoquímica).
34
por último se realiza una prueba de significación para comprobar la
estacionaridad en las muestras, para todo esto se utiliza el
programa SPSS 15.
35
2.4 Análisis exploratorio de los datos
Variable
Nitrógeno Nitrito Nitrato Fósforo Clorofila
Estación
Total (mg/l) (mg/l) Total “a”
(mg/l) (mg/l) (mg/m3)
Nº 0 1.9 0.2 0.44 0.97 71
Nº 3 3.4 0.01 0.1 0.95 32
Nº 5 1.3 0.19 0.1 0.91 41
Nº 6 3.65 0.19 0.1 0.82 78.5
Nº 12A 2.63 0.29 1.07 0.97 20
Nº 16 1.3 0.01 0.35 0.96 93
Nº 17 1.53 0.2 0.39 0.92 37
Nº 20 3.51 0.09 0.95 0.93 43
Nº 24 2.27 0.88 0.88 0.93 39
Nº 33 4.65 0.21 0.1 1.09 67
Nº 34 1.5 0.37 0.1 0.71 76
Nº 39 10.3 0.01 0.1 0.92 82.5
Nº 40 2.8 0.01 0.1 0.82 50
Nótese que la unidad de medida para las variables nitrógeno total, nitrito,
nitrato y fósforo total es el miligramos por litro (mg/l), mientras que para la
variable clorofila “a” es el miligramos por metro cúbico (mg/m3). Es
36
importante resaltar que para el año 2004 no se tomó muestras en las
estaciones número 2, 4A, 7 y 25.
Figura 17. Gráficos de caja para las variables nitrógeno total y nitrito
Figura 18. Gráficos de caja para las variables nitrato y fósforo total
37
Figura 19. Gráfico de caja para la variable clorofila “a”
38
Tabla 2. Estadística descriptiva para las sustancias
Variable
Estadístico Nitrógeno Nitrito Nitrato Fósforo Clorofila
Total Total “a”
Media 2.54 0.15 0.37 0.92 56.15
Mediana 2.45 0.19 0.1 0.93 50
0.82, 0.92,
Moda 1.3 0.01 0.1 No Existe
0.93 y 0.97
Varianza 1.19 0.02 0.13 0.003 522.93
Desviación
1.09 0.14 0.36 0.05 22.87
Estándar
Coeficiente de
0.43 0.93 0.97 0.05 0.41
Variación
Error Estándar 0.31 0.04 0.1 0.02 6.34
Mínimo 1.3 0.01 0.1 0.82 20
Máximo 4.65 0.37 1.07 0.97 93
Amplitud 3.35 0.36 0.97 0.15 73
Coeficiente de
0.52 0.22 1.1 -1.26 0.1
Asimetría
Curtosis -0.7 -0.88 -0.35 0.7 -1.33
Primer Cuartil 1.51 0.01 0.1 0.91 38
Tercer Cuartil 3.48 0.21 0.66 0.96 77.25
39
histogramas para ver si la distribución de los datos de cada variable se ajusta
a la curva normal.
40
Figura 22. Histograma para la variable nitrato
41
Figura 24. Histograma para la variable clorofila “a”
42
Tabla 3. Prueba de normalidad Shapiro-Wilks
Estadístico
Variable Valor p
S.W.
Nitrógeno Total 0.92 0.32
Nitrito 0.88 0.09
Nitrato 0.98 0.29
Fósforo Total 0.97 0.39
Clorofila “a” 0.94 0.47
43
establecer la estacionaridad a partir de los modelos de regresión se realiza la
prueba de significación para determinar si la regresión es no significativa, es
decir, si las variables regresoras no aportan nada a la variable de respuesta.
Esta prueba de significación se plantea de la siguiente forma: H0 : b = c = 0
Vs Ha : b ≠ 0 ó c ≠ 0. A continuación presentamos en la tabla 4 los modelos
de regresión lineal múltiple para evaluar la estacionaridad.
44
2.5 Análisis estructural
45
Figura 26. Posiciones de las observaciones en el plano XY para la variable
nitrito (la unidad de medida es mg/l)
46
Figura 28. Posiciones de las observaciones en el plano XY para la variable
fósforo total (la unidad de medida es mg/l)
47
En estas figuras observamos muchas posiciones en la cuadrícula donde
no se tienen valores de las sustancias, pues son pocas las estaciones con
respecto a la superficie del Lago, por esta razón estimamos estos valores
con el método de krigeaje puntual, pero antes debemos calcular los
semivariogramas omnidireccionales. No hallamos los semivariogramas
direccionales puesto que los resultados son deficientes y esto es debido a
que en cada variable no existen valores a la distancia h, como se puede ver
las observaciones de cada variable están irregularmente espaciados. Ahora
bien antes de calcular los semivariogramas omnidireccionales, veremos el
posicionamiento de las observaciones de cada variable en el espacio.
48
Figura 31. Posiciones de las observaciones en el espacio para la variable
nitrito
49
Figura 33. Posiciones de las observaciones en el espacio para la variable
fósforo total
50
Ahora se hallan las nubes de variogramas para cada una de las variables.
51
Tabla 5. Muestras contiguas y sus distancias
52
γˆ(h) para distintos valores de h, hasta encontrar una forma
53
Tabla 6. Muestras y localizaciones de valores extremos en el gráfico de nube
Z(xi) Z(xi+h) h
(Z ( xi ) − Z ( xi + h)) 2
2
4.65 1.5 2.24 4.96
1.53 4.65 4.12 4.87
4.65 1.3 4.12 5.61
54
Figura 38. Nube de variogramas para la variable nitrato
55
Figura 40. Nube de variogramas para la variable clorofila “a”
56
Tabla 7. Muestras contiguas y sus distancias para cada una de las variables
57
tabla mostramos los valores extremos y las localizaciones de los valores
extremos en los gráficos de nube para cada variable.
(Z ( xi ) − Z ( xi + h)) 2
Variable Z(xi) Z(xi+h) h
2
Nitrito
0.01 0.37 2 0.065
Nitrato
0.1 0.88 3.61 0.3
0.1 0.1 5 0
0.1 0.1 5.83 0
0.44 0.35 7 0.0041
0.39 0.44 7.28 0.0013
0.88 0.95 9 0.0024
0.44 0.1 9 0.06
0.1 0.1 9.22 0
Fósforo Total
0.82 0.93 3.61 0.0061
0.91 0.82 4 0.0041
0.82 0.95 5 0.0084
0.92 0.82 5.83 0.005
0.93 0.82 11 0.0061
Clorofila “a”
37 93 2 1568
20 93 6.4 2664.5
58
Se calcula ahora los semivariogramas omnidireccionales para cada uno
de los incrementos iníciales encontrado, hasta conseguir la mejor estructura
de correlación espacial.
59
Figura 42. Estructura del semivariograma omnidireccional para la variable
nitrógeno total (tomando como incremento inicial h = 2 y eliminando los
valores extremos)
60
Cuando cambiamos de incremento inicial observamos un punto menos
calculado en este semivariograma experimental y una estructura que no
posee una forma suave, puesto que existe un decrecimiento pronunciado. A
continuación se extraerán las observaciones atípicas para ver si se logra
suavizar esta estructura.
En este caso podemos apreciar que esta estructura tiene una forma un
poco más suave comparada con las anteriores estructuras, por lo que se
puede decir que es una buena estructura de correlación espacial. Tomemos
ahora h = 2.36 para ver si nos arroja una estructura de correlación espacial
mucho mejor que esta.
61
Figura 45. Estructura del semivariograma omnidireccional para la variable
nitrógeno total (tomando como incremento inicial h = 2.36)
62
Como se puede apreciar esta estructura tiene una forma más suave que
la estructura de la figura 44, puesto que demuestra un crecimiento hasta un
punto y después alcanza una cierta estabilidad, por esta razón consideramos
que es la mejor estructura de correlación espacial. Nótese también que el
semivariograma es casi plano más allá de la distancia 4.5, sugiriendo que el
alcance de autocorrelación espacial termina en esa distancia (los puntos más
allá de 4.5 unidades de distancia no demuestra ningún cambio en el
semivariograma y así no está correlacionada espacialmente).
63
Figura 48. Estructura del semivariograma omnidireccional para la variable
nitrato (tomando como incremento inicial h = 2.36 y eliminando los valores
extremos)
64
Figura 50. Estructura del semivariograma omnidireccional para la variable
clorofila “a” (tomando como incremento inicial h = 2.36 y eliminando los
valores extremos)
65
A partir de los semivariogramas omnidireccionales con las mejores
estructuras de correlación espacial, se procede a probar los distintos
modelos teóricos. Se elige aquel que presente el mejor índice de bondad de
ajuste. Los resultados se muestran en la tabla 9.
Bondad
Variable Modelo Alcance Meseta Pepita Pend. Anis. Dir. de
Ajuste
Nitrógeno
Total
Esférico 4.7 1 0 ---- 1.7 90 0.094
66
El índice de bondad de ajuste se calcula de acuerdo a la siguiente
expresión:
D ⎡ γˆ(i) −γ (i) ⎤
2
n P(i)
IBA = ∑ n ⎢⎣ σ 2 ⎥⎦
i=0
∑ P( j ) d (i )
j =0
67
Figura 51. Modelo gaussiano ajustado a los datos del semivariograma
omnidireccional para la variable nitrógeno total
Figura 52. Modelo efecto de pepita ajustado a los datos del semivariograma
omnidireccional para la variable nitrito
68
Figura 53. Modelo gaussiano ajustado a los datos del semivariograma
omnidireccional para la variable nitrato
Figura 54. Modelo efecto de pepita ajustado a los datos del semivariograma
omnidireccional para la variable fósforo total
69
Figura 55. Modelo esférico ajustado a los datos del semivariograma
omnidireccional para la variable clorofila “a”
2.6 Predicciones
70
Figura 56. Rejilla de datos estimados para la variable nitrógeno total
71
Figura 58. Imagen de contornos para la variable nitrógeno total con la
superficie del Lago de Valencia y su tabla de niveles de concentración
72
Figura 59. Mapa de contornos para la variable nitrato con la superficie del
Lago de Valencia y su tabla de niveles de concentración
Figura 60. Imagen de contornos para la variable nitrato con la superficie del
Lago de Valencia y su tabla de niveles de concentración
73
2.6.2 Nitrato
Figura 61. Mapa de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración
74
Figura 62. Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración
75
Figura 63. Mapa de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 1998)
Figura 64. Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 1998)
76
2.7.1 Clorofila “a”, año 1998
Figura 65. Mapa de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 1999)
77
Figura 66. Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 1999)
78
Figura 67. Mapa de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 2001)
Figura 68. Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 2001)
79
2.7.3 Clorofila “a”, año 2001
Figura 69. Mapa de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 2002)
80
Figura 70. Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 2002)
81
Figura 71. Mapa de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 2004)
Figura 72. Imagen de contornos para la variable clorofila “a” con la superficie
del Lago de Valencia y su tabla de niveles de concentración (año 2004)
82
2.7.5 Clorofila “a”, año 2004
83
Figura 73. Mapa de contornos idóneo para la variable clorofila “a” con la
superficie del Lago de Valencia y su tabla de niveles de concentración
Figura 74. Imagen de contornos idóneo para la variable clorofila “a” con la
superficie del Lago de Valencia y su tabla de niveles de concentración
84
Al comparar detalladamente las figuras 71 y 73, notamos que en la figura
73 ya no son continuas las líneas de contornos y estas tienden a tener
diferentes direcciones, por lo que se concluye que estas últimas
estimaciones están más ajustadas a los verdaderos valores.
85
CAPÍTULO 3
SERIES TEMPORALES
86
El estudio de una serie temporal puede tener distintas motivaciones. El
tipo de análisis, así como los modelos en los que basemos el estudio,
dependerán en gran medida del tipo de preguntas que queramos responder.
Cuando las observaciones corresponden a una única variable, el análisis de
series temporales suele tener como objetivo construir un modelo para
explicar la estructura (descripción) y prever la evolución (predicción) de la
variable de interés. Cuando se observa simultáneamente un grupo de
variables, el objetivo que se persigue consiste generalmente en analizar las
posibles relaciones entre las variables observadas y su evolución conjunta.
Este último punto, debe ser tratado mediante técnicas multivariantes de
análisis de series temporales, pero en la presente investigación no
cubriremos este punto, solamente nos referiremos al análisis univariante de
series temporales.
87
⎧Estable
⎪
⎪
⎪ ⎧Sin tendencia
⎪ ⎪
⎪ ⎪ ⎧Creciente
⎪Inestable ⎨ ⎪
El nivel de una serie puede ser: ⎨ ⎪Con tendencia ⎨
⎪ ⎪ ⎪Decreciente
⎪ ⎩ ⎩
⎪
⎪
⎪Circunstancial ⇒ El fenomeno tiene un nivel estable
⎪ salvo comportamientos estacionales.
⎩
• Estacionalidad
88
∇X t = X t − X t − 1
componentes.
X t = f ( Ct , Tt , St , Et )
89
media de la serie. Refleja la dirección del movimiento de una
determinada variable; creciente, decreciente o estable.
90
Un proceso estocástico o proceso aleatorio es un concepto matemático
que sirve para caracterizar y estudiar todo tipo de fenómenos aleatorios
(estocásticos) que evolucionan generalmente con el tiempo.
γ t , s = C ov ( X t , X s ) t, s∈ Z
91
Un proceso estocástico es estacionario en sentido estricto si la función de
distribución conjunta de cualquier subconjunto de variables es constante
respecto a un desplazamiento en el tiempo.
F ( X 1 , K , X n ) = F ( X1 + h , K , X n + h ) ∀ n ∈ N , ∀ h ∈ Z
1. μt = E ( X t ) es independiente de t
Cov( X t + h , X t ) γ (h) ∀ h∈ Z , ∀ t ∈ Z
ρ (h) = =
Var ( X t + h ) ⋅ Var ( X t ) γ (0)
92
Propiedades de la autocorrelación:
a. ρ (h) = ρ (−h)
b. ρ (0) = 1
c. ρ (h) ≤ 1
93
Un proceso es ergódico cuando conforme h se hace más grande la
autocorrelación ρ (h) , se hace más pequeña, es decir que lo que ocurre
hoy, conforme va pasando el tiempo va teniendo menos importancia.
ρ (h) ⎯⎯⎯
h → +∞
⎯→0
X t = Zt + θ1 Zt -1 + θ2 Zt - 2 + K + θq Zt - q
Un proceso de medias móviles de orden q es un proceso en el
que la variable X se obtiene como un promedio de variables de
t
94
• La función de autocorrelación parcial de un modelo de medias
móviles tiene un decaimiento exponencial.
X t = Zt + φ1 X t -1 + φ2 X t - 2 + K + φ p X t - p
Un proceso autorregresivo de orden p es un proceso en el que
la variable X se obtiene efectuando una regresión sobre valores
t
X t = φ1 X t -1 + K + φ p X t - p + Zt + θ1 Zt -1 + K + θq Zt - q
95
El comportamiento general que suele tener el modelo ARMA es
que posee un decaimiento exponencial cuando aplicamos las
funciones de autocorrelación simple y parcial.
96
Este método nos proporciona un único parámetro cuantitativo y podrá ser
aplicado a series cuya estadísticas fundamentales (tales como media y
varianza) o dinámicas no son estacionarias (cambiando con el tiempo). Esto
está relacionado con medidas basadas en técnicas espectrales tales como
autocorrelación y transformada de Fourier.
El AFST fue introducido por Peng, 1994 y representa una extensión del
análisis de fluctuación (AF) (ordinario), que es afectado por la no
estacionaridad.
1⎛ 2⎞
n
σ = ∑ x − x 2 , se define la función de autocorrelación muestral
2
n ⎜ t =1 t ⎟
⎝ ⎠
C(k ) = ⎡ 1 n−k x x − 2⎤
como
1
∑
⎢ n − k t =1 t t + k x ⎥. Esta función mide la
σ2 ⎣ ⎦
dependencia del valor en la posición t con el valor en la posición t + k. Para
reciproco no es cierto.
k
−
Cuando una serie es tal que C (k ) ≈ e a
se dice que la serie tiene
97
economía, además de en diversas disciplinas científicas. Sin embargo, sean
del tipo que sean, su característica común es que aunque sirven para
generar series con correlaciones, éstas caen siempre de forma exponencial,
con lo que tenemos siempre correlaciones de corto alcance.
∞ ∞ ∞
∑ C ( k ) ≈ ∑ k ≈ ∫ k dk
−γ −γ
diverge.
k =1 k =1 1
Si en (2) se toma γ >1 , a pesar que las correlaciones decaen como una
ley de potencia, no se considera que las correlaciones sean de largo alcance
dado que son sumables.
98
largo alcance, dado que en este caso lo característico está dado por el
comportamiento asintótico (es decir para k grande) de C(k).
S ( f ) ≈ f −β
β = 1− γ
99
eliminar sistemáticamente tendencias de diferentes órdenes, y así detectar
correlaciones de largo alcance en series contaminadas con tendencias
polinomiales que pueden enmascarar la verdadera naturaleza de las
correlaciones. A continuación se dará una breve explicación del AFST.
T = { x1 , x2 ,K, xn } :
i
y ( i ) = ∑ ( xt − x ) con i = 1,K, n
t =1
(v) = 1 k
( yv ( i ) − tv ( i ) )
2
Fk2 ∑
k
i =1
100
Figura 75. Se divide el perfil de la serie en ventanas de longitud k, y para
cada ventana se realiza ajustes lineales que constituye la tendencia local
nk
F (k ) = 1
nk
∑ Fk ( v )
2
v =1
101
F ( k ) ≈ kα
α =1− γ , α=
1+ β
2 2
Debe tenerse presente que estas dos ecuaciones son exactas cuando
n → ∞ , y que sólo puede esperarse una concordancia limitada entre los
tres exponentes por efecto de la finitud de la serie temporal bajo estudio.
102
de grado m, de modo de tener una jerarquía de métodos, AFST1 (coincide
con el original AFST), AFST2, AFST3,..., que difieren entre ellos en el tipo de
no estacionariedades en T que pueden eliminar.
103
CAPÍTULO 4
4.2 Metodología
104
a. Análisis preliminar de las series temperaturas. En primer lugar,
realizamos gráficos de caja para detectar observaciones atípicas,
utilizando el software Matlab 7, en segundo lugar, efectuamos un
análisis estadístico descriptivo, histogramas y gráficos Q-Q plot
para verificar si las muestras provienen de una población normal,
en tercer lugar, empleamos los gráficos de secuencia para
observar el comportamiento de las series, en cuarto lugar,
aplicamos los gráficos de cajas por día y la función de
autocorrelación parcial para detectar si existen tendencias y
periodicidades en las series y por último realizamos gráficos de
dispersión por nivel para ver si se consigue que las series sean
estacionarias diferenciándolas, para todo esto se utilizó el paquete
SPSS 15.
105
4.3 Análisis preliminar de las series temperaturas
Figura 76. Gráficos de caja de las series temperaturas para las estaciones
Sucre y Tacarigua respectivamente
106
Tabla 10. Estadística descriptiva para las series temperaturas
Estación
Estadístico
Sucre Tacarigua
Media 24.69 25.23
Mediana 24.3 24.6
Moda 21.8 22.8 y 23.3
Varianza 11.84 5.95
Desviación Estándar 3.44 2.44
Coeficiente de Variación 0.14 0.1
Error Estándar 0.06 0.04
Mínimo 17.2 20.1
Máximo 32.7 31.1
Amplitud 15.5 11
Coeficiente de Asimetría 0.17 0.52
Curtosis -0.88 -0.86
Primer Cuartil 22.1 23.2
Tercer Cuartil 27.48 27.2
107
Figura 77. Histograma de la serie temperaturas para la estación Sucre
108
Figura 79. Q-Q plot para la distribución normal aplicada a la serie
temperaturas para la estación Sucre
109
En los histogramas podemos ver que la distribución de los datos no se
ajusta muy bien a la curva normal, pero cuando observamos los gráficos Q-Q
plot notamos que existe una tendencia a ajustarse a la línea recta, lo que nos
parece indicar que los datos de cada estación constituyen muestras
aleatorias que provienen de una población normal. Esta condición permite
continuar con el proceso de modelización sin transformar las series.
110
Figura 82. Gráfico de secuencia de la serie temperaturas para la estación
Tacarigua
111
Figura 83. Gráficos de cajas por día de la serie temperaturas para la estación
Sucre
Figura 84. Gráficos de cajas por día de la serie temperaturas para la estación
Tacarigua
112
Tabla 11. Medida de tendencia central para cada periodo de tiempo
113
La línea que aparece en el interior de cada una de las cajas de un box-
plot representa la mediana, es decir, el nivel de la serie, pues esta es una de
las posibles medidas de tendencia central. Una vez representado el nivel de
la serie lo estudiamos para determinar si es o no estable. Cuando
observamos los gráficos de cajas y la tabla 11 concluimos que los niveles de
las series son estables, puesto que los valores de las medianas son similares
en cada uno de los días. Ahora si tomamos en cuenta que las series poseen
unos picos que se repiten periódicamente, se concluye entonces que las
series tienen un nivel circunstancial.
114
Figura 86. Función de autocorrelación parcial de la serie temperaturas para
la estación Tacarigua
115
Figura 87. Gráfico de dispersión por nivel de temperatura por día para la
estación Sucre
Figura 88. Gráfico de dispersión por nivel de temperatura por día para la
estación Tacarigua
116
Como podemos ver no existe dependencia entre variabilidad y nivel en las
estaciones Sucre y Tacarigua, pues los puntos en ambas gráficas no se
ajustan a una línea recta, así que podemos decir que las series no son
estacionarias en nivel, o sea se consigue que ambas series sean
estacionarias diferenciándolas.
117
Figura 90. Función de autocorrelación parcial de la serie diferenciada para la
estación Sucre
118
Figura 92. Función de autocorrelación parcial de la serie diferenciada para la
estación Tacarigua
119
Tabla 12. Parámetros de los modelos ajustados para las series temperaturas
Sucre
AR(4) -1.01 0.85
-1.01
-1.07
-0.83
Tacarigua
AR(7) -0.82 0.88
-0.72
-0.75
-0.48
0.35
0.07
0.07
120
4.5 Predicciones
121
Figura 94. Modelo AR(7) ajustado a la serie temperaturas para la estación
Tacarigua y su predicción
122
4.6 Análisis de fluctuación sin tendencia
Figura 95. Gráfico log-log del resultado del análisis AFST para la estación
Sucre
123
Figura 96. Gráfico log-log del resultado del análisis AFST para la estación
Tacarigua
Estación α
Sucre 0.88
Tacarigua 0.28
124
exponencialmente. Se ha demostrado (Koscielny Bunde, 1996 y 1998) que
los datos de temperatura atmosférica (uno elegido aleatoriamente de 14
regiones continentales) muestran fuertes correlaciones cuando aplicamos el
125
CONCLUSIONES Y RECOMENDACIONES
Conclusiones
126
cambios seguramente serán graves y se harán sentir en todo el
ecosistema del Lago y sus zonas contiguas.
Recomendaciones
127
Valencia para que pensemos un poco en las consecuencias que ya se
detectaron y en las que se puedan detectar en un futuro.
128
BIBLIOGRAFÍA
• Beran J., 1994, Statistics for Long-Memory Processes, Chapman & Hall,
New York.
• Carr J.R., 1995, Numerical Analysis for the Geological Sciences, Prentice
Hall Inc, 592p.
129
Explotación de Recursos Minerales, Tesis Doctoral, Universidad de
Granada, España, 387 p.
130
Geology, Vol. 30. No. 4. pp. 323-345.
• Ho K.K.L., Moody G.B., Peng C-K., Mietus J.E., Larson M.G., Levy D.,
y Goldberger A.L., 1997, Predicting survival in heart failure cases and
controls using fully automated methods for deriving nonlinear and
conventional indices of heart rate dynamics. En: Circulation, 96, pp. 842-
848.
• Koscielny Bunde E., Bunde A., Havlin S. y Goldreich Y., 1996, Physica
A 231, 393.
• Koscielny Bunde E., Bunde A., Havlin S., Roman H.E., Goldreich Y. y
Schellenhuber H.-J., 1998, Phys. Rev. Lett. 81, 729.
131
• Lamorey G. y Jacobsom E., 1995, Estimation of Semivariogram
Parameters and Evaluation of the Effects of Data Sparsity, Mathematical
Geology, Vol.27, No.3, pp. 327-358.
132
and variogram modelling in 2D, International Workshop on Statistics of
Spatial Processes-Theory and Applications, Bari, Italy 27-30 September
1993.
• Pannatier Y., 1996, Variowin. Software for Spatial Data Analysis in 2D.
Springer, Statistics and Computing.
• Peng, C.-K., Buldyrev S.V., Havlin S., Simons M., Stanley H.E. y
Goldberger A.L., 1994, Phys. Rev. E 49, 1685.
• Shumway R.H. y Stoffer D.S., 2006, Time Series Analysis and Its
Applications With R Examples, Second Edition, Springer.
133
• Wackernagel H., 1995, Multivariate Geostatistic, an Introduction with
applications, Berlin: Springer, 256 p.
• Witt A., Kurths J. y Pikovsky A., 1998, Phys. Rev. E 58, 1800.
• http://geologia.cicese.mx/labs/lab_geoquim.htm - [12/12/2007].
134
• http://giscenter.isu.edu/training/geostats/Probsets.pdf - [09/01/2008].
• http://www.gisits.com/docs/Mini_manual_surfer.PDF - [09/01/2008].
• http://www.ilec.or.jp/database/sam/sam-05.html - [12/12/2007].
• http://www.mathworks.com/matlabcentral/fileexchange/19795#comment -
[22/07/2008].
• http://www.monografias.com/trabajos14/geoestadistica/geoestadistica.sht
ml - [15/11/2007].
• http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0304-
28472006000100009&lng=en&nrm=iso&tlng=es - [12/12/2007].
• http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1561-
08882006000200009&lng=en&nrm=is - [09/01/2008].
• http://www.seh-lelha.org/noparame.htm - [17/05/2008].
• http://www.telefonica.net/web2/biomates/explora/explora_shapirow/explor
a_shapirow.htm - [17/05/2008].
135