Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ia
Des
arrollo
estigac
Inv
i
Ciencia
Jhon William
Cely Pulido1
Willington Libardo
Siabato Vaca2
Alber Hamersson
Snchez Ipia3
Adriana Patricia
Rangel Sotter4
ABSTRACT
Some people say that Geostatistics is "the art of
modeling spatial data". A more specific definition is:
"Geostatistics is a statistical methodology used to estimate,
forecast, and simulate correlated spatial data, which uses in
its analysis exploratory and interpolative methods2"
Geostatistics is a useful tool for improving
estimations of a variable for non-measured locations
if it is compared with other estimation techniques,
for example, IDW (Inverse Distance Weighted
interpolation).
2
3
4
I. INTRODUCCIN
La geoestadstica es una tcnica estadstica usada
para la estimacin, prediccin y simulacin de datos
correlacionados espacialmente, que se ha conocido
como el arte de modelar datos espaciales.
Su importancia radica en que permite describir la
continuidad espacial de las variables y estimar valores muy
cercanos a los reales en puntos desconocidos.
El objetivo principal para esta etapa de la investigacin es crear un modelo Geoestadstico sustentado en tcnicas de interpolacin espacial y compararlo con los resultados obtenidos en el Modelo de Pluma de Gauss.
La Geoestadstica tuvo su origen en procesos de
bsqueda y exploracin de minerales, es por esto la
asignacin del prefijo "GEO" para referirse a ciencias de la tierra. A lo largo de su evolucin se han
identificado cuatro generaciones:
Geoestadstica Lineal: Dedicada a la teora de las
funciones aleatorias.
Geoestadstica no Lineal: Dedicada a la aplicacin
minera y a la gran difusin de esta ciencia.
Vol. 7 No
.2
No.2
Ingeniera
31
La geoestadstica
como tcnica de
prediccin hace
parte de los
procesos de
interpolacin
espacial.
El objetivo
principal para
esta etapa de la
investigacin es
crear un modelo
Geoestadstico
sustentado en
tcnicas de
interpolacin
espacial.
32
Vol. 7 No
.2
No.2
Ingeniera
El semivariograma esta
descrito por tres
parmetros,
Nugget Pepita,
Sill Meseta y
Range Rango.
pesos de la variable por el valor mismo de dicha variable, de tal manera que la ecuacin bsica que representa Kriging es:
Z ( x0 ) = w1Z ( x1 ) + w2 Z ( x2 ) + ... + wn Z ( xn )
n
Z ( x0 ) = w1 * Z ( x1 )
i =1
La geoestadstica
utiliza mtodos
exploratorios y
de interpolacin.
Ingeniera
33
Informacin
bsica.
Anlisis
exploratorio de
Datos.
Anlisis
estructural y
clculo.
Seleccin de
Variables.
Seleccin del
mtodo.
Prueba
comprobacin y
seleccin.
Resultado de la
estimacin.
Para realizar un
buen anlisis
Geoestadstico se
debe realizar un
proceso iterativo
para poder
obtener
resultados
ptimos, este
proceso consta
de 7 pasos que
conforman una
metodologa
producto de esta
etapa de la
investigacin.
34
Vol. 7 No
.2
No.2
Ingeniera
utilizar en el modelo (Se recomienda que el tamao del Lag sea similar a la distancia promedio que
existe entre la ubicacin espacial de los datos). Se
define si hay isotropa o anisotropa mediante el
anlisis del Semivariograma desde diferentes ngulos de referencia; con base en la existencia o no
de la autocorrelacin direccional se debe definir la
vecindad de anlisis para cada uno de los datos y
posteriormente se hace la verificacin del error de
prediccin, lo cual se puede realizar mediante Validacin Cruzada que usa todos los datos para predecir la autocorrelacin del modelo, cuyo procedimiento es omitir un valor de la variable y predecir dicho valor con los dems datos, luego se compara la prediccin y el valor medido de la variable,
este proceso se repite para cada uno de los valores
muestreados.
6. Prueba, Comprobacin y Seleccin. Se hacen diferentes ensayos para escoger el mejor mtodo, ya
sea determinstico o estocstico, y el mejor modelo dentro de ellos; en la prctica es realizar los pasos 4 y 5 tantas veces como sea necesario para
encontrar el mejor modelo Geoestadstico. Escoger el mtodo ms apropiado depende del tamao
de la muestra y la precisin que se desee obtener
en la prediccin. Similarmente escoger el mejor
modelo se fundamenta en seleccionar aquel cuyos
errores de prediccin sean mnimos. Si los resultados obtenidos en esta etapa no estn dentro de
parmetros especificados en el planteamiento del
problema, se debe regresar al paso 1, es decir,
mejorar la muestra y volver a realizar el ciclo de
anlisis.
7. Salida Final. Los resultados se pueden observar
en tablas como las de la Validacin Cruzada,
Histogramas, QQPLOT (muestra los quantiles de
las diferencias entre los errores estandarizados y
los quantiles correspondientes de una distribucin
normal), Anlisis de Tendencia, Nubes de puntos
del Semivariograma o del covariograma, etc. y/o
en mapas como los de Prediccin, Probabilidad,
Prediccin del error estndar y de quantiles para
cada uno de los anteriores pasos.
Este proceso se debe repetir para cada una de las
variables que se deseen estimar dentro del anlisis a
realizar. Este esquema metodolgico es uno de los
aportes generados por este proyecto, el cual permite
realizar el anlisis Geoestadstico en forma general
para cualquier solucin planteada ante un fenmeno
de ubicacin espacial.
MODELO GEOESTADSTICO
PARA BOGOT
Aplicando el modelo geoestadstico para el caso
particular de Bogot y teniendo en cuenta las consideraciones locales se realizaron los siguientes procesos y obtuvieron los siguientes resultados.
INFORMACIN UTILIZADA
La informacin utilizada para esta etapa de la investigacin es coincidente con la base de datos
implementada en la fase inicial que contiene las mediciones del DAMA en el periodo 1997-2000, esta
base de datos incluye tal y como ya se mencion
anteriormente informacin de las variables humedad, presin, radiacin, temperatura, lluvia, velocidad del viento, direccin del viento, azimut, elevacin, metano, monxido de carbono, xidos de nitrgeno, dixidos de nitrgeno, ozono, material
particulado y dixido de azufre. Es de destacar que
en general las mediciones de las variables estn en
registros horarios diarios para cada mes, sin embargo, por diversas razones no hay mediciones para algunos periodos de tiempo.
La grfica de Caja y Bigote esta formada por cuatro elementos: Bigote, Caja, Puntos y Lnea. El bigote indica el rango de distribucin de los datos, es
decir el valor mximo y mnimo de la muestra; la
varianza est representada por la caja, la amplitud de
est es directamente proporcional al valor de la
varianza; la Lnea ndica la mediana de la muestra, la
ubicacin relativa de la lnea y la caja con respecto al
bigote representan el sesgo de la muestra, si la lnea
se encuentra en la mitad de la caja indica que la media y la mediana son muy cercanas, siendo esto tpico en las distribuciones normales; los puntos en la
grfica son valores atpicos y pueden o no estar presentes en ella.
Se selecciona esta variable porque es uno de los tipos de sustancias conocidas como contaminantes primarios que influye en la calidad del aire de la ciudad,
adems desde el punto de vista de la salud humana
son de mayor inters las partculas cuyo tamao no
excede las 10 micras (PM10) debido a que pueden
ingresar al tracto respiratorio y producir daos en los
tejidos y rganos que lo conforman, y adicionalmente
existen valores de esta variable en la mayora de las
estaciones metereolgicas medidas a diario.
MARCO Y ANLISIS
El anlisis se realiza para los das 24 de Abril de
2000, 13 de Febrero y 26 de Abril de 2001 a las 14
horas, adems se incluye el da del 15 de Febrero de
2002, este periodo se tiene en cuenta por ser la fecha
actualizada que ms mediciones tiene sobre la variable a analizar.
El anlisis consiste en escoger entre los mtodos
de interpolacin existentes dos o ms para hacer estimaciones y comparar los resultados que arrojan
cada uno de los mtodos seleccionados. Se utiliz
entonces para hacer el anlisis un mtodo
determinstico y uno estocstico, el mtodo
determinstico seleccionado fue Interpolacin por
Distancia Inversa mientras el estocstico fue Kriging
Ordinario, se selecciona Distancia Inversa porque es
el mtodo de interpolacin ms sencillo, utiliza po-
Ingeniera
35
RESULTADOS DE LA ESTIMACIN
Dentro de los resultados que se obtuvieron en el
anlisis Geoestadstico, uno de los ms importantes es el mapa de estimaciones. Se ilustran distribuciones espaciales estimadas por los dos mtodos
nombrados.
36
Vol. 7 No
.2
No.2
Ingeniera
COMPARACIN
DE LOS MODELOS
El modelo Geoestadstico toma en
cuenta las mediciones que representan el comportamiento de la variable
medida en cada una de las zonas en
donde se encuentran ubicadas las estaciones de muestreo, por otro lado,
el modelo de Pluma de Gauss involucra las fuentes de emisin in situ una
por una, siempre y cuando se
involucren en el anlisis; esto implica que el modelo de Pluma de Gauss
sea ms preciso a la hora de clasificar los contaminantes segn su origen, permita involucrar una muestra
ms representativa a la hora de un
anlisis debido a que es ms sencillo
y econmico tomar los datos de una
fuente directa como las chimeneas,
que construir una estacin de
monitoreo, pero tiene restricciones,
pues no tiene en cuenta la correlacin espacial entre las diversas variables que intervienen en el fenmeno
de contaminacin atmosfrica que si
es tenido en cuenta en el modelo
Geoestadstico.
De lo anterior se deduce que el
modelo Gaussiano puede llegar a
diferenciar el comportamiento y/o
distribucin de gases contaminantes y material particulado por diferentes tipos de origen como el
antropognico y el natural, mientras que el Geoestadstico no.
A travs del modelo Geoestadstico
se tiene un mejor manejo de los datos
que se desean analizar, pues permite
el control del error de las predicciones desde la misma formulacin del
algoritmo de interpolacin, permite
conocer el grado de auto-correlacin
entre los puntos muestreados para poder modelarla y dar como resultado la
estimacin. El algoritmo de estimacin usado dentro de la Geoestadstica
tiene la caracterstica de ser BLUE
(Best Linear Unbiased Estimator) en
la medida en que se cumplan los supuestos del modelo.
CONCLUSIONES
De acuerdo a la muestra tomada
para hacer el anlisis de Material
Particulado (PM10) en la zona urbana de Bogot para los das analizados
se concluye que el mejor mtodo de
interpolacin entre los utilizados es
Distancia Inversa, para ello la herramienta de decisin utilizada fue la Validacin Cruzada. Aunque Kriging es
considerado BLUE sus estimaciones
obtienen un intervalo de error mayor
al de Distancia Inversa posiblemente
debido al tamao de muestra con el
que se cuenta.
Para los das que se tomaron como
muestra, la contaminacin producida
por Material Particulado en la zona
Urbana de Bogot no es uniforme,
presenta una mayor concentracin en
el costado occidental y sur de la ciudad, esta situacin es el reflejo de la
ubicacin de fuentes fijas de contaminantes tales como zona industrial,
canteras, relleno sanitario y plantas
asflticas. La menor concentracin de
Material Particulado se encuentra en
el costado oriental de la ciudad lo cual
con seguridad es producido por el
gran pulmn ambiental que generan
los cerros orientales y la alta precipitacin en este lugar que hace un lavado de los contaminantes, llevando la
contaminacin a la superficie urbana
y a los suelos.
Al comparar el modelo
Geoestadstico para los das analizados con el Modelo de Pluma de Gauss
se corrobora el comportamiento de
la contaminacin decreciente en senVol. 7 No
.2
No.2
Ingeniera
37
RECOMENDACIONES
Se espera continuar con el proyecto de investigacin desarrollando un tercer modelo (Matemtico,
Estadstico o Fsico) para hacer un prototipo de la
prediccin de la contaminacin provocada por material particulado en el Distrito Capital y extender
los anlisis a otros contaminantes.
Finalmente, no hay que perder de vista que la atmsfera y los fenmenos que en ella se producen,
en muchos aspectos, permanecen inexplorados o aun
fuera del alcance de nuestro conocimiento y por tanto
no son modelables (al menos por ahora), por lo cual
se decidi cerrar este articulo con esta frase de Henri
Poincar, matemtico y fsico francs de finales del
siglo XIX y comienzos del siglo XX, que ha acompaado al grupo de investigadores en el recorrido
de este proyecto:
"Puede pasar que pequeas diferencias en las condiciones iniciales produzcan unas muy grandes en el fenmeno final. Un
pequeo error en lo anterior producir un enorme error en lo
posterior. La prediccin se torna imposible..."
Henri Poincar. (1854-1912)
BIBLIOGRAFA
Vol. 7 No
.2
No.2
Ingeniera
GORDON S. Thomas. Interactive Analysis and Modelling of SemiVariograms. Snowden Associates Pty. Disponible en Internet:
http://www.ai-geostats.org/online_papers/_papers/0000001e.htm
38