Está en la página 1de 15

Geoestadística Otoño 2023

Examen 1.
Análisis de calidad del agua de Chapala
Presenta:
Daniela Zamorano Rolón 734929
Fabrizio Franco Félix. 736087
José Manuel Corona 734336
1. Introducción:
La geoestadística no se limita en aplicar estadística clásica a datos geológicos; en
cambio, utiliza la componente espacial de los datos para caracterizar sistemas
distribuidos en el espacio, cuya totalidad no se conoce por completo. (Villareal, M.
2022)
Un concepto fundamental para la geoestadística es la correlación espacial, esto es
que las observaciones son interdependientes en función de la distancia entre ellas,
donde hay más similitud (relación) conforme más cercanas estén las observaciones
y esa similitud o relación es más débil conforme la distancia incrementa. (Villareal, M.
2022)
El Lago de Chapala padece muchos de los problemas que amenazan la existencia de
los lagos en el mundo, este recibe varios contaminantes provenientes de la cuenca;
desechos de las industrias de la zona como la elaboración de pieles, petrolera,
mueblería, tequilera y lechera; además de aguas negras de las poblaciones
colindantes. De las principales problemáticas del lago son la contaminación por
bacterias, el exceso de nutrientes, y la contaminación por sustancias tóxicas.
(Chapala un lago vivo, 2022).
En este examen se realizó un análisis geoestadístico de la calidad del agua en el Lago
de Chapala utilizando datos históricos de las estaciones de monitoreo de la
CONAGUA que pasaron por un pretratamiento con el propósito de formular hipótesis
sobre las condiciones del lago en cuanto a las problemáticas mencionadas
previamente con ayuda de análisis estadísticos, espaciotemporales y de
autocorrelación espacial.
2. Desarrollo
Previamente al análisis geoestadístico se realizó un filtro para seleccionar los
parámetros más relevantes con los cuáles se trabajó. Comparamos los datos de las
mediciones anuales de las estaciones del lago con la NOM-001-SEMARNAT-2021, la
cual establece los límites permisibles de contaminantes en las descargas de aguas
residuales en cuerpos receptores propiedad de la nación.
Para un segundo filtro, utilizando la herramienta de “Selección por atributos” en
ArcGISPro, se encontraron los valores de los parámetros que estaban por encima o
cercanos al límite permisible de cada contaminante. Después efectuamos un análisis
estadístico generando histogramas y gráficas QQ para observar el comportamiento
de cada contaminante y evaluar su relevancia dentro del análisis.
Concluimos que los 4 contaminantes que usaríamos para el análisis por su
comportamiento a través de los años fueron: Demanda Química de Oxígeno (DQO),
Escherichia coli (E_COLI), Coliformes Totales (COLI_FEC) y Sólidos Disueltos
Totales (SST). A las gráficas se les aplicaron transformaciones logarítmicas y de raíz
cuadrada para una mejor distribución de los datos.
Después, se realizó un análisis espacio temporal creando cubos espaciotemporales
usando la herramienta: “Create Space Time Cube From Defined Locations” para
observar el comportamiento de los datos con el tiempo. Luego se llevó a cabo un
análisis de autocorrelación espacial con una distancia de 12 km usando la
herramienta: “Spatial Autocorrelation” para saber cómo se relacionan los valores de
un contaminante en un punto determinado del lago con los valores del mismo en
puntos cercanos. Por último, se desarrolló un análisis de clústeres emergentes con:
“Emerging Hot Spot Analysis” para observar los puntos importantes con altas o bajas
concentraciones en comparación con puntos vecinos.

3. Resultados y discusión:
Gráficas Distribución por Contaminante

Figura 3.1. Histograma de E. Coli Figura 3.2. Histograma de SST

Figura 3.3. Histograma de DQO Figura 3.4. Histograma de Coliformes Totales

Figura 3.5. Gráfica de Cajas y Bigotes de los 4 parámetros seleccionados

En la selección por atributos fue posible observar que, de los 4 parámetros, E. coli,
COLI_FEC y SST tienen valores muy por encima de los límites en la mayoría de los
años, y la DQO se acerca en varias ocasiones al límite. Cabe mencionar que existió
una tendencia en los datos que mostraba que en 2021 los valores eran atípicos a la
secuencia de datos conforme el paso de los años en la mayoría de los contaminantes,
por lo que solo se seleccionaron estos que de cierta manera formaban una tendencia
positiva a futuro.
En los histogramas se pudo notar que era necesario hacer transformaciones para
obtener resultados más representativos y fáciles de interpretar, en este caso se
hicieron transformaciones logarítmicas para los parámetros de E. coli y de DQO, y a
su vez se hicieron transformaciones de raíz cuadrada para los valores de COLI_FEC
y SST, de esta manera se pudieron interpretar mejor los resultados y a su vez fue útil
para saber que era necesario hacer estas transformaciones para los siguientes
análisis, ya que sin los mismos los resultados no tendrían un significado visual ni
estadístico probablemente. Por otro lado, la gráfica de cajas y bigotes demuestra
como todos estos parámetros tiene varios valores “atípicos” que a nuestra
interpretación significaron que eran aumentos en la concentración que podían
demostrar una tendencia a la alta u ocasiones de descargas muy graves.

Análisis Espacio Temporal

E. COLI

Figura 3.6. Target Field 6 Figura 3.7. Target Field 3

*Transformación Logarítmica

Figura 3.8. Análisis Espacio Temporal ECOLI

En el caso de E. coli, se encontraron 4 puntos (color morado) que mostraban una “up-
trend” esto quiere decir que sus valores de concentración tenían una tendencia de
aumentar con los años.

SST

Figura 3.9. Target Field


*Transformación Raíz Cuadrada
Figura 3.10. Análisis Espacio Temporal SST

Para los sólidos suspendidos, 7 de los puntos (marcados en verde) demostraban una
“down-trend” o una tendencia de disminuir su concentración con los años, aunque en
el 2021 se generan picos de aumento del parámetro.

DQO

Figura 3.11. Target Field 10


*Transformación Logarítmica

Figura 3.12. Análisis Espacio Temporal DQO

Con el DQO solo se encontraron 3 puntos con tendencia de decrecer, aunque tienen
varios picos que pueden ser valores atípicos.

COLIFEC

Figura 3.13. Target Field 18


*Transformación Raíz Cuadrada
Figura 3.14. Análisis Espacio Temporal COLIFEC

Los coliformes fecales muestran tendencia a disminuir solo en dos puntos de


muestreo, aun así, la mayoría de los datos no muestran tendencias significativas

Análisis de autocorrelación espacial


En el caso de E. coli y los coliformes fecales los datos no cuentan con significancia
estadística en los datos, es decir que no hay áreas específicas donde los valores
sean significativamente altos o bajos en comparación con otras áreas. Por lo que
para estos parámetros se puede considerar que hay una distribución aleatoria de
concentraciones, y esto se puede deber a diversos factores tales como la falta de
muestras. Esto se puede confirmar en el anexo al final del documento, donde se
observa un reporte de autocorrelación de todos los parámetros, y en el caso del E.
coli y del COLI_FEC se puede ver un p-value mayor a 0.1

Figura 3.15. Hot spots y Cold spots DQO

Figura 3.16. Análisis de Outliers DQO

En el caso de la DQO se pueden observar únicamente puntos fríos en la parte oeste


del lago, y los puntos calientes se pueden observar en la parte norte del mismo, lo
que demuestra las aglomeraciones de valores altos y de valores bajos de DQO, esto
puede indicar áreas de interés para analizar más la calidad del agua en dichas zonas.
Por otro lado, en estas áreas de “hot” y “cold” spots se encuentran la mayor cantidad
de valores High-High (H-H) y de valores Low-Low (L-L) como era de esperarse, lo que
quiere decir que son valores altos rodeados de valores también altos y valores bajos
rodeados por valores bajos.
Sin embargo, en la zona donde están valores bajos aglomerados se encuentra un
clúster “High-Low” (H-L) con valores altos en una zona con menores concentraciones,
lo que puede indicar un área anormal de interés que se debería de indagar más para
el análisis de calidad del agua del lago de Chapala, sin embargo es necesario recalcar
que estos valores altos y bajos son respecto a la media, por lo que este análisis es un
parteaguas a más investigación de este “outlier” para conocer el por qué hay una
“alta” concentración de DQO. Por otro lado, también podemos observar que en las
estaciones de monitoreo que están cercanas a la zona de Chapala y Mezcala, son las
estaciones en las que se presentan los H-H Clúster, esto puede ser debido a que son
de las ciudades más pobladas alrededor del lago, y por su actividad de la industria.

Figura 3.17. Hot spots y cold spots SST

Figura 3.18. Análisis de outliers SST

En este caso no se encuentra ningún valor anormal, es decir que no hay clústeres
con valores H-L ni L-H, por lo que es más fácil de analizar las aglomeraciones de
concentraciones “altas” y “bajas” de SST. En el mapa se encuentran “Hot spots” de
SST en el lado este del lago y del lado oeste se encuentran los “Cold spots” con
patrones L-L mientras que en el centro del lago (al igual que con DQO, casi todos
los puntos carecen de significancia estadística para este análisis, lo que indica un
comportamiento “aleatorio” en estas áreas del lago de Chapala

Análisis de clústeres emergentes


Figura 3.19. Clústeres emergentes COLI_FEC

Aquí podemos observar el comportamiento histórico de los puntos, en el caso de los


coliformes podemos ver varios “oscillating hot spot” esto significa que actualmente
son puntos calientes (valores más altos que los vecinos) pero que en algún momento
fueron puntos fríos (valores más bajos que los vecinos), también hay presencia de
puntos fríos que fueron calientes y de puntos que son esporádicamente calientes. Lo
que esto quiere decir es que pueden existir tendencias que no pueden observarse por
medio de otros análisis. Como en el caso del sur del lago donde parecen crecer las
concentraciones del contaminante en zonas donde luego tienden a disminuir y esto
se puede relacionar con la frecuencia y cantidad de las descargas.

Figura 3.20. Clústeres emergentes DQO

En el caso del DQO podemos notar varios puntos fríos con tendencia oscilante y un
“New cold spot” que nunca había mostrado ningún patrón hasta ahora y el patón que
muestra es de una disminución en la concentración con respecto a los valores
colindantes. Sin embargo, si existe una tendencia en cuestión de ubicación, ya que la
mayoría de estos puntos se encuentran en el centro y en el norte del lago.

4. Muestreo
Figura 4.1 Nuevos puntos de muestreo sugeridos.

Debido a que no se observaron tantas tendencias de autocorrelación espacial en los


parámetros de ecoli y Coli-Fec, es razonable estimar que es necesaria la presencia
de más puntos de muestreo, para que los mismos tengan más vecinos adyacentes y
se pueda estudiar de manera más efectiva los impactos ambientales de estos
contaminantes biológicos. En el área del lago de Chapala se observaba una gran
ausencia de puntos de muestreo en la zona este, por lo que se hizo un análisis con
uso de hexágonos con un área de 5 mil hectáreas y se estimó en que lugares era
pertinente contar con estos puntos de muestreo. En total se agregaron 20 puntos de
muestreo extra, estos mismos pueden otorgar información importante sobre
concentración de contaminantes en áreas no conocidas y pueden aportar más al
conocimiento de tendencias espaciotemporales y de autocorrelación espacial.

5. Hipótesis
Los parámetros con mayores concentraciones serán los provenientes de las
descargas de aguas negras y mantendrán un comportamiento relativamente
constante ya que la mayoría de las estaciones se encuentran cercanas a ciudades y
pueblos en donde hay descargas seguido y a pesar de que muchos contaminantes
se biodegradan con el tiempo, las descargas sobrepasan la capacidad del lago para
remediarse.
La demanda química de oxígeno llega a tener valores elevados probablemente
cuando se toman muestras recien se hacen las descargas de aguas residuales, sin
embargo, la calidad en términos químicos del lago es mejor de la esperada, esto,
según un estudio de la ong. “Chapala un lago vivo” se debe al exceso de
sedimentación en el lago, los sedimentos “secuestran” a los contaminantes y se
quedan en el fondo del lago donde las estaciones de medición no pueden tomar
muestras.

6. Conclusiones
Algunas de las razones de porque parámetros como E. coli y coliformes fecales
no mostraron significancia estadística pueden ser las fuentes difusas de
contaminación; escorrentías pluviales, desbordamientos de alcantarillado o
actividades agrícolas, esto ocasiona que las concentraciones de contaminantes
puedan distribuirse de manera irregular en el espacio, lo que dificulta la detección
de patrones significativos. Otra puede ser el muestreo si se realizó de manera
irregular en ubicación y frecuencia o factores de dilución y mezcla en el lago.
Una manera de mejorar el muestreo y por lo tanto el análisis puede ser dividir el
lago en sectores ya que como se trata de un lago con poco movimiento y con una
extensión amplia, puede ser que los valores de un extremo del lago sean causados
por factores distintos a los del otro extremo y esto puede generar confusión en la
interpretación de los resultados.
Se pueden comparar los resultados de los distintos análisis para llegar a
conclusiones, por ejemplo, podemos comparar las gráficas del análisis espacio
temporal con el análisis de clusteres emergentes y notar como en las gráficas de
DQO y SST donde se ven picos y caidas abruptas son los parámetros en los que
se generaron clusteres emergentes, mientras que para E. coli y COLI_FEC no se
notaron cambios drásticos (mas que un aumento considerable al inicio) y tampoco
se crearon clusteres emergentes.
Consideramos que este lago por su extensión y por su importancia, es necesario
seguir analizando y documentando información sobre este para poder encontrar
soluciones de mejora a largo plazo, ya que es un lugar que tanto como ciudades e
industrias, siguen aumentando por lo que los contaminantes siempre serán un
problema para el cuerpo de agua. Con análisis como el hecho en este trabajo pueden
darles las herramientas a las autoridades correspondientes para la toma de
decisiones.

7. Anexo A – reflexión personal


Daniela: En lo personal, considero que los tutoriales previos fueron de mucha ayuda,
ya que, al momento de empezar a aplicar herramientas para el análisis de este
trabajo, recurrimos bastante a los tutoriales porque, aunque entendíamos lo que
hacíamos, al ser tantas herramientas diferentes, nos llegábamos a confundir en los
pasos. Otra de las cosas que recapitulé durante este examen es que no importa tanto
la cantidad de datos o información que tengamos sino la calidad de esta. Considero
que, desde la toma de decisiones de los parámetros, hasta la decisión de hipótesis,
teníamos una gran cantidad de información, pero es importante poder filtrar sobre en
realidad que necesitamos en un análisis de datos espaciales.
Fabrizio: Considero que es importante realizar una investigación a profundidad
previo a cualquier análisis ya que con un contexto en mente es más fácil darle una
cara a los datos que se están observando, para mi aún es algo abstracto el tema de
las transformaciones de datos, sobre todo como interpretarlos una vez
transformados. También creo que los tutoriales me ayudaron bastante a recordar
conceptos y como usar las herramientas. Este tipo de trabajos son relevantes ya
que pueden ayudar a los investigadores y planificadores a tomar decisiones
informadas sobre la asignación de recursos, intervenciones específicas en ciertas
áreas y comprensión de las causas detrás de estos patrones.
José: con base a todos los resultados observados, se pueden observar varios
puntos del lago de Chapala a los que se les deben de hacer análisis mas profundos,
con respecto al análisis de autocorrelación espacial, hay un punto en especifico
anormal con valores altos de DQO que se debe de considerar y estudiar más para
conocer si se debe a uno o varios eventos aislados en dicho punto que ocasionaron
esta alta concentración, o si se debe a algún tipo de descarga anormal que se deba
estudiar mas a fondo. Por otro lado en este análisis no se demostró ninguna
aglomeración en específico de concentraciones de E. coli ni de COLI-FEC, esto no
necesariamente es algo bueno ya que en el análisis previo se veían altas
concentraciones de estos parámetros que iban a la alza, por lo que no es
descabellado asumir que el lago de Chapala esta tan contaminado que tiene
concentraciones muy altas de estos contaminantes más distribuidas de lo que se
esperaba, por lo que es necesario analizar mas a fondo estos parámetros y ver el
por qué hay concentraciones tan altas del mismo pero a su vez tan distribuidas que
no se podía observar ningún comportamiento en el análisis de autocorrelación
espacial. Finalmente concluiría que es necesario poner mas puntos de muestreo a
lo largo del lago para poder modelar de mejor manera el comportamiento de los
diversos contaminantes que hacen daño a este ecosistema, de esta manera se
podrían tomar mas acciones preventivas para poder contaminar lo menor posible el
lago y que de esa manera se puedan eliminar estos contaminantes de la manera
que sea (ya sea por degradación, sedimentación, advección, etc.)

8. Anexo B tablas y figuras:

Imagen 8.1 reporte de autocorrelación de E. coli


Imagen 8.2 reporte de autocorrelación de Coliformes fecales

Imagen 8.3 reporte de autocorrelación de DQO

Imagen 8.4 reporte de autocorrelación de SST

Gráfica 8.1 de Moran para DQO


Gráfica 8.2 de Moran para SST

Visualización en 3D.

Imagen 8.5 E. coli

Imagen 8.6 COLI_FEC


Imagen 8.7 DQO

Imagen 8.8 SST

Referencias:
Villareal, M. (2022). Introducción al análisis geoestadístico de datos en geociencias:
teoría y aplicación. Revista Geológica de América Central, 67, 1-22. Recuperado de
file:///Users/favrizio/Downloads/51474-Texto%20del%20art%C3%ADculo-217157-1-
10-20220704.pdf
NORMA Oficial Mexicana NOM-001-SEMARNAT-2021, Que establece los límites
permisibles de contaminantes en las descargas de aguas residuales en cuerpos
receptores propiedad de la nación.
Chapala un lago vivo. (2022). Muchos problemas ¿De dónde vienen?. Recuperado
de
https://lagodechapala.org/problemas/#:~:text=El%20lago%20tambi%C3%A9n%20re
cibe%20una,de%20lo%20que%20se%20esperar%C3%ADa.
Ibarra, J. (2022). Sufre Lago de Chapala, 15 de los 19 problemas que amenazan a
los lagos en el mundo. ZonaDocs. Recuperado de
https://www.zonadocs.mx/2022/03/17/sufre-lago-de-chapala-15-de-los-19-
problemas-que-amenazan-a-los-lagos-en-el-mundo/

También podría gustarte