Está en la página 1de 81

COMPARACIÓN DE METODOLOGÍAS ESTADÍSTICAS PARA EL ANÁLISIS DE

LAS VARIABLES REGISTRADAS POR LA RED DE CALIDAD HÍDRICA DE


BOGOTÁ EN LOS RÍOS TORCA Y SALITRE DE LA CIUDAD DE BOGOTÁ D.C

OPCIÓN DE GRADO MODALIDAD SOLUCIÓN DE UN PROBLEMA DE


INGENIERÍA.

ELABORADO POR:

PAULA ANDREA BALAGUERA VEGA


JULIETH NATHALIA HERNÁNDEZ CHAVARRO

DIRECTOR DE TESIS:

CARLOS ANDRES PEÑA


INGENIERO AMBIENTAL

CO-DIRECTOR TESIS

RONAL JACKSON SIERRA PARADA


INGENIERO TOPOGRAFICO

UNIVERSIDAD SANTO TOMÁS


FACULTAD DE INGENIERÍA AMBIENTAL
BOGOTÁ D.C
JULIO DE 2017
RESUMEN..........................................................................................................................................5
ABSTRACT ........................................................................................................................................6
INTRODUCCION ..............................................................................................................................7
1. PLANTEAMIENTO DEL PROBLEMA ....................................................................................8
2. JUSTIFICACIÓN .................................................................................................................... 10
3. OBJETIVOS ............................................................................................................................ 12
3.1 OBJETIVO GENERAL................................................................................................... 12
3.2 OBJETIVOS ESPECÍFICOS ........................................................................................ 12
4. MARCO TEÓRICO ................................................................................................................ 13
4.1 CALIDAD DE AGUA ...................................................................................................... 13
4.2 OPTIMIZACIÓN DE UNA RED DE CALIDAD HÍDRICA ......................................... 14
4.3 RED DE CALIDAD HÍDRICA........................................................................................ 16
4.4 RÍO SALITRE .................................................................................................................. 20
4.5 RÍO TORCA .................................................................................................................... 22
4.6 MÉTODOS ESTADÍSTICOS ........................................................................................ 24
4.6.1 ANÁLISIS JERÁRQUICO ..................................................................................... 24
4.6.2 GEOESTADÍSTICA IDW Y KRIGING)................................................................ 25
4.6.3 ANÁLISIS DISCRIMINANTE ................................................................................ 27
4.6.4 RED NEURONAL ARTIFICIAL ............................................................................ 28
4.5.4.1 Casos de estudio: uso de redes neuronales artificiales en modelamiento de
calidad de agua .................................................................................................................. 30
5. METODOLOGIA ..................................................................................................................... 36
5.1 ESTADO ACTUAL DE LA RED Y SUS CARACTERISTICAS HISTÓRICAS. ..... 36
5.1.1 TRATAMIENTO ESTADISTICO DE LOS DATOS ............................................ 36
5.2 APLICACIÓN DE LAS METODOS UTILIZADOS EN PREVIO ESTUDIO DE LA
RED DE CALIDAD HÍDRICA DE BOGOTÁ ........................................................................... 37
5.2.1 ANÁLISIS PRELIMINAR ....................................................................................... 38
5.2.2 APLICACIÓN DE LOS MÉTODOS ESTADÍSTICOS ....................................... 39
6. RESULTADOS Y ANÁLISIS DE RESULTADOS. ............................................................. 41
6.1 RESULTADOS DEL ANÁLISIS DE VARIANZA (KRUSKAL – WALLIS) .............. 41
6.2 RESULTADOS DE LA PRUEBA PAIRWISE WILCOX. ........................................... 43

2
6.3 DIAGRAMA MATEMÁTICO CON COORDENADAS CARTESIANAS
(SCATTERPLOT) ....................................................................................................................... 46
6.4 ANÁLISIS JERÁRQUICO - DENDOGRAMA .................................................................. 48
6.5 ANÁLISIS LINEAL DE DISCRIMINANTES ..................................................................... 52
6.6 ANÁLISIS GEOESTADÍSTICO ........................................................................................ 55
6.7 RED NEURONAL ARTIFICIAL ........................................................................................ 62
7. PROPUESTA DE MEJORA.................................................................................................. 68
8. RECOMENDACIONES ......................................................................................................... 71
9. CONCLUSIONES................................................................................................................... 72
BIBLIOGRAFÍA ............................................................................................................................... 75

3
TABLA DE GRÁFICAS

Gráfica 1: Mapa de la ubicación del río Salitre en la ciudad de Bogotá. ............... 20


Gráfica 2: Mapa de la ubicación del río Torca en la ciudad de Bogotá. ................ 22
Gráfica 3: Esquema del principio de funcionamiento de la red neuronal artificial. 28
Gráfica 4: Red Neuronal Artificial propuesta la predicción de chl-a y SM en la
reserva Beaver....................................................................................................... 32
Gráfica 5: Red Neuronal Artificial llevada a cabo con el método backpropagation
algorithm para el río Tou-Chen. ............................................................................. 33
Gráfica 6: Boxplot del parámetro “oxígeno disuelto” vs año de medición para el río
Torca. ..................................................................................................................... 44
Gráfica 7: Boxplot del parámetro “DQO” vs observaciones para el río Salitre. ..... 45
Gráfica 8: Scatterplot matrix de pH y oxígeno disuelto vs estación para el río Torca
............................................................................................................................... 46
Gráfica 9: Scatterplot matrix de Fósforo total, Coliformes fecales y Nitrógeno total
vs estación para el río Salitre. ................................................................................ 47
Gráfica 10: Dendograma de los parámetros fisicoquímicos para el río Torca. ...... 49
Gráfica 11: Dendograma de los parámetros fisicoquímicos sin coliformes fecales
para el río Torca..................................................................................................... 50
Gráfica 12: Dendograma de los parámetros fisicoquímicos para el río Salitre. ..... 49
Gráfica 13: Dendograma de los parámetros fisicoquímicos sin coliformes fecales
para el río Salitre.................................................................................................... 50
Gráfica 14: Diagramas de los respectivos grupos del análisis discriminante para el
río torca con respecto a las estaciones. ................................................................. 52
Grafica 15: Diagramas de los respectivos grupos del análisis discriminante para el
río salitre con respecto a las estaciones. .............................................................. 53
Gráfica 16: Plot de mosaico para el parámetro sustancias activas al azul de
metileno versus estación para el rio Torca ............................................................ 53
Gráfica 17: Plot de mosaico para el parámetro sustancias activas al azul de
metileno versus estación para el río Salitre ........................................................... 55
Gráfica 18: Mapa de las concentraciones de oxígeno disuelto para el mes de
febrero. .................................................................................................................. 56
Gráfica 19: Mapa de las concentraciones de pH para el mes de marzo. ............. 57
Gráfica 20: Red neuronal artificial de los parámetros fisicoquímico y biológicos
versus la estación para el río Torca. ...................................................................... 63
Gráfica 21: Red neuronal artificial de los parámetros fisicoquímico y biológicos
versus la estación para el río Salitre. ..................................................................... 65

4
RESUMEN

En la actualidad, la ciencia y la tecnología han avanzado de manera significativa,


ofreciendo diversas herramientas por las cuales se pueden realizar análisis más
profundos y más precisos para estudiar a detalle el recurso hídrico. En Bogotá,
como en otras muchas ciudades con numerosos habitantes, hay una problemática
que ha venido creciendo en los últimos años, la contaminación persistente de los
cuerpos de agua que se encuentran bajo su jurisdicción.
Sin embargo, como se ha dicho anteriormente, hay herramientas que permiten que
el monitoreo constante de estos cuerpos hídricos faciliten el análisis del estado
actual de los mismos, como lo es la red de calidad hídrica de Bogotá (RCHB), la
cual es un sistema de puntos de muestreo a lo largo de los cuerpos hídricos de
interés que recolecta información continuamente.
Es así como el siguiente proyecto representa una propuesta de mejoramiento de la
red de calidad hídrica de Bogotá para los ríos Torca y Salitre mediante la aplicación
de una Red Neuronal Artificial, la cual, es un modelo de interconexión de nodos que
permite establecer tareas que serán aprendidas automáticamente por la red,
entrenándola para que desempeñe una actividad en específico y que esto dé paso
a la mejora continua del mismo sistema. Este proyecto tiene como fin la aplicación
de diversas metodologías estadísticas, para evaluar cuál es la diferencia de la
aplicabilidad de los métodos (Análisis Lineal de Discriminantes, Análisis Jerárquico,
Kriging y Red Neuronal Artificial) y la diferencia que existe en los resultados finales,
pudiendo así determinar cuál ha generado la información con mayor grado de
confiabilidad y cuál aporta más a la propuesta de mejoramiento que será generada
en este proyecto.
Palabras claves: Red de calidad hídrica, río Salitre, río Torca, Análisis Lineal de
Discriminantes, Análisis jerárquico, Análisis Geoestadístico, Red Neuronal Artificial.

5
ABSTRACT

Nowadays, there are diverse tools which can be used to realize deep analysis, that
are more accurate and makes easier to read results of all what is related with water
resources. Bogotá (as in many others cities with huge populations) has a problematic
that has been growing in the last years, the persistent contamination in water bodies
which are under their jurisdiction.
Nevertheless, as it has been said previously, there are tools that allow constantly
monitoring of those water bodies, to get information in real time, like the water quality
networks; in this case, the Bogotá’s water quality network, which is a system of
monitoring points along the main rivers of the city (Salitre, Torca, Fucha and
Tunjuelito rivers)
The main objective of this project is to create an improvement approach for the water
quality network, focused to the two the rivers named previously (Salitre and Torca)
through the application of an artificial neural network or connectionist system, that
basically is a model of nodes interconnected, which allow to establish tasks that will
be learned automatically by the network. The idea is to train the network to develop
a specific action, which will improve the system by itself.
By now, in this paper will be shown the results of some statistics tests applied to the
data obtained from the water quality network (linear discriminant analysis,
hierarchical analysis, Kriging) taking into account that before this project, some
students have realized an analysis for Tunjuelito and Fucha rivers respectively. So
now, the idea is to contrast the methodologies applied for those rivers and see what
is the difference between the information obtained for every river and how the
methods work for every water body. Likewise, it is important to determinate another
factors that affects directly in the information like population dynamics, domestic
water spills, industrial water spills, anthropic activities, among others).
Keywords: Artificial Neural Network, Lineal Discriminant Analysis, Hierarchical
Analysis, Geoestatistical Analyst, Salitre River, Torca River, Water Quality Network.

6
INTRODUCCION

La gestión de recursos hídricos debe realizarse de forma eficiente, eficaz y


sostenible, especialmente en áreas en donde no es efectivo el sistema hídrico. Así,
las técnicas de optimización constituyen una herramienta de gran utilidad en el
proceso de toma de decisiones para la mejora de la recolección de información
como lo es para la red hídrica del rio Bogotá [2].
El siguiente trabajo tiene como finalidad, generar una propuesta de optimización
sobre la red de calidad de agua de Bogotá para los ríos Torca y Salitre, los cuales
hacen parte de los cuatro ríos más importantes del sistema hídrico de la capital.
Para el desarrollo del proyecto se usarán las bases de datos de las campañas
realizadas por la secretaria de ambiente entre los años 2009-2013, las cuales
contienen los datos de los parámetros establecidos en la resolución 5731 de 2008
(pH, oxígeno disuelto, DBO, DQO, coliformes fecales, sólidos suspendidos totales,
grasas y aceites, nitrógeno total, fosforo total y sustancias activas al azul de
metileno), la ubicación de las estaciones de cada río, y demás características que
serán evaluadas para el desarrollo de la propuesta.
A la hora de generar la idea de optimización, la información será tratada
estadísticamente para depurar los datos y así continuar con la aplicación de las
metodologías utilizadas en el proyecto de grado anterior a este (propuesta de
optimización de la red de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y
Tunjuelo en la ciudad de Bogotá D.C), las cuales son análisis jerárquico, Kriging
(análisis geoestadístico), y análisis lineal discriminante.
La innovación de este proyecto es la implementación y diseño de una red neuronal
artificial, la cual, permitirá generar un sistema de comando libre para aplicar una
nueva clasificación de la información existente por medio de una instrucción de
predicción, lo cual, permitirá contrastar todos los métodos ya aplicados con este, y
así determinar cuál genera los resultados más acertados y con la mayor
confiabilidad.
La finalidad del trabajo es mejorar los puntos de toma de muestras, omitiendo si es
necesario estaciones o agregando más puntos de muestreo, mejorando los tiempos
de recolección de datos y determinando que metodología es la que mejor se adapta
según los resultados.

7
1. PLANTEAMIENTO DEL PROBLEMA

Bogotá por sus características es la ciudad capital de la República de Colombia y


se constituye en el principal centro geográfico, político, industrial, económico y
cultural del país. El crecimiento demográfico y el rápido proceso de desarrollo
económico de Bogotá, a una altura de 2.630 metros sobre el nivel del mar, y con un
área de 1587 Kms², es sede del gobierno y la más extensa de las ciudades de
Colombia. Aquí se concentra el 17% de la población total de la nación (7.980.001),
con la característica de poseer los más altos índices educativos.

La ciudad cuenta con muchos procesos dinámicos que están en constante


interacción con el medio ambiente y en consecuencia de esto, el saneamiento que
se debe tener es constante, por eso es de gran importancia llevar a cabo una red
dinámica con las obras de saneamiento y de las propuestas del distrito para sanar
los ríos, y una de estas ideas es la optimización de la red de calidad hídrica de la
ciudad [1]. Los ríos Torca y Salitre son dos cuerpos de agua que hacen parte del
sistema hídrico de Bogotá, ambos presentan problemáticas ambientales, puesto
que gracias a la intervención humana, la contaminación que en ellos reside es
altamente significativa.

El río Torca con una longitud de 13.06 km comienza su recorrido desde el conjunto
residencial Bosque de Pinos (carrera 6 con Calle 153) hasta su entrega al río
Bogotá. Este río nace en los cerros orientales y desemboca al sistema humedal
Torca-Guaymaral a altura de la Autopista Norte, en cercanía a los terrenos del
cementerio Jardines de Paz, y a su vez drena al norte en la cuenca media del río
Bogotá. La cuenca del río Torca se conforma por tres subcuencas principales: El
Cedro, San Cristóbal y Serrezuela, que se inician en los cerros orientales de la
ciudad y cuyos canales se encuentran revestidos [2]

La principal fuente de contaminación de este río o más conocido como canal Torca
son las aguas residuales que llegan a él por medio de escorrentía o descarga
directa, además de tener vertimientos de tipo industrial gracias a las canteras que
se encuentran en el noroccidente de Bogotá [3].

La cuenca del río Salitre se encuentra ubicada en el sector centro-norte del Distrito
Capital, limita por el norte con la cuenca del río Torca y el humedal La Conejera, por
el occidente con el río Bogotá y el humedal Jaboque, al oriente con los municipios
de La Calera y Choachí, y por el sur con la cuenca del río Fucha [2]; este río recorre
muchas más localidades que el río Fucha (Engativá, Santa Fe, Chapinero, Usaquén,
Suba, Barrios Unidos y Teusaquillo), por ende, por actividad antropológica de igual
manera tiene una problemática ambiental marcada, el vertimiento de residuos,
aguas residuales y residenciales a lo largo de su cauce [4].

8
Por ello, es necesario que exista un monitoreo constante de estos cuerpos de agua,
y en general, de los diversos ríos de Bogotá, puesto que, se necesitan establecer
controles para evitar que la situación actual de los mismos empeore a medida de
que pasan los años y así mitigar los problemas ambientales ya existentes. Para esta
situación, ya existe la red de calidad hídrica de Bogotá, en donde, entidades como
la EAAB se encargan del constante monitoreo y seguimiento de los niveles de
contaminación de estos ríos mediante la medición de variables de calidad de agua
[5].

Las redes de monitoreo al ser sistemas estáticos, requieren cierta infraestructura


especial para poder llevar a cabo el seguimiento a un cuerpo hídrico; esto implica,
la inversión de estaciones de monitoreo y una central de recepción de datos en
donde se lleva a cabo el tratamiento de información, acorde a la finalidad de la red
de calidad hídrica. El principal problema es que con el tiempo, se genera una
desactualización de los equipos empleados, lo que conlleva al aumento de errores
a la hora de realizar un diagnóstico real de un cuerpo hídrico [6]

9
2. JUSTIFICACIÓN

Las redes de monitoreo son sistemas que tienen como objetivo verificar el estado
actual de un cuerpo hídrico, teniendo en cuenta los agentes externos que pueden
llegar a alternar el equilibrio de este ecosistema. A través de los años, las redes de
monitoreo van perdiendo características de calidad (bien sea porque no se hace el
respectivo mantenimiento a los equipos y sistemas o porque simplemente la
tecnología usada comienza a ser obsoleta). Cuando una red de monitoreo tiende a
minimizar la calidad de la información que provee, es necesaria una optimización
de la misma, no solo por la calidad de los datos sino que gracias a esta acción de
mejora, se generan beneficios económicos para la entidad que esté encargada del
seguimiento de la misma [7].

La calidad del agua se ha convertido en los últimos años en un tema de interés


global, debido a que el mundo se desarrolla exponencialmente conforme Avanza el
tiempo y esto implica que los recursos naturales sean sobreexplotados, generando
un deterioro en el medio ambiente a un ritmo considerable. Sin embargo, se tiene
en cuenta que en este ritmo acelerado de desarrollo, la tecnología se ha vuelto un
aliado fundamental a la hora de generar soluciones a diversas problemáticas socios
ambientales.
La red de calidad hídrica de Bogotá tiene el propósito de suministrar información en
tiempo real de cómo están los cuerpos que conforman el sistema hidrográfico de la
ciudad; sin embargo, conforme pasan los años, se debe generar una constante
actualización de los métodos e instrumentos de medición, para no caer en
imprecisiones a la hora de valorar los cuerpos de agua en cuestión.
El río Salitre y el río Torca son estratégicos en la labor que realiza la red de calidad
hídrica de Bogotá, ya que son ríos que se ven sumamente afectados por la
contaminación directa e indirecta que ejerce la población de la ciudad; una
optimización a la red de calidad hídrica trae consigo una serie de beneficios a las
decisiones ambientales que se tomen con respecto a estos ríos, puesto que si
mejora la calidad de la información que se obtiene de la constante medición de la
red, se puede determinar el verdadero estado de los ríos, para así, evaluar el
impacto e implementar medidas de corrección para mejorar el estado de estos
cuerpos hídricos [8].
Por ello, este proyecto busca generar una solución a la posible problemática que se
pueda presentar en la red de calidad hídrica de Bogotá, valorando las estaciones
de medición de la red, y generando una propuesta de optimización para determinar
cuáles son los puntos débiles de esta y así proveer nuevas alternativas para que se
genere una constante mejora.

10
Se deben considerar las ventajas de realizar una propuesta de mejora para la red
de calidad hídrica de Bogotá. Primero se cuenta con los beneficios económicos ya
que se pueden utilizar métodos matemáticos que evitan la implementación de
sistemas que demandan un alto costo y que tiene grados de confiabilidad similares
a los de un sistema convencional, así mismo, el uso de software reemplaza la mano
de obra y otros costos directos del proyecto generando viabilidad a la optimización
que se genera después del estudio respecto a la RCHB [9].
Además de ello, los beneficios técnicos que representa el hecho de generar una
propuesta de optimización, debido a que se determina la situación actual de la red
y esta sería la base de futuras adecuaciones físicas y tecnológicas que pueda llevar
a que la calidad de la red con respecto a la información que brinda sea más óptima
[10]. Ambientalmente hablando, el beneficio sería propicio debido a que la calidad
de la información respecto al estado actual de la contaminación que tienen los ríos
Salitre y Fucha serán más acertados, pudiendo así establecer medidas de
intervención para mitigar la polución actual de los mismos [11]
Finalmente, la idea de este proyecto es demostrar el poder de emplear aquellas
metodologías que han venido evolucionando a través del tiempo, que combinadas
con tecnologías de medición crean sistemas óptimos y dan paso a nuevas técnicas
con sensores e inteligencia artificial [12].

11
3. OBJETIVOS

3.1 OBJETIVO GENERAL

Comparar metodologías estadísticas para el análisis de la Red de Calidad hídrica


de Bogotá en los ríos Torca y Salitre de la ciudad de Bogotá D.C
3.2 OBJETIVOS ESPECÍFICOS

 Implementar las metodologías del análisis jerárquico, IDW y Kriging (análisis


geoestadístico) y análisis lineal de discriminantes a las variables medidas por
la RCHB para los ríos Salitre y Torca
 Utilizar la metodología de la red neuronal artificial sobre los datos de los ríos
Torca y Salitre.
 Diseñar la propuesta de mejoramiento a la red de calidad de agua de Bogotá
en los ríos Torca y Salitre de acuerdo a las metodologías aplicadas.

12
4. MARCO TEÓRICO

4.1 CALIDAD DE AGUA

Uno de los objetivos de una red de calidad hídrica es determinar qué tan
contaminado se encuentra un cuerpo de agua específico. La contaminación hídrica
en Colombia se puede dar por actividades industriales, domésticas, agropecuarias,
entre otras [13]. La contaminación hídrica puede darse de dos formas, por fuentes
naturales o por fuentes artificiales.
- Fuentes naturales: Cuando el cuerpo hídrico tiene contacto directo con
diferentes superficies, estas pueden contener sales minerales que pueden
disolverse en el agua [14].
- Fuentes artificiales: Son aquellas fuentes que son consecuencia de las
actividades humanas; las sustancias o elementos que son producidos por el
hombre son mucho más difíciles de eliminar cuando están en presencia en
el agua debido a la complejidad de los compuestos que son vertidos [14].

El agua tiene capacidad de auto recuperarse cuando está presente todo tipo de
contaminantes en la misma, pero las concentraciones en las que se encuentran
esos elementos o sustancias es tan alta que para ello se necesitan tecnologías
alternas para el proceso de recuperación. La contaminación hídrica puede
determinarse por parámetros físicos, químicos y biológicos. En la siguiente tabla se
enlistan los principales parámetros que se tienen en cuenta a la hora de determinar
el estado de un cuerpo de agua [15].
Tabla 1: Parámetros clasificados por su naturaleza (física, química y biológica)

Parámetros para determinar la calidad del agua


Físicos Químicos Biológicos
Bacterias
Color pH
coliformes
Virus
Olor DBO
Animales
Sabor DQO Plantas
Oxígeno disuelto
Temperatura
(OD)
Sólidos
nitrógeno Microorganismos
suspendidos
Espumas Fósforo
Conductividad Aniones y cationes

13
Compuestos
Radiactividad
orgánicos
Fuente: [15].
A la hora de analizar un cuerpo de agua, se debe tener en cuenta cuáles son las
condiciones en las que se está dando la contaminación hídrica, para así, seleccionar
los parámetros de calidad en los que se enfocará dicho análisis. Para ello, es
importante resaltar los contaminantes principales que están en contacto con los
cuerpos hídricos.
- Aguas residuales: Las aguas residuales contienen basura, detergentes,
residuos orgánicos, inorgánicos y biológicos como la excreta humana. Estos
residuos traen consigo una serie de contaminantes fisicoquímicos y
biológicos [16].
- Residuos industriales: Estas contienen una serie de sustancias químicas las
cuales provienen de diversas actividades económicas, se pueden encontrar
una serie de metales pesados, compuestos orgánicos e inorgánicos (ácidos,
cianuros, cloruros, entre otros) [16].
- Residuos de agricultura: estos residuos traen consigo las restos de
pesticidas, fungicidas, herbicidas, entre otros (en donde se resaltan los
compuestos de fosforo y nitrógeno) [16].
- Contaminantes físicos: entre estos se encuentran los residuos radioactivos,
los sedimentos, los residuos de la actividad petrolera, y las aguas de
termoeléctricas y plantas nucleares, las cuales, alteran la temperatura del
cuerpo hídrico receptor [16].

4.2 OPTIMIZACIÓN DE UNA RED DE CALIDAD HÍDRICA

A través de que avanza el tiempo, el ambiente y los agentes que lo afectan


directamente son cada vez más pronunciados por lo que ha crecido una constante
preocupación por controlar las consecuencias de las acciones antropogénicas; el
problema radica en que los sistemas de monitoreo actuales están diseñados con un
solo propósito, y no consideran problemas futuros que puedan llegarse a presentar
[19].
Además de ello, se consideran los límites impuestos por presupuestos, la capacidad
limitada de los análisis de laboratorio y los constantes cambios en los objetivos de
los sistema de monitoreo. Por ello, es que es importante tener en cuenta que una
red de calidad hídrica debe estar sujeta a constantes mejoras para siempre tener
un escenario real de lo que pasa con el cuerpo de agua que se está midiendo [19].

14
Cuando se busca optimizar una red de calidad hídrica hay que tener en cuenta la
relación costo y beneficio de la recolección y tratamiento de datos, para ello se
tienen en cuenta factores como los costos de campo (mediciones realizadas en los
puntos establecidos o estacones móviles), los costos de laboratorio (dependiendo
del parámetro medido, varían los valores del análisis de laboratorio por insumos
como reactivos especiales) y los costos de mantenimiento y tratamiento de
información, caso específico para las estaciones fijas y las personas que manipula
y analizan la información recibida [21].
Si se quiere obtener una reducción de costos, se debe ser radical a la hora de
eliminar acciones y/o elementos específicos, por ejemplo, si se elimina una estación,
se reducen los costos de mantenimiento y tratamiento estadístico más no los costos
de laboratorio, pero si en cambio, se elimina un parámetro de la lista de los objetivos
de calidad de agua, puede que reduzca el costo de análisis pero no el costo de
monitoreo in situ. Esto conlleva a que el encargado de la optimización debe tener
en cuenta que no siempre la reducción de costos será sustancial y que siempre hay
que equilibrar la eficiencia de la optimización con respecto a la calidad de la
información con la rebaja de precios del continuo uso de la red de calidad hídrica
[21].
A continuación se muestra cuales son aquellos pasos que se recomienda llevar a
cabo a la hora de considerar la optimización de un sistema existente de monitoreo
de calidad hídrica [20].

Seleccionar los
Tener claros los
parámetros Análisis de la
objetivos de
fisicoquímicos y covertural espacial
monitoreo.
biológicos

Análisis de la
Análisis relación
frecuencia
espacio-temporal
(tempoalidad)

1. Objetivos de monitoreo: en este caso, la entidad de control de la red neuronal


artificial es quién define los objetivos de calidad de agua según sus metas e
intereses [20].

15
2. Parámetros fisicoquímicos: estos parámetros se encuentran establecidos en
la normativa colombiana, y de acuerdo a los objetivos se seleccionan los
adecuados [20].
3. Análisis de cobertura espacial: métodos como el análisis jerárquico y
métodos geoestadísticos son usados para determinar cómo es la distribución
de las concentraciones de los parámetros a lo largo de los cuerpos de agua
y así, determinar la importancia de los puntos de muestreo [20].
4. Análisis de frecuencia: métodos como el análisis de tendencia son útiles para
determinar cuáles serán aquellos periodos de tiempo en los que se realizarán
las mediciones de acuerdo a las características de la zona [20].
5. Análisis relación espacio temporal: finalmente, cuando ya se han realizados
métodos que puedan analizar la importancia de los puntos de muestreo y los
periodos de tiempo de medición, se relacionan todos en métodos integrales
que puedan dar resultados más acertados, en este caso, un método muy
eficaz es red neuronal artificial [20].
De acuerdo a los pasos que se enlistaron anteriormente, los siguientes métodos son
algunos de los que pueden ser útiles para poder llevar a cabo una optimización
(dependiendo de las características de la red de calidad hídrica, los métodos se
adecuarán a las respectivas condiciones) [20].

Intervalo de Análisis de Herramientas


confianza tendencia geoestadísiticas

Análisis de
Análisis
correlación y
multivariado
regresión

Fuente: Guidance Manual for Optimizing Water Quality Monitoring Program


Design.
4.3 RED DE CALIDAD HÍDRICA

Una red de calidad hídrica es un sistema de puntos de monitoreo donde se


determina la calidad y cantidad de los cuerpos de agua existentes en el área, la cual
puede contar con puntos fijos que miden parámetros de campo y puntos móviles
donde se hace el monitoreo a través de comisiones. En el caso de Bogotá, se
constituye la red por un sistema mixto de las dos anteriores. La RCH permite
obtener, procesar y divulgar información de calidad de los ríos monitoreados de

16
forma confiable, clara y oportuna, para evaluar el cumplimiento de estándares de
calidad según la normatividad ambiental vigente. Asimismo, facilita generar
información base produciendo un récord histórico que admite definir
comportamientos y perfiles de calidad, constituyéndose en una herramienta
fundamental para la toma de decisiones [17].
- Parámetros del diseño: Los métodos utilizados en el monitoreo desde la
recolección de las muestras, la preservación, hasta el transporte de las
mismas, fueron los establecidos por el método estándar AWWA, edición 20ª.
Los parámetros a analizar son:
Tabla 2: Parámetros seleccionados para la optimización por el método estándar
AWWA.
# PARÁMETRO UNIDAD MÉTODO DE ANÁLISIS LÍMITE DE DETECCIÓN
1 Arsénico mg/l-As IC Plasma 3500 As-D 0,003
2 Amonio mg/l-N Destilación titulación 4500-NH3-c 0,3
3 Bario mg/l-Ba IC Plasma 3500 Ba-C 0,0002
4 Cadmio mg/l-Cd IC Plasma 3500 Cd-C 0,0002
5 Caudal l/s Área velociad-volumétrico 0,1
6 Cianuros mg/l-CN Destilación colorimétrico 4500-CN-C-E 0,001
7 Cobre mg/l-CU IC Plasma 3500 Cu-C 0,001
8 Coliformes totales NMP/100 ml Sustrado definido <1
9 Cromo hexavalente mg/l-Cr(+4) Colorimétrico 3500 Cr-C 0,025
10 Cromo total mg/l-Cr IC Plasma 3500 Cr-C 0,001
11 Demanda biológica de oxígeno mg/l-O2 Electrométrico 5210-B 2
12 Demanda química de oxígeno mg/l-O2 Titulométrico 5220-B 5
13 E. Coli NMP/100 ml Sustrado definido <1
14 Fenoles totales mg/l Destilación colorimétrico 5330-b 0,05
15 Fósforo toal mg/l-p Colorimétrico 4500-P-C y E 0,01
16 Grasas y aceites mg/l Partición gravimétrica-5520-B 10
17 Manganeso mg/l-Mn IC Plasma 3500 Mn-C 0,0002
18 Mercurio mg/l-Hg Absorción atómica 3500 Hg-B 0,00025
19 Niquel mg/l-Ni IC Plasma 3500 Ni-C 0,001
20 Nitrógeno total mg/l-N Volumétrico 4500 N-B 0,3
21 Oxígeno disuelto mg/l-O2 Titulométrico 4500 O-C 0,1
22 pH Unidades Electrométrico 0,1
23 Plomo mg/l-pb IC Plasma 3500 Pb-C 0,001
24 Sólidos suspendidos totales mg/l Gravimétrico 2540 D 1
25 Sólidos sedimentables mg/L-hora Volumétrico cono imnoff 0,5
26 Sulfuros mg/l-S Titulométrico 4500-S=C-F 0,1
27 Tensoactivos (SAAM) mg/l Colorimétrica 5540-C 0,025
28 Temperatura °C Electrométrico 0,1
29 Zinc mg/l-Zn IC Plasma 3500 Zn-C 0,00002

Fuente: Acreditación de pruebas y ensayos. Laboratorio de Aguas. Dirección


Servicios Técnicos de la EAAB-ESP.
Para optimizar la red hídrica de Bogotá para los ríos Torca y Salitre se deben
establecer conceptos e información para poder entender la dinámica y su ejecución.

17
Se define optimización como acción y efecto de optimizar. Este verbo hace
referencia a buscar la mejor manera de realizar una actividad. El término se utiliza
mucho en el ámbito de la informática [18]. La optimización matemática está
constituida por un conjunto de resultados y métodos analíticos y numéricos
enfocados a encontrar e identificar al mejor candidato entre una colección de
alternativas, sin tener que enumerar y evaluar explícitamente todas esas
alternativas. Un problema de optimización es, en general, un problema de decisión
[19].
Antes de establecer una red de calidad hídrica, se deben tener en cuenta dos
factores importantes, el primero es la definición del objetivo de la red de monitoreo,
y segundo las características del río al que se implementará dicha red, es decir, se
deben tener en cuenta variables tan básicas como la evapotranspiración, la
precipitación, la pendiente, la forma, las dimensiones, la velocidad y el caudal del
flujo [20]. Después de ello, se tiene en cuenta cuáles son las especificaciones
esenciales del funcionamiento de una red de monitoreo, las cuales se enlistan a
continuación [21]:
1. Componentes de la garantía de calidad: se tienen en cuenta cosas como las
normas de calidad, la capacitación de trabajadores, la facilidad de operación
de los equipos, los procedimientos de operación, entre otros [21].
2. Facilidad de laboratorios: cómo se realizarán los procedimientos de análisis
de información [21].
3. Calibración, mantenimiento y control de los equipos: esto implica los costos,
la mano de obra, y el seguimiento e inspección que se le deben hacer a los
equipos de monitoreo [21].
4. Control del análisis cualitativo: Se deben establecer los controles internos y
externos de calidad, con respecto a la información generada en todo el
proceso de obtención de datos. Es importante que este control se aplique a
toda la red de monitoreo, integralmente hablando, involucrando los equipos,
al personal a cargo, a los análisis de laboratorio, entre otros [21].
5. Garantía de calidad de la información: Se basa en establecer protocolos de
obtención de datos, como ejemplo, se recomienda que a la hora de
muestrear, no se conforme con una única vez de muestreo, sino que se
realice una o dos veces más para corroborar la información. Lo ideal es que
se plantee el paso a paso de cómo se hará el análisis de la información, esto,
asegurando que el margen de error de la información oficial de la calidad de
agua del cuerpo en cuestión sea mínimo [21].

A la hora de diseñar una red de calidad hídrica, también se debe establecer


inicialmente la frecuencia de monitoreo, los puntos de muestreo, los métodos que
serán usados para el muestreo y las variables a tener en cuenta, esto con el fin de
que la red genera la información que se requiere.

18
- Selección de las variables: Las variables dependerán de las fuentes de
contaminación del cuerpo de agua y el uso del agua que tiene actualmente
(industrial, agropecuario, doméstico, recreacional, entre otros) [22].
- Selección de puntos de muestreo: Así como las variables de interés
dependerán del uso que se le da a la información que se obtiene en el
monitoreo, de igual manera la ubicación de las estaciones dependerá de qué
objetivo tenga la red de monitoreo, es decir, si se quiere conocer las
concentraciones de contaminantes en puntos fijos como vertimientos
(domésticos o industriales) o si se quiere conocer el comportamiento general
de un cuerpo hídrico con respecto a los nutrientes que recibe a lo largo de su
cuenca [23].
- Frecuencia de monitoreo: Para determinar cuáles serán los lapsos se debe
tener en cuenta el objetivo de la red de monitoreo, así como las variables que
se han establecido en primeras instancias, ya que no todas las variables
necesitan ser monitoreadas en los mismos períodos, además de que un
monitoreo innecesario podría incurrir en costos [24].

La red de calidad hídrica de Bogotá permite el constante monitoreo de los 4 ríos


principales de Bogotá: Tunjuelito, Fucha, Salitre y Torca; esta tiene en total 28
puntos de monitoreo, distribuidos estratégicamente sobre los cuerpos de agua en
cuestión, y por medio de estos, evalúa parámetros fisicoquímicos y biológicos del
agua para así, generar un consolidado del estado actual de la calidad del agua de
los ríos estudiados. Bogotá tiene en su jurisdicción ríos y quebradas que están en
constante interacción con la población de la capital. Para este estudio, como se ha
venido mencionando, se tomarán en cuenta los ríos Salitre y Torca [25]. Los criterios
para el diseño de una red de calidad son:
- La localización de la estación de muestreo: es un factor clave que puede
determinar la validez de la información que se pretende inferir, a través del
análisis de las muestras colectadas en la misma. Haciendo referencia a la
representatividad de las fases y/o matrices que se extraen de un tramo del
río, efluente o sedimento y que sirven para definir las condiciones de calidad
media del mismo, prevalecientes en el ámbito espacial y/o temporal que
pretende identificar el estudio y objetivos de las tareas que se realizan en
dicha cuenca. [26]
- Pueden definirse tres niveles en el proceso de selección de las estaciones
de monitoreo y puntos de toma, una primera aproximación mediante la macro
locación o tramos del río que son representativos del nivel de calidad de toda
la cuenca, la micro locación que implica la ubicación dentro del tramo
precedente de la estación de muestreo y la selección final del punto o de los
puntos de toma de muestras, que van a dar un valor representativo del área
de monitoreo. [26]
- El diseño establecido permite realizar el seguimiento en un punto compuesto
por dos días intercalados, logrando así monitorear un punto compuesto 2

19
veces en un mismo día para obtener al final del diseño 20 datos por punto
repitiendo la metodología planteada [5].

4.4 RÍO SALITRE

Gráfica 1: Mapa de la ubicación del río Salitre en la ciudad de Bogotá.

20
Fuente: Autores.
El río Salitre nace en los cerros orientales con el nombre de quebrada Arzobispo,
el cual es canalizado desde el parque nacional y tiene un papel importante como
límite natural entre las localidades de Engativá y Suba, en donde cambia su nombre
a Juan Amarillo, haciendo honor al humedal con el mismo nombre. Este río tiene
una longitud total de 21,56 kilómetros desde su nacimiento en los cerros hasta su
desembocadura en el río Bogotá, en la instancia de la planta de tratamientos de
aguas residuales El Salitre [27].
El Salitre tiene un área de drenaje de 13.964 hectáreas, localizada en el sector
centro - norte del Distrito Capital, su pendiente media del cauce es de 3,32% y su
altura promedio es de 2870 m.s.n.m, donde la cota máxima está por el orden de los
3200 metros presentando corrientes naturales de agua de alta pendiente sobre los
Cerros Orientales; un sector medio que es plano y comprende gran parte del
sistema pluvial de la ciudad donde se han canalizado, entubado y rectificado los
cursos naturales y un sector bajo donde se encuentran cuerpos amortiguadores
naturales que entregan al río Bogotá y han sido reducidos en su capacidad por
acción antrópica y la cota mínima está sobre los 2540 metros (el perímetro urbano
va aproximadamente hasta los 2700 m.s.n.m) [28].
El rio salitre en los últimos años ha sido represado como medida preventiva para
evitar mayor afluencia del agua, por la carga de contaminantes que son vertidos en
sus aguas; el recorrido que hace el contaminante es: entre la carrera séptima y la
circunvalar se empiezan a ver los problemas que afectan al río, pues algunos
vertimientos empiezan a deteriorar sus cristalinas aguas, así mismo se realizan
vertimientos directos de los baños del parque nacional, por la falta de adecuación
de la zona, Como se ha mencionado el rio se divide en cuatro tramos, en el segundo
tramo el rio esta canalizado en su totalidad, en este tramo se presentan problemas
de indigencia, quienes dejan sus residuos en el canal, otro punto de vertimiento de
aguas residuales es la carrera 24 con calle 45 al frente del estadio el campin y por
la mitad de la carrera 30, aquí el rio aumenta su tamaño pero reduce su velocidad
lo que provoca la acumulación de basuras y sedimentación en sus aguas, en este
segmento también existen varios puntos de vertimientos de aguas domesticas
donde solo drenan las aguas pluviales al canal pues las negras se dirigen al rio
Fucha, los sectores críticos del rio son entre los ríos y la calle 80 pues las bajas
pendientes del salitre ocasionan que la velocidad se disminuya trágicamente,
generando problemas de sedimentación y de descomposición orgánica por este
motivo se presentan olores fuertes en esta zona, a las alturas de la Avenida 68 el
rio recibe las aguas de los canales rio negro y rio nuevo que trasportan las aguas
del norte y parte de metrópolis, disminuyendo más la velocidad del rio debido a su
carga contaminante; el río desemboca sus aguas cerca de la PTAR donde existen
vertederos ilegales y es este punto es donde el rio recoge la mayoría de carga
contaminada vertida entregando sus aguas tratadas al rio Bogotá . [29]

21
4.5 RÍO TORCA

Gráfica 2: Mapa de la ubicación del río Torca en la ciudad de Bogotá.

Fuente: Autores.

22
El Canal de Torca tiene una longitud de 4.24 kilómetros, que comienza desde el
canal Serrezuela y termina su recorrido en el humedal Torca- Guaymaral. La cuenca
cuenta con un sistema de alcantarillado, el cual a su vez está dividido por el sistema
de saneamiento y el sistema de aguas lluvias. El sistema sanitario es el que se
encarga de recoger todas las aguas residuales y las dirige a la planta de tratamiento
de aguas residuales El Salitre, mientras que el sistema de aguas lluvias, dirige el
agua recogida hasta el humedal torca, que posteriormente llegará a la cuenca media
del río Bogotá [3].
Como se mencionó en el planteamiento del problema, la cuenca del río Torca se
compone de 3 subcuencas (El cedro, San Cristóbal y Serrezuela) y de esta se
desprenden las siguientes quebradas [30] [31].

QUEBRADAS CUENCA
TORCA
Quebradas Bosque Pino y El
Cedro
Quebradas Arauquita y San
Cristóbal.
Quebrada Soratama
Quebrada Aguas Calientes
Quebrada Patiño
Quebrada San Juan
Quebrada Floresta
Quebrada El Novita
Fuente: [31].
El humedal torca-Guaymaral se encuentra una altura de 2550 m.s.n.m, el cual es
caracterizado por estar en un piso bioclimático altitudinal subandino o andino bajo,
a continuación se enlista la información aportada por la estación meteorológica de
Guaymaral [31].

HUMEDAL TORCA
Característica Dato
Temperatura 13,1*C
1305
Brillo solar
horas/año
Precipitación 773mm
Humedad 74%
Evaporación 947mm
Radiación
342 cal/cm2
solar
Fuente: [31].

23
El humedal de Torca-Guaymaral ha sufrido daños en su estructura ecológica debido
a infraestructura vial y demás construcciones, y así mismo, el canal de Torca posee
una serie de fuentes que contaminan sus aguas a lo largo de su recorrido, hasta
finalmente desembocar en el río Bogotá. Las fuentes de contaminación son [2].
1. Aguas residuales domésticas por vertimientos realizados directamente por la
red de alcantarillado público (este problema se evidencia en el primer tramo)
[2].
2. Cargas orgánicas, sólidos suspendidos totales y coliformes fecales que
provienen de los afluentes al canal (quebradas) así como el sistema de agua
lluvias aporta a estos contaminantes [2].
3. Vertimientos directos domésticos e industriales (segundo tramo del río,
puesto que no se cuenta con sistema de alcantarillado) [2].

4.6 MÉTODOS ESTADÍSTICOS

Por el crecimiento exponencial de las actividades económicas globales y el


desarrollo tecnológico, es importante que si se tienen medidas de seguimiento y
control (como las redes de calidad hídrica), estas tengan una constante
actualización y mantenimiento, para que de esta forma, sea posible tener
información más acertada sobre el estado de los cuerpos de agua que se estén
estudiando.
Por ello, es importante saber que el cambio de tecnologías y optimizaciones de las
redes de monitoreo tienen un costo significativo, y que esto repercute en si se decide
realizar estos cambios o no. De esta manera, es que muchos programas
informáticos permiten determinar cuáles son las mejoras que se pueden realizar a
una red existente, y poder generar una optimización que no incurra en costos
exagerados o cambios poco rentables.

4.6.1 ANÁLISIS JERÁRQUICO

Es un método estadístico de aprendizaje no supervisado usado para agrupar


elementos que compartan similitudes [32]. Está diseñado para resolver problemas
complejos con criterios múltiples. El proceso requiere que quien toma las decisiones
proporcione evaluaciones subjetivas respecto a la importancia relativa de cada uno
de los criterios y que, después, especifique su preferencia con respecto a cada una
de las alternativas de decisión y para cada criterio. El resultado es una
jerarquización con prioridades que muestran la preferencia global para cada una de
las alternativas de decisión. El análisis proporciona la posibilidad de incluir datos

24
cuantitativos relativos a las alternativas de decisión; la ventaja es que
adicionalmente permite incorporar aspectos cualitativos que suelen quedarse fuera
del análisis debido a su complejidad para ser medidos, pero que pueden ser
relevantes en algún caso [33].
La construcción de un modelo jerárquico, permite de una manera eficiente y grafica
organizar la información respecto de un problema, descomponerla y analizar por
partes, visualizar los efectos de cambios en los niveles y sintetizar información [33].
Una herramienta que es muy útil para poder sacarle provecho al análisis clúster es
el dendograma, la cual, permite visualizar de una manera más gráfica la agrupación
de información en clústeres [34].

Algunas de sus ventajas son: presenta un sustento matemático, permite desglosar


y analizar un problema por partes, permite medir criterios cuantitativos y cualitativos
mediante una escala común, incluye la participación de diferentes personas o
grupos de interés para generar un consenso, es de fácil uso y permite que su
solución se pueda completar con métodos matemáticos de optimización. [33]. Así
mismo, existen técnicas que se basan más en el reconocimiento visual que en el
procesamiento matemático puro.

4.6.2 GEOESTADÍSTICA IDW Y KRIGING)

La geoestadística es una rama de la estadística que permite estudiar, analizar y


estimar fenómenos espaciales o temporales por medio de técnicas que permiten
predecir valores implícitamente por información existente [35]. Su interés primordial
es la predicción y simulación de dichos fenómenos Esta herramienta ofrece una
manera de describir la continuidad espacial, que es un rasgo distintivo esencial de
muchos fenómenos naturales, y proporciona adaptaciones de las técnicas clásicas
de regresión para tomar ventajas de esta continuidad que se define como una
aplicación de la teoría de probabilidades a la estimación estadística de variables
espaciales. Cuando el objetivo es hacer predicción, la geoestadística opera
básicamente en dos etapas, la primera es el análisis estructural, en la cual se
describe la correlación entre puntos en el espacio, en la segunda fase se hace
predicción en sitios de la región no muestreados por medio de la técnica Kriging
[36].

El método Kriging es una interpolación óptima basada en una regresión realizada a


los valores observados, los cuales están rodeados de información (puntos de
información o “data points”) [37]. Este método tiene en cuenta la distancia y el grado
de variación entre los puntos conocidos y los puntos en áreas desconocidas. Esta
técnica tiene la ventaja de minimizar el error de la varianza de la información,
teniendo un promedio de cero en los errores de predicción, esto debido a que no se
realizan sobreestimaciones. En otras palabras, El Kriging es un método de

25
estimación el cual busca generar una estimación lineal de los valores de los puntos
con información [38].

Matemáticamente, el método tiene la siguiente fórmula

En donde,

Z (si)= Es el valor que se tiene en un punto específico.

Λi: Es la ponderación (dada en la interpolación) y desconocida al ejecutar el método


para un punto específico i.

So= La ubicación de la predicción.

N= el número de puntos medidos.

Esta interpolación es parecida al IDW (Inverse Distant Weighting) en algunos


aspectos; el IDW estima el valor de cada cuadrícula o “grid” usando puntos de
muestreo dentro de un radio específico, es decir que, los puntos que se encuentren
más cerca tendrán mayor influencia sobre la interpolación que aquellos que se
encuentren más lejos, por ello, es que el método Kriging es más preciso, ya que
esta interpolación usa diferentes funciones de peso dependiendo de la distancia y
la orientación de los puntos de muestreo con respecto al punto de referencia y la
manera en que la información está clasificada en clústeres [39].

La interpolación -Inverse Distant Weighting, IDW tiene como fórmula general:

Donde es el valor estimado para el punto j ; n es el número de puntos usados en la


interpolación; zi el valor en el punto i-ésimo y kij el peso asociado al dato i en el
cálculo del nodo j. Los pesos k varían entre 0 y 1 para cada dato y la suma total de
ellos es la unidad. Para establecer una función de proporcionalidad entre el peso y
la distancia, la fórmula general queda como sigue: [40]

26
1
Donde 𝑑𝑖𝑗 𝐵 es un exponente de ponderación que controla la forma en la que el peso
disminuye con la distancia Esta familia de métodos permite la generación del MDE
(modelo Digital de elevación), de una forma rápida y simple. Sin embargo, se trata
esencialmente de una media ponderada y el resultado se encuentra siempre
incluido dentro del rango de variación de los datos. Por este motivo, el correcto
tratamiento de las formas cóncavas y convexas depende estrechamente de la
distribución de los puntos originales y la presencia de datos auxiliares se hace muy
conveniente. [40]

Los métodos mencionados anteriormente fueron utilizados primeramente por las


estudiantes Lina Soto Cortes Y Angie Díaz león (propuesta de optimización de la
red de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y Tunjuelo en la ciudad
de Bogotá D.C), para la optimización de la red hídrica de Bogotá en los ríos Fucha
y Tunjuelo; se quiere en el presente trabajo realizar una verificación de las mismas
para los ríos Torca y Salitre con el fin de comprobarlas y determinar cuál es la que
más se asemeja al comportamiento de los datos de la RCHB para los cuerpos de
agua ya mencionados.

4.6.3 ANÁLISIS DISCRIMINANTE

El análisis discriminante es una técnica estadística multivariante cuya finalidad es


analizar si existen diferencias significativas entre grupos de objetos respecto a un
conjunto de variables medidas sobre los mismos para, en el caso de que existan,
explicar en qué sentido se dan y facilitar procedimientos de clasificación sistemática
de nuevas observaciones de origen desconocido en uno de los grupos analizados
[41].
Cuando se dispone de un cierto número de variables es el análisis discriminante,
que permite resolver incógnitas sobre el verdadero comportamiento de los datos
con respecto a categorías que el observador plantea. El método también se enfoca
en la determinación de unas funciones de las variables originales, que permite
decidir en qué clase debe estar cada elemento; utilizando como criterio de
asignación la proximidad de cada elemento a las distintas clases o grupos existentes
[42].

27
La construcción de las funciones discriminantes (combinaciones lineales de las
variables originales) se realiza buscando aquellas que hacen máxima la separación
entre grupos, lo que equivale a maximizar la variable entre grupos. [43].
La asignación de los elementos a clases se realiza mediante el criterio de Bayes:
cada elemento se asigna a una clase para la que es mayor la probabilidad de
pertenencia condicionada por los valores que toman las funciones discriminantes
[44]

- Modelo matemático: Partiendo de “q” grupos donde se asignan a una serie


de objetos y de “p” variables medidas sobre ellos (x, x1… xn), se trata de
obtener para cada objeto una serie de puntuaciones que indican el grupo al
que pertenecen (y, y1…yn), de modo que sean funciones lineales de (x, x1…
xn) [41].

Tales que discriminen o separen lo máximo posible a los “q” grupos. Estas
combinaciones lineales de las “p” variables deben maximizar la varianza
entre los grupos y minimizar la varianza dentro de los grupos [41].

4.6.4 RED NEURONAL ARTIFICIAL

La red neuronal artificial es un método inspirado en las redes neuronales biológicas,


en donde su funcionamiento se basa en la existencia de nodos (elementos simples
de procesamiento) que están organizados en capas. Estos nodos están
interconectados entre sí, creado enlaces de comunicación. Este sistema se basa en
el aprendizaje por experiencia, es decir, aprender a desarrollar o llevar cabo
acciones por medio de tareas programadas [45].

Gráfica 3: Esquema del principio de funcionamiento de la red neuronal


artificial.

28
Fuente: [45].

Por lo tanto, el método de la red neuronal artificial se caracteriza por lo siguiente


[46]:
- Posee unidades de procesamiento que intercambian información por
intercomunicación entre sí [46].
- Se utilizan para reconocer patrones [46].
- Con el tiempo, tiene la posibilidad de aprender y mejorar su procesamiento
[46].

Una de las consideraciones que se deben tener en cuenta es si el sistema debe


tener supervisión de un tercero o no, es decir, si es supervisado se referirá a si el
observador o encargado del sistema tiene información sobre las salida de las
acciones llevadas a cabo en la red neuronal para una serie de entradas que él
mismo dará; si es no supervisado es porque las salidas no tienen una relación
directa con las entradas del sistema [47].

Las redes neuronales pueden llegar a tener diez mil nodos o dendritas así como
pueden tener tan solo 10, depende de que tan complejo sea el sistema y cuál sea
el objetivo del creador de la misma. Así mismo, las redes pueden tener solo una
capa de intercomunicación entre nodos y una capa de salida (que es la red neuronal
más simple), pero las capas las define el usuario a razón de la complejidad de
interacción entre nodos [47].

Las redes neuronales artificiales son métodos universales de solución de


problemas, dependerá del algoritmo usado, el objetivo de la misma, la información
de entrada, la programación de las capas ocultas o caja negra, entre otras
características. A continuación se enlistan las ventajas y desventajas que tiene este
método a la hora de aplicarlo.

29
Tabla 3: Ventajas y desventajas de la implementación de una red neuronal
artificial.

VENTAJAS DESVENTAJAS
Necesita una serie de entrenamientos
Es un método que puede ser usado para
sucesivos, lo que dificulta el proceso de
predicciones a corto plazo y estimaciones.
obtención de información.
Una de las características de la RNA es Para que el funcionamiento de una RNA sea
que puede establecer relaciones no óptimo, la información que se ingrese al
lineales en el análisis de series de tiempo sistema debe ser confiable y de calidad
No existe una metodología universal para
Una RNA puede lidiar bien con la falta de calibrar, validar y entrenar una RNA, lo que
información o información perdida. dificulta su aplicación, pues dependerá del
objetivo de la misma.
La RNA puede aprender a manejar muy
Tiene pocas habilidades de generalización
buen un conjunto de datos de entrada y
de información
generar respuestas efectivas.
Fuente: [51].

4.5.4.1 Casos de estudio: uso de redes neuronales artificiales en


modelamiento de calidad de agua

Como en todo proceso que lleve a cabo procesos matemáticos, es necesario


determinar qué tan correcta es la predicción hecha por un modelo, para ello, existen
criterios estadísticos que permiten determinar esta eficacia a la hora de predecir
información. Uno de los más usados es el error cuadrático medio, el coeficiente de
correlación y el coeficiente de determinación; esto se realizó en un estudio en el río
Yamuna en india [48].

Los nodos o también llamados “pesos”, se someterán a un proceso de aprendizaje,


en donde la estructura estará sujeta a constantes cambios (dependiendo de la
información de entrada). La cantidad de nodos facilitará o dificultará el aprendizaje,
es decir, si en la capa escondida o caja negra se encuentran pocos nodos, esto hará
que los grados de libertad para aprender el proceso no sean suficientes [48].

30
Fuente: [48].

Así entonces, se lleva a cabo la calibración y validación del modelo, teniendo en


cuenta que previamente es necesario hacer un tratamiento estadístico de los datos
para homogeneizar la información. El objetivo del estudio es la simulación del
comportamiento del oxígeno disuelto (OD) en el río; se tiene 72 patrones, de los
cuales 48 serán para calibrar el sistema y 24 para validar el funcionamiento del
mismo [48].

Se estipularon 3 casos hipotéticos para crear las interacciones, teniendo en cuenta


que se tienen 2 estaciones (aguas arriba y aguas abajo), de esta manera se
estableció [48].

1. Toda la información de las estaciones aguas arriba y aguas abajo excepto


la información de oxígeno disuelto (aguas arriba).
2. Toda la información de las estaciones aguas arriba y aguas abajo excepto
la información de oxígeno disuelto (aguas abajo).
3. Toda la información de las estaciones aguas arriba y aguas abajo.

Para este estudio se utilizó el algoritmo de programación hacia atrás o “error back
propagation algorithm” [48].

En la reserva Beaver, en Arkansas, se utilizó la red neuronal artificial para predecir


los valores de concentración de chlorophyll-a (chl-a) y material suspendido en el

31
lago, teniendo en cuenta que al ser parámetros físicos, estos se podían obtener de
dos fuentes, la primera de imágenes Landsat obtenidas de los años 2001, 2002,
2003 y 2004, así como una serie de muestreos que realizaron los investigadores
[49].

Tal como en el anterior caso de estudio, se usó el error cuadrático medio, el


coeficiente de determinación y el coeficiente de correlación para calcular la
veracidad del modelo a la hora de predecir los valores de chl-a y sólidos
suspendidos. El número de bandas espectrales determinan el número de nodos (6)
de la capa de entrada, con 5 nodos en la capa oculta o caja negra, y una tercera
capa en donde se establece un nodo de salida (información de chl-a y sólidos
suspendidos) [49].

Gráfica 4: Red Neuronal Artificial propuesta la predicción de chl -a y SM


en la reserva Beaver.

Fuente: [49].
En China, para el río Hanjiang se usó la red neuronal artificial para determinar cuál
era el comportamiento de los contaminantes en un número específico de días (Kth)
teniendo en cuenta la legislación que estipula los límites permisibles de
contaminantes en los sistemas hídricos, así como los puntos en donde se dan
vertimientos por actividades industriales (Ws). La red se activa o genera un mensaje
de advertencia cuando en la capa de salidas hay presencia de información de uno
o más contaminantes, teniendo en cuenta que esto se sale del comportamiento
“normal” estipulado en la capa de entrada y en las instrucciones dadas al modelo
[50].

32
En Tainan, se realizó la construcción de un algoritmo multiobjetivo para para
optimizar el manejo y control de la calidad de agua del río Tou-Chen ya que este
presentaba diversos problemas de contaminación continua. En este caso de
estudio se usó el método “backpropagation algorithm”, que sirve para calcular el
error contribuido por cada una de las neuronas después de que una base de datos
es procesada [52].

Gráfica 5: Red Neuronal Artificial llevada a cabo con el método


backpropagation algorithm para el río Tou -Chen.

Fuente: [52].

Se seleccionó una muestra de entrenamiento y una muestra de testeo de la base


de datos original, en donde se llevaron a cabo 50 repeticiones hasta que el error
cuadrático medio fue menor a 0,1. El objetivo de la aplicación de la red neuronal fue
la de determinar los puntos débiles de la calidad del agua de un río y que un
controlador tuviera el poder de decisión sobre las instrucciones dadas al algoritmo
y que fuera flexible a los diferentes escenarios de la cuenca del río Tou-Chen [52].

33
El último estudio citado en esta sección se desarrolla en Heilongjiang en el noreste
de China, el rio mide 1890 km de largo de la parte alta y media del río, el método
que es un modelo matemático en primer lugar utiliza los pocos datos disponibles del
cuerpo hídrico donde se usó una red de monitoreo de calidad para calibrar el
modelo expuesto, Este modelo se aplica posteriormente para extender el conjunto
de datos y proporcionar información sobre las cuencas fluviales que no son
experimentales controlados. En segundo lugar, utiliza un análisis de los conjuntos
de datos experimentales y numéricamente extendidos con el fin de dividir toda la
longitud del río en tramos homogéneos con respecto a la calidad del agua, lo cual
gracias al a metodología optima se estimó los puntos donde debe ser instalada cada
estación de monitoreo en cada tramo del rio, el cual consta de 15 estaciones de
medición existentes. En este río, la DQO y el fueron identificados como los dos
parámetros más relevantes con respecto a la calidad del agua.
Para cada sección transversal del río en la que se dispone de datos numéricos, se
representan los parámetros de calidad del agua como:

donde el índice iyj representan la sección transversal y los Parámetro de calidad


considerados respectivamente, y a, b, c representan el valor más bajo, más alto,
respectivamente, de la Calidad del agua en todo el alcance del río Ka Kb se puede
interpretar como las desviaciones normalizadas de la calidad de agua de sus valores
medios. Obviamente, los parámetros Ka y Kb son equivalentes cuando sólo se
considera un parámetro de calidad del agua. Este no es el caso cuando los valores
compuestos de Ka y Kb se consideran como múltiples parámetros de calidad del
agua

34
El numerador 1/2 (aj þ bj) en la ecuación representa el promedio de los valores más
bajos y más altos del agua, j el parámetro de calidad en el río, El parámetro Sjk en
el denominador representa el valor umbral de la clase k para el agua el parámetro
de calidad j en la norma nacional de calidad del agua (GB3838-2002), que tiene
cinco clases (kmax ¼ 5). Si es mayor s la contaminación del parámetro de calidad
del agua j, Mayor su correspondiente factor de peso Pj. La ecuación normaliza
factores de peso para los diferentes parámetros de calidad del agua donde su suma
es igual a 1.

35
5. METODOLOGIA

Este proyecto tendrá varias etapas establecidas, las cuales, son importantes para
su desarrollo y ejecución. A continuación serán explicadas.

5.1 ESTADO ACTUAL DE LA RED Y SUS CARACTERISTICAS HISTÓRICAS.

Para determinar cómo se encuentra la red de calidad hídrica de los ríos Torca y
salitre, se realizó una recopilación y revisión bibliográfica, donde principalmente se
tuvo como referencia:

- Los valores registrados durante las cuatro campañas de monitoreo de la red


de calidad hídrica entre los años 2009-2013.
- El trabajo de grado de las estudiantes Lina Soto cortes y Angie Díaz León
(propuesta de optimización de la red de calidad hídrica de Bogotá (RCHB)
para los ríos Fucha y Tunjuelo en la ciudad de Bogotá D.C.), el cual sirve de
base para la comprobación de las metodologías establecidas.
- El Decreto 5731 de 2008, el cual establece los parámetros fisicoquímicos
evaluados en la calidad hídrica del río Bogotá.
- Bases de datos existentes, artículos, informes y demás bibliografía que
ayude a determinar su estado para poder optimizarlo.

5.1.1 TRATAMIENTO ESTADISTICO DE LOS DATOS

Por parte de la red de calidad hídrica de Bogotá, se tienen series de datos de calidad
de agua establecidos para los ríos Salitre y Torca (de igual manera se tienen para
los ríos Fucha y Tunjuelo); la primera parte de este proyecto se basó en el
tratamiento de las bases de datos, las cuales, se depuraron para tener información
más confiable. Para ello se realizaron los siguientes pasos

1. De las bases globales de información, se seleccionaron las estaciones que


correspondían a los ríos Salitre y Torca respectivamente (ya que las bases
contienen la información de todas las estaciones de la red de calidad hídrica
de Bogotá). Después de ello, se buscó ordenar los datos de forma
ascendente y temporal.

2. Después de tener en cuenta los parámetros establecidos en la normativa de


(Decreto 5731 de 2008) se extrajeron de la base de datos original solamente

36
las columnas correspondientes a los 10 parámetros que se tienen en cuenta
en los objetivos de calidad de agua de la ciudad (pH, oxígeno disuelto,
demanda biológica de oxígeno, demanda química de oxígeno, sólidos
suspendidos disueltos, grasas y aceites, coliformes fecales, nitrógeno total,
fósforo total y sustancias activas al azul de metileno). Para el río Torca solo
se utilizaron datos desde el año 2010 ya que en el año 2009, se tenían
establecidos otros puntos de monitoreo, que cambiaron en el año siguiente;
en el caso del rio Salitre se utilizaron todas las campañas entre 2009-2013
exceptuando la estación PTAR ya que solo tenía información para la
campaña 2009-2010.

3. Después de extraer la información necesaria para el estudio de las bases de


datos originales, se identificaron los valores atípicos (2% del total de datos
para ambos ríos) aquellos que se encontraban por encima de los límites
superior e inferior. Los datos atípicos fueron eliminados de los parámetros
pH y oxígeno disuelto, ya que fueron los únicos que presentaban mayor
número de registro, y por ende, mayor variabilidad.

5.2 APLICACIÓN DE LAS METODOS UTILIZADOS EN PREVIO ESTUDIO DE LA


RED DE CALIDAD HÍDRICA DE BOGOTÁ

Se aplicaron los métodos del trabajo de grado “Propuesta de optimización de la red


de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y Tunjuelo en la ciudad
de Bogotá D.C” (especificados en el marco teórico) y posterior a ello, se aplicó un
nuevo método para poder completar el análisis realizado a las bases de datos de la
RCHB, y así, determinar cuál es el que arroja la información más completa y
verídica. Las bases de datos, tienen la siguiente información: ESTACIÓNID,
observaciones, mes, día, año, hora inicial, hora final y las mediciones para los
respectivos parámetros. A continuación se explican los campos ESTACIONID y
observaciones, los cuales, cuentan con subcategorías especiales.

Tabla 4: Descripción de las variables ESTACIÓNID y observaciones,


pertenecientes a la base de datos de la RCHB

ESTACIONID OBSERVACIONES
Las estaciones con las Para este campo se tienen las
que cuenta este río son: siguientes categorías:
RÍO
- Bosque de pinos, Calle
TORCA
161, Jardines de paz y - N/A: Hace referencia a la falta
San Simón de información del día de

37
Las estaciones con las medición.
que cuenta este río son: - Soleado.
RÍO Carrefour - AV 68, TV91, - Nublado.
SALITRE Alameda, Río Arzobispo, - Lluvia
Parque Nacional y Calle
53

Fuente: autores
5.2.1 ANÁLISIS PRELIMINAR

Para el análisis preliminar, se utilizaron el test de Kruskal Wallis y la prueba de


Pairwise Wilcox. Donde la prueba de Kruskal-Wallis es un método no paramétrico
para probar si un grupo de datos proviene de la misma población y el test de Wilcox
para comparar dos muestras están relacionadas El test de Kruskal Wallis es un test
no paramétrico análogo al análisis de varianza (ANOVA), con una distribución chi-
cuadrado. Es la prueba más utilizada para más de dos muestras independientes,
siendo mucho más sensible que el test de la mediana. Este método se encarga de
medir la tendencia central de las muestras, teniendo como hipótesis nula que las
poblaciones testeadas tienen la misma mediana [43].

Cuando el análisis de Kruskal determina que los tratamientos (en este caso las
variables cualitativas evaluadas) no tienen la misma varianza, se procede a realizar
el test de pairwise wilcox, esta prueba sirve para determinar la diferencia inter-
grupos [54]. No todos los parámetros tienen la misma significancia con respecto a
todas las variables evaluadas, es decir, que no todas las variables influyen en el
cambio de concentración registrado por la red de calidad hídrica, y para ello, se
realizó este test. Para este trabajo con el nivel de significancia del 0.05, el cual indica
la probabilidad bajo la cual no hay efecto o diferencia de obtener un resultado
diferente al que se tuvo al inicio del estudio.

La prueba de pairwise es un método combinatorio de pruebas de software que, para


cada par de parámetros de entrada a un sistema (típicamente, un algoritmo de
software), prueba todas las posibles combinaciones, discretas de esos parámetros.
Utilizando vectores de prueba cuidadosamente seleccionados, esto puede hacerse
mucho más rápido que una búsqueda exhaustiva de todas las combinaciones de
todos los parámetros, "paralelizando" las pruebas de pares de parámetros [39]. Para
este tipo de test estadístico, el ajuste del p value por medio de Bonferroni y Holm
son de los más conocidos, teniendo en cuenta que ambos se realizan estableciendo
suposiciones arbitrarias. Bonferroni es el método más usado ya que es muy común
al controlar la tasa de error familiar; la corrección o ajuste lo realiza encontrando el
valor crítico (alpha) para un test individual dividiendo la tasa de error (que por
defecto generalmente es 0,05) entre el número de test realizados [56].

38
Posterior a ello se aplicaron los métodos previamente mencionados en el marco
teórico de este documento, para las técnicas se usaron los softwares: ArcMap
(ESRI) y R Studio. A continuación se explican los pasos de cómo se realizó el
análisis por medio de métodos estadísticos.
5.2.2 APLICACIÓN DE LOS MÉTODOS ESTADÍSTICOS

1. Análisis jerárquico: cuando se ha culminado la etapa de análisis de varianza,


se realizó un análisis visual por medio de diagramas matemáticos con
coordenadas cartesianas o diagrama de puntos, en donde se ve el
comportamiento en el espacio de los parámetros versus cada una de las
variables de referencia. Posterior a ello se complementa con los
dendogramas, generados para comparar los parámetros entre sí, y
determinar cuáles afectan directamente el comportamiento de los demás.
Se usó el método Ward de varianza mínima (desarrollado por Joe H. Ward
Jr.) en donde se calcula el error de la suma de los cuadrados para determinar
la distancia entre los clústeres finales. Primero, el test se enfoca en calcular
n-1 clústeres, posterior a ello se calcula el r2 y el error de la suma de los
cuadrados, esto para comenzar a agrupar los clústeres de referencia inicial;
entonces, aquellos grupos que tengan el menor error de la suma de
cuadrados (o en su defecto el mayor r2) formarán el primer clúster, y así,
sucesivamente se repite el proceso restando una unidad más al valor inicial
n (número de categorías) [57].
2. Análisis lineal de discriminantes: como se mencionó anteriormente en la parte
teórica del documento, este método se usó para poder determinar si los datos
originales pertenecen a los grupos iniciales de clasificación, o por si el
contrario, pueden ser clasificados en un nuevo grupo. Primero se realizó el
análisis discriminante global por variable, para ver cómo se comportan los
parámetros y cómo cada uno afecta la discriminación realizada, posterior a
ello se realizó el ALD individual, para analizar más a detalle el
comportamiento de los parámetros vs cada una de las variables; el programa
RSTUDIO arrojó gráficos como histogramas y plots de mosaico, de los cuales
se realizó su respectiva interpretación.
3. Kriging/IDW: unas de las ventajas de estos métodos son los resultados
visuales que arroja, ya que, esto permitió determinar desde una perspectiva
más gráfica el comportamiento de los parámetros a lo largo de los cuerpos
de agua. Los mapas se realizaron por mes (análisis mensual multianual) para
cada uno de los parámetros, obteniendo así 120 mapas por río para su
respectivo análisis, El método Kriging no pudo ser aplicado para todos los
casos de estudio.
4. Red Neuronal Artificial: esta es la parte final del proyecto, ya que se diseñó
un sistema de nodos, el cual permitió potenciar el sistema de medición ya
existente y así poder determinar cuál es el comportamiento inicial de
medición de esta red de calidad. El objetivo de esta programación es

39
primeramente, reclasificar los datos originales, seguido de un entrenamiento
de neuronas, para así, poder predecir valores del caso de estudio. El
procedimiento de la red neuronal se llevó a cabo en dos pasos importantes,
primero el entrenamiento de la red, en donde se determinó (en la capa oculta)
el número de neuronas que ayudarían a calcular correctamente los pesos
finales correspondientes con cada una de las categorías de las variables
estudiadas. Para el entrenamiento, se generó una base de datos aleatoria
con el 70% de la información que se tiene para cada uno de los ríos.

Posterior a ello, se realizó la clasificación de la información predicha por la


red neural, para ello, se generó una base de datos con el 30% de la
información de cada uno de los ríos. En este caso, se corrió el código más
de una vez, ya que en cada repetición se generaban nuevas muestras
aleatorias, tanto los pesos generalizados de la red como la clasificación de la
información cambiaban.

40
6. RESULTADOS Y ANÁLISIS DE RESULTADOS.

A continuación se mostrarán los resultados correspondientes a cada metodología


planteada en el trabajo: Resultados del análisis de varianza (Kruskal – Wallis),
resultados de la prueba Pairwise Wilcox, diagrama matemático con coordenadas
cartesianas (scatterplot), análisis jerárquico – dendograma, análisis lineal
discriminante, análisis geoestadístico y la red neuronal artificial, las cuales fueron
arrojados por el programador; posterior a ello, se muestran los análisis de cada
método. Se tiene en cuenta que por la cantidad de resultados obtenidos, aquí se
muestran algunos, los más representativos de cada método y los demás serán
mostrados en los anexos.
6.1 RESULTADOS DEL ANÁLISIS DE VARIANZA (KRUSKAL – WALLIS)

En las tablas 5 y 6 se resumen los resultados arrojados por este test, en donde, la
significancia o no de un parámetro está dada por la siguiente simbología

Códigos de significancia: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

En donde la cantidad de asteriscos determina que tan fuerte es la influencia de la


variable sobre los parámetros evaluados. En el caso de no encontrar simbología en
la tabla, es porque la variable no actúa directamente en la variabilidad de la
información registrada.

Como análisis general, la prueba de Kruskal – Wallis arrojó que la variable estación
tiene un alto grado de significancia (p<0,05) para todos los parámetros, indicando
que esta variable afecta significativamente la variabilidad de la información. Para los
demás parámetros, dependiendo de su naturaleza, influenciarán ciertas variables,
por ejemplo para el río salitre, las variables que influyen en la concentración son
meses y observaciones en mayor medida, mientras que para el río Torca es
fundamental el variable año.

Tabla 5: Resumen de los resultados arrojados por la prueba Kruskal Wallis para el
río Torca.

ANÁLISIS DE VARIANZA (Significancia)


Observaciones Estación Día Mes Año
pH ** *** * ***
Oxígeno disuelto *** . *
DBO ** *** ** ***

41
DQO ** *** * ***
SAAM ***
Grasas y aceites *** * ** ***
Coliformes fecales *** . ***
Sólidos suspendidos
***
totales
Fósforo total *** *** ** *** ***
Nitrógeno total *** ** ***
Fuente: Autores.

Para el río torca, se ve en la tabla 5 que los parámetros sólidos suspendidos totales
y sustancias activas al azul de metileno dependen únicamente de la estación, esto,
se debe a que estos parámetros están fuertemente ligados con actividades
antrópicas ya que los vertimientos domésticos e industriales tienen sólidos
suspendidos totales y tensoactivos. Se aclara que los sólidos totales también se
generan por procesos de desgaste del suelo, y esto complementa la cantidad
generada por los vertimientos descargados directamente en el cuerpo de agua.

Tabla 6: Resumen de los resultados arrojados por la prueba Kruskal Wallis para el
río Salitre.

ANÁLISIS DE VARIANZA (Significancia)


Observaciones Estación Día Mes Año
pH *** *** ** ***
Oxígeno disuelto *** ** ***
DBO ** *** **
DQO *** **
SAAM . *** *
Grasas y aceites * *** * ***
Coliformes
fecales
Sólidos
suspendidos * *** * **
totales
Fósforo total *** ***
Nitrógeno total . *** **

Para el río Salitre, se ve en la tabla 6 que el parámetro coliformes fecales presenta


fluctuaciones en sus concentraciones por variables no tenidas en cuenta en la base
de datos, como los vertimientos domésticos, vertimientos industriales y demás

42
actividades, por ello, el test de Kruskal – Wallis considera que ninguna de las
variables aporta al cambio de coliformes fecales a lo largo del cuerpo de agua.
6.2 RESULTADOS DE LA PRUEBA PAIRWISE WILCOX.

Esta es la continuación de la prueba de Kruskal - Wallis; aquí se determinó cuál es


la relación intergrupal de la información de las bases de datos. Para ambos casos,
se tuvo en cuenta que la estación era la variable de mayor importancia ya que es la
que de acuerdo a la ubicación registró valores que variaban por factores externos
como las actividades antrópicas de la zona en donde se encuentra cada punto de
muestreo. A continuación se muestran los resultados del test para estaciones en las
tablas 7 y 8, en donde se ve el resumen de los resultados; en ellas se enlistan las
estaciones que registran valores similares de los parámetros evaluados, esto con el
fin de poder generar la propuesta de optimización con respecto a la eliminación o
adición de puntos de monitoreo.
Así mismo, de todos los resultados que podrán encontrarse posteriormente en los
anexos, se adjunta en esta sección del documento un ejemplo del Boxplot generado
por este test para el respectivo análisis de la relación intergrupal de los parámetros
fisicoquímicos y biológicos.
Tabla 7: Resultados del test pairwise wilcox en donde se contrasta los parámetros
fisicoquímicos contra la variable “ESTACIONID” para el río Torca

PARÁMETROS ESTACIÓN ID
Jardines de Paz y Calle
pH 161
Jardines de Paz y San
Oxígeno disuelto Simón
Jardines de Paz y Calle
DBO5 total 161
Jardines de Paz y Calle
DQO total 161
sustancias activas al azul Jardines de Paz y Calle
de metileno 161
Jardines de Paz y Calle
Grasas y aceites 161
Sólidos suspendidos Jardines de Paz y Calle
totales 161
Jardines de Paz y Calle
Coliformes fecales 161

43
Jardines de Paz y Calle
Fósforo total 161
Jardines de Paz y San
Nitrógeno total Simón

Fuente: Autores.

Gráfica 6: Boxplot del parámetro “pH” vs estación para el río Torca.

Fuente: autores.

Para el Río Torca, como se ve en la tabla 7, las estaciones que mayor similitud
tienen son calle 161 y jardines de paz, teniendo en cuenta que son estaciones que
aunque espacialmente no se encuentren tan cerca, ambas están ubicadas en el
tramo dos del río, en donde hay más influencia antrópica en las descargas en el
canal (por parte de las zonas residenciales y comerciales).

Con respecto a las observaciones, para el río Torca no hay una condición climática
que influya más que otra ya que las medias no presentan cambios muy significativos
entre categorías. La categoría N/A para el parámetro de sustancias activas al azul
de metileno y oxígeno disuelto, es la más representativa, sin embargo, no es posible
determinar si la presencia o ausencia de la luz solar influye en el comportamiento
de las concentraciones.

Tabla 8: Resultados del test pairwise wilcox en donde se contrasta los parámetros
fisicoquímicos contra la variable “ESTACIONID” para el río Salitre.

PARÁMETROS ESTACIÓN ID
pH Alameda,TV91, calle 53

44
Oxígeno disuelto Carrefour, TV91
DBO5 total Alameda,TV91, calle 53
DQO total Alameda,TV91, calle 53
Sustancias activas al azul
de metileno Alameda,TV91, calle 53
Grasas y aceites Alameda,TV91, calle 53
Sólidos suspendidos Alameda,TV91, calle 53,
totales Carrefour
Coliformes fecales Calle 53
Fósforo total Alameda,TV91, calle 53
Nitrógeno total Alameda,TV91, calle 53

Fuente: Autores.

Gráfica 7: Boxplot del parámetro “pH” vs estación para el río Salitre.

Fuente: autores.

Para el río Salitre, como se ve en la tabla 8, las estaciones Calle 53, Alameda y
TV91 tienen comportamientos similares con respecto a la variabilidad de las
concentraciones de los parámetros y por la dinámica geográfica que tiene el flujo
del canal, pues en estos puntos que se encuentran ubicados en los tramos dos y
tres se encuentran vertimientos industriales, domésticos y algunos ilegales

45
aumentando la concentración de algunos parámetros por lo que se puede dar su
similitud de datos.

Con respecto a la variable observaciones, se puede afirmar que la categoría


“soleado” en los parámetros exceptuando DQO y grasa y aceites, es la variable
que tiene un comportamiento diferente las otras tres categorías (N/A, nublado y
lluvia) ya que su media se diferencia de las demás (aumenta o disminuye
dependiendo del parámetro) por lo que se cataloga como la condición climática que
afecta en mayor medida las concentraciones de los parámetros evaluados

Para ambos ríos, las variables mes y días, son variables que no presentan cambios
muy pronunciados en sus medias, es decir que no se puede inferir que medir en el
mes de enero los días viernes sea diferente a medir el mes de junio los días martes
ya que los resultados arrojan que no hay diferencia en los resultados obtenidos por
el periodo en el que se mida.

Los boxplot puestos como ejemplo (gráficas 6 y 7) muestran cuál es la importancia


de la estación para los parámetros, pues es la variable que presenta mayor cambio
en las medias registradas, hay parámetros en donde esta diferencia de medias es
más marcada que en otros, pero en resumen, se quiere denotar que los boxplot
afirman los resultados de la prueba de pairwise wilcox (Para mayor información,
consultar los anexos)

6.3 DIAGRAMA MATEMÁTICO CON COORDENADAS CARTESIANAS


(SCATTERPLOT)

Este es un método de gráfica de datos que sirve para el contraste de variables [58].
En este caso, se usó para contrastar los parámetros físico-químicos versus las
variables de referencia que hayan sido relevantes en la comparación de pairwise,
para así, poder complementar con los resultados obtenidos en la fase anterior del
análisis de ANOVA.
El objetivo principal de llevar a cabo este procedimiento gráfico fue determinar cuál
es la relación preliminar (directa o indirecta) entre variables continuas [59]; la
generación de estos gráficos es un paso complementario a previos test para poder
complementar los análisis mostrados más adelante.
Gráfica 8: Scatterplot matrix de sustancias activas al azul de metileno y
fósforo total vs estación para el río Torca

46
Fuente: autores.
Gráfica 9: Scatterplot matrix de Fósforo total, Coliformes fecales y
Nitrógeno total vs estación para el río Salitre.

Fuente: autores.
En las gráfica 8 y 9, se establece la relación entre los parámetros sustancias activas
al azul de metileno y fósforo total, que para ambos ríos es un de las relaciones más
fuertes (directamente proporcional). Así mismo, los parámetros DBO y DQO

47
también tienen a tener un comportamiento directamente proporcional, más fuerte en
el río Torca. Para mayor información, revisar anexos.
Teniendo en cuenta los resultados arrojados para los parámetros sustancias activas
al azul de metileno y fósforo total la relación directamente proporcional se da en que
las sustancias activas al azul de metileno reaccionan en medios alcalinos con
componentes de los detergentes sintéticos, una de las principales fuentes
aportadoras de fósforo [58].
Así mismo se ve que para ambos ríos la relación más marcada se ve entre la DBO
y DQO, teniendo en cuenta que ambos parámetros están ligados por la cantidad de
oxígeno que quiere la materia orgánica (con compuestos químicos por las
descargas residuales y compuestos orgánicos en donde los agentes son las
baterías aerobias) para ser sintetizada.
Sin embargo, estos gráficos no pueden determinar una relación definitiva entre
parámetros, teniendo en cuenta que pueden existir factores externos a los
evaluados en este trabajo, que influyan en la relación que se da realmente entre los
parámetros fisicoquímicos y biológicos tratados en este estudio puesto que el
método de los scatterplots no detecta variables discretas.
6.4 ANÁLISIS JERÁRQUICO - DENDOGRAMA

Posterior al paso de generar los scatterplots, se hizo el análisis jerárquico para


determinar qué parámetros fisicoquímicos tienden a parecerse a los demás. Para
ambos ríos, las ramificaciones del dendograma se comportan de la misma manera,
determinando que existen las siguientes relaciones.
 Demanda química de oxígeno y sólidos suspendidos totales.
 Demanda biológica de oxígeno y grasas y aceites.
 Nitrógeno total
 pH, oxígeno disuelto, sustancias activas al azul de metileno y fósforo total.

El programa permitió realizar una clasificación por grupos (a parte de las


ramificaciones iniciales) para formar grupos más específicos, dado el caso las
divisiones involucren muchos parámetros. Se estableció que se dibujaran 7
rectángulos en las ramas, señalando los clústeres finales.
Al aplicar el análisis jerárquico, se formaron inmediatamente dos clústeres en donde
uno está conformado por el parámetro coliformes fecales y el otro está formado por
los demás parámetros del estudio (tal como se especificó en la sección 6.1.3). Se
determinó entonces que los coliformes fecales tienen un comportamiento aislado,
puesto que no está influenciado por el cambio de concentraciones de los demás
parámetros.

48
Gráfica 10: Dendograma de los parámetros fisicoquímicos para el rí o
Torca.

Fuente: autores.
Gráfica 11: Dendograma de los parámetros fisicoquímicos para el río
Salitre.

49
Fuente: autores.
Al realizar la clasificación jerárquica en presencia del parámetro “coliformes fecales”
(como se ve en la gráficas 10 y 11), se denota que los demás parámetros no se
definen por sus diferencias y son clasificados como un gran clúster, lo que impide
establecer la relación entre ellos; este comportamiento puede darse por el recorrido
que hacen los ríos pues en algunos de sus tramos debido a la sedimentación y
carga orgánica existe mayor presencia de coliformes. Este parámetro es un
parámetro biológico que depende de la presencia de vertimientos domésticos (al
estar presente principalmente en excrementos humanos y animales) por lo que
estos resultados no presentan relación inicial con los demás parámetros, ya que los
coliformes fecales en particular dependen en tal caso de la dinámica poblacional de
la zona de estudio. Posterior a ello, cuando se realizó el análisis jerárquico sin el
grupo de coliformes fecales, ya se generaron más ramificaciones en los respectivos
dendogramas.

Gráfica 12: Dendograma de los parámetros fisicoquímicos sin coliformes


fecales para el río Torca.

Fuente: autores.

Gráfica 13: Dendograma de los parámetros fisicoquímicos sin coliformes


fecales para el río Salitre.

50
Fuente: autores.

Entonces, al ser excluido el parámetro coliformes fecales, los dendogramas


generaron respectivamente dos grandes ramificaciones o clústeres para ambos ríos
con los parámetros igualmente clasificados (como se ve en las gráficas 12 y 13). El
primer gran grupo se formó teniendo en cuenta los parámetros DQO y sólidos
suspendidos totales; los sólidos suspendidos totales permiten que la adsorción de
contaminantes sea mayor, lo que implica mayor cantidad de oxígeno para poder
oxidar los diversos compuestos presentes en el agua.

La segunda ramificación tiene contenido en su clasificación a los parámetros pH,


oxígeno disuelto, sustancias activas al azul de metileno y fósforo total como la
división principal y los parámetros DBO y Grasas y Aceites en otro grupo pero con
características similares; sin embargo la cercanía entre los pesos de cada uno de
los parámetros en este clúster varia para cada caso, el río Torca presenta una
relación entre oxígeno disuelto, sustancias activas al azul de metileno y fósforo total
y mantiene el pH dentro del grupo pero con una relación menos fuerte (gráfica 12),
mientras que el río salitre asocia el pH con el oxígeno disuelto, y el fósforo total con
las SAAM (gráfica 13).

La relación pH y oxígeno disuelto, está dada entre otros factores por la temperatura,
ambos tienen una relación inversamente proporcional a este parámetro, teniendo
en cuenta que cuando la temperatura aumenta, se rompen las moléculas de agua,
liberando así iones de hidrógeno y oxígeno, el oxígeno sale por medio de

51
evaporación mientras que los iones de hidrógeno acidifican el agua. Por otro lado,
la relación entre los parámetros sustancias activas al azul de metileno y fósforo total
se da por la composición de los tensoactivos descargados a lo largo de los cuerpos
de agua (esto, teniendo en cuenta que ambos ríos relacionan estos dos parámetros)
contienen fosfatos en su composición.

Finalmente, la relación entre los parámetros DBO y Grasas y Aceites se da ya que


las grasas y aceites son mezclas de hidrocarburos con componentes orgánicos, que
en contacto con el agua envuelven a las comunidades microbianas que están
presentes en los cuerpos de agua, generando una acción asfixiante para ellas ya
que gracias a la composición semi-hidrófila de las grasas y aceites, el oxígeno no
puede ser usado por dichas comunidades para degradar los componentes
biológicos de este contaminante.

6.5 ANÁLISIS LINEAL DE DISCRIMINANTES

A continuación se mostrarán los resultados del análisis discriminante para cada uno
de los ríos.
Gráfica 14: Diagramas de los respectivos grupos del análisis
discriminante para el río torca con respecto a las estaciones.

Fuente: autores.
Una de las variables que tiene mayor importancia a la hora de determinar la
fluctuación de los valores registrados por la red es la estación; para el río Torca, se
ve que la estación Jardines de paz se aglomera espacialmente junto a las demás
estaciones (gráfica 14), demostrando, que los resultados registrados por esta
estación son similares a la estación calle 161, y en casos específicos a la estación
San simón.

52
Gráfica 16: Plot de mosaico para el parámetro coliformes fecales versus
estación para el rio Torca

Fuente: autores.

De acuerdo al análisis lineal discriminante individual, para la estación 1 (bosque de


pinos) se dio la clasificación más acertada con respecto a la original para todos los
parámetros, teniendo en cuenta que es la única estación que se encuentra en el
tramo 1. Así como en el análisis general, las tres estaciones del tramo 2 comparten
similitudes, y por ello, 9 de los 10 parámetros distribuían la información
equitativamente entre ellas, salvo el parámetro coliformes fecales (gráfica 16) en
donde la información de las 4 estaciones era muy similar y la distribución fue más
equitativa entre las estaciones 2 y 3 (calle 161 y jardines de paz).
Para la variable año en el rio torca, hay una tendencia en la clasificación de los
datos, ya que más del 90% de la información se clasifica como registrada en el año
2011; esta clasificación final se debe a que la información en gran medida realizada
por la red de calidad hídrica se realizó en el año 2011, el año 2010 no posee gran
información, por lo que es posible que los datos registrados en este año sean
similares a los de otros años. Así mismo, la red de calidad hídrica para el rio Torca
tenía registrada información del año 2009 para este río, sin embargo, esta
información pertenece a estaciones que no son contempladas en los siguientes
períodos por la red, por lo que la información no ha sido incluida y puede que esto
afectará la clasificación final.

Grafica 15: Diagramas de los respectivos grupos del análisis


discriminante para el río salitre con respecto a las estaciones.

53
Fuente: autores
En el caso del rio Salitre, la variable estación mostró alta significancia (gráfica 15),
demostrando que la estaciones 1, 2 y 6 (Alameda, Río Arzobispo TV 91) se
encuentran aglomeradas espacialmente en otras estaciones (Carrefour, Calle 53 y
Parque nacional).
Para el rio Salitre si se tuvo en cuenta la información del año 2009 la cual se clasifica
en su totalidad en el año 2011 según el método, pero en general no se estableció
que los datos pudieran variar entre años, de tal forma que permitiera determinar si
el dato pertenecía a un periodo de tiempo en específico, puesto que los datos de
los parámetros oscilan entre rangos definidos y no hay variaciones significativas
entre años.

Para la variable observaciones en los dos ríos (Salitre y Torca), la clasificación de


la información en nuevas categorías desiste de dos de las antiguas categorías (n/a
y lluvia) teniendo en cuenta que la información se adapta mejor a las categorías
“nublado” y “soleado” descartando lluvia que aglomera la mayoría de sus datos en
”nublado” (89% para el río Torca y el 80% para el río Salitre). En el caso de la
variable observaciones, se puede decir que a excepción de los sólidos suspendidos
totales, coliformes fecales y grasas y aceites, que clasifica todos sus datos en la
variable soleado, se clasifican por iguales tanto soleado y nublado, la gráfica no
tiene en cuenta ni lluvia ni N/A pues clasifica su información en soleado.

54
Gráfica 17: Plot de mosaico para el parámetro sustancias activas al azul
de metileno versus estación para el río Salitre

Fuente: autores.
Explicando uno de los parámetros, se puede observar que el él plot mosaico para
el parámetro SAAM versus las estaciones (gráfica 17) se concluye que de las seis
estaciones, los datos se distribuyen tres de ellas (alameda, río arzobispo y AV68)
y que la estación parque nacional es la que mayor número de datos acoge.
Para la variable mes, en el caso de los dos ríos (Salitre y Torca), se denota que la
clasificación nueva tenía sus complicaciones, esto debido a que inicialmente se
especificó que no todos los meses del año poseían información de mediciones
realizadas por la red de calidad hídrica, lo que dificultaba tener un patrón de
referencia mensual para la nueva clasificación; en general, se ve que la mayoría de
la información se clasifica como realizada en los meses de septiembre, octubre y
noviembre.
6.6 ANÁLISIS GEOESTADÍSTICO

En todo el trabajo, se ha realizado un análisis puntual de la información obtenida


por cada una de las estaciones de los dos ríos (Salitre y Torca); para ello, se
generaron interpolaciones por medio de los métodos Kriging e IDW para cada uno
de los parámetros por mes, los mapas resultantes permitieron determinar cuál es el
comportamiento de estos parámetros a lo largo del río y los cambios de
concentraciones de acuerdo al tramo y estación en las que se miden.

55
Gráfica 18: Mapa de las concentraciones de oxígeno disuelto para el
mes de febrero para el río Torca

Fuente: Autores.

56
Gráfica 19: Mapa de las concentraciones de pH para el mes de marzo
para el río Salitre.

Fuente: autores.

57
- pH
El pH es un parámetro que está en función de la temperatura y la profundidad del
cuerpo de agua, en este caso de un humedal (Juan Amarillo y Guaymaral – Torca),
que es un cuerpo lentico en donde se dan muchos procesos fisicoquímicos y
microbiológicos, la temperatura del cuerpo de agua aumenta, disminuyendo así los
niveles de este parámetro [60], de igual forma, los humedales se caracterizan por
ser ambientes con naturaleza silicia (pobres en caliza) los cuales mantienen pH
neutro o algunas veces cercanos a 6 (un poco más ácidos) [61]. En general este
parámetro siempre se mueve en el mismo rango (6,5-9,0).
En el rio torca, Los valores más altos se registran en la estación jardines de paz
puesto que esta estación se encuentra en el punto en que el canal de torca se
convierte en humedal, no hay valores atípicos en algún mes en específico. Se puede
apreciar en los mapas (revisar anexos) que este parámetro tiende a registrar los
mayores valores en la estación 3, Jardines de Paz, y después de ello, cuando el
efluente llega al humedal, el pH disminuye.
Para el rio salitre (ejemplo gráfica 19) se puede observar en los mapas que la
estación Av 68 es la que presenta los mayores valores en todos los meses, esto se
debe a que es una zona industrial, donde existe mayor carga de vertimientos; los
valores más bajos se pueden observar en la estación río arzobispo y parque
nacional pues están ubicadas en la cuenca alta donde el agua no ha recibido
grandes cargas de vertimientos, en la cuenca baja del rio se pueden observar los
datos más altos de pH en esta parte del rio por su descomposición anaerobia de
materia orgánica, hace que se genere una cantidad de ácidos grasos volátiles para
disminuir el pH del rio.
- Oxígeno disuelto
El oxígeno disuelto se encuentra en diversas concentraciones a lo largo de la masa
de agua, también se ve afectado por la temperatura (como el pH), la presión
atmosférica, el viento y procesos biológicos (fotosíntesis y respiración) [62].
Para el río torca (ejemplo gráfica 18), la concentración de oxígeno disuelto tiende a
disminuir a través de los meses medidos, esto en sí, es un comportamiento normal
de este parámetro, teniendo en cuenta que aguas abajo, se encuentra el humedal,
en donde se producen muchos procesos biológicos, en donde se consumen
grandes cantidades de oxígeno disuelto, así mismo, estos bajos niveles de oxígeno
disuelto pueden determinar qué tan contaminado está el cuerpo de agua [63].
Para el rio salitre se puede observar en todos los meses que a medida que el río
hace su recorrido, las concentraciones para este parámetro van disminuyendo, para
el oxígeno disuelto. La estación Av 68 es la que mayor variabilidad tiene en los
datos, ya que en este tramo medio del río se empieza a ver la disminución de

58
oxígeno disuelto puesto que los organismos anaerobios hacen presencia en el río
por la descarga residual del sector.
- Demanda biológica de oxígeno
La DBO sirve para determinar qué tanto oxígeno es requerido para degradar la
materia orgánica, cuando este parámetro se encuentra a niveles altos, indica que la
materia orgánica necesita de mayores cantidades de oxígeno para realizar los
procesos de degradación [64]. Este parámetro es inversamente proporcional al
oxígeno disuelto, por lo que, en los mapas, se ve que este parámetro aumenta
significativamente en la estación calle 161; en este punto se une el canal San
Cristóbal y más adelante al canal serrezuela, los cuales traen consigo grandes
cantidades de aguas de escorrentía provenientes de canteras [65]. Sin embargo,
los niveles no sobrepasan el límite permisible de la norma por lo que puede decirse
que es un cuerpo de agua medianamente contaminado. Para el rio salitre se puede
ver que las concentraciones más altas en todos los meses ocurren en el tramo 3 y
4 donde están las estaciones Av 68 y calle 53, ningún valor ha pasado el limite
normativo.
- Demanda química de oxígeno
La DQO es un parámetro que permite medir la oxidación de los compuestos
orgánicos e inorgánicos presentes en el agua [66]. Este parámetro está ligado con
la demanda biológica de oxígeno y siempre tiende a registrar valores mayores, ya
que se necesita más oxígeno para oxidar compuestos orgánicos que para la
demanda de organismos en un cuerpo de agua. Cuando los valores de DQO son
mayores indican un alto grado de contaminación, así como la DBO. Para el rio torca,
los niveles de DQO en el canal no sobrepasan los límites permisibles (salvo los
meses de mayo y julio que se registran valores atípicos) por lo que podría
considerarse como un cuerpo de agua medianamente contaminado.
Para el rio salitre se puede apreciar que la DQO tiene un comportamiento similar a
la DBO, en la mayoría de los meses se puede decir que los valores altos de la
concentración están en las estaciones Av 68, tv 91 y alameda, la última estación
(alameda) no tiene la mayor carga de concentración la tiene la estación Av 68, se
puede decir de esto que esta estación amortigua un poco la cantidad de materia
orgánica, este comportamiento no se da en el mes de agosto, donde alameda
presenta la mayor concentración y es el mes que no cumple con la normativa.
- Sólidos suspendidos totales
Los SST es la suma de todos los minerales, metales y sales disueltas en el agua,
las cuáles se dan por procesos antrópicos en donde se hagan intervenciones
directas en suelos [67]. No hay como tal un comportamiento fijo a través de los
meses para este parámetro en el río Torca, es decir que dependiendo de la época,
pueden variar las concentraciones de SST en cada punto medidos [61].

59
En general, las estaciones Calle 161 y Jardines de paz son las estaciones que
registran los valores más altos de sólidos suspendidos, esto teniendo en cuenta lo
mencionado anteriormente sobre la actividad de las canteras, y además de ello, que
en el tramo dos, se encuentra la entrada directa de otras quebradas y drenajes, que
traen consigo sólidos suspendidos, así como que en este tramo, se generen
vertimientos domésticos y/o industriales.
Para el parámetro de solidos suspendidos totales en el rio salitre, sin importar el
mes se puede decir que los mayores niveles de solidos se encuentran en las
estaciones Av 68, Alameda y Tv 91, en general se cumple la normatividad en este
parámetro, para las estaciones de Rio arzobispo y parque nacional los niveles son
bajos pues como en todos los parámetros a estar en la cuenca alta existen pocas
intervenciones antropogénicas, para este parámetro es fundamental que se trate de
que la cantidad de solidos suspendidos no se de en grandes cantidades para que
pueda llevarse a cabo el proceso de fotosíntesis.
- Grasas y aceites
Las grasas y aceites son compuestos de origen orgánico, ya que están constituidas
por sustancias vegetales y animales, así como también tiene hidrocarburos de
petróleo. Este parámetro puede producir acidificación en el agua, lo cual hace que
el nivel de pH del agua aumente, y así mismo impide que el CO2 se libere en la
atmósfera, disminuyendo los niveles de oxígeno disuelto en el cuerpo de agua en el
que esté presente [69].
Para el rio torca, en el parámetro grasas y aceites, en el mes de octubre, se ve que
hay un valor de 336, mientras que los demás datos oscilan entre 3,6 y 8. Se puede
concluir que ha sido un problema de digitación por parte del observador, ya que, en
esta zona (aguas arriba) no existen fuentes de contaminación conocidas, y menos
que se registre un valor tan grande en un solo día.
En general, las mayores se concentran entre la estación calle 161 y la estación
Jardines de paz, ya que el caudal del canal no es muy grande, el transporte de las
grasas y aceites toma su tiempo en llegar hasta el humedal, por lo que primero se
registran concentraciones altas en la estación cale 161 y cuando aquí bajan,
aumentan en jardines de paz, registrando la misma cantidad inicial, pero
adicionando la de los canales Serrezuela y El Redil.
Para el rio salitre, el parámetro grasas y aceites en la estación calle 53 se ve la más
alta concentración del parámetro, donde algunos de sus valores pasan el límite
permitido por la normativa, los valores se tienen un comportamiento similar en las
estaciones Rio arzobispo, Parque nacional, Av 68. En los años 2011 y 2013 los
valores son más altos que en los demás años,
- Sustancias activas al azul de metileno

60
El parámetro sustancias activas al azul de metileno está directamente relacionado
por las descargas de aguas domésticas e industriales al canal de los
establecimientos (colegios, universidades, empresas, restaurantes, entre otros) y
viviendas que se encuentran a lo largo de la cuenca del río Torca.
Así como en casos anteriores, este parámetro se encuentra en grandes cantidades
en el tramo dos, ya que es donde se realizan mayor cantidad de descargas
(teniendo en cuenta las puramente industriales), y así progresivamente las
concentraciones se estabilizan en un rango de 0,5 a 2,5 mg SAAM/L en el último
punto de registro, es decir, en el humedal, ya que al ser mayor el cuerpo de agua,
las cargas se disuelven, registrando menores cantidades.
Para el rio salitre las concentraciones se mantienen en los tramos uno y dos entre
(0,02 y 0,19 mg/L) pero en el tramo tres del rio se ve un aumento considerable (3
mg/L aproximadamente), en el año 2010 se ven las concentraciones más altas
respecto a los demás años.
- Fósforo total.
El fósforo total tiene dos tipos de fuente, la natural que se da por desprendimiento
de suelos y descomposición de rocas y la forma artificial, aportada por detergentes
y otras sustancias químicas usadas en la industrial. En general, para el rio torca,
ninguna de las estaciones cumple con los objetivos de calidad que se impone la
secretaría de ambiente, inclusive en el tramo 1, se registran concentraciones
mayores a los 0,2 mg/L que exige la norma, y a lo largo del tramo dos, las
concentraciones superan el miligramo por litro (1 mg/L) establecido. Esto, como
ocurre con las grasas y aceites y las sustancias activas al azul de metileno, se debe
a los vertimientos domésticos e industriales constantes que se realizan a lo largo
del segundo tramo del canal [61].
Para el rio salitre en las estaciones de la cuenca alta las concentraciones de fosforo
son bajas, en las estaciones Av 68 y calle 53 empiezan a aumentar, encontrando
concentraciones por encima de 2 mg/L, estas concentraciones se puede relacionar
a la descomposición natural del parámetro y a las descargas que se realizan en el
río a través de su recorrido. En estas últimas estaciones se puede decir que las
aguas se encuentran contaminadas.
- Nitrógeno total
El nitrógeno se encuentra en el agua gracias a dos fuentes, la antrópica que en esta
caso se da por vertimientos con excrementos y secreciones de orina (de animales
y humanos), así como en compuestos industriales como los fertilizantes (teniendo
en cuenta que al norte la ciudad hay muchos campos con especies vegetales que
solicitan un constante cuidado con este tipo de productos [68].
Para el río Salitre existe un comportamiento variable, ya que en las estaciones Rio
arzobispo y parque nacional tiene una concentración baja (promedio de 1 mg/L)

61
pero por la dinámica de este parámetro y sus proceso químicos relacionados, se ve
un aumento en la mayoría de los meses del parámetro en las estaciones Av 68,
Calle 53, Alameda, superando los 18 mg/L en esta parte del rio.
Para el rio torca, en general, las estaciones calle 161, jardines de paz y San Simón
registran valores que oscilan entre los 5 y 25 mg/L, ya que, gracias a los vertimientos
y los afluentes naturales al canal, llegan compuestos nitrogenados en todas sus
formas (mayormente en forma de nitritos y nitratos) que terminan en el humedal
concentrándose con nitrógeno que se encuentra depositados a lo largo del cuerpo
de agua por el ciclo natural del mismo.
El parámetro coliformes fecales está ligado con el nitrógeno total, teniendo en
cuenta que los desechos fecales son la principal fuente de la presencia de esto
organismos en el agua, además de que este grupo de organismos sobreviven fuera
del tracto gastrointestinal por las condiciones dadas en el ambiente en el que se
encuentran (humedad, pH, materia orgánica, entre otros) [69].
En general, se ve que en todas las estaciones del tramo dos se superan las
concentraciones permisibles establecidas en los objetivos de calidad de la
secretaría de ambiente (1,0E5), y como se explicó anteriormente, todo se debe a
los vertimientos de aguas domésticas e industriales. Para el rio torca a lo largo de
los meses de medición, se ve que las variaciones de coliformes fecales se
mantienen en el rango del número más probable de 1,0E5 a 1,0E7, exceptuando
valores atípicos registrados en los meses de febrero y agosto. Además, se ve como
las concentraciones disminuyen (aunque no en gran medida) en el humedal, debido
al área de cuerpo de agua, agregando también que ahí hay presencia de
organismos y seres vivos que igual aportan coliformes fecales al agua. En el rio
salitre, el parámetro no tiene una tendencia fija, tiene una gran variabilidad, en el
mes de octubre se ve la mayor concentración registrada por la red de calidad
hídrica; este parámetro al igual que en el rio torca no cumple con la normativa en la
mayoría de sus datos.
Hay un fenómeno en el río Salitre, pues las concentraciones más altas para muchos
de los parámetros se da entre calle 53 y AV68, pero cuando pasan por la estación
TV91 tienden a disminuir. Por ello, aunque las estaciones se parezcan entre sí, es
fundamental conservar estos puntos de monitoreo.
Los respectivos mapas utilizados para el análisis de esta sección se encuentran en
los anexos.
6.7 RED NEURONAL ARTIFICIAL

62
Por último, se implementó el algoritmo de una red neuronal artificial, con el
propósito de analizar la información y así, generar nuevas clasificaciones para las
variables estación, mes, año y observaciones
- Río Torca
Gráfica 20: Red neuronal artificial de los parámetros fisicoquímico y
biológicos versus la estación para el río Torca.

1 1. 1
61
pH 1. 7 16
0. 48 1 5
27

1.
0-01..4.18264136297 0-101..8606572 6 -101..09050
64

42
8 99 0. 99
01 7977 .27 8 5491

69
9 99
1.242
73
DO

-0-0..3386 85
1.0
1.1 BosqueP

.24 95 3
11

04
275

18 9
75

1
85
. 15
2 2 64

1 6 41
-1 .0
7

BOD 2.438 41
0.4 -0 .
79
87

85

0.87
4 72
67

5 428 -11.023
.27 4 157 -1 .0.5.019021 -2 .6.12 4

0.60

0. 9 .10 9
1.

9
96

COD

8
52
2

26
1
8

1. 12 99
57
9

5 44 9
79

.7
1 Calle161
25
.91 --11

-0

37 0.071 21
8 8 16

.
-0

2 115
23

TDS -0 .68 -0
.28
55 5

-0 .
0.5
08 529 .00 7 1326 .585 4678 -3 .461057069 .78804 5

69
9

0.293

28
3075 2
03
-0

40 14 0.866
91

2
21.

.
1 1 82

-0 2
2

47
13

F.G -3 .17 959 0.


82
0
17 1

1.
82

31 -0 .24 659
0.3

16 Jardines
16..1

2 4
-0
95

2 51
1.026 8

-9 .0
.2
71 503
17

MBAS
14 25

5.80
7

55
0-0.0.79
65

1 784 5
001-1..529.62397697 002-0..85.3052131 -081.45134

25
9

8
2.

09 28
91

-0 .
-0 .60 42

.3
26

-6
Phosphorus -0.29 696 0.5
00 1
00 8

1.5 6
2.062 49
1

23
3
4536
00...144386 72
91 3

30
5

. Ssimon
22

- 1
Faecal_coliform 2.776
51
24

11 -0 .55
971
0. .20 474
Nitrogen -2

Error: 32.634824 Steps: 2224


Fuente: autores.
Tabla 11: Resumen de los resultados arrojados por la red neuronal para la
reclasificación de datos en las estaciones del río Torca.

prediction BosqueP Calle161 Jardines Ssimon


BosqueP 12 1 0 0

63
calle161 0 2 0 0
Jardines 0 17 10 12
Ssimon 2 0 0 0

Fuente: autores.
Para la estación Torca, se realizaron 3 pruebas para las cuatro variables de estudio,
en donde se obtuvo que la mejor clasificación para la estación fue la obtenida en el
primer intento (gráfica 20), en donde se tenían en cuenta todas las estaciones; esta
clasificación arrojó que la mayoría de los datos (69% del total de la muestra del test
de la red) pertenecían a la estación Jardines de Paz (tabla 11). Para los otros
intentos, solo se tienen en cuenta las estaciones bosque de pinos y jardines de paz.
Jardines de paz es la estación que se encuentra en el punto de entrada de afluente
al humedal de Torca y Guaymaral.
En los métodos usados anteriormente, se estipuló que la estacón Jardines de Paz
era la estación que al presentar similitudes con calle 161 y san simón, era la que
podría no tenerse en cuenta para la optimización. Sin embargo, los resultados de la
red neuronal establecieron que a pesar de presentar similitudes, es una estación
que registra valores con mayor rango de variabilidad.
Para la variable año, en las repeticiones del algoritmo se determinó que la
información de la muestra del test de la red neuronal, pertenecía en su mayoría al
año 2011 (comportamiento que se evidenció en las tres reproducciones del código).
En definitiva, coincide con el registro de datos original de la red de calidad hídrica,
ya que el año en donde se realizaron mayores registros por parte de la red fue en
el año 2011.
Esto demuestra que la cantidad de datos puede hacer que la red neuronal arroje
resultados más precisos, puesto que no se realizarían sesgos tan pronunciados si
todos los años tuvieran la misma cantidad de registros.
Para la variable observaciones, se determinó que las mediciones por parte de la
RCHB se realizaron en dos condiciones climáticas (soleado y nublado), sin
embargo, es en la condición “nublado” en donde se clasifica la mayoría de los datos
de la muestra del test de la red neuronal en las tres réplicas del código. En los
métodos aplicados a lo largo de este estudio, se evidenció el mismo comportamiento
con respecto a esta variable, ya que predominaban en los registros de los
observadores que generaron la base de datos de la red de calidad hídrica. Se tiene
en cuenta que el campo “N/A” estaba sujeto a que el observador no registro la
condición del día, por ello, la semejanza de los datos registrados bajo esta condición
fácilmente son clasificados en las dos grandes categorías “soleado” y “nublado”.
La variable mes presentó problemas a la hora de correrse el código, ya que se
tuvieron que llevar a cabo seis intentos, de los cuales 3 arrojaron resultados,
mientras que los otros tres no concluían el proceso de intercepto entre capas. Sin

64
embargo, los resultados arrojaron que las mediciones de la red de calidad hídrica
se clasifican en los meses de agosto, septiembre y octubre. Esto da a entender que
esta época (meses más fríos) son los que dan la variabilidad de la información y en
los que es clave realizar mediciones y ahorrar costos a la hora de elegir la frecuencia
de medición, esto concuerda con la información aportada por la clasificación de la
variable observación, en donde la condición “nublado” es la de mayor relevancia,
por lo que es importante medir en aquellos meses en donde el clima de la ciudad
sea frío.
- Río Salitre
Gráfica 21: Red neuronal artificial de los parámetros fisicoquímico y
biológicos versus la estación para el río Salitre.

Fuente: autores.

65
Tabla 12: Resumen de los resultados arrojados por la red neuronal para la
reclasificación de datos en las estaciones del río Salitre.

Carrefour
Prediction
Alameda Calle 53 - AV68 ParqueN Rio Arz. TV91
Carrefour -
AV68 0 0 0 2 0 0
ParqueN 18 19 16 17 23 17
Rio Arz. 0 0 0 3 0 0

Fuente: autores.
En el caso del río Salitre, se realizaron 6 intentos de los cuales se presenta la misma
tendencia, dando por resultado que la información es clasificada en 3 de las
estaciones originales: Parque Nacional, Carrefour - AV68 y Rio Arzobispo, siendo
las estaciones donde se reclasifican el 70% de los datos originales, pudiendo ser
estos los valores ideales y la clasificación más eficiente que encontró el programa
(gráfica 20 y tabla 12), las otras tres estaciones que no entran en la nueva
clasificación Alameda, calle 53 y TV 91 pueden presentar valores similares, como
se ha visto en los métodos anteriores, lo que comprueba que las metodologías
implementadas anteriormente coinciden en los resultados arrojados para la variable
estación.
Con respecto a los años, solo se realizaron dos intentos pues arrojo el mismo
resultado, esta clasificación no cuenta con los años 2009 y 2013, pues son los años
que menor información presentan, se puede ver que el año 2009 clasifica su
información en 2010 y 2012, el 2010 en los años 2010 y 2013, esto sucede ya que
el programa ajusta las clasificaciones a la calidad de los datos organizándolos
donde mejor se agrupan. Esta variable no aporta gran significancia al estudio en el
rio salitre.
Para la variable observaciones, la metodología de la red neuronal nos afirma que
en su nueva clasificación, la información de la muestra del test se agrupan en
nublado y soleado, donde aporta en gran medida al estudio pues las otras
metodologías excluyen en sus resultados, lluvia o vacío (entendido como N/A en el
estudio). Se deduce entonces que si la muestra se toma un día lluvioso o nublado,
está en la mayoría de los casos la clasificará como Nublado, el día que se toma la
muestra siendo soleada se clasifica al 100% en la misma categoría, sin clasificarla
en otro grupo, la información vacía (N/A) o que no fue registrada se clasifica en
nublado.
Por ende, como se dedujo para el río Torca, los días nublados serán claves para
realizar las mediciones pues es esta condición climática la que da más variabilidad
a las concentraciones de los parámetros fisicoquímicos y biológicos.

66
Para la variable meses donde se realizaron tres intentos, se puede ver que la
información se clasifica en general en el último trimestre del año (octubre, noviembre
y diciembre), donde la mayoría de datos se organizan en el mes de noviembre, esto
se puede dar a que es el trimestre del año donde más se registra información, pues
el estudio para la RCHB no tomo la misma cantidad de muestras todos los meses,
lo que puede alterar el resultado. Estos resultados concuerdan en parte con los
resultados del río Torca, en donde se demostró que medir en el último cuatrimestre
del año se puede registrar mayor variabilidad de los parámetros que se están
midiendo, y así, ahorrar costos para no tener que medir todo el año.

67
7. PROPUESTA DE MEJORA

Para la optimización de una red de calidad hídrica deben tenerse en cuenta tres
puntos fundamentales:

 Puntos de muestreo
 Frecuencia de monitoreo
 Parámetros que se medirán.

Los parámetros en este estudio están establecidos por El Decreto 5731 de 2008,
por lo cual debe establecerse el mínimo de 10 parámetros, pero, para un estudio
más amplio se podrían tener en cuenta parámetros como temperatura, caudal u otro
de los 34 parámetros registrados en los monitoreos pasados para este estudio.

La frecuencia de monitoreo representa un costo elevado por los recursos que esta
requiere, donde la red de calidad hídrica debe enfocarse en la importancia de la
calidad y cantidad de datos, por ello, para determinar el día de medición, teniendo
en cuenta que según el método de Kruskal Wallis, se establecieron los días de
medición teniendo en cuenta el rango de variación de las concentraciones de los
parámetros (días en donde se registran valores que se alejan de la media de
concentración) y la cantidad de información que existe de cada día de medición, ya
que, esto determinará el comportamiento que tiende a tener el parámetro en los
puntos de monitoreo.

Días de medición
Río Río
Salitre Torca
Miércoles Lunes
Viernes Miércoles
Sábado Sábado

La variación que se da entre días no es muy marcada, sin embargo, en aquellas


pequeñas diferencias entre los rangos de cambio de los valores registrados, se
determinó que los días expuestos previamente, son los más óptimos, teniendo en
cuenta que el lunes y miércoles son días claves en las actividades industriales y
comerciales de la zona y así contrastar con días de baja actividad (viernes y sábado)

Para el mes, como se explicó en la sección de conclusiones, se debe tener en


cuenta el comportamiento bimodal del clima de la ciudad, teniendo en cuenta que
la precipitación es una de las variables que más influyen en los cambios de
concentración de los parámetros fisicoquímicos y biológicos. Se establecen
entonces meses en temporada seca (febrero, marzo y diciembre) y meses en
temporada fría (septiembre y octubre) para realizar las mediciones.

68
Meses de medición
Río Salitre Río Torca
Febrero Marzo
Octubre Septiembre
Noviembre Octubre
Diciembre Diciembre

Dos semanas de cada uno de los meses mencionados anteriormente, con dos
muestras diarias compuestas (duración de dos horas) para cada punto, de 6:00 a.m
a 8:00 a.m y de 4.00 p.m a 6:00 p.m, esto teniendo en cuenta las condiciones de
inseguridad que se dan al medir en horas de la madrugada (como se hacía
anteriormente) sin tener variaciones significativas en las concentraciones
registradas.

La mayor cantidad de datos anuales (192 datos para el río Torca y 240 para el río
salitre) permitirá tener mayores registros para alimentar la red neuronal artificial y
así codificar con instrucciones más rigurosas el algoritmo, obteniendo resultados
aún más puntuales.

Los puntos de monitoreo del estudio son 4 estaciones para el río Torca y 6
estaciones para el río salitre y después del desarrollo del estudio, se consideró que:

1. Para el río Torca se cambiaron los puntos originales de monitoreo (adición


de la estación calle 161 y la localización de los anteriores puntos). En general,
aunque la calle 161 y jardines de paz tengan tanta similitud, son clave ya que
la calle 161 está ubicado en un punto de alta influencia antrópica y jardines
de paz es la estación que se encuentra en la entrada del afluente al humedal
torca y sirve para comparar las concentraciones de los parámetros
registrados por la estación San Simón, en el punto de salida del humedal con
los datos de entrada.
2. Para el río Salitre, la similitud de registros se dan en las estaciones calle 53,
TV91 y Alameda (como se ha mencionado a lo largo del estudio). El análisis
de la red neuronal artificial ha arrojado que ninguna de las estaciones que se
acaban de mencionar son necesarias pues con las tres estaciones restantes
se obtendrían los mismos datos. Por ello, se establece que no se tomará en
cuenta la estación calle 53, teniendo en cuenta los resultados del análisis
geoestadístico, está ubicado en un punto en donde las concentraciones
tienden a mantenerse en el mismo rango en los que registra Carrefour –
AV68. Las estaciones Alameda y TV91 están antes del humedal juan amarillo
y después del mismo, por lo que pueden ser consideradas como estaciones
de control. De igual manera, es recomendable contar con la información
nuevamente la estación PTAR (descontinuada de la red en el 2010) para
poder determinar cuáles son las variaciones de las concentraciones después
del tratamiento.

69
Al verificarse las metodologías sobre la información obtenida de la RCHB, se puede
decir que se necesitan otros factores para mejorar el análisis de datos, como la
estimación de cargas de los vertimientos realizados a lo largo de los ríos Torca y
Salitre, ya que se necesitan conocer en algunos tramos las descargas permanentes
que se generan para un análisis más profundo, y con ello el estudio arrojaría
resultados que aporten a determinar mejor la calidad del agua si se hacen estudios
de estos vertimientos1.

Así mismo, teniendo en cuenta que la variable observaciones influye en la variación


de los datos, más específicamente la categoría “nublado”, se podría tener más
certeza de cómo influye la precipitación si se agrega esta información a la base de
datos para su posterior análisis, dejando solo dos variables tiempo seco y húmedo
para no generar confusiones en las bases de datos.

Al tener en cuenta que la información necesita ser confiable en un 100% para la


implementación de un sistema de tratamiento de datos (como la red neuronal) es
necesaria la constante capacitación del personal que realiza la recopilación de la
información generada por la red de calidad hídrica, para disminuir error de registro
y que la información describa la situación real de los cuerpos de agua en estudio.

1
el cual estudia la frecuencia acumulada de los datos históricos de flujo durante un periodo determinado.
Una curva de caudales relaciona los valores de caudal con el porcentaje de tiempo en que esos valores se
han alcanzado o excedido. [73]

70
8. RECOMENDACIONES

1. Se recomienda en primera instancia aplicar lo propuesto en la optimización


2. Se sugiere verificar que la red neuronal artificial es un método viable para los
otros dos cuerpos de agua del sistema hídrico de la ciudad (río Tunjuelo y río
Fucha).
3. A medida de que se recolecten mayor número de datos, se pueden mejorar
las instrucciones de la red neuronal artificial, aplicando el “backpropagation
algorithm” para obtener resultados más precisos.
4. El trabajo de ser aplicado puede reducir costos por la remoción de la estación
del río Salitre, lo cual reduciría gastos de medición en campo y al aumentar
el número de mediciones, se obtendría una idea más real de la calidad de
agua de ambos ríos.

71
9. CONCLUSIONES

A lo largo del desarrollo del proyecto, se concluyó que la variable mes no aporta
significativamente a la variabilidad de los datos registrados. Sin embargo, teniendo
en cuenta el carácter bimodal del clima en la ciudad de Bogotá, es importante tener
en cuenta meses representativos de cada época (temporada seca (febrero, marzo
y diciembre) y meses en temporada fría (septiembre y octubre).) a la hora de
plantear la continua mejora de la red de calidad hídrica. La variable día así mismo,
para ambos ríos, no influye directamente en el cambio de concentraciones de los
parámetros fisicoquímicos y biológicos, pero para establecer la frecuencia, por
medio de los boxplot se pudo determinar qué día podría ser clave la medición.

En el caso específico de la variable observaciones, la cual se clasifica en lluvia, N/A,


soleado y nublado se concluyen de las metodologías descartan la opción de N/A en
primera instancia ya que no hay gran cantidad de datos clasificados en esta
categoría. Para la categoría “lluvia”, los datos registrados con esta característica se
clasifican entre las dos categorías dominantes (soleado y nublado), excluyéndola
por su baja influencia en la información registrada. Siempre existirá un umbral de
error por parte del observador ya que por razones de olvido o distracción, no se
registra la información correctamente, así mismo, pasa con algunos valores de los
parámetros fisicoquímicos y biológicos en la base de datos

El método de Kruskal Wallis determinó que la variable más significativa es la


estación, ya que es una variable que nos ayuda a determinar el comportamiento de
los cuerpos de agua en cuestión en zonas de alto impacto por actividades
antrópicas, como es en el caso del rio salitre que se tienen estaciones aguas arriba
del rio y estaciones antes de ser tratadas en la PTAR, mostrando todo el
comportamiento del rio a lo largo de la ciudad, ya que allí fueron ubicadas por
problemáticas ambientales puntuales.

El río Salitre con la ayuda de las metodologías planteadas para ahorrar costos, y
tiempo; podría sólo tener en cuenta cinco de las seis estaciones establecidas,
dejando como referencia las estaciones Río arzobispo (estación fija),
Parque Nacional, Carrefour AV 68, Alameda (estación fija) y tomar una de las dos
que tienen similitud de datos, Calle 53 o TV91, pues estas estaciones son ubicadas
en zonas residenciales por ende aportan una información parecida.

Para el río Torca se dedujo que de las cuatro estaciones con las que cuenta, la
información de la estación Jardines de paz es muy similar a la registrada por la
estación Calle 161 y San Simón, por temas de cercanía entre puntos de muestreo.
Sin embargo, no se puede considerar la eliminación de esta estación ya que es un
punto clave del trayecto del río, puesto que allí es donde el río torca y el humedal

72
de Torca y Guaymaral convergen; además, el río Torca en el año 2009 contaba con
solo 3 estaciones, las cuales no lograban registrar de la manera más óptima, por
ello, se consideró la implementación de otra estación.

El análisis jerárquico es un método que evalúo la relación entre parámetros


fisicoquímicos, posterior a ello, al generarse los dendogramas el criterio del
evaluador genera las clasificaciones de los grupos de parámetros. El análisis
jerárquico no establece relaciones entre parámetros de acuerdo a sus
características fisicoquímicas sino a los valores registrados; por lo que no debe
establecerse como un único criterio de decisión y debe ser complementado con
otros métodos para el análisis final del comportamiento de la información. El método
ayudo a determinar que en el parámetro coliformes es independiente a los demás
parámetros.

El análisis geoestadístico permitió ver el comportamiento espacial de los


parámetros fisicoquímicos y biológicos por una característica de temporalidad
(mensual multianual), con el fin de ver la distribución de la información registrada a
nivel promedio. Este análisis fue de gran ayuda para ver cómo era el fenómeno de
dispersión de las concentraciones de los parámetros a lo largo de los dos ríos,
donde se puede observar y corroborar los demás métodos, ayudando así a
complementar el análisis general del estudio.

Para el río Torca, al momento de realizar las interpolaciones, se usó el método IDW
ya que con el método Kriging las interpolaciones no tenían en cuenta los rangos
establecidos y salía una imagen unicolor; esto podría ser porque no se tiene gran
cantidad de puntos de muestreo, así como el distanciamiento entre puntos que no
es muy grande. En el caso del rio salitre al contar con mayores puntos de muestreos
fue posible usar el método Kriging y IDW, los cuales mostraron similitud.

Al realizar el análisis de discriminantes de forma individual, se evidenció que la


clasificación variaba para las variables estación y observaciones, concluyendo que
para el río Torca se necesitan sólo 3 estaciones y para el río salitre 5 estaciones,
para medir lo que se hace actualmente. En definitiva, En este método se determinan
los pesos de cada parámetro y esto permitió determinar la importancia de cada una
de las variables, ya que gracias a la reclasificación/readecuación de la información,
las variables se evaluaron inter-grupalmente, permitiendo así determinar el
comportamiento de los datos registrados y así, generar las conclusiones del
presente estudio.

La red neuronal artificial es el modelo de clasificación considerado el valor agregado


de este estudio. Cuando se llevó a cabo este método, se expuso a la variación de
la información, ya que el algoritmo debe correrse más de una vez para cada una de
las variables, y esto incurrió en que de todas las veces que se corrió el código,
permitiera escoger la clasificación que mejor se adaptara a los resultados arrojados
por otros métodos. Este método tiene muchas ventajas como la auto organización

73
de la información de entrada que el programador aporta así como la flexibilidad a
la hora de entrenar el algoritmo. En conclusión, la red neuronal artificial arrojó una
buena clasificación, que para cuando se tenga más información de las mediciones
de la red de calidad hídrica, el programa pueda tener instrucciones más complejas
de clasificación y así obtener clasificaciones aún más acertadas. Para este estudio
función la red neuronal artificial con los comandos más básicos, arrojando
resultados que se asemejan al análisis lineal de discriminantes, con menos sesgos
entre interacciones.

La metodología de las redes neuronales al simular las conexiones del cerebro


humano, puede manipular su información para una toma de decisiones y poder
resolver problemas, por ello este método es muy útil al tener el control la persona
que codifique el algoritmo, y con ello, se pueden obtener los resultados más exactos
al ser el controlador quién da las ordenes de función. Uno de los casos más
particulares en este estudio fue el comportamiento aislado de coliformes fecales, lo
que complicaba el análisis de resultados al ser comparado con los demás
parámetros; lo que se puede concluir es que el método de RNA para coliformes
fecales realizó un ajuste para que se pudiera hacer en análisis, determinando que
la muestra microbiológica era tan alta que no tenía relación con los otros
parámetros, y que actuaba diferente de acuerdo a su origen (actividades
antrópicas).

El método estadístico que arrojó la mejor re clasificación de la información tratada


fue la red neuronal artificial, ya que tuvo un error menor a la hora de generar los
resultados finales, así como estos eran mucho más fáciles de interpretar.

Así mismo, se comprobó que las metodologías empleadas en el estudio de los ríos
Fucha y Tunjuelito para la optimización de la red de calidad hídrica de Bogotá
(análisis clúster, análisis lineal de discriminantes, análisis geoestadístico)
funcionaron adecuadamente con los datos del presente estudio, interpretando que
son eficientes para la optimización de la red hídrica del río.

74
BIBLIOGRAFÍA
[1 Universidad Fransisco jose de Caldas. (2015) Universidad Fransisco jose de
] Caldas. [Online].
https://www.udistrital.edu.co/universidad/colombia/bogota/caracteristicas/

[2 Secretaria Distrital de Ambiente. (2015, septiembre) Informe Tecnico No.


] 01575. [Online].
http://www.ambientebogota.gov.co/c/document_library/get_file?uuid=698885eb
-239e-4c23-89ca-99d18bef5865&groupId=586236

[3 Corporación Autónoma Regional, "Adecuación hidráulica y recuperación


] ambiental río Bogotá," Bogotá D.C,.

[4 Ericka Johanna Díaz Mendivelso, Mauricio Ruíz Flores, and Jennifer Alejandra
] Suárez Silva, "Aguas residuales del río Salitre, como una cuestión
sociocientífica para el fortalecimiento del pensamiento crítico en docentes en
formación inicial," Bogotá D.C, 2014.

[5 Secretaría Distrital de Ambiente. (2008, Agosto) Red de calidad hídrica.


] [Online]. http://ambientebogota.gov.co/red-de-calidad-hidrica

[6 Universidad Pontificia Bolivariana, "Red de Monitoreo Ambiental en la Cuenca


] Hidrográfica del Río Aburrá - Medellín en Jurisdicción del área Metropolitana -
Fase III," Medellín, 2011.

[7 World Health Organization, Water Quality Monitoring - A practical guide to the


] design and implementation of freshwater quality studies and monitoring
programmes. Ginebra, 1996.

[8 Water Quality Monitoring Program Design. Perth Western, 2009.


]

[9 Raziyeh Farmani, Godfrey Walters, and Dragan Savic, "Evolutionary multi-


] objective iptimization for the design and operation of water distribution network:
total cost vs reliability vs water quaility," Exeter, 2006.

[1 N B Harmancioglu, Y Icaga, and A Gul, "The use of and Optimization Method In


0] Assessment of Water Quality Sampling Sites," Izmir, 2004.

75
[1 Kijin Nam, "Optimization of Paths and Locations of Water Quality Monitoring
1] Systems in Surface Water Enviroments," Georgia, 2008.

[1 Agustín Alejandro Moreno Tovar, Mauricio Toro Botero, and Luis Fernando
2] Carvajal, "Revisión de criterios y metodologías de diseños de redes para el
monitoreo de la calidad del agua en ríos.," Medellín, 2008.

[1 Universidad del Valle, "Conceptos básicos de la contaminación del agua y


3] parámetros de medición," Cali, 2002.

[1 Universidad de Catambria, "La contaminación del agua," Catambria,.


4]

[1 Luis Echarri, "Contaminación del agua," Pamplona, 2007.


5]

[1 National Intitute of Open Schooling, "Water pollution," New Delhi,.


6]

[1 Secretaria Distrital de Ambiente.. (2008) calidad del recurso Hidrico. [Online].


7] http://ambientebogota.gov.co/documents/10157/220042/calidad_del_recurso_h
idrico2008.pdf

[1 Julian Pérez Porto and Ana Gardey. (2009) deficiones. [Online].


8] (http://definicion.de/optimizacion/)

[1 Universidad Nacional Abierta y a Distancia. (2014) Fundamentos de


9] Optimización.. [Online]. http://nuyoo.utm.mx/~jjf/rna/guia_foe.pdf

[2 Internation Institute For Sustainable Development, "Water Quality Monitoring


0] System Design," Winnipeg, 2015.

[2 World Metereological Organization, "Planning of Water Quality Monitoring


1] Systems," Geneva, 2013.

[2 World Meteoreological Organization, "Planning of Water Quality Monitoring


2] Systems," Geneva, 2012.

[2 G. Asadollahfardi, "Water Quality Management," 2015.


3]

76
[2 Autoridad Nacional del Agua - DGCRH, "Protocolo de Monitoreo de la Calidad
4] de los Recursos Hídricos ," Lima,.

[2 Javier Andrés Escobar Pintor and Nataly Moreno Dueñas, "Determinación de


5] los coeficientes de oxigenación y desoxigenación para la curva de
comportamiento de oxígeno disuelto del río Fucha," Bogotá, 2016.

[2 Ministerio de Desarrollo Social y Medio Ambiente. (2014) Diseño de redes de


6] monitoreo,estadísticas, precisión de las determinaciones analíticas, control de
calidad. [Online]. http://www.ingenieroambiental.com/7/manual05.pdf

[2 Jardín Botánico José Celestino Mutis, "Proyecto No. 410 PEL: COMUNIDAD
7] REALIZACIÓN DE ACCIONES DE SENSIBILIZACIÓN A LA ENTORNO AL
CUIDADO DE LA CUENCA DEL RÍO SALITRE," Bogotá D.C,.

[2 CORPORACION AUTONOMA DE CUNDINAMARCA. (2005) Plan de


8] Ordenación y Manejo Ambiental de la cuenca de río Bogotá. [Online].
https://www.car.gov.co/index.php?idcategoria=11553&download=

[2 SDA (Secretaria Distrital de Ambiente), "Recorrido por el río Salitre hizo la


9] secretaría Distrital de Ambiente para verificar su estado," EL TIEMPO, julio
2008.

[3 Secretaría Distrital de Ambiente. Ríos, Quebradas y Canalas - Alinderamiento


0] de Quebradas. [Online]. http://ambientebogota.gov.co/rios-quebradas-y-
canales

[3 Ellie Marie López Barrera, Ángela María Plata Rangel, and Milena M Fuentes
1] Cotes, Humedal Torca-Guaymaral: Iniciativas para su conervación. Bogotá
D.C: Fondo de Publaciones Universidad Sergio Arboleda, 2015.

[3 Kun Mei et al., "Optimization Water Quality Monitoring Networks Using


2] Continuos Longitudinal Monitoring Data: A Case os Study of Wen-Rui Tang
River, Wenshou, China," Wenshou, 2011.

[3 Toskano Hurtado and Bruno Gérard. (2014) El proceso de analisis jerárquico


3] (AHP) como herramienta para la toma de decisiones en la selección de
proveedores. [Online].
http://sisbib.unmsm.edu.pe/bibvirtualdata/tesis/basic/toskano_hg/cap3.pdf

77
[3 Universidad de Granada, "Ejemplos de Análisis Clúster ," Granada,.
4]

[3 Escuela Superior Politécnica del Litoral, "Marco teórico Conceptual de la


5] Geoestadística," Quito,.

[3 Ramon Giraldo Henao. (2013) Introducción a la geoestadistica.. [Online].


6] http://www.docentes.unal.edu.co/rgiraldoh/docs/LIBRO%20DE%20GEOESTA
DISTICA.pdf

[3 Geoff Bohling, Kriging. Lawrence, 2005.


7]

[3 Jorge Zavaleta Sánchez, "Kriging: Un método de interpolación sobre datos


8] dispersos," México D.F, 2010.

[3 Department of Cartography and Geoinformatics, Kriging Interpolation.


9] Nagyszombat, 2008.

[4 Escuela de Ingeniería de Minas. (2014, agosto) Conceptos construccion del


0] MDE. [Online]. http://www6.uniovi.es/

[4 Santiago de la Fuente Fernandez. (2011, agosto ) Universidad Autonoma de


1] Madrid. [Online].
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACION
/DISCRIMINANTE/analisis-discriminante.pdf

[4 Antonio Vaamonde Lise, Aldo Barreiro Felpeto Castor Guisande González,


2] Tratamamiento de datos con R, STATISTICA y SPSS.: Diaz de Santos, 2011.

[4 Cástor Guisande Gonzáles, Antonio Vaamonde Liste, and Aldo Barreiro


3] Felpeto, Tratamiento de datos con R, Statistica y SPSS.: Díaz de Santos,
2011.

[4 UNIVERSIDAD COMPLUTENSE DE MADRID. Analisis Discriminante :El


4] procedimiento discriminante. [Online].
http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/ma
teriales/analisis_datosyMultivariable/23discr_SPSS.pdf

78
[4 Pol A. Palmer and J. Montaño Moreno, "¿Qué son las redes neuronales
5] artificiales? Aplicaciones realizadas en el ámbito de las adicciones,"
ADICCIONES, vol. 11, no. 3, p. 14, 1999.

[4 Damián Jorge Matich, "Redes Neuronales: conceptos básicos y aplicaciones.,"


6] Rosario, 2001.

[4 Jure Zupan, "Introduction to Artificial Neuronal Network (ANN) Methods: What


7] They Are and How to Use Them," Tarragona, 1994.

[4 Sorin Vlad, "On the prediction Methods Using Neural Networks," Suceava,
8] 2005.

[4 Archana Sarkar and Prashant Pandey, "River Water Quality Modelling using
9] Artificial Neural Network Technique," Uttarakhand, 2015.

[5 S. S. Panda, V. Garg, and I. Chaubey, "Artificial Neural Networks Application in


0] Lake Water Quality Estimation Using Satellite Imagery," Arkansas, 2004.

[5 I. Zaheer and C. G. Bar, "Application of Artificial Neural Network for Water


1] Quality Management," Lowland Technology International , vol. V, no. 2, p. 6,
2003.

[5 Wen Ching-Chung and Lee Chih-Sheng, "A neural network approach to


2] multiobjective optimización for water quality management in a river basin.,"
Water Resources Research, vol. 34, no. 3, p. 9, March 1998.

[5 John Quick. (2011, Enero) R-Bloggers. [Online]. https://www.r-bloggers.com/r-


3] tutorial-series-one-way-anova-with-pairwise-comparisons/

[5 John H. McDonald, "Handbook of Biological Statistics," Baltimore, 2008.


4]

[5 The Pennsilvania State University. Cluster Analysis. [Online].


5] http://sites.stat.psu.edu/~ajw13/stat505/fa06/19_cluster/09_cluster_wards.html

[5 Tal Galili. (2013, Enero) R-bloggers. [Online]. https://www.r-


6] bloggers.com/scatterplot-matrices/

79
[5 Antony Unwin, Graphical Data Analysis with R.: CRC Press, 2015.
7]

[5 Andrea del Pilar Gónzales Torres , "Evaluación de la caga de fósforo al río


8] Bogotá relacionado con el uso de detergentes en la capital," Universidad de los
Andes, Bogotá D.C, Tesis de pregrado 2005.

[5 Francisco Fuentes and Arturo Massol-Deyá, "Manual de laboratorios: ecología


9] de microorganismos," Mayagüez, 2002.

[6 Juan María Fornés Azcoiti, "La Geologia e Hidrogeologia en la Investigacion de


0] Humedales," Madrid, 2009.

[6 G Ramón and G Moya, "Evolución del contenido de oxígeno disuelto en las


1] aguas de los embalses de la serra de Tramuntana (Mallorca) estudio
comparado," Mallorca, 1984.

[6 María Dolores Curt Fernández de la Mora, "Fitodepuración en humedales:


2] conceptos generales.," Pontevedra,.

[6 Ninoschtka Freire Morán, "Demanda biológica de oxígeno: calidad de agua,"


3] Guayaquil,.

[6 Viglemira Poloche Rojas, "Revisión de la documentación existente sobre las


4] áreas de protección de la zona de influencia del río frío en Chía y el río torca
en el norte de Bogotá," Bogotá D.C, 2015.

[6 Luz Edith Barba, "Conceptos básicos de la contaminación del agua y


5] parámetros de medición," Santiago de Cali, 2002.

[6 Adam Sigler and Jim Bauder, "Well educated: educación en el agua de pozo,"
6] Universidad Estatal de Montana, Bozeman, Documento informativo.

[6 María Isabel Toapanta Vera. Repositorio de ESPOL. [Online].


7] https://www.dspace.espol.edu.ec/bitstream/123456789/6161/8/GRASASYACEI
TES.pdf

[6 Gloria Lucía Cárdenas Calvachi and Iván Andrés Sánchez Ortiz , "Nitrógeno en
8] aguas residuales: orígenes, efectos y mecanismos de remoción para preservar
el ambiente y la salud pública," Universidad y Salud, vol. XV, no. 1, 2013.

80
[6 Ciencia y Tecnología para el Desarrollo, "Indicadores de contaminación fecal
9] en aguas," Texmelucan, 1996.

[7 Gudberto J. León , "Apuntes de métodos estadísticos I," Mérida,.


0]

[7 Antonia Guillén Serra, Ágata Carreño Serra, and Neus Canal Díaz, "Fases del
1] análisis estadístico de los datos de un estudio," Bogotá,.

[7 Carolina Peña Guzmán, "Procesos de monitoreo a la calidad hídrica del río


2] Bogotá realizados por la Corporación Autónoma Regional de Cundinamacar -
CAR -," Bogotá D.C, 2010.

[7 Canadian Water Quality Guidelines for the Protection of Aquatic Life, "CCME
3] WATER QUALITY INDEX 1.0 User’s Manual," Alberta, 2001.

[7 Agung Setianto and Tamia Triandini, "COMPARISON OF KRIGING AND


4] INVERSE DISTANCE WEIGHTED (IDW) INTERPOLATION METHODS IN
LINEAMENT EXTRACTION AND ANALYSIS," Gadjah Mada University, 2013.

[7 Superintendencia de Sociedades, "Desempeño del sector de minería 2012-


5] 2014 informe," Bogotá D.C, 2015.

[7 IDEAM. (2007) protocolo para el monitoreo y segumiento del agua. [Online].


6] http://documentacion.ideam.gov.co/openbiblio/bvirtual/021172/Protocoloparael
monitoreoyseguimientodelagua.pdf

[7 Takur Dahiro, "P – VALUE, A TRUE TEST OF STATISTICAL SIGNIFICANCE?


7] A CAUTIONARY NOTE," Zaria, 2008.

[7 Environmental Systems Research Institute. Comparar métodos de


8] interpolación. [Online]. http://desktop.arcgis.com/es/arcmap/10.3/tools/3d-
analyst-toolbox/comparing-interpolation-methods.htm

81

También podría gustarte