Está en la página 1de 16

Mapeo del potencial de manantiales de agua subterránea en

La zona centro de Boyacá utilizando peso de evidencia,


Regresión logística convencional y Lasso.
(Mapping the potential of groundwater springs in the central area of Boyacá
using weight of evidence,
Conventional logistic regression and Lasso.)

María Fernanda Muños Nope 1,2, Neyla Esperanza Daza Cárdenas2


1
Escuela de Ingeniería Geológica , Uptc.
2
Departamento de Ingeniería Eléctrica y Electrónica, Grupo Inv UDEA, aracris@yahoo.es
Universidad Pedagógica y Tecnológica de Colombia.

(Recibido abril 23 de 2021y aceptado julio 01 de 2021)

Resumen
La escasez de agua se ha convertido en un problema critico que lleva al ser humano a buscar activamente
nuevas fuentes de agua optando principalmente por las aguas subterráneas para resolver sus problemas de
abastecimiento, un reflejo directo de las aguas subterráneas son los manantiales. Para este trabajo se calculó el
potencial de manantiales de la zona centro de Boyacá utilizando métodos estadísticos de regresión logística
(convencional y Lasso) y pesos de evidencia incluyendo 489 manantiales y 17 factores de acondicionamiento y/o
variables.
Palabras clave:
Agua subterránea, Boyacá, Peso de Evidencia, Potencial de Manantiales, SIG, Regresión Logística, Regresión
Logística Lasso.
Abstract
The scarcity of water has become a critical problem that leads the human being to actively seek new sources of
water, opting mainly for groundwater to solve its supply problems, a direct reflection of the groundwater is the
springs. For this work, the potential of springs in the central zone of Boyacá was calculated using statistical
methods of logistic regression (conventional and Lasso) and weights of evidence including 489 springs and 17
conditioning factors and / or variables.
Key words: Groundwater, Boyacá, Weight of Evidence, Spring Potential, GIS, Logistic Regression, Lasso Logistic
Regression.

1. INTRODUCCIÓN superficiales. Un reflejo directo de las aguas


El agua dulce es uno de los recursos más subterráneas son los manantiales, siendo estos la
significativos e influyentes en todo el planeta tierra fuente principal para las comunidades ya sea para
(AQUAE , (s.f)) que está escaseando debido al consumo humano o actividades agrícolas; por esta
aumento de las bajas precipitaciones y las altas razón es importante para las autoridades
temperaturas; por esta razón, el ser humano está ambientales identificar los factores influyentes en
en la búsqueda activa de nuevas fuentes de agua la formación de los manantiales para garantizar la
optando principalmente por las aguas subterráneas delimitación, conservación, disponibilidad del agua
siendo la opción más viable para resolver sus en cantidad y calidad, y la protección de las cuencas
problemas de abastecimiento (Peréz , 2018). hidrográficas y de sus recursos naturales (Agencia
En Colombia, las aguas subterráneas son PCJ, (s.f)).
reconocidas por ser fuentes principales, La zona centro de Boyacá no tiene aún la
complementarias o alternas de aprovechamiento información sobre los factores que contribuyen a la
en cuencas con acceso limitado de aguas ocurrencia de manantiales lo cual dificulta obtener
Revista Ingeniería, Investigación y Desarrollo

información útil para una mejor planificación y Figura 1. Localización área de estudio.
gestión de los recursos hídricos del departamento.
Por esta razón, en este trabajo se hará una
identificación de los mismos y se generará el mapa
de potencial de ocurrencia de manantiales
empleando tres modelos estadísticos diferentes
(Regresión Logística, Regresión Logística Lasso y
Peso de Evidencia) para facilitar la identificación de
Las zonas de alta y baja probabilidad de ocurrencia
de estos cuerpos de agua.

Localización del área de estudio


El área de estudio comprende una superficie de
aproximadamente 859 Km2 del departamento el
cual está ubicado en el centro-oriente del país
abarcando parcialmente los municipios de Combita,
Duitama, Firavitoba, Nobsa, Paipa, Santa Rosa de
Viterbo, Sogamoso, Sotaquirá, Tibasosa y Tuta
(SGC, 2016). Ver figura 1.

METODOLOGÍA
La metodología de trabajo se ejecutó en cuatro
Figura 2. Metodología del Proyecto fases las cuales se resumirán en la Figura 2 con su
respectiva descripción:

Dentro de estas variables se incluyeron la litología. Posteriormente con ayuda del software
pendiente, elevación, orientación de la pendiente, ArcGIS 10.5 se generaron los mapas temáticos de
curvatura (plana y de perfil), los índices cada una de las variables categóricas y continúas
geomorfológicos TWI, STI, TSP, distancia a la red seleccionadas anteriormente (ver figura 3).
fluvial, distancia a la red vial, cobertura vegetal, uso Cada mapa temático se superpuso con el mapa del
del suelo, tipo de suelo, NDVI, precipitación y inventario de puntos de agua del Servicio Geológico
Colombiano (SGC), obteniendo una base de datos
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

entre la intersección de cada uno de estos para los análisis de ocurrencia de manantiales utilizando un
puntos que corresponden a manantiales y a no grupo de métodos estadísticos a partir del conjunto
manantiales. de datos obtenido en la fase 2.
La tercera y cuarta fase se desarrolló realizando el En estas fases se generaron los mapas de
análisis de ocurrencia de manantiales utilizando un probabilidad de ocurrencia de manantiales
grupo de métodos estadísticos a partir del conjunto mediante Regresión Logística (convencional y
de datos obtenido en la fase 2. Lasso); (Fernández, 2011) y Peso de Evidencia (Fan,
La tercera y cuarta fase se desarrolló realizando el et al., 2011) finalmente se compraron y validaron
los diferentes métodos mediante las curvas ROC.
Suelos Indice transporte de sedimentos NDVI

Uso de suelos Precipitación Distancia a los ríos

Cobertura de suelos Distancia a las vías Litología

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

MÉTODOS ESTADÍSTICOS

3.3.1 Regresión logística


En la Regresión Logística se estima la probabilidad
de que un evento ocurra; es decir el valor esperado A mayor λ, mayor es la penalización en los
de Y dado las variables predictoras debe tomar coeficientes de regresión. Es por esto que la
valores entre 0 y 1. Debido a que el modelo de cantidad de variables seleccionadas depende
Regresión Logística no es lineal, se requiere de un netamente del valor que se le asigna a este
algoritmo iterativo para estimar los parámetros parámetro de penalización. En caso de reducir λ,
(Mercedes & Poma, (s.f)). La función más utilizada automáticamente se reduce la penalización por lo
que cumple con esta descripción es la función que una cantidad de variables pueden ingresar al
logística (función sigmoide) (Rodrigo, 2016). modelo (Wu & Lange, 2008).
Esta relación, indica cuanto más probable es el
éxito que el fracaso, pudiendo tomar cualquier 3.3.3 Peso de evidencia
valor entre 0 (muy baja probabilidad de éxito) y ∞ El modelo Peso de la Evidencia utiliza
(muy alta probabilidad de éxito). probabilidades condicionales y no condicionales,
Al aplicar logaritmo a la ecuación, obtenemos una está basado en calcular fundamentalmente los
función lineal: pesos de las clases que conforman las variables
condicionantes (Oh & Lee, 2010). Los pesos
positivos (W+) indican la presencia de la clase como
parámetro que favorece la presencia del evento y
su magnitud indica su correlación. El peso negativo
(W-) indica la ausencia de la clase. En caso de ser
cero, indica que la clase analizada no es de interés
Donde  corresponde a los odds para el evento o que no brinda información del
evento de interés. Para cada factor hay cuatro
(posibilidades), combinaciones posibles (Van Westen, Rengers , &
Soeters, 2003).
El   indica el cambio en el logaritmo
de Odds debido al incremento de una unidad de x,
o lo que es lo mismo, multiplica los Odds por 
Donde A1 es el número de pixeles con presencia
3.3.2 Regresión logística Lasso del evento en la clase; A2 número de pixeles donde
Tibshirani (1996) introdujo el método Lasso con el está el evento, pero no están presentes en la
objetivo de encontrar una técnica de regresión que misma clase; A3 número de pixeles en la clase
lograra estabilizar las estimaciones y predicciones y donde no se presenta el evento; y A4 es el número
a su vez realizara una selección de variables ya que de pixeles en la clase donde no se presenta el
sólo los parámetros con mayor influencia en la evento y que no está presente en la misma clase
regresión tendrán coeficientes distintos de cero. (SGC, 2017). Para cada variable, entonces, se
(Carrasco , 2016). estima el Peso de Contraste (C) de la siguiente
La regularización Lasso penaliza la suma del valor forma:
absolutos de los coeficientes de regresión
||β||1=∑pj=1|βj|. A esta penalización se le conoce El contraste da una medida de correlación entre el
como L1 y tiene el efecto de forzar a que los factor condicionante y el evento. El contraste será
coeficientes de los predictores tiendan a cero. A cero cuando la distribución espacial del evento de
medida que λ aumenta, mayor es la penalización y interés es independiente del factor considerado; es
más predictores quedan excluidos. (Amat , 2016). positivo cuando existe una asociación positiva y
Función de penalización de Lasso: negativo cuando existe una asociación negativa
(SGC, 2017).
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

4. RESULTADOS observa entre las categorías del suelo y litología


(ver tabla 2).
4.1 Regresión logística modelo 1

En este estudio inicialmente se realiza la Regresión


Logística a través del software de análisis
estadístico R utilizando todas las variables En este estudio se usa la inflación de varianza (FIV)
predictivas categóricas y continuas. para detectar la multicolinealidad; cuando los
En el método de Regresión Logística se aplican dos valores de inflación de varianza (FIV) son
procedimientos (entrenamiento y validación). En el superiores a 10 y los índices de tolerancia son
procedimiento de entrenamiento se estiman los inferiores a 0,1 se indica una correlación entre
coeficientes del modelo de regresión usando el 70% variables. Para este estudio se muestra una clara
de los datos los cuales son seleccionados correlación entre las variables de curvatura
aleatoriamente mientras que el procedimiento de estándar, curvatura de perfil, curvatura del plano,
validación se realiza con el 30% de datos restantes. cobertura del suelo 8, cobertura del suelo 10, y uso
Este procedimiento de validación se realiza con el del suelo y litología (en todos los casos). Debido a la
fin de comprobar la efectividad del modelo. presencia de multicolinealidad en estas variables, la
Se realiza un análisis de multicolinealidad de estimación de los coeficientes tiene problemas de
variables para el modelo inicial que considera todas estabilidad numérica y por lo tanto pueden tener
las variables de entrada (ver Tabla 1). un alto grado de error.

Tabla 1. Prueba de multicolinealidad para la Regresión Logística


definida usando todos los factores.
Variable Tolerancia FIV Variable Tolerancia FIV Variable Tolerancia FIV
precipitation 0,6799911 1,470608 soil.cover3 0,5734189 1,743926 soil.cover16 0,8603338 1,16234
curvature 0,00499 200,4022 soil.cover5 0,8754986 1,142206 soil.cover17 0,4938095 2,025072
dist.roads 0,772077 1,295208 soil.cover6 0,9465236 1,056498 soil.cover18 0,2733407 3,658438
twi 0,3333426 2,999917 soil.cover7 0,5899183 1,69515 soil.cover19 0,2350364 4,25466
sti 0,1323533 7,555535 soil.cover8 0,0750416 13,32595 soil.cover20 0,6566631 1,522851
spi 0,1924302 5,19669 soil.cover9 0,4055461 2,465811 soil.cover21 0,8556209 1,168742
ndvi 0,6382232 1,56685 soil.cover10 0,0528381 18,92574 soil.use1-10 0 Inf
dem 0,277106 3,608728 soil.cover11 0,1898919 5,266153 soil1-24 0 Inf
plan.curv 0,0155266 64,40553 soil.cover12 0,1110351 9,006165 lithology1-12 0 Inf
dist.riv 0,7955606 1,256975 soil.cover13 0,2535403 3,944147 slope 0,3070482 3,256818
prof.curv 0,0138531 72,18617 soil.cover14 0,8077899 1,237946 aspect 0,9004167 1,110597
soil.cover2 0,4585969 2,180564 soil.cover15 0,8628929 1,158892

Los coeficientes positivos significativos aumentan la Tabla 2 Coeficientes Regresión Logística


contribución al cálculo de la probabilidad de
Variable Coeficiente
ocurrencia de manantiales como lo son las variables
Precipitación 0,00E+00
NDVI, Cobertura de suelo 18 (Herbazal), Cobertura NDVI 5,58E+00
del suelo 19 (Arbustal), Cobertura del suelo 10 Cobertura suelo 10 2,40E+00
(Mosaico de pastos y cultivos), y Pendiente. Los Cobertura suelo 18 3,65E+00
coeficientes negativos disminuyen la contribución Cobertura suelo 19 2,95E+00
al cálculo de probabilidad de ocurrencia de Uso del suelo 6 -3,91E+00
manantiales esto lo muestran las variables de Uso Uso del suelo 9 -2,70E+00
del Suelo 6 (Mosaico de Cultivo) Uso del Suelo 9 Suelo 24 NA
(Pastos y Ganadería). Algunas categorías no Litologia 1 - 12 NA
presentan valores de estimación de coeficiente Pendiente 1,92E-01
(NA) lo cual es consecuencia de la multicolinealidad
de las variables de entrada. Esta problemática se 4.2 REGRESIÓN LOGÍSTICA MODELO 2

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

Debido a la presencia de multicolinealidad en el Litología para suprimir la correlación entre las


conjunto de datos original se procedió a realizar variables no se puede determinar la influencia
una selección de variables para aplicar nuevamente déstas (curvatura, suelo y litología) en la ocurrencia
el procedimiento de Regresión Logística (Regresión de manantiales. Gracias a este problema y con el
Logística Modelo 2). En este método se omitieron fin de incluir todas las variables en el análisis se
las variables que anteriormente presentaban de datos no presenta multicolinealidad ya que los
correlación. Los resultados del análisis de valores de inflación de varianza (FIV) son inferiores
multicolinealidad para este nuevo conjunto de a 10 y los índices de tolerancia son mayores a 0,1.
datos se presentan en la Tabla 3. De los resultados
mostrados en esta tabla ahora este nuevo conjunto

Tabla 3. Análisis de multicolinealidad Regresión Logística


modelo 2.
Variable Tolerancia FIV Variable Tolerancia FIV
precipitation 0,788261 1,268615 soil.use3 0,6114677 1,635409
curvature 0,6590006 1,517449 soil.use4 0,962209 1,039275
dist.roads 0,8514131 1,174518 soil.use5 0,6259336 1,597614
twi 0,376976 2,652689 soil.use6 0,4758022 2,101714
sti 0,1518717 6,584505 soil.use7 0,9311885 1,073896
spi 0,2119865 4,717282 soil.use8 0,5089204 1,964944
ndvi 0,7416208 1,348398 soil.use9 0,3523459 2,83812
dem 0,4167066 2,39977 soil.use10 0,6740479 1,483574
dist.riv 0,8718861 1,146939 slope 0,3506097 2,852174
soil.use2 0,5599173 1,785978 aspect 0,9575365 1,044347
emplea la Regresión Logística Lasso siendo un
En la tabla 4 se observan las variables método más robusto cuando se presenta
seleccionadas por el Modelo 2 de Regresión multicolinealidad en el conjunto de datos de
Logística y sus respectivos coeficientes, entrada
observándose que las variables más significativas La Figura 3 muestra el resultado de la estimación
con coeficientes positivos altos son: NDVI, de los coeficientes del modelo de Regresión
Pendiente, TWI, DEM. Las variables con coeficientes Logística usando todas las variables de entrada. En
negativos son: Uso del suelo 9 (Pastos y Ganadería), el eje X inferior, se representa el Log-Lambda, este
Uso del suelo 3 (Cultivos de Hortalizas) y representa un parámetro que controla el efecto
Precipitación (ver tabla 4). Estas variables con relativo del término de penalización en el proceso
coeficientes negativos presentes en la zona de de selección de variables. Para este caso se
estudio disminuyen la probabilidad de ocurrencia determinó un valor de lambda óptimo de λ
de manantiales. =0,000273 con lo cual 50 variables de un total de 58
son seleccionadas (esto se puede observar en el eje
Tabla 4. Coeficientes Modelo 2 X superior)
Variable Coeficiente Figura 3. Comportamiento de los coeficientes por medio de la
Precipitación -4,34E-03 regularización Lasso aplicado al conjunto de datos.
TWI 2,01E-01
NDVI 6,15E+00
DEM 2,99E-03
Uso del suelo 3 -1,37E+00
Uso del suelo 9 -1,19E+00
Pendiente 2,06E-01

5.1.1.3. REGRESIÓN LOGÍSTICA LASSO


Debido a que en el modelo 2 de Regresión Logística
se omiten las variables de Curvatura, Suelos y
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

En la tabla 4, se evidencian las variables


seleccionadas por el modelo de LR Lasso. Las
principales variables que debido a sus coeficientes
influyen positivamente en esta probabilidad de
ocurrencia son: NDVI, Cobertura de Suelo 5 “Zonas 20 “Arbustal. Las principales variables que debido a
de extracción minera”, Cobertura de Suelo 21 sus coeficientes reducen la probabilidad de
“Tierras desnudas + degradadas”, Cobertura del ocurrencia de manantiales son: Suelo 19 MMHa,
Suelo 17 “plantación forestal”, Cobertura del Suelo suelo 10 MHVd, suelo 15 “MMAg3.
Tabla 4. Coeficientes regresión Lasso

4.4 peso de evidencia


(p < 0,05 indica dependencia condicional entre variables)

En cuarto lugar, se utiliza el modelo de Peso de


Evidencia (WOE) donde se emplean todas las
variables predictivas (ver tabla 9). Para analizar la
relación de dependencia y/o independencia entre
dos variables cualitativas, se utiliza la prueba
estadística (test chi cuadrado). Esta prueba
permite determinar si existe una relación entre dos
variables categóricas (cualitativas), pero no señala
el grado o el tipo de relación; es decir, no indica el
porcentaje de influencia de una variable sobre la
otra o la variable que causa la influencia (Tinoco,
2008). Tabla 1. Coeficientes Peso de Evidencia para

Tabla 5 Valores independientes condicionales usando


test.

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

variables más contribuyentes de acuerdo a los


En la tabla 9 los valores de P< 0,05 indican que las valores de contraste son: Suelo 14 “MMAF2” con
variables son condicionalmente dependientes, es un valor de contraste igual a 2,73, seguido de Suelo
decir están correlacionadas. Entre 256 12 “MHVF” ,con 2,37, Pendiente entre los rangos
comparaciones por pares, se encontró que 194 de 16,5 – 32,4 con un valor de contraste igual a 2,27,
las parejas de comparación por pares dependían Cobertura de Suelo 18 “Arbustal” y Suelo 17
entre sí (ver tabla 9). Para este caso, las variables “MMCe2” con un valores equivalentes de 2,15,
litología y suelo muestran dependencia condicional Cobertura del Suelo 19 “herbazal ” con un valor
con casi todas las variables de entrada al obtener de 1,99, Suelo 6 “ME”, Litología 7 (mezcla de limo y
un nivel de significancia ≤0,05. En el caso contrario, arena no consolidada) con valores de 1,88, Uso de
el par de Curvatura estándar y Dirección de la suelo 7 (frutales y bosques comerciales) y Suelo 21
Pendientes muestra independencia condicional “MMXe1” Con valores de 1,66.
presentando un nivel de significancia = 0,88.
7- Mapas de potencial de manantiales
Regresión Logística (modelo 1) Regresión Logística (modelo 2)

Regresión Logística Lasso Peso de evidencia

Figura 7 Mapas de potencial de manantiales generados a partir de: regresión logística modelo 1, regresión logística, regresión logística
modelo 2 , regresión logística Lasso y peso de evidencia

Tabla 2. Coeficientes Peso de Evidencia para

En la tabla 10, se presentan las 10 variables En la tabla 11, se evidencian las 10 variables
principales seleccionadas por el modelo de Peso de principales seleccionadas por el modelo de Peso de
Evidencia (WOE) consideradas significativas en la Evidencia (WOE) que reducen la probabilidad de
ocurrencia de manantiales. Las principales ocurrencia de manantiales. Estas variables son:
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

Cobertura del Suelo 1 “Tejido Urbano Continuo” regresión logística, regresión logística modelo 2,
con un valor de contraste igual a -2,57, Litología 2 regresión logística Lasso y peso de evidencia.
“Depósitos Clásticos Hidrogenicos”, Suelo 22 En tonalidades azules se representan las zonas
“VMAa” con un valor equivalente a -2,53, STI entre donde la predicción de ocurrencia de manantiales
los rangos 0,1 – 0,3 con un valor de contraste igual es mayor, en tonalidades amarillas y verdes donde
a -2,40, Suelo 20 “MMXd1” con una valor de -2,26, la probabilidad de ocurrencia es media y en
Uso de Suelo 9 “Ganadería Intensiva y Semi - tonalidades rojas donde es baja.
intensiva” -2,15, DEM entre los rangos 2470 - 2484 Para el método de regresión logística modelo 1 las
con un contraste igual a -2,07 que representarían zonas con probabilidades altas se encuentran en la
zonas de baja altitud en la zona de estudio, parte central de la zona de estudio, las zonas con
Litología 12 “Zona Urbana” ,Suelo 24 “Zona probabilidades bajas se encuentran al S - SE de la
Urbana”, Uso del Suelo 10 “Zona Urbana”, con un zona y distribuidos de forma irregular en el sector y
valor equivalente a -2.06. las zonas con probabilidades medias se encuentran
al s-w de la zona. Este resultado no era el deseado
debido a que se esperaba que los valores de
probabilidad alta y bajas mostraran un claro control
por parte de algunas variables (NDVI, Cobertura de
suelo, pendiente, uso de suelo) pero dicho control
no es visible en el mapa obtenido. Esta falta de
control por parte de las variables de entrada sobre
el mapa es una consecuencia de la
multicolinealidad presente en el conjunto de datos
como en el caso de curvatura, suelos y litología.
Para el Modelo 2 de Regresión Logística se las
zonas donde la predicción de ocurrencia de
manantiales es mayor, estas zonas se encuentran
principalmente en las zonas montañosas presentes
en el área de estudio. Las probabilidades bajas se
encuentran principalmente las zonas planas del
área presentando relación con los depósitos
cuaternarios encontrados en la zona de estudio.
Estos resultados muestran la influencia de la
variable pendiente sobre la ocurrencia de los
manantiales, en donde los valores altos de
probabilidad de ocurrencia de manantiales (color
azul) están asociados a las zonas en donde la
pendiente es alta (áreas montañosas), mientras que
las probabilidades de ocurrencia bajas (color rojo)
están asociadas a zonas con pendientes bajas
(zonas planas).
Para la Regresión Logística Lasso las
probabilidades altas están asociadas a zonas
montañosas. Las probabilidades medias se
encentran dispersas en la zona de estudio Y las
probabilidades bajas se encuentran asociados con
zonas planas representando los depósitos
cuaternarios encontrados en la zona. Estos
resultados muestran la influencia de las variables
(NDVI, cobertura de suelos (asociados con la
En la figura 7 se observan los mapas de vegetación, suelos) sobre la ocurrencia de los
probabilidad de ocurrencia de manantiales manantiales, en donde los valores altos de
generados a partir de: regresión logística modelo 1, probabilidad de ocurrencia de manantiales (color

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

azul) están asociados a las zonas en donde la la muestra que se prueba es manantial y el modelo
vegetación es más abundante, mientras que las calcula una probabilidad alta de no manantial, es
probabilidades de ocurrencia bajas (color rojo) decir, el modelo estaría realizando una clasificación
están asociadas a zonas con índices de vegetación incorrecta.. La sensibilidad se refiere a la capacidad
bajos. que tiene el modelo para clasificar correctamente
los manantiales. La especificidad se refiere a la
Para el método de Peso de Evidencia las zonas de capacidad que tiene el modelo de clasificar
baja probabilidad se encuentran en zonas planas correctamente los no manantiales. Un modelo con
relacionadas con los depósitos cuaternarios. Las buena capacidad predictiva debería tener valores
zonas de alta probabilidad de abarcan un gran altos tanto de sensibilidad como de especificidad
porcentaje del área de estudio .En este método de (Camarero, Almazan, & Mañas, (s.f)).
Peso de Evidencia las variables presentan
dependencia condicional, debido a estas El modelo Regresión Logística Lasso mostró el
correlaciones, el modelo (WOE) genera una mayor desempeño en la clasificación del potencial
sobreestimación y subestimación de probabilidad de manantiales en la zona centro de Boyacá, con un
en la ocurrencia de manantiales sobresaliendo las índice de sensibilidad igual a 0,84 seguido por el
zonas de alta y baja probabilidad y, minimizando las modelo Regresión Logística Modelo 2 con (0,82),
zonas de probabilidad media. Peso de Evidencia (0,81) y Regresión Logística
Modelo 1 (0,66).
En cuanto a la clasificación de los no manantiales,
5. validación de resultados el Modelo 1 de Regresión Logística (especificidad =
0,71) logra el mayor rendimiento, seguido del
modelo Peso de Evidencia (0,69), Regresión
Logística Modelo 2 (0,66) y por último el modelo de
Regresión Logística Lasso (0,63).

Figura 1. ROC para datos de validación

Tabla 3. Resultados para el procedimiento de validación de


los modelos ajustados para la estimación de la probabilidad de
ocurrencia de manantiales en la parte central de Boyacá.

De acuerdo a los resultados de datos de validación


observados en la tabla 13 el parámetro Positivos
Verdaderos, corresponde cuando la muestra que se
prueba es manantial y el modelo calcula una
probabilidad alta de manantial, en otros términos, Se evaluó la precisión de cada modelo utilizando la
el modelo está haciendo una clasificación correcta; curva ROC. En el eje Y observamos la sensibilidad,
Negativos Verdaderos, corresponde cuando la en el eje X se tiene el valor de 1-especificidad y se
muestra no es manantial y el modelo calcula una evaluó el entrenamiento y el rendimiento
probabilidad baja de manantial, es decir, el modelo predictivo de los modelos a partir del área bajo la
está realizando una clasificación correcta; Positivos curva y de esta forma explicar cuál es el mejor
Falsos, corresponde cuando la muestra que se modelo. Se observa que el modelo que tuvo un
prueba no es manantial y el modelo calcula una mejor comportamiento fue el modelo Regresión
probabilidad alta de manantial, por consiguiente, el Logística Modelo 2 (AUC=0,81), Regresión Logística
modelo estaría realizando una clasificación Lasso (AUC=0,81), Peso de Evidencia (WOE) con
incorrecta; Negativos Falsos, corresponde cuando
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

(AUC=0,81) y por último Regresión Logística ocurrencia de manantiales sean estimadas de


Modelo 1 (AUC=0,71). manera sesgada.
En resumen, los resultados anteriores indican que El método de la Regresión Logística Lasso está
no existen grandes diferencias entre los cuatro precisamente diseñado para ser empleado en
métodos usados como se aprecia en los valores de situaciones en donde las variables de entrada
sensibilidad, especificidad, área bajo las curvas presentan multicolinealidad ya que los coeficientes
ROC, y los números de muestras clasificadas se van estimando uno a uno, y la inclusión de una
correcta e incorrectamente .Sin embargo, según los variable al conjunto de datos se hace sin que se
resultados de validación, el mejor modelo sería la presenten problemas en la estimación de esos
Regresión Logística Lasso para la predicción de coeficientes (Carrasco , 2016). Esto quiere decir que
ocurrencia de manantiales (tabla 13 y Figura 53); la pregunta de investigación se puede responder
mientras que el mejor modelo para la predicción de sin problema usando los resultados de la Regresión
la ocurrencia de no-manantiales es la Regresión Logística Lasso y estos resultados se van a
Logística Modelo 1 (tabla 13). comparar con los obtenidos con los otros modelos.

5. Discusión de resultados
Los resultados para el método de regresión
La pregunta de investigación es: ¿Cuáles son los logística muestran que las variables con
factores que contribuyen a la ocurrencia de coeficientes positivos mayores a 1.0 y que por lo
manantiales en la parte central de Boyacá? Para tanto tienen mayor influencia en la ocurrencia de
responder a esta pregunta se emplearon tres manantiales incluyen al NDVI, cobertura de suelo
técnicas estadísticas incluyendo Regresión Logística (arbustal, herbazal, bosque galería) y tipo de suelo
convencional, Regresión Logística Lasso y Peso de (ME y MHEg) lo cual indica que la ocurrencia de
Evidencia. La aplicación de estos procedimientos manantiales está controlada por la vegetación
estadísticos requiere que la información de entrada (NDVI y cobertura de suelo) y la presencia de
posea ciertas características (independencia lineal e pendientes altas (tipos de suelo) y descubiertas
independencia condicional de las variables), y por (tipo de suelo ME y coberturas de suelo zona de
lo tanto es importante verificar que dichas área minera y tierras degradadas). Los resultados
características se cumplan. Las variables de indican que la ocurrencia de manantiales también
entrada usadas en este trabajo presentan está controlada por la presencia de zonas
multicolinealidad y son condicionalmente descubiertas como zonas extracción minera
dependientes lo cual indica que su análisis con los (cobertura de suelo 5), tierras desnudas y
procedimientos de Regresión Logística y pesos de degradadas (cobertura de suelo 21) y donde aflora
evidencias puede presentar problemas, y los el material parental (tipo de suelo ME. Estos
resultados obtenidos se deben interpretar con resultados se presentan de manera gráfica en las
mucho cuidado. El problema de multicolinealidad Figuras 53 y 54.
de la Regresión Logística se resolvió parcialmente
eliminando del conjunto de entrada de aquellas
variables que presentaban una alta correlación
(Modelo de Regresión Logística 2), dentro de las
cuales se eliminaron el suelo y la litología. Este
hecho no es ideal ya que estas son variables que de
acuerdo a nuestra hipótesis inicial son influyentes
para la ocurrencia de manantiales. Así mismo, el
hecho de no incluir algunas variables dentro del
análisis cambia los coeficientes del modelo lineal
estimado y por lo tanto una variable que
inicialmente era importante (coeficiente cercano a
0) ahora puede serlo (coeficiente diferente de 0).
En el caso del método de pesos de evidencias, las Figura 2. Modelo conceptual de ocurrencia de manantiales en
variables de entrada presentan dependencia zonas descubiertas de pendiente alta.
condicional lo cual hace que las probabilidades de

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

Figura 3. Modelo conceptual de ocurrencia de manantiales en


zonas con vegetación y pendiente alta.
Figura 5. Modelo conceptual de ocurrencia de manantiales en
Las variables que tienen coeficientes positivos zonas con pendiente intermedia y suelo tipo AMVe2
entre 0,1 y 1 y que por lo tanto representan
variables que tienen una influencia intermedia en la
ocurrencia de manantiales estas incluyen los tipos
de suelo MMAf2, AMVe2 y MMCe2 con predominio
de coberturas de mosaico de pastos y cultivos y
bosque fragmentado, e influencia de la pendiente,
curvatura de plano y el índice de humedad
topográfica (TWI). Estos resultados se resumen de
manera gráfica en las Figuras 55, 56 y 57 .En la
Figura 56 y 57 se presenta el modelo para el tipo de
suelo MMAf2 y el suelo AVMe2 que tienen
características muy similares. La Figura 58 presenta
el modelo para el tipo de suelo MMCe2 el cual se
caracteriza por suelos alta fertilidad lo que hace
que en la cobertura predominen los cultivos. Figura 6. Modelo conceptual de ocurrencia de manantiales en
zonas con pendiente intermedia y suelo tipo MMCe2

Las variables que tienen coeficientes positivos entre


0,0 y 0,1 y que tendrían una contribución baja a la
ocurrencia de manantiales incluyen el tipo de suelo
MMXe1, curvatura de perfil, altitud (DEM),
distancia a los ríos y tipos de litología 11(areniscas y
rocas ígneas intrusivas) y litología 7 (depósitos no
consolidados de arenas y limo mezclado. Un
resumen de las condiciones de ocurrencia de
manantiales en zonas de pendiente moderada se
presenta en la Figura 59.

Figura 4. Modelo conceptual de ocurrencia de manantiales en


zonas con pendiente intermedia y suelo tipo MMAf2.
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

herbazal) aparecen como influyentes para la


ocurrencia de manantiales junto con el tipo de
suelo 6 (ME), 7 (MEEg), 12 (MHVf), 14 (MMAf2), 17
(MMCE2) y 21 (MMXE1), el uso del suelo
Agricultura y frutas (uso suelo 7) y la litología de
arena no consolidada (litología 7). Esto indica que
la cobertura de suelo se encuentra correlacionada
con estos otros factores (tipo de suelo y litología).

2. CONCLUSIONES
1. Este estudio utilizó los métodos Regresión
Logística, Regresión Logística Lasso, Peso de
Evidencia (WOE) para realizar los mapas de
probabilidad de ocurrencia de manantiales en la
Figura 7. Modelo conceptual de ocurrencia de manantiales en zona centro de Boyacá. Se determinó que las
zonas con pendiente intermedia a baja y suelo tipo MMEx1 variables que tienen influencia positiva en la
ocurrencia de manantiales para el método de
Las variables que tienen una influencia negativa en Regresión Logística Modelo 1 son: NDVI, Cobertura
la ocurrencia de manantiales son aquellos con de Suelo 18 (Herbazal), Cobertura de Suelo 19
coeficientes negativos estimados con el (Arbustal) y Cobertura de suelo 10 (Mosaico de
procedimiento de Regresión Logística Lasso (ver Pastos y Cultivos); las variables que para este
tabla 8 y tabla 14). Estas variables corresponden a mismo método disminuyen la probabilidad de
los tipos de suelo MMAg3 (tipo de suelo 15), MHVd ocurrencia de manantiales son: Uso de Suelo 6
(tipo de suelo 10), y MMHa (tipo de suelo 19) . (Mosaico de Cultivos) y Uso de Suelo 9 (Pastos y
Ganadería).
Los resultados anteriores muestran que existe una 2.Se identificó que las variables que tienen
clara interacción entre las variables de entrada del influencia positiva en la ocurrencia de manantiales
presente análisis a la hora de considerar su efecto para el método de Regresión Logística Modelo 2
en la ocurrencia de los manantiales, sin embargo, son: NDVI, Pendiente, TWI, DEM (Modelo Digital de
esta interacción se presenta en forma de variables Elevación); las variables que disminuyen la
relacionadas con el suelo y específicamente la probabilidad de ocurrencia de manantiales son: Uso
cobertura de suelo. Esta variable de cobertura se de Suelo 9 (Pastos y Ganadería), Uso de Suelo 3
encuentra relacionada con el tipo de suelo, y en la (Cultivo de Hortalizas) y Precipitación.
parte central de Boyacá estos suelos tienen un 3.Para el método de Regresión Logística Lasso se
control muy fuerte del relieve y del material determinó que las variables que tienen influencia
parental. Esto indica que la variable cobertura de positiva en la ocurrencia de manantiales son: NDVI,
suelo está encapsulando las variaciones de la Cobertura de Suelo 5 (Zonas de Extracción Minera),
topografía, tipo de suelo y material parental Cobertura de Suelo 21 (tierras desnudas y
(litología). Es por esta razón, que esta variable degradadas) y Cobertura de suelo 17 (plantación
aparece como influyente en los métodos de forestal).
Regresión Logística Modelo 1 y Peso de Evidencia, 4.Las principales variables que debido a sus
Esta variable no se consideró en la Regresión coeficientes reducen la probabilidad de ocurrencia
Logística Modelo 2 ya que algunas de sus categorías de manantiales son: Suelo 19 MMHa ,suelo 10
cobertura de suelo 8 y 10 (pastos limpios, mosaico suelo 15 “MMAg3.
de pastos y cultivos) presentaban altos valores de 5.Se determinó que las variables que tienen
factor de inflación de varianza y valores bajos de influencia positiva en la ocurrencia de manantiales
tolerancia (ver tabla 4), lo cual indica que para el método de Peso de Evidencia son: Suelo 14
efectivamente esta variable se encontraba “MMAF2” ,Suelo 12 “MHVF” ,Pendiente, Cobertura
correlacionada con otras de las variables de de Suelo 18 (Arbustal), Cobertura del Suelo 19
entrada. En el caso de la metodología de pesos de “herbazal; las variables que para este mismo
evidencia, la cobertura de suelo 18 y 19 (arbustal, método disminuyen la probabilidad de ocurrencia

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

de manantiales son: Cobertura del Suelo 1 (Tejido de Peso de Evidencia Modificado (MWOE) (Wey,
Urbano Continuo), seguido de Suelo 22 “VMAa”, Zhang, & Agterberg, 2018) debido a que este
Litología 2 (Depósitos Clásticos Hidrogenicos), STI modelo debilita la dependencia condicional
(entre los rangos 0,1 – 0,3), Suelo 20 “MMXd1”, generando mejores resultados.
Uso de Suelo 9 (Ganadería Intensiva y Semi – Se recomienda realizar un estudio similar al
intensiva), DEM (entre los rangos 2470 – 2484), Uso presentado en el presente trabajo para los
del Suelo 10 (Zona Urbana), Suelo 24 (Zona manantiales que ocurren en zonas de pendientes
Urbana), Litología 12 (Zona Urbana). bajas. Los resultados presentados en este
Se concluye que, aunque la categoría NDVI se documento muestran claramente el control que
encuentra entre las variables más influyentes en los ejerce la pendiente sobre la ocurrencia de
métodos de Regresión Logística Modelo 1, manantiales, pero estos resultados no aplican para
Regresión Logística Modelo 2 y Regresión Logística todos los manantiales presentes en la zona de
Lasso se presenta una excepción en el método de estudio. Los modelos conceptuales de la ocurrencia
Pesos de Evidencia debido a que no se presenta de manantiales derivados en este trabajo (figuras
como una variable influyente debido a los 53 a 58) aplican para zonas de pendientes altas y
problemas de correlación que este método moderadas dejando la gran inquietud sobre los
presenta para seleccionar las variables. factores que controlan los manantiales en las zonas
Se determina que los modelos que visualmente de pendientes bajas como lo es el abanico aluvial.
presentan una mejor distribución de las zonas de
alta, media y baja probabilidad de ocurrencia de REFERENCIAS
manantiales son Regresión Logística modelo 2 y
Agencia PCJ. ((s.f)). Protección de los Manantiales para Enfrentar
Regresión Logística Lasso, sin embargo, es los Cambios Climaticos.
importante tener en cuenta que el modelo de Amat , J. (2016). Selección de predictores, regularización ridge,
Regresión Logística Lasso es el método que evalúa lasso, elastic net y reducción de dimensionalidad.
todas las variables, este caso no ocurre con el Obtenido de
https://www.cienciadedatos.net/documentos/31_sel
Modelo 2 de Regresión Logística debido a que en eccion_de_predictores_subset_selection_ridge_lasso
este método se eliminaron las variables que _dimension_reduction
presentan multicolinealidad. Angarita, J. C., & Marín, R. A. (2019). Modelo de Predicción de
Incumplimiento de Pago en Sector de Microfinanzas -
Analitics. Bogota.
AQUAE . ((s.f)). Importancia del agua y funciones en los seres
Recomendaciones vivos. Obtenido de AQUAE FUNDACIÓN:
https://www.fundacionaquae.org/importa
Al realizar análisis de probabilidad de ocurrencia ncia-del-agua/
de manantiales a través de los diferentes métodos Arabameri, A., Roy, J., Saha, S., Blaschke, T.,
estadísticos (Regresión Logística, Regresión Ghorbanzadeh, O., & Tien Bui, D. (2019).
Logística Lasso, Peso de Evidencia, etc.) se Application of Probabilistic and Machine
recomienda utilizar a la par los índices Learning Models for Groundwater Potentiality
estadísticos (coeficientes) los cuales al ser Mapping in Damghan Sedimentary Plain, Iran.
analizados conjuntamente con los mapas permiten ArcMap. (2016). Función de Curvatura. Obtenido de ArcGIS for
Desktop:
estimar las relaciones existentes entre las variables https://desktop.arcgis.com/es/arcmap/10.3/manage-
dependientes e independientes mientras los mapas data/raster-and-images/curvature-function.htm
generados indican la distribución de las zonas de ArcMap. (2018). ArcGis for Desktop. Obtenido de
alta, media y baja probabilidad de ocurrencia de https://desktop.arcgis.com/es/arcmap/10.3/tools/sp
atial-analyst-toolbox/how-aspect-works.htm
manantiales, esto con el fin de tener un mejor Avellaneda , F., Villaona , J., Gonzalez , M., & Safra, D. (2017).
criterio en el análisis de estos y en futuras toma de Evaluación de un prospecto de Hidrocarburos en el
decisiones. Sinclinal San Miguel, Municipio de Iza Departamento
Para aplicar el método Peso de Evidencia se de Boyacá. Bucaramanga.
Balsa , C., & sanchez , A. (2017). Un paquete R para analisis
recomienda no utilizar variables con dependencia masivo de modelos predictivos de regresión logística
condicional por los errores que se pueden generar multivariante y sus medidas de discriminación y de
en la aplicación de este, en caso de ser necesaria la clasificacíon asociadas . España.
aplicación de las variables que presenten esa
multicolinealidad se recomienda aplicar el modelo
Revista de Ingeniería, Investigación y Desarrollo. ISSN 1900-771X/E-ISSN 2422-4324

Camarero, L., Almazan, A., & Mañas, B. ((s.f)). Regresión Guijarro , F. (2013). Estadística Aplicada a la valoración de
Logística: Fundamentos y Aplicación a la Modelos multivariantes . Valencia : Editorial
Investigación Sociologíca. España. Universitat Politécnica de Valencia .
Carrasco , M. (2016). Tecnicas de Regularización en Regresión: Hastie , T., Tibshirani,, R., & Friedman, J. (2009). The Elements of
Implementación y Aplicaciones. España. Statistical Learning: Data Mining, Inference, and
Carrasco, M. (2016). Tecnicas de Regularización en Regresión: Prediction. Springer.
Implementación y Aplicaciones. España. Huang , J. (2014). Investigation on Landslide Susceptibility using
Chen, W., Zhao, X., Tsangaratos, P., Shahabi, H., Ilia, I., Xue, Remote Sensing and GIS Methods. Hong Kong: Open
W., . . . Ahmad, B. B. (2020). Evaluating the usage of Access Theses and Dissertations. 33.
tree-based ensemble methods in groundwater IDEAM . (2015). Estudio Nacional del Agua . Bogota .
spring. Journal of Hidrology. IDEAM, IGAC, IAvH, (Invemar, Sinchi, I., & IIAP. (2007).
CORPOBOYACA. (28 de Julio de 2017). Socialización y Entrega ECOSISTEMAS CONTINENTALES, COSTEROS Y
del Modelo Hidrogeológico de la Zona Centro de MARINOS DE COLOMBIA. Bogotá, D. C.
Boyacá. Obtenido de CORPOBOYACA: IGAC . (2005). Estudio General de Suelos y Zonificacion de Tierras
https://www.corpoboyaca.gov.co/noticias/socializaci del Departamento de Boyaca . Bogota D.C.
on-y-entrega-del-modelo-hidrogeologico-de-la-zona- IGRAC. ((s.f)). Qué es agua subterranea? Obtenido de
centro-de-boyaca/ International Groundwater Resources Assessment
Diaz Garcia , J. J. (2015). Estudio de Índices de vegetación a partir Centre: https://www.un-igrac.org/es/que-es-agua-
de imágenes aéreas tomadas desde UAS/RPAS y IGRAC. (s.f ). IGRAC. Obtenido de International Groundwater
aplicaciones de estos a la agricultura de precisión. Resources Assessment Centre : https://www.un-
MADRID. igrac.org/es
Domingo, J. M., Corral, E., Ruiz, F., Fernández , R., & Redondo, F. INGEOMINAS. (1979). Geología de las Planchas 170, Velez, 190,
(2013). Cuantificación de la influencia del índice de Chiquinquira, Colombia. Bogotá.
humedad en la profundidad y capacidad Hidrica del INGEOMINAS. (2001). Geología de la Plancha 192 Laguna de
suelo. España: Sociedad Española de Ciencias Tota. Bogotá.
Forestales. INGEOMINAS. (2009). Geología del Domo Volcanico de Iza y sus
Dornelles, S., & Tena, D. (2011). El inconsciente colectivo en la Alrededores Sector Pesca e Iza. Bogotá.
imagen de marca. anagramas rumbos sentidos Irala, J., Fernandez-Crehuet, R., & Serrano, A. (1997). Intervalos
comun. de confianza anormalmente amplios en regresión
Fan, D., Cui, X.-m., Yuan, D.-b., Wang, J., Yang, J., & Wang, S. logística: interpretación de resultados de programas
(2011). Weight of Evidence Method and Its estadísticos. 230-234.
Applications and Its Applications and Development. James, G., Witten, D., Tibshirani, R., & Hastie, T. (2013). An
Beijing, China: College of Geoscience and Surveying Introduction to Statistical Learning with Applications
Engineering. in R. Springer.
FAO. (1996). Bases Digitales de Datos de Suelo y Terreno a Nivel Joshep , M. (2016). Practical Guide to Logistic Regression.
Mundial y Nacional. Roma. Estados Unidos : Prensa CRC, 2016.
Fernández, S. (2011). Regresión Logística. Madrid. Kemp, L. D., Bonham - Carter, G. F., & Raines, G. L. (1999). Peso
Finnegan, N., Sklar, L., & F. T. (2007). Interplay of sediment de Evidencia. Obtenido de Arc-WofE: Arcview
supply, river incision, and channel morphology extension for weights of evidence mapping:
revealed by the transient evolution of an https://www.ige.unicamp.br/wofe/documentation/w
experimental bedrock channel. JOURNAL OF ofeintr.htm
GEOPHYSICAL RESEARCH,. Mariño, S. J. (2 de Septiembre de 2020). En Boyacá los
doi:10.1029/2006JF000569 Campesinos Recibirán Recompensa por Cuidar y
Fuentes, M. J., Sanchez, A., & Sainz, G. I. (2018). Detección de Defender un Páramo. Última Hora.
Fallos Dinamica y Descentralizada Basada en Mercedes, C., & Poma, S. ((s.f)). Estimación de la Ocurrencia de
Métodos de Regresión. 554 - 561. Incidencias en Declaración de Pólizas de Importación.
Garcia, G., & Rache, J. (2018). ZONIFICACIÓN DE Perú.
SUSCEPTIBILIDAD A MOVIMIENTOS EN MASA EN LA Miraki , S., Zanganeh , S., Chapi, K., Singh , V., Shirzadi , ,.,
MICROCUENCA TABACAL - MUNICIPIO DE LA PALMA, Shahabi , H., & Pham , B. T. (2019). Mapping
DEPARTAMENTO DE CUNDINAMARCA. Bogota D.C. Groundwater Potential Using a Novel Hybrid
Gil Martinez, C. (Mayo de 2018). Regresión Logística Lineal y Intelligence Approach. Water Resour Manage, 281-
Múltiple. Obtenido de Regresión Logística: 302.
https://rstudio-pubs-static.s3.amazonaws.com/ Montoya Valer, S. K. (2017). Factores Socieconomicos que
Gobernación de Boyacá. (Junio de 2012). Gobernación de Afectan al Consumo Domestico de Agua Potable
Boyacá. Obtenido de Usando la Regresión Múltiple Puno Ciudad - 2015 .
https://www.boyaca.gov.co/hidrografia-boyacense/ Perú.
Gobernación de Boyacá. (Junio de 2012). Hidrografía Boyacense. Moore, I. D., & Wilson, J. (1992). Length-slope factors for the
Obtenido de Gobernación de Boyacá: Revised Universal Soil Loss Equation: Simplified
www.boyaca.gov.co/hidrografia-boyacense/ method of estimation. Journal of soil and water
Govaerts, B., & Verhulst, N. (2010). The normalized difference conservation., 423-428.
vegetation index (NDVI) Greenseeker(TM) handheld Moore, I. D., Gesseler, P. E., Nielsen, G. A., & Peterson, G. A.
sensor: toward the integrated evaluation of crop (1993). Soil attribute prediction using terrain analysis.
management part A: concepts and case studies. 443-452.
Mexico .

Calle 4 Sur N° 15-134 Edificio Administrativo Tercer piso Sogamoso, Boyacá-Colombia www.uptc.edu.co/enlaces/ringinvedesa
Revista Ingeniería, Investigación y Desarrollo

Moreno, M., & Fechi, Y. (2006). PLAN DE ORDENACIÓN Y Tibshirani, R. (1996). Regression Shrinkage and Selection via the
MANEJO AMBIENTAL DE LA CUENCA ALTA DEL RIO Lasso. Journal of the Royal Statistical Society., 267-
CHICAMOCHA. TUNJA. 288.
Mozzicafreddo, S., Ortega, J., Papa, N., & Torre, P. J. ((s.f)). Tinoco, O. (2008). Una Aplicación de la Prueba Chi-Cuadrado con
Delimitación de Zonas de Manejo Utilizando SPSS.
Variables. Argentina. Torres , O. (2014). Logit, Probit and Multinomial Logit models in
Naghibi, S., Pourghasemi, H., & Dixon , B. (2016). GIS-based R. Mexico .
groundwater potential mapping using boosted USGS. (2018). NDVI, la Fundación para la Fenología de
regression tree, classification and regression tree, Teledetección. Obtenido de USGS:
and random forest machine learning models in Iran. https://www.usgs.gov/core-science-systems/eros/ph
Environ Monit Assess . enology/science/ndvi-foundation-remote-sensing-
Oh, H.-J., & Lee, S. (2010). Landslide susceptibility mapping on phenology?qt-science_center_objects=0#qt-
Panaon Island, Philippines using a geographic science_center_objects
information system. Environ Earth Sci, 935 - 951. Van Westen, C. J., Rengers , N., & Soeters, R. (2003). Use of
Olusegun, M., Garba, H., & Samson, A. (2015). Variance Inflation Geomorphological Information in Indirect Landslide
Factor: As a Condition for the Inclusion of Suppressor Susceptibility Assessment. International Institute for
Variable(s) in Regression Analysis. Open Journal of Aerospace Survey and Earth Sciences, 399 - 419.
Statistics,, 754-767. Van, F. J., Rengers, N., & Soeters, R. (2003). Use of
Ozdemir, A. (2011). GIS-based Groundwater Spring Potential Geomorphological Information in Indirect Landslide
Mapping in the Sultan Mountains (Konya, Turkey) Susceptibility Assessment. Natural Hazards, 399 -
Using Frequency Ratio, Weights of Evidence and 419.
Logistic Regression Methods and their Comparison. Velandia, F. (2003). Cartografía Geologíca y Estructural Sector
Journal of Hydrology, 290 - 308. Sur del Municipio de Paipa . Bogotá.
Peréz , L. R. (Diciembre de 2018). Manantiales. Obtenido de Velandia, F. (2005). Interpretación de Transcurrencia de las
Tecnologías de abastecimiento de agua: Fallas Soapaga y Boyacá apartir de Imagenes Landsat
https://sswm.info/es/gass-perspective-es/tecnologia TM. Bogotá: Boletín de Geología.
s-de/tecnologias-de-abastecimiento-de-agua/ Vicéns , J., & Medina , E. (2005 ). Analisis de datos cualitativos .
manantiales Wey, Y.-L., Zhang, D., & Agterberg, F. (2018). Modified Weights-
Pourtaghi, Z. S., & Pourghasemi, H. R. (2014). GIS-Based of-Evidence Modeling with Example of Missing
Groundwater Spring Potential Assessment and Geochemical Data. Hindawi.
Mapping in the Birjand Township, Southern Khorasan Wilson, J. P., & Lorang, M. (2000). Spatial Models of Soil Erosion
Province, Iran. Journal of Hydrology, 643 - 662. and GIS. California.
Ramos , R. (2018). Estudio de la susceptibilidad al deslizamiento Wu, T. T., & Lange, K. (2008). COORDINATE DESCENT
de laderas en el Estado de Guerrero, México, ALGORITHMS FOR LASSO PENALIZED REGRESSION.
aplicando Tecnologías de Información Geográfica. Institute of Mathematical Statistics, 224 - 244.
Madrid,España.
Renzoni, G. (1967). Geología del Cuadrangulo J-12. Bogotá.
Rodrigo, J. (Agosto de 2016). Regresión Logística. Obtenido de
Regresión Logística Simple y Multiple:
https://www.cienciadedatos.net/documentos/27_re
gresion_logistica_simple_y_multiple#
Rodriguez , A., & Solano, O. (2000). Mapa Geologico
Departemento de Boyaca. INGEOMINAS.
Serra, A. (2020). Comparación de Algoritmos de Clasificación
Supervisada. España.
SGC. (2004 ). Atlas de Aguas Subterraneas de Colombia .
Obtenido de Ministerio del Ambiente y Desarrollo
Sostenible:
https://www.minambiente.gov.co/index.php/compo
nent/content/article/1936-acuiferos#
SGC. (2013). Documento metodológico de la zonificación de
susceptibilidad y amenaza relativa por movimientos
en masa escala 1:100.000. bogota .
SGC. (2016). Mdelo Hidrogeologico Boyaca Centro . Bogota .
SGC. (2016). MODELO HIDROGEOLOGICO BOYACA CENTRO .
BOGOTA .
SGC. (2017). Guia metodologica para la zonificación de amenaza
por movimientos en masa escala 1:25000. Bogota
D.C.
SIGLA. (2014). Modelo Digital de Elevación. Obtenido de Sistema
de Información Geográfica de Latinoamérica S.A.S:
http://www.sigla-sas.com/modelos-digitales-de-
elevacion.html

También podría gustarte