Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Artículo 54881 1 10 20190420 PDF
Artículo 54881 1 10 20190420 PDF
investigaciones sociales
Vol.22 N.°40, pp.97-110 [2019]UNMSM-IIHS. Lima, Perú
DOI: http://dx.doi.org/10.15381/is.v22i40.15889
RESUMEN
En todo el Perú se carece de estaciones meteorológicas suficientes que pudieran proporcionar datos climáticos y ante esta nece-
sidad, en la presente investigación se analiza la aplicación de diferentes métodos con el objetivo de completar datos faltantes en
cuatro estaciones pluviométricas en las zonas ubicadas entre 4000 a 4500 m.s.n.m. de la región Arequipa. Estos métodos son;
regresión lineal, razones de distancia, promedios vecinales, correlación con estaciones vecinas, regresión múltiple y se ha añadido la
completación por el método del Vector Regional. Los métodos se analizan a través del Coeficiente de Determianción (R2), Error
Estándar de Estimación (EEE) y el test de concordancia de Bland y Altman, logrando establecer el mejor estimador en esta región.
97
ROBERT RAMOS ALONZO / MIGUEL ALVA HUAYANEY
E
l clima es un elemento esencial en el desarro- La investigación fue realizada en las zonas altas de
llo de la vida, así por ejemplo presenta una las cuencas de Camana y Chili, emplazadas en la re-
influencia directa en los recursos hídricos, gión Arequipa. Geográficamente, la región evaluada
en la biodiversidad, las actividades huma- está comprendido entre los paralelos de 15º17’48’’
nas entre otros; por lo que conocer los parámetros a 16º12’55’’ LS y los meridianos 70º53’10’’ a
meteorológicos como la precipitación y temperatura 71º24’32’’ LW. Esta región se ubica a una altitud que
son importantes. Por otro lado, diversas publicacio- varía entre los 4000 a 4500 m.s.n.m., por su ubica-
nes (CELPAL y el BID, 2014) indican que el planeta ción presenta temperaturas medias entre 4 a 6ªC y la
estaría sufriendo un cambio climático y que esta- precipitación anual está próximo a 400 mm (Zúñiga,
rían afectando sobre todo a países como el nuestro. 2010).
A pesar de la necesidad de contar con información Políticamente se ubica en los distritos de Callali,
actualizada no se cuenta con estaciones meteoroló- San Antonio de Chuca y San Juan de Tarucani, en las
gicas suficientes que pudieran monitorear las carac- provincias de Caylloma y Arequipa, región Arequipa.
terísticas climáticas, por lo que en esta investigación La Ubicación de presenta en la Figura 1.
se presentan diversas alternativas para generar datos
nuevos ante la falta de información en determinados
períodos de tiempo. 3. Objetivo
En la actualidad existen diferentes formas de ge-
nerar información de precipitación, que van desde El objetivo de la presente investigación ha sido deter-
datos satelitales como el TRMM (Tropical Rainfall minar el mejor método para la completar datos faltan-
Measuring Mission), hasta métodos estadísticos, sin tes en las zonas altas de las cuencas Camaná y Chili en
embargo, aun con estas avanzadas tecnologías, los da- las provincias de Caylloma y Arequipa.
tos generados deben ser corroborados y validados con
datos reales, estos últimos muchas veces son escasos Objetivos específicos
por lo que resultan una limitante cuando se pretende
realizar estudios climáticos y de recursos hídricos. En • Determinar en qué meses del año la completa-
este contexto, esta investigación compara siete méto- cion de datos es más certero.
dos para completar valores de precipitación mensual. • Recomendar que método sería el más apropiado
Antes de completar los datos, se ha realizado un para completar datos en esta región.
análisis de consistencia, este análisis, es un proceso
que implica la identificación o detección de datos anó-
malos, los cuales se ha realizado a través del método 4. Metodología
gráfico y el análisis de cuartiles, luego se ha realizado
el análisis de doble masa y finalmente se ha corregi- Previo a la completación de datos faltantes se realizó
do algunos datos dudosos. Así los métodos como el análisis de consistencia de datos mediante el méto-
razones de distancia, promedios vecinales y razones do de doble masa y el método del Vector Regional en
promedio se desarrollan a través de fórmulas bási- donde se evidencia que los valores guardan consisten-
investigaciones sociales 402019
cas, mientras que los métodos por correlación con cia entre ellos. Una vez realizado este análisis, se pro-
estaciones vecinas, regresión lineal simple y regresión cedió a completar los datos a través de los métodos
múltiple se aplican bajo ciertas consideraciones esta- antes indicados.
dísticas como el grado de correlación, en tanto que el Los datos de precipitación provienen de cuatro
Vector Regional además de esta consideración se apli- estaciones meteorológicas, y son a paso mensual
ca utilizando el programa Hydraccess. Para verificar (Tabla 1), estos corresponden al período 1984-1997
el mejor método se ha considerado el Coeficiente de ya que las cuatro estaciones consideradas presentan
Determianción (R2), Error Estándar de Estimación datos homogéneos en estos años; en total se anali-
(EEE), test de concordancia de Bland y Altman. zaron 214 datos por estación. Eligiéndose al azar el
98
ANÁLISIS DEL MEJOR MÉTODO PARA COMPLETAR DATOS DE PRECIPITACIÓN EN EL SECTOR ALTO DE LAS CUENCAS DE CAMANÁ Y CHILI, AREQUIPA
Fuente: SENAMHI
13% de los datos, en donde se supuso como datos no bles valores de precipitación, mientras que el resto
existentes (Tabla 2). de los meses no presentan precipitación alguna. Así
Los datos analizados y que fueron retirados co- mismo los datos que luego fueron retirados se con-
rresponden a los mismos años. El procedimiento de sideraron reales puesto que sus valores fueron some-
cálculo de completación de datos faltantes se reali- tidos a un análisis de consistencia, razón por lo cual
zó para los meses comprendidos entre octubre hasta se consideran como el valor real, por lo que fue el
mayo, meses caracterizados por presentar considera- referente para verificar los valores obtenidos.
100
ANÁLISIS DEL MEJOR MÉTODO PARA COMPLETAR DATOS DE PRECIPITACIÓN EN EL SECTOR ALTO DE LAS CUENCAS DE CAMANÁ Y CHILI, AREQUIPA
5. Métodos para completar datos faltantes Para aplicar este método, se estableció una regre-
sión lineal simple, entre los valores de precipitación
investigaciones sociales 402019
5.1. Por regresión lineal de la estación que carecía con parte de su información
y de otras que si contaban con una data completa.
Es un método que presenta gran aceptación, y para Para un mejor análisis las estaciones fueron organiza-
su aplicación es necesario que los datos analizados das desde la 1º, 2º y 3º según su cercanía (Tabla 3).
presenten un buen grado de correlación. Se puede
aplicar tanto a datos diarios, mensuales y anuales.
101
ROBERT RAMOS ALONZO / MIGUEL ALVA HUAYANEY
5.2. Por razones de distancias Tabla 4. Estaciones consideradas para aplicar el método por
razones de distancias.
Este método tiene su aplicación en zonas de relieve
homogéneo en donde dominen las planicies. Y para Estación sin Estaciones con datos completos
obtener mejores resultados las estaciones elegidas tie- datos Estación A Estación B
nen que estar distribuidas en forma lineal (Pizarro, Imata Pillones (20 km) Condoroma (54 km)
1993), y se denota mediante la siguiente ecuación. Pillones El Frayle (12 km) Imata (20 km)
Fuente: Elaboración propia
más próximos (Tabla 4). Para establecer distancias nes para la completación de datos por promedios ve-
entre las estaciones, estas fueron ubicadas sobre una cinales (Pizarro, 1993)
imagen de satélite a una escala apropiada, esta escala Donde; X, A, B y C representan la disposición
ha permitido visualizar con claridad la ubicación de espacial de cuatro estaciones pluviométricas y donde
las estaciones. la estación X es la que presenta carencia de informa-
ción. Dada esta condición para el cálculo de los datos
faltantes, solo fue posible aplicarlo a uno de las cuatro
estaciones (Tabla 5).
102
ANÁLISIS DEL MEJOR MÉTODO PARA COMPLETAR DATOS DE PRECIPITACIÓN EN EL SECTOR ALTO DE LAS CUENCAS DE CAMANÁ Y CHILI, AREQUIPA
Tabla 6. Relación de estaciones para completar datos por el método por razones promedio
Estación sin Estaciones con datos completos
datos (PX) Estación A Estación B Estación N
Condoroma Imata Pillones El Frayle
El Frayle Pillones Imata Condoroma
Imata Pillones El Frayle Condoroma
Pillones El Frayle Imata Condoroma
Fuente: Elaboración propia
5.5 . Por correlación con estaciones vecinas Donde; PXi = valor estimado de precipitación
en X, a partir de las regresiones con cada una de las
En este método se utilizan las precipitaciones esti- estaciones, rXi = coeficiente de correlación entre los
madas a partir de correlaciones entre la estación con registros de la estación X, y cada una de las estacio-
carencia de información y cada una de las estaciones nes consideradas, A, B y N son las estaciones anali-
vecinas a los que se asocian los coeficientes de corre- zadas. Para la aplicación de este método primero se
lación respectivos (Unesco-Rostlac, 1982), su expre- estimó el coeficiente de correlación que es la relación
sión es según la ecuación (5). que existe entre dos variables (entre los datos de la
estación PX y cada una de las otras estaciones), en la
Tabla 7 se presenta el cálculo de los valores entre cada
una de las estaciones.
investigaciones sociales 402019
Tabla 7. Relación de estaciones para aplicar el método por correlación con estaciones vecinas
Estación sin Estaciones con datos completos
datos (PX) Estación A Estación B Estación N
Condoroma Imata Pillones El Frayle
El Frayle Pillones Imata Condoroma
Imata Pillones El Frayle Condoroma
Pillones El Frayle Imata Condoroma
Fuente: Elaboración propia
103
ROBERT RAMOS ALONZO / MIGUEL ALVA HUAYANEY
Tabla 8. Estaciones consideradas para la aplicación del método por regresiones múltiples
Tabla 9. Estaciones consideradas para la aplicación del método del Vector Regional
Estación sin Estaciones con datos completos
datos (PX) Estación A Estación B Estación N
Condoroma Imata Pillones El Frayle
investigaciones sociales 402019
104
ANÁLISIS DEL MEJOR MÉTODO PARA COMPLETAR DATOS DE PRECIPITACIÓN EN EL SECTOR ALTO DE LAS CUENCAS DE CAMANÁ Y CHILI, AREQUIPA
6. Análisis comparativo entre el dato real y los región del país, sin embargo, es necesario aplicar
obtenidos por los diferentes métodos algunos métodos estadísticos para poder establecer
que método es el que mejor estima los datos reales,
Luego de la aplicación de los diferentes métodos, se y estos son: el Coeficiente de Determinación (R2).
obtuvieron los resultados para cada caso, estos fue- Error Estándar de Estimación (EEE); que permite
ron comparados con los datos reales que previamente calcular la disparidad promedio entre los valores
fueron retirados. Los resultados son diversos puesto reales de precipitación y los estimados, en donde
que varios de los métodos son más exigentes para los valores cercanos a cero indican la buena des-
su aplicación, y si bien otros también permiten su cripción de la precipitación (Caro, 2001). Test de
aplicación sin embargo al no pasar por un filtro, sus Concordancia de Bland y Altman (ACBA); se basa
valores se alejan en mayor o menor medida respecto en las diferencias promedio existentes entre el valor
al dato real. Es preciso recalcar que para aplicar estos real y el estimado, y la comparación de las gráficas
métodos los datos de cada estación deben correspon- residuales (Bland y Altman, 1999; Dunn y Roberts,
der a un mismo período de análisis. 1999). La ecuación de test de concordancia es la
En esta primera visión de los resultados se eviden- siguiente:
cia que el mejor estimador es el método del Vector
Regional, seguido del método de regresión múltiple y LC = dp +/-1.96*SD (8)
finalmente el método que presenta un estimador más
bajo es el de Regresión Simple. Donde LC es el límite de concordancia; dp son las
Si bien en una primera revisión se evidencia a diferencias promedio y SD es la desviación estándar.
los mejores métodos para completar datos en esta
105
ROBERT RAMOS ALONZO / MIGUEL ALVA HUAYANEY
7. Resultados
En las tablas desde el 11 hasta la 18 se muestran los valores obtenidos de acuerdo a cada método
estadístico analizado como son el coeficiente de determinación (R2) y el error estándar de estimación
(EEE).
Los resultados siguen un patrón común, aunque presentan ligeras diferencias, por lo que estos
se analizan según cada estación y cada mes.
106
ANÁLISIS DEL MEJOR MÉTODO PARA COMPLETAR DATOS DE PRECIPITACIÓN EN EL SECTOR ALTO DE LAS CUENCAS DE CAMANÁ Y CHILI, AREQUIPA
De acuerdo al análisis según cada mes, se evidencia un claro mejor estimador que es el método
del Vector Regional, seguido del método de regresión múltiple. Sin embargo, según cada mes los
coeficientes de determinación serán mucho más altos en algunos meses respecto a otros, lo mismo
ocurre entre cada estación, de este modo se evidencia que los mejores ajustes presentan la estación
Imata, y los ajustes más bajos presenta la estación Condoroma.
107
ROBERT RAMOS ALONZO / MIGUEL ALVA HUAYANEY
Tabla 19. Valores de test de concordancia para cada metodo de Tabla 21. Valores de test de concordancia para cada metodo de
completación, para la estación Pillones completació, para la estación Imata
En la Tabla 19, se muestra que en la estación En la Tabla 21, se muestra que en la estación
Pillones, el método del Vector Regional es el que me- Imata, el método del Vector Regional es el que más se
jor estima y sus valores son muy parecidos a los da- acerca a los valores reales con una diferencia prome-
tos reales, con una diferencia promedio de 7.95 mm, dio de 6.73 mm, seguido del método de Regresión
seguido del Metodo de Regresión Multiple con 8.03 Múltiple con 8.65 mm, y el método por Regresión
mm y el método de Regresión Lineal es el que pre- Simple es el que presenta los valores más elevados con
senta el valor más alto con 22.45 mm. 15.37 mm.
Tabla 20. Valores de test de concordancia para cada metodo de Tabla 22. Valores de test de concordancia para cada metodo de
completació, para la estación El Frayle completació, para la estación Condoroma.
Metodos ACBA
Metodos ACBA
Regresión Multiple 15.24
Vector Regional 3.10
Vector Regional 24.38
Regresión Multiple 3.36
Estaciones Vecinas 27.92
Estaciones Vecinas 3.82
Razones Promedio 29.91
Razones Promedio 9.75
Razones de Distancia 34.00
Regresión Lineal 13.32 Regresión Lineal 38.00
Fuente: Elaboración propia
Fuente: Elaboración propia
En la Tabla 20, se muestra que en la estación El
Frayle, el método del Vector Regional es el mejor es- En la Tabla 22, se muestra que en la estación
timador, con una diferencia promedio de 3.1 mm, Condoroma, el método de Regresión Multiple es el
seguido del método de Regresión Múltiple con 3.36 que muestra los mejores resultados con una diferen-
mm, y el método por Regresión Simple es el que cia promedio de 15.24 mm, seguido del método del
muestra los valores más altos con 13.32 mm. Vector Regional con 24.38 mm.
investigaciones sociales 402019
ACBA
11.72
ACBA
6
10 7.95 8.03 3.82
3.10 3.36
4
5
2
0 0
Vector Regresión Estaciones Promedios Razones de Razones Regresión Vector Regional Regresión Estaciones Razones Regresión Lineal
Regional Multiple Vecinas Vecinales Distancia Promedio Lineal Multiple Vecinas Promedio
ACBA
8 6.73 20 15.24
6 15
4 10
2 5
0 0
Vector Regresión Razones Razones de Estaciones Regresión Regresión Vector Estaciones Razones Razones de Regresión
Regional Multiple Promedio Distancia Vecinas Lineal Multiple Regional Vecinas Promedio Distancia Lineal
109
ROBERT RAMOS ALONZO / MIGUEL ALVA HUAYANEY
110