Está en la página 1de 38

Chachapoyas

Escuela Profesional
de Ingeniería Civil

ANÁLISIS DE CALIDAD DE
DATOS
HIDROMETEOROLÓGICOS

Docente: MSc Ana Gabriela Cruz Baltuano


Escuela Profesional
de Ingeniería Civil

¿Cuáles considera que


son las causas del
desplome de este puente?

¿Mal diseño estructural?

¿Mal proceso
constructivo?
¿Temas relacionados al
agua?
Puente Solidaridad, San Juan de
Lurigancho, Lima (2010 – 2017)
Fuente: El Comercio Perú
Escuela Profesional
de Ingeniería Civil

Conocimientos previos
• Tipos de estaciones y variables hidro-
meteorológicas.
• Variabilidad espacial y temporal de las
variables hidro-meteorológicas.
• No estacionariedad de la data.
Escuela Profesional
de Ingeniería Civil ▪ La precipitación pluvial se considera como la variable principal en
los estudios hidrogeológicos, ya que es la fuente fundamental
para el cálculo de balances hídricos y la generación de alertas
tempranas por riesgo de sequía, entre otros.

▪ En varias investigaciones el punto de partida es la estimación de la


lluvia con adecuada resolución espacial y temporal.

▪ Para realizar el análisis de la precipitación se requiere contar con


una base de datos continuos, homogéneos y que abarquen el
máximo intervalo temporal posible.

Introducción
Escuela Profesional
de Ingeniería Civil • La cuantificación de las variables hidrológicas, su variabilidad y su
posible asociación estadística (covariación) requiere la recolección
sistemática de datos, que se desarrollan en el tiempo y el espacio.
• Las muestras más extensas de datos hidrológicos precisos, recolectados
en muchos sitios sobre una cuenca o área geográfica, son el origen de
soluciones efectivas a los diversos problemas del análisis de sistemas de
recursos hídricos.
• El grupo de estaciones de aforo dentro de un área (una provincia, una
región o un país) se conoce como red hidrométrica , cuya densidad
espacial y mantenimiento son esenciales para la calidad y el valor
práctico de los datos hidrológicos.
• Los errores en los datos hidrológicos pueden ser aleatorios o
sistemáticos.
• Los errores aleatorios son inherentes al acto de medir, llevando
consigo la inevitable imprecisión de lecturas y medidas que se
dispersarán en torno al valor verdadero (y desconocido).
• Los errores sistemáticos son el resultado de instrumentos defectuosos
Calidad de o no calibrados, lecturas repetidamente incorrectas, técnicas de
medición inapropiadas o cualquier otra inexactitud proveniente de (o
los datos transmitida por) cualquiera de las fases de detección, transmisión,
registro y procesamiento de datos hidrológicos.
Escuela Profesional
de Ingeniería Civil
• Incertidumbre es una palabra que se usa ampliamente para
caracterizar una condición general donde el conocimiento vago,
imperfecto, impreciso o incompleto de una realidad impide la
descripción exacta de sus estados actuales y futuros.
• Se pide a los científicos e ingenieros que comprendan fenómenos
complejos, que consideren alternativas en competencia y que tomen
decisiones racionales sobre la base de cantidades inciertas.
• Independientemente de las fuentes de incertidumbre, es necesario
evaluarlas y combinarlas, de manera sistemática y lógica, en el marco
de un enfoque científico sólido. El formalismo matemático más
conocido y más utilizado para cuantificar y combinar incertidumbres
está incorporado en la teoría de la probabilidad.
• Desde tiempos remotos, una de las principales funciones de la ciencia
ha sido predecir eventos futuros a partir del conocimiento adquirido a
partir de la observación de eventos pasados.
• La hidrología estadística se ocupa la mayor parte del tiempo de la
variabilidad del muestreo o la incertidumbre del muestreo o incluso los
errores de muestreo, en relación con muestras de variables hidrológicas.
Incertidumbre
SELECCIÓN DE ESTACIONES HIDROMETEOROLÓGICAS

Estación Datos

De acuerdo a la
Extensión suficiente
necesidad

Estimación de registros
Completa Análisis gráfico
faltantes

Consistente Curva de doble masa

Test de
Homogénea Análisis de tendencia
homogeneidad

▪ Estaciones con registros completos (estaciones índices) → lo más cerca posible y de


altitud parecida.
Escuela Profesional
de Ingeniería Civil

ANÁLISIS GRÁFICO

Docente: MSc Ana Gabriela Cruz Baltuano


Escuela Profesional
de Ingeniería Civil ▪ El análisis exploratorio de los datos por medios gráficos se realiza
con el fin de comprobar tendencias y cambios en la serie de
tiempo por medio visual.

▪ Es considerado como el primer análisis a realizar antes de


cualquier análisis confirmatorio (cuantitativo) y, más aún, antes
de utilizar la información hidro-climatológica para modelos y
simulaciones.

▪ Dentro del análisis exploratorio gráfico se recomienda utilizar la


gráfica de serie de tiempo, el diagrama de cajas, la gráfica de
doble masa y la gráfica de normalidad

Introducción
Escuela Profesional
de Ingeniería Civil Gráfica de serie de tiempo (dispersión)

▪ En coordenadas cartesianas se plotea la información hidrológica


histórica, ubicándose en las ordenadas, los valores de las serie; y en
las abscisas, el tiempo.
▪ Son gráficos en los cuales se pueden observar claramente las
tendencias, los cambios, la intermitencia, entre otros.

Análisis ▪ ¿La serie es uniforme?


▪ ¿Entre qué meses ocurre la época de
gráfico lluvias?
▪ ¿Cuáles fueron los años con mayores
precipitaciones?
Escuela Profesional
de Ingeniería Civil Se considera un resumen de la información, ya que brinda una idea
de la tendencia central, la variabilidad, la simetría y la presencia de
puntos atípicos. Para determinar si existe un cambio en la medida
de la tendencia central en la serie hidro-climatológica se divide la
misma en dos o más partes, de tal forma que se pueda observar a
partir del diagrama de cajas de cada una de ellas si existen
diferencias entre las características estadísticas de cada una de las
partes de la serie.

Diagrama de cajas

En el diagrama de cajas se
muestra el percentil 50 (la
mediana), 25 y 75 (limite inferior
y superior de la caja
respectivamente), el menor y el
mayor valor observados sin ser
Análisis considerados atípicos, además de
puntos atípicos (1.5 veces la
gráfico longitud de la caja) y extremos
(3.0 veces la longitud de la caja).
Escuela Profesional
de Ingeniería Civil Consiste en graficar la información en un papel de probabilidad
normal. La transformación más utilizada es la propuesta por Box &
Cox (1964), según la cual si {xt} es una serie cronológica asimétrica
se determinarán los parámetros a y λ, tal es que la serie {yt} después
de la transformación minimice su asimetría:

Gráfica de normalidad

Si la gráfica muestra una línea


recta, indicará que la información
se distribuye normalmente, de
otra manera la información no se
Análisis distribuye siguiendo esta
gráfico distribución y será necesario
realizar una transformación a la
variable.
Escuela Profesional
de Ingeniería Civil

ANÁLISIS DE
CONSISTENCIA

Docente: MSc Ana Gabriela Cruz Baltuano


Escuela Profesional
de Ingeniería Civil Consistencia y Homogeneida d

▪ Inconsistencia: Errores aleatorios.


▪ No homogeneidad: Cambios de los datos originales con el tiempo.

✓ Cambio en la localización del pluviómetro


✓ Cambio en la forma de exposición o reposición del aparato
✓ Cambio en el procedimiento de observación o reemplazo del
operador
✓ Construcción de embalses en las cercanías
Test
p ara m étric os y ✓ Deforestación y reforestación en la zona
n o p ara m étric os ✓ Cambio en uso de suelos

Paramétricas
H om o g en eidad Pru ebas Estad ísticas
N o param é tricas

Introducción Consistencia C u rva de dob le m a sa


Análisis de tendencia
de resid u ales

Xi = ഥ
X + Kiσ
Diferencia
entre
correlación
y regresión
Escuela Profesional Relaciona la precipitación anual acumulada de una estación X (estación que
de Ingeniería Civil se analiza) con el correspondiente valor medio de la precipitación anual
acumulada de un grupo de estaciones vecinas.

La serie de puntos encaja Series de rectas paralelas →


perfectamente en una línea recta proporcionalidad → años
→ proporcionalidad → consistente. medidos en exceso o defecto.

Curva de
doble masa
Dos rectas de diferente Tramo central de mayor o menor
pendiente → error sistemático. pendiente → dicho tramo se
midió incorrectamente.
Escuela Profesional
de Ingeniería Civil

ANÁLISIS DE
HOMOGENEIDAD

Docente: MSc Ana Gabriela Cruz Baltuano


Escuela Profesional Nivel de significancia
de Ingeniería Civil
Antes de realizar el estudio, debemos plantearnos, qué proporción de error
estamos dispuestos a aceptar para dar por válido nuestro estudio. El error es el
objetivo principal del estudio. El análisis estadístico consiste en calcular la
probabilidad de cometer este error, y esperamos que sea menor al planteado
preliminarmente como nivel de significancia.
Nivel de confianza
Es la confianza que debemos alcanzar para generalizar el resultado de una
muestra hacia toda la población. Es el complemento del nivel de significancia. Es
la confianza que tenemos de que la conclusión a la que hemos llegado es cierta.
Una probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es
cercano a lo real y no debida al azar.

α = 5%
Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza
Nivel de
α = 1%
significancia
Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza
y nivel de
confianza Si el valor p es menor que el criterio α de significancia (especificado a priori), se
rechaza la hipótesis nula; en el caso contrario se acepta
Escuela Profesional
de Ingeniería Civil Las características estadísticas de las series hidrológicas, como la media, la
desviación estándar y los coeficientes de correlación serial, se afectan cuando
la serie presenta tendencia en la media o varianza, o cuando ocurren saltos
negativos o positivos; tales anomalías son producidas por la pérdida de
homogeneidad o la inconsistencia.
La homogeneidad es una cuestión importante para detectar la variabilidad de
los datos.
La falta de homogeneidad es en general producida por actividades humanas
tales como la deforestación, apertura de nuevas áreas de cultivo, rectificación
de cauces, construcción de embalses y reforestación.
Las pruebas estadísticas que miden la homogeneidad de unas series de datos
parten de una hipótesis nula y usan una regla para aceptarla o rechazarla.
Hipótesis nula (H0) → Homogeneidad
Hipótesis alterna (H1) → Diferencias

▪ Standard Normal Homogeneity Test (SNHT)


Detectan el año en que
▪ Buishand Range (BR) Test se produce el posible
salto.
Introducción ▪ Pettitt Test
▪ Von Neumann Ratio (VNR) Test
Escuela Profesional
de Ingeniería Civil

El SNHT es sensible a la hora de detectar los saltos cerca del principio y del
final de la serie. Además, esta prueba supone que y i se distribuye
normalmente.
Se utiliza un estadístico T y para comparar la media de los primeros y años
con la de los últimos (n-y) años y puede escribirse como sigue:

Donde:

Standard El año y de posible cambio estará definido si el valor de T es máximo.

Normal Para rechazar la hipótesis nula, el estadística de prueba T 0 es mayor que el


valor crítico, que depende del tamaño de la muestra.
Homogeneity
Test (SNHT)
Escuela Profesional
de Ingeniería Civil

El BRT es sensible a la hora de detectar los saltos en la mitad de la serie.


Además, esta prueba supone que y i se distribuye normalmente.
La suma parcial ajustada se define como:

Cuando la serie es homogénea, el valor de S* y sube y baja en torno a cero.


El año y tiene un salto cuando S* y a alcanzado un ha alcanzado un máximo
(desplazamiento negativo) o un mínimo (desplazamiento positivo).
El rango ajustado re-escalado, R se obtiene mediante:

Buishand El 𝑅Τ 𝑛 se compara con los valores críticos.


Range (BR)
Test
Escuela Profesional
de Ingeniería Civil

El Test de Pettitt es sensible a la hora de detectar los saltos en la mitad de la


serie. Además, esta prueba no supone que y i se distribuye normalmente
porque es una prueba no paramétrica.
Esta prueba se basa en el rango, ri del y i.

El salto ocurrirá en el año y cuando:

El valor se compara entonces con el valor crítico.

Pettitt Test
Escuela Profesional
de Ingeniería Civil

Resumen Se observa en la estación Titijones un salto en el año 1996, que puede producir
un cambio en la medida de tendencia central y también en la varianza
(suposición que puede ser comprobada con el análisis respectivo)
https://doi.org/10.3390/atmos14010146 https://doi.org/10.3390/cli10050064
Escuela Profesional
de Ingeniería Civil

ANÁLISIS DE
TENDENCIA

Docente: MSc Ana Gabriela Cruz Baltuano


Escuela Profesional La detección de cambios en las series hidrológicas juega un papel importante en
de Ingeniería Civil la gestión y planificación modernas de los sistemas de recursos hídricos, ya que
permite comprender mejor el comportamiento temporal del fenómeno
hidrológico subyacente.
La detección de tendencias, periodicidades, puntos de cambio u otros
componentes deterministas de la serie hidrológica debilita el supuesto de
estacionariedad de la variable aleatoria a la que se refiere la serie, lo que a su vez,
afecta la aplicabilidad de los procedimientos técnicos estándar más
comúnmente utilizados en Hidrología Estadística.
Existen varios tipos de pruebas y otros métodos para la detección de cambios,
cada uno con sus propias ventajas y limitaciones. Estos métodos no deben
aplicarse sin considerar las características específicas de la variable hidrológica
bajo análisis.

Introducción
Escuela Profesional ▪ Berger (1986) considera que el teste Mann-Kendall es el método más
de Ingeniería Civil
apropiado para analizar tendencias en series climatológicas. También que
este método permite detectar y localizar el punto aproximado de inicio de
una determinada tendencia.
▪ El test Mann-Kendall es un teste no-paramétrico, sugerido para evaluar la
tendencia en series de datos ambientales. El test consiste básicamente en
la comparación entre los valores que componen una misma serie temporal,
en orden secuencial.
▪ La prueba de Mann-Kendall tiene la hipótesis nula H0: {sin tendencia en la
serie hidrológica Xt}.
Xj representa los datos estimados de la
secuencia de valores, n representa el
tamaño de la serie temporal. Reciben valor
cero (0) si (Xj - Xk) = 0; y [-1] si (Xj - Xk) > 0,
finalmente, [1] si (Xj - Xk) < 0.

▪ La prueba de Mann - Kendall esta basada en la estadística S. Si el numero


de pares positivos es P, y el numero del tipo de pares negativos es M,
entonces la S es definida como S = P − M.
Mann – ▪ Para n> 10, se puede definir una estadística Z que sigue la distribución
estándar normal donde:
Kendall
Escuela Profesional
de Ingeniería Civil
▪ El valor Z es el parámetro de salida del test Mann-Kendall.
▪ Considerando un nivel de significancia α = 0.05:
✓ Cuando el valor absoluto de Z sea igual que 0 la hipótesis nula al nivel de
5% será aceptada, sin tendencia (Ts).
✓ Caso contrario, se seguirán los siguientes criterios:

▪ Verificar que las series no estén autocorrelacionadas, de lo


contrario, habría que aplicar modificaciones al test.

Si:

Mann – La serie es independiente

Kendall ▪ De existir tendencia, esta se debería corregir; teniendo suficiente cuidado


con el concepto de no estacionariedad.
Escuela Profesional ▪ TREND está diseñado para hidrólogos, científicos ambientales, consultores e
de Ingeniería Civil investigadores para facilitar las pruebas estadísticas de tendencia, cambio y
aleatoriedad en datos de series de tiempo.
▪ TREND está diseñado para facilitar las pruebas estadísticas de tendencia,
cambio y aleatoriedad en datos hidrológicos y otras series de tiempo.
▪ TREND tiene 12 pruebas estadísticas.

Herramienta
TREND
Escuela Profesional
de Ingeniería Civil

ESTIMACIÓN DE DATOS
FALTANTES

Docente: MSc Ana Gabriela Cruz Baltuano


Escuela Profesional
de Ingeniería Civil ▪ La precipitación pluvial se considera como la variable principal en los estudios
hidrogeológicos, ya que es la fuente fundamental para el cálculo de balances
hídricos y la generación de alertas tempranas por riesgo de sequía, entre
otros.
▪ En varias investigaciones el punto de partida es la estimación de la lluvia con
adecuada resolución espacial y temporal.
▪ Para realizar el análisis de la precipitación se requiere contar con una base de
datos continuos, homogéneos y que abarquen el máximo intervalo temporal
posible.
▪ Lamentablemente, frecuentemente, las bases de datos con que se cuenta
presentan importantes huecos de información debidos a la ausencia de
lectura, falla del instrumento de registro, error de transcripción, etcétera, lo
que limita su análisis y constituye una fuente de error, dado que las
conclusiones de cualquier estudio que se realice sobre esos datos serán
erróneas.
▪ Existen numerosos métodos para efectuar el completado de valores faltantes
en una serie pluviométrica.
▪ En la guía de prácticas climatológicas de la Organización Meteorológica
Mundial (WMO, 1983) se proponen métodos estadísticos para el relleno de
valores faltantes, como regresión lineal, de la razón y la razón normal.
▪ El método de regresión lineal simple es uno de los métodos tradicionales
Introducción más utilizados para estimar los valores de datos faltantes de precipitación y
temperatura (mensuales y anuales).
Los métodos de regresión no consideran las características físicas y geomorfológicas de las
Regresión Lineal cuencas hidrográficas y sus implicaciones sobre los resultados obtenidos, solo hacen
consideraciones estadísticas.

Regresión Simple Regresión Múltiple

El caso más simple de regresión lineal La regresión lineal múltiple se basa en


ajusta a la ecuación de la recta los valores obtener una relación lineal entre un
de la variable independiente X1 a la conjunto de variables independientes
variable dependiente Y. X1,..,Xn con una variable dependiente Y.

Y = b0 + b1X1 Y = b0 + b1X1 + b2X2 + b3X3 + ··· + bnXn

El éxito de determinar una correlación


El ajuste a esta ecuación (mediante
lineal múltiple es que exista una buena
mínimos cuadrados) se caracteriza por la
correlación lineal simple de cada variable
obtención de b0, b1 y el coeficiente de
independiente con la variable
correlación r.
dependiente.
Escuela Profesional
de Ingeniería Civil Para determinar lo conveniente de la inferencia estadística, se calcula el
coeficiente de correlación lineal y la eficiencia estadística.
Limitaciones: Tanto la recta de regresión como el coeficiente de correlación no
son robustos, en el sentido de que resultan muy afectados por medidas
particulares que se alejan mucho de la tendencia general.
Método de correlación lineal
▪ Coeficiente de correlación de Pearson:
σxy: covarianza
σx: desviación típica de x
σy: desviación típica de y

Si se toma en cuenta que el valor del


coeficiente de correlación (r) se calcula con
base en una muestra relativamente pequeña,
se considera que es únicamente una
estimación del valor poblacional y, por tanto,
es necesario investigar si existe la posibilidad
de que r=0. Para ello se emplea el siguiente
Regresión expresión:

lineal simple Para un nivel de confianza


de 95%: ZC = 1.645.
Si Z ≥ ZC no hay posibilidad
de que r=0.
Escuela Profesional
▪ Aun cuando la correlación entre los registros x y y sea mayor de 0.80, es
de Ingeniería Civil
recomendable investigar hasta qué punto es provechoso utilizar el registro
más amplio para incrementar el otro, dado que puede suceder que los valores
inferidos discrepen mucho de la realidad.
▪ La eficiencia estadística, E, ayuda a determinar si mejora el valor medio del
registro y, y con ello si conviene hacer la inferencia.
▪ Si el valor de E resulta mayor que 1, no mejorará en nada el registro de las yi, en
cambio, si E es menor que 1, convendrá hacer la inferencia de los valores
faltantes a partir de las xi.
▪ La eficiencia estadística se calcula con la siguiente expresión:
m: número total de datos de y.
n: número total de datos de x.
r: coeficiente de correlación.

Regresión
lineal simple
Escuela Profesional
de Ingeniería Civil
El modelo de regresión lineal múltiple es idéntico al modelo de regresión lineal
simple, con la única diferencia de que aparecen más variables explicativas.
Se recomienda para estimación de datos mensuales y anuales de la estación en
estudio, en base a datos pluviométricos consistentes de estaciones cercanas.
Limitaciones: Es más recomendable que el método de regresión lineal, pero
siempre que se cuente con estaciones cercanas y confiables.

Regresión
lineal
múltiple
Últimas tendencias
El Big Data comprende, la adquisición, el almacenamiento, la
validación, el procesamiento y el análisis de los mismos para extraer
el conocimiento que “esconden” (patrones de comportamiento),
facilitando la toma de decisiones.

Por lo tanto, se podría disponer de gran cantidad de datos para


alimentar modelos hidrológicos.

También se puede utilizar la ciencia de datos para la aplicación de


inteligencia artificial en la completación de datos y análisis
predictivos.
Chachapoyas

También podría gustarte