Este documento describe diferentes métodos estadísticos para analizar datos hidrológicos, incluyendo pruebas paramétricas como la prueba t de Student y el método de dobles masas. Explica que las pruebas paramétricas estiman parámetros de una población con base en muestras y que el método de dobles masas detecta inconsistencias en series de datos comparándolas con otras estaciones para corregirlas aplicando un coeficiente. También provee ejemplos del uso de estas técnicas.
Este documento describe diferentes métodos estadísticos para analizar datos hidrológicos, incluyendo pruebas paramétricas como la prueba t de Student y el método de dobles masas. Explica que las pruebas paramétricas estiman parámetros de una población con base en muestras y que el método de dobles masas detecta inconsistencias en series de datos comparándolas con otras estaciones para corregirlas aplicando un coeficiente. También provee ejemplos del uso de estas técnicas.
Este documento describe diferentes métodos estadísticos para analizar datos hidrológicos, incluyendo pruebas paramétricas como la prueba t de Student y el método de dobles masas. Explica que las pruebas paramétricas estiman parámetros de una población con base en muestras y que el método de dobles masas detecta inconsistencias en series de datos comparándolas con otras estaciones para corregirlas aplicando un coeficiente. También provee ejemplos del uso de estas técnicas.
Los procesos hidrolgicos evolucionan en el espacio y en el tiempo en una
forma que es parcialmente predecible, o determinstica, y parcialmente aleatoria. Un proceso de este tipo se conoce con el nombre de proceso estocstico. En algunos casos la variabilidad aleatoria del proceso es tan grande comparada con la variabilidad determinstica, que se justifica que el hidrlogo trate el proceso como puramente aleatorio. De esta manera, el valor de una observacin del proceso no est correlacionada con los valores de observaciones adyacentes, y las propiedades estadsticas de todas observaciones son iguales. Cuando no existe correlacin entre observaciones adyacentes, la salida de un sistema hidrolgico es tratada como estocstica, independiente del espacio e independiente del tiempo, en el esquema de clasificacin mostrado en la figura 1.4.1.
Este tipo de tratamiento es apropiado para observaciones de eventos
hidrolgicos extremos, como crecientes o sequias, y para informacin hidrolgica promediada a lo largo de intervalos de tiempo grandes, como la precipitacin anual. Este tema describe informacin hidrolgica de procesos enteramente aleatorios utilizando parmetros y funciones estadsticos. Los mtodos estadsticos estn basados en principios matemticos que describen la variacin aleatoria de un conjunto de observaciones de un proceso, y estos centran su atencin en las observaciones mismas en lugar de los procesos fsicos que las producen. La estadstica es una ciencia de descripcin, no de casualidad. PRUEBAS ESTADISTICAS PARAMETRICAS Se llaman as porque su clculo implica una estimacin de los parmetros de la poblacin con base en muestras estadsticas. Mientras ms grande sea
la muestra ms exacta ser la estimacin, mientras ms pequea, ms
distorsionada ser la media de las muestras por los valores raros extremos
SUPOSICIONES QUE SUBYACEN A LA UTILIZACIN DE LAS PRUEBAS
PARAMTRICAS.
El nivel de medicin debe ser al menos de intervalo. Debemos tomar
una decisin a cerca de nuestra variable dependiente. Es realmente un nivel de intervalo? Si es una escala no estandarizada, o si se basa en estimaciones o calificaciones con humanos. Frecuentemente aparecen como intervalo pero lo reducimos a nivel ordinal al darles rango. Los datos de la muestra se obtienen de una poblacin normalmente distribuida. Este principio suele mal entenderse como: la muestra debe distribuirse normalmente, "no es as". La mayora de las muestras son demasiado pequeas para siquiera parecerse a una distribucin normal, la cual solo obtiene su caracterstica en forma de campana con la acumulacin de muchas puntuaciones. La varianza de las 2 muestras no son significativamente diferentes, esto se conoce como el principio de homogeneidad de la varianza. Los especialistas en estadstica han investigado ms sobre ese requisito, el cual saba exigir varianzas muy similares. Estos se ignoran cuando tratamos con muestras relacionadas sin gran riesgo de distorsionar nuestro resultado. Para muestras no relacionadas necesitamos ser ms cuidadosos cuando los tamaos de las muestras sean bastante diferentes.
ALGUNAS PRUEBAS PARAMTRICAS
Prueba del valor Z de la distribucin normal
Prueba T de Student para datos relacionados (muestras dependientes)
Prueba T de Student para datos no relacionados (muestras
independientes) Prueba T de Student-Welch para dos muestras independientes con varianzas no homogneas Prueba de ji cuadrada de Bartlett para demostrar la homogeneidad de varianzas Prueba F (anlisis de varianza o ANOVA).
PRUEBA ESTADSTICA T DE STUDENT
Cuando la prdida de homogeneidad es un abrupto cambio en la media, esta prueba es muy til y poderosa para detectar este tipo de inconsistencias. Para obtener mejores resultados, se recomienda que la muestra total se divida en dos partes con tamaos iguales para que las medias sean muy similares. Se considera que una muestra es homognea si el valor del estadstico td de la prueba t de Student que se calcula con la ecuacin 3.1, resulta menor o igual al estadstico tc de la distribucin t de Student de dos colas del cuadro 3.1 y con n1+n2 -2 grados de libertad.
Ecuacin 3.1
Para ejemplificar su aplicacin se presenta el anlisis realizado a los
registros de precipitaciones mximas en 24 horas de la estacin climatolgica Amecameca. De los datos de la tabla 1.19 se obtuvieron los siguientes valores:
Nmero de registros = 37 Tamao de la primera muestra n1 = 18
Media de la primera muestra
Desviacin estndar de la primera muestra S 1= 12.20
Tamao de la segunda muestra n2 = 19
Media de la segunda muestra
Desviacin estndar de la segunda muestra S 2= 12.44
Grados de libertad = 35
X 1 = 40.94
X 2 = 37.14
Aplicamos la siguiente ecuacin para la prueba estadstica t de
student segn los datos anteriores
Ecuacin 3.1
t d=
40.9437.14
1812.20 +1912.44 1 1
+ 18+192 18 19
)]
1 2
t d=0.9123
Sustituyendo los valores en la ecuacin 3.1, se obtiene td=0.9123. Con el
valor de los grados de libertad se entra al cuadro 3.1 para determinar el valor del estadstico tc de la distribucin t de Student, el cual resulta de 2.0315. Como td < tc, se concluye que la muestra es homognea. Los resultados de los anlisis de los registros de precipitaciones mximas en 24 horas de las estaciones climatolgicas y de los registros de gastos mximos anuales de las estaciones hidromtricas, se presentan en la tabla 3.1. En ella se observa que todas las muestras de las estaciones climatolgicas resultaron homogneas, as como los registros de gastos mximos de la estacin hidromtrica San Lucas, mientras que los registros de las estaciones San Marcos y Los Reyes son no homogneas.
MTODO DE DOBLES MASAS
El test de corridas solo permite detectar heterogeneidades. Ms no permite corregirlas. Con el mtodo de doble masas adems de detectar inconsistencias en la informacin permite corregirlas. Se analiza la consistencia de una serie de valores de algn elemento hidrometeorolgico medido en la estacin "X". Con base en los datos tomados en otra estacin o grupo de estaciones "Y", situadas en una zona climtica similar y cuya homogeneidad haya sido verificada. Este. Sistema de homogeneizacin de series. Se utiliza cuando puede suceder un cambio relativo en la variable observada, medida o registrada en una estaci6n meteorolgica. El mtodo puede ser aplicado tambin, con mucho xito en la interpelacin para el relleno de datos faltantes y la extrapolacin para extender una serie incompleta al periodo de comparaci6n (normalmente de 30 aos). (Searcy J. &Hardison h. 1983, traducido por Barrero & Sabogal.). Si se toma por caso la precipitacin, en el anlisis de dobles masas se compara la lluvia anual o mensual (valores acumulados), con la precipitacin anual o mensual, acumulada de otra estacin o grupo de estaciones. Graficando estas dos variables se observa si se presenta un cambio de pendiente, el cual solo puede deberse a causas diferentes a las meteorolgicas. Con el fin de ilustrar el procedimiento, se analizarn los datos pluviomtricos anuales de la estacin "X", con los obtenidos en las estaciones A, B Y C durante el periodo 1951-1970, las cuales se hallan ubicadas en condiciones climatolgicas anlogas a las de la estacin problema. Para cada una de las estaciones de referencia (A, B Y C) se suman las precipitaciones anuales de ao en ao empezando por el ms reciente (en este caso 1970), luego se obtienen los promedios de estos valores acumulados y esta serie se toma como base de comparacin (ver datos en la tabla 22). En casos extremos, cuando slo existe una estacin de referencia los datos acumulados de esta serie pueden servir como base de comparacin, aunque en estos casos el mtodo puede llegar a no tener ninguna significacin. Luego se aplica tambin la acumulacin a la estacin problema y. se construye un diagrama cartesiano, tomando como abscisas los valores acumulados de la serie base y como ordenadas los de la estacin problema. Si todos los puntos aparecen sobre una lnea recta, los datos iniciales de la estacin problema son vlidos sin correccin.
En caso de presentarse cambio de pendiente es necesario reestablecer la
homogeneidad bajo las condiciones del tramo ms confiable, generalmente es el primero, o sea el correspondiente al ltimo periodo y realizar el ajuste con base en la relacin de las pendientes de los dos segmentos de la curva de dobles masas. La relacin proporciona una constante K, que multiplicada por los valores inconsistentes de la estacin analizada X, permite el ajuste de la serie. La curva representada en la Figura 44, muestra un quiebre a partir del dcimo primer valor; siguiendo el procedimiento descrito, se han obtenido las pendientes de los dos tramos y se ha calculado el coeficiente K=1.65.
En la Tabla 22 aparecen los datos corregidos a partir del dcimo
primer valor y el nuevo acumulado una vez realizado el ajuste.
Determinacin de la homogeneidad de los estados de precipitacin en la
estacin X con los registros en las estaciones A, B, y C por el mtodo de dobles masas. Tabla 22. Datos de precipitacin. Curva de doble masas
En la Figura 44, la lnea de trazos se ha construido con los nuevos valores
acumulados y constituye una prolongacin del primer tramo, con lo cual se tiene evidencia de haber obtenido un buen ajuste. Como ejemplo se tomar el mismo caso de la desviacin meteorolgica de la Universidad del Valle, a la cual le haremos la prueba de doble masas con las estaciones meteorolgicas de los ingenios Manuelita, Cauca, y la estacin de Florida, todas ellas, ubicadas en la zona plana del Valle geogrfico del ro Cauca, es decir todas las estaciones estn localizadas dentro de una zona' homognea fisiogrficamente. Y climticamente hablando. En este ejemplo se trabajar con tres estaciones, siendo recomendable un mayor nmero de estaciones.
La informacin se presenta en la Tabla 23. Al graficar la informacin, se
observa que la lnea acumulada de los datos de precipitacin de las estaciones involucradas no presenta un quiebre apreciable, razn por la cual se concluye que a pesar de existir la presencia de rboles en los alrededores de la estacin meteorolgica de la Universidad del Valle, esta no representa hasta el momento del anlisis una fuente de heterogeneidad.