Está en la página 1de 57

POR: CÉSAR VIDAL GUTIÉRREZ NINAHUAMÁN

Correo: cesar08_13@Hotmail.com
Cel.: (+51) 966923372
Análisis de la Análisis y
zona de Recopilación validación
estudio de datos estadística de
datos
Función de la magnitud del proyecto y el nivel de
Cantidad planificación.

Calidad Homogéneos, consistentes, precisos?

Tiempo ¿Qué fechas?, ¿Durante cuanto tiempo?, Escala?

¿Dónde? ¿Qué extensión debo cubrir?, ¿Qué distribución?, Si


Lugar no hay suficientes datos en la zona ¿Qué hacer?
Son las observaciones
que proceden de la red
superficial, la unidad de
información básica es la
estación meteorológica.
Un radar meteorológico, o radar
meteo, es un tipo de radar usado
en meteorología para
localizar precipitaciones, calcular
sus trayectorias y estimar sus tipos
(lluvia, nieve, granizo, etc.).
Las observaciones obtenidas a
partir de sensores remotos se TRMM
refiere a una extensa IMERG
superficie, cubre casi toda la WorldClim
superficie terrestre. Utilizan
instrumentos con una
tecnología muy avanzada y
las medidas se realizan desde
satélites o aviones.
Precipitación Radar vs Pluviómetros
Se define como una secuencia de observaciones o datos que han sido
medidos en determinados instantes y sus medidas se organizan
cronológicamente. Las medidas pueden ser en cualquier intervalo de
tiempo, por ejemplo:

 Minutos
 Horas
 Días
 Meses
 Años
 Pp max 24 horas.
HISTOGRAMA DE PRECIPITACION ANUAL
1,600.00
HISTOGRAMA DE PRECIPITACION MENSUAL
1,400.00 450

400
1,200.00
350
Precipitación (mm)

Precipitación (mm)
1,000.00 300

250
800.00 Huancaray
200
Andahuaylas
600.00 Paucaray 150

100
400.00
50

200.00 0
0 100 200 300 400 500
MESES
-
1965 1975 1985 1995 2005
AÑOS
El análisis de series temporales permite definir los períodos de calibración y validación
en la implementación del modelo y descartar estaciones que presentan inconsistencia
en los datos.
a) Conteo de datos disponibles, selección de los periodos de
calibración y validación.
b) Completación y extensión.
c) Análisis de consistencia.
d) Análisis Estadístico.
LONGITUD DE REGISTRO: PRECIPITACION MEDIA MENSUAL
ALTITUD
Nº ESTACION
(msnm)
1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010
1 CHIARA 3400

2 TAMBILLO 3250

3 SACHABAMBA 3540

4 ALLPACHACA 3541

5 CHONTACA 3525

6 PUTACCA 3589
Para la determinación de los datos faltantes se utilizan variados métodos, los
cuales normalmente se basan en fórmulas empíricas, donde se relacionan
determinadas variables hidrológicas que, independientemente de su base
teórica, responden a la estructura de un estudio estadístico. Métodos de
completación de datos faltantes:

Completación por regresión lineal


Completación por razones de distancias
Completación por promedios vecinales
Completación por razones promedio
Completación por correlación con estaciones vecinas
Completación por regresiones múltiples
Otros
Si en una zona cualquiera, la precipitación normal de la estación X, difiere en más de un 10%
con alguna de las estaciones vecinas, entonces es necesario aplicar la ecuación:

Donde:
PX, PA, PB,..., PN = promedio normal de las precipitaciones anuales registradas en un período
común para las N estaciones y la estación X; PA, PB,…PN = precipitación en las N estaciones
durante el período que falta en X.
Cabe señalar que se entiende por precipitación normal, el promedio de los últimos treinta
años; de no contarse con los registros de esta duración, se puede establecer un periodo común
a las estaciones en análisis, que se sugiere sea mayor o igual a 20 años en lo posible.
Este método es uno de los más utilizados; se recomienda para la estimación de datos
mensuales y anuales de la estación en estudio y las de una estación pluviométrica
cercana, que cuente con una estadística consistente y observada. Para ello se requiere
establecer una regresión y correlación lineal entre una estación patrón y la estación
que tenga carencia de información, mediante una ecuación lineal de dos variables (1),
del tipo:

Donde:
Yˆ = Valor estimado de la precipitación para la estación carente (mm).
x = Valor de precipitación registrado en la estación patrón (mm).
a, b = Constantes de regresión.
Consiste en realizar un análisis de la información disponible, mediante
criterios físicos y métodos estadísticos que permitan identificar, evaluar y
eliminar los posibles errores sistemáticos que ha podido ocurrir, sea por
causas naturales u ocasionadas por la intervención de la mano del hombre.
Inconsistencia: Son los errores sistemáticos que se presentan como saltos y
tendencias en las series muestrales.

No homogeneidad: Cambios de los datos originales con el tiempo. La No


Homogeneidad en los datos de Precipitación, se produce por movimiento
de la Estación, cambios en el medio ambiente que rodea la Estación.
Las causas principales de serie de precipitaciones no homogéneas se debe
a:
 Cambio en la localización del pluviómetro.
 Cambio en la forma de exposición o reposición del aparato.
 Cambio en el procedimiento de observación o reemplazo del
operador.
 Construcción de embalses en las cercanías.
 Deforestación y reforestación en la zona.
 Apertura de nuevas áreas de cultivo en los alrededores.
 Desecación de pantanos.
 Industrialización en áreas circundantes.
Análisis gráfico
Análisis de
homogeneidad y
Análisis Doble
consistencia
Masa

Test de Mann-
Kendall
Prueba
estadística de
Análisis estadístico Helmert

Análisis de saltos

Análisis de
tendencias

Corrección de datos
Representación gráfica de la información
hidrometeorológica en el tiempo.
Tiene como objetivo determinar periodos
en los cuales se presenten datos poco
confiables. Se revisa cada estación de
manera independiente.
Se puede revisar la información en campo,
es decir la estación y la serie de
observaciones para justificar posibles
saltos.
400.00 800.00

350.00 700.00

300.00 600.00

250.00 500.00
Prec. (mm)

Prec. (mm)
200.00 400.00

150.00 300.00

100.00 200.00

50.00 100.00

0.00 0.00
0 100 200 300 400 500 0 100 200 300 400 500
Meses Acum. Meses Acum.
Gráfico Nº 32: ANALISIS DE SALTOS (Meses) Gráfico Nº 32: ANALISIS DE SALTOS (Meses)
200.00 250.00

180.00

160.00 200.00

140.00

120.00 150.00
Prec. (mm)

Prec. (mm)
100.00

80.00 100.00

60.00

40.00 50.00

20.00

0.00 0.00
0 50 100 150 200 0 50 100 150 200
Meses Acum. Meses Acum.
Representación acumulada de una misma
variable entre dos estaciones, con respecto a
una estación patrón. La estación patrón
será la que menos quiebres presente en el
análisis de doble masa.
Está conformada por la media aritmética
de todas las estaciones, en periodos comunes
de análisis.
Gráfico Nº 24: ANALISIS DE DOBLE MASA (1992 - 2010)
20,000.0

18,000.0

16,000.0
ESTACIÓN PROBLEMA (ESTACIONES)

14,000.0

12,000.0
Tambillo
Sachabamba
10,000.0
Allpachaca

8,000.0 Chontaca
Putacca

6,000.0 Chiara

4,000.0

2,000.0

-
- 2,000.0 4,000.0 6,000.0 8,000.0 10,000.0 12,000.0 14,000.0 16,000.0 18,000.0
ESTACIÓN BASE (PROMEDIO)
CHIARA TAMBILLO SACHABAMBA ALLPACHACA CHONTACA PUTACCA

Media 661.41 735.71 987.31 822.41 759.95 885.99


Error típico 19.02 25.17 33.11 23.71 43.88 44.31
Mediana 650.60 716.80 995.54 792.40 813.80 840.10
Moda #N/A #N/A #N/A #N/A #N/A #N/A
Desviación estándar 82.90 109.70 144.31 103.35 191.25 193.15
Varianza de la muestra 6872.61 12033.07 20824.20 10681.77 36577.16 37307.98
Curtosis 4.86 1.12 -0.88 0.11 -0.84 -1.49
Coeficiente de asimetría 1.41 0.52 0.33 0.57 -0.27 0.06
Rango 409.05 471.53 499.77 391.20 661.86 587.50
Mínimo 510.50 505.59 791.67 669.20 413.62 595.10
Máximo 919.55 977.12 1291.44 1060.40 1075.48 1182.60
Suma 12566.88 13978.55 18758.83 15625.78 14439.00 16833.73
Cuenta 19.00 19.00 19.00 19.00 19.00 19.00
Gráfico Nº 25: CURVA DOBLE MASA (1992 - 2010) Gráfico Nº 26: CURVA DOBLE MASA (1992 - 2010)
16,000.0 20,000.0

18,000.0
14,000.0
16,000.0
12,000.0
14,000.0

Estacion Sachabamba
Estacion Tambillo

10,000.0
12,000.0

8,000.0 10,000.0

8,000.0
6,000.0
6,000.0
4,000.0
4,000.0
2,000.0
2,000.0

- -
- 2,000.0 4,000.0 6,000.0 8,000.0 10,000.0 12,000.0 14,000.0 - 2,000.0 4,000.0 6,000.0 8,000.0 10,000.0 12,000.0 14,000.0
Estacion Chiara Estacion Chiara
Gráfico Nº 27: CURVA DOBLE MASA (1992 - 2010) Gráfico Nº 28: CURVA DOBLE MASA (1992 - 2010)
18,000.0 16,000.0

16,000.0 14,000.0

14,000.0
12,000.0
12,000.0
Estacion Allpachaca

Estacion Chontaca
10,000.0
10,000.0
8,000.0
8,000.0
6,000.0
6,000.0
4,000.0
4,000.0

2,000.0 2,000.0

- -
- 2,000.0 4,000.0 6,000.0 8,000.0 10,000.0 12,000.0 14,000.0 - 2,000.0 4,000.0 6,000.0 8,000.0 10,000.0 12,000.0 14,000.0
Estacion Chiara Estacion Chiara
Gráfico Nº 29: CURVA DOBLE MASA (1992 - 2010)
18,000.0

16,000.0

14,000.0

12,000.0
Estacion Putacca

10,000.0

8,000.0

6,000.0

4,000.0

2,000.0

-
- 2,000.0 4,000.0 6,000.0 8,000.0 10,000.0 12,000.0 14,000.0
Estacion Chiara
Un box-plot (también conocido como
gráfico de caja y bigotes) es un modo
práctico para mostrar grupos de datos
numéricos, como:
•Valor mínimo y valor máximo
•Cuartil superior y cuartil inferior
•Valores de la mediana
•Valores atípicos y valores extremos
Los espaciados entre las diferentes partes
del box-plot indican el grado de dispersión
y sesgo de los datos e identifican los valores
atípicos.
La prueba de Homogeneidad de Mann-Kendall es un test no
paramétrico, tiene una hipótesis nula sencilla y fácil de satisfacer.
La prueba de Homogeneidad de Mann-Kendall es en realidad un test
estadístico que conduce a elegir alguna de las siguientes respuestas:
Hipótesis nula: Todos los valores de la serie son datos aleatorios de
una sola población (Es una serie Homogénea).
Hipótesis alternativa: Es una serie no homogénea con tendencia
monótona.
La prueba consiste en calcular un índice de desviación S de la serie, y a partir
de este valor calcular el valor de V mediante la relación:
Consiste en analizar el signo de las desviaciones de cada evento de la serie
con respecto a su valor medio. Si una desviación de un cierto signo es
seguida por otra del mismo signo, se crea un cambio S., en contraste, si una
desviación es seguida por otra de signo contrario, se registrará una secuencia
C. cada año, excepto el primero, definirán una secuencia o un cambio.

Si la serie es homogénea, la diferencia entre el número de secuencias y


cambios en el registro deberá ser cero, dentro de los límites de un error
probable, el cual, depende de la longitud del registro n.
Si el número de secuencias es mayor que el número de cambios, algún tipo de
variación en la media o una tendencia en los datos crean la inconsistencia en
el registro. Esta condición se puede deber a un cambio en el emplazamiento
de la estación pluviométrica. Si el número de cambios resulta mayor, alguna
forma de oscilación del valor medio está presente y se requiere de mayor
investigación.
La consistencia en la media se realiza mediante la prueba estadística "T"
de Students y para la desviación estándar el análisis estadístico consiste en
probar, mediante la prueba estadística de "F" de Fisher. Si los parámetros
la media y la desviación estándar de los períodos considerados en el
análisis son iguales estadísticamente, entonces no se corrige la información
de lo contrario se debe corregirse. Después de todo el análisis respectivo la
información es una serie homogénea, confiable y consistente al 95% de
probabilidad.
ANALISIS DE SALTOS

CONSISTENCIA EN LA MEDIA

Tt (5%) Diferencia
Sp Sd Tc Alfa G.L. Comparc.
Tabla Signific.
50.35 6.91 0.66 0.05 226 1.645 Tc < Tt NO es significativo

CONSISTENCIA EN LA DESVIACION ESTANDAR

Fc Ft (5%) Diferencia
Alfa G.L.N. G.L.D. Comparación
Calculado Tabla Signific.
1.18 0.05 83 143 1.28 Fc < Ft NO es significativo
ANALISIS DE TENDENCIA

TENDENCIA EN LA MEDIA
n = 228
Tm = 55.12
t = 114.50
STm = 50.29
St = 65.96
Tm*t = 6054.94

Tc Tt (5%) Diferencia
R B A G.L. Comparc.
Calculado Tabla Signific.
-0.08 -0.059 61.86 -1.17 226 1.645 Tc < Tt NO es significativo

TENDENCIA EN LA DESVIACION ESTANDAR


n = 19
Tm = 51.45
t = 10.00
STm = 7.30
St = 5.63
Tm*t = 505.10

Tc Tt (5%) Diferencia
R B A G.L. Comparc.
Calculado Tabla Signific.
-0.23 -0.296 54.40 -1.02 17 1.96 Tc < Tt NO es significativo
ANALISIS DE SALTOS

CONSISTENCIA EN LA MEDIA

Tt (5%) Diferencia
Sp Sd Tc Alfa G.L. Comparc.
Tabla Signific.
70.01 9.29 1.44 0.05 226 1.645 Tc < Tt NO es significativo

CONSISTENCIA EN LA DESVIACION ESTANDAR

Fc Ft (5%) Diferencia
Alfa G.L.N. G.L.D. Comparación
Calculado Tabla Signific.
1.55 0.05 119 107 1.37 Fc < Ft SI es significativo
CHIARA TAMBILLO SACHABAMBA ALLPACHACA CHONTACA PUTACCA
Media 661.41 735.71 987.31 822.41 623.56 801.75
Error típico 19.02 25.17 33.11 23.71 27.64 36.01
Mediana 650.60 716.80 995.54 792.40 621.22 794.85
Moda #N/A #N/A #N/A #N/A #N/A #N/A
Desviación estándar 82.90 109.70 144.31 103.35 120.50 156.96
Varianza de la muestra 6872.61 12033.07 20824.20 10681.77 14519.89 24636.01
Curtosis 4.86 1.12 -0.88 0.11 2.07 -0.24
Coeficiente de asimetría 1.41 0.52 0.33 0.57 -0.89 0.32
Rango 409.05 471.53 499.77 391.20 535.27 618.27
Mínimo 510.50 505.59 791.67 669.20 296.89 507.42
Máximo 919.55 977.12 1291.44 1060.40 832.16 1125.69
Suma 12566.88 13978.55 18758.83 15625.78 11847.63 15233.30
Cuenta 19.00 19.00 19.00 19.00 19.00 19.00
CHIARA TAMBILLO SACHABAMBA ALLPACHACA CHONTACA PUTACCA
Media 661.41 735.71 987.31 822.41 759.95 885.99
Error típico 19.02 25.17 33.11 23.71 43.88 44.31
Mediana 650.60 716.80 995.54 792.40 813.80 840.10
Moda #N/A #N/A #N/A #N/A #N/A #N/A
Desviación estándar 82.90 109.70 144.31 103.35 191.25 193.15
Varianza de la muestra 6872.61 12033.07 20824.20 10681.77 36577.16 37307.98
Curtosis 4.86 1.12 -0.88 0.11 -0.84 -1.49
Coeficiente de asimetría 1.41 0.52 0.33 0.57 -0.27 0.06
Rango 409.05 471.53 499.77 391.20 661.86 587.50
Mínimo 510.50 505.59 791.67 669.20 413.62 595.10
Máximo 919.55 977.12 1291.44 1060.40 1075.48 1182.60
Suma 12566.88 13978.55 18758.83 15625.78 14439.00 16833.73
Cuenta 19.00 19.00 19.00 19.00 19.00 19.00
CHIARA TAMBILLO SACHABAMBA ALLPACHACA CHONTACA PUTACCA
Media 661.41 735.71 987.31 822.41 623.56 801.75
Error típico 19.02 25.17 33.11 23.71 27.64 36.01
Mediana 650.60 716.80 995.54 792.40 621.22 794.85
Moda #N/A #N/A #N/A #N/A #N/A #N/A
Desviación estándar 82.90 109.70 144.31 103.35 120.50 156.96
Varianza de la muestra 6872.61 12033.07 20824.20 10681.77 14519.89 24636.01
Curtosis 4.86 1.12 -0.88 0.11 2.07 -0.24
Coeficiente de asimetría 1.41 0.52 0.33 0.57 -0.89 0.32
Rango 409.05 471.53 499.77 391.20 535.27 618.27
Mínimo 510.50 505.59 791.67 669.20 296.89 507.42
Máximo 919.55 977.12 1291.44 1060.40 832.16 1125.69
Suma 12566.88 13978.55 18758.83 15625.78 11847.63 15233.30
Cuenta 19.00 19.00 19.00 19.00 19.00 19.00
Preguntas?

También podría gustarte