Está en la página 1de 21

Análisis de Estacionariedad

Waldo Lavado
Basado en e-learning CLIMANDES 1
Algunos aspectos que se verán en los
datos a través del AED y que
probablemente se descubrirán:
• Problemas de datos (valores atípicos,
lagunas en el registro, etc.)
• La variación estacional.
• Patrones regionales y espaciales.
• Correlaciones (entre variables o sitios).
• Patrones temporales (por ejemplo,
tendencia o cambio en la media)
Si se identifica, muchos de los aspectos anteriores
se pueden encontrar en la fase del AED. AED
también puede servir para examinar cuestiones
como la:
• independencia y autocorrelación
• distribución estadística de los valores de los
datos
• detalles de la estructura estacional.
El AED es a menudo útil en la identificación de
problemas de calidad de datos. Sin embargo, no es
un sustituto para un adecuado control de calidad
de los datos.
NIVEL DE
SIGNIFICANCIA

Al plantear un estudio sobre una población, idealmente


debemos estudiar a todos los individuos que la
conforman; pero no siempre podemos acceder a todos,
entonces tenemos que escoger una muestra; sin embargo
los resultados obtenidos de esta manera nunca serán
exactamente iguales, a los que se obtendrían de estudiar
a toda la población; es decir, siempre va a haber un
margen de error.

Sociedad Peruana de Bioestadística


www.bioestadistico.com
Nivel de
Significancia
Antes de realizar el estudio debemos plantearnos; que
proporción de error estamos dispuestos a aceptar para dar por
válido nuestro. El error es el objetivo principal del estudio. El
análisis estadístico consiste en calcular la probabilidad de
cometer este error y esperamos que sea menor al planteado
preliminarmente como nivel significancia.
Nivel de
Confianza
Es la confianza que debemos alcanzar para generalizar el
resultado de una muestra hacia toda la población. Es el
complemento del nivel de significancia; es la confianza que
tenemos, de que la conclusión a la que hemos llegado es cierta.
Una probabilidad elevada nos da la tranquilidad de que lo que
hemos calculado es cercano a lo real y no debida al azar.

Sociedad Peruana de Bioestadística


www.bioestadistico.com
Niveles Convenidos
a) α = 5%
Existe 5% (0.05) de probabilidad de equivocarse y
95% (0.95) de confianza.

b) α = 1%
Existe 1% (0.01) de probabilidad de equivocarse y
99% (0.99) de confianza.

Sociedad Peruana de Bioestadística


www.bioestadistico.com
Definición de Términos
El error tipo I: Ocurre cuando afirmamos la hipótesis del
investigador, siendo que es falsa. Por lo tanto, es un juicio
de valor equivocado..

El p - valor: Es la probabilidad de equivocarse al aceptar


nuestra hipótesis del investigador como verdadera; es decir
la probabilidad de cometer un error tipo I.

El nivel de significancia: Es la máxima probabilidad de


error que estamos dispuestos aceptar para dar como válida
nuestra hipótesis del investigador.

Sociedad Peruana de Bioestadística


www.bioestadistico.com
Tests Paramétricos (TP) y No Paramétricos (TNP)
• La mayoría de test asume que las series de tiempo son
independientes e idénticamente distribuidos.

• TP asume que las series de tiempo y los errores


(desviaciones respecto a la tendencia) sigue una
particular distribución por lo general normalmente
distribuidos. TP son prácticos ya que ellos cuantifican el
cambio en los datos (p.e. cambio en la media o gradiente
de la tendencia). TP son generalmente mas poderosos
que TNP.

• TNP son generalmente de libre distribución


probabilística. Ellos detectan la tendencia/cambio pero
no cuantifican el tamaño de la tendencia/cambio. Ellos
son bastante usados porque la mayoría de series
hidrológicas tiene una distribución no normal.
ANÁLISIS DE INDEPENDENCIA
SERIAL (aleatoriedad)

En la estadística paramétrica se supone que


los datos provienen de observaciones
independientes, cosa que muchas veces no
ocurre en la realidad.
La auto correlación complica la aplicación
de test estadísticos ya que reduce el
numero real de valores a tomar en cuenta
de la muestra. Auto correlación puede
también complicar la correlación entre
series de tiempo
ANÁLISIS DE ESTACIONARIEDAD

El criterio de ESTACIONARIEDAD implica


que los datos deben estar libres de
TENDENCIA durante el periodo de
observación. Una serie de tiempo de datos
hidrológicos, se dice estrictamente
estacionaria, solo si sus propiedades
estadísticas (media, varianza y momentos de
orden superior) no son afectados por la
elección del momento de origen de la serie
de datos (Dahmen y Hall, 1990).
Porque las climatologías son por lo general
calculados en los últimos 30 años?
En resumen, la variabilidad interanual es
bastante alta. Muchos procesos climáticos
tienen largas escalas de tiempo que pueden
influir en décadas enteras de clima. Si se
predice una tendencia con sólo 10 años,
muchos de estos procesos más duraderos no
han tenido tiempo de mostrar su rango
completo de influencia.
Vea lo que sucede con las tendencias previstas
en el gráfico siguiente si se utilizan los últimos
5, 10, 30, 50, 100 o 150 años de datos.
Discusión
¿Es 30 años una buena longitud de
tiempo para usar para calcular las
tendencias?
¿Cuáles son las ventajas y
desventajas de usar una ventana de
tiempo más corta o más larga para
calcular las tendencias?
Propósito de los test de Tendencia
Una serie de tiempo aleatoria de muchas estaciones han
sido recolectados sobre el mismo periodo de tiempo.
Nosotros desearíamos saber si las series de tiempo en
general aumentan o disminuyen.
En términos estadísticos es la determinación si la
probabilidad de distribución que tiene la serie ha
cambiado con el tiempo.
Para eso nosotros debemos describir el valor o tasa de
cambio, en términos de cambio en base algun valor de
distribución central como la media o la mediana.
Resultados espaciales son interesantes para el analisis.
Ejemplos de tendencia (1)

DESCENSO EN LOS CAUDALES DE -0.83% Y DE -0.81%


PARA LAS LLUVIAS Y LOS CAUDALES RESPECTIVAMENTE
Espinoza et al. (2006)
Tendencias significativas en verano (1965-2007) por estaciones
(VERANO)
Azul: positivos; Rojo: négativos
LLUVIA TEMPERATURA EVAPOTRANSPIRACION

Lavado (2010)
TESTS ESTADISTICOS PARA TENDENCIAS
Tests para tendencias
• Mann-Kendall (no- paramétrico)
• Spearman’s Rho (no- paramétrico)
• Regresión Linear (paramétrico)
Tests para cambio en media/mediana
• Distribución Free CUSUM (no- parametrico)
• Cumulative Deviation (paramétrico)
• Worsley Likelihood Ratio (paramétrico)
Tests para diferencia en media/mediana en dos
diferentes periodos de la serie
• Rank-Sum (no-parametrico)
• Student’s t-test (paramétrico)
ATENCION
• Debería tener una buena data y debería entender los
datos (vía análisis exploratorio de datos).

• Debería entender los test estadísticos y sus supuestos.

• Un test estadístico provee evidencia no prueba.

• Significancia no es lo mismo que importancia ( p. e. un


cambio puede ser detectado, pero el tamaño puede ser
bastante pequeño que no es importante en nuestro
análisis).

• Si H0 es rechazado, las razones de la tendencia/cambio


deberían ser investigado.

También podría gustarte