Está en la página 1de 45

Pruebas no paramétricas Hidrología estadística

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS


(Universidad del Perú, Decana de América)
FACULTAD DE CIENCIAS FISICAS
ESCUELA ACADEMICO PROFESIONAL DE INGENIERIA MECANICA DE
FLUIDOS

PRUEBAS NO PARAMETRICAS

HIDROLOGIA ESTADISTICA

CIUDAD UNIVERSITARIA 2019

PROFESOR DEL CURSO: Ing. Gastelo Villanueva, Jorge


ESTUDIANTES:
 Atincona Choque Ángel 14130126
 Gómez Cusi Luigi 14130151
 Inocente Gomero Javier Alfredo 15130044
 Mendoza Cotrina Diego Gabriel 15130073
 Vergara Calderón Eva Cecilia 14130061

1
Pruebas no paramétricas Hidrología estadística

Índice

Introducción 3

Objetivos 3

Marco teórico 4

Prueba De Anderson-Darling 5

Prueba Binomial 9

Prueba De Mann-Kendall 11

Prueba De U De Mann-Whitney 16

Prueba De Kruskal-Wallis 20

Prueba De Los Signos 24

Prueba De Rangos Y Signos De Wilcoxon 26

Prueba De Wald-Wolfowitz 31

Coeficiente De Correlación De Spearman 38

Conclusiones 42

Bibliografía 42

2
Pruebas no paramétricas Hidrología estadística

Introducción

Las técnicas estadísticas de estimación de parámetros, intervalos de confianza y prueba de


hipótesis son, en conjunto, denominadas ESTADÍSTICA PARAMÉTRICA y son aplicadas
básicamente a variables continuas.

Estas técnicas se basan en especificar una forma de distribución de la variable aleatoria y


de los estadísticos derivados de los datos.

En ESTADÍSTICA PARAMÉTRICA se asume que la población de la cual la muestra es extraída


es normal o aproximadamente normal. Esta propiedad es necesaria para que la prueba de
hipótesis sea válida. Sin embargo, en un gran número de casos no se puede determinar la
distribución original ni la distribución de los estadísticos por lo que en realidad no tenemos
parámetros a estimar. Tenemos solo distribuciones que comparar. Esto se llama
ESTADÍSTICA NO-PARAMÉTRICA.

Objetivos

 Conocer las diferencias, ventajas y desventajas entre las pruebas paramétricas y no


paramétricas
 Conocer y saber determinar cuándo es necesario poder aplicar las pruebas no
paramétricas en un análisis estadístico
 Conocer los diferentes procedimientos de los métodos no paramétricos tratados
en el siguiente informe como la prueba de wilcoxon, Spearman, Wald-Wolfowitz,
etc.
 Plantear correctamente los datos hidrológicos y poder analizarlos por medios de
las siguientes pruebas no paramétricas para poder obtener la información
requerida.

3
Pruebas no paramétricas Hidrología estadística

Marco teórico

Pruebas No Paramétricas

Definición:

Las pruebas no paramétrica es una rama de la estadística inferencial que estudia las


pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados
criterios paramétricos. Su distribución no puede ser definida a priori, pues son los datos
observados los que la determinan. La utilización de estos métodos se hace recomendable
cuando no se puede asumir que los datos se ajusten a una distribución conocida, cuando
el nivel de medida empleado no sea, como mínimo, de intervalo .

En el siguiente trabajo explicaremos a mayor profundidad las siguientes pruebas:

 Prueba De Anderson-Darling
 Prueba Binomial
 Prueba De U De Mann-Whitney
 Prueba De Kruskal-Wallis
 Prueba De Los Signos
 Prueba De Rangos Y Singos De Wilcoxon
 Prueba De Wald-Wolfowitz
 Coeficiente De Correlación De Spearman

4
Pruebas no paramétricas Hidrología estadística

PRUEBA DE ANDERSON-DARLING:

Definición:

La prueba de Anderson-Darling es una prueba estadística que permite determinar si una


muestra de datos se extrae de una distribución de probabilidad. En su forma básica, la
prueba asume que no existen parámetros a estimar en la distribución que se está
probando, en cuyo caso la prueba y su conjunto de valores críticos siguen una distribución
libre. Sin embargo, la prueba se utiliza con mayor frecuencia en contextos en los que se
está probando una familia de distribuciones, en cuyo caso deben ser estimados los
parámetros de esa familia y debe tenerse estos en cuenta a la hora de ajustar la prueba
estadística y sus valores críticos. Cuando se aplica para probar si una distribución normal
describe adecuadamente un conjunto de datos, es una de las herramientas estadísticas
más potentes para la detección de la mayoría de las desviaciones de la normalidad.

Condiciones para usar la prueba de Anderson-Darling

En una prueba no paramétrica sobre si los datos de una muestra provienen de una


distribución específica. La fórmula para el estadístico A determina si los datos  

{ y1 < ⋯ ⋯ ⋯ ⋯< Y n }

(observar que los datos se deben ordenar) vienen de una distribución con función
acumulativa F

Donde:
N
2∗K −1
S= ∑ ∗¿
K =1 N

El marco estadístico de la prueba se puede entonces comparar contra las distribuciones


del estadístico de prueba (dependiendo que F se utiliza) para determinar el valor de P.

5
Pruebas no paramétricas Hidrología estadística

Problema Aplicativo (Anderson-Darling)

Luego de un estudio de la Cuenca Rio Santa, se tienen las precipitaciones mensuales generadas
(mm), desde el año hidrológico 1953-54 hasta 2000-01.

Se quiere saber si existe una distribución normal o no, de las precipitaciones de los meses de
marzo desde el año 1958-59 hasta 1987-88.

AÑO MARZO
1958-59 170.79
1959-60 107.42
1960-61 151.16
1961-62 192.29
1962-63 247.3
1963-64 96.04
1964-65 250.96
1965-66 76.52
1966-67 184.67
1967-68 123.91
1968-69 121.41
1969-70 109.82
1970-71 250.54
1971-72 263.48
1972-73 184.15
1973-74 209.1
1974-75 246.36
1975-76 187.38
1976-77 112.01
1977-78 113.37
1978-79 204.71
1979-80 154.19
1980-81 227.16
1981-82 148.13
1982-83 178.82
1983-84 312.34
1984-85 159.3
1985-86 113.47
1986-87 151.68
1987-88 111.49

6
Pruebas no paramétricas Hidrología estadística

SOLUCIÓN:

Plantamos la Hipótesis nula y alternativa.

H0: Las precipitaciones en el mes de marzo desde 1958-59 a 1987-88 siguen una
distribución normal.
Ha: Las precipitaciones en el mes de marzo desde 1958-59 a 1987-88 no siguen una
distribución normal.
De los datos obtenemos la desviación estándar y la media.

MEDIA 171.999
DESV. EST. 59.2988

  FÓRMULA
Precipitación(mm) ESTANDARIZACIÓN DE Distribució Ordenadas DE
N° Ordenadas de LOS DATOS n Normal 1-F(Yi) de menor a ANDERSON-
menor a mayor   F(Yi) mayor DARLING

1 76.52 -1.61013 0.05368 0.94632 0.00897 -7.63801


2 96.04 -1.28095 0.10011 0.89989 0.06145 -15.27318
3 107.42 -1.08904 0.13807 0.86193 0.09150 -21.85718
4 109.82 -1.04857 0.14719 0.85281 0.09267 -30.06333
5 111.49 -1.02041 0.15377 0.84623 0.10207 -37.38987
6 112.01 -1.01164 0.15586 0.84414 0.10492 -45.24720
7 113.37 -0.98870 0.16140 0.83860 0.17613 -46.28503
8 113.47 -0.98702 0.16182 0.83818 0.26577 -47.19629
9 121.41 -0.85312 0.19680 0.80320 0.29060 -48.64362
10 123.91 -0.81096 0.20869 0.79131 0.36611 -48.86258
11 148.13 -0.40252 0.34365 0.65635 0.39767 -41.79549
12 151.16 -0.35142 0.36264 0.63736 0.41540 -43.53613
13 151.68 -0.34265 0.36593 0.63407 0.41882 -46.89069
14 154.19 -0.30033 0.38196 0.61804 0.45421 -47.29376
15 159.3 -0.21415 0.41521 0.58479 0.50813 -45.12321
16 170.79 -0.02039 0.49187 0.50813 0.58479 -38.62776
17 178.82 0.11503 0.54579 0.45421 0.61804 -35.86218
18 184.15 0.20491 0.58118 0.41882 0.63407 -34.94018
19 184.67 0.21368 0.58460 0.41540 0.63736 -36.52779
20 187.38 0.25938 0.60233 0.39767 0.65635 -36.19249
21 192.29 0.34218 0.63389 0.36611 0.79131 -28.28778
22 204.71 0.55163 0.70940 0.29060 0.80320 -24.18683

7
Pruebas no paramétricas Hidrología estadística

23 209.1 0.62566 0.73423 0.26577 0.83818 -21.84524


24 227.16 0.93022 0.82387 0.17613 0.83860 -17.37904
25 246.36 1.25400 0.89508 0.10492 0.84414 -13.73342
26 247.3 1.26986 0.89793 0.10207 0.84623 -14.00572
27 250.54 1.32449 0.90733 0.09267 0.85281 -13.59262
28 250.96 1.33158 0.90850 0.09150 0.86193 -13.44959
29 263.48 1.54271 0.93855 0.06145 0.89989 -9.62712
30 312.34 2.36667 0.99103 0.00897 0.94632 -3.78745

30

∑ (2 i−1) [ LnF ( Y i) + ln (1−F ( Y n+1−i ) ) ]=−915.140773


i=1

Para n=30

N
( 2i−1 )
A2n =−∑
n [
LnF ( Y i ) + ln ( 1−F ( Y n +1−i ) ) ] −n
i=1

A2=0.50469242

Según la tabla de Anderson-Darling para un nivel de confianza de 95% y para una prueba
de normalidad, tenemos:

0.50469242<0.757

- Se rechaza la Ha en favor a la nula. Por lo tanto los datos de las precipitaciones en


el mes de marzo desde 1958-59 a 1987-88 se ajustan a una distribución normal.

8
Pruebas no paramétricas Hidrología estadística

PRUEBA BINOMIAL:

Definición:

El procedimiento Prueba binomial compara las frecuencias observadas de las dos


categorías de una variable dicotómica con las frecuencias esperadas en una distribución
binomial con un parámetro de probabilidad especificado. De forma predeterminada, el
parámetro de probabilidad para ambos grupos es 0,5. Para cambiar las probabilidades,
puede introducirse una proporción de prueba para el primer grupo. La probabilidad del
segundo grupo será 1 menos la probabilidad especificada para el primer grupo.

Estadísticos. Media, desviación estándar, mínimo, máximo, número de casos no perdidos y


cuartiles.

CONDICIONES PARA SU USO:


1. Experimento que se repite “n” veces (ensayos).
2. Este ensayo debe tener 2 posibles resultados.
3. Las probabilidades de esos 2 resultados tienen que ser siempre constante, eso quiere
decir que en cada ensayo las probabilidades de un resultado y del otro tiene que ser
el mismo siempre(constante).

P( X =r )= n ∗pr∗qn −r
()
r

Donde: q=1-r

X=variable

r= el valor que toma la variable

n=número de ensayos a realizar

9
Pruebas no paramétricas Hidrología estadística

Ejemplo:
En una empresa de distribución de agua al pueblo de Manchay , el 5% de esta sale con
impurezas por la contaminación. Determinar la probabilidad de una muestra de 12, se
encuentran 2 con impurezas.

Solución:

X= n° de repartición de agua con impurezas.

r=2

n=12
5
p=5% = = 0.05
100
q=1-P = 1-0.05=0.95

ahora que identificamos, lo reemplazamos en la ecuación de distribución binomial:

P(X =2)= 12 ∗0.052∗0.9512−2 =0.0988=9.8% donde es la probabilidad que al tener 12


( )
2
distribuciones de agua 2 de estas traigan impurezas en sus aguas

10
Pruebas no paramétricas Hidrología estadística

PRUEBA DE MANN-KENDALL

Definición:

En el análisis de tendencias en series hidrometeorológicas destaca el uso de la prueba no


paramétrica de Mann-Kendall, es una prueba basada en rangos, la cual es muy similar a
coeficiente de correlación de Spearman. Esta prueba ha sido ampliamente aplicada en
estudios de identificación de tendencias en series hidrometeorológicas y otras series
ambientales.

La prueba de Mann-Kendall se resume como:

1. Se listan los valores de las variables de forma ordenada (Q1, Q2, …, Qn).

2. Se obtiene el signo de la diferencia de cada par de valores al comparar sus


magnitudes (Qj - Qk) con (j>k) de acuerdo con lo siguiente:

1 si ( Q j−Qk ) > 0

{
signo ( Q j−Qk ) = 0 si ( Q j−Q k ) =0
−1 si ( Q j−Q k ) < 0 }
3. Obtención del estadístico S de Mann-Kendall, mediante la ecuación anterior:
n−1 n
S=∑ ∑ signo ( Q j −Qk )
k=1 j=k +1
Si S es positivo, se infiere de forma subjetiva que la tendencia es creciente, cuando
S es negativo, se infiere que hay tendencia decreciente.

4. Con base a los indicadores se estima una varianza para el estadístico S de Mann-
Kendall, que considera el caso de los empates 𝑠𝑖𝑔𝑛𝑜 𝑄𝑗−𝑄𝑘=0 obtenidos en el paso
2, mediante la ecuación:

g
Var [ S ] =
1
18 [
n ( n−1 )( 2 n+5 ) −∑ t i (t i−1)(2 t i +5)
i=1
]
Donde n es el tamaño de muestra, g es el número de grupos de medidas que
tienen igual valor y ti es el número de vínculos en el grupo i. Mann definió la
varianza de series que no incluyen vínculos, y Kendall realizó el ajuste del segundo
término de la ecuación (S) (McCuen, 2002). Kendall señala que la aproximación
normal de la ecuación Zmkdebe proporcionar decisiones precisas para muestras
tan pequeñas como 10, pero generalmente es aplicada cuando N≥30. Para
tamaños de muestra menores a 30, se puede utilizar el estadístico 𝜏 cuando la serie
no incluye vínculos.
2S
τ=
n ( n−1 )

11
Pruebas no paramétricas Hidrología estadística

Gibbons, 1976 citado por McCuen (2002) menciona que la ecuación anterior no
debe ser utilizada cuando la serie incluye datos de la misma magnitud, en tales
casos, se puede aplicar una corrección para las relaciones.

5. Cálculo del estadístico ZMK.


El valor de la prueba estadística Z MK de la muestra se calcula con la ecuación 1.39 y
un nivel de significancia (α) seleccionado, con esto la hipótesis nula puede ser
probada.

S−1
si> 0

{ }
1
2
[Var ( S ) ]
Z MK = 0 si S=0
S−1
1
si< 0
2
[Var ( S ) ]

6. A partir de estadístico ZMK se evalúa la hipótesis de interés, que puede ser:


a) H0: No hay tendencia vs H1: Hay tendencia decreciente
b) H0: No hay tendencia vs H1: Hay tendencia creciente

Los valores críticos del estadístico 𝜏 de Kendall se obtuvieron de la tabla a


continuación:

12
Pruebas no paramétricas Hidrología estadística

Para muestras grandes y con una prueba de dos colas, la hipótesis nula H0 es
rechazada si ZMK es mayor que 𝑍∝2 o menor que −𝑍∝2 de la distribución Normal
Estándar para un nivel de significancia (α).

La prueba de Mann-Kendall identifica las tendencias ascendentes o descendientes, pero


no las cuantifica. En 1968 un método desarrollado por Sen (1968) permite el cálculo de la
pendiente de regresión para un parámetro en un punto de muestreo sin que el mismo se
vea afectado por la presencia de covariantes, como es el caso de la regresión paramétrica.
El estimador de pendiente de Sen es un procedimiento no paramétrico que estima
cambios por unidad de tiempo en una serie cuando existe en ella tendencia lineal. Para N
pares de datos, la pendiente de Sen se estima como:
x j−x k
Qi=
j−k
Donde:
i= 1, …, N.
𝑥𝑗−𝑥𝑘 son datos en los tiempos j y k (j>k), respectivamente.
La mediana de los N valores de 𝑄𝑖 es el estimador de pendiente de Sen.

13
Pruebas no paramétricas Hidrología estadística

Problema Aplicativo( Mann – Kendall)

Tomando la Estación hidrometrica 26224 Tamuin, para la cual tendremos un analisis de de


tendencia de la serie de gastos maximos anuales, para un nivel de significancia   5%

Estaciones hidrométricas seleccionadas para el estudio

Qmax Qmax Qmax


AÑO (m³/s) AÑO (m³/s) AÑO (m³/s)
1954 2240 1972 1292 1989 692
1955 3386 1973 1676 1990 1645
1956 1737 1974 2689 1991 2500
1957 587 1975 2103 1992 1498
1958 2009 1976 3230 1993 3749
1959 730 1977 1660 1994 925
1960 821 1978 1792 1995 1417
1961 1171 1979 1160 1996 1629
1962 465 1980 1045 1997 1006
1963 1253 1981 1330 1998 978
1964 464 1982 348 1999 1170
1965 928 1983 1420 2000 855
1966 1683 1984 1840 2001 1595
1967 1963 1985 1121 2002 894
1968 940 1986 814 2003 1221
1969 1957 1987   2004 817
1970 1856 1988 1479 2005 1054
1971 1235     2006 383

14
Pruebas no paramétricas Hidrología estadística

 Para el análisis estadístico S, tomamos la ecuación:


n−1 n
S=∑ ∑ signo ( Q j −Qk )
k=1 j=k +1

De la cual obtenemos un valor negativo S   204 donde inferimos que hay tendencia
decreciente.

 Para la obtención del valor  , tomar en cuenta el valor de n  56

2S 2  (204)
 
n(n  1) 56  (55)
   0.148
 Analizando la varianza
g
Var [ S ] =
1
18 [
n ( n−1 )( 2 n+5 ) −∑ t i (t i−1)(2 t i +5)
i=1
]
Var [ S ]= 16995.3

 Para el P- valué se tendrá un valor de


P  value  0.119
CONCLUSIÓN
  Prueba de Mann - Kenndall
Codigo Tau S Var(S) P-Value
26224 -0.148 -0.204 16995.33 0.119

Para la Prueba de Mann – Kendall , el P-value será mayor que el nivel de significancia
  5%
H
por lo tanto no podemos rechazar nuestra Hipótesis Nula o . Concluyendo que la prueba
presenta ausencia de tendencia en la serie de gastos máximos anuales de la estación
26224 Tamuin y se comprueba que la serie es homogénea y estacionaria.

15
Pruebas no paramétricas Hidrología estadística

PRUEBA DE U DE MANN-WHITNEY:

Definición:

En estadística la prueba de la U de Mann-Whitney (también llamada de MannWhitney-


Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon- Mann-Whitney) es
una prueba no paramétrica aplicada a dos muestras independientes. Es la versión no
paramétrica de la habitual prueba t de Student.

Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaños y
extendido a muestras de tamaño arbitrario como en otros sentidos por Henry B. Mann y D.
R. Whitney en 1947.

Condiciones para usar la prueba de U de Mann-Whitney

La prueba de Mann-Whitney se usa para comprobar la heterogeneidad de dos muestras


ordinales. El planteamiento de partida es:

1. Las observaciones de ambos grupos son independientes.


2. Las observaciones son variables ordinales o continuas.
3. Bajo la hipótesis nula, la distribución de partida de ambos grupos es la misma: P(X
> Y) = P(Y > X)
4. Bajo la hipótesis alternativa, los valores de una de las muestras tienden a exceder a
los de la otra: P(X > Y) + 0.5 P(X = Y) > 0.5.

Cálculo Estadístico:
Para calcular el estadístico U se asigna a cada uno de los valores de las dos muestras su
rango para construir (de menor a mayor, siendo el menor de rango 1, el siguiente 2 y así
sucesivamente).

n 1( n1+ 1)
U =n1 n2+ −R1
2
n 1(n1+ 1)
U =n1 n2+ −R2
2

donde n1 y n2 son los tamaños respectivos de cada muestra; R1 y R2 es la suma de los


rangos de las observaciones de las muestras 1 y 2 respectivamente.

El estadístico U se define como el mínimo de U1 y U2.

16
Pruebas no paramétricas Hidrología estadística

Los cálculos deben tener en cuenta la presencia de observaciones idénticas a la hora de


ordenarlas (en este caso se suma los rangos de las posiciones idénticas y se divide entre la
cantidad de éstas).

Distribución del estadístico:

La prueba calcula el llamado estadístico U , cuya distribución para muestras con más de 20
observaciones se aproxima bastante bien a la distribución normal. La aproximación a la
normal, z , cuando tenemos muestras lo suficientemente grandes viene dada por la
expresión:

z=(U−mU )/σ U

Donde m U y σ U son la media y la desviación estándar de U si la hipótesis nula es cierta, y


vienen dadas por las siguientes fórmulas:

m U =n 1 n2 /2

n 1 n2 (n 1+ n2+ 1)
σU =
√ 12

17
Pruebas no paramétricas Hidrología estadística

Ejemplo Aplicativo: (Mann-Whitney)


Se maneja datos de las precipitaciones mensuales generadas por la cuenca del Río Santa (en
mm), de 47 años (1953 – 2000).
Para los años hidrológicos 1962-63 y 1963-1964:

Se quiere calcular si en estos años existieron diferencias estadísticamente significativas.

Empleando un nivel de confianza de 95% y un nivel de significación de 0.05

SE OCT NOV DIC ENE FEB MAR ABR MA JU JU AG


T Y N L O
1961- 8.2 19 202.4 182.6 243.5 96.77 192.2 58.77 20.8 0 0 0
62 5 2 9 5 9 8
1962- 0 58.2 58.15 79.02 244.0 191.0 247.3 141.0 10.7 0 0 0
63 5 7 4 3 5

SOLUCIÓN:

Planteamos la hipótesis nula e hipótesis alternativa.

H0= No existen diferencias estadísticamente significativas de las precipitaciones anuales de los


años hidrológicos 1961-62 y 1962-63.

Ha= Sí existen diferencias estadísticamente significativas de las precipitaciones anuales de los


años hidrológicos 1961-62 y 1962-63.

Ordenando los valores e introduciendo el rango correspondiente, tenemos:

1961-62 Rango 1962-63 Rango


8.25 8 0 4
19 10 58.25 13
202.42 21 58.15 12
182.69 18 79.02 15
243.55 22 244.07 23
96.77 16 191.04 19
192.29 20 247.3 24
58.77 14 141.03 17
20.88 11 10.75 9
0 4 0 4
0 4 0 4
0 4 0 4

RANGO 1 152 RANGO 2 148

18
Pruebas no paramétricas Hidrología estadística

Hallamos el valor de U:

Para n1 =n2=12

n 1( n1+ 1)
U =n1 n2+ −R1
2
12(12+1)
U =12× 12+ −152
2
U =70
n 1(n1+ 1)
U =n1 n2+ −R2
2
12(12+1)
U =12× 12+ −148
2
U =74
Escogemos el U menor =70

Para 2 muestras, con un nivel de confianza de 95 % y un α =0.05

Se observa:

U menor >U tabla

Se rechaza la hipótesis alternativa (Ha) en favor a la hipótesis nula (Ho):

∴ NO existen diferencias estadísticamente significativas de las precipitaciones


anuales de los años hidrológicos 1961−62 y 1962−63.

19
Pruebas no paramétricas Hidrología estadística

20
Pruebas no paramétricas Hidrología estadística

PRUEBA DE KRUSKAL-WALLIS:

En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un


método no paramétrico para probar si un grupo de datos proviene de la misma población.
Es una extensión de la prueba de la U de Mann-Whitney para 3 o más grupos.

Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume normalidad


en los datos. Sí asume, bajo la hipótesis nula, que los datos vienen de la misma
distribución.
Una forma común en que se viola este supuesto es con datos heterocedásticos (cuando
la varianza del error condicional a las variables explicativas es constante a lo largo de las
observaciones).

Condiciones para usar la prueba de Kruskal-Wallis

1. Trabaja con un diseño para grupos independientes que emplea k número de


muestras.
2. Método que se usa como sustituto para el ANOVA paramétrico, cuando los
supuestos de ANOVA son seriamente violados.
3. No supone normalidad en la población ni homogeneidad de varianza.
Se requiere una escala Ordinal.
4. Sigue la distribución chi-cuadrado.

12
K
R2j
H= ∑ −3( N +1)
N (N +1) J =1 n j

N es la cantidad total de datos que se obtiene, k es la cantidad de grupos, Rj son los


rangos de cada grupo.

Grado de libertad:
g .l =k −1

Al tener el grado de libertad y ubicándolo en la tabla de valores críticos chi-cuadrado, para


el caso respectivo.

21
Pruebas no paramétricas Hidrología estadística

 Si valor cr í tico ≤ H rechazamos la hipótesis nula en favor de la hipótesis alternativa.

NOTA: las hipótesis son hipótesis bilaterales, ya que está basada en la desigualdad, osea
queremos diferencias significativas.

En la tabla chi-cuadrado contiene valores bilaterales ( α =0.05 ), en caso de hipótesis


unilaterales dividimos el nivel de significanción, esto es α =0.025 .

22
Pruebas no paramétricas Hidrología estadística

Ejemplo Aplicativo: (Kruskal-Wallis)


Teniendo como datos las precipitaciones mensuales de la cuenca del Río Santa (desde 1953 al
2000). Lo que se pretende es conocer si, en los meses de Enero-Febrero-Marzo, éstos años
hidrológicos son estadísticamente diferentes entre sí.

ENERO FEBRERO MARZO


1980-81 196.05 208.78 227.16
1981-82 269.12 232.06 148.13
1982-83 222.46 49.59 178.82
1983-84 152.73 249.08 312.34

Empleando un nivel de confianza de 95% y un nivel de significación de 0.05

SOLUCIÓN:

Hipótesis estadísticas:

H0= No existen diferencias estadísticamente significativas entre dichos años hidrológicos.

Ha= Existes diferencias estadísticamente significativas entre dichos años hidrológicos.

Ordenando los valores e introduciendo el rango:

1980-81 1981-82 1982-83 1983-84


196.05 5 269.12 11 222.46 7 152.73 3
208.78 6 232.06 9 49.59 1 249.08 10
227.16 8 148.13 2 178.82 4 312.34 12
RANGO 1 19 RANGO 2 22 RANGO 3 12 RANGO 4 25

Hallamos el valor de H: (N=12)

12
K
R2j
H= ∑ −3(N +1)
N (N +1) J =1 n j

12 192 222 122 252


H=
12(12+1) 3 [+
3
+
3
+
3
−3 ×(12+1) ]
H=2.3846
Ahora vamos a calcular el grado de libertad:

gl=k −1
gl=4−1=3

23
Pruebas no paramétricas Hidrología estadística

Tabla de distribución Chi-cuadrado:

Según tabla para un gl=3 y un α =0.05 tenemos un valor crítico de 7.815

Como el valor crítico es mayor que el obtenido (7.815> H ) rechazamos la hipótesis alternativa
( H a ) en favor a la hipótesis nula( H 0 ).
∴ No existen diferencias estadísticamente significativas entre dichos años hidrológicos .
(Para un nivel de confianza de 95% y un nivel de significación α =0.05 )

Según el estudio de Inversión Pública a Nivel de Perfil: "RECUPERACIÓN DE LOS SERVICIOS


ECOSISTÉMICOS DE REGULACIÓN HÍDRICA, EN LAS CUENCAS ALTA, MEDIA Y BAJA DE LOS RÍOS
FORTALEZA Y SANTA, EN LAS PROVINCIAS DE RECUAY Y BOLOGNESI – REGIÓN ANCASH”.
FEBRERO – 2017

PRECIPITACIÓN MEDIA MENSUAL (mm)


CUENCA RIO SANTA
Luego de un estudio de alrededor de 47 años (1953-2001)

24
Pruebas no paramétricas Hidrología estadística

PRUEBA DE LOS SIGNOS

Definición:

Es una prueba no paramétrica que tiene como propósito contrastar dos grupos
relacionados o emparejados, partiendo de la hipótesis de que ambos provienen de
poblaciones iguales.

Formulas a Emplear

Zcritico : Interceptar nivel de confianza con el de Significancia

Zcalculado :
X−N . P
√ N . P .q
Donde

X = N(+) - P
- N : Numero de Pruebas
- P, q = Relación Porcentual de Probabilidad Optima

Variables

- Nivel de Confianza : Ne = 1 – α
Ha = Hipótesis Alternativa
- Ho = Hipótesis Nula (contrarresta a Ha)
- µ = Factor de Correlación
- α = Nivel de Significancia
- Ne = Nivel de Confianza
- N= Numero de Pruebas

Aplicación de la Prueba de Signos


Tomaremos una estación meteorológica de la cuenca del Rio Santa, tomando los años
hidrológicos 1962 – 63 y 1963 – 64, tomando en cuenta que la precitación media es 85 mm

Vamos a calcular si existe diferencias significativas

SE OCT NOV DIC ENE FEB MAR ABR MA JU JU AG


T Y N L O
1961- 8.2 19 202.4 182.6 243.5 96.77 192.2 58.77 20.8 0 0 0
62 5 2 9 5 9 8
1962- 0 58.2 58.15 79.02 244.0 191.0 247.3 141.0 10.7 0 0 0
63 5 7 4 3 5

25
Pruebas no paramétricas Hidrología estadística

26
Pruebas no paramétricas Hidrología estadística

Solución
DATOS

Ha > 85 Ho = 85 µ = 85

N = 24 , Ne = 1 – 0.05 = 95 % = 0.95

  SET OCT NOV DIC ENE FEB MAR ABR MAY JUN JUL AGO
1961-62 - - + + + + + - - - - -
1962-63 - - - - + + + + - - - -

De la tabla obtengo los números de pruebas positivos y negativos

N (+) = 9 , N (-) = 15  N(+) + N(-) = N

Tendremos una campana de gauss, relacionando los valores de mi hipótesis alternativa

Zcritico será la intercepción de Ne con α, Zcritico = 1.695

Calculando el

Zcalculado =
X−N . P
√ N . P .q
Al tener dos casos posibles los valores de P y q serán del 50% cada una P = 0.5 q = 0.5
X = N(+) - P

X= 9 – 0.5 = 8.5
8.5−24. 0.5
Zcalculado =
√ 24.0 .5 .0 .5
Zcalculado = -4.928

Conclusión

El Zcalculado se encuentra en la zona de hipótesis nula, por tanto, Ho la voy a aceptar y la


Ha la voy a rechazar, demostrando que no existe una diferencia significativa entre los años
hidrológicos 1961-62 y 1962-63

27
Pruebas no paramétricas Hidrología estadística

PRUEBA DE RANGOS Y SINGOS DE WILCOXON

Definición:

La prueba de rangos y signos de Wilcoxon es una prueba no paramétrica las cuales se usan
para poder comparar poblaciones, esta prueba es una alternativa a la prueba t de Student
cuando no se puede suponer la normalidad de las poblaciones. Es una prueba para
comparar el rango medio de dos muestras relacionadas y determinar si existen diferencias
entre ellas. 

La prueba de wilcoxon se utiliza para comparar dos muestras relacionadas y por lo tanto
no necesita una distribución específica. Usa más bien el nivel ordinal de la variable
dependiente. Se utiliza para comparar dos mediciones relacionadas y determinar si la
diferencia entre ellas se debe al azar o no.

Condiciones para usar la prueba de rangos con signo de wilcoxon

 Los datos de las muestras que analizaremos tienen que ser independientes y
ordinales
 Esta prueba se recomienda a usar en vez de la prueba t-student ya que es su
equivalente no paramétrico cuando hay valores atípicos, no hay normalidad de los
datos o el tamaño de las muestras es pequeño.
 A diferencia de la prueba de T de student la prueba de rangos de signos de
Wilcoxon trabaja con medianas, no con medias.

Procedimiento:

1. Hipótesis: primero planteamos la hipótesis que queremos verificar con la prueba


de rangos y signos de wilcoxon
2. Cálculo de las diferencias y los rangos
3. Cálculo del estadístico W

W =min ⁡¿

W+ = suma de los rangos con signo positivo


W− = suma de los rangos con signo negativo

28
Pruebas no paramétricas Hidrología estadística

4. Calculamos el P valor. –

(n)(n+1)
W−
4
Z=
n(n+ 1)(2 n∗1)
√ 24

Una vez ha obtenido el valor del estadístico W, se puede calcular cuál es la probabilidad de
que adquiera valores iguales o más extremos que el observado.

Si el tamaño n < 25, se compara el valor obtenido de W con los valores de una tabla
Wilcoxon. Si W cae dentro del intervalo correspondiente en la tabla para ese n, la
diferencia NO es significativa.

Si n > 25 se puede asumir que W se distribuye de forma aproximadamente Normal,


rechazando H0 si Z calculado es menor que el valor de Z para el α

29
Pruebas no paramétricas Hidrología estadística

Ejemplo

Se tienen los datos del caudal medio anual del rio Ebro desde los años 1951 hasta 1988 si
se sabe que en el año 1969 se finalizo el complejo de embalses de Mequineza y Ribarroja,
se desea saber si produjo un cambio significativo del caudal medio anual después de la
construcción de los embalses.

Análisis:

Como observamos en el siguiente ejemplo podemos observar que nos piden comparar el
comportamiento del caudal medio de anual a lo largo de 34 años teniendo en cuenta que
a los 17 años del comienzo de la toma de datos se terminó la construcción de un conjunto
de embalses el cual queremos ver si genero una alteración significativa en el caudal medio
anual de la cuenca

30
Pruebas no paramétricas Hidrología estadística

Desarrollo:

Paso 1: primero digitamos los datos antes y después de la construcción de la represa para
poder empezar a realizar la prueba

Antes Después
468 501
436 465
226 457
412 610
254 403
287 385
436 429
896 287
728 496
701 568
569 537
486 312
347 300
587 241
431 448
482 381

Paso 2: Procedemos a hallar la diferencia del antes y después y luego ponemos los rangos
correspondientes a cada uno de los valores obtenidos

Antes Despues Diferencia Rango


468 501 -33 5
436 465 -29 3
226 457 -231 13
412 610 -198 12
254 403 -149 10
287 385 -98 7
436 429 7 1
896 287 609 16
728 496 232 14
701 568 133 9
569 537 32 4
486 312 174 11
347 300 47 6
587 241 346 15
431 448 -17 2
482 381 101 8

31
Pruebas no paramétricas Hidrología estadística

Paso 3: procedemos a crear la hipótesis nula y la hipótesis alterna

H0: no hay variación significativa estadísticamente de las 2 muestras

Ha: si hay variación significativa estadísticamente de las 2 muestras

Paso 4: procedemos a hallar la suma de los rangos con signos positivos y negativos y
escogemos el menor valor de ambos

Suma de rangos positivo 84

suma de rangos negativos 52

Paso 5:
como la cantidad de datos con la que estamos trabajando es de 16 no es necesario utilizar
la ecuación de P valor la cual según la norma es de 25 datos como mínimo, procedemos a

Conclusión:

Como nuestro valor W es de 52 y el valor critico en la tabla de wilcoxon para 16 datos con
un nivel de significancia de 5% es de 30 concluimos que no podemos rechazar la hipótesis
nula eso quiere decir que los valores de los caudales medios anuales no han variado
significativamente

32
Pruebas no paramétricas Hidrología estadística

Conceptos previos a la Prueba de Wald-Wolfowitz


La independencia implica que ninguna observación de la serie de datos influye en las
observaciones posteriores. Incluso si los sucesos de una serie son aleatorios, podrían no
ser independientes. Los grandes almacenamientos naturales en la cuenca de un río, por
ejemplo, pueden hacer que los flujos altos estén seguidos de flujos altos, y los flujos bajos,
de flujos bajos. La dependencia varía con el intervalo entre elementos sucesivos de la
serie: la dependencia entre valores sucesivos del flujo diario tiende a ser grande, mientras
que la dependencia entre los valores máximos anuales es generalmente pequeña.

Estacionalidad significa que, excluyendo las fluctuaciones aleatorias, la serie de datos es


invariante con respecto al tiempo. La no-estacionalidad puede consistir en tendencias,
saltos o ciclos. En el análisis de crecidas, los saltos se deben generalmente a un cambio
abrupto en una cuenca fluvial o un sistema fluvial, como la construcción de una presa. Las
tendencias pueden estar causadas por cambios graduales de las condiciones climáticas o
del uso de la tierra, como en el caso de la urbanización. Los ciclos pueden estar asociados a
oscilaciones del clima en largos períodos.

PRUEBA DE WALD-WOLFOWITZ

Dada una muestra N de datos, la prueba Wald- Wolfowitz evalúa los parámetros de
independencia y estacionalidad sin importar si el orden de los datos es aleatorio o no. Allí
el valor estadístico R es calculado a partir de la siguiente ecuación:
n−1
R=∑ ( x i∗x i+1 ) + ( x i ¿ x N )
i=1

Cuando los elementos de la prueba son independientes, R sigue una distribución normal
con media y varianza dadas por las siguientes ecuaciones:

s21−s 2
Ŕ=
N −1

s 22−s 4 4 2 2
2 ( s 1 −4 s1 s 2 + s 2−2 s 4 )
var ( R )= − Ŕ +
N −1 ( N−1)(N−2)
Con:

N= número de registros

Y
n
Sk =∑ xik
i=1

Además, el valor estadístico |u| se obtiene como:

R− Ŕ
|u|=
√ var ( R )
33
Pruebas no paramétricas Hidrología estadística

Consideraciones:

 El valor estadístico |𝑢| de cada una de las estaciones debe ser menor que el valor
crítico del nivel de significación que se escoja y que se ajuste mejor a las finalidades del
estudio; dependiendo del valor crítico de cada nivel de significación si el valor de u de
cada estación es menor, se acepta la hipótesis de independencia y estacionalidad.

 Nivel de Significación: Los valores críticos para una distribución normal estándar se
relacionan en la siguiente tabla
Tabla. Valores del Nivel de Significación

Valores críticos del nivel de significación


para una distribución Normal Estándar
α α/2 Z
1% 0.005 2.58
5% 0.025 1.96
10% 0.05 1.64

Para el desarrollo del presente proyecto se utilizará el nivel de significación del 5 %,


dada la finalidad académica del estudio y la necesidad de utilizar la mayor cantidad
de estaciones hidrométricas posibles.

EJEMPLO DE APLICACIÓN

Queremos conocer el comportamiento de los datos recopilados de la Estación “La Virginia”


pertenecientes a la Cuenca Magdalena-Cauca y verificar si la utilización de estos datos es
confiable.
Se adjunta la Tabla de la Estacion “La Virginia”

34
Pruebas no paramétricas Hidrología estadística

ESTACI CODIGO NOMBRE


ON
2617703 La
0 Virginia
N° Año ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC
1 1946 252 901 591
2 1947 765 566 358 304 467 559 483 566 566 1047 1216 1145
3 1948 371 283 505 873 775 787 333 256 188 490 981 553
4 1949 775 668 581 534 914 760 696 550 313 911 1512 1183
5 1950 1073 1553 1553 1500 1728 1709 1269 602 364 753 1450 1578
6 1951 898 1210 784 615 948 826 615 317 371 717 1215 1009
7 1952 681 552 460 846 1250 722 400 394 387 1120 1468 1452
8 1953 887 620 573 876 1112 817 838.9 726 332 1151 1226 1362
9 1954 1290 631 1202 1371 1169 1198 745 512 527 1422 1666 1710
10 1955 1497 1061 1007 1202 950 1483 750 415 436 1215 1193 1193
11 1956 1038 478 640 871 1272 1134 421 255 184 504 868 962
12 1957 424 344 280 734 837 560 304 344 234 294 768 837
13 1958 784 366 285 597 1058 880 834 422 272 795 768 759
14 1959 1414 1190 584 843 1208 572 567 327 325 491 1394 1430
15 1960 573 592 589 1168 840 990 821 321 206 366 1154 786
16 1961 534 498 750 950 1230 1044 637 455 268 744 916 1058
17 1962 689 1013 843 1234 1382 883 612 469 248 387 1193 680
18 1963 713 504 332 913 930 1165 910 589 544 900 1061 1020
19 1964 907 515 315 1121 1328 665 292 362 227 956 1290 1107
20 1965 629 321 418 520 818 798 464 370 325 557 1279 1446
21 1966 1279 716 950 798 1090 1068 575 398 222 827 1320 1094
22 1967 623 920 734 1104 750 853 605 578 405 1044 1256 1351
23 1968 590 500 380 1280 1490 890 500 270 450 1040 1140 700
24 1969 620 650 870 930 1420 1030 530 370 410 1310 1600 1438
25 1970 1650 1330 2182 2150 1486 1753 831 601 660 1013 1663 871
26 1971 988 1219 860 783 1257 1002 692 366 349 457 853 731
27 1972 379 217 266 404 625 638 495 866 1074 1212 2102 1589
28 1973 1414 1563 1709 1303 1227 753 583 400 591 1103 1490 1700
29 1974 828 1088 1219 762 1295 1568 1402 697 708 1193 1585 2036
30 1975 1527 759 717 1088 1106 725 488 309 281 700 1002 481
31 1976 347 211 264 490 570 578 410 353 476 895 1206 513
32 1977 780 309 591 1189 1110 776 565 281 234 614 828 1067
33 1978 620 378 652 1434 1061 1119 427 546 745 1168 1418 990

35
Pruebas no paramétricas Hidrología estadística

Dentro de la solución del test, se debe tener claro que se evaluarán los parámetros de
independencia y estacionalidad.

En primera instancia se deben organizar los datos de manera ascendente de acuerdo con el
año de registro. Una vez organizados se debe encontrar la sumatoria para el cálculo de R,
donde se tiene:

N° Año Caudal (XiXi+1) 28 1973 1709 3479524


X (1)
máx 29 1974 2036 3108972
1 1946 901 1095616 30 1975 1527 1841562
2 1947 1216 1192896
31 1976 1206 1433934
3 1948 981 1483272
32 1977 1189 1705026
4 1949 1512 2612736
5 1950 1728 2099520 33 1978 1434
X (66)
N= 33 6453403
2
Con la ecuación
n−1
R=∑ ( x i∗x i+1 ) + ( x i∗x n )
i=1

Se aclara:

N° Año Cauda (XiXi+1)


l máx
1 1946 901 109561
6
2 1947 1216 119289
6

( x i∗x i+1 ) =( 901∗1216 )=1095616


De la cual se obtiene posteriormente:

R=( 64534032 )+ ( x33∗x 1 )

R=( 64534032 )+ (1434∗901 )

R=65826066

Se presenta la tabla de resultados obtenidos para la Estación “La Virginia”.

36
Pruebas no paramétricas Hidrología estadística

N° Año Caudal (XiXi+1) X X2 X3 X4


máx
1 1946 901 1095616 901 811801 731432701 6.59021E+11
2 1947 1216 1192896 1216 1478656 1798045696 2.18642E+12
3 1948 981 1483272 981 962361 944076141 9.26139E+11
4 1949 1512 2612736 1512 2286144 3456649728 5.22645E+12
5 1950 1728 2099520 1728 2985984 5159780352 8.9161E+12
6 1951 1215 1783620 1215 1476225 1793613375 2.17924E+12
7 1952 1468 1999416 1468 2155024 3163575232 4.64413E+12
8 1953 1362 2329020 1362 1855044 2526569928 3.44119E+12
9 1954 1710 2559870 1710 2924100 5000211000 8.55036E+12
10 1955 1497 1904184 1497 2241009 3354790473 5.02212E+12
11 1956 1272 1064664 1272 1617984 2058075648 2.61787E+12
12 1957 837 885546 837 700569 586376253 4.90797E+11
13 1958 1058 1512940 1058 1119364 1184287112 1.25298E+12
14 1959 1430 1670240 1430 2044900 2924207000 4.18162E+12
15 1960 1168 1436640 1168 1364224 1593413632 1.86111E+12
16 1961 1230 1699860 1230 1512900 1860867000 2.28887E+12
17 1962 1382 1610030 1382 1909924 2639514968 3.64781E+12
18 1963 1165 1547120 1165 1357225 1581167125 1.84206E+12
19 1964 1328 1920288 1328 1763584 2342039552 3.11023E+12
20 1965 1446 1908720 1446 2090916 3023464536 4.37193E+12
21 1966 1320 1783320 1320 1742400 2299968000 3.03596E+12
22 1967 1351 2012990 1351 1825201 2465846551 3.33136E+12
23 1968 1490 2384000 1490 2220100 3307949000 4.92884E+12
24 1969 1600 3491200 1600 2560000 4096000000 6.5536E+12
25 1970 2182 2742774 2182 4761124 1.0389E+10 2.26683E+13
26 1971 1257 2642214 1257 1580049 1986121593 2.49655E+12
27 1972 2102 3592318 2102 4418404 9287485208 1.95223E+13
28 1973 1709 3479524 1709 2920681 4991443829 8.53038E+12
29 1974 2036 3108972 2036 4145296 8439822656 1.71835E+13
30 1975 1527 1841562 1527 2331729 3560550183 5.43696E+12
31 1976 1206 1433934 1206 1454436 1754049816 2.11538E+12
32 1977 1189 1705026 1189 1413721 1680914269 1.99861E+12
33 1978 1434 64534032 1434 2056356 2948814504 4.2286E+12
N= 33 Σ= 46309 68087435 1.0493E+11 1.69447E+14
S1 S2 S3 S4
2144523481 4.6359E+15 1.101E+22 2.87122E+28
S12 S22 S32 S42

Adicionalmente con el uso de la siguiente ecuación:

37
Pruebas no paramétricas Hidrología estadística

s21−s 2
Ŕ=
N −1
Reemplazando valores, se obtiene:

2144523481−68087435
Ŕ=
33−1
Ŕ=64888626.4
Ahora bien, utilizando los datos relacionados a continuación:

Σ= 46309 68087435 1.0493E+11 1.69447E+14


S1 S2 S3 S4
2144523481 4.6359E+15 1.101E+22 2.87122E+28
S12 S22 S32 S42

Se reemplazan los valores obtenidos en la siguiente ecuación:

s 22−s 4 ( s 4−4 s21 s 2+ s 22−2 s 4 )


var ( R )= − Ŕ2 + 1
N −1 ( N−1)(N−2)
Obteniendo:

var ( R )=5.69431E+14
De lo cual se procede a calcular el |u|, utilizando:

R− Ŕ
|u|=
√ var ( R )
|u|=1.8144
Donde se tiene como resumen de resultados:

R= 65826066
Ṝ= 64888626.4
Var(R)= 5.69431E+14
Reemplazando:

65826066−64888626.4
|u|=
√5.69431E+14
|u|=1.8144
Criterio de aceptación test Wald-Wolfowitz

El criterio de aceptación de la Estación “la Virginia” se resume en una desigualdad de acuerdo


con el nivel de significación utilizado en el estudio. Para el presente proyecto se escogió el 1 %
correspondiente a un valor de 2.58. De allí se concluye entonces que el dato es independiente
y estacionario si:

|u|< 1.96

38
Pruebas no paramétricas Hidrología estadística

Luego, de los resultados obtenidos por el test:

|1.81|<1.96
¿ Estación laVirginia Aceptada
Por lo que puede concluirse que los datos de la estación la Virginia son independientes y
estacionarios, lo que implica que algunos de los registros medidos no dependen en alguna
medida de registros anteriores; lo q nos indica que no hay una tendencia a seguir, de modo tal
que los datos proporcionados por la estación “La Virginia” son convenientes de utilizar dada la
hipótesis de independencia y estacionalidad empleada en los métodos de distribución.

39
Pruebas no paramétricas Hidrología estadística

COEFICIENTE DE CORRELACIÓN DE SPEARMAN


El coeficiente de correlación de Spearman (Spearman, 1904), es una medida de la relación
lineal entre dos variables aleatorias cuantitativas, basado en los rangos (posición) de
ambas variables dentro de una serie estadística. Para su cálculo se aplica la siguiente
fórmula:
6 Σ d i2
r s=1− 2
n (n −1)
Donde:
d es la diferencia entre los correspondientes estadísticos de orden de x - y
n es el número de parejas de datos.

El valor del índice de correlación varía en el intervalo [-1,1], indicando el signo el sentido
de la relación. La correlación de Spearman mide el grado de asociación entre dos variables
cuantitativas que siguen una tendencia siempre creciente o siempre decreciente. Es más
general que el Coeficiente de correlación de Pearson, la correlación de Spearman, en
cambio se puede calcular para relaciones exponenciales o logarítmicas entre las variables.

Condiciones de uso:

- Cuando una o ambas variables se miden en una escala ordinal o de intervalo. 


- Planteamiento de Hipótesis:
Ho: No existe asociación entre las dos variables.
Ha: Existe una relación o asociación entre las dos variables.

Cuadro 1. Valores críticos para una prueba de dos colas del


Coeficiente de Correlación de Spearman

Número de Valor crítico para α:


casos P=0.1 P=0.05 P=0.01
7 0.714 0.786 0.929
8 0.643 0.738 0.881
9 0.600 0.683 0.833
10 0.564 0.648 0.794
12 0.506 0.591 0.777
14 0.456 0.544 0.715
16 0.425 0.506 0.665
18 0.399 0.475 0.625
20 0.377 0.450 0.591
22 0.359 0.428 0.562
24 0.343 0.409 0.537
26 0.329 0.392 0.515
28 0.317 0.377 0.496
30 0.306 0.364 0.478

40
Pruebas no paramétricas Hidrología estadística

- Regla de decisión (para muestras entre 4 y 30): Si rs es mayor o igual al valor de


tabla, se rechaza la hipótesis nula es decir si hay correlación o asociación entre las
dos variables.
- En el Cuadro 1 se muestran los valores críticos para distinto número de casos y
niveles de significancia.
- Para tamaños de muestra mayor a 30, la siguiente estadística puede ser utilizada:
Rs
t= 0.5
1−Rs2
[( n−2) ]
Donde t sigue una distribución t de Student con n-2 grados de libertad. Para una
prueba de una cola para una tendencia directa, la hipótesis nula de no tendencia
se rechaza cuando el valor de t calculada es mayor que el valor crítico t α para n-2
grados de libertad. La tendencia es creciente o decreciente si r s>0 ó rs<0,
respectivamente.

Procedimiento:

1. Se asignan rangos en la variable (X) y en la variable (Y), de manera independiente.

2. Se determinan las diferencias entre los rangos (di).

3. Se eleva al cuadrado cada di y luego se suman los resultados, para reemplazar en la


siguiente formula:

6 Σd i 2
r s=1−
n (n2−1)
*Si la muestra es mayor de 30, se procede a calcular el valor de t, y compararlo con
el to de la distribución de t de Student.

EJEMPLO DE APLICACIÓN

En este trabajo, contamos con datos de caudales máximos en m3/s, de una cuenca rural.
Queremos saber si existe una tendencia en la serie hidrológica.

Caudal [m3/s]

116.21
190.41
485.69
123.84
120.84
206.5
447.74
132.13
219.04
196.14

41
Pruebas no paramétricas Hidrología estadística

52.94
123.75
40.25
202.04
470.55
53.47
33.65
130.98
296.95
77.81
293.92
474.04
372.36
274.1
146.88
239.09
199.15
213.33
133.83
362.27
95.94
120.63
Solución:

Seguimos los pasos indicados en la teoría y aplicaremos la fórmula

Caudal [m3/s]
X Y Rango (X) Rango (Y) d=((X)-(Y))^2
116.21 33.65 4 1 9
190.41 130.98 9 5 16
485.69 296.95 16 13 9
123.84 77.81 7 2 25
120.84 293.92 5 12 49
206.5 474.04 12 16 16
447.74 372.36 14 15 1
132.13 274.1 8 11 9
219.04 146.88 13 7 36
196.14 239.09 10 10 0
52.94 199.15 2 8 36
123.75 213.33 6 9 9
40.25 133.83 1 6 25
202.04 362.27 11 14 9
470.55 95.94 15 3 144
53.47 120.63 3 4 1
n= 16 Suma= 394

42
Pruebas no paramétricas Hidrología estadística

6 Σd i 2
Coef. De Correlación de Spearman: r s=1−
n (n2−1)
rs=0.4206
*La respuesta coincide con la fórmula de Excel.

Como la muestra es n=32, mayor de 30, hallaremos el estadístico t, par aun G.L= 30
Rs
t= 0.5
1−Rs2
[ ]
( n−2 )

t=2.5392
Si revisamos en la tabla de distribución de t de Student
¿=2.038
Podemos concluir que, en este caso para una muestra de 32 y una hipótesis con un nivel
de significancia del 5%, el valor crítico es 2.038. Como el valor estimado del coeficiente de
correlación de Spearman, t=2.5392, es mayor al valor crítico, se rechaza la hipótesis nula y
se concluye que existe una tendencia en la serie hidrológica, una tendencia creciente,
debido al rs>0.

43
Pruebas no paramétricas Hidrología estadística

Conclusiones

 Concluimos que las pruebas no paramétricas son muy útiles a diferencias de las
pruebas no paramétricas con respecto a datos que no poseen una normalidad,
pero son muy laboriosas cuando se tratan de grandes cantidades de datos.
 Aprendimos a identificar los diferentes tipos de problemas que se nos pueda
presentar y tomar la decisión más adecuada con respecto a la elección de la
prueba no paramétrica que procederemos a utilizar.
 Hemos conocido y aprendido a utilizar los diferentes procedimientos de las
diferentes pruebas no paramétricas, así como analizar sus valores críticos en las
diferentes tablas estadísticas.

Bibliografía
 Coeficiente de Correlación por Rangos de Spearman
http://aprendeenlinea.udea.edu.co/lms/moodle/pluginfile.php/124470/mod_resource/conten
t/0/Noparametrica/Rangos_de_Spearman.ppt

 Asociación entre variables: correlación no paramétrica


http://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0001-60022008000300004

 Análisis De Correlación Entre Parámetros Morfométricos, Precipitaciones Máximas Y


Caudales Máximos Asociados A Diferentes Periodos De Retorno En Cuencas Rurales
https://repository.ucatolica.edu.co/bitstream/10983/14625/1/TRABAJO%20DE%20GRADO.pdf

 Los Recursos Hídricos En Una Cuenca De Montaña: Modelización De La Cabecera Del


Río Esla
https://repositorio.unican.es/xmlui/bitstream/handle/10902/14924/YedraArn
%C3%A1izCarolina.pdf?sequence=1&isAllowed=y

 Coeficiente de Correlación por Rangos de Spearman


http://aprendeenlinea.udea.edu.co/lms/moodle/pluginfile.php/124470/mod_resource/conten
t/0/Noparametrica/Rangos_de_Spearman.ppt

 Asociación entre variables: correlación no paramétrica


http://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0001-60022008000300004

 Análisis De Correlación Entre Parámetros Morfométricos, Precipitaciones Máximas Y


Caudales Máximos Asociados A Diferentes Periodos De Retorno En Cuencas Rurales
https://repository.ucatolica.edu.co/bitstream/10983/14625/1/TRABAJO%20DE%20GRADO.pdf

 Los Recursos Hídricos En Una Cuenca De Montaña: Modelización De La Cabecera Del


Río Esla
https://repositorio.unican.es/xmlui/bitstream/handle/10902/14924/YedraArn
%C3%A1izCarolina.pdf?sequence=1&isAllowed=y

44
Pruebas no paramétricas Hidrología estadística

 Prueba U de Mann-Whitney
https://es.wikipedia.org/wiki/Prueba_U_de_Mann-Whitney

 Prueba de Kruskal-Wallis
https://es.wikipedia.org/wiki/Prueba_de_Kruskal-Wallis

 Tabla de valores críticos del coeficiente U de Mann-Whitney


Mann Whitney U Test - Critical Values Table. Medina Valley Center. ENVIRONMENTAL &
OUTDOOR EDCATION

 Historial de las precipitaciones mensuales generadas de 50 años de la cuenca Río Santa


Estudio de Inversión Pública a Nivel de Perfil: "RECUPERACIÓN DE LOS SERVICIOS
ECOSISTÉMICOS DE REGULACIÓN HÍDRICA, EN LAS CUENCAS ALTA, MEDIA Y BAJA DE LOS RÍOS
FORTALEZA Y SANTA, EN LAS PROVINCIAS DE RECUAY Y BOLOGNESI – REGIÓN ANCASH”.
FEBRERO2017
http://siar.minam.gob.pe/ancash/sites/default/files/archivos/public/docs/25_estudio_hidrolo
gico_cuenca_del_rio_santa.pdf

45

También podría gustarte