Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRUEBAS NO PARAMETRICAS
HIDROLOGIA ESTADISTICA
1
Pruebas no paramétricas Hidrología estadística
Índice
Introducción 3
Objetivos 3
Marco teórico 4
Prueba De Anderson-Darling 5
Prueba Binomial 9
Prueba De Mann-Kendall 11
Prueba De U De Mann-Whitney 16
Prueba De Kruskal-Wallis 20
Prueba De Wald-Wolfowitz 31
Conclusiones 42
Bibliografía 42
2
Pruebas no paramétricas Hidrología estadística
Introducción
Objetivos
3
Pruebas no paramétricas Hidrología estadística
Marco teórico
Pruebas No Paramétricas
Definición:
Prueba De Anderson-Darling
Prueba Binomial
Prueba De U De Mann-Whitney
Prueba De Kruskal-Wallis
Prueba De Los Signos
Prueba De Rangos Y Singos De Wilcoxon
Prueba De Wald-Wolfowitz
Coeficiente De Correlación De Spearman
4
Pruebas no paramétricas Hidrología estadística
PRUEBA DE ANDERSON-DARLING:
Definición:
{ y1 < ⋯ ⋯ ⋯ ⋯< Y n }
(observar que los datos se deben ordenar) vienen de una distribución con función
acumulativa F
Donde:
N
2∗K −1
S= ∑ ∗¿
K =1 N
5
Pruebas no paramétricas Hidrología estadística
Luego de un estudio de la Cuenca Rio Santa, se tienen las precipitaciones mensuales generadas
(mm), desde el año hidrológico 1953-54 hasta 2000-01.
Se quiere saber si existe una distribución normal o no, de las precipitaciones de los meses de
marzo desde el año 1958-59 hasta 1987-88.
AÑO MARZO
1958-59 170.79
1959-60 107.42
1960-61 151.16
1961-62 192.29
1962-63 247.3
1963-64 96.04
1964-65 250.96
1965-66 76.52
1966-67 184.67
1967-68 123.91
1968-69 121.41
1969-70 109.82
1970-71 250.54
1971-72 263.48
1972-73 184.15
1973-74 209.1
1974-75 246.36
1975-76 187.38
1976-77 112.01
1977-78 113.37
1978-79 204.71
1979-80 154.19
1980-81 227.16
1981-82 148.13
1982-83 178.82
1983-84 312.34
1984-85 159.3
1985-86 113.47
1986-87 151.68
1987-88 111.49
6
Pruebas no paramétricas Hidrología estadística
SOLUCIÓN:
H0: Las precipitaciones en el mes de marzo desde 1958-59 a 1987-88 siguen una
distribución normal.
Ha: Las precipitaciones en el mes de marzo desde 1958-59 a 1987-88 no siguen una
distribución normal.
De los datos obtenemos la desviación estándar y la media.
MEDIA 171.999
DESV. EST. 59.2988
FÓRMULA
Precipitación(mm) ESTANDARIZACIÓN DE Distribució Ordenadas DE
N° Ordenadas de LOS DATOS n Normal 1-F(Yi) de menor a ANDERSON-
menor a mayor F(Yi) mayor DARLING
7
Pruebas no paramétricas Hidrología estadística
30
Para n=30
N
( 2i−1 )
A2n =−∑
n [
LnF ( Y i ) + ln ( 1−F ( Y n +1−i ) ) ] −n
i=1
A2=0.50469242
Según la tabla de Anderson-Darling para un nivel de confianza de 95% y para una prueba
de normalidad, tenemos:
0.50469242<0.757
8
Pruebas no paramétricas Hidrología estadística
PRUEBA BINOMIAL:
Definición:
P( X =r )= n ∗pr∗qn −r
()
r
Donde: q=1-r
X=variable
9
Pruebas no paramétricas Hidrología estadística
Ejemplo:
En una empresa de distribución de agua al pueblo de Manchay , el 5% de esta sale con
impurezas por la contaminación. Determinar la probabilidad de una muestra de 12, se
encuentran 2 con impurezas.
Solución:
r=2
n=12
5
p=5% = = 0.05
100
q=1-P = 1-0.05=0.95
10
Pruebas no paramétricas Hidrología estadística
PRUEBA DE MANN-KENDALL
Definición:
1. Se listan los valores de las variables de forma ordenada (Q1, Q2, …, Qn).
1 si ( Q j−Qk ) > 0
{
signo ( Q j−Qk ) = 0 si ( Q j−Q k ) =0
−1 si ( Q j−Q k ) < 0 }
3. Obtención del estadístico S de Mann-Kendall, mediante la ecuación anterior:
n−1 n
S=∑ ∑ signo ( Q j −Qk )
k=1 j=k +1
Si S es positivo, se infiere de forma subjetiva que la tendencia es creciente, cuando
S es negativo, se infiere que hay tendencia decreciente.
4. Con base a los indicadores se estima una varianza para el estadístico S de Mann-
Kendall, que considera el caso de los empates 𝑠𝑖𝑔𝑛𝑜 𝑄𝑗−𝑄𝑘=0 obtenidos en el paso
2, mediante la ecuación:
g
Var [ S ] =
1
18 [
n ( n−1 )( 2 n+5 ) −∑ t i (t i−1)(2 t i +5)
i=1
]
Donde n es el tamaño de muestra, g es el número de grupos de medidas que
tienen igual valor y ti es el número de vínculos en el grupo i. Mann definió la
varianza de series que no incluyen vínculos, y Kendall realizó el ajuste del segundo
término de la ecuación (S) (McCuen, 2002). Kendall señala que la aproximación
normal de la ecuación Zmkdebe proporcionar decisiones precisas para muestras
tan pequeñas como 10, pero generalmente es aplicada cuando N≥30. Para
tamaños de muestra menores a 30, se puede utilizar el estadístico 𝜏 cuando la serie
no incluye vínculos.
2S
τ=
n ( n−1 )
11
Pruebas no paramétricas Hidrología estadística
Gibbons, 1976 citado por McCuen (2002) menciona que la ecuación anterior no
debe ser utilizada cuando la serie incluye datos de la misma magnitud, en tales
casos, se puede aplicar una corrección para las relaciones.
S−1
si> 0
{ }
1
2
[Var ( S ) ]
Z MK = 0 si S=0
S−1
1
si< 0
2
[Var ( S ) ]
12
Pruebas no paramétricas Hidrología estadística
Para muestras grandes y con una prueba de dos colas, la hipótesis nula H0 es
rechazada si ZMK es mayor que 𝑍∝2 o menor que −𝑍∝2 de la distribución Normal
Estándar para un nivel de significancia (α).
13
Pruebas no paramétricas Hidrología estadística
14
Pruebas no paramétricas Hidrología estadística
De la cual obtenemos un valor negativo S 204 donde inferimos que hay tendencia
decreciente.
2S 2 (204)
n(n 1) 56 (55)
0.148
Analizando la varianza
g
Var [ S ] =
1
18 [
n ( n−1 )( 2 n+5 ) −∑ t i (t i−1)(2 t i +5)
i=1
]
Var [ S ]= 16995.3
Para la Prueba de Mann – Kendall , el P-value será mayor que el nivel de significancia
5%
H
por lo tanto no podemos rechazar nuestra Hipótesis Nula o . Concluyendo que la prueba
presenta ausencia de tendencia en la serie de gastos máximos anuales de la estación
26224 Tamuin y se comprueba que la serie es homogénea y estacionaria.
15
Pruebas no paramétricas Hidrología estadística
PRUEBA DE U DE MANN-WHITNEY:
Definición:
Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaños y
extendido a muestras de tamaño arbitrario como en otros sentidos por Henry B. Mann y D.
R. Whitney en 1947.
Cálculo Estadístico:
Para calcular el estadístico U se asigna a cada uno de los valores de las dos muestras su
rango para construir (de menor a mayor, siendo el menor de rango 1, el siguiente 2 y así
sucesivamente).
n 1( n1+ 1)
U =n1 n2+ −R1
2
n 1(n1+ 1)
U =n1 n2+ −R2
2
16
Pruebas no paramétricas Hidrología estadística
La prueba calcula el llamado estadístico U , cuya distribución para muestras con más de 20
observaciones se aproxima bastante bien a la distribución normal. La aproximación a la
normal, z , cuando tenemos muestras lo suficientemente grandes viene dada por la
expresión:
z=(U−mU )/σ U
m U =n 1 n2 /2
n 1 n2 (n 1+ n2+ 1)
σU =
√ 12
17
Pruebas no paramétricas Hidrología estadística
SOLUCIÓN:
18
Pruebas no paramétricas Hidrología estadística
Hallamos el valor de U:
Para n1 =n2=12
n 1( n1+ 1)
U =n1 n2+ −R1
2
12(12+1)
U =12× 12+ −152
2
U =70
n 1(n1+ 1)
U =n1 n2+ −R2
2
12(12+1)
U =12× 12+ −148
2
U =74
Escogemos el U menor =70
Se observa:
19
Pruebas no paramétricas Hidrología estadística
20
Pruebas no paramétricas Hidrología estadística
PRUEBA DE KRUSKAL-WALLIS:
12
K
R2j
H= ∑ −3( N +1)
N (N +1) J =1 n j
Grado de libertad:
g .l =k −1
21
Pruebas no paramétricas Hidrología estadística
NOTA: las hipótesis son hipótesis bilaterales, ya que está basada en la desigualdad, osea
queremos diferencias significativas.
22
Pruebas no paramétricas Hidrología estadística
SOLUCIÓN:
Hipótesis estadísticas:
12
K
R2j
H= ∑ −3(N +1)
N (N +1) J =1 n j
gl=k −1
gl=4−1=3
23
Pruebas no paramétricas Hidrología estadística
Como el valor crítico es mayor que el obtenido (7.815> H ) rechazamos la hipótesis alternativa
( H a ) en favor a la hipótesis nula( H 0 ).
∴ No existen diferencias estadísticamente significativas entre dichos años hidrológicos .
(Para un nivel de confianza de 95% y un nivel de significación α =0.05 )
24
Pruebas no paramétricas Hidrología estadística
Definición:
Es una prueba no paramétrica que tiene como propósito contrastar dos grupos
relacionados o emparejados, partiendo de la hipótesis de que ambos provienen de
poblaciones iguales.
Formulas a Emplear
Zcalculado :
X−N . P
√ N . P .q
Donde
X = N(+) - P
- N : Numero de Pruebas
- P, q = Relación Porcentual de Probabilidad Optima
Variables
- Nivel de Confianza : Ne = 1 – α
Ha = Hipótesis Alternativa
- Ho = Hipótesis Nula (contrarresta a Ha)
- µ = Factor de Correlación
- α = Nivel de Significancia
- Ne = Nivel de Confianza
- N= Numero de Pruebas
25
Pruebas no paramétricas Hidrología estadística
26
Pruebas no paramétricas Hidrología estadística
Solución
DATOS
Ha > 85 Ho = 85 µ = 85
N = 24 , Ne = 1 – 0.05 = 95 % = 0.95
SET OCT NOV DIC ENE FEB MAR ABR MAY JUN JUL AGO
1961-62 - - + + + + + - - - - -
1962-63 - - - - + + + + - - - -
Calculando el
Zcalculado =
X−N . P
√ N . P .q
Al tener dos casos posibles los valores de P y q serán del 50% cada una P = 0.5 q = 0.5
X = N(+) - P
X= 9 – 0.5 = 8.5
8.5−24. 0.5
Zcalculado =
√ 24.0 .5 .0 .5
Zcalculado = -4.928
Conclusión
27
Pruebas no paramétricas Hidrología estadística
Definición:
La prueba de rangos y signos de Wilcoxon es una prueba no paramétrica las cuales se usan
para poder comparar poblaciones, esta prueba es una alternativa a la prueba t de Student
cuando no se puede suponer la normalidad de las poblaciones. Es una prueba para
comparar el rango medio de dos muestras relacionadas y determinar si existen diferencias
entre ellas.
La prueba de wilcoxon se utiliza para comparar dos muestras relacionadas y por lo tanto
no necesita una distribución específica. Usa más bien el nivel ordinal de la variable
dependiente. Se utiliza para comparar dos mediciones relacionadas y determinar si la
diferencia entre ellas se debe al azar o no.
Los datos de las muestras que analizaremos tienen que ser independientes y
ordinales
Esta prueba se recomienda a usar en vez de la prueba t-student ya que es su
equivalente no paramétrico cuando hay valores atípicos, no hay normalidad de los
datos o el tamaño de las muestras es pequeño.
A diferencia de la prueba de T de student la prueba de rangos de signos de
Wilcoxon trabaja con medianas, no con medias.
Procedimiento:
W =min ¿
28
Pruebas no paramétricas Hidrología estadística
4. Calculamos el P valor. –
(n)(n+1)
W−
4
Z=
n(n+ 1)(2 n∗1)
√ 24
Una vez ha obtenido el valor del estadístico W, se puede calcular cuál es la probabilidad de
que adquiera valores iguales o más extremos que el observado.
Si el tamaño n < 25, se compara el valor obtenido de W con los valores de una tabla
Wilcoxon. Si W cae dentro del intervalo correspondiente en la tabla para ese n, la
diferencia NO es significativa.
29
Pruebas no paramétricas Hidrología estadística
Ejemplo
Se tienen los datos del caudal medio anual del rio Ebro desde los años 1951 hasta 1988 si
se sabe que en el año 1969 se finalizo el complejo de embalses de Mequineza y Ribarroja,
se desea saber si produjo un cambio significativo del caudal medio anual después de la
construcción de los embalses.
Análisis:
Como observamos en el siguiente ejemplo podemos observar que nos piden comparar el
comportamiento del caudal medio de anual a lo largo de 34 años teniendo en cuenta que
a los 17 años del comienzo de la toma de datos se terminó la construcción de un conjunto
de embalses el cual queremos ver si genero una alteración significativa en el caudal medio
anual de la cuenca
30
Pruebas no paramétricas Hidrología estadística
Desarrollo:
Paso 1: primero digitamos los datos antes y después de la construcción de la represa para
poder empezar a realizar la prueba
Antes Después
468 501
436 465
226 457
412 610
254 403
287 385
436 429
896 287
728 496
701 568
569 537
486 312
347 300
587 241
431 448
482 381
Paso 2: Procedemos a hallar la diferencia del antes y después y luego ponemos los rangos
correspondientes a cada uno de los valores obtenidos
31
Pruebas no paramétricas Hidrología estadística
Paso 4: procedemos a hallar la suma de los rangos con signos positivos y negativos y
escogemos el menor valor de ambos
Paso 5:
como la cantidad de datos con la que estamos trabajando es de 16 no es necesario utilizar
la ecuación de P valor la cual según la norma es de 25 datos como mínimo, procedemos a
Conclusión:
Como nuestro valor W es de 52 y el valor critico en la tabla de wilcoxon para 16 datos con
un nivel de significancia de 5% es de 30 concluimos que no podemos rechazar la hipótesis
nula eso quiere decir que los valores de los caudales medios anuales no han variado
significativamente
32
Pruebas no paramétricas Hidrología estadística
PRUEBA DE WALD-WOLFOWITZ
Dada una muestra N de datos, la prueba Wald- Wolfowitz evalúa los parámetros de
independencia y estacionalidad sin importar si el orden de los datos es aleatorio o no. Allí
el valor estadístico R es calculado a partir de la siguiente ecuación:
n−1
R=∑ ( x i∗x i+1 ) + ( x i ¿ x N )
i=1
Cuando los elementos de la prueba son independientes, R sigue una distribución normal
con media y varianza dadas por las siguientes ecuaciones:
s21−s 2
Ŕ=
N −1
s 22−s 4 4 2 2
2 ( s 1 −4 s1 s 2 + s 2−2 s 4 )
var ( R )= − Ŕ +
N −1 ( N−1)(N−2)
Con:
N= número de registros
Y
n
Sk =∑ xik
i=1
R− Ŕ
|u|=
√ var ( R )
33
Pruebas no paramétricas Hidrología estadística
Consideraciones:
El valor estadístico |𝑢| de cada una de las estaciones debe ser menor que el valor
crítico del nivel de significación que se escoja y que se ajuste mejor a las finalidades del
estudio; dependiendo del valor crítico de cada nivel de significación si el valor de u de
cada estación es menor, se acepta la hipótesis de independencia y estacionalidad.
Nivel de Significación: Los valores críticos para una distribución normal estándar se
relacionan en la siguiente tabla
Tabla. Valores del Nivel de Significación
EJEMPLO DE APLICACIÓN
34
Pruebas no paramétricas Hidrología estadística
35
Pruebas no paramétricas Hidrología estadística
Dentro de la solución del test, se debe tener claro que se evaluarán los parámetros de
independencia y estacionalidad.
En primera instancia se deben organizar los datos de manera ascendente de acuerdo con el
año de registro. Una vez organizados se debe encontrar la sumatoria para el cálculo de R,
donde se tiene:
Se aclara:
R=65826066
36
Pruebas no paramétricas Hidrología estadística
37
Pruebas no paramétricas Hidrología estadística
s21−s 2
Ŕ=
N −1
Reemplazando valores, se obtiene:
2144523481−68087435
Ŕ=
33−1
Ŕ=64888626.4
Ahora bien, utilizando los datos relacionados a continuación:
var ( R )=5.69431E+14
De lo cual se procede a calcular el |u|, utilizando:
R− Ŕ
|u|=
√ var ( R )
|u|=1.8144
Donde se tiene como resumen de resultados:
R= 65826066
Ṝ= 64888626.4
Var(R)= 5.69431E+14
Reemplazando:
65826066−64888626.4
|u|=
√5.69431E+14
|u|=1.8144
Criterio de aceptación test Wald-Wolfowitz
|u|< 1.96
38
Pruebas no paramétricas Hidrología estadística
|1.81|<1.96
¿ Estación laVirginia Aceptada
Por lo que puede concluirse que los datos de la estación la Virginia son independientes y
estacionarios, lo que implica que algunos de los registros medidos no dependen en alguna
medida de registros anteriores; lo q nos indica que no hay una tendencia a seguir, de modo tal
que los datos proporcionados por la estación “La Virginia” son convenientes de utilizar dada la
hipótesis de independencia y estacionalidad empleada en los métodos de distribución.
39
Pruebas no paramétricas Hidrología estadística
El valor del índice de correlación varía en el intervalo [-1,1], indicando el signo el sentido
de la relación. La correlación de Spearman mide el grado de asociación entre dos variables
cuantitativas que siguen una tendencia siempre creciente o siempre decreciente. Es más
general que el Coeficiente de correlación de Pearson, la correlación de Spearman, en
cambio se puede calcular para relaciones exponenciales o logarítmicas entre las variables.
Condiciones de uso:
40
Pruebas no paramétricas Hidrología estadística
Procedimiento:
6 Σd i 2
r s=1−
n (n2−1)
*Si la muestra es mayor de 30, se procede a calcular el valor de t, y compararlo con
el to de la distribución de t de Student.
EJEMPLO DE APLICACIÓN
En este trabajo, contamos con datos de caudales máximos en m3/s, de una cuenca rural.
Queremos saber si existe una tendencia en la serie hidrológica.
Caudal [m3/s]
116.21
190.41
485.69
123.84
120.84
206.5
447.74
132.13
219.04
196.14
41
Pruebas no paramétricas Hidrología estadística
52.94
123.75
40.25
202.04
470.55
53.47
33.65
130.98
296.95
77.81
293.92
474.04
372.36
274.1
146.88
239.09
199.15
213.33
133.83
362.27
95.94
120.63
Solución:
Caudal [m3/s]
X Y Rango (X) Rango (Y) d=((X)-(Y))^2
116.21 33.65 4 1 9
190.41 130.98 9 5 16
485.69 296.95 16 13 9
123.84 77.81 7 2 25
120.84 293.92 5 12 49
206.5 474.04 12 16 16
447.74 372.36 14 15 1
132.13 274.1 8 11 9
219.04 146.88 13 7 36
196.14 239.09 10 10 0
52.94 199.15 2 8 36
123.75 213.33 6 9 9
40.25 133.83 1 6 25
202.04 362.27 11 14 9
470.55 95.94 15 3 144
53.47 120.63 3 4 1
n= 16 Suma= 394
42
Pruebas no paramétricas Hidrología estadística
6 Σd i 2
Coef. De Correlación de Spearman: r s=1−
n (n2−1)
rs=0.4206
*La respuesta coincide con la fórmula de Excel.
Como la muestra es n=32, mayor de 30, hallaremos el estadístico t, par aun G.L= 30
Rs
t= 0.5
1−Rs2
[ ]
( n−2 )
t=2.5392
Si revisamos en la tabla de distribución de t de Student
¿=2.038
Podemos concluir que, en este caso para una muestra de 32 y una hipótesis con un nivel
de significancia del 5%, el valor crítico es 2.038. Como el valor estimado del coeficiente de
correlación de Spearman, t=2.5392, es mayor al valor crítico, se rechaza la hipótesis nula y
se concluye que existe una tendencia en la serie hidrológica, una tendencia creciente,
debido al rs>0.
43
Pruebas no paramétricas Hidrología estadística
Conclusiones
Concluimos que las pruebas no paramétricas son muy útiles a diferencias de las
pruebas no paramétricas con respecto a datos que no poseen una normalidad,
pero son muy laboriosas cuando se tratan de grandes cantidades de datos.
Aprendimos a identificar los diferentes tipos de problemas que se nos pueda
presentar y tomar la decisión más adecuada con respecto a la elección de la
prueba no paramétrica que procederemos a utilizar.
Hemos conocido y aprendido a utilizar los diferentes procedimientos de las
diferentes pruebas no paramétricas, así como analizar sus valores críticos en las
diferentes tablas estadísticas.
Bibliografía
Coeficiente de Correlación por Rangos de Spearman
http://aprendeenlinea.udea.edu.co/lms/moodle/pluginfile.php/124470/mod_resource/conten
t/0/Noparametrica/Rangos_de_Spearman.ppt
44
Pruebas no paramétricas Hidrología estadística
Prueba U de Mann-Whitney
https://es.wikipedia.org/wiki/Prueba_U_de_Mann-Whitney
Prueba de Kruskal-Wallis
https://es.wikipedia.org/wiki/Prueba_de_Kruskal-Wallis
45