Sesión 03, U-Man Whitney y Kruskal Wallis

La prueba de la suma de rangos (Dos muestras independientes).
Cuando se interesa probar la igualdad de medias de dos distribuciones

continuas que obviamente no son normales, y las muestras son
independientes (es decir, no hay pareamiento de observaciones), la prueba de
la suma de rangos de Mann - Whitney es una alternativa apropiada a la
prueba t de dos muestras independientes. Es el método no paramétrico
más poderoso para comparar dos muestras cuando no son apareadas. Con
la prueba de suma de rangos de Mann - Whitney o prueba de U de Mann -
Whitney, no se requiere hacer suposición alguna acerca de la forma de las
distribuciones poblacionales. Pero si se requiere que el nivel de medición de las
observaciones de las dos muestras sea al menos de escala ordinal.
Si las distribuciones de las poblaciones son continuas, la hipótesis nula consiste

en afirmar que las dos medias poblacionales son iguales, esto es, H 0 : 1   2
contra una alternativa unilateral o bilateral.
El procedimiento es el siguiente:
 sea n 1 el número de observaciones en la muestra más pequeña y n2 el número

de observaciones en la muestra más grande. Cuando las muestras son de
igual tamaño, n1 y n2 se pueden asignar aleatoriamente.
 Se acomodan las observaciones n1 + n2 de las muestras combinadas en orden
ascendente y se sustituye un rango de 1, 2,…, n1 + n2 para cada observación,
si se encuentran observaciones iguales, se le asigna el promedio de sus
rangos.
La suma de rangos correspondiente a las n1 observaciones en la muestra más

pequeña se representa por w1. En forma semejante, el valor de w2 representa
la suma de los n2 rangos correspondientes a la muestra más grande. Observar
que las Wi son las sumas de rangos de Wilcoxon.
La hipótesis H 0 : 1   2 se rechazará a favor de H 1 : 1   2 si W 1 es
suficientemente pequeña, la alternativa H 1 : 1  2 se acepta si W 2 es

suficientemente pequeña; y la alternativa H 1 : 1   2 se acepta si el número de
W1 y W 2 es suficientemente pequeño.
En la práctica, la decisión por lo común se basa en el valor,
n 1 (n 1  1) n 2 (n 2  1)
u1  w 1  o u2  w 2 
2 2
del estadístico correspondiente U1 y U2 o sobre el valor de u del estadístico U, el

mínimo de u1 y u2.
En consecuencia, la hipótesis nula se rechazará siempre que el estadístico

apropiado U1, U2 o U tiene un valor menor o igual que el valor crítico deseado
proporcionado en la tabla U de Mann - Whitney (ver tabla A- 2).
Prueba de la suma de rangos.

Para probar H 0 contra Calcule
H1
µ1 < µ 2 u1
µ1 = µ 2 µ1 > µ 2 u2
µ1 ≠ µ 2 u
Ejemplo 5. Se registran las siguientes muestras de ingresos familiares

mensuales (en dólares) de dos cuidades A y B.
Ingresos A: 850 600 700 910 870 800 700 1050

Ingresos B: 940 1000 1100 880 850 860 780 650 820 700
Utilice la prueba U de Mann – Whitney al nivel de significancia del 5%, para

probar la hipótesis nula de que son iguales los ingresos familiares de las dos
poblaciones A y B contra la hipótesis alternativa de que son diferentes los
ingresos.
Solución.
1. Hipótesis: H 0 : 1   2
contra H 1 : 1   2
2. Nivel de significancia: α = 0.05
3. Estadística de prueba: U de Mann – Whitney (no se supone normalidad)
4. Región critica: Para n1 = 8 y n2 = 10 y α = 0.05, en la tabla A-2 de valores de u,

se obtiene el valor critico igual a 17.
Se rechazará H 0 si u, el menor de los valores de u1 y u2 es menor o igual a 17;
es decir si u ≤ 17.
5. Cálculos. Las observaciones se acomodan en orden ascendente y se asignan

los rangos de 1 a 18.
Ingresos Rangos
600 * 1
650 2
700 * 4
700 * 4
700 4
780 6
800 * 7
820 8
850 * 9.5
850 9.5
860 11
870 * 12
880 13
910 * 14
940 15
1000 16
1050 * 17
1100 18
Los rangos de los ingresos que pertenecen a los ingresos A, la muestra más
pequeña, aparece marcado con asterisco (*).
Ahora: w1 = 1 + 4 + 4 + 7 + 9.5 + 12 + 14 + 17 = 68.5

y
18  19 
w2     68.5  102 .5
 2 
Por lo tanto:
89
u1  68.5   32.5
2
10  11
u 2  102 .5   47.5
2
Luego µ = 32.5
6. Decisión. Dado que u = 32.5 > 17, no se rechaza H 0 y se concluye que son
iguales los ingresos promedios familiares de las dos ciudades.
Nota. Puede verificarse que si se supone normalidad de las variables, utilizando

la prueba t se obtiene t= - 0.735, para una prueba bilateral. Un valor de
P  2  P(t  0.735)  0.473    0.05 . Por lo tanto, también se acepta la
hipótesis H 0.
Aproximación a la teoría normal para dos muestras.

Cuando n1 y n2 exceden de 8, la distribución muestral de u1 (o u2) se aproxima a
la distribución normal con
n1  n2 n1  n2  (n1  n2  1)
Media μu  y Varianza  u2 
1 2 1 12
Por lo tanto, cuando n1 es mayor que 20 y n2 es al menos 9, se puede utilizar el

u1   u
estadístico Z 1
 N (0,1)
u
1
La prueba de Kruskal -Wallis (K muestras independientes).
La prueba de Kruskal - Wallis, llamada también prueba H de Kruskal – Wallis se

utiliza para probar la hipótesis nula de que k muestras independientes provienen
de poblaciones idénticas o de la misma población. Es una generalización de la
prueba U de Mann – Whitney para el caso de K > 2 muestras independientes.
La prueba de Kruskal – Wallis (introducida en 1952), es un procedimiento no

paramétrico para probar la igualdad de medias en el análisis de varianza de un
factor cuando se desea evitarse la suposición de que las muestras se
seleccionaron de poblaciones normales. Se requiere que los valores de las
muestras aleatorias independientes estén cuando menos en escala ordinal.
El procedimiento de la s como sigue:
 Sea ni (i = 1, 2,…, k) el número de observaciones en la i-ésima muestra. Se

combinan las k muestras y se arreglan las n = n1 + n2 +…+ nk observaciones
en orden ascendente e identificándolos de acuerdo al grupo muestral al que
pertenecen.
 Se les asigna el rango apropiado de 1, 2,…, n a cada observación. Si se

encuentran valores iguales, se les asigna como rango el promedio de sus
rangos. La suma de los rangos correspondientes a las ni observaciones en la
muestra i se representa por la variable aleatoria Ri.
Consideremos el estadístico de prueba:

12 k
R i2
H 
n(n  1) i 1 n i
 3(n  1)  χ (2k  1)
Cuando la hipótesis H0: las k poblaciones son iguales, es verdadera y si cada

muestra consiste de al menos 5 observaciones (ni ≥ 5). Luego, para probar H0,
12 k
ri2
calcúlese: h   3(n  1)
n(n  1) i 1 n i
Si h   (2α, k  1) se rechaza H 0 al nivel de significancia de α; de otra manera se
acepta H0.
Ejemplo 2.6. Los datos que siguen representan los tiempos de operación en
horas, de tres tipos de baterías de teléfonos celulares hasta antes que requieran
cargarlas.
Baterías
A B C
24.9 19.8 18.2
26.1 18.2 19.0
22.8 17.5 19.6
21.8 17.5 20.1
25.9 19.2 20.3
18.5 23.4
19.0
19.5
Pruebe la hipótesis que los tiempos promedios de operación para las tres
baterías son iguales, al nivel de significancia α = 0.05.
Solución.
1. Hipótesis: H 0 : 1   2   3
H 1 : No son iguales las tres medias.

2. Nivel de significancia: α = 0.05
12 k
R i2
3. Estadística de prueba: H  
n(n  1) i 1 n i
 3(n  1)  χ (22)
4. Región critica:
R.C = {h /h > 5.99}

2
f( )
 = 0.05
0 2 (0.05,2) = 5.99 2
5. Cálculos. En la tabla siguiente se convierten las 19 observaciones a

rangos y se suman los mismos para cada grupo (baterías).
Rango de la duración de las operaciones

Baterías
A B C
24.9 19.8 18.2
26.1 18.2 19.0
22.8 17.5 19.6
21.8 17.5 20.1
25.9 19.2 20.3
18.5 23.4
19.0
19.5
Se tiene n1 = 5, n2 = 8, n3 = 6, r1 = 83, r2 = 46 y r3 = 61.

12  83 2 46 2 612 
El valor h de la estadística H es: h       3  20
19  20  5 8 6 
 11.446
.
6. Decisión. Dado que h = 11.446 > 5.99, se debe rechazar H 0 y concluir que los
tiempos promedios de duración para las tres clases de baterías son diferentes.

Sesión 03, U-Man Whitney y Kruskal Wallis

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sesión 03, U-Man Whitney y Kruskal Wallis

Cargado por

Copyright:

Formatos disponibles

La prueba de la suma de rangos (Dos muestras independientes).

Cuando se interesa probar la igualdad de medias de dos distribuciones

Si las distribuciones de las poblaciones son continuas, la hipótesis nula consiste

contra una alternativa unilateral o bilateral.

 sea n 1 el número de observaciones en la muestra más pequeña y n2 el número

La suma de rangos correspondiente a las n1 observaciones en la muestra más

suficientemente pequeña, la alternativa H 1 : 1  2 se acepta si W 2 es

En la práctica, la decisión por lo común se basa en el valor,

del estadístico correspondiente U1 y U2 o sobre el valor de u del estadístico U, el

En consecuencia, la hipótesis nula se rechazará siempre que el estadístico

Prueba de la suma de rangos.

Ejemplo 5. Se registran las siguientes muestras de ingresos familiares

Ingresos A: 850 600 700 910 870 800 700 1050

Utilice la prueba U de Mann – Whitney al nivel de significancia del 5%, para

2. Nivel de significancia: α = 0.05

3. Estadística de prueba: U de Mann – Whitney (no se supone normalidad)

4. Región critica: Para n1 = 8 y n2 = 10 y α = 0.05, en la tabla A-2 de valores de u,

5. Cálculos. Las observaciones se acomodan en orden ascendente y se asignan

Ahora: w1 = 1 + 4 + 4 + 7 + 9.5 + 12 + 14 + 17 = 68.5

Nota. Puede verificarse que si se supone normalidad de las variables, utilizando

Aproximación a la teoría normal para dos muestras.

Por lo tanto, cuando n1 es mayor que 20 y n2 es al menos 9, se puede utilizar el

La prueba de Kruskal - Wallis, llamada también prueba H de Kruskal – Wallis se

La prueba de Kruskal – Wallis (introducida en 1952), es un procedimiento no

El procedimiento de la s como sigue:

 Sea ni (i = 1, 2,…, k) el número de observaciones en la i-ésima muestra. Se

 Se les asigna el rango apropiado de 1, 2,…, n a cada observación. Si se

Consideremos el estadístico de prueba:

Cuando la hipótesis H0: las k poblaciones son iguales, es verdadera y si cada

H 1 : No son iguales las tres medias.

R.C = {h /h > 5.99}

5. Cálculos. En la tabla siguiente se convierten las 19 observaciones a

Rango de la duración de las operaciones

Se tiene n1 = 5, n2 = 8, n3 = 6, r1 = 83, r2 = 46 y r3 = 61.

También podría gustarte