Está en la página 1de 7

La prueba de la suma de rangos (Dos muestras independientes).

Cuando se interesa probar la igualdad de medias de dos distribuciones


continuas que obviamente no son normales, y las muestras son
independientes (es decir, no hay pareamiento de observaciones), la prueba de
la suma de rangos de Mann - Whitney es una alternativa apropiada a la
prueba t de dos muestras independientes. Es el método no paramétrico
más poderoso para comparar dos muestras cuando no son apareadas. Con
la prueba de suma de rangos de Mann - Whitney o prueba de U de Mann -
Whitney, no se requiere hacer suposición alguna acerca de la forma de las
distribuciones poblacionales. Pero si se requiere que el nivel de medición de las
observaciones de las dos muestras sea al menos de escala ordinal.

Si las distribuciones de las poblaciones son continuas, la hipótesis nula consiste


en afirmar que las dos medias poblacionales son iguales, esto es, H 0 : 1   2

contra una alternativa unilateral o bilateral.

El procedimiento es el siguiente:

 sea n 1 el número de observaciones en la muestra más pequeña y n2 el número


de observaciones en la muestra más grande. Cuando las muestras son de
igual tamaño, n1 y n2 se pueden asignar aleatoriamente.
 Se acomodan las observaciones n1 + n2 de las muestras combinadas en orden
ascendente y se sustituye un rango de 1, 2,…, n1 + n2 para cada observación,
si se encuentran observaciones iguales, se le asigna el promedio de sus
rangos.

La suma de rangos correspondiente a las n1 observaciones en la muestra más


pequeña se representa por w1. En forma semejante, el valor de w2 representa
la suma de los n2 rangos correspondientes a la muestra más grande. Observar
que las Wi son las sumas de rangos de Wilcoxon.
La hipótesis H 0 : 1   2 se rechazará a favor de H 1 : 1   2 si W 1 es

suficientemente pequeña, la alternativa H 1 : 1  2 se acepta si W 2 es


suficientemente pequeña; y la alternativa H 1 : 1   2 se acepta si el número de
W1 y W 2 es suficientemente pequeño.

En la práctica, la decisión por lo común se basa en el valor,

n 1 (n 1  1) n 2 (n 2  1)
u1  w 1  o u2  w 2 
2 2

del estadístico correspondiente U1 y U2 o sobre el valor de u del estadístico U, el


mínimo de u1 y u2.

En consecuencia, la hipótesis nula se rechazará siempre que el estadístico


apropiado U1, U2 o U tiene un valor menor o igual que el valor crítico deseado
proporcionado en la tabla U de Mann - Whitney (ver tabla A- 2).

Prueba de la suma de rangos.


Para probar H 0 contra Calcule
H1
µ1 < µ 2 u1
µ1 = µ 2 µ1 > µ 2 u2
µ1 ≠ µ 2 u

Ejemplo 5. Se registran las siguientes muestras de ingresos familiares


mensuales (en dólares) de dos cuidades A y B.

Ingresos A: 850 600 700 910 870 800 700 1050


Ingresos B: 940 1000 1100 880 850 860 780 650 820 700

Utilice la prueba U de Mann – Whitney al nivel de significancia del 5%, para


probar la hipótesis nula de que son iguales los ingresos familiares de las dos
poblaciones A y B contra la hipótesis alternativa de que son diferentes los
ingresos.

Solución.
1. Hipótesis: H 0 : 1   2

contra H 1 : 1   2

2. Nivel de significancia: α = 0.05

3. Estadística de prueba: U de Mann – Whitney (no se supone normalidad)

4. Región critica: Para n1 = 8 y n2 = 10 y α = 0.05, en la tabla A-2 de valores de u,


se obtiene el valor critico igual a 17.
Se rechazará H 0 si u, el menor de los valores de u1 y u2 es menor o igual a 17;
es decir si u ≤ 17.

5. Cálculos. Las observaciones se acomodan en orden ascendente y se asignan


los rangos de 1 a 18.
Ingresos Rangos
600 * 1
650 2
700 * 4
700 * 4
700 4
780 6
800 * 7
820 8
850 * 9.5
850 9.5
860 11
870 * 12
880 13
910 * 14
940 15
1000 16
1050 * 17
1100 18
Los rangos de los ingresos que pertenecen a los ingresos A, la muestra más
pequeña, aparece marcado con asterisco (*).

Ahora: w1 = 1 + 4 + 4 + 7 + 9.5 + 12 + 14 + 17 = 68.5


y
18  19 
w2     68.5  102 .5
 2 

Por lo tanto:
89
u1  68.5   32.5
2

10  11
u 2  102 .5   47.5
2
Luego µ = 32.5

6. Decisión. Dado que u = 32.5 > 17, no se rechaza H 0 y se concluye que son
iguales los ingresos promedios familiares de las dos ciudades.

Nota. Puede verificarse que si se supone normalidad de las variables, utilizando


la prueba t se obtiene t= - 0.735, para una prueba bilateral. Un valor de
P  2  P(t  0.735)  0.473    0.05 . Por lo tanto, también se acepta la
hipótesis H 0.

Aproximación a la teoría normal para dos muestras.


Cuando n1 y n2 exceden de 8, la distribución muestral de u1 (o u2) se aproxima a
la distribución normal con

n1  n2 n1  n2  (n1  n2  1)
Media μu  y Varianza  u2 
1 2 1 12

Por lo tanto, cuando n1 es mayor que 20 y n2 es al menos 9, se puede utilizar el


u1   u
estadístico Z 1
 N (0,1)
u
1
La prueba de Kruskal -Wallis (K muestras independientes).

La prueba de Kruskal - Wallis, llamada también prueba H de Kruskal – Wallis se


utiliza para probar la hipótesis nula de que k muestras independientes provienen
de poblaciones idénticas o de la misma población. Es una generalización de la
prueba U de Mann – Whitney para el caso de K > 2 muestras independientes.

La prueba de Kruskal – Wallis (introducida en 1952), es un procedimiento no


paramétrico para probar la igualdad de medias en el análisis de varianza de un
factor cuando se desea evitarse la suposición de que las muestras se
seleccionaron de poblaciones normales. Se requiere que los valores de las
muestras aleatorias independientes estén cuando menos en escala ordinal.

El procedimiento de la s como sigue:

 Sea ni (i = 1, 2,…, k) el número de observaciones en la i-ésima muestra. Se


combinan las k muestras y se arreglan las n = n1 + n2 +…+ nk observaciones
en orden ascendente e identificándolos de acuerdo al grupo muestral al que
pertenecen.

 Se les asigna el rango apropiado de 1, 2,…, n a cada observación. Si se


encuentran valores iguales, se les asigna como rango el promedio de sus
rangos. La suma de los rangos correspondientes a las ni observaciones en la
muestra i se representa por la variable aleatoria Ri.

Consideremos el estadístico de prueba:


12 k
R i2
H 
n(n  1) i 1 n i
 3(n  1)  χ (2k  1)

Cuando la hipótesis H0: las k poblaciones son iguales, es verdadera y si cada


muestra consiste de al menos 5 observaciones (ni ≥ 5). Luego, para probar H0,
12 k
ri2
calcúlese: h   3(n  1)
n(n  1) i 1 n i
Si h   (2α, k  1) se rechaza H 0 al nivel de significancia de α; de otra manera se

acepta H0.

Ejemplo 2.6. Los datos que siguen representan los tiempos de operación en
horas, de tres tipos de baterías de teléfonos celulares hasta antes que requieran
cargarlas.
Baterías
A B C
24.9 19.8 18.2
26.1 18.2 19.0
22.8 17.5 19.6
21.8 17.5 20.1
25.9 19.2 20.3
18.5 23.4
19.0
19.5
Pruebe la hipótesis que los tiempos promedios de operación para las tres
baterías son iguales, al nivel de significancia α = 0.05.

Solución.

1. Hipótesis: H 0 : 1   2   3

H 1 : No son iguales las tres medias.


2. Nivel de significancia: α = 0.05
12 k
R i2
3. Estadística de prueba: H  
n(n  1) i 1 n i
 3(n  1)  χ (22)

4. Región critica:

R.C = {h /h > 5.99}


2
f( )
 = 0.05

0 2 (0.05,2) = 5.99 2

5. Cálculos. En la tabla siguiente se convierten las 19 observaciones a


rangos y se suman los mismos para cada grupo (baterías).

Rango de la duración de las operaciones


Baterías
A B C
24.9 19.8 18.2
26.1 18.2 19.0
22.8 17.5 19.6
21.8 17.5 20.1
25.9 19.2 20.3
18.5 23.4
19.0
19.5

Se tiene n1 = 5, n2 = 8, n3 = 6, r1 = 83, r2 = 46 y r3 = 61.


12  83 2 46 2 612 
El valor h de la estadística H es: h       3  20
19  20  5 8 6 
 11.446
.
6. Decisión. Dado que h = 11.446 > 5.99, se debe rechazar H 0 y concluir que los
tiempos promedios de duración para las tres clases de baterías son diferentes.

También podría gustarte