Está en la página 1de 7

Pruebas de suma de rangos de Wilcoxon

(Prueba U de Mann – Whitney)

Permite determinar si dos muestras independientes se obtuvieron de la misma población (o de


distintas poblaciones pero con la misma distribución).

La hipótesis nula que se va a probar es que las dos muestras tomadas independientemente
provienen de poblaciones que tienen la misma media (mediana). Esta prueba pude ser de una
o dos colas.

Nota: La prueba paramétrica equivalente es la prueba T.

Se tienen muestras aleatorias de dos poblaciones independientes:


( x 1 , x 2 , x 3 , … , x n )( y 1 , y 2 , y 3 ,… , y n )
1 2

Por lo general, n1 es el número de observaciones de la muestra más pequeña y n2 es el número


de observaciones de la muestra más grande. Cuando las muestras son de igual tamaño n1 y n2
pueden asignarse de manera aleatoria.
El objetivo es probar la hipótesis H 0 : ~
μ 1=~
μ2
En comparación con alguna hipótesis alternativa adecuada H : ~μ <~
μ o~
μ ≠~μ o~
μ >~μ 1 1 2 1 2 1 2

Wilcoxon (1945), propone mezclar ambas muestras, ordenar ascendentemente y asignar


rangos al conjunto de observaciones recordando de qué población proviene.

Suponga que dos muestras (1 y 2) con n1 y n2 observaciones respectivamente, se han tomado


independientemente y que los n1 y n2 valores de las dos muestras se disponen en orden
ascendente. Se asigna un rango a cada valor de acuerdo a su magnitud (el más bajo tiene rango
1, el que sigue, rango 2 y así sucesivamente). Se asigna junto a cada dato el grupo al que
pertenece. Después se calcula la suma de rangos de cada grupo (W 1 y W2)

Ejemplo: Se encuentra que el contenido de nicotina de dos marcas de cigarrillos, medido en


miligramos, es el siguiente:
Marca A 2.1 4.0 6.3 5.4 4.8 3.7 6.1 3.3

Marca B 4.1 0.6 3.1 2.5 4.0 6.2 1.6 2.2 1.9 5.4

Pruebe la hipótesis, en el nivel de significancia de 0.05, de que el contenido promedio de


nicotina de las dos marcas es igual en comparación con una hipótesis alternativa de que son
diferentes.
Paso1: Plantee las hipótesis correspondientes:
H 0 :~
μ A= ~
μB H 1: ~
μA ≠ ~
μB
Paso2: Seleccione un nivel de significancia para su prueba: α =0.05
Paso3: Agrupe las observaciones de ambas muestras (Sin olvidar su procedencia) y ordénelas
de menor a mayor.
0. 1. 2. 2. 2. 3. 3. 4. 4. 5. 6. 6.
Datos 1.9 3.7 4 4 5.4 6.3
6 6 1 2 5 1 3 1 8 4 1 2
Marc
B B B A B B B A A A B B A A B A B A
a
Paso 4: Asigne rango a las observaciones. En caso de empate, reemplace el rango por la media
de los rangos.
0. 1. 2. 2. 2. 3. 3. 4. 4. 5. 6. 6.
Datos 1.9 3.3 4 4 5.4 6.3
6 6 1 2 5 1 7 1 8 4 1 2
Marc
B B B A B B B A A A B B A A B A B A
a
1
Ri 1 2 3 4 5 6 7 8 9 11 12 13 14 15 16 17 18
0

1. 1. 2. 2. 3. 3. 4. 6. 6.
Datos 0.6 2.2 3.7 4 4 4.1 5.4 5.4 6.3
6 9 1 5 1 3 8 1 2
Marc
B B B A B B B A A A B B A A B A B A
a
10. 10. 14.
Ri 1 2 3 4 5 6 7 8 9 12 13 14.5 16 17 18
5 5 5

Paso5: Se calcula la suma de los rangos de cada muestra ( w 1 es asignado a la muestra más
pequeña y w 2 a la muestra más grande):
w 1=4 +8+ 9+10.5+13+14.5+16+18=93
w 2=1+2+3+5+6 +7+10.5+12+14.5+17=78
Podría encontrar a w 2 como:
(n1 +n 2)(n 1+n 2+1) (8+10)(8+ 10+1)
w 2= −w 1 w 2= −93=78
2 2
Paso6: La decisión a tomar se basa en los valores de los estadísticos U1 y U2, los que se calculan
de la siguiente forma:
n1 ( n1 +1 ) n2 ( n2 + 1 )
u1=w1− u 2=w 2− u=min ⁡(u1 , u2)
2 2
8 ( 8+1 ) 10 ( 10+1 )
u1=93− =57 u2=78− =23 u=23
2 2

Se usará el correspondiente estadístico para probar una de las siguientes hipótesis:

Ho H1 Estadístico
~
μ1 < ~
μ2 u1
~
μ1 =~
μ2 ~
μ1 > ~
μ2 u2
~
μ1 ≠ ~
μ2 u

Si el valor del estadístico es menor o igual que el valor critico tabulado se rechaza H 0 al nivel de
significancia seleccionado en el punto 2.
Paso7: Buscamos el valor crítico en la tabla, así:
1. Seleccione la tabla que corresponda a una prueba de una cola o dos colas con el nivel de
significancia de la prueba. En nuestro caso es 𝛼=0.05 prueba de dos colas
2. Seleccione la fila que corresponda al valor de 𝑛1 (8)
3. Seleccione la columna que corresponda al valor de 𝑛 2 (10)
4. El valor donde se cruza la fila y columna buscadas es 17, por lo tanto, el valor crítico
será 17

Paso8: Como los valores calculados de los estadísticos de prueba son:u1=57 y u2=23
El valor de µ es 23

Como la hipótesis nula ( H o ¿ se rechaza si u ≤17


Se puede afirmar que no hay suficiente evidencia con un nivel de significancia del 0.05 para
demostrar que las medianas del contenido de nicotina sean diferentes.

Observaciones
1. Para n1 y n2, ambos menores que 9, el menor valor de U se refiere a la tabla U de valores
críticos para determinar si la hipótesis nula de que no hay diferencia entre las medias debe
rechazarse.
2. Cuando n1 y n2 son mayores o iguales 9, la distribución muestral de U 1 o (U2) se puede
aproximar por una distribución normal apropiada (Cuando no hay empates), esto es:
n1 n2 2 n1 n 2(n1+ n2 +1)
μU = σ =
1
2 U 1
12
El estadístico de prueba cuando H 0 es verdadera será:
u 1−μU
Z= 2
1

√σ U1

3. El uso de la prueba de suma de rangos de Wilcoxon no se restringe a poblaciones no


normales. Se puede utilizar cuando las poblaciones son normales, aunque la potencia será
menor.
4. Se puede probar que µ = n1 n2 - el otro valor de µ
Ejemplo 2:

Prueba la hipótesis de que no hay diferencia entre las edades de los empleados masculinos y
femeninos de cierta compañía. Use un nivel de significancia de 0.10

Hombres 31 25 38 33 42 40 44 26 43 35
Mujeres 44 30 34 47 35 32 35 47 48 34
En este caso, tanto n1 como n2 son iguales a 10 (no es necesario que ambas muestras sean del
mismo tamaño)

Consecutivo Edad Rango Grupo


1 25 1 H
2 26 2 H
3 30 3 M
4 31 4 H
5 32 5 M
6 33 6 H
7 34 7.5 M
8 34 7.5 M
9 35 10 H
10 35 10 M
11 35 10 M
12 38 12 H
13 40 13 H
14 42 14 H
15 43 15 H
16 44 16.5 H
17 44 16.5 M
18 47 18.5 M
19 47 18.5 M
20 48 20 M

Los valores de n son cada uno igual a 10

Los rangos son: w1 = wH = 93.5 y w2 = wM = 116.5

Por lo tanto, el valor de U es:

n1 ( n1 +1 ) n2 ( n2 + 1 )
u1=w1− u 2=w 2− u=min ⁡(u1 , u2)
2 2
10 ( 10+ 1 ) 10 ( 10+1 )
u1=93.5− =38.5u 2=116.5− =61.5 u=38.5
2 2

La hipótesis nula es que las edades promedio (mediana) son iguales, mientras que la hipótesis
alterna dice que estos valores son diferentes.

El valor Z α/2 = Z 0.05 = 1.645

Por lo tanto, se rechaza la hipótesis nula si Zc es mayor que 1.645 o si Zc es menor de -1.645, en
caso contrario no se puede afirmar que las edades promedios sean diferentes

n1 n2 10∗10(10+10+1 )
μU =
2
=
10∗10
2
=50 σU=
√ 12
=√ 175

U −μU 61. 5−50


Z= = =0 . 869
Nuestro Z calculado es: σU √ 175
Este valor está en la región de no rechazo, por esto, se puede asegurar que no hay diferencia
significativa entre las edades promedio de hombres y mujeres

Ejercicios.

1. Los siguientes datos muestran horas anuales perdidas por enfermedad de los 24 hombres y
mujeres de una empresa. Al nivel de significancia de 0.10, ¿existe alguna diferencia
atribuible al sexo? Utilice la prueba suma de rangos de Wilcoxon
Hombres 31 44 25 30 70 63 54 42 36 22 25 50
Mujeres 38 34 33 47 58 83 18 36 41 37 24 48

2. En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido


de cadmio, 15 animales de laboratorio sirvieron de sujetos para el experimento, mientras
que 10 animales similares sirvieron de control. La variable de interés fue la concentración
de hemoglobina después del experimento. Los resultados se muestran a continuación. Se
desea saber si es posible concluir que la inhalación prolongada de óxido de cadmio
disminuye el nivel de hemoglobina. Utilice la prueba suma de rangos de Wilcoxon
Con un α =0.05
14. 16. 15. 15. 13.
Animales expuestos
4 14.2 13.8 5 14.1 16.6 9 15.6 14.1 3 15.7 16.7 7 15.3 14.0
No expuestos 17. 17. 16. 16.
4 16.2 17.1 5 15.0 16.0 9 15.0 16.3 8

También podría gustarte