Está en la página 1de 31

Prueba Mann-Whitney

Wilcoxon
Danny Rivera Montero
Juan David Alvarez G.

Prueba Mann-Whitney Wilcoxon


DATOS
Consiste en dos muestra aleatorias. Sea x1,x2,x3,x4,x5,...,xn una muestra de
tamao n de una poblacin 1 y sea y1,y2,y3,y4,y5,...,ym una muestra de tamao m
de una poblacin 2.
Se asigna el rango 1 a travs de n+m a las dos muestras en la forma habitual.
Qu es, asignar el rango 1 al valor ms pequeo en la muestra combinada de X
y Y, el rango 2 a el siguiente ms pequeo, y as sucesivamente hasta el nmero
mayor que recibe el rango n+m.

Prueba Mann-Whitney Wilcoxon


Sea R(xi) y R(yj) indican el rango asignado a xi y yj, para todo i y j.

Si muchas valores de muestras son exctamente igual uno al otro (empates),


se asigna a cada uno el promedio de los rangos que se les hubieran asignado
si no hubiera habido empates.

Prueba Mann-Whitney Wilcoxon


Supuestos
1.
2.
3.
4.

Ambas muestras, son muestras aleatorias de sus respectivas


poblaciones.
Adems de la independencia dentro de cada muestra, existe una
independencia mutua entre las dos muestras.
Ambas muestras consisten en variables aleatorias continuas. (Un nmero
moderado de empates es tolerable).
La escala de medicin es al menos ordinal.

Prueba Mann-Whitney Wilcoxon


Hiptesis
A.

(Test a dos colas): Sea F(x) y G(x) las funciones de distribucin


correspondientes a las poblaciones 1 y 2 respectivamente, y de x y de y
respectivamente.
H0: F(x) = G(x)

para todo x

H1: F(x) G(x)

para algunos x

Prueba Mann-Whitney Wilcoxon


Hiptesis
A.

(Test a dos colas): Sea F(x) y G(x) las funciones de distribucin


correspondientes a las poblaciones 1 y 2 respectivamente, y de x y de y
respectivamente.
H0: P(X<Y) = 1/2
H1: P(X<Y) 1/2

Prueba Mann-Whitney Wilcoxon


Hiptesis
B. (Test a una cola):
H0: P(X<Y) 1/2
H1: P(X<Y) > 1/2

Prueba Mann-Whitney Wilcoxon


Hiptesis
C. (Test a una cola):
H0: P(X<Y) 1/2
H1: P(X<Y) < 1/2

Prueba Mann-Whitney Wilcoxon


Con el fin de asegurar que la prueba permanezca consistente e imparcial para
las siguientes hiptesis, basta con aadir otra suposicin al modelo anterior.
Supuestos
5. Si hay una diferencia entre las funciones de distribucin de la poblacin, esa
diferencia es una diferencia en la ubicacin de la distribucin. Es decir, si F(x)
es no idntica con G(x), donde F(x) es idntica con G(x+c), donde c es alguna
constante.

Prueba Mann-Whitney Wilcoxon


Hiptesis
A.

(Test a dos colas):


H0: E(X) = E(Y)
H1: E(X) E(Y)

Prueba Mann-Whitney Wilcoxon


Hiptesis
B. (Test a una cola):
H0: E(X) E(Y)
H1: E(X) > E(Y)

Prueba Mann-Whitney Wilcoxon


Hiptesis
C. (Test a una cola):
H0: E(X) E(Y)
H1: E(X) < E(Y)

Prueba Mann-Whitney Wilcoxon


Estadstico de prueba
Suma de los rangos asignados a las observaciones de la poblacin 1:
S=R(xi)
T=S - n(n+1)/2

Prueba Mann-Whitney Wilcoxon


Regla de decisin
El uso de la regla de decisin A, B o C dependiendo de si la hiptesis de inters
est clasificada en A, B o C. Los cuantiles wp de T estn dados en la Tabla 8
del libro de Conover para p igual a .001, .005, .01, .025, .05 y .10. Los cuantiles
de arriba no estn dados pero pueden ser encontrados por la sustraccin de
nm.
w1-p = nm - wp

DISTRIBUCIN DE T

Dado que S=R(xi) es la suma de los rangos de los X, para muestras de tamao
n y m grandes el TCL es aplicable para obtener la distribucin de S, por lo cual S
sigue una distribucin normal con parmetros :
E(S)=n(n+m+1)/2 y V(S)=n(n+m+1)m/12
Dado que T es igual a S menos una constante entonces T sigue una distribucin
normal con los siguientes parmetros:
V(T)=V(S) y E(T)=E(S)-n(n+1)/2=nm/2
wp =E(T)-xp[V(T)] con xp~N(0,1)

Prueba Mann-Whitney Wilcoxon


Regla de decisin
Como una alternativa para usar los cuantiles de arriba, el estadstico T, se
define como:
T = nm - T
A.

Se rechaza H0 a un nivel de significancia si T es menor que /2 cuantil


w /2 o si T es mayor que 1- /2 cuantil w1- /2 . Acepto H0 si T est entre o
igual a los dos cuantiles.

Prueba Mann-Whitney Wilcoxon


Regla de decisin
B. Valores pequeos de T indican que H1 es cierta. Por lo tanto se rechaza H0 a
un nivel de significancia si T es menor que cuantil w . Acepto H0 si T es
mayor o igual a w .
C. Valores grandes de T, o valores pequeos de T, indican que H 1 es cierta. Por
lo tanto se rechaza H0 a un nivel de significancia si T es menor que w1- o
(equivalente) si T es menor que w . Acepto H0 si T es menor o igual a w1- .

Ejemplo 1
La clase mayor de una escuela secundaria tena cuarenta y ocho muchachos.
Doce de ellos vivan en granjas y los otros treinta y seis vivan en la ciudad. Una
prueba fue ideada para ver si los muchachos de la granja en general eran ms
fsicamente aptos que los muchachos de la ciudad. Cada estudiante de la
clase recibi una prueba de aptitud fsica en la cual una puntuacin baja indica
una condicin fsica deficiente. Las puntuaciones de los chicos de la granja (X i)
y de los chicos de la ciudad (Yj) son las siguientes:

Puntuaciones
Muchachos de granja

Muchachos de ciudad

14.8

10.6

12.7

16.9

7.6

2.4

6.2

9.9

7.3

12.5

14.2

7.9

11.3

6.4

6.1

10.6

5.6

12.9

12.6

16.0

8.3

9.1

15.3

14.8

6.3

16.1

2.1

10.6

6.7

6.7

10.6

5.0

9.0

11.4

17.7

5.6

3.6

18.6

1.8

2.6

4.2

2.7

11.8

5.6

1.0

3.2

5.9

4.0

Supuestos e Hiptesis

Ningn grupo de muchachos es una muestra aleatoria de una poblacin


cualquiera. Sin embargo, es razonable suponer que estas puntuaciones se
asemejan a muestras aleatorias hipotticas de las poblaciones de los
muchachos de la granja y de la ciudad en ese grupo de edad, al menos para
localidades similares. Los otros supuestos del modelo parecen ser razonables,
como la independencia entre grupos. Por lo tanto, la prueba de Mann-Whitney
se selecciona para probar:
H0: Los muchachos de granja no tienden a ser ms aptos, fsicamente, que los
los nios de ciudad.
H1: Los muchachos de granja tienen tendencia a ser ms aptos, fsicamente,
que los nios de ciudad.

Puntuaciones
X

4.0

1.0

1.8

2.1

5.0

11

6.4

19

9.1

27

2.4

5.6

13

6.7

20.5

9.9

28

2.6

5.6

13

6.7

20.5

10.6

30.5

22

10.6

30.5

4.2

10

6.2

17

6.3

18

8.3

25

9.0

26

11.3

33

11.4

14.8

41.5

34
14.8

2.7

5.6

13

7.3

3.2

5.9

15

7.6

23

3.6

6.1

16

7.9

24

10.6

30.5
10.6

30.5

11.8

41.5

35
36

15.3

43

12.6

37

16.0

44

12.7

38

12.5

12.9
14.2

16.1

45

39

16.8

46

40

17.7

47

18.6

48

Hay cuatro grupos de puntuaciones vinculadas, 5.6, 6.7, 10.6 y 14.8 .Dentro de
cada grupo se promedian los rangos que deberan haber sido asignados, y en
cambio se asigna el rango promedio.
El test es de una sola cola. La regin crtica corresponde a valores grandes de
T. Debido a que m, el nmero de valores de Y, excede de 20, se utiliza la
aproximacin de muestra grande al final de la Tabla de cuantiles de
Mann-Whitney. La regin crtica de tamao aproximado 0,05 corresponde a
valores de T mayores que w.95

Clculo del estadstico y Regin de Rechazo

La suma S de rangos asignados a los X es:

Conclusin

Debido a que T es menor que 285.1, se acepta la hiptesis nula. El valor-p de


este caso es 0.26, Es decir, no se ha demostrado por estos datos que los
muchachos de la granja son ms fsicamente aptos que los muchachos de la
ciudad.

Ejercicio 1
Se dise un experimento simple para ver si el pedernal en la zona A tenda a
tener el mismo grado de dureza que el pedernal en la zona B. Se recogieron
cuatro piezas de muestra de pedernal en la zona A y cinco piezas de la zona B.
Para determinar cul de las dos piezas de pedernal era ms duro, las dos
piezas se frotan entre s. La pieza de pedernal tuvo menos dao fue juzgada
como la pieza ms dura de los dos. De esta manera se ordenaron nueve piezas
de pedernal segn la dureza. El rango 1 fue asignado a la pieza ms blanda, el
rango 2 al siguiente ms suave, y as sucesivamente.

Datos

Origen de pieza

Rango

Ejercicio 2
En un laboratorio de ambiente controlado, diez hombres y diez mujeres fueron
probados para determinar la temperatura ambiente que encontraron que era
la ms cmoda. Suponiendo que estas temperaturas se asemejan a una
muestra aleatoria de sus respectivas poblaciones, es la temperatura promedio
cmoda lo mismo para hombres y mujeres. Los resultados fueron los
siguientes.

DATOS

Men

74

72

77

76

76

73

75

73

74

75

Women

75

77

78

79

77

73

78

79

78

80

BIBLIOGRAFA
W. J. Conover, Wiley & Sons Practical nonparametric Statistics 1971.