Está en la página 1de 8

PRUEBA DE LAS RACHAS DE WALD-WOLFOWITZ

Este Test contrasta si dos muestras con datos independientes proceden de


poblaciones de la misma distribucin. Si esto es as lgicamente los parmetros
poblacionales de ambas muestras son los mismos.
Sean dos muestras independientes de tipo continuo que siguen una
determinada distribucin F(x) F(y):
x 1 x 2 .. x n
y 1 y 2 .. x n
Se trata de contrastar la hiptesis de:
H 0 : F ( X )=F (Y )
H0: F ( X ) o F (Y )
Esta prueba se basa en la prueba de rachas. Consiste en ordenar todos los casos
de ambos grupos de forma conjunta, dispuestos en orden, se cuentan las
rachas pertenecientes al mismo grupo. Si existen muy pocas rachas, existe
diferencia entre ambos grupos. Con muchas rachas (posiciones muy
entrelazadas) no existe diferencia entre los grupos.
Ejemplo 1:
Se dispone de las siguientes dos muestras de dos poblaciones A
y B independientes.
A
B

6'
6'

3'
3'

2'
2'

4'
7'

5'
4'

5'
9'

7'

7'

8'

3'

Realizar un test de W-W con un nivel de significacin del 5% , para


contrastar si las poblaciones tienen distribuciones idnticas.
2
A

2
B

3
B

3
B

3
A

4
A

4
B

5
A

5
A

6
A

6
B

7
B

7
B

7
B

8
B

9
B

Una vez ordenado de menor a mayor y sabiendo en ese orden a que muestra
pertenece, procedemos a obtener las rachas.
1 (A)
R1 = 3
N1 = 6
R=6
N = 16

2(B)

R2 = 3

N2 = 10

Como ni N1 N2 son iguales o mayores de 20, procedemos a buscar en la tabla


con un nivel de significacin del 0'05 y N1 =6 N2 = 10 y obtenemos dos valores RI
RS 4 - 13 que constituyen la frontera de la regin critica.
Como R = 6 a la regin critica
Se acepta la hiptesis
Nula
Si el valor de N1 y N2 son mayores de 20 al igual que hacamos en la prueba de
rachas lo aplicaramos aqu. El estadstico R que tomara valores 2 , 3 , ... N1+ N2
tiene una probabilidad P [ R=r ] y la distribucin asinttica de R es una NORMAL
con:
2. N 1 . N 2+ n
E ( R )=
n

Var ( R )=

2. N 1 . N 2 (2. N 1 . N 2 n)
n2 .(n1)

H0
Bajo
: Existe aleatoriedad , los valores de R no deben ser
excesivamente pequeos ni grandes, por lo que a nivel de significacin se
rechaza la H0 si:
Rexp r /2 Rexp r 1 /2
Rechazaremos la

H0

si

Z exp Z 1/2 , donde Z sigue una N(0, 1) siendo:

|R expE( R)|0.5

Z exp =

Ejemplo 2:
Supongamos que hemos observado estos puntajes del grupo A (compuesto
por 3 casos; n1=3 ) y del grupo B (compuesto por 4; n2=4 :
Puntajes del grupo A

12

16

Puntajes del grupo B

11

Cuando estos se colocan en series 7 puntajes se colocan en una serie


ordenada, tenemos:
3

11

12

16

Ntese que observamos la identidad de cada puntaje acompandolo del smbolo


del grupo que pertenece. Luego observamos el orden de su ocurrencia (Ay B) para
determinar el nmero de rachas. En todos del grupo B y as se constituye una racha
de B; el siguiente puntaje es una racha de una sola A; sigue otra racha constituida
por una B; y los dos puntajes ms grandes son ambos del grupo A y constituyen la
racha final.
Ahora podemos deducir que si las dos muestras son de la misma poblacin (es
decir, si H 0 es verdadera), entonces los puntajes de A y B estarn mezclados.
H0
En ese caso, el nmero de rachas ser relativamente grande. Cuando
es
falsa, r es pequea.
Por ejemplo, r ser pequea si las dos muestras se sacaron de poblaciones que
tienen diferentes medianas. Supongamos que la poblacin de la que se recogieron
los casos A tena una mediana ms grande que la poblacin de los casos B. En la
serie ordenada de puntajes procedentes de las dos muestras, esperaramos una
racha larga de B en el extremo inferior de la serie y una racha de A en el extremo
superior; consecuentemente tendramos r relativamente pequea.
Adems, supongamos que las dos muestran se recogieron de poblaciones que
difieren en variabilidad. Si la poblacin de los casos B era homognea o compacta,
esperaramos una larga racha de A en cada extremo de la serie ordenada y as, un
valor relativamente pequeo de r.
Pueden representarse argumentos similares para mostrar que cuando las
poblaciones de las que fueron sacados los casos n1 y n2 .
En general, se rechaza

H 0 si r, el nmero de rachas, es muy pequeo

La distribucin muestral de r proviene de que cuando dos clases diferentes de


objetos (digamos n1 y n2 ) son dispuestas en una sola lnea, el nmero total de
posibles arreglos es:

n1 +n2
n1

) (
=

n1 +n2
n2

A partir de esto, se puede demostrar (Steven, 1939; Mood, 1950, pag.392-393) que
la probabilidad de obtener un valor observador de r o un valor an ms pequeo es:
1
P ( r r )=
n 1+ n2
n1

( )( )

n11 n21
(2) r 1 r 1
r =2
2
2
r'

'

Cuando r es un nmero par. Cuando r es un nmero impar, esa probabilidad se


deduce a partir de:

(nk11)( nk 11)+ (nk11)( nk 11)


1

P ( r r' ) =

1
n1 +n2
n1

r'

, donde r=2k-1

r=2

Ejemplo 3: Muestras pequeas


Doce nios y doce nias de 4 aos de edad fueron observados durante
sesiones de juego de 15 minutos y el juego de cada nio durante ambos
periodos fue calificado por incidencia y grado de agresin. Con estos
puntajes, es posible probar la hiptesis que hay diferencias sexuales en l
cantidad de agresin exhibida.
SOLUCIN:
i.

Hiptesis nula.

H 0 : La incidencia y grado de agresin son los

mismos en los nios de cuatro aos de ambos sexos.

ii.

iii.

H 1 : los nios

de cuatro aos y las nias de la misma edad muestran diferencias en


la incidencia y grado de agresin.
Prueba estadstica. Como los datos estn en una escala ordinal y la
hiptesis concierne a cualquier clase de diferencias entre los puntajes
de agresin de dos grupos independientes (nios y nias), se escogi
la prueba de las rachas de Wald-Wolfowitz.
Nivel de significacin. Sean =0.05, n1=12= nmero de nios y
n2=12=nmero de nias.

iv.

Distribucin muestral. A partir de la distribucin muestral de r, se han


tabulado valores crticos en la tabla F I para valores n1 y n2 20
. ( Aunque

n1 =

n2 ) son tan pequeos que la probabilidad

asociada con su ocurrencia conforme a

H0

es igual o menor que

=0.05
v.

Decisin. Se obtuvo el puntaje de cada nio por su agresin total en


ambas sesiones. Estos puntajes se dan en la tabla 1.

TABLA 1
Nios

Nias

86

55

69

40

72

22

65

58

113

16

65

118

45

16

141

26

104

36

41

20

50

15

Ahora si combinamos los puntajes de los nios (las B) y de las nias (las G) en una
sola serie ordenada, podemos determinar el nmero de rachas de G y de B. Esta es
la serie de la tabla 2.

TABLA 2

Puntaje

15

16

16

20

22

26

36

40

Grupo
Rachas

G
1

Puntaje

41

45

50

55

58

Grupo
Rachas

B
2

Puntaje

65

65

69

86

104

113

118

141

Grupo
Rachas

BB

3
72

Cada racha esta subrayada, y observamos que r=4. La referencia a la tabla


Fi revela que para los valores n1 =12 y n2=12 , una r de 7 es significativa al
nivel 0.05. ya que nuestro valor de r es menos que el tabulado, podemos rechazar
H 0 en =0.05 . Concluimos que los nios y las nias muestran diferencias en
agresin en la situacin de juego libre.
Ejemplo 4:
Cuando se extirpa uno de los ovarios a una rata (hemicastracin), el ovario
remanente sufre el proceso de hipertrofia compensadora (HCO), que equivale
a un aumento en su peso. Con el propsito de estudiar si la HCO vara
dependiendo del ovario que se extirpe (derecho o izquierdo), se
hemicastraron un nmero al azar. Despus de 20 das se realizaron autopsias
a las ratas y se determin el porcentaje de aumento en peso del ovario
remanente en relacin al peso del ovario extirpado al momento de la
hemicastracin (el peso de ambos ovarios no es significativamente diferente a
un animal entero). Pruebe la hiptesis de que no existe diferencia en HCO si
se extirpa el ovario derecho o el izquierdo, usando la prueba de WaldWolfowitz. Los datos se muestran en la siguiente tabla.
% de HCO
# de rata
1
2
3
4
5
6
7
8

OD
32
43
110
112
89
68
28
75

#de rata
1
2
3
4
5
6
7
8

OI
32
42
18
36
68
28
38
40

9
10
11
12
13
14
15
16

143
100
95
35
29
53
141

9
10
11
12
13
14
15
16
17

104
123
105
65
77
96
22
14
57

SOLUCIN:
Primero ordenamos los datos en sentido ascendente, con la ayuda de un diagrama
de tallo y hoja.
1 48
2 2889
3 22568
4 23
5 37
6 588
7 57
8 9
9 56
10 045
11 02
12 3
13
14 13

Por lo tanto los datos ordenados con sus correspondientes etiquetas indicando a
que tipos pertenecen son:
14

18

22

28

28

29

32

32

35

36

38

40

42

43

53

57

65

68

68

75

77

89

95

96

100 104 105 110

112

123 141 143

El nmero de rachas est entre 18 y 20, 18 r <20

n1 =15 y

n2 =17.

Decisin y conclusin: como Rcalc=18 r 0.95 .15.17 =11, no se rechaza

H0 ,

entonces las HCO no son significativamente diferentes para le hemicastracin


izquierda y derecha.
Ejemplo 5:
Se ha contado el nmero de caries presentes en pacientes diabticos y en
pacientes sanos, los valores obtenidos son los siguientes:
Diabtico
s
Sanos

11

13

12

14

12

10

12

11

Pruebe la hiptesis de que el nmero de caries en pacientes sanos es ms


variables que en pacientes diabticos.
SOLUCIN:
Los datos en orden ascendente son:
1

10

11

11

12

12

S
S

S
S

S
S

S
S

S
S

S
D

D
D

S
S

D
S

S
S

S
S

D
S

S
D

D
D

S
D

1
2
D
S

1
3
D
D

14
D
D

Decisin y conclusin: El nmero de rachas est dentro de 6 a y 10. Ya que se


pueden arreglar las etiquetas de diferentes manera, 6 r <10 y r 0.95,7.10 =5, en
cualquiera de los casos rcalc rtablar ,

por lo tanto no se rechaza

H0 ,

concluyndose que el nmero de caries en personas sanas no es ms variable que


en personas diabticas.