Está en la página 1de 11

TEXTO UNIVERSITARIO

LA PRUEBA DE RACHAS DE UNA MUESTRA



UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
FACULTAD DE CIENCIAS ECONMICAS Y ADMINISTRATIVAS
DEPARTAMENTO ACADMICO DE CIENCIAS ECONMICAS
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

1
LA PRUEBA DE RACHAS DE UNA MUESTRA
Si un experimentador desea llegar a una conclusin acerca de una poblacin usando la
informacin contenida en una muestra de ella, su muestra debe ser aleatoria En aos
recientes, se han desarrollado varias tcnicas que nos permiten probar que una mues-
tra es aleatoria. Estas tcnicas se basan en el orden o secuencia en que los puntajes u
observaciones del individuo fueron obtenidos originalmente.
La tcnica que presentaremos aqu se basa en el nmero de rachas que la muestra ex-
hibe. Se define una racha como una sucesin de smbolos idnticos que pueden estar o
no estar separados por otros smbolos.
Por ejemplo, supongamos una serie de smbolos de ms y menos ocurrida en este
orden:
++ --- + ---- ++ -
Esta muestra de puntajes empieza con una racha de dos ms, la sigue otra racha de
tres menos, a continuacin otra de un ms, enseguida cuatro menos, dos ms,
etc. Podemos agruparlos en rachas, contando las series de smbolos idnticos:
++ --- + ---- ++ - +
1 2 3 4 5 6 7
Observamos que R, el nmero de rachas, es de 7.
El nmero total de las rachas de una muestra de cualquier tamao nos seala si la
muestra es o no es aleatoria. La escasez de rachas puede deberse a tendencias tem-
porales o a cierta falta de independencia. Por otra parte, al ocurrir rachas abundan-
tes, las fluctuaciones cclicas sistemticas de corto periodo pueden causar esta in-
fluencia en los puntajes.
Por ejemplo, supongamos que lanzamos al aire 20 veces una moneda y observamos la
siguiente secuencia de caras (C) y sellos (S):
C C C C C C C C C C S S S S S S S S S S
En 20 lanzamientos, ocurrieron solamente dos rachas. Esto es muy poco si se trata de
una moneda "legal" (lo de un jugador honesto) y sugiere que hay falta de independencia
en los eventos. Por otra parte, supongamos que ocurri la siguiente secuencia:
C S C S C S C S C S C S C S C S C S C S
Aqu se observan demasiadas rachas. En este caso, siendo R=20 cuando n=20, es otra
vez razonable rechazar la hiptesis de que la moneda es "legal". Ninguna de las fre-
cuencias anteriores parecen ser series al azar de C y S.
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

2
Ntese que el anlisis basado en el orden de los eventos nos da una informacin que no
proviene de la frecuencia de los mismos. En ambos casos, ocurrieron 10 sellos y 10 ca-
ras. Si se analizaran los puntajes de acuerdo a sus frecuencias, por ejemplo, usando la
prueba Chi-Cuadrado o la prueba binomial, no tendramos razn para sospechar que la
moneda no fuera "legal". La prueba de rachas solamente no atiende sino al orden de los
eventos, descubriendo en una fuerte falta de aleatoriedad de los puntajes y as, la po-
sible "legalidad" de la moneda.
La distribucin muestral de los valores de R que podemos esperar de repetidas mues-
tras al azar es conocida. Usando esta distribucin muestral, podemos saber cundo
una muestra observada tiene ms o menos rachas de las que probablemente ocurriran
en una muestra al azar.
Cuando los datos a probar, si provienen de un muestreo al azar, son valores numricos,
se debe seguir el siguiente procedimiento para clasificarlos en dos categoras o cla-
ses:
1. Se determina la mediana de los valores observados.
2. Se asigna como categora 1 (por ejemplo A) a cada valor muestral observado
que resulte ser menor que el valor de la mediana, se asigna como categora 2
(por ejemplo B) a los valores que son mayores o igual que el valor de la media-
na.
3. Se ordena en orden secuencial por categora o clases (A o B), tal como se
han observado los valores muestrales.

MTODO
Sea n
1
el nmero de elementos de una clase, y n
2
el nmero de elementos de la otra; n
1

podra ser el nmero de caras y n
2
el de sellos; o n
1
podra ser el nmero de signos de
ms y n
2
el de signos de menos. Sea n
a
el nmero total de eventos observados,
n
a
= n
1
+ n
2
. puede suceder que n=n
a
si los valores observados son cualitativos.
Al usar la prueba de rachas de una muestra, se observan en primer lugar los eventos n
1

y n
2
en el orden que han ocurrido y se determina el valor de R.
La hiptesis nula y alternativa para una prueba de rachas son:
H
0
: La serie de datos son escogidos al azar
H
a
: La serie de datos no son escogidos al azar

LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

3







MUESTRAS PEQUEAS
Si tanto n
1
como n
2
son iguales o menores que 20, encontraremos en la tabla F (para
prueba de rachas) los valores crticos de R conforme a H
0
considerando o=0.05. Son
valores crticos de su distribucin muestral: Si el valor observado de R est entre los
valores crticos, se acepta H
0
. Si el valor observado de R es igual o ms extremo que
uno de los valores crticos, se rechaza H
0
.
Son dos las tablas, F
I
y F
II
. La tabla F
I
contiene valores de r tan pequeos, que la pro-
babilidad asociada con su ocurrencia conforme a H
0
es p=0.025. La tabla F
II
contiene
valores de R tan grandes, que la probabilidad asociada con su ocurrencia conforme H
0

es p=0.025.
Cualquier valor observado de R igual a o menor que el de la tabla F
I
, o igual a o mayor
que el de la tabla F
II
, queda en la regin de rechazo considerando o=0.05.
Por ejemplo, en la primera serie de lanzamientos de la moneda observamos dos rachas:
una de 10 caras seguida por otra de 10 cruces. Aqu, n
1
=10, n
2
=10, y r=2. La tabla F
muestra que a estos valores de n
1
y n
2
, corresponde una muestra aleatoria de ms de 6
rachas y menos de 16. Cualquier r observada de 6 (o menos) o de 16 (o ms) est en la
regin de rechazo en o=0.05. La R observada de 2 es menor que 6; por tanto, al nivel
de significacin de 0.05 se rechaza la hiptesis de nulidad que supone series aleato-
rias de caras y cruces producidas por esta moneda.
Al considerar adecuada una prueba de una cola, es decir, al ser predeterminada la di-
reccin de desviacin de la aleatoriedad, solamente se necesita examinar una de las
dos tablas. Si se predice una observacin de muy pocas rachas, la tabla F
I
abarca los
valores crticos de R. Si la R observada bajo la prueba de una cola es igual a o menor
que la de la tabla F
I
, H
0
puede rechazarse en o=0.025. Si se predice una observacin
de demasiadas rachas, la tabla F
II
abarca los valores crticos de R significativos al ni-
vel 0.025.

Z
(o/2)
- Z
(o/2)

1- o
o/2 o/2
Se
acepta
H
a

Se
acepta
H
0

Se
acepta
H
a

LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

4
Veamos ahora el caso de la segunda secuencia de lanzamientos de la moneda. Supon-
gamos se ha hecho la prediccin de que con esta moneda se producirn demasiadas ra-
chas. Como R=20, y n
1
=10 y n
2
=10, y puesto que el valor observado de R es igual o ma-
yor que el mostrado en la tabla F
II
, podemos rechazar H
0
en o=0.025, y concluir que la
moneda es "legal" en la direccin predicha.
EJEMPLO
En un estudio de la dinmica de la agresin en nios menores, la experimentadora ob-
serv varias parejas de nios en una situacin de juego controlada. La mayora de los
24 sujetos infantiles del estudio provena de la misma guardera y por tanto jugaban
juntos diariamente. En vista de que la experimentadora fue observando solamente dos
nios cada da, investig qu propensiones reflejara el estudio debido a las discusio-
nes entre aquellos nios que ya haban servido como sujetos y aquellos que no lo haban
hecho an. Si las discusiones tenan efectos sobre el nivel de agresin durante las se-
siones de juego, las consecuencias podran sealar en el orden de los puntajes de
agresin una carencia de aleatoriedad. Al finalizar el estudio, fue probada la aleato-
riedad de la sucesin de puntajes convirtiendo el puntaje de agresin de cada nio en
un A o un B, de acuerdo con que quedara por debajo o por encima de la mediana del
grupo y aplicando la prueba de rachas de una muestra a la sucesin observada.
TABLA
Puntaje de agresin en orden de ocurrencia
Nio Puntaje
Clase de
puntaje
con res-
pecto a la
mediana
Nio Puntaje
Clase de
puntaje
con res-
pecto a la
mediana
1 31 B 13 15 A
2 23 A 14 18 A
3 36 B 15 78 B
4 43 B 16 24 A
5 51 B 17 13 A
6 44 B 18 27 B
7 12 A 19 86 B
8 26 B 20 61 B
9 43 B 21 13 A
lo 75 B 22 7 A
11 2 A 23 6 A
12 3 A 24 8 A
MEDIANA 25
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

5
1) HIPOTESIS:
H
0
: La sucesin las categoras A y B ocurren al azar.
H
a
: La sucesin de las categoras A y B no ocurre al azar.
2) NIVEL DE SIGNIFICANCIA: o=0.05.
3) REGIN DE RECHAZO: Puesto que H
a
no predice la direccin de la desviacin
que supone, se usa un test de dos colas. H
0
ser rechazada a nivel de significa-
cin 0.05 si R es igual o menor que un valor apropiado de la tabla F
I
o es igual a o
mayor que un valor apropiado de la tabla F
II
. Para n
A
=12 y n
B
=12, la tabla F
muestra que la regin de rechazo consiste en los valores de R de 7 o menores y
los valores de R de 19 o mayores.
4) DETERMINACIN DE R: La tabla muestra los puntajes de agresin de cada
nio en el orden en que ocurrieron. La mediana de este conjunto de puntajes es
25. Todos los puntajes por debajo de la mediana se designan como A en la ta-
bla; y todos los que quedan por encima de la mediana se designan como B. En la
columna que muestra la serie de B y A se puede rpidamente observar que
ocurrieron 10 rachas en esta serie, por tanto, R=10.
5) CONCLUSION: La referencia a la tabla F nos revela que R=10 para n
A
=12 y
n
B
=12 no cae en la regin de rechazo ( 19 10 7 < < ). Por tanto, se puede decidir
que es aceptable la hiptesis de nulidad que supone una muestra de puntajes
ocurrida al azar, a un nivel de confianza del 95%.
MUESTRAS GRANDES
Si n
1
o n
2
es mayor que 20, la tabla F no puede usarse. Para muestras tan grandes, una
buena aproximacin a la distribucin muestral de R es la distribucin normal, con
1
2
2 1
2 1
+
+
=
n n
n n
R

( )
( ) ( ) 1
2 2
2 1
2
2 1
2 1 2 1 2 1
+ +

=
n n n n
n n n n n n
R
o
Por tanto, cuando
1
n o
2
n es mayor que 20, H
0
puede probarse as:
R
c
R
R
z

=
Las hiptesis nula y alternativa para una prueba de dos extremos son:
H
0
: La serie de datos son escogidos al azar
H
a
: La serie de datos no son escogidos al azar
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

6






Los valores de z que son dados por la frmula son, conforme a H
0
aproximadamente
distribuidos en forma normal con media de cero y varianza de uno; por tanto la signifi-
cacin de cualquier valor observado de z calculado con esta frmula puede determi-
narse por medio de la tabla de curva normal. Esto es, en la tabla distribucin normal
estandarizada se encuentran las probabilidades de una cola asociadas con la ocurren-
cia conforme a H
0
de valores tan extremos como el de cierta z observada.
EJEMPLO
Se interesa en descubrir el carcter ordenado o azaroso de la colocacin de hombres
y mujeres en la cola frente a la taquilla de un cine. Los datos se obtuvieron simplemen-
te anotando el sexo de 50 personas en el momento de acercarse a la taquilla.
TABLA
Orden de 30 hombres (M) y 20 mujeres (F) formados frente a la taquilla del cine
M F M F MMM FF M F M F
M F MMMM F M F M F MM FFF
M F M F M F MM F MM F
MMMM F M F MM

1) HIPOTESIS:
H
0
: La serie de hombres y mujeres en la cola, es al azar.
H
a
: La serie de hombres y mujeres en la cola, no es al azar.
2) NIVEL DE SIGNIFICANCIA: o=0.05.
3) REGIN DE RECHAZO: H
a
no predice la direccin de la desviacin respecto al
azar, en consecuencia, se usa una regin de rechazo de dos colas. La regin de
rechazo, por tanto, incluye todos los valores de z iguales a o ms extremos que
1.96.

Z
(o/2)
- Z
(o/2)

1- o
o/2 o/2
Se
acepta
H
a

Se
acepta
H
0

Se
acepta
H
a

LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

7





4) DETERMINACIN DE R y z
c
: La muestra fue de 30 hombres y 20 mujeres. El
examen de los datos de la tabla, determina que R=35 es el nmero de rachas, y
por lo tanto:
( )( )
25 1
20 30
20 30 2
= +
+
=
R

( )( ) ( )( ) ( )
( ) ( )
2
2 30 20 2 30 20 30 20
3.3564
30 20 30 20 1
R
o

= =
+ +

35 25
2.98
3.3564
c
z

= =
5) CONCLUSION: Como
c
z es mayor que
025 . 0
z (2.98>1.96), entonces se acepta la
H
a
, es decir, la serie de hombres y mujeres en la cola, no es al azar, a un nivel
de significancia del 5%.
METODO DE PROBABILIDAD
1) HIPOTESIS:
H
0
: la serie de hombres y mujeres en la cola, es al azar.
H
a
: la serie de hombres y mujeres en la cola, no es al azar.
2) NIVEL DE SIGNIFICANCIA: o=0.05.
3) REGIN DE RECHAZO: H
a
no predice la direccin de la desviacin respecto al
azar, en consecuencia, se usa una regin de rechazo de dos colas. La regin de
rechazo, por tanto, incluye todos los valores de z iguales a o ms extremos que
1.96.





1.96 - 1.96
0.95
Se
acepta
H
a

Se
acepta
H
a

Se
acepta
H
0

0.025 0.025

1.96 - 1.96
0.95
Se
acepta
H
a

Se
acepta
H
a

Se
acepta
H
0

0.025 0.025
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

8
4) DETERMINACIN DE R,
c
z y | |
c
z Z P > 2 : La muestra fue de 30 hombres y
20 mujeres. El examen de los datos de la tabla, determina que R=35 es el nme-
ro de rachas, y por lo tanto:
( )( )
25 1
20 30
20 30 2
= +
+
=
R

( )( ) ( )( ) ( )
( ) ( )
2
2 30 20 2 30 20 30 20
3.3564
30 20 30 20 1
R
o

= =
+ +

35 25
2.98
3.3564
c
z

= =
| | ( )( ) 2 2.98 2 0.0014 0.003 P Z > = =
5) CONCLUSION: Como | |
2 2.98 0.003 P Z > = es menor que | | 05 . 0 = o , entonces se
acepta la H
a
, es decir, la serie de hombres y mujeres en la cola, no es al azar, a
un nivel de significancia del 5%.
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

9
TABLA F. Tabla de valores crticos de R en la prueba de Rachas
Se dan en los cuerpos de las tablas F
I
y F
II
diferentes valores crticos de R para
distintos valores de n
1
y n
2
. Para la prueba de las rachas de una muestra, cual-
quier valor de R es igual o menor que el que aparece en la taba F
I
, o igualo ma-
yor que el que aparece en la tabla F
II
es significativo en el nivel 0.05.
LA PRUEBA DE RACHAS DE UNA MUESTRA Estadstica No Paramtrica


Daniel Guzmn Rojas

10

También podría gustarte