Prueba de Corridas Ó de Rach

También podría gustarte

Está en la página 1de 16

lOMoAR cPSD| 12874333

lOMoAR cPSD| 12874333

PRUEBA DE CORRIDAS DE UNA SOLA MUESTRA.

Hasta ahora, se ha utilizado el supuesto de que las muestras en los problemas se


seleccionaron aleatoriamente, es decir, se eligieron sin preferencia o sesgo. Sin
embargo, en muchos casos resulta sospechosa la selección de elementos de una
muestra, ya que se observa algún tipo de patrón o alguna igualdad entre elementos
distintos, para comprender esta situación, se presentan estos ejemplos:

Una muestra aleatoria de 8 alumnos de una población de 40, son seleccionados para
tomar un curso avanzado de Excel (sin importar el sexo), para ello se denota: H=
hombre y M= mujer. La muestra está dada de la siguiente manera:

H, H, M, M, H, H, M, M

Al observar la muestra, se identifica primeramente que la selección ha resultado con


pares de alumnos del mismo sexo y además que se ha dividido de manera igual entre
los sexos, por lo cual se puede inferir que el proceso no es aleatorio. Un proceso
aleatorio rara vez enumeraría dos elementos en grupos alternos de 2. Supóngase que
ahora la muestra aleatoria está dada de la siguiente manera:

H, M, H, M, H, M, H, M

En este caso es bastante improbable que un proceso de selección aleatoria esté dado
por un patrón de orden alterno uno a uno entre hombres y mujeres, y que además la
proporción entre los sexos sea igual. Por lo cual se sospecha de la selección aleatoria.
Para probar que dicha muestra es seleccionada de forma aleatoria se recurre a la
prueba de corridas. Una corrida es una secuencia de ocurrencias idénticas precedidas
y seguidas de ocurrencias diferentes o del todo por ninguna, para comprender mejor el
concepto se propone el siguiente ejemplo:
lOMoAR cPSD| 12874333

La muestra del ejemplo anterior esta dada de la siguiente manera:

H, M, M, H, M, H, H, H

Entonces de la secuencia tiene 5 corridas. En este caso para una prueba de corridas
se usaría los siguientes símbolos si solo tuvieran dos tipos de ocurrencias:

n1= número de ocurrencias de tipo 1 (número de hombres= 5)

n2= número de ocurrencias de tipo 2 (número de mujeres= 3)

r= número de corridas (5)

LA DISTRIBUCION DE MUESTREO DEL ESTADÍSTICO r

El número de corridas, r, es un estadístico con su propia distribución de muestreo


especial y su propia prueba. Es obvio que las corridas pueden ser de diferente longitud
y en una muestra pueden ocurrir diversos números de corridas. Los estadísticos
pueden probar que demasiadas corridas o muy pocas en una muestra indican que
intervino algo más que el azar cuando se seleccionaron los elementos. Una prueba de
corridas de una sola muestra, entonces, está basada en la idea de que muy pocas o
demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente.
Para derivar la media de la distribución de muestreo del estadístico r, se utiliza la
siguiente fórmula:
lOMoAR cPSD| 12874333

El error estándar del estadístico r puede calcularse con esta fórmula:

PRUEBA DE HIPÓTESIS
En la prueba de corridas de una sola muestra, la distribución muestral de r puede
aproximarse de cerca por la distribución normal si n1 o bien n2 es mayor que 20. En
una prueba de corridas de una sola muestra, no es adecuado formular la hipótesis con
símbolos.

Hipótesis nula= la muestra está seleccionada aleatoriamente.

Hipótesis alternativa= la muestra no está seleccionada aleatoriamente.


Ya que se utiliza la distribución normal, se calcula el y además el estadístico z,
2

dado por:

r −μr
Z=
σr


Por lo tanto, luego se compara y Z , para conocer así la conclusión de la
2

prueba de corridas. Se tienen dos casos:

Si ocurre que: ∣z ∣∈∣z∣


α
2
, se acepta la hipótesis nula y se concluye que la muestra esta

seleccionada aleatoriamente.

Si ocurre que: ∣z ∣≥∣z∣


α
2
, se rechaza la hipótesis nula a favor de la hipótesis

alternativa, se concluye que la muestra no esta seleccionada aleatoriamente


lOMoAR cPSD| 12874333

PRUEBA DE KOLMOGOROV- SMIRNOV

La prueba de Kolmogorov-Smimov, bautizada así en honor de los estadísticos A. N.


Kolmogorov y N. V. Smirnov que la desarrollaron, se trata de un método no paramétrico
sencillo para probar si existe una diferencia significativa entre una distribución de
frecuencias observada y una distribución de frecuencias teórica.

El estadístico de K-S, Dn, es particularmente útil para juzgar qué tan cerca está la
distribución de frecuencias observada de la distribución de frecuencias esperada,
porque la distribución de probabilidad de Dn depende del tamaño de muestra n, pero es
independiente de la distribución de frecuencias esperada (Dn es un estadístico de
“distribución libre”).

1. Prueba de hipótesis:
H0= los datos analizados siguen una distribución M
H1= los datos analizados no siguen una distribución M
2. Se calcula el estadístico de K-S

Se denota que: Fe= frecuencia esperada utilizando la distribución M, F0=


frecuencia observada en los datos.

Para calcular el estadístico de K-S, se utiliza la siguiente formula:


lOMoAR cPSD| 12874333

3. Se calcula el valor critico D, teniendo en cuenta una prueba de una


cola, con un nivel de significancia de α. D se obtiene con la
siguiente tabla:

4. Se comparan el valor de D y Dn, para poder concluir la prueba de


hipotesis. Surgen dos posibilidades:
lOMoAR cPSD| 12874333

• D> Dn, se acepta la hipotesis nula y se concluye que la


distribución M es significativa para los datos.

• D< Dn, se rechaza la hipotesis nula a favor de la hipotesis


alternativa y se concluye que la distribución M no es
significativa para los datos.
lOMoAR cPSD| 12874333

Un problema que ilustra una prueba de corrida de una sola


muestra:

Un fabricante de cereal para el desayuno usa una máquina para introducir


aleatoriamente uno de dos tipos de muñecos en cada caja. La compañía desea una
aleatoriedad tal que no todos los niños de un vecindario terminen con el mismo
muñeco. Los probadores eligen muestras de 60 cajas sucesivas para ver si la máquina
está mezclando adecuadamente los dos tipos de muñecos. Usando los símbolos A y B
para representar los dos tipos de muñecos, un probador reportó que uno de estos lotes
se presentó como sigue:

B, A, B, B, B, A, A, A, B, B, A, B, B, B, B, A, A, A, A, B,
A, B, A, A, B, B, B, A, A, B, A, A, A, A, B, B, A, B, B, A,
A, A, A, B, B, A, B, B, B, B, A, A, B, B, A, B, A, A, B, B

Los valores de esta prueba serían:

n1 = 29 Número de cajas que contienen el muñeco A


n2=31 Número de cajas que contienen el muñeco B
r=29 Número de corridas

Media de la distribución muestral del estadístico r

2 n1 n 2
μ= +1
r
n1 + n2

Aplicando la formula, obtenemos la media del estadístico r

2(29)(31)
μr = +1
29+ 31

1798
μr = +1
60
μr =30.97
lOMoAR cPSD| 12874333

El error estándar del estadístico r puede calcularse con esta fórmula:

σr=
√ 2 n1 n2 (2 n1 n2−n1 −n2)
( n1 +n 2) ( n1 +n2−1)
2


(29+31 )2 (29+ 31−1)
r

2( 29)( 31)(2(29)(31)−29−31)
σ=


(60) 2 (59)
r

(1798)(1738)
σ=
σr=√14.71

σr =3.84

Prueba de las hipótesis:

En la prueba de corridas de una sola muestra, la distribución muestral de r puede


aproximarse de cerca por la distribución normal si n1 o bien n2 es mayor que 20.
Nuestra compañía de cereales tiene una muestra de 60 cajas, así que podemos usar la
aproximación normal. La gerencia está interesada en probar, al nivel de 0.20, la
hipótesis de que los muñecos están mezclados aleatoriamente, por lo que la prueba se
convierte en:

H0: los muñecos están mezclados aleatoriamente.


H1: los muñecos no están mezclados aleatoriamente.

Puesto que demasiadas o muy pocas corridas indicarían que el proceso mediante el
cual se introducen los muñecos en las cajas no es aleatorio, una prueba de dos colas
es apropiada.

A continuación, se usa la siguiente ecuación para estandarizar el estadístico de la


muestra r:
lOMoAR cPSD| 12874333

r−μr
z=
σr
29−30.97
z=
3.84
z=−0.513
lOMoAR cPSD| 12874333

Colocando el valor estandarizado en la escala z, se ve que cae dentro de los valores


críticos para esta prueba. Por tanto, la administración no debe rechazar la hipótesis
nula y concluir, a partir de esta prueba, que los muñecos se ponen en las cajas en
orden aleatorio.

16.23 Walpole, Probabilidad y Estadísticas para Ingenieros

Con el fin de estimar la proporción de votantes que favorecen a cierto candidato para
alcalde, se selecciona una muestra aleatoria de 15 adultos que viven en una pequeña
ciudad. También se le pregunta a cada individuo si se graduó de la universidad. Al
denotar con S y N las respuestas “sí” y “no”, respectivamente, a la pregunta sobre la
escolaridad, se obtuvo la siguiente secuencia:

NNNNSSNSSNSNNNN

Utilice la prueba de rachas a un nivel de significancia de 0.1 para determinar si la


secuencia apoya la afirmación de que la muestra se seleccionó al azar.

Los valores de esta prueba serían:

n1 = 10 Número de respuestas “Si”


n2= 5 Número de respuestas “No”
r= 7 Número de corridas

Media de la distribución muestral del estadístico r

2 n1 n 2
μ= +1
r
n1 + n2

Aplicando la formula, obtenemos la media del estadístico r

2(10)(5)
μr = +1
10+ 5
100
μ= +1
r
15
μr =7.667
lOMoAR cPSD| 12874333

El error estándar del estadístico r puede calcularse con esta fórmula:

σr=
√ 2 n1 n2 (2 n1 n2−n1 −n2)
( n1 +n 2) ( n1 +n2−1)
2


(10+5 )2 (10+5−1)
r

2( 10)(5)(2( 10)(5)−10−5)
σ=


(15 ) 2( 14)
r

(100)(85)
σ=
σr=√2.6984

σr =1.6427

Prueba de las hipótesis:

H0: La secuencia apoya la afirmación de que la muestra se seleccionó al azar.


H1: La secuencia no apoya la afirmación de que la muestra se seleccionó al azar.

A continuación, se usa la siguiente ecuación para estandarizar el estadístico de la


muestra r:

r−μr
z=
σr
7−7.667
z=
1.6427
z=−0. 406
Buscando en la tabla de distribución normal el valor de nuestro z0.05 obtenemos que su
valor es de 1.645 el cual resulta ser mayor que nuestro estadístico z (0.406)
anteriormente calculado.

Por lo tanto, podemos concluir rechazando la hipotesis nula, diciendo que la secuencia
no apoya la afirmación de que la muestra se seleccionó al azar.

Un problema que ilustra la prueba de K-S:


lOMoAR cPSD| 12874333

Suponga que la central telefónica del condado de Orange, en California, ha llevado un


registro del número de “transmisores” (un tipo de equipo automático que se utiliza en
las centrales telefónicas) usados en un instante dado. Las observaciones se hicieron en
3,754 ocasiones distintas. Para propósitos de planeación de Inversión de capital, el
funcionario de presupuesto de esta compañía piensa que el patrón de uso sigue una
distribución de Poisson con una media de 8.5. Si desea probar esta hipótesis al nivel de
significancia de 0.01, puede emplear la prueba de K-S.

Formularíamos nuestras hipótesis de la siguiente manera:

H0: una distribución de Poisson con ʎ=8.5 es una buena descripción del patrón de uso
H1: una distribución de Poisson con ʎ=8.5 no es una buena descripción del patrón de
uso

Ahora podemos utilizar la fórmula de Poisson para calcular las frecuencias esperadas:
lOMoAR cPSD| 12874333

λ
(¿¿ x)( e−λ)
x!
P ( x ) =¿

Al comparar estas frecuencias esperadas con las observadas, podemos examinar la


magnitud de la diferencia entre ellas: la desviación absoluta. En la siguiente tabla
enumeramos las frecuencias acumuladas observadas relativas F0, las frecuencias
acumuladas relativas esperadas Fe, y las desviaciones absolutas para x=0 a 22.
lOMoAR cPSD| 12874333

Cálculo del estadístico de K-S:

Para calcular el estadístico de K-S para este problema, simplemente elija Dn, la
desviación absoluta máxima de Fe, alejada de Fo:

D n=max∣F e−Fo ∣

En este problema, Dn=0.2582 en x=9.


Una prueba de K-S siempre debe ser una prueba de una cola. Los valores críticos para
Dn se han tabulado y pueden encontrarse en la siguiente tabla:
lOMoAR cPSD| 12874333

Si buscamos en la fila de n=3,754 (el tamaño de muestra) y la columna para un nivel de


significancia de 0.01, encontramos que el valor crítico de Dn debe calcularse usando la
fórmula:

1.63 1.63
= =0.0266
√n √3754
El siguiente paso es comparar el valor calculado de Dn con el valor crítico de Dn que se
encuentra en la tabla. Si el valor de la tabla para el nivel de significancia elegido es
mayor que el valor calculado de Dn, entonces no rechazaremos la hipótesis nula.
Obviamente, 0.0266 < 0.2582, así que rechazamos H0 y llegamos a la conclusión de
que una distribución de Poisson con una media de 8.5 no es una buena descripción del
patrón del uso del transmisor en la central telefónica del condado de Orange.

14-43 Al nivel de significancia de 0.05, ¿podemos concluir que los siguientes datos
provienen de una distribución de Poisson con λ=3

Número de llegadas por día 0 1 2 3 4 5 6


Número de días 6 18 30 24 11 2 9

Primero procedemos a calculamos las frecuencias relativas, obteniendo lo siguiente:

0.06 0.18 0.3 0.24 0.11 0.02 0.09

Luego formulamos nuestras hipotesis:

H0: una distribución de Poisson con ʎ=3 es una buena descripción del patrón de uso

H1: una distribución de Poisson con ʎ=3 no es una buena descripción del patrón de
uso.

Ahora podemos utilizar la fórmula de Poisson, ya que es el estadístico que nos plantea
el ejercicio para calcular las frecuencias esperadas:

λ
(¿¿ x)( e−λ)
x!
P ( x )=¿
lOMoAR cPSD| 12874333

También podría gustarte