Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pruebas No Paramétricas
Pruebas No Paramétricas
Distribucin chi-cuadrada ( 2)
La distribucin chi cuadrada es toda una familia de distribuciones. Existe una
distribucin chi-cuadrada para cada grado de libertad. La Figura 1 muestra que a medida
que se incrementan los grados de libertad la distribucin se vuelve menos sesgada. Las
aplicaciones ms comunes de la distribucin chi-cuadrada son (1) pruebas de bondad de
ajuste y (2) pruebas de independencia.
A. Pruebas de bondad de ajuste
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de
distribucin particular planteada como hiptesis. Si el ajuste es razonablemente cercano,
puede concluirse que si existe la forma de distribucin planteada como hiptesis.
Prueba chi-cuadrada
i 1
Ei
Ei
(1.1)
Ventas esperadas
12
12
12
12
15 12
11 12
10 12
12 12
1.17
12
12
12
12
Debido a que no hay parmetros que estimarse el nmero de grados de libertad es k-1 = 3
grados de libertad. Si Juan deseara probar al nivel del 5%, se encontrara, como lo
2
muestra la Figura 1.2, que 0.05 , 3 7.815
2
Regla
de
" No rechazar si
decisin:
7.815. Rechazar si
7.815"
Total
31
48
21
100
7.75
36
12
15.8
5.25
3.76
H0: m p
H1: m > p
Pregunta: Qu hara que se rechazara la hiptesis nula?
1) un nmero significativamente grande de signos menos
2) un nmero significativamente pequeo de signos ms
Nmero de signos menos = 6
Nmero de signos ms = 4
Los valores que resultan en una diferencia de cero se eliminan.
La Tabla de Distribucin Binomial establece que la probabilidad de seis o ms signos
menos es:
p( m 6 | n 10 , 0.5 ) 1 P ( X 5 )
1 0.6230
0.3770
k 0.5 0.5 n
0.5 n
La prueba de rachas
Cuando no existe aleatoriedad, muchas de las herramientas estadsticas en las cuales se
confa son de poco uso o de ningn uso. Para comprobar la aleatoriedad se utiliza una
prueba de rachas.
Prueba de rachas. Prueba no paramtrica de aleatoriedad en el proceso de muestreo.
Racha. Una serie continua de uno o ms smbolos.
Ejemplo. Suponga que se seleccionan los empleados para un programa de entrenamiento.
Si la seleccin no depende de si el empleado es de sexo masculino (m) o femenino (f), se
esperara que el gnero fuera un evento aleatorio. Sin embargo, si se detecta algn patrn
en el gnero, se puede asumir que la aleatoriedad est ausente y que la seleccin se hizo,
por lo menos en parte, con base en el gnero de un trabajador. Si existe un nmero
inusualmente grande o inusualmente pequeo de rachas, se sugiere un patrn. As, por
ejemplo
_____________________________________________
mmm
ffffff
mmm
_____________________________________________
1
2
3
_____________________________________________
Tres rachas existen en esta muestra. Tres hombres , seguidos de seis mujeres y luego tres
hombres. Aparentemente existe ausencia de aleatoriedad. Consideremos ahora que el
orden de seleccin es
_______________________________________
m f m f m f m f m f m f m f m f
_______________________________________
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
_______________________________________
De nuevo, parece existir un patrn que produce un nmero inusualmente grande de 16
rachas independientes.
Deteccin de un patrn. Si se presentan muy pocas o demasiadas rachas, puede estar
ausente la aleatoriedad.
Un conjunto de hiptesis para probar es:
H0: Existe aleatoriedad en la muestra.
H1: No existe aleatoriedad en la muestra.
Para probar la hiptesis se debe determinar si el nmero de rachas r es demasiado grande
o demasiado pequeo. Las Tablas de valores crticos de r en la prueba de rachas
muestran el nmero de rachas si es 5%. Supongamos ahora que las selecciones fueron:
__________________________________________
m
fff
mmm
ff
mmm
1
2
3
4
5
__________________________________________
Las selecciones parecen ms aleatorias porque no existe patrn evidente. Se nota que n1
= 7 es el nmero de hombres y n2 = 5 es el nmero de mujeres.
La tabla M1 muestra el nmero crtico mnimo de rachas para un valor de de 5%.. Si
el nmero de rachas es igual o menor que el valor mostrado en la tabla M1, se sugiere
que al nivel del 5% hay muy pocas rachas como para confirmar la hiptesis nula de
aleatoriedad. Debido a que n1 = 7 y n2 = 5, se halla el valor crticamente bajo que es 3.
Debido a que el nmero de rachas excede este mnimo, entonces no hay un nmero
significativamente bajo de rachas como para garantizar el rechazo de la hiptesis nula. La
tabla M2 proporciona valores crticamente altos para r. si el nmero de rachas en una
muestra es igual o mayor que estos valores, se puede concluir que existe un nmero
extremadamente grande de rachas, lo que sugiere la ausencia de aleatoriedad. Para n1 = 7
y n2 = 5, la tabla M2 revela que el nmero mximo de rachas es 11. Si el nmero de
rachas es superior a 11, existen demasiadas como para sustentar la hiptesis de
aleatoriedad. Debido a que el nmero de rachas es menor que 11, no es
significativamente alto y no se rechaza la hiptesis nula al nivel del 5%.
2
3.5
5
Mtodo 2
24
Rango
1
28
3.5
30
34
34
10.5
10.5
37
38
14.5
16
7
8
9
35
36
37
12
13
14.5
39
17
40
18
43
41
42
19
20
44
22
R2=123
21
R1=130
n1 n2 ( n1 n2 1 )
( 12 )( 10 )( 12 10 1 )
15.17
12
12
Valor de Z para normalizar la prueba U de Mann-Whitney
U u
Z 1
u
Prueba de dos extremos: Probar la hiptesis de que los tiempos promedio de enfriamiento
de enfriamiento del mtodo 1 y del mtodo 2 son los mismos
H 0 : 1 2
H 1 : 1 2
52 60
0.053
15.17
pruebas ANOVA. No importa la restriccin de que las poblaciones tienen que estar
distribuidas normalmente.
Las hiptesis son:
H0: Todas las k poblaciones tienen la misma distribucin.
H1: No todas las k poblaciones tienen la misma distribucin.
Ejemplo. Un nuevo gerente de Avon debe comparar el tiempo que les toma a tres clientes
pagar los envos del nuevo producto New-Face Cream, ofrecido por la empresa. Se
seleccionan aleatoriamente varias compras de cada cliente, junto con el nmero de das
que cada uno se tom en liquidar su cuenta. Los resultados aparecen en la Tabla 1.5.
Tabla 1.5 Nmero de das para pagar a Avon la entrega recibida.
Compra
1
2
3
4
5
6
7
1
28
19
13
28
29
22
21
Cliente
2
26
20
11
14
22
21
3
37
28
26
35
31
12 Ri2
3( n 1 )
n( n 1 ) ni
donde ni es el nmero de observaciones en la i-sima muestra
n es el nmero total de observaciones en todas las muestras.
Ri es la suma de los rangos de la i-sima muestra.
Tabla 1.6 Rangos en la prueba de Kruskall-Wallis.
Das
Rango
Das
Rango
Das
11
1
13
2
14
3
19
4
20
5
21
6.5
21
6.5
22
8.5
22
8.5
26
10.5
26
28
13
28
13
28
29
15
31
K
Rango
10.5
13
16
35
37
R1=62
R2=34.5
17
18
R3=74.5
62 2 34.5 2 74.5 2
12
3 18 1 8.18
18( 18 1 ) 7
6
5
Ck
1
n n 1 1
12 ni n j
2 ,k 1
18 19 1 1
5.99
Ck
5.99
Ck
5.99
18 19 1 1
18 19 1 1