Está en la página 1de 33

PRUEBAS NO PARAMTRICAS

Se utilizan cuando no se conoce la distribucin o no se cumplen los


supuestos de la distribucin normal

DISTRIBUCIN CHI-CUADRADO

Permite relalizar pruebas de bondad de ajuste y pruebas de independencia

f(X2)
Chi Cuadrado de la muestra
gl =1

Alfa = Zona de rechazo

gl =10

X2
Distribucin Chi-Cuadrado

PRUEBAS DE BONDAD DE AJUSTE

Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribucin particular planteada como hiptesis
Si el ajuste es razonablemente cercano, puede concluirse que s exite la forma de distribucin
planteada como hiptesis

Por ejemplo:

Ho: La distribucin poblacional es uniforme


Ha: La distribucin poblacional no es uniforme

Se usa el estadstico Chi-Cuadrado

K
(OiEi )2
2 =
i=1 Ei

Oi = Frecuencia de los eventos observados en los datos muestrales

Ei = Frecuencia de los eventos esperados si la hiptesis nula es correcta


Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
cumplir con este requisito.
K = Nmero de categoras o clases

Ejemplo:

Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperara que se vendieran


12 botes / mes. La cantidad real que se vendi fue:

Ventas (Oi) Ventas (Ei)


Tipo de bote observadas esperadas
A 15 12
B 11 12
C 10 12
D 12 12
DISTR.CHI

Entonces el estadstico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020817

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3

Chi cuadrado de excel = 7.815

El estadstico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hiptesis nula

PRUEBA.CHI.INV
Otro ejemplo:

Frecuencias.esperadas .. .. .. . . . Ei=npi
Ho: Se mantuvo el patrn de 60% crditos comerciales, 30% extranjeros y 10% personales
Ha: No se mantuvo el patrn deseado

Tipo de Frec. (Oi) Frec. (Ei)


Crdito Observada Esperada
Comercial 62 51 60%
Personal 10 8.5 10%
Extranjero 13 25.5 30%

TOTAL 85 85 DISTR.CHI

Estadstico Chi Cuadrado de la muestra = 8.76 Valor P = 0.01252536


Chi Cuadrado de excel con alfa 0.1 y
gl = K (Categoras) - 1 = 2 es 4.605 Ho se rechaza, no se mantuvo el patrn

PRUEBA.CHI.INV
PRUEBA DE NORMALIDAD

Ho: Los niveles de llenado se ditribuyen normalmente


Ha: Los niveles de llenado no se ditribuyen normalmente

La presin de llenado de tanques de immersin promedio debe ser de 600 lb con una desviacin
estndar de 10 lb.
Se mide el nivel de llenado de 1000 tanques:

Frec. (Oi) Probabilidad Frec. (Ei)


PSI Observada de ocurrencia Esperada
0 - 579.9 20 0.0228 228
580 - 589.9 142 0.1359 135.9
590 - 599.9 310 0.3413 341.3
600 - 609.9 370 0.3413 341.3
610 - 619.9 128 0.1359 135.9
620 - arriba 30 0.0228 22.8

TOTAL 1000 1 1000

Por ejemplo para las frecuencias por debajo de 580:

Z = (X-Media) / Desv. Estndar = (580 - 600) / 10 = -2

P(Z<= -2) = 0.0228

Para el caso del rea entre 580 y 590:

Z = (X -Media) / Desv. Estndar = (590 - 600) / 10 = -1

P(Z<=-1) = 0.15865525

P(580 < X < 590 ) = 0.1598 - 0.0228 = 0.1359

Etcetera DISTR.CHI

El estadstico Chi Cuadrado de la muestra es = 8.63 Valor P = 0.12476391

El Chi Cuadrado de excel para alfa = 0.05 y K - 1 = 6 - 1 = 5 Gl. Es 11.07

Por tanto no se rechaza Ho y se sigue una distribucin normal

NOTA: Si la media y desviacin estndar poblacionales no fueran conocidas se hubieran


tenido que estimar de los datos muestrales entonces m = 2 y los gl. = K - m - 1 = 3

PRUEBA.CHI.INV

TABLAS DE CONTINGENCIA - PRUEBAS DE INDEPENDENCIA

Permite probar la hiptesis de independencia de dos variables, por ejemplo:


para probar la efectividad de un nuevo insecticida por 100 consumidores:
A - Clasifica- B - Ubicacin
cin Urbano Rural Total f = Filas = 3
> Promedio 20 11 31 c = Columnas = 2
Promedio 40 8 48
< Promedio 15 6 21
Total 75 25 100

Las hiptesis son:

Ho: La clasificacin y la ubicacin son independientes


Ha: La clasificacin y la ubicacin no son independientes

Las frecuencias esperadas se determinan como sigue:

Eij = (Suma rengln i x Suma columna j ) / Total

E11 = 31 * 75 / 100 = 23.3


E12 =48 * 75 / 100 = 36
Etcetera

La tabla completa queda como sigue:

A - Clasifica- B - Ubicacin
cin Urbano Rural Total
> Promedio 20 11 31
23.3 7.75

Promedio 40 8 48
36 12

< Promedio 15 6 21
15.8 5.25

Total 75 25 100
DISTR.CHI

El estadstico Chi Cuadrado de la muestra = 3.76 Valor P correspondiente = 0.15259011

El estadstico de excel se determina con alfa = 0.1 para (f-1)(c-1) gl = 2 gl. Dando 4.605

Por tanto no se rechaza Ho y la Ubicacin y Clasificacin son independientes

PRUEBA.CHI.INV
nto se acepta
na desviacin

e hubieran
PRUEBA DEL SIGNO
Es una prueba de hiptesis que compara las distribuciones de dos poblaciones.

Se asume que se tienen datos de antes y despus para una muestra y


se desea comparar estos conjuntos de datos correspondientes.
No se tiene inters en la diferencia sino nicamente en si resulta un signo + o -.

m = nmero de signos menos y p = nmero de signos ms

Ho: m = p Ho: m <= p Ho: m >= p


Ha: m<> p Ha: m > p Ha: m < p

Por ejemplo se trata de probar la efectividad de un juego promocional en las ventas en tiendas:

Ventas antes Ventas con


Tienda del juego el juego Signo
1 42 40 + Los signos menos indican incremento
2 57 60 - de las ventas ya que se resta el Antes
3 38 38 0 menos el Despus
4 49 47 +
5 63 65 -
6 36 39 -
7 48 49 -
8 58 50 +
9 47 47 0
10 51 52 -
11 83 72 +
12 27 33 -

Se trata de probar la hiptesis:

Ho: m <= p
Ha: m > p

Ignorando los 0's se tienen 6 signos ms y 4 signos menos para un total de n = 10 signos.

Si probabilidad de ambos signos es de pi = 0.5. 0.01953125

De la tabla C del apndice III o DISTR.BINOM, la probabilidad de 6 o ms signos menos es:

P( m >= 6 | n = 10, pi = 0.5) = 1 - P( X <= 5) = 1 - 06230 = 0.3770

o P ( p <= 4 | n = 10, pi = 0.5) = 0.377 DISTR.BINOM(4,10,0.5,verdadero)

Como este valor de P = 0.377 es mayor que un alfa de 0.05 entonces no se rechaza Ho
indicando que el juego promocional no incremena las ventas
Para el caso de muestras grandes n >= 30 se puede aproximar al uso de Z, con k = nmero de
signos ms o menos. Si k < n/2 se utiliza k + 0.5 y en caso contrario se usa k - 0.5 para
utilizar la distribucin normal que es continua.

k0 . 50 .5 n
Z=
0 . 5 n

Por ejemplo al comparar dos tipos de 10 bandas en su desgaste se obtuvieron,ignorando los 0s:

m = 8, p = 1

Si Ho: m = p
Ha: m<> p

Usando la tabla C del apndice III o la funcin e Excel DISTR.BINOM

P (p <= 1 | n = 9, pi = 0.5) = 0.0195

o P (m >= 8 | n = 9, pi = 0.5) = 1 - P(m <= 7) = 1 - 0.9805 = 0.0195

Con Alfa /2 = 0.025 siendo mayor al valor P de la probabilidad se


rechaza la hiptesis Ho y el desgaste es diferente

Usando el estadstico Z se tiene:


rando los 0s:
Unidad 14 Pruebas no paramtricas
Pruebas Chi cuadr
Ejercicio 1

Frecuencia (Oi)
Frecuencia (Ei)
Tipos de Crditoobservada esperadas Oi-Ei (Oi-Ei)2 (Oi-Ei)2 / Ei
Autos 55 66.66 -11.66 135.9556 2.03953795
Estudiantes 47 66.66 -19.66 386.5156 5.79831383
Propsitos
generales 98 66.66 31.34 982.1956 14.7344074
200 199.98 22.5722592

Ho: Los tres tipos de crdito se conceden en la misma proporcin


Ha: Los tres tipos de crdito no se conceden en la misma proporcin

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2


Chi cuadrado de excel = 5.99146455

Dado que el valor k1 = 22.57 > 5,99 se rechaza la Ho:

Ejercicio 2

Frecuencia (Oi)
Frecuencia (Ei)
Tipos de Crditoobservada esperadas Oi-Ei (Oi-Ei)2 (Oi-Ei)2 / Ei
Autos 55 50 5 25 0.5
Estudiantes 47 50 -3 9 0.18
Propsitos
generales 98 100 -2 4 0.04
200 200 0.72

Ho: Se mantuvo el patrn deseado para crditos generales el 50%, para autos el 25% y para estudiantes
Ha: No se mantuvo el patrn deseado para crditos generales el 50%, para autos el 25% y para estudian

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2


Chi cuadrado de excel = 5.99146455

Dado que el valor k1 = 0.72 menor que 5,99 no se rechaza la Ho:

PRUEBA DE SIGNOS
Ejercicio 6

Publicidad 1 Publicidad 2 Diferencia


8 7 1
9 3 6 Mas 11
5 2 3 Menos 3
7 8 -1
9 5 4
4 5 -1
3 7 -4
8 2 6
9 1 8
5 3 2
7 7 0
8 2 6
8 2 6
7 3 4
9 8 1

Ho: m=p
Ha:m p
P ( m3|n=14 ,=0.5 )=0.287

P ( m11|n=14,=0 .5 )=1 p ( m10 ) =10. 9713 =0 . 0287

Debido a que = 0 . 10/2 = 0 . 05 > 0 . 0287 Se rechaza la Ho.

Ejercicio 7

Con grasa Sin grasa Diferencia


10 15 -5
12 13 -1 Mas 3 p
14 12 2 Menos 6 m
18 9 9
17 17 0
18 19 -1 n= 9
5 3 2
21 27 -6
6 12 -6
8 14 -6

Ho: mp
Ha:m p
P ( m3|n=9, =0.5 )=0.2539
P ( m6|n=9,=0 . 5 ) =1 p ( m5 ) =10 . 7461 =0. 2539
Debido a que = 0 . 10/2 = 0 . 05 0 . 253 No se rechaza la Ho.

PRUEBA U DE MANN-WHITNEY
Ejercicio 10

Ho:U 1U 2
Ha:U 1 U 2
Mujeres Rango Hombres Rango
2.12 1
3.02 2
3.15 3
3.42 4
3.72 5
4.42 6
4.45 7
4.87 8
5.12 9.5 5.12 9.5
5.42 11
5.72 12
5.83 13
6.43 14
1010
u = =50
6.49 15 2
8.17 16
8.79 17

66.5
8.89
9.02
9.73
18
19
20
143.5
u=
1010 ( 10+10+1 )
12
=13

R 1=66 .5 11 .550
Z= =2. 91
13 .22
R 2= 143. 5
Para un valor de alfa del 10%
-1.28155157
10( 10+1 )
U 1 =1010+ 66 . 5=88 . 5 Conclusiones: Dado que Z=-2.9 se encuentra en la zo
2 se rechaza la Ho y se acepta la Ha.

10( 10+1 )
U 2=1010+ 143. 5=11.5
2

Ejercicio 12

n1= 42
Ho:U 1=U 2 n2= 35
4235
u = =735
Ha:U 1 U 2 2

u=
4235 ( 42+35+1 )
12
=97 . 74
930 . 5735
R 1=1833 . 5 Z= =2
97 . 74
R 2=1169 .5

Para un valor de alfa del 5% Z=1.96


42( 42+1 )
U 1 =4235+ 1833 . 5=539. 5
2 Conclusiones: Dado que Z=1.96 se encuentra en la z
se rechaza la Ho y se acepta la Ha.
35 ( 35+1 )
U 2=4235+ 1169. 5=930 .5
2

CORRELACIN DE RANGOS DE SPERMAN


Ejercicio 14 =5
Clasificacin Clasificacin
del ingreso Consumo Y
Ingreso Consumo X di= x-y x-ycuadrado El coeficiente de correlacin
97 55 1 3 -2 4 sugiere alguna relacin?
58 63 6 2 4 16
69 54 3 4 -1 1
47 37 8 9 -1 1
58 45 6 7 -1 1
38 38 9 8 1 1
91 71 2 1 1 1
67 52 5 6 -1 1
68 53 4 5 -1 1
47 37 8 9 -1 1
48 37 7 9 -2 4
32

6 di 2
Ho: Ps=0
rs=1 No existe relacin entre las dos variables
n ( n 21 )
Ha: Ps0
6(32) 192
rs=1 =1 85 relacin entre las dos variables
=0.Existe
2
11 ( 11 1 ) 1320
De tabla n apendice 3
Para un valor alfa del 5% y n=11 r=0.6091

Dado que rs= 0.85 mayor que r= 0.6091 la Ho.se rechaza.

Ejercicio 15

Clasificacin Clasificacin
del Tiempo Nota Y
Tiempo Nota X di= x-y x-ycuadrado
21 67 2 2 0 0
18 58 3 4 -1 1 El coeficiente de correlacin
15 59 5 3 2 4 sugiere alguna relacin?
17 54 4 5 -1 1
18 58 3 4 -1 1
25 80 1 1 0 0
18 14 3 9 -6 36
4 15 8 8 0 0
6 19 6 7 -1 1
5 21 7 6 1 1
45

Ho: Ps=0
6 (45 ) 270
rs=1 =1 =0 . 72
10 ( 10 2 1 ) 990
6 (45 ) 270 No existe relacin entre las dos variables
rs=1 =1 =0 . 72
10 ( 10 2 1 ) 990
Ha: Ps0
Existe relacin entre las dos variables

De tabla n apendice 3
Para un valor alfa del 10% y n=10 r=0.5515

Dado que rs= 0.72 mayor que r= 0.5515 la Ho.se rechaza.

PRUEBA DE KRUSKAL-WALLIS
Ejercicio 18

Planta 1 Rango Planta 2 Rango Planta 3 Rango


25 6 31 12.5 29 10.5
36 15 28 8.5 28 8.5
38 16 39 17 22 4
31 12.5 41 18 26 7
29 10.5 21 3 24 5
33 14 20 1.5 20 1.5
74 60.5 36.5

K=
12
n ( n+1 ) [ ] R 2i
ni
3 ( n+1 )

[ ]
2 2 2
12 74 60.5 36.5
K= + + 3 ( 18+1 ) =0. 035(912 .66+610 .041+222.04 )57=0 .03
18 ( 18+1 ) 6 6 6
[ ]
2 2 2
12 74 60.5 36.5
K= + + 3 ( 18+1 ) =0. 035(912 .66+610 .041+222.04 )57=0 .03
18 ( 18+1 ) 6 6 6

Para un alfa de 5% k-1 gl

K 0 .05 ,2 =5. 991

Dado que K=4.065.991 la Ho no se rechaza.

Ejercicio 19

Mezcla 1 Rango Mezcla 2 Rango Mezcla 3 Rango Mezcla 4


3 2.5 3 2.5 10 25.5 8
6 7.5 4 4 8 14 10
9 21.5 8 14 9 21.5 11
5 5 9 21.5 8 14 8
6 7.5 7 9.5 7 9.5 8
44 51.5 84.5

[ ]
2 2 2 2
12 44 51.5 84.5 94.5
K= + + + 3 ( 20+1 ) =0.028(387.2+530. 45+1428.05+4465.12)
20 ( 20+1 ) 5 5 5 5

K=0.028(6810.82)63=127.7
Para un alfa de 5% k-1 gl

K 0 .05 ,3 =7 .815
K 0 .05 ,3 =7 .815

Dado que K=127.77,815 la Ho se rechaza.

Determinacin de diferencias estadsticamente significativas

44 51.5 84.5 94.5


R1 = =8 .8 R2 = =10.3 R3= =16.9R4 = =18.9
5 5 5 5
R1 R2 =8. 810 .3=1 .5 R2 R 4 =10 . 318 . 9=8. 6

R1 R3 =8. 816 . 9=8. 1 R3 R 4 =16 . 918. 9=2


R1 R 4 =8 . 818. 9=10 .1

R2 R3 =10 . 316 . 9=6 . 6

Valor critco Ck


Ck = 7 . 815 [ 12 ][ ]
20 (20+1) 1 1
+ = 10. 45
5 5
Dado que R1R2=1.510.45
No hay diferencia entre la Mezcla 1 y la Mezcla 2

Dado que R1R3=8.110.45


No hay diferencia entre la Mezcla 1 y la Mezcla 3

Dado que R1 R 4 =10.110.45


No hay diferencia entre la Mezcla 1 y la Mezcla 4

Dado que R2 R3 =6.610. 45 diferencia entre la Mezcla 2 y la Mezcla 3


No hay

Dado que R2R 4=8.610.45


No hay diferencia entre la Mezcla 2 y la Mezcla 4

Dado que R3 R 4 =210.45


No hay diferencia entre la Mezcla 3 y la Mezcla 4
mtricas

el 25% y para estudiantes 25%


os el 25% y para estudiantes 25%
3 =0 . 0287

rechaza la Ho.
61 =0. 2539
e rechaza la Ho.
10 ( 10+10+1 )
=13 . 22

50
=2. 91
2

=-2.9 se encuentra en la zona de rechazo

5+1 )
=97 . 74
=1.96 se encuentra en la zona de rechazo

El coeficiente de correlacin de rangos de Spearman


ugiere alguna relacin?
=10

El coeficiente de correlacin de rangos de Spearman


ugiere alguna relacin?
1+222.04 )57=0.035 (1744 .741 )57=4. 06
1+222.04 )57=0.035 (1744 .741 )57=4. 06

Ejercicio 19

Rango Mezcla 1 Rango Mezcla 2 Rango Mezcla 3


14 3 1.5 3 1.5 10
25.5 6 5.5 4 3 8
27 9 15 8 10.5 9
14 5 4 9 15 8
14 6 5.5 7 7 7
94.5 31.5 37

[ ]
2 2 2 2
12 31.5 37 60.5 76.5
45+1428.05+4465.12)63= K= + + + 3 ( 20+1 )=0.028(198.45+273
20 ( 20+1 ) 5 5 5 5

K=0.028(2359.5)63=3.066 Ho: Todas los incrementos en


Ha: No todos los incremento

Para un alfa de 5% k-1 gl

K 0 .05 ,3 =7.815
K 0 .05 ,3 =7.815

Dado que K=3.0667, 815 la Ho no se rechaza.

Lo cual quiere decir que no se observ una diferencia significativa en los incre
Rango Mezcla 4 Rango
17.5 8 10.5
10.5 10 25.5
15 11 19
10.5 8 10.5
7 8 10.5
60.5 76

1 )=0.028(198.45+273.8+732.05+1155.2)63=

Ho: Todas los incrementos en el peso permanecen iguales


Ha: No todos los incrementos en el peso permanecen iguales
ia significativa en los incrementos en peso de los cachorros al 5%
PRUEBA U DE MANN WHITNEY
Contrasta la igualdad de dos distribuciones poblacionales, se basa en la suposicin de que dos
muestras aleatorias se sacan independientemente de variables continuas. Es la contraparte de
la prueba paramtrica t aunque no requiere que las diferencias de las muestras estn
distribuidas normalmente.

La prueba puede realizarse para analizar la igualdad de las dos medias o medianas
poblacionales. Para el caso de medias, se debe asumir que las poblaciones son simtricas
y que tienen la misma varianza, si el supuesto de simetra se elimina entonces la mediana
reemplaza a la media como estadstico de prueba.

Los datos se ordenan en forma ascendente:

Ejemplo: Se trata de probar si el tiempo de enfriamiento de piezas de barro despus de ser


horneadas con dos mtodos diferentes presenta los mismos resultados.

Mtodo 1: 27, 31, 28, 29, 39, 40, 35, 33, 32, 36, 37, 43
Mtodo 2: 34, 24, 38, 28, 30, 34, 37, 42, 41, 44

Ordenado los datos se tiene:

Mtodo 1 Rango Mtodo 2 Rango


24 1
27 2
28 3.5 28 3.5 Promedio de rangos correspondientes
29 5
30 6
31 7
32 8
33 9
34 10.5
34 10.5
35 12
36 13
37 14.5 37 14.5
38 16
39 17
40 18
41 19
42 20
43 21
44 22
Suma 130 123
rangos

Se calcula el estadstico U de Mann Whitney para la primera y segunda muestras,


as como la media y la distribucin estndar de la distribucin U:

n1 (n 1 +1)
Estadstico . Pr imera . muestra. . . .. U 1 =n1 n2 + R 1
2
n2 ( n2 +1)
Estadstico . Segunda . muestra. .. . . U 2 =n1 n 2 + R2
2
n1 n2
Media . de .la . distribucin .. U . .. . . .. . u =
2

n n (n +n +1)
Desviacin. estndar . de .. . U .. . . .. . . . u = 1 2 1 2
12

U1 = (12)(10) + (12)(12 + 1) / 2 - 130 = 68

U2 = (12)(10) + (10)(10 + 1) / 2 -123 = 52

Media U = (12)(10) / 2 = 60

Desv. Est. U = 15.17

Valor de Z para normalizar U = (Ui - Media U ) / Desv. Est. U

Las hiptesis son:

Ho: Media 1 = Media 2


Ha: Media 1 <> Media 2

Se puede utilizar de manera arbitraria U1 o U2, escogiendo U2 se tiene:

Zu2 = (52 - 60) / 15.17 = - 0.53 Valor P = 0.29805597

SI alfa es 0.1 entonces Z de excel para alfa entre dos es -1.65

Por tanto no se rechaza Ho

NOTA: Para pruebas de una cola, si se trata de cola derecha, se utiliza el


valor de U que sea mayor y para cola izquierda el valor de U que sea menor.
de que dos

También podría gustarte