Está en la página 1de 43

PRUEBAS NO PARAMTRICAS

Se utilizan cuando no se conoce la distribucin o no se cumplen los


supuestos de la distribucin normal
DISTRIBUCIN CHI-CUADRADO
Permite relalizar pruebas de bondad de ajuste y pruebas de independencia

f(X2)
Chi Cuadrado de la muestra
gl =1

Alfa = Zona de rechazo


gl =10

X2
Distribucin Chi-Cuadrado

PRUEBAS DE BONDAD DE AJUSTE


Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribucin particular planteada como hiptesis
Si el ajuste es razonablemente cercano, puede concluirse que s exite la forma de distribucin
planteada como hiptesis
Por ejemplo:
Ho: La distribucin poblacional es uniforme
Ha: La distribucin poblacional no es uniforme
Se usa el estadstico Chi-Cuadrado
K

( OiEi )
Ei
i=1

=
2

Oi = Frecuencia de los eventos observados en los datos muestrales


Ei = Frecuencia de los eventos esperados si la hiptesis nula es correcta
Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para

cumplir con este requisito.


K = Nmero de categoras o clases
Ejemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperara que se vendieran
12 botes / mes. La cantidad real que se vendi fue:
Ventas (Oi) Ventas (Ei)
Tipo de bote observadas esperadas
A
15
12
B
11
12
C
10
12
D
12
12
DISTR.CHI

Entonces el estadstico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020817


El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3
Chi cuadrado de excel = 7.815
El estadstico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hiptesis nula
PRUEBA.CHI.INV
Otro ejemplo:

Frecuencias. esperadas .. . . .. . . . Ei=npi


Ho: Se mantuvo el patrn de 60% crditos comerciales, 30% extranjeros y 10% personales
Ha: No se mantuvo el patrn deseado
Tipo de
Crdito
Comercial
Personal
Extranjero

Frec. (Oi)
Observada
62
10
13

Frec. (Ei)
Esperada
51
8.5
25.5

TOTAL

85

85

60%
10%
30%
DISTR.CHI

Estadstico Chi Cuadrado de la muestra = 8.76


Valor P =
0.01252536
Chi Cuadrado de excel con alfa 0.1 y
gl = K (Categoras) - 1 = 2 es 4.605
Ho se rechaza, no se mantuvo el patrn
PRUEBA.CHI.INV
PRUEBA DE NORMALIDAD
Ho: Los niveles de llenado se ditribuyen normalmente
Ha: Los niveles de llenado no se ditribuyen normalmente

La presin de llenado de tanques de immersin promedio debe ser de 600 lb con una desviacin
estndar de 10 lb.
Se mide el nivel de llenado de 1000 tanques:

PSI
0 - 579.9
580 - 589.9
590 - 599.9
600 - 609.9
610 - 619.9
620 - arriba

Frec. (Oi)
Observada
20
142
310
370
128
30

Probabilidad
de ocurrencia
0.0228
0.1359
0.3413
0.3413
0.1359
0.0228

Frec. (Ei)
Esperada
228
135.9
341.3
341.3
135.9
22.8

TOTAL

1000

1000

Por ejemplo para las frecuencias por debajo de 580:


Z = (X-Media) / Desv. Estndar = (580 - 600) / 10 = -2
P(Z<= -2) = 0.0228
Para el caso del rea entre 580 y 590:
Z = (X -Media) / Desv. Estndar = (590 - 600) / 10 = -1
P(Z<=-1) =

0.15865525

P(580 < X < 590 ) = 0.1598 - 0.0228 =

0.1359

Etcetera

El estadstico Chi Cuadrado de la muestra es = 8.63

DISTR.CHI

Valor P =

0.12476391

El Chi Cuadrado de excel para alfa = 0.05 y K - 1 = 6 - 1 = 5 Gl. Es 11.07


Por tanto no se rechaza Ho y se sigue una distribucin normal
NOTA: Si la media y desviacin estndar poblacionales no fueran conocidas se hubieran
tenido que estimar de los datos muestrales entonces m = 2 y los gl. = K - m - 1 = 3
PRUEBA.CHI.INV

TABLAS DE CONTINGENCIA - PRUEBAS DE INDEPENDENCIA


Permite probar la hiptesis de independencia de dos variables, por ejemplo:
para probar la efectividad de un nuevo insecticida por 100 consumidores:

A - Clasificacin
> Promedio
Promedio
< Promedio
Total

Urbano
20
40
15
75

B - Ubicacin
Rural
11
8
6
25

Total
31
48
21
100

f = Filas = 3
c = Columnas = 2

Las hiptesis son:


Ho: La clasificacin y la ubicacin son independientes
Ha: La clasificacin y la ubicacin no son independientes
Las frecuencias esperadas se determinan como sigue:
Eij = (Suma rengln i x Suma columna j ) / Total
E11 = 31 * 75 / 100 =
E12 =48 * 75 / 100 =
Etcetera

23.3
36

La tabla completa queda como sigue:


A - Clasificacin
> Promedio

Urbano
20
23.3

B - Ubicacin
Rural
11
7.75

Promedio

40
36

8
12

48

< Promedio

15
15.8

6
5.25

21

Total

75

25

100

Total
31

DISTR.CHI
El estadstico Chi Cuadrado de la muestra = 3.76

Valor P correspondiente =

0.15259011

El estadstico de excel se determina con alfa = 0.1 para (f-1)(c-1) gl = 2 gl. Dando 4.605
Por tanto no se rechaza Ho y la Ubicacin y Clasificacin son independientes
PRUEBA.CHI.INV

nto se acepta

na desviacin

PRUEBA DEL SIGNO


Es una prueba de hiptesis que compara las distribuciones de dos poblaciones.
Se asume que se tienen datos de antes y despus para una muestra y
se desea comparar estos conjuntos de datos correspondientes.
No se tiene inters en la diferencia sino nicamente en si resulta un signo + o -.
m = nmero de signos menos y p = nmero de signos ms
Ho: m = p
Ha: m<> p

Ho: m <= p
Ha: m > p

Ho: m >= p
Ha: m < p

Por ejemplo se trata de probar la efectividad de un juego promocional en las ventas en tiendas:

Tienda
1
2
3
4
5
6
7
8
9
10
11
12

Ventas antes Ventas con


del juego
el juego
42
40
57
60
38
38
49
47
63
65
36
39
48
49
58
50
47
47
51
52
83
72
27
33

Signo
+
0
+
+
0
+
-

Los signos menos indican incremento


de las ventas ya que se resta el Antes
menos el Despus

Se trata de probar la hiptesis:


Ho: m <= p
Ha: m > p
Ignorando los 0's se tienen 6 signos ms y 4 signos menos para un total de n = 10 signos.
Si probabilidad de ambos signos es de pi = 0.5.

0.01953125

De la tabla C del apndice III o DISTR.BINOM, la probabilidad de 6 o ms signos menos es:


P( m >= 6 | n = 10, pi = 0.5) = 1 - P( X <= 5) = 1 - 06230 = 0.3770
o P ( p <= 4 | n = 10, pi = 0.5) = 0.377

DISTR.BINOM(4,10,0.5,verdadero)

Como este valor de P = 0.377 es mayor que un alfa de 0.05 entonces no se rechaza Ho
indicando que el juego promocional no incremena las ventas

Para el caso de muestras grandes n >= 30 se puede aproximar al uso de Z, con k = nmero de
signos ms o menos. Si k < n/2 se utiliza k + 0.5 y en caso contrario se usa k - 0.5 para
utilizar la distribucin normal que es continua.

Z=

k0 . 50 .5 n
0 . 5 n

Por ejemplo al comparar dos tipos de 10 bandas en su desgaste se obtuvieron,ignorando los 0s:
m = 8, p = 1
Si Ho: m = p
Ha: m<> p
Usando la tabla C del apndice III o la funcin e Excel DISTR.BINOM
P (p <= 1 | n = 9, pi = 0.5) = 0.0195
o P (m >= 8 | n = 9, pi = 0.5) = 1 - P(m <= 7) = 1 - 0.9805 = 0.0195
Con Alfa /2 = 0.025 siendo mayor al valor P de la probabilidad se
rechaza la hiptesis Ho y el desgaste es diferente
Usando el estadstico Z se tiene:

rando los 0s:

Unidad 14 Pruebas no paramtricas


Pruebas Chi cuadr
Ejercicio 1
Frecuencia (Oi)
Frecuencia (Ei)
Tipos de Crditoobservada esperadas
Autos
55
66.66
Estudiantes
47
66.66
Propsitos
generales

98
200

66.66
199.98

Oi-Ei
-11.66
-19.66

(Oi-Ei)2
(Oi-Ei)2 / Ei
135.9556 2.03953795
386.5156 5.79831383

31.34

982.1956 14.7344074
22.5722592

Ho: Los tres tipos de crdito se conceden en la misma proporcin


Ha: Los tres tipos de crdito no se conceden en la misma proporcin
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2
Chi cuadrado de excel =
5.99146455
Dado que el valor k1 = 22.57 > 5,99 se rechaza la Ho:
Ejercicio 2
Frecuencia (Oi)
Frecuencia (Ei)
Tipos de Crditoobservada esperadas
Autos
55
50
Estudiantes
47
50
Propsitos
generales

98
200

100
200

Oi-Ei
5
-3

(Oi-Ei)2
(Oi-Ei)2 / Ei
25
0.5
9
0.18

-2

0.04
0.72

Ho: Se mantuvo el patrn deseado para crditos generales el 50%, para autos el 25% y para estudiantes
Ha: No se mantuvo el patrn deseado para crditos generales el 50%, para autos el 25% y para estudiant
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2
Chi cuadrado de excel =
5.99146455
Dado que el valor k1 = 0.72 menor que 5,99 no se rechaza la Ho:

PRUEBA DE SIGNOS

Ejercicio 6
Publicidad 1 Publicidad 2 Diferencia
8
7
1
9
3
6
5
2
3
7
8
-1
9
5
4
4
5
-1
3
7
-4
8
2
6
9
1
8
5
3
2
7
7
0
8
2
6
8
2
6
7
3
4
9
8
1

Mas
Menos

11
3

Ho:m= p
Ha:m p

P ( m3|n=14 ,=0.5 )=0.287


P ( m11|n=14, =0 .5 )=1 p ( m10 ) =10. 9713

=0 . 0287

Debido a que = 0 .10/2 = 0 .05 > 0 .0287 Se rechaza la Ho .

Ejercicio 7
Con grasa
10
12
14

Sin grasa
15
13
12

Diferencia
-5
-1
2

Mas
Menos

3 p
6 m

18
17
18
5
21
6
8

9
17
19
3
27
12
14

9
0
-1
2
-6
-6
-6

n= 9

Ho:m p
Ha:m p

P ( m3|n=9, =0.5 )=0.2539


P ( m6|n=9,=0 . 5 ) =1 p ( m5 )=10 . 7461

=0 . 2539

Debido a que = 0 .10/2 = 0 .05 0 . 253 No se rechaza la Ho.

PRUEBA U DE MANN-WHITNEY
Ejercicio 10

Ho:U 1 U 2
Ha:U 1 U 2
Mujeres

Rango

Hombres

Rango

2.12
3.02
3.15
3.42
3.72
4.42

1
2
3
4
5
6

4.87
5.12

8
9.5

5.72

12

8.17

4.45

5.12
5.42

9.5
11

5.83
6.43
6.49

13
14
15

8.79
8.89
9.02
9.73

17
18
19
20
143.5

u =

16

66.5

u=

R 1=66.5

Z=

R 2=143. 5
U 1 =1010+

1010
=50
2

10( 10+1 )
66 . 5=88. 5
2

U 2=1010+

1010 ( 10+10+1 )
=13
12

11 .550
=2. 91
13 .22

Para un valor de alfa del 10%


-1.28155157

Conclusiones: Dado que Z=-2.9 se encuentra en la zo


se rechaza la Ho y se acepta la Ha.

10( 10+1 )
143. 5=11.5
2

Ejercicio 12

Ho:U 1 =U 2

Ha:U 1U 2

n1= 42
n2= 35

u =
u=

4235
=735
2

Z=

4235 ( 42+ 35+1 )


=97 . 74
12

930 . 5735
=2
97 . 74

Z=

R 1=1833 . 5

930 . 5735
=2
97 . 74

R 2=1169 .5
42( 42+1 )
U 1 =4235+
1833 . 5=539. 5
2
U 2=4235+

35 ( 35+1 )
1169. 5=930 .5
2

Para un valor de alfa del 5% Z=1.96

Conclusiones: Dado que Z=1.96 se encuentra en la z


se rechaza la Ho y se acepta la Ha.

CORRELACIN DE RANGOS DE SPERMAN


Ejercicio 14

Ingreso

=5

Consumo
97
58
69
47
58
38
91
67
68
47

55
63
54
37
45
38
71
52
53
37

Clasificacin Clasificacin
del ingreso Consumo Y
X
di= x-y
1
3
6
2
3
4
8
9
6
7
9
8
2
1
5
6
4
5
8
9

-2
4
-1
-1
-1
1
1
-1
-1
-1

x-ycuadrado El coeficiente de correlacin


4 sugiere alguna relacin?
16
1
1
1
1
1
1
1
1

48

rs=1

6 di

37

-2

4
32

Ho: Ps=0

No existe relacin entre las dos variables

n ( n2 1 )

Ha: Ps0
192
rs=1
=1
=0.Existe
85 relacin entre las dos variables
2
1320
11 ( 11 1 )
6(32)

De tabla n apendice 3
Para un valor alfa del 5% y n=11 r=0.6091
Dado que rs= 0.85 mayor que r= 0.6091 la Ho.se rechaza.

Ejercicio 15

Tiempo

Nota
21
18
15
17
18
25
18
4
6
5

67
58
59
54
58
80
14
15
19
21

Clasificacin Clasificacin
del Tiempo Nota Y
X
di= x-y
2
2
3
4
5
3
4
5
3
4
1
1
3
9
8
8
6
7
7
6

0
-1
2
-1
-1
0
-6
0
-1
1

x-ycuadrado
0
1 El coeficiente de correlacin
4 sugiere alguna relacin?
1
1
0
36
0
1
1
45

Ho: Ps=0
6 (45 )

No existe relacin entre las dos variables


270
rs=1
=1
=0 . 72
2
990
(
)
10 10 1

rs=1

6 (45 )
10 ( 10 2 1 )

=1

270
=0 . 72
990
Ha: Ps0
Existe relacin entre las dos variables

De tabla n apendice 3
Para un valor alfa del 10% y n=10 r=0.5515
Dado que rs= 0.72 mayor que r= 0.5515 la Ho.se rechaza.

PRUEBA DE KRUSKAL-WALLIS
Ejercicio 18

Planta 1

Rango
25
36
38
31
29
33

12
K=
n ( n+1 )

Planta 2
6
15
16
12.5
10.5
14
74

Rango
31
28
39
41
21
20

Planta 3
12.5
8.5
17
18
3
1.5
60.5

Rango
29
28
22
26
24
20

10.5
8.5
4
7
5
1.5
36.5

[ ]

R 2i
3 ( n+1 )
ni

12
74 60. 5 36 . 5
K=
+
+
3 ( 18+1 ) =0 . 035(912 . 66+610 .041+222.04 )57=0. 03
6
6
6
18 ( 18+1 )

Para un alfa de 5% k-1 gl

K 0 .05 ,2=5 .991

K=4.065.991

Dado que

la Ho no se rechaza.

Ejercicio 19

Mezcla 1

Rango
3
6
9
5
6

Mezcla 2
2.5
7.5
21.5
5
7.5
44

Rango
3
4
8
9
7

Mezcla 3
2.5
4
14
21.5
9.5
51.5

Rango
10
8
9
8
7

Mezcla 4
25.5
14
21.5
14
9.5
84.5

8
10
11
8
8

12
44 51.5 84.5 94.5
K=
+
+
+
3 ( 20+1 ) =0.028(387.2+530.45+1428.05+4465.12)
5
5
5
20 ( 20+1 ) 5

K=0.028(6810.82)63=127.7
Para un alfa de 5% k-1 gl

K 0 .05 ,3 =7. 815

K=127.77,815

Dado que

K=127.77,815

la Ho se rechaza.

Determinacin de diferencias estadsticamente significativas

R1 =

84.5
94.5
51.5
44
=18.9
=8 .8 R2 =
=10.3 R3 = =16.9R4 =
5
5
5
5

R1 R2 =8. 810 .3=1 .5


R1 R3 =8. 816 . 9=8. 1

R2 R 4 =10 . 318 . 9=8. 6


R3 R 4 =16 . 918. 9=2

R1 R 4 =8 . 818. 9=10 .1
R2 R3 =10 . 316 . 9=6 . 6

Valor critco Ck

Ck = 7 . 815

][ ]

20 (20+1) 1 1
+ =10 . 45
12
5 5

Dado que

No hay diferencia entre la Mezcla 1 y la Mezcla 2


R1 R2 =1.510.45

Dado que

No hay diferencia entre la Mezcla 1 y la Mezcla 3


R1 R3 =8.110.45

Dado que

R1 R 4 =10.110.45
No hay diferencia entre la Mezcla 1 y la Mezcla 4

Dado que

R2 R3=6.610.
No hay
45 diferencia entre la Mezcla 2 y la Mezcla 3

Dado que

R2 R 4=8.610.45
No hay diferencia entre la Mezcla 2 y la Mezcla 4

Dado que

No hay diferencia entre la Mezcla 3 y la Mezcla 4


R3R 4 =210.45

mtricas

el 25% y para estudiantes 25%


os el 25% y para estudiantes 25%

=0 . 0287

rechaza la Ho .

61

=0 . 2539

e rechaza la Ho.

10 ( 10+10+1 )

=13 .22

50
=2. 91
2

=-2.9 se encuentra en la zona de rechazo

5+1 )

=97 . 74

=1.96 se encuentra en la zona de rechazo

El coeficiente de correlacin de rangos de Spearman


ugiere alguna relacin?

=10

El coeficiente de correlacin de rangos de Spearman


ugiere alguna relacin?

1+222. 04 )57=0.035(1744 .741 )57=4 .06

Ejercicio 19

Rango

Mezcla 1

Rango

14
25.5
27
14
14
94.5

45+1428.05+4465.12)63=

3
6
9
5
6

Mezcla 2
1.5
5.5
15
4
5.5
31.5

Rango
3
4
8
9
7

Mezcla 3
1.5
3
10.5
15
7
37

10
8
9
8
7

12
31.5 37 60.5 76.5
K=
+ +
+
3 ( 20+1 )=0.028(198.45+273
5
5
20 ( 20+1 ) 5 5

K=0.028(2359.5)63=3.066
Para un alfa de 5% k-1 gl

K 0 .05 ,3 =7. 815

K=3.0667,815

Ho: Todas los incrementos en


Ha: No todos los incremento

Dado que

K=3.0667,815

la Ho no se rechaza.

Lo cual quiere decir que no se observ una diferencia significativa en los incre

Rango

Mezcla 4
17.5
10.5
15
10.5
7
60.5

Rango
8
10
11
8
8

10.5
25.5
19
10.5
10.5
76

1 )=0.028(198.45+273.8+732.05+1155.2)63=

Ho: Todas los incrementos en el peso permanecen iguales


Ha: No todos los incrementos en el peso permanecen iguales

a significativa en los incrementos en peso de los cachorros al 5%

PRUEBA U DE MANN WHITNEY


Contrasta la igualdad de dos distribuciones poblacionales, se basa en la suposicin de que dos
muestras aleatorias se sacan independientemente de variables continuas. Es la contraparte de
la prueba paramtrica t aunque no requiere que las diferencias de las muestras estn
distribuidas normalmente.
La prueba puede realizarse para analizar la igualdad de las dos medias o medianas
poblacionales. Para el caso de medias, se debe asumir que las poblaciones son simtricas
y que tienen la misma varianza, si el supuesto de simetra se elimina entonces la mediana
reemplaza a la media como estadstico de prueba.

Los datos se ordenan en forma ascendente:


Ejemplo: Se trata de probar si el tiempo de enfriamiento de piezas de barro despus de ser
horneadas con dos mtodos diferentes presenta los mismos resultados.
Mtodo 1: 27, 31, 28, 29, 39, 40, 35, 33, 32, 36, 37, 43
Mtodo 2: 34, 24, 38, 28, 30, 34, 37, 42, 41, 44
Ordenado los datos se tiene:
Mtodo 1

Rango

27
28
29

2
3.5
5

31
32
33

7
8
9

35
36
37

12
13
14.5

39
40

17
18

43

Mtodo 2
24

Rango
1

28

3.5

30

34
34

10.5
10.5

37
38

14.5
16

41
42

19
20

44

22

21

Promedio de rangos correspondientes

Suma
rangos

130

123

Se calcula el estadstico U de Mann Whitney para la primera y segunda muestras,


as como la media y la distribucin estndar de la distribucin U:

n1 ( n 1 +1 )
R 1
2
n 2 (n2 +1)
Estadstico . Segunda . muestra. .. . . U 2 =n1 n 2 +
R2
2
n1 n2
Media . de .la . distribucin .. U . .. . . .. . u =
2
n n (n +n +1)
Desviacin. estndar . de .. . U .. . . .. . . . u = 1 2 1 2
12
Estadstico . Pr imera . muestra . . . .. U 1 =n 1 n2 +

U1 = (12)(10) + (12)(12 + 1) / 2 - 130 =

68

U2 = (12)(10) + (10)(10 + 1) / 2 -123 =

52

Media U = (12)(10) / 2 =
Desv. Est. U =

60
15.17

Valor de Z para normalizar U = (Ui - Media U ) / Desv. Est. U


Las hiptesis son:
Ho: Media 1 = Media 2
Ha: Media 1 <> Media 2
Se puede utilizar de manera arbitraria U1 o U2, escogiendo U2 se tiene:
Zu2 = (52 - 60) / 15.17 = - 0.53

Valor P =

0.29805597

SI alfa es 0.1 entonces Z de excel para alfa entre dos es -1.65


Por tanto no se rechaza Ho
NOTA: Para pruebas de una cola, si se trata de cola derecha, se utiliza el
valor de U que sea mayor y para cola izquierda el valor de U que sea menor.

de que dos

También podría gustarte