Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Noparametrico Wilcoxon
Noparametrico Wilcoxon
paramtricos
En captulo 12: Mtodos no paramtricos
Los mtodos que hemos visto hasta ahora,
asumen como distribucin muestral la
distribucin Normal, supuesto que no siempre
se cumple, sin embargo estos mtodos
paramtricos son robustos.
Pero qu hacemos cuando no se cumple la
normalidad o tenemos muy pocos datos?
Opciones:
1. Si hay valores extremos y el tamao
muestral es pequeo cualquier mtodo de
inferencia es dudoso.
Ejemplo:
Se tienen datos sobre la emisin de monxido de
Carbono (CO) de 46 vehculos del mismo tipo
(Monoxido.sav).
IDEN
1
2
3
.
.
.
44
45
46
HC
0.5
0.65
0.46
.
.
.
0.46
0.47
0.55
CO
5.01
14.67
8.6
.
.
.
3.99
5.22
7.47
NOX
1.28
0.72
1.17
.
.
.
2.01
1.12
1.39
10
4
Desv. tp. = 5.26
Media = 8.0
N = 46.00
0
2.0
6.0
4.0
10.0
8.0
14.0
12.0
18.0
16.0
22.0
20.0
24.0
Monxido de Carbono
7,96 2,021
5,261
46
10
0
.50
1.00
.75
1.50
1.25
2.00
1.75
2.50
2.25
3.00
2.75
3.25
Log(CO)
2 , 0691
Sin transformacin:
Intervalo de confianza 95% para la
media (6,398 - 9,522)
Monxido de Carbono
Log(CO)
Kolmogorov-Smirnov
Shapiro-Wilk
Estadstico
gl
Sig.
Estadstico
gl
.187
46
.000
.842
46
.104
46
.200*
.970
46
Sig.
.000
.266
Normal esperado
-1
-2
-3
-10
10
20
30
Valor observado
Normal esperado
-1
-2
-3
.5
1.0
1.5
2.0
2.5
3.0
3.5
Valor observado
Se define poder o potencia del test como la capacidad del test para
detectar hiptesis nulas falsas. Potencia = 1-
*
10
Test
Paramtrico
Test t simple
Test no
Problema
paramtrico
Una muestra
Test del signo
de rangos de
Wilcoxon
Muestras
Test t simple
Test del signo
pareadas
de rangos de
Wilcoxon
Dos muestras Test t para
Test de suma
independientes muestras
de rangos de
independientes Wilcoxon
Ms de dos
ANOVA de un Test de
muestras
factor
Kruskal-Wallis
independientes
Diseo en
ANOVA con Ji cuadrado de
bloques
bloque
Friedman
aleatorios
11
Ejemplo:
Se
tienen
dos
parcelas
experimentales. Daar la presencia de maleza
la produccin maz?
Malezas por
metro cuadrado
Produccin
0
166,7 172,2 165,0 176,9
3
158,6 176,4 153,1 156,0
Hiptesis
En este problema del maz la hiptesis nula es que la
maleza no afecta la produccin de maz.
Si estamos dispuestos a asumir que la produccin de
maz es Normal, o si tenemos un tamao muestral
razonablemente grande, usamos el test t para medias
independientes. Las hiptesis son:
H 0 : 1 2
H1 : 1 2
13
Pruebas de normalidad
a
YIELD
WEEDS
0
3
Kolmogorov-Smirnov
Estadstico
gl
Sig.
.241
4
.341
4
.
.
Estadstico
.938
.819
Shapiro-Wilk
gl
4
4
Sig.
.640
.140
.5
Normal esperado
0.0
-.5
-1.0
164
166
168
170
172
174
176
178
Valor observado
.5
Normal esperado
0.0
-.5
-1.0
150
160
170
180
Valor observado
14
156.0
2
158.6
3
165.0
4
166.7
5
172.2
6
176.4
7
176.9
8
15
36
2
2
16
n1 ( n 1)
2
y desviacin estndar:
W
n1n2 ( n 1)
12
18
4(8 1)
18
2
y desviacin estndar:
W
4 4(8 1)
3,4641
12
Valor p = P(W 13 | H )
Necesitamos conocer la distribucin muestral
de W bajo la hiptesis nula.
0
19
Estadsticos de contrasteb
YIELD
3.000
13.000
-1.443
.149
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
Sig. exacta [2*(Sig.
unilateral)]
Sig. exacta (bilateral)
Sig. exacta (unilateral)
Probabilidad en el punto
.200
.200
.100
.043
F
YIELD
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
1.256
Sig.
.305
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para l
diferencia
Inferior
Supe
-1.554
.171
-9.175
5.9056
-23.6254
5.2
-1.554
4.495
.187
-9.175
5.9056
-24.8832
6.5
20
La aproximacin Normal
El estadstico de suma de rangos W se aproxima a la
distribucin Normal cuando n es grande. Entonces
podemos formar un test z para estandarizar a W:
z
W W
W
13 18
1,44
3,4641
Empates
La distribucin exacta de test de Wilcoxon para suma de
rangos se obtiene asumiendo que todas las
observaciones tienen diferentes valores y por lo tanto su
rango. En la prctica ocurre que muchas veces tenemos
valores iguales. Lo que hacemos es asignar el valor
promedio del rango que ocupan.
Ejemplo:
Observacin
Rango
153
1
155
2
158
3,5
158
3,5
161
5
164
6
22
Ejemplo:
La comida que se vende en eventos al aire libre puede
ser menos segura que la de restoranes porque se prepara
en lugares no acondicionados y a menudo por
voluntarios. Qu pensar la gente acerca de la
seguridad de la comida en ferias? Un estudio pregunt a
asistentes a este tipo de eventos:
Qu tan a menudo piensa usted que se enferma la gente
que consume comida en eventos al aire libre?
Las respuestas posibles eran:
1 = raramente
2 = de vez en cuando
3 = a menudo
4 = muy frecuentemente
5 = siempre
En total 303 personas respondieron a la pregunta. De
estos 196 eran mujeres y 107 hombres.
Existe evidencia que hombres y mujeres difieren en su
percepcin acerca de la seguridad en la comida de ferias
al aire libre?
23
F
M
Total
2
13
22
35
108
57
165
Respuesta
3
50
22
72
5
23
5
28
2
1
3
Total
196
107
303
Sexo
Total
F
M
1
6.6%
20.6%
11.6%
2
55.1%
53.3%
54.5%
Respuesta
3
25.5%
20.6%
23.8%
4
11.7%
4.7%
9.2%
5
1.0%
.9%
1.0%
Total
100.0%
100.0%
100.0%
24
Respuesta
Sexo
F
M
Total
N
196
107
303
Rango
promedio
163.25
131.40
Suma de
rangos
31996.50
14059.50
Estadsticos de contrastea
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
Sig. exacta (bilateral)
Sig. exacta (unilateral)
Probabilidad en el punto
Respuesta
8281.500
14059.500
-3.334
.001
.001
.000
.000
25
F
Respuesta
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
3.031
Sig.
.083
gl
Sig. (bilateral)
Diferencia
de medias
Error tp.
la diferen
3.361
301
.001
.33
3.365
218.856
.001
.33
26
Tipo de aceite
Rangos
Tipo de aceite
Animal
Vegetal
Total
Absorcin
Rango
promedio
15.29
9.71
N
12
12
24
Suma de
rangos
183.50
116.50
Estadsticos de contrasteb
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
Sig. exacta [2*(Sig.
unilateral)]
Absorcin
38.500
116.500
-1.936
.053
a
.052
F
Absorcin
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
.310
Sig.
.583
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
1.928
22
.067
9.25
4.797
-.698
19.198
1.928
21.694
.067
9.25
4.797
-.706
19.206
27