Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NO PARAMTRICOS
Parte 2: Como alternativas a los
contrastes paramtricos
CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
D) Contraste de normalidad de DAgostino
Si x1, x2, , xn es una muestra aleatoria de una poblacin con distribucin continua
F(x). El contraste de DAgostino nos permite contrastar la bondad del ajuste de F(x) a la
distribucin Normal con las hiptesis:
H0 La distribucin de F(x) es Normal
H1 La distribucin de F(x) no es Normal
y donde el estadstico de contraste es:
EC
2
n n ni1 yi2 n1 ni1 yi
CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
E) Contraste de los signos:
Si x1, x2, , xn es una muestra aleatoria de una poblacin con distribucin continua.
El contraste de los signos nos permite contrastar un valor para la mediana de la
distribucin con las hiptesis:
H0 Me = Me0
H1 Me Me0
(Debe notarse que si la mediana fuera la de la hiptesis nula, debera dar un 50% de
valores de la muestra por encima (yi>0) y el otro 50% por debajo (yi<0))
Por tanto, el valor del EC sigue una distribucin Bi(n, ), cuando es cierta
H0, y esta distribucin nos permitir construir la regin crtica y decidir
sobre la significatividad del contraste para un cierto error
(Si es posible, es conveniente utilizar la tabla de la Binomial, pg. 168 del Apndice del
Cuaderno de Prcticas.)
CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
Ejemplo:
En general, se sabe que de los pacientes con leucemia mieloblstica aguda con los que se
logra una remisin completa, a partir de un tratamiento convencional, el 50% sobreviven ms
de 21 meses. Se est estudiando un nuevo procedimiento con el que se espera que aumente
este nmero de meses de supervivencia. Este tiempo para 10 pacientes con el nuevo
tratamiento ha sido:
24.1 25.8 20.5 20.9 27.3 21.5 20.1 28.9 19.2
26.3
1. Mediante el contraste de los signos, decidir si el nuevo procedimiento ha aumentado la
mediana del tiempo de supervivencia.
2. Mediante el contraste de D'Agostino, estudiar si los datos son normales.
Solucin:
1. Si consideramos la variable n de meses que sobreviven estos pacientes, para decidir si el
nuevo procedimiento ha aumentado la mediana del tiempo de supervivencia se plantea:
H0 Me = 21
H1 Me > 21
Por tanto, como el EC es el nmero de valores positivos, EC = 6 que si es cierta H0 sigue una
distribucin binomial Bi(10; 0.5), que segn la tabla de la binomial (pg. 168), nos dara un valor
de p=0.3770.
El contraste no es significativo, es decir, no podemos decidir que ha aumentado la mediana
CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
Solucin:
2. Para estudiar, mediante el contraste de D'Agostino, si los datos son normales, planteamos:
H0 La distribucin en la poblacin es Normal
H1 La distribucin en la poblacin no es Normal
Xi : 24.1
25.8
20.5
20.9
27.3
20.1
28.9
19.2
26.3
10
yi
19.2
20.1
20.5
20.9
21.5
24.1
25.8
26.3
27.3
28.9
EC
2
n n ni1 yi2 n1 ni1 yi
1382.3 5.5234.6
10 10 5610.6 0.1234.62
92
0.2814
326.93
Por tanto, como el EC no est en las regiones crticas que para n=10 aparecen en la tabla de
pg. 177 cualquiera que sea , por ejemplo para =0.05, el contraste no es significativo, es
decir, podemos decir que los datos siguen una distribucin Normal en la poblacin
CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
F) Contraste de los rangos signados de Wilcoxon:
Si x1, x2, , xn es una muestra aleatoria de una poblacin con distribucin continua.
El contraste de los rangos con signos de Wilcoxon nos permite contrastar un valor
para la mediana de la distribucin, en realidad nos contrasta si hay simetra en la
distribucin respecto de la mediana, con las hiptesis:
H0 Me = Me0
H1 Me Me0
1.
2.
3.
4.
5.
CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
Ejemplo:
En general, se sabe que de los pacientes con leucemia mieloblstica aguda con los que se
logra una remisin completa, a partir de un tratamiento convencional, el 50% sobreviven ms
de 21 meses. Se est estudiando un nuevo procedimiento con el que se espera que aumente
este nmero de meses de supervivencia. Este tiempo para 10 pacientes con el nuevo
tratamiento ha sido:
24.1 25.8 20.5 20.9 27.3 21.5 20.1 28.9 19.2
26.3
Mediante el contraste de los rangos con signos, decidir si el nuevo procedimiento ha
aumentado la mediana del tiempo de supervivencia.
Solucin:
Si consideramos la variable n de meses que sobreviven estos pacientes, para decidir si el
nuevo procedimiento ha aumentado la mediana del tiempo de supervivencia se plantea:
Para determinar el EC, se obtienen:
H Me = 21
0
H1 Me > 21
28.9-21
19.2-21 26.3-21
xi - 21
3.1(+)
4.8(+)
0.5(-)
0.1(-)
6.3(+)
0.5(+)
0.9(-)
7.9(+)
1.8(-)
5.3(+)
Orden
0.1(-)
0.5(-)
0.5(+)
0.9(-)
1.8(-)
3.1(+)
4.8(+)
5.3(+)
6.3(+)
7.9(+)
Rangos
1(-)
2.5(-)
2.5(+)
4(-)
5(-)
6(+)
7(+)
8(+)
9(-)
10(+)
Para estos casos, pueden aplicarse con yi-xi cualquiera de los dos
contrastes de los signos o de los rangos signados para una muestra
Ejemplo:
Se administr un cierto frmaco a una muestra representativa de enfermos de hepatitis alcohlica.
Para estudiar sus consecuencias, se valoraron ciertos parmetros fisiolgicos inicialmente y al cabo
de un mes de tratamiento. Para el parmetro SGOT se obtuvo:
Paciente
10
Inicial
56
56
147
58
121
57
49
118
63
75
Al mes
47
63
125
26
99
36
34
90
50
59
Indique qu procedimiento(s) estadstico(s) podra emplear para analizar tal variacin en el caso de
que no se pudiera suponer Normalidad en los datos.
10
yi - xi
Signo
-9
-
4
+
-22
-
-32
-
-22
-
-21
-
-15
-
-28
-
-13
-
-16
-
Solucin 2:
Utilizaremos el contraste de los rangos con signos para las diferencias yi xi. El planteamiento
de las hiptesis es el mismo de antes. Los clculos son:
yi -xi - 0
yi xi
Orden
Rangos
-9
9(-)
4(+)
1(+)
4
4(+)
9(-)
2(-)
-22
22(-)
13(-)
3(-)
-32
32(-)
15(-)
4(-)
-22
22(-)
16(-)
5(-)
-21
21(-)
21(-)
6(-)
-15
15(-)
22(-)
7.5(-)
-28
28(-)
22(-)
7.5(-)
-13
13(-)
28(-)
9(-)
-16
16(-)
32(-)
10(-)
Con las m+n observaciones se forma una nica muestra que se ordena de menor a mayor
Asignamos rangos a las observaciones ordenadas de 1 a m+n.
En caso de empates, se asigna el mismo rango a los valores empatados, obtenido con la
media de los rangos que se asignaran a los valores si no fueran iguales.
Se calculan R1 y R2 , las sumas de los rangos de cada una de las muestras. Debe suceder
que R1+R2 = (m+n)(m+n+1)/2.
Solucin:
Para ver si son distintas las estancias con metdos no paramtricos, tiene sentido plantear el
contraste:
Para obtener
H0 Las distribuciones de X e Y son iguales en ambos hospitales
el estadstico:
H Las distribuciones de X e Y no son iguales en ambos hospitales
1
Mezclamos y
ordenamos
Rangos
10
(A)
1
12
(A)
2
14
(B)
3
15
(A)
4
16
(B)
5
17
(A)
7
17
(B)
7
17
(B)
7
20
(B)
9
23
(A)
11
23
(B)
11
23
(B)
11
25 26 30
(B) (B) (B)
13 14 15
SI
NO
SI
n11
n12
NO
n21
n22
Donde:
n11 es el nmero de individuos que tienen la caracterstica en ambas ocasiones
n12 son los que la tienen en A pero no en B
n21 son los que la tienen en B pero no en A
n22 los que no la tienen ni en A ni en B
H0 A B
H1 A B
RC X 2 21 (1)
Ambulatorio
SI
NO
SI
27
35
NO
43
20
Solucin:
Vamos a plantear un contraste para decidir si los usuarios tienen la misma opinin
sobre ambos centros:
H0 A B
H1 A B
0.628 y
n12 n21
78
2
Con las N observaciones se forma una nica muestra que se ordena de menor a mayor
Asignamos rangos a las observaciones ordenadas de 1 a N.
En caso de empates, se asigna el mismo rango a los valores empatados, obtenido con la
media de los rangos que se asignaran a los valores si no fueran iguales.
Se calculan R1, R2, , Rk , las sumas de los rangos de cada una de las muestras. Debe
suceder que R1+R2++ Rk = N(N+1)/2.
RC H 21 (k 1)
261,1
221,9
600,9
186,2
188,7
301,2
239,1
167,6
607,0
Concentracin de Ureasa
243,3
296,8
270,5
222,5
224,9
178,8
147,9
175,3
283,3
193,3
159,4
540,3
267,3
214,3
355,1
230,6
159,5
265,3
244,8
230,0
512,4
Solucin:
Planteamos el contraste, asignamos rangos (en rojo entre parntesis), obtenemos el EC y la RC:
H0 Las distribuciones de las k poblaciones son iguales
H1 Las distribuciones de las k poblaciones no son iguales
Grupo I
Grupo II
Grupo III
Concentracin de Ureasa
261,1(19) 186,2(7) 239,1(16) 243,3(17) 296,8(24) 270,5(22) 222,5(12)
221,9(11) 188,7(8) 167,6(4) 224,9(13) 178,8(6) 147,9(1) 175,3(5)
600,9(29) 301,2(25) 607,0(30) 283,3(23) 193,3(9) 159,4(2) 540,3(28)
La suma de rangos en cada muestra es RI = 171, RII = 75 y RIII = 219, luego el EC: Luego las
concentraciones
k R2
12
12 1712 75 2 2192
H
( 10 10 10 ) 3 31 13.87 y RC H 20.999 (2) H 13.82
ni 3(N 1)
son distintas
N(N 1) i1 i
30 31
(p<0.001)