Está en la página 1de 15

CONTRASTES DE HIPTESIS

NO PARAMTRICOS
Parte 2: Como alternativas a los
contrastes paramtricos

CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
D) Contraste de normalidad de DAgostino
Si x1, x2, , xn es una muestra aleatoria de una poblacin con distribucin continua
F(x). El contraste de DAgostino nos permite contrastar la bondad del ajuste de F(x) a la
distribucin Normal con las hiptesis:
H0 La distribucin de F(x) es Normal
H1 La distribucin de F(x) no es Normal
y donde el estadstico de contraste es:
EC

ni1i yi n21 ni1 yi

2
n n ni1 yi2 n1 ni1 yi

Siendo y1, y2, , yn la muestra ordenada de x1, x2, , xn


La distribucin del EC cuando sea cierta H0 est tabulada (pg. 177 del Cuaderno
de Prcticas) y permite construir la regin crtica del contraste

CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
E) Contraste de los signos:
Si x1, x2, , xn es una muestra aleatoria de una poblacin con distribucin continua.
El contraste de los signos nos permite contrastar un valor para la mediana de la
distribucin con las hiptesis:
H0 Me = Me0
H1 Me Me0

y donde el estadstico de contraste es el nmero de valores positivos


encontrados en la muestra transformada
y1 = x1 Me0, y2 = x2 Me0, , yn = xn Me0

(Debe notarse que si la mediana fuera la de la hiptesis nula, debera dar un 50% de
valores de la muestra por encima (yi>0) y el otro 50% por debajo (yi<0))

Por tanto, el valor del EC sigue una distribucin Bi(n, ), cuando es cierta
H0, y esta distribucin nos permitir construir la regin crtica y decidir
sobre la significatividad del contraste para un cierto error
(Si es posible, es conveniente utilizar la tabla de la Binomial, pg. 168 del Apndice del
Cuaderno de Prcticas.)

CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
Ejemplo:
En general, se sabe que de los pacientes con leucemia mieloblstica aguda con los que se
logra una remisin completa, a partir de un tratamiento convencional, el 50% sobreviven ms
de 21 meses. Se est estudiando un nuevo procedimiento con el que se espera que aumente
este nmero de meses de supervivencia. Este tiempo para 10 pacientes con el nuevo
tratamiento ha sido:
24.1 25.8 20.5 20.9 27.3 21.5 20.1 28.9 19.2
26.3
1. Mediante el contraste de los signos, decidir si el nuevo procedimiento ha aumentado la
mediana del tiempo de supervivencia.
2. Mediante el contraste de D'Agostino, estudiar si los datos son normales.

Solucin:
1. Si consideramos la variable n de meses que sobreviven estos pacientes, para decidir si el
nuevo procedimiento ha aumentado la mediana del tiempo de supervivencia se plantea:

H0 Me = 21
H1 Me > 21

Para determinar el EC, se obtienen los signos de las diferencias:


24.1-21 25.8-21 20.5-21 20.9-21 27.3-21 21.5-21 20.1-21 28.9-21 19.2-21 26.3-21
+

Por tanto, como el EC es el nmero de valores positivos, EC = 6 que si es cierta H0 sigue una
distribucin binomial Bi(10; 0.5), que segn la tabla de la binomial (pg. 168), nos dara un valor
de p=0.3770.
El contraste no es significativo, es decir, no podemos decidir que ha aumentado la mediana

CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
Solucin:
2. Para estudiar, mediante el contraste de D'Agostino, si los datos son normales, planteamos:
H0 La distribucin en la poblacin es Normal
H1 La distribucin en la poblacin no es Normal
Xi : 24.1

25.8

20.5

20.9

27.3

Los datos son:


21.5

20.1

28.9

19.2

26.3

Ordenamos los datos:


i

10

yi

19.2

20.1

20.5

20.9

21.5

24.1

25.8

26.3

27.3

28.9

El estadstico de contraste se calcula:

EC

ni1i yi n21 ni1 yi

2
n n ni1 yi2 n1 ni1 yi

1382.3 5.5234.6

10 10 5610.6 0.1234.62

92
0.2814
326.93

Por tanto, como el EC no est en las regiones crticas que para n=10 aparecen en la tabla de
pg. 177 cualquiera que sea , por ejemplo para =0.05, el contraste no es significativo, es
decir, podemos decir que los datos siguen una distribucin Normal en la poblacin

CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
F) Contraste de los rangos signados de Wilcoxon:
Si x1, x2, , xn es una muestra aleatoria de una poblacin con distribucin continua.
El contraste de los rangos con signos de Wilcoxon nos permite contrastar un valor
para la mediana de la distribucin, en realidad nos contrasta si hay simetra en la
distribucin respecto de la mediana, con las hiptesis:
H0 Me = Me0
H1 Me Me0
1.
2.
3.
4.
5.

y donde para calcular el estadstico de contraste hay que realizar los


siguientes pasos:

Restar de cada dato la mediana de H0 : y1 = x1 Me0, y2 = x2 Me0, , yn = xn Me0


Calculamos los valores absolutos de las diferencias xi Me0
Ordenamos de menor a mayor estos valores absolutos, registrando el signo que tengan
Se asignan rangos (rdenes) de 1 en adelante, de forma que si todos los valores son
distintos, los rangos sern de 1 a n
En caso de empates, se asigna el mismo rango a los valores empatados, obtenido con
la media de los rangos que se asignaran a los valores si no fueran iguales.

El EC se obtiene sumando los rangos de aquellas diferencias que tenan signo


positivo W(+), o tambin de las que tenan signo negativo W(-)
Cuando es cierta H0, el EC tiene unos valores de aceptacin y otros de rechazo
(dado un error ) que estn en la tabla de la pg. 179 del Cuaderno de Prcticas.

CONTRASTES DE HIPTESIS NO
PARAMTRICOS PARA UNA POBLACIN
Ejemplo:
En general, se sabe que de los pacientes con leucemia mieloblstica aguda con los que se
logra una remisin completa, a partir de un tratamiento convencional, el 50% sobreviven ms
de 21 meses. Se est estudiando un nuevo procedimiento con el que se espera que aumente
este nmero de meses de supervivencia. Este tiempo para 10 pacientes con el nuevo
tratamiento ha sido:
24.1 25.8 20.5 20.9 27.3 21.5 20.1 28.9 19.2
26.3
Mediante el contraste de los rangos con signos, decidir si el nuevo procedimiento ha
aumentado la mediana del tiempo de supervivencia.

Solucin:
Si consideramos la variable n de meses que sobreviven estos pacientes, para decidir si el
nuevo procedimiento ha aumentado la mediana del tiempo de supervivencia se plantea:
Para determinar el EC, se obtienen:
H Me = 21
0

H1 Me > 21

yi =xi - 21 24.1-21 25.8-21 20.5-21 20.9-21 27.3-21 21.5-21 20.1-21

28.9-21

19.2-21 26.3-21

xi - 21

3.1(+)

4.8(+)

0.5(-)

0.1(-)

6.3(+)

0.5(+)

0.9(-)

7.9(+)

1.8(-)

5.3(+)

Orden

0.1(-)

0.5(-)

0.5(+)

0.9(-)

1.8(-)

3.1(+)

4.8(+)

5.3(+)

6.3(+)

7.9(+)

Rangos

1(-)

2.5(-)

2.5(+)

4(-)

5(-)

6(+)

7(+)

8(+)

9(-)

10(+)

Por tanto el EC=W(+) = 2.5+6+7+8+9+10=42.5, o tamin podra ser W(-) = 1+2.5+4+5=12.5

Con cualquiera de ellos, se consulta la tabla de pg 179, y para =0.05, se concluye H0

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
G) Contrastes para comparar 2 muestras emparejadas o dependientes:
Se utilizan cuando se tienen muestras emparejadas de dos poblaciones, es decir, n
pares de mediciones (x1, y1), (x2, y2), , (xn, yn), y se quiere ver si la mediana de la
poblacin de las diferencias yi-xi es cero o no, o lo que es lo mismo, la mitad de los
valores de Y superan a los de X y la otra mitad est por debajo.
H0 MeY-X = 0
H1 MeY-X 0

Para estos casos, pueden aplicarse con yi-xi cualquiera de los dos
contrastes de los signos o de los rangos signados para una muestra

Ejemplo:
Se administr un cierto frmaco a una muestra representativa de enfermos de hepatitis alcohlica.
Para estudiar sus consecuencias, se valoraron ciertos parmetros fisiolgicos inicialmente y al cabo
de un mes de tratamiento. Para el parmetro SGOT se obtuvo:
Paciente

10

Inicial

56

56

147

58

121

57

49

118

63

75

Al mes

47

63

125

26

99

36

34

90

50

59

Indique qu procedimiento(s) estadstico(s) podra emplear para analizar tal variacin en el caso de
que no se pudiera suponer Normalidad en los datos.

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
Solucin 1:
Utilizaremos el contraste de los signos para las diferencias yi - xi :
Hacemos las diferencias
H0 La mediana de la poblacin de las diferencias yi xi es 0
restadas con la mediana (0)
H1 La mediana de la citada poblacin no es 0
Paciente

10

yi - xi
Signo

-9
-

4
+

-22
-

-32
-

-22
-

-21
-

-15
-

-28
-

-13
-

-16
-

Como el EC es el nmero de valores positivos, EC = 1 que si es cierta H0 sigue una distribucin


binomial Bi(10; 0.5), que segn la tabla de la binomial (pg. 168), nos dara un valor de p=0.002.
El contraste es significativo, es decir, podemos afirmar que ha cambiado el valor del parmetro
fisiolgico . (Tambin se podra haber planteado unilateral para ver si los valores disminuyen)

Solucin 2:
Utilizaremos el contraste de los rangos con signos para las diferencias yi xi. El planteamiento
de las hiptesis es el mismo de antes. Los clculos son:
yi -xi - 0
yi xi
Orden
Rangos

-9
9(-)
4(+)
1(+)

4
4(+)
9(-)
2(-)

-22
22(-)
13(-)
3(-)

-32
32(-)
15(-)
4(-)

-22
22(-)
16(-)
5(-)

-21
21(-)
21(-)
6(-)

-15
15(-)
22(-)
7.5(-)

-28
28(-)
22(-)
7.5(-)

-13
13(-)
28(-)
9(-)

-16
16(-)
32(-)
10(-)

Por tanto el EC=W(+) = 1, o tambin podra ser W(-) = 2+3+4+5+6+7.5+7.5+9+10=54, y consultando


la pg.179, para =0.05, est claro que el EC est fuera de la Regin de Aceptacin (8- 47)

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
H) Contraste de la suma de los rangos de Wilcoxon para comparar 2
muestras independientes:
Si x1, x2, , xm e y1, y2, , yn son muestras aleatorias de tamao m y n de dos
poblaciones con distribuciones continuas de X e Y, respectivamente, este contraste
nos permite decidir si las distribuciones de X e Y son iguales, con las hiptesis:
H0 Las distribuciones de X e Y son iguales
H1 Las distribuciones de X e Y no son iguales
y donde para calcular el estadstico de contraste hay que realizar los siguientes pasos:
1.
2.
3.
4.

Con las m+n observaciones se forma una nica muestra que se ordena de menor a mayor
Asignamos rangos a las observaciones ordenadas de 1 a m+n.
En caso de empates, se asigna el mismo rango a los valores empatados, obtenido con la
media de los rangos que se asignaran a los valores si no fueran iguales.
Se calculan R1 y R2 , las sumas de los rangos de cada una de las muestras. Debe suceder
que R1+R2 = (m+n)(m+n+1)/2.

Se toma como EC a la suma de rangos (R1 R2 ) de la muestra de menor tamao


Cuando es cierta H0, el EC tiene unos valores de aceptacin y otros de rechazo
(dado un error ) que estn en la tabla de la pg. 178 del Cuaderno de Prcticas.
NOTA: Existen otros contrastes equivalentes a ste, como el de la U de Mann-Whitney, que se basan
en el mismo razonamiento, aunque el EC (y por tanto la tabla para mirar la RC) son distintos.

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
Ejemplo:
Los das de estancia en dos hospitales, de dos muestras de tamao 5 y 10 respectivamente, de
pacientes intervenidos quirrgicamente por el mismo tipo de operacin, son los siguientes:
HospitalA(X): 10, 15, 12, 23, 17
Hospital B (Y): 14, 16, 23, 25, 17, 23, 20, 17, 26, 30
Suponiendo que los datos no son Normales, puede considerarse que la duracin de la
estancia es distinta en ambos hospitales?

Solucin:
Para ver si son distintas las estancias con metdos no paramtricos, tiene sentido plantear el
contraste:
Para obtener
H0 Las distribuciones de X e Y son iguales en ambos hospitales
el estadstico:
H Las distribuciones de X e Y no son iguales en ambos hospitales
1

Mezclamos y
ordenamos
Rangos

10
(A)
1

12
(A)
2

14
(B)
3

15
(A)
4

16
(B)
5

17
(A)
7

17
(B)
7

17
(B)
7

20
(B)
9

23
(A)
11

23
(B)
11

23
(B)
11

25 26 30
(B) (B) (B)
13 14 15

Se tiene que R1 = 1+2+4+7+11 = 25, y R2 = 3+5+7+7+9+11+11+13+14+15 = 95.


Por tanto el EC = 25, y mirando en la tabla de pg. 178, para n1=5 y n2=10, se tiene que:
Si tomamos = 0.05, RA=(23-57) H0
Si tomamos = 0.10, RA=(26-54) H1

0.05<p<0.1 No pueden considerarse distintas

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
I) Contraste de Mcnemar:
Se utiliza cuando se quieren comparar dos proporciones cuando las poblaciones son
dependientes. El planteamiento parte de tomar una muestra de individuos, a cada uno
de los cuales se mira si tienen o no una caracterstica en dos ocasiones (A y B, antes
y despus de un tratamiento, o con dos tratamientos distintos, o en dos situaciones
distintas generadas por una intervencin,).
En este caso, los individuos de la muestra son clasificados segn que presenten (SI) o no (NO) la
caracterstica, y se disponen los datos de la forma:
En B
En A

SI

NO

SI

n11

n12

NO

n21

n22

Donde:
n11 es el nmero de individuos que tienen la caracterstica en ambas ocasiones
n12 son los que la tienen en A pero no en B
n21 son los que la tienen en B pero no en A
n22 los que no la tienen ni en A ni en B

Siendo las hiptesis, EC y RC de este contraste:

H0 A B

H1 A B

(| n12 n21 | 1)2


X
n12 n21
2

RC X 2 21 (1)

(Para que la aproximacin que se utiliza en la distribucin del


EC sea aceptable, conviene que n12+n21>10)

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
Ejemplo
Se ha realizado una encuesta a 125 individuos que son usuarios al mismo tiempo
de Centros de Salud y Ambulatorios. En dicha encuesta se ha recogido su opinin
favorable (SI) o desfavorable (NO) a dichos sistemas de asistencia. Los datos
recogidos aparecen en la siguiente tabla
Centro de Salud
Qu debeconcluirseenbaseaestosdatos?

Ambulatorio

SI

NO

SI

27

35

NO

43

20

Solucin:
Vamos a plantear un contraste para decidir si los usuarios tienen la misma opinin
sobre ambos centros:
H0 A B

H1 A B

(| n12 n21 | 1)2 72


X

0.628 y
n12 n21
78
2

RC X2 20.95 (1) X2 3.84

Como X2 RC, puede concluirse que los usuarios tienen la misma


opinin sobre ambos tipos de centros (=0.05)

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
J) Contraste de Kruskal Wallis o de ANOVA para rangos:
Se utiliza cuando se quieren comparar ms de dos poblaciones (k) con variables
continuas No Normales, de las que se tienen muestras independientes de tamaos n1,
n2, , nk y tal que se tienen en total n1+ n2 + , + nk = N datos. Las hiptesis se
plantean:
H0 Las distribuciones de las k poblaciones son iguales
H1 Las distribuciones de las k poblaciones no son iguales
y para calcular el estadstico de contraste hay que realizar los siguientes pasos:
1.
2.
3.
4.

Con las N observaciones se forma una nica muestra que se ordena de menor a mayor
Asignamos rangos a las observaciones ordenadas de 1 a N.
En caso de empates, se asigna el mismo rango a los valores empatados, obtenido con la
media de los rangos que se asignaran a los valores si no fueran iguales.
Se calculan R1, R2, , Rk , las sumas de los rangos de cada una de las muestras. Debe
suceder que R1+R2++ Rk = N(N+1)/2.

El EC se obtiene utilizando un mtodo parecido al de ANOVA (cociente de medias cuadrticas),


pero con los rangos obtenidos. La frmula del EC, para el caso en que no haya empates es:
k R2
12
H
ni 3 (N 1)
N(N 1) i 1 i

RC H 21 (k 1)

CONTRASTES DE HIPTESIS NO PARAMTRICOS


PARA DOS O MS POBLACIONES
Ejemplo:
Aplquese el test de Kruskal y Wallis al siguiente problema: La ureasa es una enzima
productora de amonaco en el tracto gastrointestinal. Es conocido que el amonaco es
perjudicial en pacientes con enfermedades hepticas. Se ha realizado un estudio cuyo objeto
es comparar la concentracin de ureasa en los jugos gstricos en tres poblaciones : I) grupo
control, II) pacientes con obstruccin en la vena porta extraheptica; III) pacientes con hepatitis
viral. Los datos obtenidos, en miligramos por mililitro son los siguientes:
Grupo I
Grupo II
Grupo III

261,1
221,9
600,9

186,2
188,7
301,2

239,1
167,6
607,0

Concentracin de Ureasa
243,3
296,8
270,5
222,5
224,9
178,8
147,9
175,3
283,3
193,3
159,4
540,3

267,3
214,3
355,1

230,6
159,5
265,3

244,8
230,0
512,4

Solucin:
Planteamos el contraste, asignamos rangos (en rojo entre parntesis), obtenemos el EC y la RC:
H0 Las distribuciones de las k poblaciones son iguales
H1 Las distribuciones de las k poblaciones no son iguales
Grupo I
Grupo II
Grupo III

Concentracin de Ureasa
261,1(19) 186,2(7) 239,1(16) 243,3(17) 296,8(24) 270,5(22) 222,5(12)
221,9(11) 188,7(8) 167,6(4) 224,9(13) 178,8(6) 147,9(1) 175,3(5)
600,9(29) 301,2(25) 607,0(30) 283,3(23) 193,3(9) 159,4(2) 540,3(28)

267,3(21) 230,6(15) 244,8(18)


214,3(10) 159,5(3) 230,0(14)
355,1(26) 265,3(20) 512,4(27)

La suma de rangos en cada muestra es RI = 171, RII = 75 y RIII = 219, luego el EC: Luego las
concentraciones
k R2
12
12 1712 75 2 2192
H
( 10 10 10 ) 3 31 13.87 y RC H 20.999 (2) H 13.82
ni 3(N 1)
son distintas
N(N 1) i1 i
30 31
(p<0.001)

También podría gustarte