Está en la página 1de 9

Comparacin no paramtrica de muestras

Proyecto e-Math 1
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
FIABILIDAD (V): COMPARACIN
(NO PARAMTRICA) DE MUESTRAS
RELACIN CON OTROS MATH-BLOCS__________________________________
Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad
de componentes desde un punto de vista estadstico:
Conceptos Bsicos (I).
Identificacin y descripcin grfica de los datos (II).
Anlisis paramtrico de los tiempos de fallo (III).
Anlisis no paramtrico de los tiempos de fallo (IV).
Comparacin no paramtrica de muestras (V).
Tests de vida acelerada (VI).
Modelos de regresin para observaciones censuradas (VII).
Anlisis Probit (xito / fracaso) (VIII).

ESQUEMA DE CONTENIDOS___________________________________________

Fiabilidad (V):
Comparacin (no
paramtrica) de muestras
Comparacin de n
grupos (n > 2)
Comparacin de 2
grupos
Ejemplo comparacin
grupos (Statistica)
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 2
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
INTRODUCCIN_____________________________________________________
A menudo, puede resultar conveniente usar mtodos no paramtricos para comparar los tiempos de
fallo procedentes de diferentes muestras. As, por ejemplo, en el caso de los porttiles (visto en el
captulo anterior), podramos estar interesados en comparar los tiempos de supervivencia de los tres
grupos determinados segn el taller de reparacin al que corresponde cada observacin.
A priori, cuando los tiempos de fallo no se distribuyan segn una normal, podra pensarse en utilizar
los mtodos no paramtricos clsicos, tales como los mtodos Wilcoxon o Mann-Whitney para
comparar dos muestras, o el Kruskal-Wallis para varias muestras. Sin embargo, estos mtodos
tradicionales no son vlidos cuando las muestras contienen observaciones censuradas, debiendo
recurrir en tales casos a alguno de los mtodos no paramtricos especficos que se enuncian en el
siguiente cuadro:








La mayora de estos mtodos proporcionarn valores de una v.a. Z que sigue una distribucin normal
tipificada (i.e., una N(0,1)); dichos valores se usarn para hacer un contraste de hiptesis sobre la
similitud o no de los grupos. A fin de que los resultados sean estadsticamente fiables, ser necesario
disponer de muestras suficientemente numerosas. Es importante observar adems que, cuando se
quieran comparar dos o ms grupos resulta fundamental examinar primero la proporcin de
observaciones censuradas en cada uno de ellos, dado que si dicha proporcin difiere de forma
notable segn el grupo, los resultados podran resultar bastante sesgados.
Si bien no hay un criterio general sobre qu mtodo es mejor, a la hora de comparar dos grupos, si
las muestras provienen de una poblacin con distribucin Exponencial o Weibull, los mtodos Cox-
Mantel y log-rank parecen ofrecer resultados ms fiables. El test Wilcoxon-Gehan para mltiples
grupos es una generalizacin de los mtodos Wilcoxon-Gehan. De hecho, cuando se utiliza este test
con slo dos grupos de muestras, los resultados que se obtienen son los mismos que con el
Wilcoxon-Gehan.
MTODOS PARA COMPARAR GRUPOS CON OBSERVACIONES CENSURADAS
Wilcoxon-Gehan
Cox-Mantel
F-Cox
Log-rank
Wilcoxon-Peto
Comparacin de 2 grupos
Comparacin de mltiples grupos
Wilcoxon-Gehan
generalizado
Cox-Mantel generalizado
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 3
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
COMPARACIN DE 2 GRUPOS___________________________________
Supongamos que se dispone de n
1
y n
2
observaciones pertenecientes a los grupos 1 y 2:
{ }
1
1
1 1
) , (
n
i
i i
t
=
y { }
2
1
2 2
) , (
n
j
j j
t
=

donde:

=
1i
1i
t en fallo hay si
t en censura hay si
1
0
1i
y

=
2j
2j
t en fallo hay si
t en censura hay si
1
0
2j

Sea d = nmero total de fallos en ambas muestras,
(i) Se unen las observaciones procedentes de ambos grupos, y se consideran m instantes
(ordenados) en los cuales se haya producido al menos 1 fallo:
2 2 1
... n t t t
m
+ < < <
1
n d m con
(ii) En cada uno de los instantes anteriores, t
i
, 1 i m , se podrn resumir los datos en una
tabla 2x2:




ESTADO
MUESTRA Fallo (d) En Riesgo (d + n) Supervivientes (n)
1 d
1i
n
1i
n
1i

2 d
2i
n
2i
n
2i

Total d
i
n
i
n
i




Tendremos as que la hiptesis nula
H
0
: probabilidad de supervivencia es la misma en ambas muestras
implica la independencia de las categoras muestra y estado de la tabla 2x2 anterior.
Por tanto, bajo la hiptesis nula, el valor esperado de d
1i
(n de fallos del grupo 1 en el instante t
i
)
ser:
E[d
1i
/H
0
] E
0
[d
1i
] = n
1i
* d
i
/ n
i

Usando las propiedades de la distribucin Hipergeomtrica, tambin se tiene que:
Var[d
1i
/H
0
] Var
0
[d
1i
] = [n
1i
* n
2i
* n
i
* d
i
] / [n
i2
* (n
i
1)]
N de observ. del grupo 1 que han
fallado justo en el instante ti
N de observ. del grupo 1
que estaban en riesgo justo
antes del instante ti:
n = n + d
N de observ. del grupo 1
supervivientes tras el instante ti
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 4
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Por su parte, es posible representar la evidencia en contra de la hiptesis nula con el siguiente
estadstico de contraste, el cual es una suma ponderada de las diferencias entre el nmero de fallos
observados y el nmero de fallos esperados en el grupo 1:
| | | |

=
=
m
i
i i i
d E d w
1
1 0 1

donde w
i
es el peso asociado al instante t
i
.
Se puede demostrar que el estadstico anterior sigue una distribucin normal. Calculemos su media y
varianza:
Bajo H
0
, se cumplir:
E[/H
0
] E
0
[] = 0
Var[/H
0
] Var
0
[] = w
i
2
Var
0
[d
1i
] = [w
i
2
* n
1i
* n
2i
* n
i
* d
i
] / [n
i2
* (n
i
1)]
Estandarizando se obtendr un estadstico de contraste que se distribuye segn una normal
tipificada, i.e.:
) 1 , 0 (
) (
0
N
Var
Z

=
o, equivalentemente, se tiene que Z
2
sigue una Chi-cuadrado con 1 grado de libertad:
2
1
0
2
2
) (

=
Var
Z
1) Tomando w
i
= n
i
estaremos en el mtodo Wilcoxon-Gehan, el cual se reduce al test
clsico de Wilcoxon cuando no hay observaciones censuradas.
2) Tomando w
i
= 1 estaremos en el mtodo Log-rank o Cox-Mantel.
3) Tomando w
i
= n
i
estaremos en el mtodo Tarone-Ware.
4) Tomando w
i
= estimacin de S(t) en t = t
i
estaremos en el mtodo Wilcoxon-Peto.
Observaciones:
El test Wilcoxon-Gehan pone ms peso en las observaciones iniciales, por tanto es
ms sensible a la hora de detectar la existencia de diferencias a corto plazo entre
grupos.
El test Log-rank pone el mismo peso en todas las observaciones, por lo tanto resulta
ms sensible a la hora de detectar la existencia de diferencias a largo plazo entre
grupos.
Debido a la forma en que los tests se formulan (los trminos del sumatorio en la
expresin de no estn elevados al cuadrado), stos slo sern potentes cuando la
tasa de riesgo de un grupo siempre sea menor que la del otro (i.e., al representar sus
respectivas funciones tasa de riesgo, stas no se crucen). En caso contrario, podra
ocurrir que algunos trminos del sumatorio anterior positivos y otros negativos,
cancelndose mutuamente.
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 5
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
COMPARACIN DE VARIOS GRUPOS___________________________________
Los mtodos anteriores para comparar 2 grupos se pueden generalizar al caso de k grupos:
Se ordenan los tiempos de fallo:
k 1 m 2 1
n ... n d m con t ... t t + + < < <

y para cada t
i
se construye la siguiente tabla 2xk:





Por tanto, bajo la hiptesis nula, el valor esperado de d
ji
(n de fallos del grupo j-simo en el instante
t
i
) ser:
E[d
ji
/H
0
] E
0
[d
ji
] = n
ji
* d
i
/ n
i

y los componentes de la matriz de covarianza sern:
| |
) 1 ' ( '
) ' ' ( '
2
0


=
i
i
i i ji i ji
ji
n n
n d n n n
d Var y | |
) 1 ' ( '
' '
,
2
0


=
i
i
i i li ji
li ji
n n
n d n n
d d Cov
La evidencia contra H
0
vendr representada por el estadstico de contraste:

=
=
m
i
i i
D w
1

donde wi es el peso asociado a las observaciones en el instante t
i
, y
| |
| |
(
(
(
(
(
(

=
ki ki
i i
i
d E d
d E d
D
0
1 0 1
.
.
.

A efectos prcticos, se usar el estadstico de contraste
2
construido a partir de :
=
1 2
w
V
el cual sigue una distribucin
2
con (k-1) grados de libertad.
En la expresin anterior, V
w
= w
2
V , siendo w el vector de pesos w
i
.
Tomando w
i
= n
i
se obtiene el mtodo de Wilcoxon-Gehan generalizado mientras que tomando w
i
=
1 tendremos el test de Log-rank o Cox-Mantel generalizado.
ESTADO
Muestra Fallo (d) En Riesgo (d + n) Supervivientes (n)
1 d
1i
n
1i
n
1i

.
.
.
.
.
.
.
.
.
.
.
.
k d
ki
n
ki
n
ki

Total d
i
n
i
n
i

w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 6
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
EJEMPLO COMPARACIN DE GRUPOS_________________________________
Usando el programa STATISTICA y, nuevamente, el ejemplo de los porttiles (considerando tres
grupos, uno por cada taller de reparacin) se mostrar cmo es posible aplicar en la prctica los
mtodos anteriores de comparacin:
Entrada de datos (input): Seleccionamos la opcin Comparing multiple samples en el men inicial
del mdulo.

Pulsar sobre el botn Variables para seleccionar los tiempos de fallo, el indicador de censura, y la
variable que determina los grupos (Taller ).

Comprobar que la opcin Code for censored responses muestra los cdigos correctos de las
variables censuradas.
Dentro de la opcin Codes (for groups) , pulsar sobre el botn All :

w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 7
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Salida de datos (output): El programa mostrar los siguientes resultados:
Notar que el test Chi-Cuadrado es casi significativo en este caso (p-valor = 0,05672), por lo que
estaramos tentados de rechazar la hiptesis nula (no hay diferencias importantes entre los tres
grupos) en favor de la hiptesis alternativa (la duracin de los porttiles depende del taller donde
fueron arreglados).
A fin de poder apreciar mejor estas ms que posibles diferencias, se podran representar en un
mismo grfico las funciones de supervivencia de cada grupo. Para ello se debe pulsar sobre la opcin
Cumul. prop. surviving by group (Kaplan-Meier) :

Claramente, la funcin de supervivencia correspondiente al taller C muestra una disminucin inicial
menos acusada que la del resto de talleres. Por tanto, deberamos concluir que los porttiles
reparados en el taller C tienen una mayor probabilidad de sobrevivir, en especial durante los
primeros 100 das crticos posteriores a la reparacin.

A
B
C
Cumulative Proportion Surviving (Kaplan-Meier)
Complete Censored
Time
C
u
m
u
l
a
t
i
v
e

P
r
o
p
o
r
t
i
o
n

S
u
r
v
i
v
i
n
g
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 200 400 600 800 1000 1200 1400 1600 1800 2000
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 8
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Pulsando sobre el botn Percent surviving by group se obtendrn las tablas de supervivencia para
cada grupo:



Entrada de datos (input): Ahora que ya se ha comprobado que no todos los grupos son similares,
sera conveniente comparar dos de ellos, el A y el C, para comprobar nuestra observacin anterior de
que el taller C parece tener unos resultados diferentes a los del resto, en particular a los del taller A.
Para ello, se deber seleccionar la opcin Comparing two samples en el men inicial del mdulo.
Pulsando sobre el botn Variables indicaremos las variables que contienen los tiempos de fallo, el
indicador de censura, y los grupos (Taller ).
Comprobar que la opcin Code for censored responses muestra los cdigos correctos de las
variables censuradas, y seleccionar los cdigos de los grupos:
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m
Comparacin no paramtrica de muestras
Proyecto e-Math 9
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Salida de datos (output): a continuacin se muestran los resultados:

Seleccionando cada uno de los mtodos se irn obteniendo, entre otras, las siguientes ventanas:









Observar que, en este ejemplo, algunos de los tests dan p-valores cercanos al 0,05 (como el
Wilcoxon-Gehan), mientras que otros no son estadsticamente significativos (como el F-Cox). Por
tanto, se podra concluir, aunque sin excesiva seguridad, que los resultados obtenidos en ambos
talleres son diferentes, proporcionando el taller C mayor fiabilidad en las reparaciones de porttiles.
w
w
w
.
M
a
t
e
m
a
t
i
c
a
1
.
c
o
m