Está en la página 1de 4

Una aplicación del modelo Weibull en el análisis de supervivencia.

Estela Morales Ruiz, Francisco Solano Tajonar Sanabria, Yoanna Guadalupe Arenas Martínez,
Hortensia Josefina Reyes Cervantes, Bulmaro Juárez Hernández

Resumen—El análisis de supervivencia hace frente al una cuerda que sostiene una carga, gradualmente está se
problema referente del estudio de sucesiones secuenciales debilitará en el transcurso del tiempo, así la falla depende del
de eventos gobernados por leyes probabilísticas para el fenómeno de estudio.
estudio del tiempo de un evento en cierto sistema. En los Klein, entre otros autores establecen que un modelo
últimos años han crecido las aplicaciones del análisis de probabilístico es un planteamiento realista para la modelación
supervivencia en varias disciplinas, como la biología, de los eventos anteriormente descritos.
medicina, ingeniería, etc.; pero el evento de interés puede Cabe mencionar la existencia de múltiples modelos
ser algo diferente como recaída en cierta enfermedad, propuestos para el estudio de datos relacionados con tiempos
reclamaciones de seguros, divorcios, etc. de vida, no obstante, existen casos en los que los datos no
En el presente trabajo se utiliza el modelo paramétrico pueden ser ajustados por modelos paramétricos clásicos. Así,
Weibull, que es uno de los modelos de mayor utilización el problema dentro del análisis de supervivencia reside en
ya que este modelo ajusta a un conjunto grande de datos, representar las distribuciones de los tiempos de vida mediante
su característica primordial radica en que su función de modelos estadísticos y formar inferencia sobre los parámetros
riesgo es de tipo polinomial y esto nos indica que el riesgo de estos modelos.
puede ser creciente, decreciente o constante, además la
estimación de sus parámetros se puede lograr utilizando
el método de máxima verosimilitud el cuál no ofrece II. TEORÍA
estimadores consistentes. El Análisis de supervivencia es una técnica inferencial que
Además de presentar las particularidades del modelo, tiene como objetivo esencial modelizar el tiempo que se tarda
también se presentará una aplicación de él. en que ocurra un determinado suceso, es decir que se encarga
del estudio de eventos-tiempo. Entre los modelos que se han
I. INTRODUCCIÓN propuesto para describir dichos eventos se encuentran el
A través de la historia, la matemática ha sido una rama de las modelo exponencial, gamma, Weibull, y lognormal, no
matemáticas que ha ayudado a crecer a muchas áreas, tales obstante, como se mencionó anteriormente no todos los datos
como biología, medicina, ingeniería, física, etc. En particular se ajustan a tales modelos, por lo cual es necesario proponer
el análisis de supervivencia ha desarrollado tópicos de gran modelos más generales, para así explicar el comportamiento
ayuda para dichas áreas, con la finalidad general de estudiar de los datos aun cuando no se ajusten a cierto modelo.
el tiempo de vida de un elemento particular. El tiempo de vida de un objeto, en general depende de otras
Cuando hablamos de tiempo de vida nos estamos refiriendo a variables, las cuales son explicables y que denominaremos
la longitud de tiempo hasta la ocurrencia de un suceso de covariables del fenómeno. Cox y Oakes (1984).
interés (que suele ser el fallo de una pieza, o la Muerte o
recaída de un paciente) desde un punto prefijado. En otras Sea T una variable aleatoria (v.a.), que denota el tiempo
ocasiones, el término tiempo de vida se usa en sentido hasta que ocurre en evento de interés; como puede ser el fallo
figurado. Matemáticamente, el tiempo de vida es una variable de un electrodoméstico, el desarrollo de una enfermedad,
aleatoria no negativa. Klein y Moeschberger (1997), muerte, recurrencia en algún fallo, etc. En particular para este
Andersen, Borgan, Gill y Keiding (1993), Cox y Oakes trabajo, T es una v.a. continua, no negativa que representa a
(1984), Lawless (1982). una población homogénea. Haremos uso de tres funciones que
Fenómenos tales como el tiempo de vida de un enfermo caracterizan de manera única a T ; función de supervivencia,
terminal, la durabilidad de electrodomésticos, fallas en función de riesgo, y función de densidad de probabilidad.
maquinarias, el desarrollo de una enfermedad, etc., no puedes
Definición 1. Para la v.a. T , definimos la función de
ser modelados de forma determinista, es decir que existe un
supervivencia como la probabilidad de que un individuo
factor aleatorio que determina el futuro del proceso en
sobreviva al menos hasta el tiempo t , esta función está denota
cuestión, ver Cox y Oakes (1984). Supongamos que es de
interés el establecer el tiempo en el que cierto por S (t ) y está
electrodoméstico dejará de ser útil, podemos observar que el S=(t ) P (T ≥ t ) dada por:
tiempo en el que este presentará falla es imprevisto, pues (1)
durante un tiempo funcionará de manera correcta y en el
siguiente presentará falla. Un ejemplo contrario sería el de

estelamruiz@gmail.com hreyes@fcfm.buap.mx
ftajonar@fcfm.buap.mx bjuarez@fcfm.buap.mx
guadalupe_yam@hotmail.com
Teorema 1. Sea T un v.a. continua, con densidad f (t ) , Definición 3. Una v.a. tiene distribución Weibull, si existen
β
entonces T 
dS (t ) λ > 0, β > 0 tales que la variable Z =   tiene una
f (t ) = − (2) λ
dt distribución exponencial con media 1.
Definición 2. La función de riesgo se define como:

P(t ≤ T < t + ∆t | T ≥ t ) La función de densidad está dada por:


h(t ) = lim (3)
∆t →∞ ∆t  β  t  β −1  β
t 
  exp    ; t > 0
f (t ) =  λ  λ  
y nos es útil para determinar de manera apropiada la
distribución de fallas. La única condición sobre h(t) es la no λ  (6)
negatividad, es decir, h(t ) ≥ 0 . 
 0 d .o. f
f (t )
Corolario 1.1 h(t ) = (4)
S (t ) PROPIEDADES
Su función de distribución acumulada está dada por:
 
t
=
Nótese que: S (t ) exp − ∫ h(u )du  (5)
 o  1 exp(t / λ ) β
F (t ) =P(T ≤ T ) =− (7)
Como resultado, podemos observar que
Su función de supervivencia está dada por:
 
t
f (t ) h(t ) exp − ∫ h(r )dr  , es decir que f puede
= β
 o  t
S (t ) = exp   (8)
expresarse en términos de la función de riesgo. Implicando λ
que la función de riesgo proporciona mayor información del
mecanismo subyacente de falla que la función de Su función de riesgo está dada por:
supervivencia. Por esta razón es que la función de riesgo es
considerada como el elemento dominante para el análisis de β −1
supervivencia. βt
h(t ) =
λ  λ 
(9)
MODELO WEIBULL
Propuesto por Berry (1975), Dyer (1975), Meier (1980) y
Wilks (1990) como modelo para datos de tiempo a partir de 3. PARTE EXPERIMENTAL
la distribución Weibull, la cual fue introducida por el físico Una compañía de juguetes quiere comparar la fiabilidad de
sueco Waloddi Weibull. dos diseños propuestos para un artículo. La confiabilidad
deseada a 400.000 ciclos es 0.90., en otras palabras, la
Lee y Thompson (1974) argumentaron que, en la clase de compañía de juguetes quisiera que el 90% de los artículos
distribuciones de riesgo proporcional, la distribución de sobrevivieran al menos 400.000 ciclos. Este objetivo se
Weibull parece ser el modelo más apropiado en la descripción expresa matemáticamente como r (400.000) 0.90. Se
de tiempos de Vida. ensamblaron diez unidades con cada uno de los dos diseños
de (diseño a y diseño b). Estas 20 unidades fueron probadas
Lee y O’Neil (1971) Y Doll (1971), afirman que este modelo hasta que fallaron. La siguiente tabla muestra la cantidad de
ajusta muy bien a datos que involucran tiempos de aparición ciclos hasta antes del fallo para cada artículo probado.
de tumores en humanos y animales.
Diseño A Diseño B
La distribución Weibull presenta un punto de partida para la Muestra Ciclos Muestra Ciclos
estimación de sus parámetros, haciendo uso de su función de 1 7290444 11 529082
supervivencia; abarcando varios tipos de riesgo, para 2 614432 12 729957
diferentes valores del parámetro β . 3 508077 13 650570
4 807683 14 445834
 β > 1, creciente 5 755223 15 343280

riesgo  β < 1, decreciente 6 848953 16 959903
 β = 1, cons tan te 7 384558 17 730049

8 666686 18 730640
Para distintos valores de β , se ajustan un gran número de 9 515201 19 973224
fenómenos de tiempo de vida. 10 20 258006
Los datos de la tabla no indican claramente si el diseño fracaso constante. Un β > 1.0 indica una tasa de fallos
cumple con la meta de deseada. Ambos diseños tuvieron al creciente. Esto es típico de los productos que se están
menos un fallo antes de 400.000 ciclos, pero claramente el agotando. Tal es el caso de nuestros artículos, tanto los
número promedio de ciclos antes del fallo supera los 400.000
diseños A como B tienen valores β mucho más altos que 1,0.
para ambos diseños. Una comparación de los promedios de la
muestra utilizando la prueba t de Student no revela diferencia Los artículos fallan debido a la fatiga, es decir, se desgastan.
estadística entre los ciclos medios para el Diseño A y los
ciclos medios para el Diseño B (valor de p = 0,965). Pero La vida característica de Weibull, es una medida de escala, en
como una simple medida de la tendencia central, el promedio la distribución de datos. Ocurre que α es igual al número de
de la muestra no da ninguna información sobre la extensión o ciclos en los que el 63.2% del producto ha fallado. En otras
la forma de la distribución de los tiempos de falla. ¿Podrían palabras, para una distribución de Weibull s = 0,368,
los promedios de los dos diseños ser iguales, pero su tiempo independientemente del valor de β . Por ejemplo, con
de vida ser bastante diferentes? viviendas de diseño A, alrededor del 37% de las viviendas
deben sobrevivir al menos 693.380 ciclos.
Se realiza una modelación tipo Weibull, empezando por
estimar los parámetros haciendo una transformación Aunque esto es interesante, todavía no revela si el diseño del
logarítmica a S(t), para que así tenga una forma lineal. artículo cumple con la meta de supervivencia de S (400,000)
  1  0,90. Para ello, es necesario conocer la fórmula de
ln ln  =  β ln(t ) − β ln(λ ) supervivencia asumiendo una distribución de Weibull:
 1 − F (t )  β
t
Que se resume a realizar una regresión lineal, el cuál fue S (t ) = exp   , dónde x es el tiempo, o número de
realizado con Analysis Tool Pack de Excel, con el cual λ
obtenemos valores: β = 4.25 , o parámetro de forma y ciclos, hasta que se presenta el fallo. Así, conectando los
α = 693,380 , o vida característica. valores conocidos para Alpha, Beta y t, podemos obtener la
estimación de tiempo de vida deseada. Para el diseño A:
Mediante la realización de una regresión lineal simple, se
S(400000)=.908 y para el diseño B: S(400000)=0.800.
obtienen estimaciones de parámetros que permitirán hacer
Con este resultado asentamos el diseño A como la alternativa
inferencias sobre el tiempo de vida del Diseño A.
superior, supongamos que la empresa planea ofrecer una
garantía en el artículo. Por supuesto, es deseable asignar los
fondos adecuados para honrar la garantía, para no ser
superado por los costes inesperados de la garantía. Se fija el
período de garantía de manera que no más del 1% de las
unidades vendidas fallaran antes de que venza el período de
garantía. ¿Cómo puede determinar la duración de la garantía?
Necesitamos obtener el número de ciclos correspondientes a
cierto nivel de supervivencia. Haciendo uso de la forma
inversa de la función de distribución de una Weibull,
obtenemos que un 99% sobrevivirá al menos 235,056 ciclos.
Esta información nos provee ventajas sobre competidores,
pues que estos 235,056 ciclos son equivalentes a 6.4 años de
uso, así podríamos extender una garantía de hasta 5 o 6 años,
asegurando ventaja sobre garantías más cortas ofrecidas por
Se repite el análisis para el diseño B y obtenemos valores de competidores.
β = 2.53 y α = 723,105
IV. CONCLUSIONES
La fuerza de la distribución de Weibull es su versatilidad.
III. RESULTADOS Dependiendo de los valores de los parámetros, la distribución
de Weibull puede aproximar una distribución exponencial,
El parámetro de forma de Weibull, denominado β , indica si normal o sesgada.
la tasa de fallos es creciente, constante o decreciente. Un β
<1.0 indica que el producto tiene una tasa de fracaso La versatilidad prácticamente ilimitada de la distribución de
decreciente. Este escenario es típico de la "mortalidad Weibull es igualada por las innumerables capacidades de
infantil" e indica que el producto está fallando durante su cálculo por distintas plataformas. Un analista de datos que
período de "burn-in". Un β = 1.0 indica una tasa de fracaso entiende la teoría detrás de un análisis dado a menudo puede
obtener resultados que otros podrían asumir requieren análisis
constante. Frecuentemente, los componentes que han estadístico especializado. El análisis de Weibull pone al
sobrevivido a quemado posteriormente exhibirán una tasa de alcance de la mayoría de los datos un buen ajusto.
REFERENCIAS
[1] Cox D., Oakes D., Analysis of Survival Data, Chapman
and Hall, 1984.
[2] Klein P., Survival Analysis. Tecniques for Censored and
Truncated Data, Second edition, Springer-Verlag New
York Inc., United States of America, 2003.
[3] Mood A., Introduction to Theory of Statistics, Third
edition, McGraw-Hill, New York, 1974.

También podría gustarte