Está en la página 1de 8

Tema 1

Modelos aleatorios de tiempos de fallo

1.1. Introducción
Cuando cierto fenómeno físico tiene interés para un investigador, éste suele llevar a
cabo un experimento con el fin de obtener un valor observado del fenómeno. Si no es
factible la realización del experimento, es aconsejable desarrollar un modelo
matemático que permita predeterminar, al menos con un grado de precisión suficiente,
el valor que se observaría en el fenómeno bajo unas condiciones dadas.
A veces este resultado no puede predecirse con la información disponible sobre
el experimento. Podría ocurrir que los resultados ocurran al azar, por ejemplo, dos
mecanismos pueden ser fabricados siguiendo el mismo proceso de manufactura en las
mismas condiciones y ser utilizados en las mismas condiciones y aún así dejar de
funcionar en tiempos diferentes. En estos casos se requiere un modelo probabilístico o
modelo aleatorio. Esto nos lleva, en primera instancia al estudio de las variables
aleatorias, a las que dedicamos este capítulo.
A veces nos interesa estudiar un fenómeno que se desarrolla en el tiempo de
manera controlada por leyes probabilísticas, de modo que necesitamos un modelo
probabilístico que describa el comportamiento de un sistema que evoluciona
aleatoriamente en el tiempo, es decir un proceso estocástico.
El análisis estadístico de tiempos de vida tiene un área de trabajo muy amplio,
especialmente en los campos de biomedicina e ingeniería. Dependiendo del campo
donde se haga el estudio, se hablará de tiempo de vida, tiempo de supervivencia o
tiempo de fallo.
En un estudio de supervivencia cuando se hace mención a los datos o a la
variable que los modeliza se habla de tiempo de vida, aunque las observaciones no
siempre tienen que referirse literalmente al concepto de tiempo de vida. Algunas veces
hablamos de tiempo de vida cuando nos referimos a la longitud de vida hasta un tiempo
de muerte desde un punto prefijado. En otras ocasiones el término tiempo de vida se usa
en sentido figurado, matemáticamente el tiempo de vida es una variable no negativa de
probabilidad.
En el tratamiento de un conjunto de datos de tiempos de vida es común la
utilización de la metodología clásica, pero por otro lado importantes desarrollos y
aplicaciones recientes se siguen publicando en importantes revistas de investigación.
Algunos ejemplos de aplicación son los siguientes:

 En el campo de la ingeniería se puede hacer un estudio de la duración de una


componente electrónica o mecánica
 En el campo de la ingeniería un sistema reparable se puede analizar el tiempo de
funcionamiento y el de reparación.
 En medicina es de interés el estudio del tiempo desde diagnóstico hasta muerte,
pérdida o curación del enfermo.
La finalidad de un estudio de supervivencia es obtener información sobre la
variable tiempo de vida; tiempo hasta muerte, curación, probabilidad de fallo en cada
instante, riesgo de fallo, etc. Todo ello pudiendo considerar distintos factores endógenos
o exógenos que intervengan en el comportamiento del tiempo de vida, así como la
consideración de distintos grupos de riesgo.
En el tratamiento del conjunto de datos es de importancia la utilización de
modelos específicos paramétricos, modelos no paramétricos y semi-paramétricos que
describen bien el comportamiento del conjunto de datos.
Para comprender los tópicos desarrollados en esta asignatura, únicamente se
requieren los conocimientos que pueden adquirirse en un curso básico de Cálculo de
Probabilidades.
Comenzamos este tema haciendo una revisión de las nociones básicas y
terminología elemental usada en análisis de supervivencia.

1.2. Características de una variable aleatoria tiempo de vida

Sea T una variable aleatoria (v.a.) que representa el tiempo de vida de algún sistema, de
modo que ha de tratarse forzosamente de una v.a. no negativa.
Para cada t número real, la función de distribución F de la v.a. T se define como
la probabilidad del intervalo (0, t], F(t) = P{T ≤ t}. A no ser que se especifique lo
contrario, supondremos que T es siempre una variable aleatoria de tipo continuo y
llamaremos f a la función de densidad correspondiente.
Vamos a denotar como F o S , la función de supervivencia o función de
fiabilidad de la v.a. T que viene dada por F (t ) = S (t ) = 1 − F (t ) , y es de gran
importancia en disciplinas como la Teoría de Supervivencia, Fiabilidad o Bioestadística.
Un resultado importante y que usaremos en adelante es el que vemos a
continuación y que proporciona una expresión para los momentos de una variable
aleatoria en términos de la función de supervivencia o función de fiabilidad, S .
Empezamos dando una representación de la esperanza de una variable. Sea T una v.a.
no negativa, entonces

E [T ] = ∫ S ( t ) dt ,
0

siempre que E[T]<∞. Esta expresión es válida tanto para variables discretas como
continuas, y la prueba de este resultado puede encontrarse en Gámiz−Pérez (1993). La
expresión anterior puede extenderse a cualquier momento no centrado, ver Nelson
(1997).

1.2.1. Modelo continuo: La función de riesgo y de riesgo acumulado

En el estudio del comportamiento de un tiempo de vida aleatorio en


supervivencia, el análisis del riesgo de fallo en un tiempo determinado o hasta un
tiempo dado juega un papel fundamental.

1.2.1.1 Función de riesgo

Si T es una variable continua, la función


f (t)
r(t) = h(t) = ; t>0
S(t)
definida para todo t≥0 tal que S(t)>0, recibe el nombre de razón de fallo o función de
riesgo. Esta función tiene un interés particular en aplicaciones de Supervivencia ya que
indica la disposición inmediata al fallo en un intervalo de tiempo pequeño, como una
función de la edad.
Esta función se puede expresar como
P(t < T ≤ t + ∆t T > t)
h(t) = lim
∆t → 0 ∆t

Desde esta expresión podemos dar una interpretación del significado físico de la función
de riesgo. Supongamos un individuo cuyo tiempo de vida viene dado por la variable
aleatoria T. Sea ∆t pequeño, entonces

f (t)∆t
h(t) ⋅ ∆t = ≈
S(t)
P(aparezca un fallo en (t, t + ∆t])
= =
P(T > t)
= P(t < T ≤ t + ∆t T > t)

Así, h(t)·∆t representa la probabilidad de fallo durante (t, t+∆t], dado que el
sistema está funcionando en t. Como conclusión al razonamiento inmediato, podemos
interpretar que
f(t)dt ≈ P[t < T ≤ t+dt].

Todas las características de una v.a. pueden expresarse en términos de la función


de riesgo y función de riesgo acumulado. Dado que f(t) = −S’(t), se puede escribir

d
h(t) = − ln S(t) ,
dt
por lo que dado que S(0)=1 entonces

{ t
S(t) = exp − ∫ h(u)du .
0 }
Otra interpretación intuitiva de esta función es la siguiente. Supongamos un gran
número de enfermos que están vivos tras un tratamiento en el tiempo de operación t,
n(t). Entonces n(t)×h(t) es aproximadamente igual al número de recaídas por unidad de
tiempo, o lo que es lo mismo, h(t) es aproximadamente el número de fallos por unidad
de tiempo y por número de individuos en riesgo.
La función h(x) recibe otros nombres en distintas áreas de la estadística, por
ejemplo en demografía se la denomina fuerza de mortalidad, en la teoría de valores
extremos función de intensidad y en economía su inversa se llama razón de Mill.
Esta función es muy importante en la modelización estocástica ya que, una vez
estimada, acota considerablemente las posibilidades de elección de la familia de
distribuciones que describe un fenómeno aleatorio. La estimación de la función de
riesgo se basa esencialmente en consideraciones físicas, y se identifica con la frecuencia
con que ocurre un determinado suceso de interés por unidad de tiempo. Cuando el
fenómeno físico que se está estudiando es la evolución de un individuo, se puede
estimar esta función considerando una serie de individuos en condiciones similares, de
modo que si se quiere modelizar matemáticamente el tiempo de vida de este tipo de
enfermedad, una estimación natural de la función de riesgo es el número de recaídas por
unidad de tiempo ocurridos en cada intervalo de observación. Siguiendo esta línea, y
con el fin de elegir un modelo adecuado vía la función de riesgo, conviene tener en
cuenta la existencia de tres tipos de "fallos" (sucesos en general) que presentan
características esencialmente temporales.
El primer tipo se llama fallo inicial se manifiesta al principio de la vida del
individuo y va desapareciendo conforme se desarrolla el periodo inicial. Un ejemplo de
este tipo puede observarse en las tablas de mortalidad humana, en las cuales se supone
que en la vida de un individuo hay presentes, al principio de la misma, ciertos
problemas de carácter hereditario que pueden provocar desenlaces fatales y que van
desapareciendo conforme el individuo crece, aproximadamente están presentes hasta
una edad de 10 años.
El segundo tipo de fallo se llama fallo accidental, y ocurre durante el periodo en
el que el individuo presenta una función de riesgo constante, generalmente menor que la
que prevalece durante su periodo inicial. En las tablas de mortalidad humana, se supone
que las muertes ocurridas entre los 10 y 30 años son debidas a accidentes.
El tercer tipo, llamado fallo de desgaste, se asocia con un deterioro gradual del
individuo. En las tablas de mortalidad humana, hay, a partir de los 30 años una
proporción creciente de muertes atribuidas al envejecimiento del individuo.
Si en la evolución de un individuo únicamente estuviesen presentes estos tres
tipos de fallo, el modelo seleccionado para representar matemáticamente su tiempo de
funcionamiento debe tener una función de riesgo como la presentada en la Figura 1, que
recibe el nombre de curva de bañera.

Figura 1. Gráfico de curva de bañera

Una aplicación interesante de este tipo de curvas podemos encontrarla en el


análisis del número de accidentes de tráfico sufridos por una persona en función de la
edad, en este caso podríamos observar la situación de la Figura 2.
Figura 2. Razón anual de accidentes por edad.

1.2.1.2 La función de riesgo acumulada

Se define la función de riesgo acumulada hasta un tiempo t como

H (t ) = Λ ( t ) = ∫ h ( x ) dx ,
t

Esta función es interesante en problemas de inferencia en determinados procesos de


recuento.
A partir de la función de riesgo acumulada podemos expresar todas las
características de de una variable aleatoria, concretamente
F ( t ) = 1 − exp ( − H ( t ) ) = 1 − exp  − ∫ h( x)dx  .
t

 0 

Definición. Se define la función de riesgo promedio entre los tiempos t1 y t2, como el
valor promedio de la función de riesgo en el intervalo (t1, t2), es decir

∫ h ( u ) du = H ( t ) − H ( t ) ,
t2

rAve ( t1 , t2 )= t1 2 1

t2 − t1 t2 − t1
y se interpreta como el valor característico de la función de riesgo en el intervalo.
Además si el incremento de la función de distribución dentro del intervalo es pequeño,
se puede admitir la siguiente aproximación
F(t 2 ) − F(t 1 )
rAve (t 1 , t 2 ) ≈ .
t 2 − t1
Como caso particular, cuando t1=0, se tiene
F(t )
rAve (t ) ≈ ,
t
siendo la aproximación buena para F(t) pequeño, concretamente menor que 0.1. Estas
expresiones proporcionan interpretaciones sencillas de la función rAve. Se trata de la
fracción aproximada de fallo por unidad de tiempo en un intervalo específico.
1.2.2. Propiedades de la función de riesgo

Como se vio en la sección anterior, la función de riesgo caracteriza la distribución de la


variable aleatoria, pero, ¿cuándo una función es una función de riesgo de una variable
aleatoria? Pues bien, una función, h(t), es una función de riesgo de alguna variable
aleatoria no negativa continua si

 h(t ) ≥ 0 ; ∀t
t
 lim ∫ h(u )du = ∞
t →∞ 0

Cualquier función que verifique estas dos propiedades es la función de riesgo de


una variable aleatoria no negativa con función de supervivencia

{
S(t) = exp − ∫ h(u)du .
t

0 }
En el caso continuo se pueden hacer las siguientes consideraciones para la
función de riesgo. Esta función no siempre es creciente, dando lugar a clases
importantes de supervivencia en función del comportamiento de la función de riesgo. Se
tiene la clase razón de fallo creciente (IFR), razón de fallo creciente (DFR), forma de
bañera y forma inversa a bañera. Por otro lado decir que h(0) no tiene porqué ser igual a
cero, puede ser igual a un valor positivo.

1.2.3. Modelo discreto: probabilidad condicional de fallo y de fallo


acumulada

En muchas ocasiones, así cuando los tiempos de vida están agrupados, cuando se refiere
a algún número de ciclos o simplemente cuando las observaciones son discretas (en el
estudio y seguimiento de muchas enfermedades las observaciones son periódicas), hay
que considerar la variable discreta tiempo de vida.
Sea T una variable aleatoria discreta que toma valores en un conjunto numerable
{ti}i∈N. La función masa de probabilidad viene dada por la probabilidad de que el
tiempo de vida es igual a tj

p j = P[T = t j ] ; j ∈ N .
La probabilidad de que el tiempo de vida sea superior a un tiempo igual a t es
dado por

S(t) = P[T > t] = ∑p


j:t j > t
j .

Esta función puede ser expresada considerando la función de Heaviside como

S(t) = ∑ p ⋅ H(t
j:t j > t
j j − t) ,
Siendo H(x) = 1 si x > 0 y cero en otro caso.
En el caso discreto la función de supervivencia es decreciente y continua a la
derecha con S(0)=1 y S(∞) =0.
Análogamente al caso continuo, es deseable estudiar el comportamiento del fallo
de la variable. En el caso discreto este riesgo de fallo es una probabilidad. La
probabilidad condicional de fallo es la probabilidad de que el tiempo de vida sea igual a
tj dado que el individuo sobrevive al comienzo de dicho tiempo. Esta probabilidad es

h j = h(t j ) = P[T = t j | T > t j−1 ] .

A partir de la definición de probabilidad condicionada se tiene que

pj
h j = P[T = t j | T > t j−1 ] = ; j = 1, 2,... .
S(t j−1 )

Al igual que ocurre en el caso continuo, la probabilidad condicional de fallo


determina la distribución de la variable tiempo de vida T. Veamos la relación entre las
distintas funciones. Es inmediato ver que

p j = S(t j−1 ) − S(t j ) ; j = 1, 2,3... ,

lo que implica que

pj S(t j−1 ) − S(t j ) S(t j )


hj = = = 1− ; j = 1, 2,...
S(t j−1 ) S(t j−1 ) S(t j−1 )

La función de supervivencia se puede expresar por lo tanto como

S(t) = P[T > t] = ∏ (1 − h j ) .


t:t j < t

Definimos en el caso discreto la función

H(t) = − log S(t) ,

teniendo que

H(t) = − log S(t) = − log ∏ (1 − h j ) = − ∑ log (1 − h j ) .


t:t j < t t:t j < t

Esta función así definida no es igual a la probabilidad condicional de fallo


acumulada que es dada por

∑h
j:t j < t
j ,
por lo que no debe llamarse así. Dicha función H(t) es una aproximación de la
probabilidad condicional de fallo acumulada, pues –log(1−ω)∼ω. Dado que esta
aproximación es mejor cuanto menor sea ω entonces H(t) es una mejor aproximación de
la probabilidad condicional de fallo acumulada cuanto menor sea hj.