Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto 613 PDF
Proyecto 613 PDF
PARA LA DISTRIBUCIÓN
WEIBULL: APLICACIÓN EN
FIABILIDAD INDUSTRIAL
Julio de 2011
Estela Sánchez Rodrı́guez y Juan Carlos Pardo Fernández, profesores del
Departamento de Estadı́stica e Investigación Operativa de la Universidade
de Vigo,
HACEN CONSTAR
Gracias a todos.
Índice general
Introducción 1
1. Conceptos básicos 5
1.1. Definiciones Preliminares . . . . . . . . . . . . . . . . . . . . . 5
1.2. Modelos de distribución importantes . . . . . . . . . . . . . . 8
1.2.1. La distribución Exponencial . . . . . . . . . . . . . . . 8
1.2.2. La distribución Weibull . . . . . . . . . . . . . . . . . . 10
1.2.3. La distribución Gumbel . . . . . . . . . . . . . . . . . 12
1.2.4. La distribución Normal . . . . . . . . . . . . . . . . . . 14
1.2.5. La distribución Log-Normal . . . . . . . . . . . . . . . 16
1.3. Muestra aleatoria simple y verosimilitud . . . . . . . . . . . . 18
2. Tipos de censura 21
2.1. Tipos de censura . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1. Censura tipo I . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.2. Censura tipo II . . . . . . . . . . . . . . . . . . . . . . 23
2.1.3. Censura Aleatoria Independiente . . . . . . . . . . . . 23
vii
viii Laura Martı́nez Fernández
4. Software R 41
4.1. Paquete Renext . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2. Paquete STAR . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3. Paquete Sim.DiffProc . . . . . . . . . . . . . . . . . . . . . . . 47
Bibliografı́a 59
Introducción
1
2 Laura Martı́nez Fernández
Conceptos básicos
F (t) = P (T ≤ t).
lı́m F (t) = 0
t→−∞
y
lı́m F (t) = 1 .
t→∞
5
6 Laura Martı́nez Fernández
R(0) = 1
y
R(∞) = lı́m (1 − F (t)) = 0 .
t→∞
F (tp ) = P (T ≤ tp ) = p,
tp = F −1 (p).
0.6
Infantil Vida útil Desgaste
0.5
0.4
h(t)
0.3
0.2
0.1
0.0
0 20 40 60 80
y su función de fiabilidad es
R(t) = e−λt .
Métodos de inferencia para la distribución Weibull 9
1.0
0.8
0.8
0.6
0.6
F(t)
f(t)
0.4
0.4
0.2
0.2
lambda=0.5
lambda=1
0.0
0.0 lambda=2
0 1 2 3 4 5 0 1 2 3 4 5 6
t t
es decir
h(t) = λ.
4
lambda=0.5
lambda=1
lambda=2
3
h(t)
2
1
0
0 1 2 3 4 5
con t ≥ 0, siendo λ > 0 y β > 0 los parámetros del modelo, que se denominan
de escala y forma, respectivamente. Su función de distribución, que es
1.0
4
0.8
3
0.6
F(t)
f(t)
0.4
1
beta=0.5
0.2
beta=1
beta=1.5
beta=2
0.0
beta=3.44
0
0 1 2 3 4 5 0 1 2 3 4 5
t t
3.0
beta=0.5
beta=1
beta=1.5
2.5
beta=2
beta=3.44
2.0
h(t)
1.5
1.0
0.5
0.0
0 1 2 3 4 5
−1 t−τ t−τ
f (t) = ω exp − − exp − ,
ω ω
Métodos de inferencia para la distribución Weibull 13
0.4
1.0
0.8
0.3
0.6
F(t)
0.2
f(t)
0.4
0.1
0.2
0.0
0.0
−2 −1 0 1 2 3 4 −2 −1 0 1 2 3 4
t t
y su función de fiabilidad es
t−τ
R(t) = 1 − exp − exp − .
ω
25
20
15
h(t)
10
5
0
−2 −1 0 1 2 3
y "
∞ 2 #
−1 x − µ
Z
1
R(t) = √ exp dx,
t σ 2π 2 σ
Métodos de inferencia para la distribución Weibull 15
0.8
0.6
F(t)
f(t)
0.4
sigma=0.3
0.2
sigma=0.5
sigma=0.8
sigma=1
0.0
3 4 5 6 7 3 4 5 6 7 8
t t
sigma=0.3
25
sigma=0.5
sigma=0.8
sigma=1
20
15
h(t)
10
5
0
3 4 5 6 7
1.0
0.8
1.5
0.6
F(t)
1.0
f(t)
0.4
0.5
0.2
sigma=0.25
sigma=0.5
sigma=1
0.0
0.0
sigma=1.5
0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0
t t
log t − µ
R(t) = 1 − Φ .
σ
sigma=0.25
sigma=0.5
6
sigma=1
sigma=1.5
5
4
h(t)
3
2
1
0
∂l(θ)
= 0, i = 1, . . . , k,
∂θi
que es una matriz cuadrada con dimensiones k×k. Cada elemento de la matriz
es el opuesto de la segunda derivada parcial de la función de log-verosimilitud
evaluada posteriormente en los estimadores de máxima verosimilitud del mo-
delo de distribución correspondiente. La matriz de varianzas-covarianzas del
vector aleatorio θ̂ es −1
∂ 2 l(θ)
V ar(θ̂) = − , (1.9)
∂θ∂θ0 θ=θ̂
20 Laura Martı́nez Fernández
Tipos de censura
21
22 Laura Martı́nez Fernández
Zi = mı́n(Ti , C),
y
1 si Ti ≤ C
∆i =
0 si Ti > C
n!
f (T(1) ) . . . f (T(r) )[R(T(r) )]n−r . (2.1)
(n − r)!
Zi = mı́n(Ti , Ci )
y
1 si Ti ≤ Ci
∆i =
0 si Ti > Ci .
Los datos de las observaciones sobre n individuos vendrán dados por los pares
(Zi , ∆i ), i = 1, . . . , n. Entonces, la contribución del par (Zi , ∆i ) a la función
de verosimilitud es
25
26 Laura Martı́nez Fernández
7. Una vez que sabemos que nuestros datos proceden de una distribución
Weibull, podremos estimar λ y β, parámetros de escala y forma, res-
pectivamente. Para ello consideremos que la recta ajustada en el gráfico
Métodos de inferencia para la distribución Weibull 29
es
y = ât + b̂,
β̂ = â,
por lo que las estimaciones de los parámetros en este caso serán β̂ = 0.95 y
λ̂ = e−0.081/0.95 = 0.92. Además, el coeficiente de determinación es R2 = 0.95,
lo que indica un buen ajuste, ya que es un valor próximo a uno.
Métodos de inferencia para la distribución Weibull 31
0.90
●
0.75
●
●
0.50
●
0.40
prob
●
0.30
●
0.20
●
0.10
T_(i)
y la función de log-verosimilitud es
n
X n
X
l(λ, β) = n log(β) + βn log λ + (β − 1) log Ti − (λTi ) .
i=1 i=1
y q
β̂ ∼aprox N β, V ar(β̂) ,
q q
donde V ar(λ̂) y V ar(β̂) son los elementos diagonales de la matriz inversa
de la matriz de información de Fisher evaluada en λ̂ y β̂. Por tanto, las
cantidades anteriores estandarizadas son
λ̂ − λ
q ∼aprox N (0, 1) (3.7)
V ar(λ̂)
y
β̂ − β
q ∼aprox N (0, 1). (3.8)
V ar(β̂)
Los intervalos de confianza (1 − α) % bilaterales basados en los pivotes (3.7)
y (3.8) son de la forma
q q
\ \
λ̂ − z α2 V ar(λ̂), λ̂ + z α2 V ar(λ̂)
y q q
\ \
β̂ − z α2 V ar(β̂), β̂ + z α2 V ar(β̂) ,
que hay una gran diferencia entre la muestra y esta misma bajo H0 es que
rechazaremos H0 . Con esto se sigue que hay dos tipos de errores, rechazar
H0 cuando es cierta, al que llamarı́amos error tipo I, y aceptar H0 cuando
es falsa, al que llamarı́amos error tipo II. El nivel de significación, denotado
por α (suele utilizarse α = 0.05 ó α = 0.01), es la máxima probabilidad de
cometer error de tipo I y la potencia del test es la probabilidad de no cometer
error de tipo II. Estos contrastes están basados en determinados estadı́sticos,
que resumen las caracterı́sticas del conjunto de datos a estudio. Los contrastes
comparan estos estadı́sticos con los valores de los estadı́sticos tabulados, que
dependen del nivel de significación y si los estadı́sticos calculados superan a
los tabulados rechazaremos H0 . Por último, definiremos el p-valor, que es la
probabilidad calculada al asumir que la hipótesis nula H0 es cierta, de que el
estadı́stico de contraste tome valores tan o más extremos que los calculados
con la muestra sin restricciones. Si esta probabilidad es menor que nuestro
nivel de significación, rechazaremos H0 .
Λ = −2l(θ)
e + 2l(θ̂),
donde l(θ)
e es la función de log-verosimilitud del modelo reducido y l(θ̂) es la
función de log-verosimilitud para el modelo sin restricciones. Ahora veremos
cómo se comporta el test de razón de verosimilitudes con los parámetros de
la distribución Weibull tanto para muestras completas como para muestras
ordenadas.
Métodos de inferencia para la distribución Weibull 37
H0 : β = β0 ,
H1 : β 6= β0 ,
H1 : β < β0 ó H1 = β > β0
donde λ̂ y β̂ son los estimadores de máxima verosimilitud del modelo sin res-
tricciones y que corresponden a las expresiones (3.5) y (3.4) respectivamente.
Las zonas de rechazo dependen de la hipótesis alternativa considerada. Por
ejemplo, en el caso del contraste unilateral derecho, rechazaremos H0 pa-
ra valores grandes de Λ, teniendo en cuenta que Λ tiene una distribución
38 Laura Martı́nez Fernández
aproximada χ21 bajo H0 . Para muestras con censura tipo II, tenemos que
! β1
0
r
λ
e= Pr ,
i=1 Tiβ0 + (n − r)T(r)
β0
H0 : λ = λ0 ,
H1 : λ 6= λ0 ,
H1 : λ < λ0 ó H1 = λ > λ0
Esta ecuación puede resolverse utilizando métodos iterativos que nos propor-
cionarán el estimador de máxima verosimilitud de β bajo H0 . El estadı́stico
del test de razón de verosimilitudes para contrastar H0 frente a H1 es entonces
Λ = −2l(λ0 , β)
e + 2l(λ̂, β̂),
Métodos de inferencia para la distribución Weibull 39
Software R
library(FAmle)
data(yarns)
datos=yarns$x
41
42 Laura Martı́nez Fernández
x vector de datos
info.observed matriz de información observada
check.logik si es TRUE, la log-verosimilitud es
recalculada utilizando
dweibull con log=TRUE.
El resultado es una lista.
library(Renext)
fweibull(datos)
$estimate
shape scale
1.604368 247.915708
$sd
shape scale
0.125092 16.270475
$loglik
[1] -625.199
$cov
[,1] [,2]
[1,] 0.01564802 0.6371975
[2,] 0.63719754 264.7283432
x vector de datos
plot.pos posición respecto a la que se van a
representar los puntos.
Si es ’exp’ entonces F(x) en el punto
i se toma como i/n+1 y si es ’med’ se
toma como (i-0.3)/(n+0.4).
shape parámetro forma para una o más lı́neas
que queramos representar (puede ser un
vector o un número).
44 Laura Martı́nez Fernández
library(Renext)
weibplot(datos,shape=1.6,scale=247.9)
Y de este gráfico podemos deducir que los datos siguen una distribución
Weibull y que por tanto la estimación del parámetro de escala es λ̂ = 0.004
y la del parámetro de forma es β̂ = 1.6.
●
●
●
0.95
●
● ● ●
●
●
●
●
●
●●
●●
●
●●●
0.75
●
●●●
●●
●
●●
●
●
●●
●
●
●
●
●
●
●●
●●
●●●
●●
●
●
●
●
●●
●
0.40
●
●
●
●
●●
●
●
●●●
●●●
●
●●
●
●
●●
●●
0.20
prob
●●
●●●
●●
●
●
●
●
0.10
●
●
●
●
●
●
●
●
T_(i)
weibullMLE(yi,ni=numeric(length(yi))+1, si=numeric(length(yi))+1,
shape.min= 0.05, shape.max= 5)
yi vector de observaciones
ni vector que cuenta cada valor
de yi. Por defecto es
numeric(length(yi))+1.
si vector de datos no censurados.
Mirar comentarios.
shape.min el menor valor posible para el
parámetro forma.
shape.max el mayor valor posible para el
parámetro forma.
Comentarios:
En el caso de muestras completas se definirá si como numeric(length(yi))+1,
46 Laura Martı́nez Fernández
que es el valor por defecto, pero en el caso de muestras censuradas (en nues-
tro caso censura tipo II), reordenaremos la muestra con el comando sort
y definiremos si como c(rep(1,r),rep(0,n-r)), por lo que tendremos una
muestras ordenada con r datos no censurados y n − r datos censurados. Los
valores que devuelve esta función son
library(STAR)
Métodos de inferencia para la distribución Weibull 47
weibullMLE(datos,shape.min=1,shape.max=5)
$estimate
shape scale
1.604369 247.915477
$se
shape scale
0.1218647 16.2860248
$logLik
[1] -625.199
library(Sim.DiffProc)
Ajdweibull(datos$yarns,starts=list(shape=1,scale=1),leve=0.95)
Coefficients:
Estimate Std. Error
shape 5.809887 0.31892806
scale 5.420565 0.06978147
-2 log L: 556.7529
$coef
shape scale
5.809887 5.420565
$AIC
[1] 560.7529
$vcov
shape scale
shape 0.101715109 0.007086121
Métodos de inferencia para la distribución Weibull 49
x vector de datos
shape parámetro de forma.
Por defecto es 1.
scale parámetro de escala.
Por defecto es 1.
library(Sim.DiffProc)
test_ks_dweibull(datos,1.6,247.9)
One-sample Kolmogorov-Smirnov test
data: X
D = 0.0761, p-value = 0.6092.
Donde el p-valor es 0.5813, valor que supera el nivel de significación, 0.05. Por
tanto, podremos afirmar que nuestro conjunto de datos sigue una distribución
W eibull(1.6, 0.004).
Capı́tulo 5
Simulaciones y aplicación a
datos reales
51
52 Laura Martı́nez Fernández
y q q
\ \
β̂ − z α2 V ar(β̂), β̂ + z α2 V ar(β̂) ,
q q
donde V ar(λ̂) y V\
\ ar(β̂) son las estimaciones de las raı́ces cuadradas de
los elementos diagonales de la inversa de la matriz de información de Fisher,
que viene dada por
2 l(λ,β) 2
−∂ ∂λ2
− ∂ ∂λ∂β
l(λ,β)
I=
,
∂ 2 l(λ,β) ∂ 2 l(λ,β)
− ∂β∂λ
− ∂β 2 |(λ,β)=(λ̂,β̂)
donde las respectivas derivadas parciales para muestras con censura tipo II
son (para muestras completas cambiamos r por n)
" r
!#
∂ 2 l(λ, β) β X β β
− = 2 r + λβ (β − 1) T(i) + (n − r)T(r) .
∂λ2 λ i=1
Por último
r
∂ 2 l(λ, β) r X
− = + log2 (λT(i) )(λT(i) )β + (n − r) log2 (λT(r) )(λT(r) )β .
∂β 2 β 2 i=1
Métodos de inferencia para la distribución Weibull 53
Pieza 1
●
0.90
●
●
●
●
0.75
●
●
●
●
●
●
●
0.50
●
●
●
●
●
●
●
0.20 0.30
prob
●
●
●
●
●
0.10
T_(i)
recta, por lo que podemos afirmar que nuestro conjunto sigue una distribución
Weibull. Los parámetros estimados por el método de máxima verosimilitud
de λ y β son 3.58 .10−8 y 0.82, respectivamente. Ahora, nos queda calcular
Métodos de inferencia para la distribución Weibull 57
1 − α = 0.95 1 − α = 0.90
β (0.52, 1.12) (0.57, 1.07)
λ (0, 1.78 .10−7 ) (0, 1.55 .10−7 )
Pieza 2
Como en el apartado anterior, disponemos de un vector de datos donde
el porcentaje de censura es enorme comparado con el de la no censura. Como
estamos trabajando con tiempos de vida, solo consideraremos aquellos datos
que sean estrictamente mayores que cero. En primer lugar, construiremos el
gráfico Weibull correspondiente para ver si nuestro conjunto de datos sigue
o no una distribución Weibull. El gráfico es el qu aparece en la figura (5.2).
Parece que los datos se pueden ajustar mediante una recta, por lo que
podemos afirmar que nuestro conjunto sigue una distribución Weibull. Ahora
nos falta estimar los parámetros de la distribución. Los parámetros estimados
por el método de máxima verosimilitud de λ y β son 2.90 .10−8 y 0.78,
respectivamente. Ahora, nos queda calcular los intervalos de confianza, que
en este caso son los correspondientes a la tabla (5.4).
58 Laura Martı́nez Fernández
●
●
●●
●
0.95
●●
●
●
●●●●
●
●
●●●
●
●●
●●●
●
●
●
0.75
● ●
●
●●
●●
●●
●
●
●●
●
●
●
●●
●
●●
●
●
●
●●
●
●
●●
●
●●
●
●
●
●
●
●●
0.40
●
●
●●
●
●
●
●
●
●
●●●●
●
●
●●●
●●●●
●●
●
● ●●
●●
0.20
●●
●
●
●
●
●
●●
prob ●
●
●
●
●
●●
●●
● ●●
0.10 ●●
●●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
T_(i)
1 − α = 0.95 1 − α = 0.90
β (0.67, 0.88) (0.69, 0.87)
λ (0, 7.28 .10−8 ) (0, 6.57 .10−8 )
[5] Jiang, R. , Zuo, M.J. y Li, H.-X. Weibull and Inverse Weibull Models
allowing negative weights. Reliability Engineering and System Safety,
No. 66, 1999, pp. 227-234.
[8] Lawless, J. F. Statistical Models and Methods for Lifetime Data. John
Wiley & Sons, Inc., 2003.
59
60 Laura Martı́nez Fernández
[11] Nelson, W. Applied Lifedata Analysis. John Wiley & Sons, Inc., 1982.