Está en la página 1de 11

Distribucin de Weibull, Distribucin de Erlang

y Mtodo de Mnimos Cuadrados


Carlos Mauricio Ramos Cardona
Universidad Autonma de Colombia
November 24, 2010
1 Distribucin de Weibull
La variable aleatoria continua con distribucin de Weibull que denimos a con-
tinuacin es de gran utilidad en estadstica para el estudio de la conabilidad,
la durabilidad, la fatiga y la rapidez de falla de muchos artefactos electrnicos y
mecnicos, incluso de seres vivos. Esta distribucin es propiamente una familia
de dsitribuciones de las cuales la exponencial es slo un caso particular. Esto
signica que la distribucin exponencial es, por un lado, un caso especial de
la distribucin gama cuando el parmetro de forma r igual a 1. Ahora vere-
mos que la exponencial tambin resulta ser un caso especial de la distribucin
de Weibull que examinaremos en esta seccin, justo en el momento en que el
parmetro de forma r es igual a 1.
La distribucin de Weibull tiene muchas aplicaciones tiles en control de
calidad y en ingenieria industrial y aeronutica. Los diseadores de turbinas
de aviones han hallado de fgran utilidad dicha distribucin en el estudio de las
variaciones de la velocidad del viento en un sitio determinado. Por otra parte,
existe la informacin de que en aos recientes ( 1979 ), G. L. Somers y R. G.
Oderwald usaron la referida distribucin para predecir la mortalidad de seres
vivos.
1.1 Denicin
La variable aleatoria continua que tiene distribucin de Weibull con parmetros
de forma r 0 y parmetro de escala 0 se dene como
\(t; r, `) = c
u
n; donde n = n(t) = (`t)
:
0 6 t < 1
1.1.1 Observacin 1
Esta manera de denir la distribucin de Weibull usando una funcin inter-
medaria n y tiene la ventaja de que queda expresada en forma sencilla y fcil
1
de memorizar. De manera equivalente se puede escribir
\(t; r, `) = r`
:
t
:1
c
(X|)
r
1.1.2 Observacin 2
Al igual que con la distribucin gama, la nomenclatura usada para los parmet-
ros diere en distintas fuentes. As, algunos autores preeren escribir c en
lugar de r para denotar el parmetro de forma y al parmetro ` lo representa
como 1,,.Usando esta nomenclatura alternativa, la funcin de densidad de la
distribucin de Weibull queda expresada
\(t; c, ,) = c,
o
t
o1
c
(
t

Utilizaremos una sustitucin para demostrar que la funcin de densidad de


probabilidad es igual a 1 n =
1
o

t
o
dn =
o
o

t
o1
dt
1
_
0
c,
o
t
o1
c
(
t

dt
=
1
_
0
c
u
dn
= c
u
_
1
0
= (c
1
c
o
)
= (0 1)
= 1
2 Valor esperado
La media o valor esperado est dada por:
j =
1
_
0
t c
X
r
|
r
`
:
rt
:1
dt
= r`
:
1
_
0
t
:
c
X
r
|
r
dt
Hacemos ahora el cambio de variable n = n(t) = (`t)
:
= `
:
t
:
con objeto de
expresar la integral de arriba en trminos de la variable n. Ntese que cuando la
variable t corre desde 0 hasta 1, la variable n tambin ir correspondientemente
desde 0 hasta 1. Entonces los lmites de integracin serm los mismos. Al
expresar t y dt en trminos de n se obtiene lo siguiente:
2
t =
_
n
`
:
_1
r
=
1
`
n
1
r
=) dt =
1
`

1
r
n
1
r
1
dn =
1
`r
n
1
r
1
Al sustituir todo esto en la integral anterior y al considerar que los lmites
de integracin son otra vez desde 0 hasta 1, se obtiene lo siguiente:
j = r`
:
1
_
0
n
`
:
c
X
r u

1
`r
n
1
r
1
dn
=
1
`
1
_
0
n
1
r
c
u
dn
=
1
`

_
1 +
1
r
_
3 Varianza
Para calcular la varianza, conviene empezar por obtener la integral
1
_
0
t
2
)(t)dt.Se
tendr:
o
2
=
1
_
0
t
2
c
X
r
|
r
`
:
rt
:1
dt
= r`
:
1
_
0
t
:+1
c
X
r
|
r
dt
= r`
:
1
_
0
_
n
1
r
`
_
:+1
c

u
1
r

dt
= r`
:
1
_
0
n
1+
1
r
`
:+1
c
u

1
`r
n
1
r
1
dn
=
r`
:
`r `
:+1
1
_
0
n
2
r
c
u
dn
=
1
`
2

_
1 +
2
r
_
Entonces, la varianza queda nalmente como sigue:
3
o
2
=
1
_
0
t
2
)(t)dt j
2
=
1
`
2

_
1 +
2
r
_

_
1
`

_
1 +
1
r
__
2
=
1
`
2
_

_
1 +
2
r
_

2
_
1 +
1
r
__
Con lo cual el teorema queda demostrado.
4 Contexto Histrico
Reza el dicho que todo por servir se acaba, lo cual es una forma coloquial de
describir el desgaste natural por fatiga y uso de un artefacto o incluso de un ser
humano. A decir verdad, con algunas ligeras modicaciones, la distribucin de
Weibull puede aplicarse tambin para describir la vida, el desgaste y nalmente
la muerte de seres humanos en condiciones normales (es decir, sin guerras ni
epidemias o catstrofes). Ya en 1662, el ingls John Graunt, considerado el padre
de la estadstica, observ que de un total de 100 individuos nacidos exactamante
el mismo da, 36 de ellos murieron antes de cumplir los 6 aos de edad (en la
poca de Graunt la mortandad infantil era muy superior a la que existe ahora);
durante la siguiente dcada despus de eso perecieron otros 15; y una dcada
despus otros 9, quedando slo 16 supervivientes despus de esos 36 aos. En la
siguiente dcadacontinu Graunt murieron otros 6; en la siguiente otros 4 y
en la subsecuente otros 3. As que despus de 66 aos slo quedaron 3 individuos
vivos. En la dcada posterior murieron 2 de ellos (entre los 67 y los 76 aos de
edad) y en la siguiente dcada muri el nico individuo restante (a una edad
que oscilaba entre los 77 y los 86 aos de edad). Naturalmente, esas cifras
que proporcion John Graunt en su histrico libro, y basadas en observaciones
reales, ya no son vlidas con los avances de la medicina moderna y la disminucin
en las tareas de mortandad infantil. Pero eso no signica que la distribucin
de probabilidad que rige la vida de los humanos (distribucin de Weibull con
unas ligeras modicaciones, algo que Graunt por supuesto desconoca) no sea
ya aplicable. S lo es, pero los valores de los parmetros han cambiado.
5 Distribucin de Erlang
Una variable aleatoria exponencial describe la longitud hasta que se obtiene el
primer conteo en un proceso de Poisson. Una generalizacin exponencial es la
longitud hasta que ocurran r conteos en un proceso de Poisson. La variable
aleatoria que es igual a la longitud del intervalo hasta que ocurran r conteos en
un proceso de Poisson es una variable aleatoria de Erlang.
4
5.1 EJEMPLO
Las fallas de las unidades de procedimiento central (CPU) de los sistemas de
computadoras grandes se modelan con frecuencia como un proceso de Poisson.
Por lo general, las fallas no son causadas por el desgaste de componentes, sino
por fallas de carcter ms aleatorio en el gran nmero de circuitos semicon-
ductores de las unidades. Suponga que las unidades que faltan se reparan de
inmediato y que el nmero promedio de fallas por hora es 0.0001. Sea que X
denote el tiempo hasta que ocurren cuatro fallas en un sistema. Determine la
probabilidad de que X exceda 40 000 horas.
Sea la variable aleatoria N que denote el nmero de fallas en 40 000 horas
de operacin. El tiempo hasta que ocurren cuatro fallas excede 40 000 horas si
y slo si el nmero de fallas en 40 000 horas es tres o menos. Por lo tanto,
1(A 40000) = 1( 3)
El supuesto de que las fallas siguen un proceso de Poisson implica que N
tiene una distribucin de Poisson con
1() = 40000(0.0001)
= 4 fallas por 40 000 horas
Por lo tanto,
1(A 40000) = 1( 3) =
3

|=0
c
4
4
|
/!
= 0.433
La funcin de distribucin acumulada de una variable aleatoria de Erlang X
puede obtenerse calculando 1(A r) = 11(Ar) y la probabilidad 1(Ar)
puede determinarse como en el ejemplo anterior. Entonces, la funcin de densi-
dad de probabilidad de X puede obtenerse derivando la funcin de distribucin
acumulada y realizando una gran cantiadad de simplicaciones algebraicas.
5.2 Denicin
La variable aleatoria X que es igual a la longitud del intervalo hasta que ocurren
r fallas en un proceso de poisson con media `0 tiene una distribucin de Erlang
con parmetros ` y r. La funcin de densidad de probabilidad de X es
)(r) =
`
:
r
:1
c
Xr
(r 1)!
, jara r0 j r = 1, 2, ...
5
1
_
0
`c
Xr
(`r)
:1
(r 1)!
=
`
:
(r 1)!
1
_
0
c
Xr
r
:1
dr
n = r
:1
dn = c
Xr
(r 1)!
t
x
X
r1
=
1
_
0
(r 1)!.
c
Xr
`
:1
dr
=
(r 1)!
`
:1
.
c
Xr
`
_
1
0
= 0 (1)
= 1
Una variable aleatoria de Erlang puede considerarse como el anlogo con-
tinuo de uan variable aleatoria binomial negativa. Una variable aleatoria bino-
mial negativa puede expresarse como la suma de r variables aleatorias exponen-
ciales.
Si X es una variable aleatoria de Erlang con parmetros ` y r. entonces el
valor esperado y al varianza de X son
6 Valor esperado
j = 1(A) =
r
`
7 Varianza
o
2
= \ ar(A) =
r
`
2
La distribucin de Erlang es un acaso especial de la distribucin gamma. Si
el parametro r de uan variable de Erlang no es un entero, pero r0, entonces
la variable aleatoria tiene una distribucin gamma. Sin embargo, en la funcin
de densidad de Erlang, el parmetro r aparece como r factorial.
6
8 Contexto Histrico
Erlang naci en Lonborg, en Dinamarca. Era hijo de un maestro de escuela y era
descendiente del matemtico Thomas Fincke por el lado de su madre. Erlang
aprob con distincin el examen de ingreso para la Universidad de Copenhague
en 1896. Obtuvo una beca para la universidad y se gradu en matemticas en
1901. Durante los siguientes aos sera profesor, pero mantuvo su inters en las
matemticas y recibi un premio por un artculo que remiti a la Universidad
de Copenhague. Fue miembro de la asociacin danesa de matemticas, por
medio de la cual conoci a Johan Jensen, el ingeniero jefe de la Copenhagen
Telephone Company (CTC), la cual era una subsidiaria de International Bell
Telephone Company. Erlang trabaj por casi 20 aos para CTC, desde 1908
hasta su muerte en Copenhague en 1928.
8.1 Contribuciones
Mientras trabaj para la CTC, a Erlang se le present el problema clsico de
la determinacin de cuntos circuitos eran necesarios para proveer un servicio
telefnico aceptable.
Erlang puso manos a la obra investigando directamente el problema. El
realiz medidas en terreno y era un experto en la historia y el clculo de las tablas
numricas de algunas funciones matemticas, particularmente logartmicas.
Erlang desarroll su teora del trco telefnico a travs de varios aos.
Entre sus publicaciones ms importantes sobre la materia, se encuentran:
- En 1909 - "La teora de las probabilidades y las conversaciones telefnicas"
- la cual demostr que la Distribucin de Poisson se aplica para trco telefnico
aleatorio.
- En 1917 - "Solucin de algunos problemas en la teora de probabilidades de
importancia en centrales telefnicas automticas", el cual contiene su frmula
clsica para el clculo de prdidas y tiempos de espera.
- Un compendio de sus trabajos fue publicado posteriormente por la Copen-
haguen Telephone Company en 1.948
El inters por su trabajo continu despus de su muerte y hacia 1944 el
"Erlang" era usado en los pases escandinavos para denotar la unidad de trco
telefnico. Esta unidad de medida fue reconocida internacionalmente al nal de
la segunda guerra mundial.
9 Regresin Lineal Simple
En el caso de la regresin lineal simple se considera un solo regresor (variable
de regresin) o predictor r, y una variable dependiente o variable de respuesta
1.Suponga que la verdadera relacin entre 1 y r es una recta y que la obser-
vacin 1 en cada nivel r es una variable aleatoria. El valor esperado de 1 para
7
cada valor de r es
1( 1 j r) = ,
0
+,
1
r
donde la ordenada al origen ,
0
y la pendiente ,
1
son coecientes de regre-
sin desconocidos. Se supone que cada observacin, 1 ,puede describirse con el
modelo
1 = ,
0
+,
1
r +- (1)
donde - es un error aleatorio con media cero y varianza o
2
. Se supone
asimismo que los errores aleatorios correspondientes a diferentes observaciones
son variables aleatorias no correlacionadas.
Suponga que se tiene : pares de observaciones (r
1
, j
1
), (r
2,
j
2
), ..., (r
n
, j
n
).En
la gura 1-1 se representa una grca de dispersin tpica de los datos obser-
vados y un candidato para la regresin estimada. Las estimaciones de ,
0
y
,
1
debern dar como resultado una recta que sea (en algn sentido) el "mejor
ajuste" para los datos. El cientco alemn Karl Gauss (1777-1855) propuso
estimar los parmetros ,
0
y ,
1
de la ecuacin (1) a n de minimizar la suma
de los cuadrados de las desviaciones verticales de la gura 1-1.
A este criterio para estimar los coecientes de regresin se le llama el mtodo
de mnimos cuadrados. Usando la ecuacin (1), las : observaciones de la
muestra pueden expresarse como
j
I
= ,
0
+,
1
r
I
+-
I
, i = 1, 2, ..., : (2)
Figura 1-1 Desviaciones de los datos del modelo de regresin estimado.
y la suma de los cuadrados de las desviaciones de las observaciones de la
verdadera recta de regresin es
1 =
n

I=1
-
2
I
=
n

I=1
(j
I
,
0
+,
1
r
I
)
2
(3)
Los estimadores de mnimos cuadrados de ,
0
y ,
1
, por ejemplo
^
,
0
y
^
,
1
,deben
satisfacer
01
0,
0

^
o
0
,
^
o
1
= 2
n

I=1
(j
I

^
,
0
+
^
,
1
r
I
) = 0
01
0,
1

^
o
0
,
^
o
1
= 2
n

I=1
(j
I

^
,
0
+
^
,
1
r
I
)r
I
= 0 (4)
Al simplicar estas dos ecuacionesse obtiene
:
^
,
0
+
^
,
1
n

I=1
r
I
=
n

I=1
(j
I
)
8
^
,
0
n

I=1
r
I
+
^
,
1
n

I=1
r
2
I
=
n

I=1
j
I
r
I
(5)
A las ecuaciones (5) se les llama las ecuaciones normales de mnimos
cuadrados. Al resolver las ecuaciones normales se obtiene los estimadores de
mnimos cuadrados
^
,
0
y
^
,
1
.
9.1 Denicin
Las estimaciones de mnimos cuadrados de la ordenada al origen y la
pendiente del modelo de regresin lineal simple son
^
,
0
= j
^
,
1
r (6)
^
,
1
=
n

I=1
j
I
r
I

_
n

I=1
j
I
__
n

I=1
r
I
_
:
n

I=1
r
2
I

_
n

I=1
r
I
_
2
:
(7)
donde j =
_
1
n
_
n

I=1
j
I
y r =
_
1
n
_
n

I=1
r
I
Por lo tanto, la recta de regresin ajustada o estimada es
^ j
I
=
^
,
0
+
^
,
1
r (8)
Obsrvese que cada par de observaciones satisface la relacin
j
I
=
^
,
0
+
^
,
1
r
I
+c
I
, i = 1, 2, ..., :
donde a c
I
= j
I
^ j
I
se llama el residual. El residual
describe el error del ajuste del modelo en la observacin i, j
I
.
En lo que a la notacin se reere, en ocaciones es conveniente asignar sm-
bolos especiales al numerador y al denominador de la ecuacin (7). Dados los
datos (r
1
, j
1
) , (r
2
, j
2
) , ..., (r
n
, j
n
) ,sean
o
rr
=
n

I=1
(r
I
r)
2
(9)
=
n

I=1
r
2
I

_
n

I=1
r
I
_
2
:
9
o
r
=
n

I=1
j
I
(r
I
r)
2
(10)
=
n

I=1
r
I
j
I

_
n

I=1
r
I
__
n

I=1
j
I
_
:
9.1.1 Ejemplo
Se ajustara un modelo de regresin lineal simple a los datos de la pureza del
oxgeno de la siguiente tabla. Pueden calcularse las siguientes cantidades:
Nmero de observacin Nivel de hidrocarburos r (%) Pureza j (%)
1 0.99 90.91
2 1.02 89.05
3 1.15 91.43
4 1.29 93.74
5 1.46 96.73
6 1.36 94.45
7 0.87 87.59
8 1.23 91.77
9 1.55 99.42
10 1.40 93.65
11 1.19 93.54
12 1.15 92.52
13 0.98 90.56
14 1.01 89.54
15 1.11 89.85
16 1.20 90.39
17 1.26 93.25
18 1.32 93.41
19 1.43 94.98
20 0.95 87.33
Tabla 1 Niveles de oxgeno de hidrocarburos
: = 20
20

I=1
r
I
= 23.92
20

I=1
j
I
= 1843.21 r = 1.20 j = 92.16
20

I=1
j
2
I
= 170044.53
20

I=1
r
2
I
= 29.29
20

I=1
r
I
j
I
= 2214.66
10
o
rr
=
20

I=1
r
2
I

_
20

I=1
r
I
_
2
20
= 29.29
(23.92)
2
20
= 0.68
o
r
=
20

I=1
r
I
j
I

_
20

I=1
r
I
__
20

I=1
j
I
_
20
= 2214.66
(23.92) (1843.21)
20
= 10.18
Por lo tanto, las estimaciones de mnimos cuadrados de la pendiente y la
ordenada al origen son
^
,
1
=
o
r
o
rr
=
10.18
0.68
= 14.97
y
^
,
0
= j
^
,
1
r
= 92.16 (14.97) 1.20
= 74.20
El modelo de la regresin lineal simple ajustado es
^ j = 74.20 + 14.97r
11

También podría gustarte