Está en la página 1de 10

DISTRIBUCIONES ESPECIALES DE PROBABILIDAD USADAS EN

ESTADÍSTICA
La distribución log-normal
La distribución normal logarítmica es una distribución de probabilidad continua de una
variable aleatoria cuyo logaritmo está normalmente distribuida. Es decir, si X es una variable
aleatoria con distribución normal, entonces Y = e X tiene una distribución log-normal, o
recíprocamente, si Y tiene distribución log-normal, entonces X = ln (Y ) tiene distribución
normal.
Observación. A esta distribución de probabilidad también se la conoce como distribución de
Galton (en honor a Francis Galton), también se le han asociado otros nombres, tales como
McAlister, Gibrat y Cobb-Douglas
Una variable puede ser modelada como log-normal si puede ser considerada como un
producto multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es
un retorno a largo plazo de una inversión: puede considerarse como un retorno de muchos
retornos diarios.
La función de densidad de la distribución log-normal es:
( ln y −  )2
1 −
f ( y) = e 2 2
, y0
y 2

La función de distribución acumulada es:


 ln y −  
F ( y) =   
  

Donde  ( z ) es la función de distribución de la normal estándar.

Donde:  y  son la media y la desviación estándar del logaritmo de la variable.

El valor esperado y la varianza de la variable aleatoria log-normal son:

, V Y  = ( e − 1) e2  +
2
+
E Y  = e
2 2
2
Ejemplo. Se analiza la proporción de empleados que tienen un ingreso anual superior a los
$18.000 para un sector económico cuya distribución salarial medida en miles de dólares,
sigue un modelo logarítmico normal con parámetros  = 2 y  = 1.2

Si se define la variable aleatoria:


Y : Ingreso anual en miles de dólares

Esta sigue una distribución log-normal, entonces la variable:


X = ln Y sigue una distribución normal: X N ( , 2 )

De donde:
 2.89 − 2 
P (Y  18 ) = P ( e X  18 ) = P ( X  2.89 ) = 1 − P ( X  2.89 ) = 1 −    = 0.2296
 1.2 

La distribución Gamma
Este modelo es una generalización del modelo exponencial ya que, en ocasiones, se utiliza
para modelar variables que describen en el tiempo hasta que se produce  veces un
determinado suceso.
Su función de densidad es de la forma:
 1 −
x

  e  x −1 , x  0
f ( x ) =    ( )

0 , x0
Gráfico de algunas funciones de densidad con  = k = 1, 2,3,5,9;  =  = 2, 2, 2,1, 0.5

Este modelo depende de dos parámetros positivos:  y  . La función  ( x ) es la denominada


Gamma de Euler que representa la siguiente integral:

 ( x ) =  e−t t x −1dt
0

Que cumple:
 ( x + 1) = x ( x )

 ( n + 1) = n!

 ( 12 ) = 

Para la distribución de probabilidad Gamma se tiene:


1.  = E  X  = 
2.  2 = V  X  =  2
3. Para  = 1 , la distribución Gamma es una distribución exponencial de parámetro  .
Es decir, el modelo exponencial es un caso particular de la Gamma con  = 1
4. Dadas dos variables aleatorias con distribución Gamma y parámetro  común:
X G (1 ,  ) y Y G (2 ,  ) , se cumple que la suma también sigue una distribución
Gamma: X + Y G (1 + 2 ,  )
Una consecuencia inmediata de esta propiedad es que, si se tienen k variables
aleatorias con distribución Exponencial de parámetro  común e independientes, la
suma de todas ellas seguirá una distribución G ( k ,  )
5. Si X G ( ,  ) , entonces  X G ( ,  )
n
6. Si  = y  = 2 la distribución Gamma correspondiente se denomina Distribución
2
Chi_cuadrado:  2 con n grados de libertad. Esta variable aleatoria es tal que:
E  X  = n, V  X  = 2n .

La distribución chi-cuadrada se puede también definir de la siguiente manera: Sean


X 1 , X 2 ,..., X n variables aleatorias independientes e idénticamente distribuidas según
una N ( 0,1) , entonces la suma de los cuadrados de estas variables sigue una
n
distribución chi-cuadrada:  2 =  X i2
i =1

Para esta variable, la función de densidad es:


n x
1 −1 −
f ( x) = n
x2 e 2 , x  0
2  ( n2 )
2

Ejemplo. El tiempo de reparación, en horas, de una pieza es una variable aleatoria


Gamma: G ( 2, 2) . El precio de venta de la misma es de 5 dólares y el de fabricación es de
mil dólares. ¿A cuánto de debe cobrar la hora de reparación para obtener un beneficio
esperado de 3 mil dólares?
Solución.
El beneficio o ganancia está dado por:
Beneficio= precio de venta – (Costo reparación + Costo de producción)
Sea: X : Tiempo de reparación (horas) y K : Costo de una hora de raparación

Entonces:
B = 5 − ( KX + 1)

De donde:
E  B = E 5 − ( KX + 1) = 4 − K  E  X  = 4 − K  2  2 = 3

K = 14 , es decir, 250 dólares

Distribución Beta
Es una distribución que se utiliza para modelizar variables que toman valores en un
intervalo finito  A, B , se la denota de la siguiente manera:

X  ( A, B, p, q )

Su función de densidad es:

( x − A) ( B − x )
p −1 q −1

f ( x) = , A x B
 ( p, q )( B − A)
p + q −1

1
 ( p)  (q)
Donde la función Beta es:  ( p, q ) =  t p −1 (1 − t )q −1 dt =
0  ( p + q)

Para se obtiene su forma estándar, descrita como X  ( 0,1, p, q ) o X


A = 0, B = 1  ( p, q )
que sirve para modelar variables aleatorias que representan porcentajes.
En este caso, la función de densidad es:

x p −1 (1 − x )
q −1

f ( x) = , 0  x 1
 ( p, q )

p pq
Sus parámetros son:  = E  X  = ,  2 =V X  =
p+q ( p + q + 1)( p + q )
2

Ejemplo.
La proporción media de tubos defectuosos es del 20%. Dicha proporción se modeliza
como una Distribución Beta: X  ( p,8) . Calcular p

Solución.
p
Se conoce del problema que  = E  X  = 0.20 =
p +8

De donde: p=2
Distribución de Weibull
La distribución de Weibull es una distribución de probabilidad continua se utiliza en la
modelización de fallos (en sistemas) cuando la tasa de fallos es proporcional a una
potencia del tiempo.
La función de densidad es:

   x  −1 −( x  )
 , x0
f ( x,  ,  ) =     
e
0 , x0

Donde   0 es el parámetro de forma y   0 es el parámetro de escala de la distribución.

Un valor   1 indica que la tasa de fallos decrece con el tiempo

Cuando  = 1 , la tasa de fallos es constante en el tiempo

Un valor de   1 indica que la tasa de fallos crece con el tiempo

La función de distribución de probabilidad es:


( ) , x  0

F ( x,  ,  ) = 1 − e
− x

La tasa de fallos (Hazard) es:


 −1
x
h ( x,  ,  ) =  
  

 1
La media de esta distribución es: E  X  =   1 + 
  

  2  1 
La varianza es: V  X  =  2  1 +  − 2 1 +  
   
  

Observación. Si se toma  = 1 se obtiene la distribución exponencial


Ejemplo. Sea X una variable aleatoria de Weibull de parámetro   1 que representa la
duración de un componente hasta que se averíe. Para montar un circuito, buscamos
componentes que nos duren al menos 500 unidades de tiempo.
Para seleccionar esos componentes nos dan a elegir entre 2 tipos. Los de tipo 1 están sin
estrenar, mientras que los de tipo 2 no son nuevos. ¿Qué tipo de componentes es el más
adecuado para nosotros?
Solución.
Si X es una Weibull de parámetro   1 , el componente envejece.

Cada vez le resulta más difícil sobrevivir; es decir,


P ( X  t0 + t X  t0 )  P ( X  t )

Por tanto nos interesa el componente sin estrenar


Ejemplo.
El tiempo T en segundos que tarda en conectarse a un servidor un día laborable sigue
una distribución de Weibull de parámetros:  = 0.6 ,  = 1 4 , mientras que un fin de
semana es una Weibull de parámetros  = 0.24 ,  = 1

Calcular:
a) Tiempo medio que se tardará en conectarse en ambos tipos de día
b) Probabilidad de tardar más de 10 segundos en realizar la conexión, en ambos tipos de
día
c) Si se lleva ya 5 segundos esperando a que se efectúe la conexión, ¿cuál es la
probabilidad de que la conexión se demore aún 10 segundos más?
d) ¿Era de esperar el resultado que se obtiene en c)?
Solución.
Sea L = laborable, F = fin de semana

a)  L = 14.4( s),  F = 0.24( s)


b) P (TL  10) = 0.133, P (TF  10)  0
c) P (TL  15 TL  5) = 0.5845, P (TF  15 TF  5) = P (TF  10)
d) El resultado era previsible al ser  L  1

Distribución t de Student
Sean X N ( 0,1) y Y  n2 dos variables aleatorias, entonces la variable aleatoria definida
por:
X
T= sigue una distribución llamada t_Student con n grados de libertad que se denota
Y
n
con t n

La función de densidad de esta distribución es:


 n +1
  −
n +1

 2   x2  2
f ( x) = 1 +  , −  x  
n n 
n   
2

Para esta variable aleatoria se tiene:


n
E  X  = 0, V  X  = ,n2
n−2

Distribución F de Snedecor (Fisher-Snedecor)


Sean X e Y dos variables aleatorias independientes distribuidas según una  2 con n y
m grados de libertad respectivamente. La variable aleatoria

X
F= n
Y
m

Sigue una distribución F de Snedecor con n y m grados de libertad que se denota Fn.m

La función de densidad de esta distribución viene dada por

n+m
m n
m 2 n2    m
f ( x) =  2  x 2 −1 n + mx − n +2m , x  0
( )
m n
   
 2  2
Para esta variable se tiene:

m m 2 ( 2m + 2n − 4 )
EX  = , m  2 ; V X  = ,m4
m−2 n ( m − 2) ( m − 4)
2

Propiedad:
1
Si X Fn, m entonces Fm, n
X

Si X tn entonces X 2 F1,n

Distribución multinomial
La distribución multinomial es una generalización de la binomial, en la que el
experimento que la genera arroja k  2 resultados distintos en cada realización -la
binomial es una distribución dicotómica- donde, las probabilidades de cada uno de los
resultados permanece constante a lo largo de todo el proceso. La distribución multinomial
se obtiene al realizar, de forma independiente, n pruebas individuales y contar el número
de veces que aparece cada resultado. Si se llama Ai al i-ésimo resultado, siendo P ( Ai ) = pi
y X i al número de veces que se obtiene Ai en las n pruebas, X i será la componente i-
ésima de la variable k-dimensional X .
La distribución de probabilidades de la variable multinomial es:
n!
P ( X1 = n1 , X 2 = n2 ,..., X k = nk ) = p1n1 p2n2 ... pknk donde: n1 + n2 + ... + nk = n
n1 !n2 !...nk !

Ejemplo: Se lanza un dado 5 veces. Determine la probabilidad de obtener un uno, dos


doses y dos cuatros.
Sean los eventos: Ai : Obtener i puntos en el dado, i = 1, 2,..., 6

La probabilidad pedida es:


5!
P ( X1 = 1, X 2 = 2, X 3 = 0, X 4 = 2, X 5 = 0, X 6 = 0 ) = ( 1 ) ( 1 ) ( 1 ) = 0.0038
1 2 2

1!2!0!2!0!0! 6 6 6
Ejercicio. En una gasolinera se ofrecen tres servicios: suministrar gasolina, lavar autos y
comprobar la presión de los neumáticos. Estos servicios son demandados con una
probabilidad de 0.90, 0.05 y 0.05 respectivamente. ¿Cuál es la probabilidad de que de
diez autos que lleguen, seis vaya a cargar gasolina, tres vayan a lavado y uno a comprobar
la presión?
Ejercicio. Una máquina produce piezas que según su peso pueden clasificarse en
“pesadas”, “normales” y “ligeras”. Por experiencia se ha estimado que el 30% son
pesadas y el 60% normales. De cinco piezas extraídas, ¿cuál es la probabilidad de que
dos sean pesadas y dos normales?

También podría gustarte