Estadística: Distribuciones

VARIABLES ALEATORIAS
Introducción
Proceso BERNOULLI
Un ensayo de BERNOULLI es un experimento aleatorio con sólo dos resultados posibles: “éxito” o
“fracaso”. Si llamamos p a la probabilidad de éxito, entonces la probabilidad de fracaso será 1-p.
Un proceso de BERNOULLI es la repetición de este tipo de ensayo, un número finito de veces, en las
siguientes condiciones:
1) Independencia.
2) Estabilidad: p = constante.
Si se fija la cantidad de ensayos n, y se cuenta la cantidad aleatoria de éxitos: r, esta variable responde
a la distribución binomial:
~
r = bi (n; p ) = número de éxitos en n experimentos
Se demuestra que:
 n
Pbi (r \ n; p) =   ⋅ p r ⋅ (1 − p) n − r r , n ∈ N , r ≤ n, p ∈ [0;1]
r 
50% 50%
n = 10 n = 10
40% p = 10% 40% p = 30%
30% 30%
20% 20%
10% 10%
0% 0%
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 1

ESTADÍSTICA TÉCNICA, INGENIERÍA, UBA.
EJERCICIOS DE VARIABLES ALEATORIAS
50% 50%
n = 10 n = 10
40% p = 50% 40% p = 80%
30% 30%
20% 20%
10% 10%
0% 0%
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Definiendo:
F (r ) = P(~
r ≤ r)
G (r ) = P(~
r ≥ r)
Se cumple, como para cualquier variable discreta entera:
F (r ) + G (r ) = 1 + P(r )
F (r ) = 1 − G (r + 1)
G (r ) = 1 − F (r − 1)
Se demuestra que:
E~
r = n⋅ p
V~
r = n ⋅ p ⋅ (1 − p )
Si se fija la cantidad de éxitos r y se cuenta la cantidad aleatoria de ensayos n necesarios para

obtenerlos, esta variable responde a la distribución PASCAL:
n~ = Pa(r ; p ) = número de experimentos necesarios para obtener r éxitos
Se demuestra que:
 n − 1 r
PPa (n \ r ; p) =   ⋅ p ⋅ (1 − p) n − r r , n ∈ N , r ≤ n, p ∈ [0;1]
 r − 1 

50% 50%
40% r =3 40% r =3
p = 10% p = 30%
30% 30%
20% 20%
10% 10%
0% 0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
50% 50%
40% r =3 40% r =3
p = 50% p = 80%
30% 30%
20% 20%
10% 10%
0% 0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
También se demuestra que:
En~ = r p
Vn~ = r ⋅ (1 − p ) p 2
La distribución Geométrica es un caso particular de la PASCAL con r = 1.
Una aplicación muy frecuente del proceso BERNOULLI son los defectos de fabricación. En ese caso n es
la cantidad de piezas evaluadas y r la cantidad de defectuosas. A veces el porcentaje de defectuosas p
puede calcularse a partir de alguna característica aleatoria de las piezas, como una dimensión, una
concentración, etc, mediante la distribución correspondiente (Normal, POISSON, etc).
Las distribuciones binomial y PASCAL están vinculadas:
r
PPa (n \ r ; p ) = ⋅ Pbi (r \ n; p )
n
FPa (n \ r ; p ) = Gbi (r \ n; p )
Esto significa que necesitar n o menos repeticiones para obtener r éxitos es equivalente a obtener r o
más éxitos en n repeticiones.
Obsérvese que esta relación no se cumple cambiando F por G y viceversa.

La Cátedra dispone de una tabla que resuelve el tedioso cálculo de las probabilidades binomiales
acumuladas, que también sirve para la PASCAL en vista de su vinculación:
r ; n; p → Gbi (r \ n; p )
En Excel se usa la siguiente función:
Fbi(r \ n;p) = binomdist(r;n;p;1)
Las tablas son limitadas (la de la cátedra alcanza hasta n = 20) y debido a los factoriales hasta las
computadoras tienen problemas aun para valores relativamente bajos de n. Entonces se utilizan
aproximaciones. Cuando el valor de p es intermedio (ni cercano a 0 ni cercano a 1) la distribución
binomial se aproxima a la normal:
r +½ − n⋅ p
Fbi (r \ n; p ) ≅ FN (u \ 0;1) con u=
n ⋅ p ⋅ (1 − p )
r −½ − n⋅ p
Gbi (r \ n; p ) ≅ G N (u \ 0;1) con u=
n ⋅ p ⋅ (1 − p )
En cambio cuando el valor de p es extremo esta aproximación no es buena.

Cuando p es pequeño la distribución binomial se aproxima a la POISSON:
Fbi (r \ n; p) ≅ FPo (r \ m) con m = n⋅ p

Gbi (r \ n; p ) ≅ G Po (r \ m) con m = n⋅ p
Y finalmente cuando p es cercano a 1, puede usarse esta aproximación pasando previamente a la

binomial complementaria: Fbi (r \ n; p ) = Gbi (n − r \ n;1 − p ) .
Hay distintos criterios para definir los límites de uso de estas aproximaciones. Algunos autores
mencionan que cuando n.p <= 5 y n >= 50 es aplicable la aproximación por POISSON, y cuando n.p
>= 5 y n.(1-p) >= 5 se aplica en cambio la distribución Normal. Este es un criterio un tanto
conservador. Un estudio más detallado realizado por el Ing. MERMOZ arroja el siguiente criterio que
utilizamos en la cátedra:
(1 − p ) 2
n ≥ 0,23 ⋅ → Normal
p3
(1 − p ) 2
n < 0,23 ⋅ → POISSON
p3

Válido para p ≤ 0,5. Sino hay que pasar previamente a la binomial complementaria:
Fbi (r \ n; p ) = Gbi (n − r \ n;1 − p ) .
Ejemplo:
Se desea que un proceso de fabricación de fusibles no produzca más de 1% de defectuosos. Se lo

controla probando 10 fusibles tomados al azar de la producción de una hora. Si 1 o más de los 10
fusibles falla se detiene el proceso y se lo examina con atención. Si realmente está trabajando al 1%
calcular la probabilidad de que el proceso sea examinado sin necesidad.
r̃: número de fusibles que fallan en una muestra de n = 10
Si el proceso funciona normalmente: r̃ = bi (n = 10 ; p = 0,01)
P(revisar sin necesidad) = P (r̃ ≥ 1 \ n = 10 ; p = 0,01) = Gbi ( 1 \ n = 10 ; p = 0,01) = 0,0956

!
Hipergeométrica
Dado un proceso de extracciones sin reposición donde hay N elementos, R de los cuales son éxito, se
define la variable hipergeométrica como:
~
r = h(n; N ; R) = cantidad de éxitos en n extracciones
Se demuestra que:
 R  N − R
  ⋅  
 r   n − r 
Ph (r \ n; N ; R) = r , n, R, N ∈ N , r ≤ n, r ≤ R, n ≤ N , R ≤ N , n − r ≤ N − R
N
 
n 
R
E~
r = n⋅
N
R  R  N −n
V~
r = n ⋅ ⋅ 1 −  ⋅
N  N  N −1
Por otra parte se define la variable PASCAL hipergeométrica:
n~ = Ph(r ; N ; R) = cantidad de extracciones para obtener r éxitos

Que está vinculada a la hipergeométrica:
FPh (n \ r ; N ; R) = Gh (r \ n; N ; R)
La cátedra dispone de una tabla que resuelve el tedioso cálculo de las probabilidades hipergeométricas
acumuladas:
n; N ; R; r → Fh (r \ n; N ; R)
Esta tabla no presenta todas las combinaciones de valores porque hay una serie de relaciones que
permiten reducirla:
Fh (r \ n; N ; R) = Fh (r \ R; N ; n)
Fh (r \ n; N ; R) = Gh ( R − r \ N − n; N ; R)
Fh (r \ n; N ; R) = Gh (n − r \ n; N ; N − R)
Fh (r \ n; N ; R) = Fh ( N − n − R + r \ N − n; N ; N − R)
Cuando el valor buscado no está en la tabla hay que ensayar con estas expresiones para encontrarlo.
En Excel se usa la siguiente función:
Ph(r \ n;N;R) = hypergeomdist(r;n;R;N)
La tabla llega hasta N = 16. Cuando la tabla o la computadora encuentran su límite se aproxima la
hipergeométrica mediante una binomial, lo cual es tanto más preciso en la medida en que n es una
pequeña fracción de N.
Ejemplo:
Un gasoducto que mide 120 km tiene 13 estaciones de bombeo ubicadas cada 10 km de distancia,
existiendo una estación en cada cabecera. Cuando fallan 1 o 2 estaciones disminuye el caudal de
bombeo, pero cuando fallan 3 se detiene la circulación del fluido. Habiéndose detenido la
circulación de fluido por fallas, se inicia la búsqueda de las estaciones dañadas desde una cabecera.
¿Qué probabilidad existe de recorrer más de 90 km para ubicar las 3 estaciones averiadas?
Al recorrer 90 km habremos revisado 10 estaciones, por lo tanto:
P = GPh (n = 11 \ r = 3; R = 3 ; N = 13) = Fh (r = 2 \ n = 10 ; R = 3 ; N = 13) = 0,5805

!

Proceso POISSON
Cuando existen eventos que ocurren a lo largo de un continuo y esas ocurrencias se dan al azar y
uniformemente, estamos en presencia de un proceso POISSON.
El mismo responde a las siguientes características:
1) La probabilidad de que en una pequeña porción del continuo ocurran 2 o más eventos es
despreciable.
2) La probabilidad de que ocurra un evento es proporcional al tamaño de la porción de continuo.
3) El número de eventos que ocurren en intervalos de continuo no superpuestos son variables
aleatorias independientes y si los intervalos son de igual tamaño, estas variables están
igualmente distribuidas.
Se define entonces la variable POISSON:

~
r = Po(m = λ ⋅ t ) = cantidad de eventos puntuales en una porción de continuo de tamaño t
Que es una variable aleatoria discreta.

Siendo λ la intensidad del proceso: cantidad media de eventos puntuales por unidad de continuo.
Se demuestra que:
m r ⋅ e−m
PPo (r \ m) = r ∈ N,m ∈ R+
r!
30% 30%
m =2 m =5
20% 20%
10% 10%
0% 0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

30% 30%
m = 10 m = 15
20% 20%
10% 10%
0% 0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
También se demuestra que:
E~
r =m
V~
r =m
Por otro lado se define la variable Gamma:

~ γ ( ; λ−1 )
t = r = extensión de continuo hasta el evento puntual número r
Que es una variable aleatoria continua.
Se demuestra que:
λ
f γ (t \ r ; λ ) = ⋅ e −λt ⋅ (λt ) r −1 t ∈ R+ , r ∈ N ,λ ∈ R+
Γ(r )
donde: Γ(r ) = (r − 1)! es la función gamma completa
E~
t = r/λ
V~
t = r / λ2
Una aplicación muy frecuente del proceso POISSON son las fallas puntuales en materiales continuos,
como alambre, hilado, papel, tela, etc. En ese caso t es la longitud de continuo r la cantidad de fallas.
Otra típica aplicación son los fenómenos de espera. En ese caso t es un lapso de tiempo y r la cantidad
de clientes que arriban al sistema; o también puede ser r la cantidad de clientes atendidos en un lapso t.
También se aplica a la vida de cosas que fallan a la POISSON (o sea al azar en un continuo, por
oposición a la falla por desgaste). La falla significa salida de operación. Entonces cobra importancia un
caso particular: la distribución exponencial, que es una Gamma con r = 1, pues una vez que salió de
operación no hay más fallas.
Las distribuciones POISSON y Gamma están vinculadas:
Fγ (t \ r ; λ−1 ) = GPo (r \ m = λ ⋅ t )

La Cátedra dispone de una tabla que da las probabilidades acumuladas de POISSON, que también sirve
para la Gamma en vista de su vinculación:
r ; m → GPo (r \ m)
En Excel se usan las siguientes funciones:
FPo(r \ m) = poisson(r;m;1)
Fγ (t \ r ;λ-1) = gammadist(t; r ;λ-1;1)
tF = gammainv(F;r ;λ-1)
La tabla de POISSON llega hasta m = 20. Con m ≥ 9 se puede utilizar la siguiente aproximación:
r +½ − m
FPo (r \ m) ≅ FN (u \ 0;1) con u=
m
Ejemplo:
Los rollos de encordado de rayón para neumáticos tienen un promedio de 2,2 nudos por metro. Se
utilizan para cada neumático cortes de 1,2 m, de un cierto tipo de encordado. Se rechaza un corte
dado si tiene más de 5 nudos. Calcular la probabilidad de que el inspector tenga que revisar menos
de 20 cortes para encontrar 15 buenos.
r̃: número de nudos en un corte = Po (m = λ.t = 2,2 nudos/m x 1,20 m)
P(~
r > 5 \ λ = 2,2; t = 1,20) = G Po (6 \ m = 2,2 ⋅1,2) = G Po (6 \ m = 2,64) = 0,05208
ñ: número de cortes a inspeccionar para encontrar 15 buenos = Pa (r = 15 ; p = 1-0,05208)
P(n~ < 20 \ r = 15; p = 0,95) = FPa (19 \ r = 15; p = 0,95) = Gbi (15 \ n = 19; p = 0,95) = 0,0132
!

Normal
Es una distribución continua con la siguiente densidad de probabilidad:

2
1  x− µ 
1 −  
f N ( x \ µ ;σ ) = ⋅ e 2 σ 
x ∈ R, µ ∈ R, σ ∈ R +
σ 2π
Es la distribución continua más sencilla y mejor estudiada. Hay muchos fenómenos que pueden ser
representados mediante ella porque tiene el sustento del Teorema del Límite Central: cuando una
variable es suma de otras muchas variables cualesquiera, tiende a ser normal.
Se aplica para dimensiones de fabricación, todo tipo de variables biológicas, errores de medición, etc.
En el caso de una dimensión de fabricación la media corresponde al ajuste de la máquina y el desvío
estándar no depende del mismo sino de la calidad y estado de la máquina.
Cuando no se conoce la distribución de una variable aleatoria, y tampoco se dispone de información
suficiente para analizarla, se suele utilizar la normal como primera aproximación. Esto condice con el
"principio de parsimonia": "aplicar el modelo más simple de entre los que describen razonablemente
bien la realidad". Podría pensarse que la distribución uniforme es más sencilla aun, pero generalmente
no describe la realidad aceptablemente, dado que la mayoría de las veces a poco que uno analiza
descubre que hay una zona central y un decaimiento de la probabilidad a medida que uno se aleja.
La distribución normal se aplica a veces a variables que tienen un dominio acotado, aunque la normal
no lo tiene. Por ejemplo si el rendimiento de un proceso tiene media 72% y desvío 2%, aplicar una
normal abre la posibilidad de rendimientos mayores que 100%. Como veremos el 99,7% de la
probabilidad de la normal está contenida en el intervalo µ ± 3σ , luego esa posibilidad de rendimientos
mayores a 100% es prácticamente despreciable y el modelo responde bien a la realidad.
Se demuestra que:
E~
x =µ
V~
x =σ 2

Se dice que µ es un parámetro de posición porque al cambiar sólo corre la distribución sin alterar su
escala ni su forma. En cambio σ es un parámetro de escala porque al cambiar la distribución se estira o
comprime sin alterar su forma. Los parámetros de posición y de escala pueden ser eliminados mediante
estandarización:
x−µ
u=
σ
La variable normal estándar tiene media 0 y varianza 1, y como es simétrica cumple:
FN (−u \ 0;1) = 1 − FN (u \ 0;1)
La estandarización simplifica enormemente el cálculo de probabilidades. No hace falta una tabla para
cada µ y cada σ. Basta estandarizar:
FN ( x \ µ ;σ 2 ) = FN (u \ 0;1)
y usar la tabla de la normal estándar:
u → FN (u \ 0;1)
También se suele usar la tabla de fractiles de la normal estándar:
F → uF
FN(x\ µ;σ2) = normdist(x;µ;σ;1)

xF = norminv(F;µ;σ)
FN(u\ 0;1) = normsdist(u)
uF = normsinv(F)
Ejemplo:
La tensión de encendido de un lote de tubos fluorescentes se distribuye normalmente con media

165 V y desviación estándar 11 V. Determinar el porcentaje de los tubos que no encenderá en un
momento en que la tensión de la red baje a 175 V.
x: Tensión de encendido de tubos fluorescentes N(µ = 165 V ; σ2 = 121 V2)
La porción de tubos que no encenderá es la que tiene tensión de encendido mayor a 175 V, o sea:

 175 − 165 
G N ( x = 175) = G N  \ 0;1 = G N (0,9091 \ 0;1) = 1 − FN (0,9091 \ 0;1) = 1 − 0,8183 = 18,2%
 121 
!
Lognormal
La variable x̃ tiene distribución Lognormal con parámetros μn y σn cuando la variable ~y = ln( ~

x ) tiene
distribución Normal con media μn y desvío estándar σn. Es decir es una distribución cuyo logaritmo es
normal. Dada una muestra lognormal, si se toman logaritmos se tiene una muestra normal.
Como puede observarse en el siguiente gráfico la Lognormal tiene gran asimetría positiva.
Cuando una variable es el resultado del producto de muchos factores con distribución cualquiera,
aplicando el Teorema del Límite Central vía logaritmos, se concluye que su distribución es
aproximadamente lognormal.
Los modelos económicos tienen un conjunto de variables que evolucionan en el tiempo. Cuando se fija
el tiempo y se observan los valores que toma una variable para distintos individuos se dice que se
realiza un "corte transversal". Por ejemplo los saldos de cuentas bancarias en un momento. En muchos
casos las variables de corte transversal tienen distribución lognormal.
Se demuestra que:
E~
x = exp( µ n + ½σ n2 )
V~
x = (exp(σ n2 ) − 1) ⋅ exp(2 µ n + σ n2 )
Si se conocen la media µ y la varianza σ2 de la distribución, pueden calcularse los parámetros

invirtiendo el sistema de ecuaciones anterior:

σ n2 = ln(1 + δ 2 ) con δ =σ µ
µ n = ln µ − ½σ 2
n
El cálculo de probabilidades se realiza a través de la Normal:
ln x − µ n
FLN ( x \ µ n ;σ n ) = FN (ln x \ µ n ;σ n2 ) = FN (u \ 0;1) con u=
σn
Ejemplo:
Los aportes jubilatorios anuales que se realizan a una AFJP de primera línea, se distribuyen
aproximadamente según una Lognormal de μ = 1000$ y σ = 2000$.
Obtener el porcentaje de afiliados que aportan más de 1200$ por año.
~
x : aportes jubilatorios anuales a la AFJP
Se deben calcular primero los parámetros de la distribución:
σ n2 = ln(1 + δ 2 ) = ln(1 + (2000 1000) 2 ) = 1,609 = 1,269 2

µ n = ln µ − ½ ⋅ σ n2 = ln(1000) − ½ ⋅1,269 2 = 6,103
 ln(1200) − 6,103 
G LN (1200 \ 6,103;1,269) = G N  \ 0;1 = G N (0,778 \ 0;1) = 0,218
 1,269 
!
Gamma
Como comentamos en el proceso de POISSON:
• Fijando una tramo de continuo t, la cantidad aleatoria de eventos puntuales se distribuye a la

POISSON.
• Fijando una cantidad de eventos puntuales r, la cantidad aleatoria de continuo se distribuye a la
Gamma.
Esta definición de la distribución Gamma es restringida. Es posible generalizarla fuera del proceso de
POISSON, donde encuentra muchas otras aplicaciones. La Gamma generalizada suele llevar otra
nomenclatura:

α =r
β = λ−1
En la Gamma generalizada el parámetro α admite valores no enteros.
Entonces:
1
⋅ exp(− x / β ) ⋅ (x / β )
α −1
fγ ( x \ α ; β ) = x ∈ R + ,α , β ∈ R +
β ⋅ Γ(α )
Donde Γ(α ) es la función gamma completa que generaliza el factorial para valores no enteros.
+∞
Γ(α ) = ∫ e −t t α −1dt
0
Γ(α ) = (α − 1)! si α es entero.
=1
>1
Se demuestra que:
E~
x =α ⋅β
V~
x =α ⋅β 2
En la distribución Gamma α es un parámetro de forma, mientras que β es un parámetro de escala.

Entonces se puede eliminar β por estandarización:
x
Fγ ( x \ α ; β ) = Fγ ( z \ α ;1) con z=
β
La Cátedra dispone de una tabla de fractiles para la Gamma estándar que admite valores de α no
enteros:

F ;α → z F
Fγ (x \ α;β) = gammadist(x;α;β;1)
xF = gammainv(F;α;β)
La tabla de Gamma se extiende hasta α = 15. Para valores superiores se usan aproximaciones.
Podría usarse la misma que para la POISSON:
x − αβ
Fγ ( x \ α ; β ) ≅ FN (u \ 0;1) con u=
α ⋅β
Pero no es muy precisa. Sólo sirve cuando α ≥ 25 .

Afortunadamente WILSON y HILFERTY desarrollaron una aproximación mucho más fina, que logra dos
o tres cifras exactas:
 x 1 
Fγ ( x \ α ; β ) ≅ FN (u \ 0;1) con u = 3 α ⋅  3 + − 1 válida para α ≥ 0,5
 αβ 9α 
Esta excelente aproximación hace conveniente calcular la POISSON por Gamma:
G Po (r \ m) = Fγ (m \ r ;1)
Ejemplo
Se ha lanzado al espacio una placa fotográfica con el fin de recoger información sobre las
radiaciones cósmicas. Los impactos de partículas α sobre la placa ocurren con una intensidad λ =
1/100 impactos/hora.
a) ¿Qué probabilidad existe de que el próximo impacto ocurra en las próximas 20 hs?
~ : tiempo hasta el próximo impacto: α = 1 ; β = λ-1 = 100)
t γ(
Fγ (t = 20 \ α = 1; β = 100) = G Po (1 \ m = 0,2) = 0,181
b) ¿Qué probabilidad existe de que el tercer impacto ocurra después de las 500 hs?
Ahora utilizamos otra variable, también Gamma:

~ : tiempo para recibir 3 impactos: α = 3 ; β = λ-1 = 100)
t γ(

Gγ (t = 500 \ α = 3; β = 100) = Gγ ( z = 5 \ α = 3; β = 1) = 0,126

!
Beta
Es una distribución continua con la siguiente densidad de probabilidad:
1
f β ( x \ m; n) = ⋅ x m −1 ⋅ (1 − x) n−1 x ∈ [0;1], m, n ∈ R +
Β(m; n)
Γ ( m ) ⋅ Γ ( n)
Donde Β(m; n) =
Γ (m + n)
m= 8
n= 8 m= 6
n= 2
m= 2
n= 4
0 1
Tiene dos parámetros de forma. Por eso es la más complicada. Se usa para variables de dominio
acotado en ambos extremos: proporciones, rendimientos, etc. Este tipo de variables sólo puede ser
descripto por otras distribuciones como la normal, etc, cuando el dominio habitual es lejano a los
extremos del dominio teórico. La distribución Beta puede generalizarse al dominio [a;b] agregándole
un parámetro de posición y uno de escala.
La distribución Beta tiene dos juegos de parámetros, dos nomenclaturas, m y n, o ν y ρ :
ν = m + n m = ρ
 
ρ = m n = ν − ρ
Donde debe ser ν > ρ.

Se demuestra que:
ρ
E~
x=
ν
ρ /ν ⋅ (1 − ρ /ν )
V~
x=
ν +1
La distribución Beta está vinculada con el proceso BERNOULLI:

~
r = bi (n; p ) = cantidad de éxitos en n experimentos, con probabilidad de éxito p
n~ = Pa(r ; p ) = cantidad de experimentos para obtener r éxitos, con probabilidad de éxito p
~
p = β (ν = n + 1; ρ = r ) =probabilidad de éxito para obtener r éxitos en n experimentos
Como la distribución Beta tiene dos parámetros de forma continuos no se puede estandarizar y la tabla
es un grueso libro, que no está disponible en la Cátedra. Sus probabilidades se pueden calcular a través
de la binomial, interpolando si los parámetros no fueran enteros:
Fβ ( x \ m; n) = Gbi (m \ m + n − 1; x)
Fβ ( x \ ν ; ρ ) = Gbi ( ρ \ ν − 1; x)
Fβ (x \ m;n) = betadist(m;n;0;1)
xF = betainv(m;n;0;1)
A veces es mejor utilizar una aproximación. Existen dos aproximaciones de la Beta por normal: la de
PAULSON (1942) y la de WISE (1960). La primera es más exacta, aunque la segunda tiene ciertas
propiedades de linealidad interesantes. Veremos la de PAULSON:
A⋅ M − N m 1 
Fβ ( x \ m; n) ≅ G N (u \ 0;1) con u= A=3 ⋅  − 1
A 2
1 n z 
+
m n
1 1
M = 3− N = 3−
3m 3n
Esta aproximación no es tan buena como la de WILSON HILFERTY para la Gamma, pero aun así hace
conveniente el cálculo de la binomial por Beta:

Gbi (r \ n; p) = Fβ ( p \ m β = r ; n β = n − r + 1)
Ejemplo
En una planta elaboradora de helados se produce un helado mixto con 2 gustos: chocolate y
vainilla. La proporción del helado de chocolate al total se distribuye aproximadamente según una
variable Beta de ν = 10 y ρ = 5
¿Qué probabilidad hay de que la proporción del gusto vainilla supere el 70% del total?
~
x : porción de helado de chocolate.
P( ~
x < 0,3) = Fβ (0,3 \ ν = 10; ρ = 5) = Gbi (r = 5 \ n = 9; p = 0,3) = 0,098
!
WEIBULL
Es una distribución continua con la siguiente función de probabilidad acumulada:
GW ( x \ ω ; β ) = exp(−( x / β )ω ) x ∈ R + ,ω , β ∈ R +
La función de densidad se obtiene derivando y cambiando de signo la anterior, y presenta la siguiente

forma:
= 10
=2
Cuando ω > 3,6 aproximadamente, la distribución asume asimetría negativa. Por eso sirve para
describir fenómenos de falla por desgaste (por ejemplo la vida humana). La WEIBULL es la única
distribución continua sencilla que cumple esta condición. La Beta y la Beta invertida pueden tener
asimetría negativa para ciertos valores de los parámetros pero, siendo más complicadas, suelen dejarse
de lado en razón del "principio de parsimonia" (usar el modelo más sencillo de entre los que describen
razonablemente bien la realidad).

Se demuestra que:
E~
x = β ⋅ Γ(1 + 1 / ω )
V~ (
x = β 2 ⋅ Γ(1 + 2 / ω ) − Γ 2 (1 + 1 / ω ) )
Evidentemente el cálculo de probabilidades de esta distribución es tan sencillo que no requiere el uso
de tablas. Sin embargo el cálculo de la media y la varianza es más complicado y la Cátedra dispone de
una tabla para ello:
µ σ
ω →δ; donde δ= coeficiente de variación
β µ
Esta tabla permite obtener µ y σ a partir de ω y β y viceversa.
Ejemplo
La resistencia a la flexión de un panel prefabricado utilizado en la construcción de edificios es

aleatoria con distribución de WEIBULL. Luego de una gran cantidad de ensayos se concluyó que la
resistencia media es 700 kgr y el desvío estándar es 300 kgr. Calcular la probabilidad de que el
panel resista una carga de 1000 kgr a la flexión.
~
x : resistencia a la flexión del panel: W(ω;β)
Para calcular la probabilidad primero hay que conocer los parámetros.
σ 300
δ= = = 0,429
µ 700
Entrando en la tabla:
µ
δ = 0,429 → ω = 2,5; = 0,887
β
µ 700
Entonces: β= = = 789
0,887 0,887
Ahora:
P( x ≥ 1000) = GW (1000 \ 2,5;789) = exp(−(1000 / 789) 2,5 ) = 0,164
!

Ejercicios
D1) Una partida de embragues viene con el 10% de defectuosos. Si se necesita equipar 14
automóviles con embragues nuevos y se tienen 16 embragues:
a) ¿Qué probabilidad existe de no tener que necesitar más embragues?
b) ¿Cuál es el número esperado de automóviles que se armarán con los 16 embragues?
c) ¿Cuál es el número esperado de embragues que se necesitan para armar los 14 automóviles?
D2) En un call center se estableció que la probabilidad de lograr una comunicación exitosa (no
ocupado ni equivocado) en una llamada es del 85%.
a) ¿Qué probabilidad existe de lograr más de 80 comunicaciones exitosas en 100 llamadas?
b) ¿Qué probabilidad existe de tener que realizar más de 120 llamadas para lograr 100
comunicaciones?
c) ¿Cuál es el número esperado de llamadas para conseguir 100 comunicaciones?
D3) Un proceso se controla en cuanto a su porcentaje de defectuosas mediante un gráfico de

control. Las muestras extraídas son de tamaño n = 30 y el proceso se revisa sin detenerlo toda vez que
se encuentran 3 o más defectuosas.
a) Calcular la probabilidad de revisarlo sin necesidad cuando el porcentaje de defectuosos es el
estándar, es decir 6%.
b) Si el proceso está fuera de control y p = 0,08: calcular el número de muestras que será necesario
sacar para detectarlo, como máximo razonable o poco probable de superar.
D4) El examen de "Estadística Técnica" es escrito y consiste en la resolución de 5 problemas. Para

aprobarlo se requiere tener 3 problemas bien. Suponiendo que un alumno tiene una probabilidad 0,4 de
resolver bien uno cualquiera de los problemas:
a) Calcular el número esperado de exámenes necesarios para aprobar.
c) Calcular la probabilidad de aprobarla en menos de 3 veces.
D5) A fin de estudiar los hábitos migratorios de las ballenas azules, fueron atrapadas 6 de ellas.
Después de ser marcadas fueron dejadas en libertad. Se sabe que tales ballenas pertenecen a un grupo
de 14 cetáceos. Se sabe también que las mismas ballenas vuelven al Atlántico Sur donde se las espera
volver a capturar para obtener la información registrada en los equipos que llevan las ballenas
marcadas.
Habiendo llegado las 14 ballenas al Atlántico Sur, ¿qué probabilidad existe de tener que atrapar más de
10 cetáceos para ubicar las 6 ballenas marcadas?

D6) Se tiene el siguiente plan de muestreo: de un lote de 50 unidades se eligen 5 al azar, se rechaza
el lote si la muestra contiene una o más defectuosas. Calcular:
a) La probabilidad de aceptar un lote que contenga 10 defectuosas.
b) La probabilidad de rechazar un lote que contenga 3 defectuosas.
D7) El proceso de pintura de unos chapones que miden 2m x 2m tiene una intensidad de falla λ =
1/4 fallas/m2. Las fallas ocurren individual y colectivamente al azar.
a) ¿Qué probabilidad existe de que un chapón tenga más de 2 fallas?
b) ¿Cuál es el número esperado de fallas en un chapón?
c) ¿Qué probabilidad existe de encontrar más de un chapón con más de 2 fallas en un lote de 6
chapones?
D8) Se requiere tomar una muestra de los microorganismos de un lecho submarino. Si tales
organismos aparecen al azar con una intensidad de 1/10 organismo/cm3 ¿qué volumen debe tener la
sonda de perforación si se desea una probabilidad del 85% de obtener por lo menos 15 organismos?
D9) Una tapa fundida se produce con un promedio de 1 falla cada 4 piezas y se entrega en lotes de
20. El comprador considera defectuosa una tapa que contenga 2 o más fallas, y a fin de controlar las
entregas revisa 6 piezas de cada lote. Si encuentra más de una defectuosa rechaza todo el lote. Calcular
el porcentaje de lotes que aceptará.
D10) Un fabricante de cables eléctricos ha comprado un nuevo equipo para producir cable de
aislación plástica. El proveedor ha prometido que con dicho equipo se reduce el promedio de fallas a 1
cada 150m. Para cerciorarse el fabricante produce 5000m de cable con el equipo nuevo y los hace
revisar, encontrándose 4 fallas. Calcular la probabilidad de ocurrencia de este hecho, suponiendo que
el equipo esté produciendo según las promesas del proveedor.
D11) El número de mensajes que se envían por computadora a un boletín electrónico es una variable
aleatoria POISSON con una media de 5 mensajes/ hora.
a) ¿Cuál es la probabilidad de que el boletín reciba exactamente 5 mensajes en una hora?
b) ¿Cuál es la probabilidad de que el boletín reciba más de 30 mensajes en 5 horas?
c) ¿Cuál es la cantidad de mensajes a recibir en media hora que sólo es superada con probabilidad
10%?
D12) Una máquina llenadora de bolsas de pellets de plástico dosifica un volumen aleatorio
normalmente distribuido con media 20 kg y desvío estándar 0,2 kg.
a) Calcular el porcentaje de bolsas que quedarán fuera de especificación si ésta es, respectivamente: µ
± σ , µ ± 2σ , o µ ± 3σ .

D13) En una rectificadora el diámetro de las piezas producidas puede considerarse normalmente
distribuido con valor medio correspondiente al valor de ajuste y con desvío estándar constante e
independiente del valor anterior. Durante la producción de la primera mitad de un lote de 200 piezas
con especificación (12 ± 0,03) mm se encontraron 22 piezas sobre medida y 3 bajo medida.
a) Calcular la reducción del porcentaje de defectuosas que puede lograrse mediante un ajuste correcto y
en cuánto se deberá corregir el ajuste para ello.
b) Calcular la reducción del porcentaje de defectuosas que puede lograrse con el ajuste actual y una
reducción de 20% en el desvío estándar.
D14) Los montos pagados en concepto de siniestros por una compañía de seguros de automotores en
el último trimestre, se pueden considerar distribuidos lognormalmente con valor medio $ 12.000 y
desvío estándar $ 10.000. Para establecer un nuevo valor para las primas a cobrar, calcular el monto
que es superado por el 80% de los siniestros y el valor que sólo es superado por el 20% de los
siniestros.
D15) La resistencia de probetas de hormigón producidas en obra a partir de los pastones que se
preparan para cada colada tiene, con suficiente aproximación, distribución lognormal. Se define como
resistencia característica aquella que es superada el 95% de las veces. Calcular el valor de la misma si
se sabe que en una larga serie de pruebas, la mitad de las pruebas dio resistencia por debajo de 20,7 y
el coeficiente de variación de la resistencia entre probetas fue 0,235. Calcular el coeficiente de
seguridad implícito.
D16) Una empresa esta analizando su consumo telefónico a fin de reducir costos. De datos extraídos
de la central telefónica surge que la duración de las llamadas tiene distribución Gamma con μ = 3,2
minutos y σ2 = 5,12 minutos2. La compañía telefónica cobra $0,05 por cada dos minutos o fracción de
comunicación. ¿Qué porcentaje de llamadas costarán más de 25 centavos?
D17) Una matriz de trefilación (trefila) tiene una vida definida por la aparición de incrustaciones en
el alambrón, que la rayan. Las incrustaciones aparecen al azar, con intensidad 1/20000 m.
a) Calcular la probabilidad de que 3 trefilas alcancen para una producción de 65000 m.
b) Calcular el número de trefilas que se deberán prever para cumplir una producción de 700000 m con
probabilidad 90 %.
D18) Las ventas mensuales de un artículo tienen distribución gamma de media 20000 unidades y
desvío estándar 4000 unidades.
a) Calcular la probabilidad de que en un año determinado las ventas mensuales superen las 16000
unidades en más de 8 meses.
b) Calcular la venta mensual que es superada con 70% de probabilidad.

D19) El rendimiento diario de un proceso de fabricación sigue una distribución beta cuya media es
0,57 y cuyo desvío estándar es 0,17.
a) Calcular la probabilidad de que durante tres días el rendimiento sea inferior al 50%.
b) Calcular el valor del rendimiento que sólo es superado en el 5% de los casos.
D20) Se supone que la proporción de pares de zapatillas del modelo A con relación al total vendido
semanalmente en un comercio tiene distribución beta. De datos de ventas de un año completo se ha
calculado la proporción semana por semana. La media de esos datos ha resultado 0,294 y el desvío
estándar 0,0885. Admitiendo que la muestra fuera suficientemente grande como para suponer que esos
valores muestrales son iguales a los poblacionales, calcular la probabilidad de que la proporción supere
el 40% en una semana determinada.
D21) Después de prolongados ensayos se ha llegado a la conclusión de que la vida de un

determinado elemento no reparable tiene distribución WEIBULL. Después de introducir algunas
modificaciones en su diseño se ha ensayado un conjunto de 100 elementos, encontrando que la mitad
ha superado las 3200 h, en tanto que sólo 10 de ellos superaron las 5000 h.
a) Calcular los parámetros de la WEIBULL, considerando esta información.
b) Calcular la vida sobrepasada con probabilidad 0,6.
D22) La resistencia a la fatiga de una pieza del motor de un avión tiene distribución WEIBULL. Se ha
determinado que la resistencia media es 20.000 k ciclos, y el desvío estándar es 5.600 k ciclos. Se
desea que la probabilidad de que la pieza falle por fatiga sea 1%. Establecer el máximo período de
recambio [k ciclos] para lograr la confiabilidad deseada.


Estadística: Distribuciones

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística: Distribuciones

Cargado por

Copyright:

Formatos disponibles

VARIABLES ALEATORIAS

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 1

Se cumple, como para cualquier variable discreta entera:

Si se fija la cantidad de éxitos r y se cuenta la cantidad aleatoria de ensayos n necesarios para

n~ = Pa(r ; p ) = número de experimentos necesarios para obtener r éxitos

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 2

También se demuestra que:

La distribución Geométrica es un caso particular de la PASCAL con r = 1.

Las distribuciones binomial y PASCAL están vinculadas:

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 3

En Excel se usa la siguiente función:

Fbi(r \ n;p) = binomdist(r;n;p;1)

En cambio cuando el valor de p es extremo esta aproximación no es buena.

Fbi (r \ n; p) ≅ FPo (r \ m) con m = n⋅ p

Y finalmente cuando p es cercano a 1, puede usarse esta aproximación pasando previamente a la

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 4

Se desea que un proceso de fabricación de fusibles no produzca más de 1% de defectuosos. Se lo

r̃: número de fusibles que fallan en una muestra de n = 10

Si el proceso funciona normalmente: r̃ = bi (n = 10 ; p = 0,01)

P(revisar sin necesidad) = P (r̃ ≥ 1 \ n = 10 ; p = 0,01) = Gbi ( 1 \ n = 10 ; p = 0,01) = 0,0956

Por otra parte se define la variable PASCAL hipergeométrica:

n~ = Ph(r ; N ; R) = cantidad de extracciones para obtener r éxitos

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 5

Que está vinculada a la hipergeométrica:

En Excel se usa la siguiente función:

Ph(r \ n;N;R) = hypergeomdist(r;n;R;N)

Al recorrer 90 km habremos revisado 10 estaciones, por lo tanto:

P = GPh (n = 11 \ r = 3; R = 3 ; N = 13) = Fh (r = 2 \ n = 10 ; R = 3 ; N = 13) = 0,5805

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 6

Se define entonces la variable POISSON:

Que es una variable aleatoria discreta.

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 7

También se demuestra que:

Por otro lado se define la variable Gamma:

Que es una variable aleatoria continua.

donde: Γ(r ) = (r − 1)! es la función gamma completa

Las distribuciones POISSON y Gamma están vinculadas:

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 8

En Excel se usan las siguientes funciones:

r̃: número de nudos en un corte = Po (m = λ.t = 2,2 nudos/m x 1,20 m)

ñ: número de cortes a inspeccionar para encontrar 15 buenos = Pa (r = 15 ; p = 1-0,05208)

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 9

Es una distribución continua con la siguiente densidad de probabilidad:

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 10

La variable normal estándar tiene media 0 y varianza 1, y como es simétrica cumple:

FN (−u \ 0;1) = 1 − FN (u \ 0;1)

y usar la tabla de la normal estándar:

También se suele usar la tabla de fractiles de la normal estándar:

En Excel se usan las siguientes funciones:

FN(x\ µ;σ2) = normdist(x;µ;σ;1)

La tensión de encendido de un lote de tubos fluorescentes se distribuye normalmente con media

x: Tensión de encendido de tubos fluorescentes N(µ = 165 V ; σ2 = 121 V2)

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 11

La variable x̃ tiene distribución Lognormal con parámetros μn y σn cuando la variable ~y = ln( ~

Si se conocen la media µ y la varianza σ2 de la distribución, pueden calcularse los parámetros

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 12

El cálculo de probabilidades se realiza a través de la Normal:

Se deben calcular primero los parámetros de la distribución:

σ n2 = ln(1 + δ 2 ) = ln(1 + (2000 1000) 2 ) = 1,609 = 1,269 2

Como comentamos en el proceso de POISSON:

• Fijando una tramo de continuo t, la cantidad aleatoria de eventos puntuales se distribuye a la

ING. MARÍA SARQUIS, ING. DIEGO COLLADO, ING. EMILIO PICASSO. 13

En la Gamma generalizada el parámetro α admite valores no enteros.