Está en la página 1de 16

VARIABLES ALEATORIAS DISCRETAS

TEMA 3. ALGUNAS VARIABLES ALEATORIAS DISCRETAS

3.1 INTRODUCCIÓN

En el Tema 2, se ha definido el concepto de variable aleatoria, cómo la distribución de probabilidad


de sus valores (sus funciones de distribución de probabilidad), así como las características asociadas a
una variable aleatoria.

A lo largo de este capítulo se van a analizar los modelos de distribución de probabilidad asociados a
las variables aleatorias discretas más útiles y frecuentes en gran número de fenómenos aleatorios.

Para cada modelo se va a seguir la misma estructura. Inicialmente se describe el modelo que genera la
variable aleatoria, detallando a continuación las funciones de probabilidad asociadas a dicho modelo
(en este caso FX, y PX), y se deducirán las características más interesantes: media, varianza (como
mínimo). Si además, existe para cada modelo alguna/s propiedad/es interesantes, también se detallan.

Todo esto se acompañará con ejemplos de aplicaciones de cada modelo.

3.2 DISTRIBUCIÓN DE BERNOULLI

Este es el modelo estadístico más sencillo de todos: considere un experimento aleatorio en el que el
resultado de interés es la ocurrencia o no de un suceso. Sin pérdida de generalidad, se puede llamar
éxito a la ocurrencia de tal suceso.

Así, se dice que una variable aleatoria discreta tiene Distribución Bernoulli, X=B(p), cuando presenta
dos alternativas (valores) posibles: ocurre el suceso A ó su contrario A*, con probabilidad p ó q=1-p,
respectivamente.

Por tanto, esta variable aleatoria Bernoulli representa a todos los fenómenos aleatorios en los que
solamente interesan analizar dos sucesos: uno y su contrario o complementario. Ejemplos:

 Lanzamiento de una moneda al aire (ocurre ‘cara’ con probabilidad p=1/2 o cruz con 1-p= 1/2.
 Estado de una pieza (está ‘defectuosa’ con probabilidad p o no lo está, con probabilidad 1-p).
 Resultado de un votante con respecto a un candidato (el votante vota al candidato A, con
probabilidad p, o no le vota a A, con probabilidad 1-p). Fijarse en este caso que la situación real es
que se puedan votar a más de dos candidatos, sin embargo, la situación se modela como una
Bernoulli si sólo nos interesa saber si se le ha votado al candidato A o no.

Suele ser muy frecuente denominar este modelo como el modelo de éxito-fracaso, haciendo referencia
a que ocurra o no ocurra el suceso de interés.

Matemáticamente, la variable aleatoria suele representarse de la siguiente manera:

Página 1 de 16
VARIABLES ALEATORIAS DISCRETAS

X  B( p):   N
A  1 P(A) = p con 0  p  1
A*  0 P(A * ) = 1- p

Entonces, su función de masa se representa por:


1
PB( p ) ( x)  p x (1  p) 1 x  p x q 1 x , x = 0,1 / P
x=0
B( p ) ( x)  1

y su función de distribución asociada:


0, x 0
𝐹 𝑥 𝑃 𝑥 q, 0 𝑥 1
p q 1, x 1

representada como se refleja en la Figura 3.1.

Fx

0 1

Figura 3.1. Función de distribución de una variable Bernoulli

Además, la media y varianza son:


1
  E ( B( p))   xPX ( x)  1  p  0  (1  p)  p
x0

𝛼 𝐸 𝐵 𝑝 𝑥 𝑃 𝑥 1 ⋅𝑝 0 ⋅ 1 𝑝 𝑝 ∀𝑟 ∈ 𝑁

𝜎 𝑉 𝐵 𝑝 𝛼 𝜇 𝑝 𝑝 𝑝 1 𝑝 𝑝𝑞

3.3 DISTRIBUCIÓN BINOMIAL

Este modelo de distribución aparece como consecuencia de repetir independientemente pruebas de


tipo Bernoulli. Es decir, se repite un experimento aleatorio n veces de manera independiente unos de
otro y los resultados posibles de cada prueba son: éxito con probabilidad p ó, fracaso con probabilidad
q=1-p, de acuerdo al modelo Bernoulli.

Página 2 de 16
VARIABLES ALEATORIAS DISCRETAS

Entonces la Distribución Binomial, X=B(n, p), cuenta cuántos éxitos pueden ocurrir tras dichas
repeticiones y nos permite calcular, por ejemplo, cuál es la probabilidad de obtener k éxitos durante
las n repeticiones del experimento.

Muchos problemas prácticos responden a las hipótesis de este modelo. Sus áreas de aplicación incluyen
las inspecciones de calidad de productos (nº de productos defectuosos en un lote), las ventas diarias
(nº de artículos A vendidos en un supermercado), la medicina (nº de pacientes infectados por un virus),
sondeos de opinión (nº de partidarios de A en un sondeo), etc. Algunos otros ejemplos concretos:

 Nº de caras que se obtienen al lanzar 20 veces una moneda,


 Nº de piezas defectuosas encontradas en un lote de 25 piezas,
 Nº de votos a favor del candidato A en una ciudad.

Matemáticamente, la variable viene caracterizada por dos valores que la definen totalmente: el valor
n, que indica el número de veces que se repite el experimento dicotómico considerado y el valor p, que
da la probabilidad de que en cada repetición se logre el éxito (al igual que en el modelo Bernoulli). De
hecho, se puede constatar que:

𝐵 𝑛, 𝑝 𝐵 𝑝 ... .. 𝐵 𝑝 , B 𝑝 0,1

Ya que, si se repite n veces de forma independiente un experimento aleatorio en el que solamente


pueden ocurrir dos sucesos, A y A* con probabilidad p y q, respectivamente, al cabo de las n
repeticiones se puede contar cuántas veces ha ocurrido el éxito, porque con cada éxito se suma 1, y por
cada fracaso 0 (que son los valores otorgados a éxito y fracaso, respectivamente, e n el modelo
Bernoulli).

Esa misma situación e el cálculo de probabilidades nos lleva a que, si en n repeticiones se han obtenido
k éxitos, también se habrán logrado n-k fracasos: AA....AA*A*.....A*, y la probabilidad de este suceso
es p  p...p  (1  p)  (1  p)...(1  p)  p k  (1  p) n  k  p k  q n  k .
Dado que el orden en el que pueden aparecer estos k éxitos y n-k fracasos es indistinto, de acuerdo a
la Regla del Producto, la probabilidad anterior ha de multiplicarse por el número de órdenes distintos.
Este número es el número de permutaciones con repetición de n elementos cuando k elementos son
iguales y los n-k restantes también lo son:

 n
PR kn , n  k   
 k

Entonces, la variable Binomial puede tomar valores enteros desde 0 (0 éxitos) hasta n (n éxitos). Por
lo tanto, su función de masa es:

 n
PB( n ,p ) ( x)  P ( B( n, p )  x exitos)    p x  (1  p) n  x x = 0,1,2..., n
 x

Por ser la variable Binomial una distribución discreta, la función de distribución será escalonada, con
escalones en los números enteros x de 0 a n de tamaño P(B(n,p)=x). Así, la siguiente fórmula nos daría
el valor de la función de distribución para un valor de la variable x cualquiera:

Página 3 de 16
VARIABLES ALEATORIAS DISCRETAS

x x
 n
FB( n , p ) ( x)  P ( B( n , p)  x)   P( B( n, p)  i) 
i0
  i  p (1  p)
i0
i ni

Y la función de distribución completa quedaría de la siguiente manera


0, x<0
x
  n
FB( n ,p ) ( x)     p i q n  i , x = 0,..., n
 i=0  i 
1, xn

y las características más importantes son la media y la varianza:

n
n
   x   p x q n  x  E(B(p)  ..( n .  B(p))  p  ...  p  np
x 0 x

n
n
 2   ( x  ) 2  p x q n  x  E(B(n, p) 2 )   2
x 0 p
E(B(n, p) )  E((B(p)  ...  B(p)) 2 )  np  n (n  1)p 2
2

 2  E(B(n, p) 2 )   2  np  n (n  1)p 2  (np) 2  np(1  p)  npq

EJEMPLO: La probabilidad de que salga elegido un vecino candidato como presidentede una vecindad
es del 30%. Si en una casa hay 14 vecinos, ¿Cuál es la probabilidad de que al menos 5 de ellos voten
a dicho candidato? En total, ¿cuántos vecinos se espera que le voten?

X: “Número de votos a favor del candidato” : Distribución discreta Binomial B(n,p) donde n es el
número de veces que se repite el experimento aleatorio votar o no al candidato, 14, y p es la
probabilidad del éxito, en este caso, la probabilidad de que el voto sea a favor del candidato, 0,3. Por
lo tanto, X es B(14 ; 0.3).

a) La probabilidad de que sean al menos 5 los vecinos que voten a favor del candidato es:
 
14 10
b) P(B(14;0,3)  5)    (0.3) i (1  0.3)14i  0.416
i 5  i 

b) El número esperado de votantes al candidato es la esperanza de la variable aleatoria que representa


a este estudio:

c) E (B(14;0,3))  np  14  0.3  4.2 vecinos

3.3.1 PROPIEDAD ADITIVA DE LA DISTRIBUCIÓN BINOMIAL

La distribución Binomial B(n,p) es reproductiva respecto del parámetro p, es decir, la suma de m


variables aleatorias Binomiales de parámetros ni y p independientes, es otra variable aleatoria Binomial
de parámetro n la suma de las ni y de parámtero p el mismo:

Página 4 de 16
VARIABLES ALEATORIAS DISCRETAS

Sean X 1 ,..., X m / X i  B(n i , p) i = 1,..., m 


m m m

 X i  B(n i , p) B( n i , p)
i =1 i =1 i 1

PROBLEMAS

1. Aprende a utilizar la variable Binomial (con o sin tablas):


a. Calcular la probabilidad de que, en una familia con 6 hijos, al mensos 2 sean chicas.
(Sol. 0,8906)
b. Probabilidad de que en un lote de 8 unidades no se observe ningún defectuosos si el
proveedor dice que tiene una calidad del 95%. (Sol. 0,6634)
c. Si un jugador tiene una efectividad de tiros libres del 90% ¿cuál es la probabilidad de
que enceste al menos 7 tiros libres de los 9 intentos que hace? (Sol. 0,9470)

2. ¿Cuál es la probabilidad de sacar al menos un 6 en 4 tiradas consecutivas de un dado? (Sol.


0,51775)

3. El 30% de los elementos fabricados en una planta son defectuosos. Si un elemento es


defectuoso, la probabilidad de que un robot lo detecte y lo saque fuera de la línea de producción
es de 0,9. Si no es defectuoso, ésta probabilidad es de 0,2. Si un robot saca fuera 10 elementos
de la cadena de producción, ¿cuál es la probabilidad de que al menos 8 sean realmente
defectuosos? (Sol. 0,2804)

4. En una fábrica se fabrica cierto producto en dos máquinas: el 55% de producto se fabrica en la
línea 1 y el 45% restante en la máquina 2. Además, el producto puede tener dos tipos de
defectos de manera independiente: A y B. Se sabe que el 5% de los productos fabricados en la
máquina 1 tienen defecto tipo A y el 7,5% defecto tipo B. En la máquina 2, el 1% de los
productos tienen defecto tipo A y el 6,8% defecto tipo B. Si se eligen 20 unidades al azar, ¿qué
probabilidad existe de que ninguno tenga defecto? ¿y de que al menos 15 de los 20 no lo
tengan? (Sol. 0,11730; 0,9865)

3.4 DISTRIBUCIÓN HIPERGEOMÉTRICA

Considérese la siguiente situación: se supone un grupo de N elementos entre los cuales hay n1
elementos de clase A y n2=N- n1 de clase B. Se eligen aleatoriamente n elementos de entre los N, de
manera que elegido uno éste ya no puede volver a ser elegido (muestreo sin reemplazamiento). La
distribución hipergeométrica H(N; n1; n) cuenta el número de elementos del tipo A que se podrían
salir elegidos entre los n y, por tanto, se utiliza para calcular la probabilidad de que entre los n
elementos elegidos, x sean del tipo A.

El esquema de esta distribución es similar al de la distribución binomial, que cuenta el número de


sucesos de un determinado tipo de entre dos que pueden suceder, pero con la diferencia de que en el
caso binomial la probabilidad de obtener un “éxito” en cada repetición del experimento es siempre la

Página 5 de 16
VARIABLES ALEATORIAS DISCRETAS

misma y, sin embargo en el caso de la distribución hipergeométrica, la probabilidad de obtener un


objeto del tipo A (“éxito”) varía de una vez a otra ya que varia el nº total de objetos disponibles N al
no existir reemplazamiento.

Entonces la variable aleatoria X que cuenta el número de objetos de clase A obtenidos al elegir n
aleatoriamente y sin reposición entre los N disponibles tiene Distribución Hipergeométrica, X =
H(N; n1; n).

La función de masa de la variable da la probabilidad de que x sean del tipo A y n-x sean del tipo B.

La probabilidad de que ocurra el siguiente suceso AAA..( x .. BB...( n  x .. B , si no existe reposición, es:

𝑛 ! 𝑛 !
𝑛 𝑛 1 𝑛 𝑥 1 𝑛 𝑛 𝑛 𝑥 1 ⋅
𝑛 𝑥 ! 𝑛 𝑛 𝑥 !
⋅ ⋅. . .⋅ ⋅. . .⋅ ⋅. . .⋅
𝑁 𝑁 1 𝑁 𝑥 1 𝑁 𝑥 𝑁 𝑛 1 𝑁!
𝑁 𝑛 !

Teniendo en cuenta todas las ordenaciones posibles en las que puede aparecer x objetos del tipo A y
n-x del tipo B, la probabilidad es:

𝑛 ! 𝑛 ! 𝑛 ! 𝑛 !
⋅ ⋅
,
𝑛 𝑥 ! 𝑛 𝑛 𝑥 ! 𝑛! 𝑛 𝑥 ! 𝑛 𝑛 𝑥 !
𝑃 𝑋 𝑥 𝑃𝑅 ⋅ ⋅
𝑁! 𝑥! 𝑛 𝑥 ! 𝑁!
𝑁 𝑛 ! 𝑁 𝑛 !
𝑛 𝑛
𝑃 𝑋 𝑥 𝑃 𝐻 𝑁;𝑛 ;𝑛 𝑥 𝑥 𝑛 𝑥
𝑁
𝑛

máx 0; 𝑛 𝑛 𝑥 𝑚í𝑛 𝑛, 𝑛

Por tanto, los valores de la función de distribución para un valor concreto x se calcularía así:

 n1   N  n1 
   
i   n  i 
x
FH ( N ; n1 ) ( x)  P( H ( N; n 1 ; n)  x)  
i0  N
 
n 
Las probabilidades de esta distribución no se encuentran recogidas en ninguna tabla.

Debido a la complejidad formal de la distribución de la variable hipergeométrica, los cálculos


necesarios para conocer sus momentos resultan largos y tediosos. Por ejemplo, para determinar la
media de la distribución hipergeométrica debe calcularse la siguiente suma:

𝑛 𝑁 𝑛
𝑥 𝑛 𝑥
𝜇 𝑥⋅
𝑁
𝑛

Teniendo en cuenta que:

Página 6 de 16
VARIABLES ALEATORIAS DISCRETAS

𝑁 𝑁 𝑁 1
𝑛 𝑛 𝑛 1
Entonces,

𝑛 1 𝑁 𝑛 𝑛 1 𝑁 𝑛
𝑥 1 𝑛 𝑥 𝑛𝑛 𝑥 1 𝑛 𝑥
𝜇 𝑛
𝑁 𝑁 1 𝑁 𝑁 1

𝑛 𝑛 1 𝑛 1

Y llamando M=N–1, k=n1–1, m=n–1 y y=x–1, resulta que:

𝑘 𝑀 𝑘
𝑛𝑛 𝑦 𝑚 𝑦
𝜇
𝑁 𝑀
𝑚

La suma anterior es igual a 1, dado que es la suma de todas las probabilidades de una distribución
hipergeométrica con parámetros M, k y m. Por tanto la media de la distribución hipergeométrica H(N;
n1; n) es:
𝑛⋅𝑛
𝜇 𝐸 𝐻 𝑁;𝑛 ;𝑛
𝑁

Con un procedimiento análogo puede demostrarse que la varianza de la distribución hipergeométrica


H(N; n1; n) es:

𝑛⋅𝑛 ⋅ 𝑁 𝑛 𝑁 𝑛
𝜎 ⋅
𝑁 𝑁 1

Si se denota al cociente n1/N como p, proporción de los objetos tipo A, puede observarse que la media
de la distribución hipergeométrica coincide con la de la distribución binomial y la varianza de la
distribución hipergeométrica es menor que la correspondiente binomial, puesto que (N-n)/(N-1) es un
factor menor que 1, salvo que únicamente se observe un elemento, n=1.

Sin embargo, cuanto mayor es el valor de N, el número de elementos considerados, este factor va
acercándose a 1, dando como resultado una similitud en las varianzas de ambas distribuciones. Esto es
debido a que, de acuerdo a la definición de ambas, si n es sólo una pequeña fracción de un lote de gran
tamaño N, la distribución hipergeométrica tiende a la distribución binomial, ya que la probabilidad en
cada repetición de obtener un elemento del tipo A se mantiene prácticamente constante.

EJEMPLO: En un sorteo con 500 boletos se reparten 3 premios. Si una persona compra 20 boletos,
¿cuál es la probabilidad de que obtenga 2 premios?

X: “Nº de boletos con premio” = H(500; 3; 20)

Es decir, existen boletos de dos tipos, con y sin premio. Se eligen 20 boletos “sin reemplazamiento”,
la probabilidad de que se obtenga un premio varía a medida que se van vendiendo los boletos.

Por lo tanto,

Página 7 de 16
VARIABLES ALEATORIAS DISCRETAS

3 497

𝑃 𝐻 500 ; 3 ; 2 0 2 2 18 0,00446
500
20

PROBLEMAS ADICIONALES

5. De todas las reparaciones hechas en TV por cierta tienda, el 80% se hace en aparatos que ya
no tienen garantía.
a) Entre 20 aparatos llevados a reparación este último mes, ¿cuál es el número esperado
de los que ya no tienen garantía? (Sol. 16)
b) Entre estos 20 aparatos ¿cuál es la probabilidad de que por lo menos el 75% ya no
tenga garantía? (Sol. 0,8043)
c) Suponga que ahora mismo hay 12 TV en reparación, de los cuales 4 están con
garantía. ¿Cuál es la probabilidad de que, de 5 de estos TV elegidos aleatoriamente,
3 estén en garantía? (Sol. 0,1414)

6. Se recibe un pedido de cajas de 100 tornillos cada una. Para hacer el control de recepción se
escogen de cada caja, 10 tornillos al azar y la caja se acepta si a lo sumo se observan 2 tornillos
defectuosos.

a. Si la caja que va a ser examinada tiene 3 tornillos defectuosos ¿cuál es la probabilidad


de que sea aceptada? (0,9992)
b. Si la calidad del proveedor es de un 3% de defectuosos ¿qué porcentaje de cajas son
aceptadas por el cliente? (Sol. 0,9972)

7. En un sorteo de 1000 números hay algunos premios. Cuántos premios debe de haber si
queremos que la probabilidad de que a un individuo que compra 10 números le toque al menos
un premio, no sea mayor que 0,05 (Sol. Aprox. 5 premios)

Página 8 de 16
VARIABLES ALEATORIAS DISCRETAS

3.5 DISTRIBUCIÓN GEOMÉTRICA

Supóngase una vez más un fenómeno aleatorio dicotómico en el que sólo interesan dos sucesos
(modelo Bernoulli): el suceso A (éxito) con probabilidad p y su complementario A* con probabilidad
1-p = q. Si observamos la repetición de una secuencia de ensayos independientes de este fenómeno, la
probabilidad de obtener el éxito en cada ensayo se mantiene constante e igual a p.

La Distribución Geométrica, X = G(p), cuenta el número de fracasos que ocurren antes de que ocurra
el primer éxito en n repeticiones independientes del experimento, donde p es la probabilidad de obtener
el éxito (como en el modelo Bernoulli).

Es decir, el resultado de tal experimento será A*A*A* ... A*A y, por tanto, la función de masa asociada
a esta distribución se describe así:

𝑃 𝑋 𝑥 𝑃 𝐺 𝑝 𝑥 1 𝑝 𝑝 𝑞 𝑝, x 0,1,2,...

La función de distribución en cada valor de x se obtiene de la siguiente manera:

𝑞 𝑞 1 1 𝑞
𝐹 𝑥 𝑃 𝐺 𝑝 𝑥 𝑞𝑝 𝑝. 𝑝 1 𝑞 , q 1
𝑞 1 1 𝑞
La media y la varianza de la variable Geométrica se calculan de la siguiente manera. Así:

𝜇 𝑥 1 𝑝 𝑝 𝑝 𝑥𝑞

Llamando 𝑆 ∑ 𝑥𝑞

𝑆 𝑞 2𝑞 3𝑞 ⋯
𝑞𝑆 𝑞 2𝑞 3𝑞 ⋯
𝑞
𝑆 𝑞𝑆 𝑞 𝑞 𝑞 ⋯
1 𝑞

Luego, 𝑆 , entonces,
𝑞 𝑞
𝜇 𝑝 𝑥𝑞 𝑝
1 𝑞 𝑝

Siguiendo un proceso análogo con:

𝐸 𝐺 𝑝 𝑥 𝑝𝑞 𝑝 𝑥 𝑞 𝑝𝑆

Se puede comprobar que en este caso 𝑆 y, por tanto,

Página 9 de 16
VARIABLES ALEATORIAS DISCRETAS

𝑞 2𝑞
𝐸 𝐺 𝑝
𝑝 𝑝

𝑞 2𝑞 𝑞 𝑞 𝑞 𝑞
𝜎 𝐸 𝐺 𝑝 𝐸 𝐺 𝑝 1
𝑝 𝑝 𝑝 𝑝 𝑝 𝑝

EJEMPLO: ¿Cuál es la probabilidad de que, al lanzar varias veces un dado, salga el seis la séptima vez?

X: “Nº de fracasos (valor del dado distinto de seis) antes de obtener el éxito (el seis)”

Como p=P(“salga el seis”)=1/6, X=G(1/6). Por lo tanto,

5 1
𝑃 𝑋 6 𝑃 𝐺 1/6 6 0,0558
6 6

3.6 DISTRIBUCIÓN BINOMIAL NEGATIVA

Siguiendo con la misma terminología para fenómenos aleatorios dicotómicos de éxito-fracaso donde
la probabilidad de éxito es p, la Distribución Binomial Negativa, BN(p,k), cuenta el número de
fracasos que ocurren antes de que ocurra el k-ésimo éxito y por tanto permite calcular la probabilidad
de que se produzcan, tras varias repeticiones independientes del experimento, x fracasos antes del k-
ésimo éxito.

Para el cálculo de su función de masa se puede razonar de la siguiente manera: si se desea calcular la
probabilidad de que tras (k+x) repeticiones del experimento el último suceso haya sido el k-ésimo
éxito, antes han debido ocurrir x fracasos y k-1 éxitos. Así, uno de los posibles resultados es
𝐴𝐴. . . . . 𝐴𝐴∗ 𝐴∗ . . . . . . 𝐴∗ 𝐴, cuya probabilidad es 𝑝𝑝. . . . . . . 𝑝𝑞𝑞. . . . . . 𝑞𝑝 𝑝 𝑞 . Teniendo
en cuenta las distintas maneras en las que pueden observarse x fracasos y k-1 éxitos, la probabilidad
de que en el experimento hayan sucedido x fracasos antes del k-ésimo éxito es:

, 𝑘 𝑥 1
𝑃 , 𝑥 𝑃 𝐵𝑁 𝑝, 𝑘 𝑥 𝑃𝑅 ⋅𝑝 ⋅𝑞 𝑝 𝑞 ,
𝑘 1
𝑥 0,1,2, . . . 𝑘 1,2, . . ..

La función de distribución para cada valor de x se calcularía así,

𝑘 𝑖 1 !
𝐹 , 𝑥 𝑃 𝐵𝑁 𝑝, 𝑘 𝑖 𝑞𝑝
𝑖! 𝑘 1 !

Existe también relación entre la distribución binomial negativa y la distribución geométrica: puede
demostrarse que, si X es una variable aleatoria binomial negativa de parámetro p, entonces:

Página 10 de 16
VARIABLES ALEATORIAS DISCRETAS

𝑋 𝑌

donde Y es una distribución geométrica de parámetro p (ya que cada variable geométrica estaría
contando el número de fracasos que ocurren hasta que ocurra un éxito). Luego, la media y la varianza
de la distribución pueden determinarse utilizando las propiedades de media y varianza a partir del
sumatorio anterior (más sencillo de calcular), o como habitualmente a partir de la función de masa
dada:

𝑘 𝑥 1 𝑞
𝜇 𝑥 𝑝 𝑞 𝑘⋅
𝑘 1 𝑝


𝑘 𝑥 1 𝑞
𝜎 𝑥 𝑝 𝑞 𝜇 𝑘⋅
𝑘 1 𝑝

EJEMPLO: ¿Cuál es la probabilidad de que al lanzar un dado siete veces, el séptimo lanzamiento salga
el seis por tercera vez?

X: “Nº de fracasos (valores distintos de seis) antes del tercer éxito (el seis)”: BN(p=1/6, k=3)

4 3 1
𝑃 𝐵𝑁 1/6, 3 4 5/6 1/6 0,0335
3 1

PROBLEMAS

8. En un campeonato de baloncesto, el vencedor para pasar de ronda es el que logra antes la 4ª


victoria. ¿Cuál es la probabilidad de que un equipo, con un 60% de triunfos, tenga que disfrutar
como mucho 6 partidos para pasar a la siguiente ronda? (Sol. 0,5443)

9. Para ganar un oso de peluche en una feria tenemos que acertar 3 dianas. Si la probabilidad de
acertar de un individuo cada vez que tira es de 0,6 ¿cuál es la probabilidad de obtener el premio
en el 5º intento? Y si cada jugada (tiro) vale 50 céntimos, ¿cuánto esperamos gastarnos hasta
obtener el premio? ¿cuál es la varianza de este gasto? (Sol. 0,20736; 2,5€; 0,83€2)

10. La Dirección General de Tráfico (DGT) quiere poner en funcionamiento un sistema de


penalización por cada infracción de tráfico, que puede conducir a la pérdida del permiso de
conducir. Supongamos que se estima que un conductor es denunciado una de cada diez
infracciones que comete y que esta proporción se mantiene constante a lo largo del tiempo. Si
la cuarta denuncia ya supone la pérdida del carné, ¿cuál es el número esperado de infracciones
necesarias para la pérdida dl carné? ¿Y la varianza? (40; 360)

11. Un departamento de control de calidad inspecciona las unidades terminadas que provienen de
dos líneas de ensamble. La proporción de unidades defectuosas de la línea 1 es del 6% mientras
que la de la línea 2 es de un 4%. ¿Cuál es la probabilidad de que se esté inspeccionando las
piezas de la línea 1 si tras 20 unidades inspeccionadas acaba de aparecer la segunda defectuosa?
(Sol. 0,6012)

Página 11 de 16
VARIABLES ALEATORIAS DISCRETAS

12. Un tirador tiene que pasar una prueba para ser reconocido como “tirador de élite”. La prueba
consiste en tirar una ronda de 6 disparos a una diana y gana la ronda si da en el centro al menos
5 de las 6 veces que tira. Se reconocerá a un tirador como “tirador de élite” si es capaz de repetir
esta hazaña 3 veces seguidas. Si la probabilidad de un tirador de hacer diana es de 0,8, ¿cuál es
la probabilidad que tiene de ganar una ronda? ¿y de que necesite como mucho 6 rondas para
conseguir ser nombrado “tirador de élite”? (Sol. 0,6554; 0,5750)

Página 12 de 16
VARIABLES ALEATORIAS DISCRETAS

3.7 DISTRIBUCIÓN POISSON

Existen sucesos que no ocurren como resultado de un número de pruebas de un experimento (como
pueden ser todos los anteriormente expuestos), sino que ocurren aleatoriamente y de forma
independiente en el tiempo o en el espacio. Algunos ejemplos claros de estos fenómenos son el número
de personas que llegan a la parada de un autobús en un cierto periodo de tiempo, el número de
accidentes que ocurren en un día, el número de fallos que se encuentran en metros de tela producidos,
etc. La distribución de Poisson permite estudiar estos fenómenos.

Teóricamente una variable aleatoria Poisson puede tomar cualquier valor natural, aunque la
probabilidad de que esta variable tome valores muy altos decrece muy rápidamente y, en muy pocos
valores se acumula la mayoría de la probabilidad. Como consecuencia de esta propiedad la
probabilidad de que esta variable tome un valor relativamente alto es despreciable y esto indica que es
muy poco probable que el número de sucesos que puedan ocurrir en un periodo de tiempo o de espacio
sea muy grande. Por eso a esta distribución se le conoce también como la distribución de los “sucesos
raros”.

Matemáticamente, se dice que X es una Distribución Poisson de parámetro , X=P(), a la variable


que representa la ocurrencia de sucesos de manera independiente en el tiempo o en el espacio. El
parámetro , representa el número medio de sucesos por la unidad de tiempo o de espacio fijada
(también se le suele llamar tasa de ocurrencias de sucesos).

Es por todo esto que se dice que para que un fenómeno aleatorio siga un modelo Poisson tiene cumplir
las siguientes tres características:
1. Los sucesos deben ocurrir de manera independiente por unidad de tiempo o espacio.
2. También debe ser independiente el número de sucesos que ocurren respecto de la unidad de
tiempo o espacio que está siendo evaluada.
3. Debe de ser despreciable la probabilidad de que ocurran un número alto de sucesos en una
unidad de tiempo o espacio pequeña.

Fijarse que, con estas características, sería cuestionable, por ejemplo, que el número de llamadas que
llegan a la hora a una centralita de emergencias tras un incidente grave sea modelizado por una variable
Poisson.

Por otro lado, la distribución Poisson aparece, habitualmente, en el estudio de la Teoría de Colas, teoría
que estudia y modeliza algunas situaciones en las que se producen llegadas a un punto de servicio y
van formando cola cumpliendo estas características:

 Número de personas que llegan a un cajero de un banco, a la caja de un supermercado, al surtidor


de una gasolinera,…
 Número de llamadas recogidas en una centralita de teléfonos en un espacio de tiempo determinado,
etc.

La probabilidad de que ocurran x sucesos aleatorios independientes en la unidad de tiempo o de espacio


fijada, se puede calcular a través de la función de masa de la distribución de Poisson, como sigue:

e   x
P ( X  P(  )  x)  p x  , x = 0,1,...  N  0
x!

Página 13 de 16
VARIABLES ALEATORIAS DISCRETAS

La función de distribución de esta variable discreta es una función escalonada con escalones en los
números naturales N de altura px. A medida que x aumenta, px va tendiendo a cero:

x
e   i
FP (  ) ( x)  P( P()  x)  
i 0 i!

Las probabilidades de la distribución Poisson se encuentran tabuladas en la Tabla B del documento


Tablas Estadísticas.

Teniendo en cuenta el desarrollo de Taylor-Mc.Laurin de la función exponencial, donde ∑ 𝑒 ,


!
entonces la media y la varianza se resuelven como sigue:
∞ ∞
𝑒 𝜆 𝜆
𝜇 𝑖 𝑒 𝜆 𝑒 𝜆𝑒 𝜆
𝑖! 𝑖 1 !

e   i 
i 1 
i 1
E ( P(  ) 2 )   i 2  e    i e     (i  1)  1 
i0 i! i 1 0 ( i  1)! i 1 0 (i  1)!

i  2 
i 1
= e      e    i e   2 e    e   e    2  
i  2  0 ( i  2)! i 1 0 ( i  1)!
Luego,

𝜎 𝐸 𝑃 𝜆 𝐸 𝑃 𝜆 𝜆 𝜆 𝜆 𝜆

La distribución Poisson se caracteriza, por tanto, por tener el mismo valor numérico para la media que
para la varianza, ambos vale .

En su origen Poisson determinó esta distribución de probabilidad discretizando la unidad de tiempo o


espacio considerada y tendiendo al límite una distribución Binomial B(n,p) en el caso de que n y
p a cero. De ahí, que otra aplicación muy importante de la distribución Poisson sea la de aproximar la
función de probabilidad Binomial en determinadas condiciones.

3.7.1 DISTRIBUCIÓN POISSON COMO LÍMITE DE UNA DISTRIBUCIÓN BINOMIAL

Basta comprobar que, en el límite, la distribución de una variable Binomial coincide con la distribución
de una variable Poisson. Esto puede hacerse a través de cualquiera de las formas en que una variable
queda representada, en concreto, puede hacerse a través de la función característica comprobando que

lim 𝑃𝐵 𝑛,𝑝 𝑃𝑃

Entonces, tomando  = np,


𝑥 𝑛 𝑥
𝑛! 𝑛 𝑥 𝑛! 𝜆 𝜆
𝑃𝐵 𝑛,𝑝 𝑝𝑥 1 𝑝 1
𝑥! 𝑛 𝑥 ! 𝑥! 𝑛 𝑥 ! 𝑛 𝑛

x
Dado que lim(1  ) n  e x , se puede observar que:
n n

Página 14 de 16
VARIABLES ALEATORIAS DISCRETAS

𝜆
lim 𝑃𝐵 𝑛,𝑝 𝑒 𝑃𝑃
𝑥!

La aproximación de la distribución Binomial a partir de la distribución Poisson es tanto mejor cuanto


mayor es n y p es menor, de manera que  tenga un valor moderado.

Como referencia, cuando p<0,1 y =np<5 las probabilidades binomiales calculadas a través de su
aproximación de Poisson, no constituyen un error muy relevante. Luego, esto es lo que es lo que se
toma por convenio, lo cual significa a efectos prácticos que podríamos utilizar la función de masa de
una variable Poisson para resolver probabilidades de una variable Binomial utilizando =np (los
cálculos con Poisson resultan más rápidos)

3.7.2 PROPIEDAD ADITIVA DE LA DISTRIBUCIÓN POISSON

La distribución Poisson P() es reproductiva respecto del parámetro , es decir, la suma de m variables
aleatorias Poisson independientes de parámetros i, es otra variable aleatoria Poisson de parámetro 
la suma de las i:

Sean 𝑋 , . . . , 𝑋 /X 𝑃 𝜆 i 1,...,m ⇒ 𝑋 𝑃 𝜆 𝑃 𝜆
i 1 i 1

La demostración de esta propiedad se resuelve fácilmente a partir de una distribución de probabilidad


no dada en este curso (la función característica) por lo que esta propiedad no será demostrada.

EJEMPLO 1: El número de llamadas medio que se reciben en una centralita de teléfonos es de 2


llamadas al minuto. Determinar la probabilidad de que se reciban más de 5 llamadas en un minuto.

X: “Nº de llamadas por minuto” = P(=2).


El nº medio de llamadas por minuto es 2: E(P(2))= =2. Por lo tanto,

P(" Ocurran mas de 5 llamadas en un minuto") = P(P(2) > 5) =


5
i
= 1- P(P(2)  5) = 1-  e 2
 1  0,9834  0,0166
i=0 i!

EJEMPLO 2: Una fábrica produce un cierto tipo de fusibles mediante un proceso automático. Se conoce
por experiencias pasadas que un 3% de los fusibles son defectuosos. Si un electricista compra 100
fusibles en dicha fábrica, determinar la probabilidad de que el electricista tenga exactamente dos
fusibles defectuosos.

Dos sucesos posibles: el fusible funciona o no.


X es el “Nº de fusibles defectuosos” = B(n,p) donde:

 n= 100 repeticiones del experimento (mirar por cada fusible si es defectuoso o no)
 p=0.03 (probabilidad de un “éxito”, de que un fusible sea defectuoso)

Por tanto,

Página 15 de 16
VARIABLES ALEATORIAS DISCRETAS

100 3
𝑃 𝐵 100 ; 0 , 03 2 0,03 1 0,03 ≅𝑃 𝑃 𝜆 3 2 𝑒
2 2!
donde 𝜆 np 100 ⋅ 0,03 3 5 y p 0,03 0,1

PROBLEMAS

13. Para aprender a utilizar la variable Poisson (tabla o calculadora):


En una fábrica el número de ausencias o bajas por semana sigue una distribución Poisson, a
razón de 2 bajas por semana (media). Calcular:
a) Porcentaje de semanas en las que se produce alguna baja (Sol. 86,5%)
b) Probabilidad de que se produzcan 4 bajas en el trascurso de 2 semanas (Sol. 0,1954)
c) Si nos dicen que en lo que va de semana ya ha ocurrido alguna baja, calcular la probabilidad
de que al término de la semana no se hayan producido más de 3. (Sol. 0,8348)

14. Los trabajos que realiza un ordenador se ejecutan en orden de llegada con una tasa de ejecución
de 2 trabajos por microsegundo. ¿Cuál es la probabilidad de que en 10 microsegundos
inspeccionados al azar del tiempo de ejecución del ordenador en al menos la mitad de ellos se
hayan ejecutado 2 trabajos? ¿Y de que en menos de 3 se haya ejecutado como mucho 2? (Sol.
0,1037; 0,0027)

15. La probabilidad de que un antibiótico produzca reacción alérgica es de 0,005. En un laboratorio


se experimentan 100 variantes de este antibiótico de manera que su uso se considera adecuado
para las personas cuando experimentado sobre 500 ratones no produce reacción alérgica sobre
ninguno de ellos. En estas condiciones, ¿cuál es la probabilidad de que, de 100 variantes en
investigación, 10 sean adecuadas para el uso humano? (Sol. 0,1064)

16. El número medio de coches que entran por un túnel es de 1 coche cada 2 minutos. Si un número
excesivo de coches entrara en el túnel en un corto espacio de tiempo, se produciría una situación
peligrosa. Si se observa el túnel durante 10 intervalos de tiempo distintos de 2 minutos, ¿cuál
es la probabilidad de que al menos durante uno de esos intervalos haya entrado más de 3
coches? (Sol. 0,17455)

Página 16 de 16

También podría gustarte