Está en la página 1de 12

Estadística Descriptiva 2021 01 180

Distribuciones de probabilidad “especiales” de variable discreta


(Binomial, Hipergeométrica y Poisson)

Distribución binomial
Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija antes de realizar
el experimento.
• Las pruebas son idénticas y cada una de ellas puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
• Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
• La probabilidad de éxito es constante de una prueba a otra y la denotamos como p.

Entonces para n intentos y la probabilidad p de éxito en cualquier intento, la probabilidad de tener x


éxitos en los n intentos está dada por:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0,1,2, ⋯ , 𝑛

La variable binomial cuenta el número de éxitos en n repeticiones semejantes e independientes con


probabilidad de éxito constante.

La variable aleatoria X sigue una distribución binomial con parámetros n y p, se denota:

𝑋~𝐵(𝑛, 𝑝)
Ejemplo 46

Media
 = 𝐸(𝑋) = 𝑛𝑝
Varianza
2 = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)

Para el cálculo de probabilidades de una distribución binomial en Excel se usa la función:


=DISTR.BINOM.N(x; n = número de repeticiones; p = probabilidad de éxito; acumulado = 1)
Estadística Descriptiva 2021 01 181
Ejemplo 47
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por
investigaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.

Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal estado es
mayor al 3%, ¿qué decisión se debe tomar?

Solución
Interpretación
Determinar si se rechazará los 60 productos.

Representación
Definamos la variable necesaria para resolver el problema:

𝑋: = número de envases en mal estado.

La variable X se tiene una distribución binomial con parámetros:

𝑛: = número de ensayos = 60
p:= probabilidad de éxito = 0,01

El rango de X es 0, 1, 2,…, 60.

Entonces:
𝑋 𝐵(𝑛 = 60; 𝑝 = 0,01)

Cálculo
La probabilidad pedida es:

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − (𝑓(0) + 𝑓(1) + 𝑓(2))

= 1 − 𝐶060 0,010 0,9960 + 𝐶160 0,011 0,9959 +𝐶260 0,012 0,9958

𝑃(𝑋 > 2) = 0,0224


Análisis
La probabilidad de seleccionar más de dos envases en mal estado es 0,0224.

Argumentación
Como la probabilidad pedida es menor al 3% (0,0224 < 0,03), entonces los 60 productos no serán
rechazados.
Estadística Descriptiva 2021 01 182
Ejemplo 48
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de
los usuarios hombres han sufrido de algún tipo de robo durante el uso del Metropolitano. Si el sistema
tiene 560 mil usuarios, calcule el número esperado de usuarios que han sido víctimas de robo durante
el uso del Metropolitano.

Solución
Interpretación

Representación
Sean los eventos:
R:= Que el usuario sea víctima de robo
H:= Que el usuario sea hombre
M:= Que el usuario sea mujer

Usaremos la distribución binomial y el teorema de la probabilidad total.

Cálculo
Usando el teorema de la probabilidad total tenemos que:
𝑃(𝑅⁄𝐻) = 0,008
𝑃(𝐻) = 0,55
𝑃(𝑅𝑐⁄𝐻) = 0,992

𝑃(𝑅⁄𝑀) = 0,01
𝑃(𝑀) = 0,45
𝑃(𝑅𝑐⁄𝑀) = 0,99

𝑃(𝑅) = 𝑃(𝐻) 𝑃(𝑅⁄𝐻) + 𝑃(𝑀) 𝑃(𝑅⁄𝑀)

𝑃(𝑅) = 0,55 × 0,008 + 0,45 × 0,01

= 0,0044 + 0,0045 = 0,0089

Sea la variable aleatoria 𝑌: = número de usuarios que han sido víctima de robo

𝑌~𝐵 (𝑛 = 560 000; 𝑝 = 0,0089)

𝐸(𝑌) = 𝑛𝑝 = 560000 × 0,0089

El número esperado de usuarios que han sido víctima de robo es 4 984 usuarios.
Estadística Descriptiva 2021 01 183
Ejemplo 49
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al azar
80 usuarios.

a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560mil
usuarios. Calcule el valor esperado y varianza de Y.

Solución

a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.

Solución

Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra

𝑋~𝐵(𝑛 = 80; 𝑝 = 0,12)

El rango de 𝑋 es 𝑅 = {0,1, … ,80}

La probabilidad pedida es:

𝑃(8 ≤ 𝑋 ≤ 9) = 𝑓(8) + 𝑓(9) = 0,2623

En Excel, se usa la función =DISTR.BINOM.N(8;80;0.12;0)+DISTR.BINOM.N(9;80;0.12;0)

b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560 mil
usuarios. Calcule el valor esperado y varianza de Y.

Solución

Sea 𝑌: = número de usuarios que realizan conexiones de los 560mil usuarios

𝑌~𝐵(𝑛 = 560000; 𝑝 = 0,12)

El valor esperado y varianza de 𝑌 es:

𝐸(𝑌) = 𝑛𝑝 = 560 000 × 0,12 = 67000

𝑉(𝑌) = 𝑛𝑝(1 − 𝑝) = 560 000 × 0,12 × (1 − 0,12) = 59136


Estadística Descriptiva 2021 01 184
Ejercicios

130. Según el analista Rodrigo Parra, en el Perú, el 15 de marzo del 2021, el porcentaje de positividad
de pruebas moleculares fue de 22%, es decir, el 22% de las pruebas moleculares de detección del
COVID 19 hechas ese día dieron un resultado positivo. Asuma independencia entre las pruebas.

a. Si a un grupo de 40 peruanos se les realiza pruebas moleculares ese día, calcule la probabilidad de
que diez den un resultado positivo a la prueba del COVID 19.
b. Si a un grupo de 40 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad de que
haya al menos ocho den positivo a la prueba del COVID 19.
c. Si en un grupo de 40 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad de
que haya entre ocho y catorce den positivo a la prueba del COVID 19.
d. Si a 44800 peruanos se realizan pruebas moleculares ese día, calcule el valor esperado del número
de peruanos que den positivo a la prueba del COVID 19.

Solución
Éxito: El resultado fue positivo / Fracaso: El resultado no fue positivo P(Éxito)=0,22 P(Fracaso)=0,78
La variable en estudio 𝑋 es número de peruanos con resultado positivo de la prueba molecular en
una muestra de tamaño 40 (número de éxitos en una muestra de tamaño n)
El rango o recorrido de la variable 𝑋 es Rx={0, 1, 2, …, 40}
La distribución de la variable es Binomial

Características de la distribución binomial:


o Cada prueba o ensayo tiene dos resultados posibles (éxito y fracaso)
o La probabilidad de éxito se mantiene constante de una prueba a otra. Y cada prueba es
independiente.
o Se conoce los parámetros: “p” probabilidad de éxito y “n” tamaño de la muestra”

Sus parámetros son p=0,22 n=40

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0,1,2, ⋯ , 𝑛

a. Si a un grupo de 40 peruanos se les realiza pruebas moleculares ese día, calcule la probabilidad de
que diez den un resultado positivo a la prueba del COVID 19.
Solución
La probabilidad pedida es:
40
𝑃(𝑋 =10) = 𝑓(10)= 𝐶10 0,2210 (0,78)30 = 40𝐶10 ∗ 0,2210 ∗ 0,7830 = 0,1304
0.1304
Estadística Descriptiva 2021 01 185

b. Si a un grupo de 40 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad de que
al menos ocho den positivo a la prueba del COVID 19.
Solución
La probabilidad pedida es:
𝑃(𝑋≥8)= 𝑓(8)+ 𝑓(9)+… + 𝑓(40)

La probabilidad pedida es:

40

𝑃(𝑋 ≥ 8) = ∑ 𝐶𝑥40 0,22𝑥 (1 − 0,22)40−𝑥


𝑥=8

𝑃(𝑋 ≥ 8) = 0,679946

En Excel, se usa la función =1-DISTR.BINOM.N(7;40;0.22;1) = 0,679946.

c. Si en un grupo de 40 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad de


que haya entre ocho y catorce den positivo a la prueba del COVID 19.

Solución

La probabilidad pedida es:

14

𝑃(8 ≤ 𝑋 ≤ 14) = ∑ 𝐶𝑥40 0,22𝑥 (1 − 0,22)40−𝑥


𝑥=8

𝑃(8 ≤ 𝑋 ≤ 14) == 0,661075

En Excel, se usa la función =DISTR.BINOM.N(14;40;0.22;1)-DISTR.BINOM.N(7;40;0.22;1)


= 0,661075

d. Si a 44800 peruanos se realizan pruebas moleculares ese día, calcule el valor esperado del
número de peruanos que den positivo a la prueba del COVID 19.

Solución

El valor esperado es:

𝐸(𝑋) = 𝑛𝑝 = 44800 × 0,22 = 9856

131. Una compañía de comida rápida sabe que el 90% de sus tiendas por franquicia tendrán éxito
comercial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas.
Calcule la probabilidad de que al menos dieciocho tiendas tengan éxito, si la compañía va a instalar
20 tiendas en el presente año. Rpta: 0, 6769

Sea 𝑋 ∶= número de tiendas por franquicia tendrán éxito comercial

El rango o recorrido de la variable 𝑋 es {0, 1, 2, ⋯, 20}

La distribución de la variable es binomial, pues cumple las condiciones de un proceso binomial.

Sus parámetros son 𝑛 = 20 y 𝑝 = 0,90.


Estadística Descriptiva 2021 01 186
𝑋~𝐵(𝑛 = 20; 𝑝 = 0,90)

La probabilidad pedida es:

20

𝑃(𝑋 ≥ 18) = ∑ 𝐶𝑥20 0,90𝑥 (1 − 0,90)20−𝑥 = 0,676927


𝑥=18

En Excel, se usa la función =1-DISTR.BINOM.N(17;20;0.9;1) = 0,676927

132. Según la Asociación para el Fomento de la Infraestructura Nacional el 48% de los hogares de Lima
no tienen acceso a agua potable de calidad, por no contar con la dosificación adecuada de cloro o
comprarla de manera informal a los camiones cisterna. Si se eligen al azar a diez hogares de Lima,
calcule la probabilidad de que cinco de ellos no tengan acceso agua potable de calidad.
Rpta: 0,2441

Sea 𝑋 ∶= número de hogares de Lima que no tengan acceso agua potable de calidad

El rango o recorrido de la variable 𝑋 es {0, 1, 2, ⋯, 10}

La distribución de la variable es binomial, pues cumple las condiciones de un proceso binomial.

Sus parámetros son 𝑛 = 10 y 𝑝 = 0,48.

𝑋~𝐵(𝑛 = 10; 𝑝 = 0,48)


La probabilidad pedida es:

𝑃(𝑋 = 5) = 𝐶510 0,485 (1 − 0,48)10−5 = 0,244131

En Excel, se usa la función =DISTR.BINOM.N(5;10;0.48;0) = 0,244131.


Estadística Descriptiva 2021 01 187

Distribución hipergeométrica
Consideremos N elementos, de los cuales r son considerados éxitos y por lo tanto N - r como fracasos.
Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de obtener
x éxitos en una muestra de n elementos.

El experimento hipergeométrico consiste en extraer al azar y sin sustitución n elementos de un


conjunto de N elementos, r de los cuales son éxitos y N - r son fracasos.

La probabilidad de obtener de x éxitos en la muestra de n elementos es:

𝐶𝑥𝑟 𝐶𝑛−𝑥
𝑁−𝑟
𝑓(𝑥) = 𝑥 = 𝑚á𝑥{0, 𝑛 − (𝑁 − 𝑟)}, … , 𝑚í𝑛{𝑛, 𝑟}
𝐶𝑛𝑁

El rango de X en la mayoría de los casos va de 0 a n, pero no siempre, por lo que se debe analizar en
cada caso.

La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño n, tomada de una
vez de una población de tamaño N donde hay r éxitos.

Se dice que la variable aleatoria X sigue una distribución hipergeométrica con parámetros n, r y N y se
denota:
𝑋~𝐻(𝑛, 𝑟, 𝑁)

Media 𝑟
𝜇 = 𝐸(𝑋) = 𝑛
𝑁
Varianza

𝑟 𝑟 𝑁−𝑛
𝜎2 = 𝑛 (1 − ) ( )
𝑁 𝑁 𝑁−1

Para el cálculo de probabilidades de una distribución hipergeométrica en Excel se usa la función:


=DISTR.HIPERGEOM.N(x; n = tamaño de muestra; r = número de éxitos en población; N = tamaño de
la población; acumulado = 0)
Estadística Descriptiva 2021 01 188
Ejemplo 50
Luego de embalar un contenedor de envases de productos de Expórtame, se tienen 60 envases, de los
cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases para el control de calidad.

e. Calcule la probabilidad de que ocho envases sean de frasco.


f. Calcule la variabilidad relativa de X respecto a la media.

Solución

a. Calcule la probabilidad de que ocho envases sean de frasco.

Representación
Definamos la variable X:= número de envases de frasco seleccionados.

La variable X se tiene una distribución hipergeométrica con parámetros:


N= 60 tamaño de la población
r = 25 número de éxitos en la población
n = 20 tamaño de la muestra.

El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 20.

Entonces,
𝑋~𝐻(𝑁 = 60; 𝑟 = 25; 𝑛 = 20)

𝑅= = {0, 1, … ,20}

Cálculo
La probabilidad pedida es:

𝐶825 × 𝐶12
35
𝑃(𝑋 = 8) = 60 = 0,2153
𝐶20

b. Calcule la variabilidad relativa de X respecto a la media.

Solución
Lo que nos piden es calcular el coeficiente de variación de X.

Primero, hallemos el esperado y la varianza de X.

𝑟 25
𝜇 = 𝐸(𝑋) = 𝑛 = 20 = 8,333
𝑁 60

𝑟 𝑟 𝑁−𝑛
𝑉(𝑋) = 𝑛 (1 − ) ( )
𝑁 𝑁 𝑁−1
Estadística Descriptiva 2021 01 189

25 25 60 − 25
= 20 (1 − ) ( ) = 2,8337
60 60 60 − 1

El coeficiente de variación de 𝑋 es:

√𝑉(𝑋)
𝐶𝑉(𝑋) = × 100%
𝐸(𝑋)

√2,8337
= × 100% = 21,79%
8,3333

Ejemplo 51
La actriz Magaly Solier es la décima séptima mujer en denunciar una agresión sexual en un bus del
Metropolitano, desde noviembre del 2012. De las 17 denuncias, solo una está cerca de recibir
sentencia. El agresor podría recibir de dos a cuatro años de prisión suspendida, cumplir trabajos
comunitarios o pagar reparación civil. Si se eligen al azar tres de las denuncias de las 17 existentes.
Calcule la probabilidad de elegir el caso que está cerca de recibir sentencia.

Solución

Sea X:= número de casos que están cerca de recibir sentencia

𝑋~𝐻(𝑁 = 17; 𝑛 = 3; 𝑟 = 1)

𝑅𝑋 = {0, 1}

𝑃(𝑋 = 1) = 𝑓(1) = 0,1765


Estadística Descriptiva 2021 01 190
Ejercicios

133. En un vuelo se van a servir 150 comidas. La oficina de control de calidad de los alimentos
durante el vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado. Dentro de
las 150 comidas, hay cuatro que no están en perfecto estado. Si se encuentre más de una comida
que no esté en perfecto estado; se cambiará de proveedor. Calcule la probabilidad de que se
cambie de proveedor.

Solución

La variable en estudio 𝑋 es número de comidas que no están en perfecto estado en la muestra.

El rango o recorrido de la variable X es 𝑅𝑋 = {0, 1, 2, 3, 4}.

La distribución de la variable es hipergeométrica, sus parámetros son 𝑁 = 150, 𝑛 = 5 y 𝑟 = 4.

La probabilidad pedida es∶

𝑃(𝑋 > 1) = 𝑓(2) + 𝑓(3) + 𝑓(4)

𝐶24 × 𝐶2146 𝐶34 × 𝐶1146 𝐶44 × 𝐶0146


= + + = 0,005225
𝐶4150 𝐶4150 𝐶4150

En Excel, se puede usa la función =1-DISTR.HIPERGEOM.N(1;5;4;150;1)

134. Un grupo de 25 amigos van a una discoteca, pero tres de ellos no tienen la edad permitida para
ingresar. Si la persona encargada en la puerta pedirá cuatro identificaciones al azar. Si a alguno de
los menores de edad se le pide la identificación, nadie en el grupo entrará a la discoteca. Calcule la
probabilidad de que todos entren a la discoteca.

La variable en estudio X es número de menores de edad en la muestra.

El rango o recorrido de la variable X es 𝑅𝑋 = {0, 1, 2, 3}.

La distribución de la variable es hipergeométrica, sus parámetros son 𝑁 = 25, 𝑛 = 4 y 𝑟 = 3.

La probabilidad pedida es:

𝐶03 × 𝐶422
𝑃(𝑋 = 0) = 𝑓(0) = = 0,578261
𝐶425

En Excel, se puede usa la función =DISTR.HIPERGEOM.N(0;4;3;25;0)

135. La empresa San Fernando ha lanzado su campaña “Plato calato no”. Si de un total de 60 personas,
donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.
Rpta: 0,9402
La variable en estudio 𝑋 es número de personas que recuerden la campaña.

El rango o recorrido de la variable X es:


𝑅𝑋 = {0, 1, 2, 3, … , 8}

La distribución de la variable es hipergeométrica, sus parámetros son 𝑁 = 60, 𝑛 = 8 y 𝑟 = 34.


Estadística Descriptiva 2021 01 191
La probabilidad pedida es∶

𝑃(𝑋 ≥ 3) = 𝑓(3) + 𝑓(4) + ⋯ + 𝑓(8)

𝐶334 × 𝐶526 𝐶434 × 𝐶426 𝐶834 × 𝐶026


= + + ⋯ +
𝐶860 𝐶860 𝐶860

𝑃(𝑋 ≥ 3) = 0,940168

En Excel, se puede usa la función =1-DISTR.HIPERGEOM.N(2;8;34;60;1) = 0,940168

136. En una distribuidora hay 25 televisores de los cuales seis son de tecnología OLED. Si se seleccionan
al azar diez televisores, calcule la probabilidad de que se haya seleccionado por lo menos dos
televisores de tecnología OLED. Rpta: 0,8022

La variable en estudio 𝑋 es número de televisores de tecnología OLED.

El rango o recorrido de la variable X es:


𝑅𝑋 = {0, 1, 2, 3, … , 6}

La distribución de la variable es hipergeométrica, sus parámetros son 𝑁 = 25, 𝑛 = 10 y 𝑟 = 6.

La probabilidad pedida es∶

𝑃(𝑋 ≥ 2) = 𝑓(2) + 𝑓(3) + ⋯ + 𝑓(6)

𝐶26 × 𝐶819 𝐶36 × 𝐶719 𝐶66 × 𝐶419


= 25 + 25 + ⋯ + 25
𝐶10 𝐶10 𝐶10

𝑃(𝑋 ≥ 2) = 0,802174

En Excel, se puede usa la función =1-DISTR.HIPERGEOM.N(1;10;6;25;1) = 0,802174

137. Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala
remesa, el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o más
computadoras defectuosas. Si en el lote hay tres computadoras defectuosas, ¿cuál es la
probabilidad de que rechace el lote? Rpta: 0,7192

La variable en estudio 𝑋 es número de computadoras portátiles defectuosas.

El rango o recorrido de la variable X es 𝑅𝑋 = {0, 1, 2, 3}.

La distribución de la variable es hipergeométrica, sus parámetros son 𝑁 = 30, 𝑛 = 10 y 𝑟 = 3.

La probabilidad de rechazar el lotees∶

𝑃(𝑋 ≥ 1) = 𝑓(1) + 𝑓(2) + 𝑓(3)

𝐶13 × 𝐶927 𝐶23 × 𝐶827 𝐶33 × 𝐶727


= 30 + 30 + 30 = 0,719212
𝐶10 𝐶10 𝐶10

En Excel, se puede usa la función =1-DISTR.HIPERGEOM.N(0;10;3;30;1) = 0,719212

También podría gustarte