Está en la página 1de 41

T3_Ejerc

October 17, 2023

1 Ejercicios Tema 3 - Variables aleatorias discretas


A continuación se indican los enunciados de los ejercicios del Tema 3, “Variables aleatorias discre-
tas,” de la asignatura Probabilidad I.
Este fichero ha sido preparado como un cuaderno de Jupyter Notebook o Jupyter Lab.

1.1 Soluciones de los ejercicios


Las soluciones de los ejercicios se han llevado a cabo incluyendo códigos en R para permitir el
tratamiento de conjuntos de datos grandes, y para generar gráficos asociados a las preguntas en
los ejercicios. Para poder ejecutar estos códigos se deben completar los pasos siguientes, que llevan
a cabo la configuración necesaria para poder obtener la parte de las respuestas que se calcularía
empleando R.

1.1.1 Configuración inicial


Los pasos iniciales para su utilización requieren incorporar las librerías necesarias para la ejecución
del código. Si obtuvieses un mensaje de error al ejecutar la siguiente celda, posiblemente debas
instalar alguna de dichas librerías en R.
Es importante asegurarse de que el directorio de trabajo en el que se encuentren los datos es correcto.
En lo que sigue se supone que los ficheros de datos están en un subdirectorio de tu directorio de
trabajo, llamado data.
Los comandos de R para llevar a cabo estas tareas se indican en la siguiente celda de código. Ejecuta
estos comandos pulsando el botón RUN en la barra de menú mientras la celda esté seleccionada.

[5]: ## Librerias para los ejercicios

library(huxtable)
suppressMessages(library(tidyverse))
suppressMessages(library(reshape2))
suppressMessages(library(gridExtra))

2 Funciones de probabilidad y de distribución


2.1 Ejercicio 1
Un grupo está formado por 2 mujeres y 4 hombres. Se eligen 2 de ellos al azar. Calcular:

1
1. La probabilidad de que se seleccione al menos una mujer, si el muestreo se hace:
• Con reemplazamiento.
• Sin reemplazamiento.
2. La función de probabilidad del número de mujeres escogidas, si el muestreo se hace:
• Con reemplazamiento.
• Sin reemplazamiento.
3. La función de distribución en los dos casos anteriores. Representar gráficamente ambas fun-
ciones de distribución.

2.1.1 Solución - Ejercicio 1


1. Denotamos por 𝑋 el número de chicas seleccionadas y queremos calcular el valor de Pr(𝑋 ≥
1) = 1 − Pr(𝑋 = 0), esto es, uno menos la probabilidad de seleccionar a dos chicos.
• Con reemplazamiento:

2
4
Pr(𝑋 ≥ 1) = 1 − 𝑃 (𝑋 = 0) = 1 − ( ) = 0.556
6
• Sin reemplazamiento:

4 3
Pr(𝑋 ≥ 1) = 1 − 𝑃 (𝑋 = 0) = 1 − × = 0.6
6 5

2. En este caso debemos calcular las probabilidades correspondientes a 𝑋 = 0, 1, 2, aunque en


el apartado anterior ya hemos obtenido el valor para 𝑋 = 0.
• Con reemplazamiento. Observamos que se trata de una distribución binomial con 𝑛 = 2
y 𝑝 = 2/6. En particular, obtenemos:

2 2
Pr(𝑋 = 0) = ( 64 ) = 0.444, Pr(𝑋 = 2) = ( 62 ) = 0.111
Pr(𝑋 = 1) = 1 − Pr(𝑋 = 0) − Pr(𝑋 = 2) = 0.444

O también

42
Pr(𝑋 = 1) = 2 = 0.444
66
• Sin reemplazamiento. En este caso tenemos una distribución hipergeométrica. En par-
ticular, obtenemos:

Pr(𝑋 = 0) = 64 × 35 = 0.4, Pr(𝑋 = 2) = 26 × 15 = 0.067


Pr(𝑋 = 1) = 1 − Pr(𝑋 = 0) − Pr(𝑋 = 2) = 0.533

O también

2
42
Pr(𝑋 = 1) = 2 = 0.533
65

3. Las funciones de distribución se obtienen acumulando las probabilidades correspondientes a


las funciones de probabilidad. Se tiene
• Con reemplazamiento | 𝑘 | 0 | 1 | 2 | | — | — | — | — | | Prob | 0.444 | 0.888 | 1 |
• Sin reemplazamiento | 𝑘 | 0 | 1 | 2 | | — | — | — | — | | Prob | 0.4 | 0.933 | 1 |
La representación gráfica de estas funciones de distribución, teniendo en cuenta que son funciones
continuas a tramos, tendrá la forma indicada a continuación, obtenida con el código R indicado

[6]: # Código R funciones de distribución - Ejercicio 1

p1.df = data.frame(val = seq(-1,3), prb.c = c(0,0.444,0.888,1,1), prb.s = c(0,0.


↪4,0.933,1,1))

cat("\n Función de distribución de X con y sin reemplazamiento\n")

p1.dfc = p1.df %>% ggplot(aes(x = val, y = prb.c)) +


geom_step() +
geom_point() +
ggtitle("F distribución con reemplazamiento") +
xlab("Mujeres") + ylab("Probabilidad") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5))

p1.dfs = p1.df %>% ggplot(aes(x = val, y = prb.s)) +


geom_step() +
geom_point() +
ggtitle("F distribución sin reemplazamiento") +
xlab("Mujeres") + ylab("Probabilidad") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5))

grid.arrange(p1.dfc,p1.dfs, ncol=2)

Función de distribución de X con y sin reemplazamiento

3
2.2 Ejercicio 2
Se venden 5000 boletos de lotería a 1 euro cada uno, para el sorteo de un premio de 2000 euros.
Determina la ganancia promedio de una persona que compra tres boletos de lotería.

2.2.1 Solución - Ejercicio 2


Suponemos que la probabilidad de que un boleto sea premiado es la misma para todos los boletos.
Definimos una variable aleatoria 𝐿 que toma el valor 1 si se obtiene el premio con los tres boletos y
el valor 0 en caso contrario. A partir de ella definimos otra variable aleatoria 𝐺 como la ganancia
de este sorteo habiendo comprado tres boletos:

𝐺(𝐿) = 2000𝐿 − 3

4
La probabilidad de obtener el premio con estos tres boletos es (se obtiene como casos favorables
sobre casos totales),

3
Pr(𝐿 = 1) =
5000
La ganancia promedio vendrá dada por

4997 3
𝐸[𝐺] = 𝐺(0) Pr(𝐿 = 0) + 𝐺(1) Pr(𝐿 = 1) = (−3) × + 1997 × = −1.8 euros
5000 5000

2.3 Ejercicio 3
En unas oposiciones el temario consta de 85 temas. Se seleccionan tres temas al azar entre los 85,
sin reemplazamiento. Si un opositor domina 35 de los 85 temas, calcular:
• La función de probabilidad del número de temas seleccionados que domina.
• La función de distribución del número de temas seleccionados que domina.
• Representar gráficamente dicha función de distribución.
• El valor de 𝐹 (1.5).
• El número esperado de temas, entre los seleccionados, que domina.
• Si domina los dos primeros temas seleccionados, calcular la probabilidad de que también
domine el tercero.

2.3.1 Solución - Ejercicio 3


Denotamos como 𝑋 el número de temas que el opositor domina, entre los tres temas seleccionados.
Por tanto, 𝑋 toma valores en {0, 1, 2, 3}. Suponemos que la selección de cada uno de los temas es
independiente y se hace sin reemplazamiento.
• La función de probabilidad se puede obtener a partir de los valores siguientes (que correspon-
den a una distribución hipergeométrica):

Pr(𝑋 = 0) = 50 49 48
85 × 84 × 83 = 0.198
Pr(𝑋 = 1) = 3 × 85 × 84 × 35
50 49
83 = 0.434
50 35 34
Pr(𝑋 = 2) = 3 × 85 × 84 × 83 = 0.301
Pr(𝑋 = 3) = 35 34 33
85 × 84 × 83 = 0.066

• La función de distribución vendrá dada por los valores acumulados de las probabilidades
anteriores:

𝑘 0 1 2 3
Prob 0.198 0.633 0.934 1

• La función de distribución es una función continua a tramos, y su representación gráfica se


muestra en el siguiente bloque de R

[7]: # Código R función de distribución - Ejercicio 3

p3.df = data.frame(val = seq(-1,4), prb = c(0,0.198,0.633,0.934,1,1))

5
cat("\n Función de distribución de X\n")

p3.dfp = p3.df %>% ggplot(aes(x = val, y = prb)) +


geom_step() +
geom_point() +
ggtitle("F distribución") +
xlab("Temas") + ylab("Probabilidad") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5))

plot(p3.dfp)

Función de distribución de X

6
2.3.2 Solución - Ejercicio 3 cont
• De su definición tenemos que 𝐹 (1.5) = Pr(𝑋 ≤ 1.5). Para calcular esta probabilidad podemos
emplear la función de probabilidad, y obtenemos
𝐹 (1.5) = Pr(𝑋 ≤ 1.5) = Pr(𝑋 = 0) + Pr(𝑋 = 1) = 0.633
Alternativamente, empleando la función de distribución,
𝐹 (1.5) = Pr(𝑋 ≤ 1.5) = Pr(𝑋 ≤ 1) = 𝐹 (1) = 0.633
• El valor esperado de 𝑋 es
4
𝐸[𝑋] = ∑ 𝑘𝑝𝑘 = 0.434 + 2 × 0.301 + 3 × 0.066 = 1.235
𝑘=1

• El valor pedido es (denotamos por 𝐷𝑘 el suceso correspondiente a que el 𝑘-ésimo tema era
uno de los que el opositor domina)
35 34 33
Pr(𝐷3 ∩ 𝐷2 ∩ 𝐷1 ) 85 × 84 × 83 33
Pr(𝐷3 |𝐷1 ∩ 𝐷2 ) = = 35 34 = = 0.398
Pr(𝐷1 ∩ 𝐷2 ) 85 × 84
83

3 Distribuciones para variables discretas


3.1 Ejercicio 4
Un estanque contiene 500 peces de los cuales 300 están marcados. Un pescador logra sacar 50
peces. Hallar la probabilidad de que:
1. 20 de los peces estén marcados.
2. Ninguno de los peces esté marcado.

3.1.1 Solución - Ejercicio 4


Denotamos por 𝑋 el número de peces marcados entre los 50 extraídos. Si suponemos que la
extracción se realiza con reemplazamiento, podemos emplear una distribución binomial con 𝑛 = 50
y 𝑝 = 300/500 para el número de peces marcados.
1. El valor pedido es

50 20
𝑃 (𝑋 = 20) = ( )𝑝 (1 − 𝑝)30 = 0.0020
20

2. La probabilidad pedida es

𝑃 (𝑋 = 0) = (1 − 𝑝)50 = 1.27 10−20

Si los cálculos se hubiesen realizado suponiendo que no hay reemplazamiento, empleando una
distribuciión hipergeométrica, los valores resultantes serían 0.00133 y 1.96 10−22 .
A continuación se muestran los resultados obtenidos empleando R.

7
[8]: ## Ejercicio 4

cat(sprintf("\nProbabilidad X = 20 (binomial) : %8.3e",dbinom(20,50,300/


↪500)))

cat(sprintf("\nProbabilidad X = 20 (hipergeométrica) : %8.


↪3e\n",dhyper(20,300,200,50)))

cat(sprintf("\nProbabilidad X = 0 (binomial) : %8.3e",dbinom(0,50,300/


↪500)))

cat(sprintf("\nProbabilidad X = 0 (hipergeométrica) : %8.


↪3e\n",dhyper(0,300,200,50)))

Probabilidad X = 20 (binomial) : 1.987e-03


Probabilidad X = 20 (hipergeométrica) : 1.328e-03

Probabilidad X = 0 (binomial) : 1.268e-20


Probabilidad X = 0 (hipergeométrica) : 1.961e-22

3.2 Ejercicio 5
Sea 𝑋 la v.a. que representa el número de caras obtenidas en cuatro lanzamientos de una moneda
equilibrada.
1. Obtener y dibujar la función de probabilidad de 𝑋.
2. Obtener la función de distribución de 𝑋 y dibujarla.
3. Calcular Pr(𝑋 ≤ 2) y Pr(1 < 𝑋 ≤ 3).
4. Simular 100 lanzamientos de las cuatro monedas y comparar las frecuencias relativas y las
frecuencias relativas acumuladas, respectivamente, con la función de probabilidad y función
de distribución.
5. Obtener y dibujar la función de probabilidad de la nueva v.a. 𝑌 = 𝑋/(1 + 𝑋).
6. Obtener 100 valores simulados de 𝑌 a partir de los valores de 𝑋 simulados en el apartado
cuarto. Comparar las frecuencia relativas con las probabilidades teóricas.

3.2.1 Solución - Ejercicio 5


1. Se trata de una distribución binomial con 𝑛 = 4 y 𝑝 = 0.5, ya que corresponde a la suma de
cuatro variables Bernoulli con 𝑝 = 0.5 (que modelan cada lanzamiento).
La función de probabilidad viene dada por

4 4
Pr(𝑋 = 𝑘) = ( )0.5𝑘 0.54−𝑘 = 0.54 ( ), 𝑘 = 0, … , 4
𝑘 𝑘

Los valores de cada una de las probabilidades son:

8
𝑘 0 1 2 3 4
Prob 0.0625 0.25 0.375 0.25 0.0625

El gráfico correspondiente a la función de probabilidad se muestra en la celda de R a contin-


uación.
2. La función de distribución corresponde a las probabilidades acumuladas, 𝐹 (𝑘) = Pr(𝑋 ≤ 𝑘),

𝑘 0 1 2 3 4
𝐹 0.0625 0.3125 0.6875 0.9375 1

El gráfico correspondiente a la función de distribución se muestra en la celda de R a contin-


uación.
3. De los valores anteriores,

Pr(𝑋 ≤ 2) = 𝐹 (2) = 0.6875, Pr(1 < 𝑋 ≤ 3) = 𝐹 (3) − 𝐹 (1) = 0.9375 − 0.3125 = 0.625

4. En la celda siguiente se muestran los gráficos con las comparaciones pedidas, para una muestra
simulada de 100 observaciones de una distribución binomial con los parámetros indicados.
5. La función de probabilidad pedida para 𝑌 se puede obtener de la correspondiente función
de probabilidad para 𝑋, sustituyendo 𝑘 por 𝑘′ = 𝑘/(1 + 𝑘) para cada valor de 𝑘 = 0, … , 4.
Obtenemos

𝑘′ 0 1/2 2/3 3/4 4/5


Prob 0.0625 0.25 0.375 0.25 0.0625

El gráfico de esta función de probabilidad se indica en la celda siguiente.


6. Aplicamos un procedimiento similar al del apartado anterior, sustituyendo los valores de 0 a
4 por los nuevos valores de 𝑌 , y obtenemos el gráfico que se indica en la celda siguiente.

[9]: # Ejercicio 5

## Parámetros

p = 0.5 ; m = 4

## Generacion de datos funcion de probabilidad de X

cat("\n Ejercicio 5.1 .- Función de probabilidad de X\n")

p6.pf = data.frame(val = seq(0,m), prb = dbinom(seq(0,m),m,p))


cat("\n Función de probabilidad de X \n")

9
print(p6.pf)

p6.pbp = p6.pf %>% ggplot(aes(x = val, y = prb)) +


geom_bar(stat = "identity", width=0.7, fill="steelblue") +
geom_text(aes(label = prb), vjust=1.6, color="white", size=3.5) +
ggtitle("Funcion de probabilidad de X") +
xlab("Numero de caras") + ylab("Probabilidad") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5))

plot(p6.pbp)

## Generacion de datos funcion de distribucion de X

cat("\n Ejercicio 5.2 .- Función de distribución de X\n")

p6.df = data.frame(val = seq(0,m), prb = pbinom(seq(0,m),m,p))


cat("\n Función de distribución de X \n")
print(p6.df)

p6.dbp = p6.df %>% ggplot(aes(x = val, y = prb)) +


geom_bar(stat = "identity", width=0.7, fill="steelblue") +
geom_text(aes(label = prb), vjust=1.6, color="white", size=3.5) +
ggtitle("Funcion de distribucion de X") +
xlab("Numero de caras") + ylab("Probabilidad") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5))

plot(p6.dbp)

Ejercicio 5.1 .- Función de probabilidad de X

Función de probabilidad de X
val prb
1 0 0.0625
2 1 0.2500
3 2 0.3750
4 3 0.2500
5 4 0.0625

Ejercicio 5.2 .- Función de distribución de X

Función de distribución de X
val prb
1 0 0.0625
2 1 0.3125
3 2 0.6875
4 3 0.9375

10
5 4 1.0000

11
[10]: ## Simulacion de 100 tiradas - probabilidades vs frecuencias

cat("\n Ejercicio 5.4 .- Comparación de datos teóricos y simulados\n")

n = 100

sim.4coin = rbinom(n,m,p)
p6.pf$sim = table(factor(sim.4coin,levels=0:m))/n

p6.pf2 = melt(p6.pf, id.vars = "val")


p6.pbp2 = p6.pf2 %>% ggplot(aes(x = val, y = value, fill = variable)) +
geom_bar(stat = "identity", position = "dodge", width = 0.7) +
ggtitle("Comparacion probabilidades - frecuencias de X") +

12
xlab("Numero de caras") + ylab("Probabilidad/Frecuencia") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5)) +

scale_fill_manual(values=c("steelblue","deepskyblue1"))
plot(p6.pbp2)

Ejercicio 5.4 .- Comparación de datos teóricos y simulados


Warning message:
“attributes are not identical across measure variables; they will be dropped”

13
[11]: ## Funcion de probabilidad para Y

cat("\n Ejercicio 5.5 .- Distribución de la variable transformada Y\n")

p6.pfy = p6.pf
p6.pfy$val = p6.pf$val/(1 + p6.pf$val)

cat("\n Función de probabilidad de Y \n")


print(p6.pfy)

p6.pbpy = p6.pfy %>% ggplot(aes(x = val, y = prb)) +


geom_bar(stat = "identity", fill="steelblue") +
geom_text(aes(label = prb), vjust=1.6, color="white", size=2) +
ggtitle("Funcion de probabilidad de Y") +
xlab("Valor de Y") + ylab("Probabilidad") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5))

plot(p6.pbpy)

## Comparacion de probabilidades y frecuencias para Y

cat("\n Ejercicio 5.6 .- Comparación de probabilidades \n")

sim.4coin = rbinom(n,m,p)
p6.pfy$sim = table(factor(sim.4coin,levels=0:m))/n

cat("\n Probabilidades y frecuencias para Y \n")


print(p6.pfy)

p6.pf2y = melt(p6.pfy, id.vars = "val")


p6.pbp2y = p6.pf2y %>% ggplot(aes(x = val, y = value, fill = variable)) +
geom_bar(stat = "identity", position = "dodge") +
ggtitle("Comparacion probabilidades - frecuencias de Y") +
xlab("Valor de Y") + ylab("Probabilidad/Frecuencia") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5)) +

scale_fill_manual(values=c("steelblue","deepskyblue1"))
plot(p6.pbp2y)

Ejercicio 5.5 .- Distribución de la variable transformada Y

Función de probabilidad de Y
val prb sim
1 0.0000000 0.0625 0.08
2 0.5000000 0.2500 0.25
3 0.6666667 0.3750 0.39
4 0.7500000 0.2500 0.24

14
5 0.8000000 0.0625 0.04

Ejercicio 5.6 .- Comparación de probabilidades

Probabilidades y frecuencias para Y


val prb sim
1 0.0000000 0.0625 0.05
2 0.5000000 0.2500 0.26
3 0.6666667 0.3750 0.39
4 0.7500000 0.2500 0.23
5 0.8000000 0.0625 0.07
Warning message:
“attributes are not identical across measure variables; they will be dropped”

15
3.3 Ejercicio 6
Una máquina empaqueta pastillas en tubos de 20 unidades. El archivo 3Defectuosas.csv propor-
ciona el número de pastillas defectuosas producidas en cada uno de los 1000 tubos examinados en
un control de calidad.
1. Proporciona una estimación de la proporción de pastillas defectuosas producidas por la
máquina.
2. Calcula la función de probabilidad del número de pastillas defectuosas por tubo, suponiendo
que la estimación del apartado anterior sea correcta.
3. Si los tubos se comercializan en cajas de 25 unidades, calcula la probabilidad de que una caja
de tubos contenga exactamente 20 tubos sin ninguna pastilla defectuosa.

16
3.3.1 Solución - Ejercicio 6
Denotamos por 𝑋 el número de pastillas defectuosas en un tubo cualquiera.
Para obtener el valor de la proporción de pastillas defectuosas a introducir en el modelo de 𝑋, 𝑝,
como se pide en el enunciado, debemos emplear los valores de las proporciones en la muestra para
determinar un valor razonable de 𝑝.
Básicamente, debemos ajustar el valor de manera que las proporciones en la muestra se corre-
spondan con los valores de probabilidades asociados a una distribución binomial con 𝑛 = 20 y 𝑝
desconocido.
La función de probabilidad de una distribución binomial es

20 𝑘
Pr(𝑋 = 𝑘) = ( )𝑝 (1 − 𝑝)20−𝑘 .
𝑘

Y de los datos tenemos los valores siguientes:

𝑘 0 1 2 3 4
Proporción 0.806 0.173 0.019 0.002 0

1. Un procedimiento para obtener 𝑝 consiste en ajustar el valor esperado de la distribución


binomial, 𝑛𝑝 con 𝑛 = 20, para que coincida con el valor medio de la muestra. Obtenemos

𝑥̄ 0.217
𝑥̄ = 0.173 × 1 + 0.019 × 2 + 0.002 × 3 = 0.217 = 𝑛𝑝 ⇒ 𝑝̂ = = = 0.01085
𝑛 20
Para este valor 𝑝 = 𝑝̂ las probabilidades teóricas y las proporciones en la muestra son

𝑘 0 1 2 3 4
Probs 0.804 0.176 0.018 0.0012 0.0000564
Proporción 0.806 0.173 0.019 0.002 0

que ofrecen un ajuste bastante razonable.


2. La función de probabilidad vendrá dada por

20
Pr(𝑋 = 𝑘) = ( )(1 − 0.01085)𝑘 0.0108520−𝑘 , 𝑘 = 0, … , 20
𝑘

Los valores para 𝑘 = 0, 1, 2, 3, 4 se han indicado en la tabla del apartado anterior.


3. Denotamos por 𝑌 la variable aleatoria que indica cuántos tubos no tienen pastillas defectuosas
en un lote de 25 tubos. La probabilidad de que un tubo no tenga ninguna pastilla defectuosa
es 𝑝𝑦 = (1 − 𝑝)̂ 20 = 0.804.
Nuestra variable 𝑌 también sigue una distribución binomial, pero los valores de los parámetros
son 𝑛 = 25, 𝑝 = 𝑝𝑦 = 0.804 y nos piden la probabilidad correspondiente a 𝑌 = 𝑘 = 20. Este
valor es

17
25 20
Pr(𝑌 = 20) = ( )𝑝 (1 − 𝑝𝑦 )5 = 0.1958
20 𝑦

[12]: # Ejercicio 6

## Lectura de datos del fichero

def.dat = read.csv("./data/3Defectuosas.csv",sep=";",dec=",")

x.bar = mean(def.dat$Defectuosas)

n = 20
p.hat = x.bar/n

cat(sprintf("\n\nMedia defectos : %8.4f",x.bar))


cat(sprintf("\nProporción defectos : %8.4f\n",p.hat))

## Probabilidades distribución binomial

cat("\n Ejercicio 6.1 .- Probabilidades de X\n")

for (i in 0:4) cat(sprintf("\nProbabilidad X = %2.0f : %8.3e",i,dbinom(i,n,p.


↪hat)))

## Probabilidad de Y = 20

cat("\n\n Ejercicio 6.2 .- Probabilidad de Y = 20")

n = 25
p = 0.804

cat(sprintf("\n\nProbabilidad Y = 20 : %8.4f",dbinom(20,n,p)))

Media defectos : 0.2170


Proporción defectos : 0.0109

Ejercicio 6.1 .- Probabilidades de X

Probabilidad X = 0 : 8.040e-01
Probabilidad X = 1 : 1.764e-01
Probabilidad X = 2 : 1.838e-02
Probabilidad X = 3 : 1.210e-03
Probabilidad X = 4 : 5.639e-05

Ejercicio 6.2 .- Probabilidad de Y = 20

18
Probabilidad Y = 20 : 0.1958

3.4 Ejercicio 7
Una línea de autobuses cubre una ruta con un autobús que tiene 50 plazas. La línea aceptó 60
reservas para un viaje. Se supone que todos los pasajeros actúan en forma independiente y se
estima que 1 de cada 10 pasajeros que hacen la reserva no se presentan. El precio del billete es 25
euros, pero si un pasajero se presenta y no puede ser embarcado, se le reintegra su dinero más una
compensación de 5 euros. Calcular:
1. La esperanza del número de pasajeros que se presentan a abordar.
2. La esperanza del número de pasajeros que acuden y no pueden ser embarcados.
3. La ganancia esperada por la línea.

3.4.1 Solución - Ejercicio 7


1. El número de pasajeros que se presentan se puede obtener como el valor de una variable
aleatoria 𝑋 que sigue una distribución binomial con 𝑛 = 60 y 𝑝 = 0.9.
La esperanza del número de pasajeros que se presentan vendrá dada por

𝐸[𝑋] = 𝑛𝑝 = 60 × 0.9 = 54

2. Los pasajeros que se presentan y no pueden ser embarcados 𝑌 se pueden obtener a partir de
𝑋 como 𝑌 = max(0, 𝑋 − 50). Con esta fórmula tenemos que

Pr(𝑌 = 𝑘) = Pr(𝑋 = 50 + 𝑘), 𝑘 = 1, … , 10


Pr(𝑌 = 0) = Pr(𝑋 ≤ 50)

Su valor esperado se puede obtener como


10 10
𝐸[𝑌 ] = ∑ 𝑘 Pr(𝑌 = 𝑘) = ∑ 𝑘 Pr(𝑋 = 50 + 𝑘) = 4.057
𝑘=0 𝑘=1

3. La ganancia para la línea, 𝐺, se obtiene como

25 × 60 si 𝑋 ≤ 50
𝐺={
25 × 60 − 30(𝑋 − 50) si 𝑋 > 50

(o si supusieramos que se devuelve el precio de la reserva a los viajeros que no se presentan,


como 𝐺 = 25𝑋 − 30𝑌 ). Su valor esperado es

𝐸[𝐺] = 25 × 60 − 30𝐸[𝑌 ] = 25 × 60 − 30 × 4.057 = 1378.29

[13]: # Ejercicio 7

19
n = 60
p = 0.9

## Generamos los valores y probabilidades de Y

y.val = seq(0,10)
y.prb = c(pbinom(50,n,p),dbinom(seq(51,60),n,p))

## Calculamos y mostramos el valor esperado de Y

y.mn = sum(y.val*y.prb)

cat(sprintf("\nValor esperado de Y : %8.3f",y.mn))

Valor esperado de Y : 4.057

3.5 Ejercicio 8
En una academia están matriculados 200 hombres y 250 mujeres. Se eligen cuatro de ellos al azar.
Calcular:
1. La probabilidad de que al menos dos de los elegidos sean mujeres si el muestreo se hace:
• Con reemplazamiento.
• Sin reemplazamiento.
2. La función de probabilidad del número de mujeres escogidas si el muestreo se hace:
• Con reemplazamiento.
• Sin reemplazamiento.

3.5.1 Solución - Ejercicio 8


Denotamos por 𝑋 el número de mujeres seleccionadas.
1. Nos piden calcular Pr(𝑋 ≥ 2) = 1 − (Pr(𝑋 = 0) + Pr(𝑋 = 1)).
• En el caso con reemplazamiento, 𝑋 sigue una distribución binomial con 𝑛 = 4 y 𝑝 =
2.5/4.5. Se cumple

Pr(𝑋 ≥ 2) = 1 − (Pr(𝑋 = 0) + Pr(𝑋 = 1)) = 1 − ((1 − 𝑝)4 + 4𝑝(1 − 𝑝)3 )


= 0.766
• En el caso sin reemplazamiento, las probabilidades de interés corresponden a una dis-
tribución hipergeométrica. Se pueden obtener como

Pr(𝑋 = 0) = 200 199 198 197


450 × 449 × 448 × 447 = 0.038
250 200 199 198
Pr(𝑋 = 1) = 4 × 450 × 449 × 448 × 447 = 0.195
Pr(𝑋 ≥ 2) = 1 − (Pr(𝑋 = 0) + Pr(𝑋 = 1)) = 0.767

20
2. La función de probabilidad de 𝑋 es en cada uno de los casos:
• A partir de las probabilidades de una distribución binomial,

Pr(𝑋 = 0) = (1 − 𝑝)4 = 0.039


Pr(𝑋 = 1) = 4𝑝(1 − 𝑝)3 = 0.195
Pr(𝑋 = 2) = 6𝑝2 (1 − 𝑝)2 = 0.366
Pr(𝑋 = 3) = 4𝑝3 (1 − 𝑝) = 0.305
Pr(𝑋 = 4) = 𝑝4 = 0.095
• Los valores de las probabilidades (para una distribución hipergeométrica) son ahora

200 199 198 197


Pr(𝑋 = 0) = 450 ×
449 × 448 × 447 = 0.038
Pr(𝑋 = 1) = 4 × 250 200 199 198
450 × 449 × 448 × 447 = 0.195
250 249 200 199
Pr(𝑋 = 2) = 6 × 450 × 449 × 448 × 447 = 0.367
250 249 248 200
Pr(𝑋 = 3) = 4 × 450 × 449 × 448 × 447 = 0.305
250 249 248 247
Pr(𝑋 = 4) = × 450 × 449 × 448 × 447 = 0.094

[14]: # Ejercicio 8

cat("\n Ejercicio 8.1 .- Probabilidades de X >= 2\n")

n = 4
p = 250/450

cat(sprintf("\nProbabilidad X >= 2 (con r): %8.3e",1 - pbinom(1,n,p)))


cat(sprintf("\nProbabilidad X >= 2 (sin r): %8.3e",1 - phyper(1,250,200,n)))

cat("\n\n Ejercicio 8.2 .- Funciones de probabilidad\n")

n = 4
p = 250/450
fp_x = seq(0,4)
fp_p = dbinom(fp_x,n,p)
fp_pf1 = data.frame(values=fp_x,probs=fp_p)

cat("\n Función de probabilidad de X con reemplazamiento:\n\n")


fp_pf1_hux <-
hux(fp_pf1) %>%
set_bold(row = 1, col = everywhere, value = TRUE) %>%
set_all_borders(TRUE)
print_screen(fp_pf1_hux,colnames = FALSE)

n = 4
N = 450
K = 250
fp_x = seq(0,4)
fp_p = dhyper(fp_x,K,N-K,n)

21
fp_pf2 = data.frame(values=fp_x,probs=fp_p)

cat("\n Función de probabilidad de X sin reemplazamiento:\n\n")


fp_pf2_hux <-
hux(fp_pf2) %>%
set_bold(row = 1, col = everywhere, value = TRUE) %>%
set_all_borders(TRUE)
print_screen(fp_pf2_hux,colnames = FALSE)

Ejercicio 8.1 .- Probabilidades de X >= 2

Probabilidad X >= 2 (con r): 7.659e-01


Probabilidad X >= 2 (sin r): 7.669e-01

Ejercicio 8.2 .- Funciones de probabilidad

Función de probabilidad de X con reemplazamiento:

���������������������

values �
probs �
���������������������
� 0 � 0.039 �
���������������������
� 1 � 0.195 �
���������������������
� 2 � 0.366 �
���������������������
� 3 � 0.305 �
���������������������
� 4 � 0.0953 �
���������������������

Función de probabilidad de X sin reemplazamiento:

���������������������

values �
probs �
���������������������
� 0 � 0.0384 �
���������������������
� 1 � 0.195 �

22
���������������������
� 2 � 0.367 �
���������������������
� 3 � 0.305 �
���������������������
� 4 � 0.0942 �
���������������������

3.6 Ejercicio 9
Se recibe un lote de 1000 bolígrafos de los cuales 60 están secos y no escriben. Para decidir si se
acepta o no el lote se seleccionan 200 bolígrafos al azar, sin reemplazo, rechazando el lote si más
de 𝑥 no escriben.
1. Obtener la función de probabilidad del número de bolígrafos que no escriben entre los 200
escogidos.
2. Escoger el menor valor de 𝑥 (número de bolígrafos que no escriben entre los 200) para el que
la probabilidad de rechazar el lote sea inferior al 5%.

3.6.1 Soluciones - Ejercicio 9


Si denotamos por 𝑋 la variable aleatoria que representa el número de bolígrafos que no escriben
entre los 200 escogidos, podemos observar que se trata de la extracción sin reemplazamiento de
𝑛 = 200 unidades de un conjunto que contiene 𝑁 = 1000 elementos, de los cuales 𝐾 = 60 tienen
una cierta propiedad (bolígrafos que no escriben).
Esta es la caracterización que hemos dado para una variable aleatoria con distribución hiperge-
ométrica y parámetros 𝑁 , 𝐾 y 𝑛. Supondremos que 𝑋 sigue esta distribución.
1. La función de probabilidad de una distribución hipergeométrica con los valores indicados de
los parámetros es:

(60 940
𝑘 )(200−𝑘)
Pr(𝑋 = 𝑘) = , 𝑘 = 0, 1, … , 60,
(1000
200 )

y esta probabilidad es 0 para 𝑘 > 60.


Estas probabilidades toman los siguientes valores (se indican solo algunos de ellos):

𝑘 0 1 2 11 12 13
Prob 0.000000964 0.0000156 0.000124 0.128 0.132 0.122

2. Respondemos a esta pregunta a partir de los valores de la función de distribución de 𝑋, 𝐹 (𝑥),


que obtenemos acumulando los valores de las probabilidades anteriores (o directamente de la
función de R phyper). Tenemos en cuenta que la condición a cumplir es:

Pr(𝑋 > 𝑥) ≤ 0.05 ⇔ 1 − Pr(𝑋 ≤ 𝑥) ≤ 0.05 ⇔ Pr(𝑋 ≤ 𝑥) ≥ 0.95 ⇔ 𝐹 (𝑥) ≥ 0.95

23
Tenemos que

𝑘 15 16 17
𝐹 (𝑘) 0.876 0.929 0.962

Por tanto, el valor pedido sería 𝑥 = 17.


La celda siguiente muestra los cálculos necesarios en R para responder a los apartados anteriores.
Para ello generamos los valores de la función de probabilidad para una variable aleatoria 𝑋 con
distribución hipergeométrica y parámetros 𝑁 = 1000, 𝐾 = 60 y 𝑛 = 200.

[15]: # Ejercicio 9

cat("\n Ejercicio 9.1 .- \n")

## Parámetros

N = 1000 ; K = 60 ; n = 200

## Valores de la función de probabilidad

fp_x = seq(0,15)
fp_p = dhyper(fp_x,K,N-K,n)
fp_pf = data.frame(values=fp_x,probs=fp_p)

cat("\n Función de probabilidad de X (algunos valores):\n\n")


fp_pf_hux <-
hux(fp_pf) %>%
set_bold(row = 1, col = everywhere, value = TRUE) %>%
set_all_borders(TRUE)
print_screen(fp_pf_hux,colnames = FALSE)

Ejercicio 9.1 .-

Función de probabilidad de X (algunos valores):

����������������������

values �
probs �
����������������������
� 0 � 9.64e-07 �
����������������������
� 1 � 1.56e-05 �
����������������������

24
� 2 � 0.000124 �
����������������������
� 3 � 0.000637 �
����������������������
� 4 � 0.0024 �
����������������������
� 5 � 0.00708 �
����������������������
� 6 � 0.017 �
����������������������
� 7 � 0.034 �
����������������������
� 8 � 0.0581 �
����������������������
� 9 � 0.086 �
����������������������
� 10 � 0.112 �
����������������������
� 11 � 0.128 �
����������������������
� 12 � 0.132 �
����������������������
� 13 � 0.122 �
����������������������
� 14 � 0.101 �
����������������������
� 15 � 0.0764 �
����������������������

[16]: # Ejercicio 9

cat("\n Ejercicio 9.2 .- \n")

## Parámetros

N = 1000 ; K = 60 ; n = 200

## Valores de la función de distribución

fp_x = seq(10,20)
fp_p = phyper(fp_x,K,N-K,n)
fp_df = data.frame(valores=fp_x, probs.ac=fp_p)

cat("\n Probabilidades acumuladas (función de distribución) de X:\n\n")


fp_df_hux <-
hux(fp_df) %>%
set_bold(row = 1, col = everywhere, value = TRUE) %>%

25
set_all_borders(TRUE)
print_screen(fp_df_hux,colnames = FALSE)

Ejercicio 9.2 .-

Probabilidades acumuladas (función de distribución) de X:

����������������������

valores �
probs.ac

����������������������
� 10 � 0.317 �
����������������������
� 11 � 0.445 �
����������������������
� 12 � 0.577 �
����������������������
� 13 � 0.699 �
����������������������
� 14 � 0.8 �
����������������������
� 15 � 0.876 �
����������������������
� 16 � 0.929 �
����������������������
� 17 � 0.962 �
����������������������
� 18 � 0.981 �
����������������������
� 19 � 0.991 �
����������������������
� 20 � 0.996 �
����������������������

3.7 Ejercicio 10
En un almacén se guardan 1000 piezas de las cuales 100 son defectuosas. Un inspector toma una
de las piezas al azar, y si no es defectuosa la devuelve al almacén.
Sea 𝑁 el número de inspecciones de piezas no defectuosas antes de encontrar la primera defectuosa.
Calcular la probabilidad de que este número de inspecciones, 𝑁 , esté entre 25 y 60, ambos incluidos.

3.7.1 Soluciones - Ejercicio 10


La variable aleatoria 𝑁 sigue una distribución geométrica (repetición de ensayos Bernoulli hasta
que se produce el primer fallo) con parámetro 𝑝 = 100/1000.

26
La probabilidad pedida se puede obtener a partir de la función de probabilidad de una distribución
geométrica,

Pr(𝑁 = 𝑘) = (1 − 𝑝)𝑘 𝑝

En nuestro caso, tenemos que calcular Pr(25 ≤ 𝑁 ≤ 60). Reescribimos esta probabilidad para
poder escribirla en términos de la función de distribución de 𝑁 , 𝐹𝑁 (𝑘), como

Pr(25 ≤ 𝑁 ≤ 60) = Pr(24 < 𝑁 ≤ 60) = 𝐹𝑁 (60) − 𝐹𝑁 (24)

Obtenemos como resultado,

Pr(25 ≤ 𝑁 ≤ 60) = 𝐹𝑁 (60) − 𝐹𝑁 (24) = 0.0702

El cálculo utilizando R se indica a continuación.

[17]: # Ejercicio 10

p = 0.1

cat(sprintf("\nProbabilidad 25 <= X <= 60: %8.3e",pgeom(60,p)-pgeom(24,p)))

Probabilidad 25 <= X <= 60: 7.017e-02

3.8 Ejercicio 11
El archivo 3LecturasBarras.csv recoge las lecturas erróneas (fallos) de un lector óptico de barras
en una muestra de 200 lecturas.
• Estimar la probabilidad de fallo del lector.
• Suponiendo que la estimación anterior es correcta, calcular la probabilidad de que falle solo
una vez en las siguientes 10 lecturas.
• Calcular la probabilidad de que el lector no falle en las siguientes 20 lecturas, sabiendo que
no falló en las primeras 10 lecturas.

3.8.1 Soluciones - Ejercicio 11


1. Las frecuencias observadas y recogidas en el fichero son

𝑘 0 1
Frecuencias 191 9

Suponiendo las lecturas independientes, podemos aproximar la variable aleatoria que representa un
fallo, 𝑋, mediante una distribución Bernoulli con 𝑝 = 9/200.

27
2. El número de fallos en las siguientes 10 lecturas sigue una distribución binomial con 𝑛 = 10
y el valor de 𝑝 anterior. Tenemos

Pr(𝑋 = 1) = 10𝑝(1 − 𝑝)9 = 0.297

3. El número de lecturas sin fallos hasta el primer fallo sigue una distribución geométrica con
el valor de 𝑝 anterior. Si denotamos el número de lecturas hasta el primer fallo como 𝑁 , nos
piden calcular

Pr((𝑁2 > 20) ∩ (𝑁1 > 10)) Pr(𝑁 > 30)


Pr(𝑁2 > 20|𝑁1 > 10) = =
Pr(𝑁1 > 10) Pr(𝑁1 > 10)

donde 𝑁1 denota la variable aleatoria correspondiente al número de lecturas sin fallos en el


primer grupo de lecturas, y 𝑁2 el valor correspondiente en el segundo grupo de lecturas. Si
las lecturas en los dos grupos se llevan a cabo consecutivamente, entonces (𝑁2 > 20) ∩ (𝑁1 >
10) = (𝑁 > 30), donde 𝑁 denota el número de lecturas hasta el primer fallo en el conjunto
de ambos casos.
Si tenemos en cuenta que


1
Pr(𝑁 > 𝑘) = ∑ (1 − 𝑝)𝑖 𝑝 = (1 − 𝑝)𝑘+1 𝑝 = (1 − 𝑝)𝑘+1
𝑖=𝑘+1
1 − (1 − 𝑝)

obtenemos

(1 − 𝑝)31
Pr(𝑁2 > 20|𝑁1 > 10) = = (1 − 𝑝)20 = 0.398
(1 − 𝑝)11

[18]: # Ejercicio 11

## Pregunta 2

n = 10
p = 9/200

cat(sprintf("\nProbabilidad de X = 1 : %6.3f",dbinom(1,n,p)))

## Pregunta 3

prb.v = (1 - pgeom(30,p))/(1 - pgeom(10,p))

cat(sprintf("\n\nProbabilidad de N > 10 cond a N > 20 : %6.3f",prb.v))

Probabilidad de X = 1 : 0.297

Probabilidad de N > 10 cond a N > 20 : 0.398

28
3.9 Ejercicio 12
El archivo 3Fallos.csv recoge los fallos por hora de un aparato eléctrico registrados en 20 horas
de funcionamiento. Calcular:
1. Una estimación del número medio de fallos por hora que se espera que tenga el aparato y de
la varianza en este número de fallos por hora.
2. Suponiendo que la estimación es adecuada, examinar si una distribución de Poisson es un
buen modelo para el número de fallos por hora.
3. Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que el aparato
funcione bien durante la siguiente hora.
4. Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que el aparato
funcione bien durante las dos siguientes horas.

3.9.1 Solución - Ejercicio 12


1. De los datos del fichero obtenemos las frecuencias siguientes:

k 0 1 2 3 4
Frecuencia 4 5 5 5 1

Si denotamos por 𝑋 el número de fallos por hora del aparato, el valor esperado en la muestra
es

𝑥̄ = (5 + 2 × 5 + 3 × 5 + 4)/20 = 1.7

Y la varianza muestral es

𝑠2 = ((4 × (−1.7)2 + 5 × (1 − 1.7)2 + 5 × (2 − 1.7)2 + 5 × (3 − 1.7)2 + (4 − 1.7)2 )/19


= (5 × 12 + 5 × 22 + 5 × 32 + 42 − 20 × 1.72 )/19 = 1.484

algo menor que la media muestral (para una distribución de Poisson, 𝐸[𝑋] = Var[𝑋]).
2. Para examinar si una distribución de Poisson es un buen modelo para el número de fallos por
hora, en primer lugar seleccionamos un valor para el parámetro 𝜆. Lo hacemos imponiendo la
condición de que la media muestral y la media de la distribución coincidan. Por ello, tomamos
𝜆 = 1.7.
Para comparar las probabilidades asociadas a una distribución de Poisson con ese valor de 𝜆
y las frecuencias observadas, calculamos las probabilidades mediante la fórmula

1.7𝑘 exp(−1.7)
Pr(𝑋 = 𝑘) =
𝑘!
En la celda siguiente se muestra el gráfico que compara estos valores.
El ajuste no es excesivamente bueno, pero el tamaño de la muestra también es muy reducido.

29
3. La probabilidad pedida es

1.70 exp(−1.7)
Pr(𝑋 = 0) = = exp(−1.7) = 0.183
0!

4. En este caso nos piden calcular el valor de Pr((𝑋1 = 0) ∩ (𝑋2 = 0)), donde 𝑋1 y 𝑋2 son
los fallos en la primera y segunda hora. Bajo una distribución Poisson ambos sucesos son
independientes, y por tanto

Pr({𝑋1 = 0} ∩ {𝑋2 = 0}) = Pr(𝑋 = 0)2 = 0.1832 = 0.033

La celda siguiente muestra los cálculos realizados en R para contestar a las preguntas siguientes.

[25]: # Ejercicio 12

## Lectura de los datos

dat.e12 = read.csv("./data/3Fallos.csv",sep=";",dec=",")

cat("\n Ejercicio 12.1 .- \n")

## Valores, frecuencias, media y varianza

vf.e12 = as.data.frame(table(dat.e12))
colnames(vf.e12) = c("vals" , "frecs")
cat("\n Valores y frecuencias del número de fallos por hora:\n\n")
vf_df_hux <-
hux(vf.e12) %>%
set_bold(row = 1, col = everywhere, value = TRUE) %>%
set_all_borders(TRUE)
print_screen(vf_df_hux,colnames = FALSE)

mn.e12 = mean(dat.e12$Fallos)
cat(sprintf("\n\nMedia del número de fallos : %8.3f\n",mn.e12))
cat(sprintf("Varianza del número de fallos : %8.3f\n",var(dat.e12$Fallos)))

## Ajuste de probabilidades y frecuencias

cat("\n Ejercicio 12.2 .- \n")

lambda.f = mn.e12

## Funcion de probabilidad de distribucion Poisson y frecuencias observadas

p12.df = data.frame(val = seq(0,4), prb = dpois(seq(0,4),lambda.f))


p12.df$obs = vf.e12$frecs/length(dat.e12$Fallos)

30
cat("\n Diagrama de barras y probabilidades para la variable X:\n\n")

p12.df2 = melt(p12.df, id.vars = "val")


p12.pbp = p12.df2 %>% ggplot(aes(x = val, y = value, fill = variable)) +
geom_bar(stat = "identity", position = "dodge", width = 0.7) +
ggtitle("Probabilidades Poisson - frecuencias") +
xlab("Numero de fallos") + ylab("Probabilidad/Frecuencia") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5)) +

scale_fill_manual(values=c("steelblue","deepskyblue1"))
plot(p12.pbp)

Ejercicio 12.1 .-

Valores y frecuencias del número de fallos por hora:

���������������������
� vals

frecs �
���������������������
� 0 � 4 �
���������������������
� 1 � 5 �
���������������������
� 2 � 5 �
���������������������
� 3 � 5 �
���������������������
� 4 � 1 �
���������������������

Media del número de fallos : 1.700


Varianza del número de fallos : 1.484

Ejercicio 12.2 .-

Diagrama de barras y probabilidades para la variable X:

31
3.10 Ejercicio 13
La siguiente tabla muestras las frecuencias absolutas del número de errores por 10.000 líneas de
código en un proyecto de desarrollo de software, para una muestra de 950.000 líneas.

#errores 0 1 2 3 4 5 Total
frecuencia 41 29 15 7 2 1 95

Calcular:
1. Una estimación del número medio de errores por 10.000 líneas que se esperan en este proyecto
y de su varianza.

32
2. Suponiendo que la estimación es adecuada, examinar si una distribución de Poisson es un
buen modelo para el número de errores por 10.000 líneas de código.
3. Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que en 10.000
líneas escogidas al azar haya al menos un error.

3.10.1 Solución - Ejercicio 13


1. Denotando por 𝑋 la variable que tiene como valor el número de errores por 10.000 líneas de
código en el proyecto, de los valores de las frecuencias obtenemos

1 5
𝑥̄ = ∑ 𝑘𝑓 = (29 + 2 × 15 + 3 × 7 + 4 × 2 + 5)/95 = 0.979
𝑛 𝑘=0 𝑘

donde 𝑓𝑘 es la frecuencia (absoluta) del valor 𝑘.


Para la varianza obtenemos

5
1
𝑠2 = (∑ 𝑘2 𝑓𝑘 − 𝑛𝑥2̄ ) = 1.255
𝑛 − 1 𝑘=0

2. Para examinar si una distribución de Poisson es un buen modelo para el número de fallos por
hora, en primer lugar determinamos un valor para el parámetro 𝜆 imponiendo la condición de
que la media muestral y la media de la distribución coincidan. Para ello tomamos 𝜆 = 0.979.
Representamos las probabilidades asociadas a una distribución de Poisson con ese valor de 𝜆,
calculadas mediante la fórmula

0.979𝑘 exp(−0.979)
Pr(𝑋 = 𝑘) =
𝑘!

y las frecuencias observadas, obteniendo el gráfico que se muestra en la celda de R más abajo.
Observamos que el ajuste parece razonable en este caso.
3. El valor pedido es

Pr(𝑋 ≥ 1) = 1 − Pr(𝑋 = 0) = 1 − exp(−0.979) = 0.624

A continuación se muestran los resultados en R correspondientes a las respuestas anteriores.

[ ]: # Ejercicio 13

cat("\n Ejercicio 13.1 .- \n")

## Introduccion de datos y obtencion de frecuencias relativas

p13.df = data.frame(val = seq(0,5), frec = c(41,29,15,7,2,1))


p13.df$frec = p13.df$frec/sum(p13.df$frec)

33
cat("\n Valores y frecuencias relativas del número de errores:\n\n")
p13_df_hux <-
hux(p13.df) %>%
set_bold(row = 1, col = everywhere, value = TRUE) %>%
set_all_borders(TRUE)
print_screen(p13_df_hux,colnames = FALSE)

## Media de los datos y varianza

mn.e13 = sum(p13.df$val*p13.df$frec)
cat(sprintf("\n\nMedia del número de errores : %8.3f\n",mn.e13))
mn2.e13 = sum(p13.df$val^2*p13.df$frec)
vr.e13 = mn2.e13 - mn.e13^2
cat(sprintf("Varianza del número de errores : %8.3f\n",vr.e13))

cat("\n Ejercicio 13.2 .- \n")

## Probabilidades Poisson

p13.df$prb = dpois(seq(0,5),mn.e13)

## Funcion de probabilidad de distribucion Poisson y frecuencias observadas

cat("\n Diagrama de barras y probabilidades para la variable X:\n\n")

p13.df2 = melt(p13.df, id.vars = "val")


p13.pbp = p13.df2 %>% ggplot(aes(x = val, y = value, fill = variable)) +
geom_bar(stat = "identity", position = "dodge", width = 0.7) +
ggtitle("Probabilidades Poisson - frecuencias") +
xlab("Numero de errores") + ylab("Probabilidad/Frecuencia") +
theme(plot.title = element_text(color="blue", size=13, face="bold.italic",␣
↪hjust=0.5)) +

scale_fill_manual(values=c("steelblue","deepskyblue1"))
plot(p13.pbp)

3.11 Ejercicio 14
El coste de producción de cierta máquina que se fabrica por encargo es de 4300 euros por máquina
cuando se producen menos de cinco unidades. Si se producen de cinco a nueve unidades, el coste
por máquina baja a 4000 euros. Y cuando se producen diez o más unidades el coste por unidad
baja a 3500 euros.
La demanda de estas máquinas fluctúa según una distribución de Poisson con valor esperado igual
a 8.
1. Si el precio de venta unitario es de 5000 euros, calcula el beneficio esperado por máquina.
2. Si vendemos cada máquina a 3810 euros, calcula la probabilidad de que la empresa pierda

34
dinero.
3. Para este precio de venta (3810 euros), calcula el beneficio total esperado.

3.11.1 Solución - Ejercicio 14


De los datos del problema tenemos que la distribución de Poisson correspondiente al número de
máquinas demandadas, 𝑋, tiene como valor del parámetro 𝜆 = 8.
1. Para un precio de venta 𝑃𝑣 , la ganancia de la empresa por máquina fabricada tiene la forma
siguiente:

⎧ 𝑃 − 4300 si 𝑋 ≤ 4
{ 𝑣
𝐺= 𝑃𝑣 − 4000 si 4 < 𝑋 ≤ 9

{
⎩ 𝑃𝑣 − 3500 si 9 < 𝑋

Su valor esperado vendrá dado por

4 9
𝐸[𝐺] = (𝑃𝑣 − 4300) ∑𝑘=0 Pr(𝑋 = 𝑘) + (𝑃𝑣 − 4000) ∑𝑘=5 Pr(𝑋 = 𝑘)

+(𝑃𝑣 − 3500) ∑𝑘=10 Pr(𝑋 = 𝑘)
𝑘
Pr(𝑋 = 𝑘) = 8 exp(−8)
𝑘!

Podemos simplificar estas expresiones teniendo en cuenta que

4
∑𝑘=0 Pr(𝑋 = 𝑘) = 0.100
9
∑𝑘=5 Pr(𝑋 = 𝑘) = 0.617
∞ 9
∑𝑘=10 Pr(𝑋 = 𝑘) = 1 − ∑𝑘=0 Pr(𝑋 = 𝑘) = 1 − (0.100 + 0.617) = 0.283
• Si 𝑃𝑣 = 5000, tenemos que

4 9 ∞
𝐸[𝐺] = 700 ∑𝑘=0 Pr(𝑋 = 𝑘) + 1000 ∑𝑘=5 Pr(𝑋 = 𝑘) + 1500 ∑𝑘=10 Pr(𝑋 = 𝑘)
= 700 × 0.100 + 1000 × 0.617 + 1500 × 0.283 = 1083.46
• Si 𝑃𝑣 = 3810, la variable 𝐺 tiene función de probabilidad

⎧ −490 si 𝑋 ≤ 4
{
𝐺 = ⎨ −190 si 4 < 𝑋 ≤ 9
{
⎩ 310 si 9 < 𝑋

2. La ganancia total 𝐺𝑇 a su vez está definida como 𝐺𝑇 = 𝐺𝑋, y nos piden calcular Pr(𝐺𝑇 < 0).
Pero como 𝑋 ≥ 0, 𝐺𝑇 < 0 se cumple si y solo si 𝐺 < 0 y 𝑋 > 0, luego

Pr(𝐺𝑇 < 0) = Pr((𝐺 < 0) ∩ (𝑋 > 0)) = Pr(0 < 𝑋 ≤ 9) = 𝐹 (9) − 𝐹 (0) = 0.716

3. Para obtener el valor esperado pedido, tenemos en cuenta que

35
⎧ −490𝑋 si 𝑋 ≤ 4
{
𝐺𝑇 = ⎨ −190𝑋 si 4 < 𝑋 ≤ 9
{
⎩ 310𝑋 si 9 < 𝑋

El valor esperado de esta variable se puede obtener como

4 9 ∞
𝐸[𝐺𝑇 ] = ∑(−490𝑘) Pr(𝑋 = 𝑘) + ∑(−190𝑘) Pr(𝑋 = 𝑘) + ∑ 310𝑘 Pr(𝑋 = 𝑘).
𝑘=0 𝑘=5 𝑘=10

Para simplificar el cálculo del último término de la suma, utilizamos el resultado siguiente:

∞ 9 9
∑ 𝑘 Pr(𝑋 = 𝑘) = 𝐸[𝑋] − ∑ 𝑘 Pr(𝑋 = 𝑘) = 𝜆 − ∑ 𝑘 Pr(𝑋 = 𝑘).
𝑘=10 𝑘=0 𝑘=0

Obtenemos finalmente 𝐸[𝐺𝑇 ] = 8.098.

[ ]: # Ejercicio 14

## Probabilidades de interés

prb.1 = ppois(4,8)
prb.2 = ppois(9,8) - ppois(4,8)
prb.3 = 1 - ppois(9,8)

cat(sprintf("\n\nProbabilidad de X <= 4 : %6.3f",prb.1))


cat(sprintf("\nProbabilidad de 4 < X <= 9 : %6.3f",prb.2))
cat(sprintf("\nProbabilidad de 9 < X : %6.3f",prb.3))

## Probabilidad de pérdidas

prb.4 = ppois(9,8) - ppois(0,8)

cat(sprintf("\n\nProbabilidad de 0 < X <= 9 : %6.3f",prb.4))

## Valor esperado del beneficio total

ve.bt = -490*sum(seq(0,4)*dpois(seq(0,4),8)) -␣
↪190*sum(seq(5,9)*dpois(seq(5,9),8))

ve.bt = ve.bt + 310*(8 - sum(seq(0,9)*dpois(seq(0,9),8)))

cat(sprintf("\n\nValor esperado benef total : %6.3f",ve.bt))

36
4 Exámenes de años anteriores
4.1 Ejercicio 15
(Parcial 2019) Una variable aleatoria discreta, 𝑋, tiene función de probabilidad 𝑝𝑘 = Pr(𝑋 = 𝑘) =
1/𝑁 para 𝑘 = 1, … , 𝑁 , donde 𝑁 ≥ 2 es un valor entero. Justifica que se cumple la siguiente
igualdad:
𝑁2 − 1
Var[𝑋] =
12

Ayuda: se cumple que


𝑁 𝑁
𝑁 (𝑁 + 1) 𝑁 (𝑁 + 1)(2𝑁 + 1)
∑𝑘 = , ∑ 𝑘2 =
𝑘=1
2 𝑘=1
6

4.1.1 Solución - Ejercicio 15


Calculamos la media de la variable 𝑋,
𝑁
1 𝑁 𝑁 (𝑁 + 1) 𝑁 +1
𝐸[𝑋] = ∑ 𝑘𝑝𝑘 = ∑𝑘 = = .
𝑖=1
𝑁 𝑖=1 2𝑁 2

Podemos obtener ahora el valor de la varianza como


𝑁 2 (𝑁+1) 𝑁 2
Var(𝑋) = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 = ∑𝑖=1 𝑘2 𝑝𝑘 − ( 𝑁+1 1 2
2 ) = 𝑁 ∑𝑖=1 𝑘 − 4
𝑁 (𝑁 + 1)(2𝑁 + 1) (𝑁 + 1)2 𝑁 + 1 2𝑁 + 1 𝑁 + 1 𝑁 +1𝑁 −1
= − = ( − )=
6𝑁 4 2 3 2 2 6
𝑁2 − 1
=
12

4.2 Ejercicio 16
Una variable aleatoria discreta tiene la siguiente función de distribución:

Valor 0 1 2 3 4
Probabilidad 0.05 0.30 0.75 0.90 1

Calcula su esperanza y su varianza.

4.2.1 Solución - Ejercicio 16


La esperanza de 𝑋 se define como
4
𝐸[𝑋] = ∑ 𝑘 Pr(𝑋 = 𝑘)
𝑘=0

También se cumple que 𝑃 (𝑋 = 𝑘) = 𝐹 (𝑘) − 𝐹 (𝑘 − 1) (donde 𝐹 denota la función de distribución


de 𝑋).

37
En nuestro caso tenemos que
4 4
𝐸[𝑋] = ∑𝑘=0 𝑘 Pr(𝑋 = 𝑘) = ∑𝑘=0 𝑘(𝐹 (𝑘) − 𝐹 (𝑘 − 1))
= 0 × 0.05 + 1 × 0.25 + 2 × 0.45 + 3 × 0.15 + 4 × 0.1 = 2

Para la varianza tenemos como definición


4
Var(𝑋) = ∑(𝑘 − 𝐸[𝑋])2 Pr(𝑋 = 𝑘)
𝑘=0

y en nuestro caso obtenemos


4
Var(𝑋) = ∑𝑘=0 (𝑘 − 2)2 (𝐹 (𝑘) − 𝐹 (𝑘 − 1))
= 4 × 0.05 + 1 × 0.25 + 0 × 0.45 + 1 × 0.15 + 4 × 0.1 = 1

4.3 Ejercicio 17
(Parcial 2019) Dispones de una muestra (aleatoria simple) del número de errores que se producen
en un proceso durante un cierto periodo de tiempo.
La muestra recoge valores de errores para 40 periodos. Las frecuencias de los números de errores
en cada periodo son las siguientes:

# Errores 0 1 2 3 4 Total
Frecuencia 11 12 9 6 2 40

1. Calcula la media y varianza muestral de los errores en un periodo.


2. Definimos una variable aleatoria 𝑋 cuyo valor es el número de errores durante cada periodo
de tiempo. Suponemos que 𝑋 sigue una distribución de Poisson. Determina un valor del
parámetro de dicha distribución que ajuste lo mejor posible los datos de la muestra.
3. Calcula la función de distribución de esta variable aleatoria 𝑋.
4. Comenta si te parece razonable utilizar una distribución de Poisson para 𝑋.
5. Calcula la probabilidad de que el número de errores en un periodo de tiempo sea igual o
superior a 1 e igual o inferior a 3.

4.3.1 Solución - Ejercicio 17


1. Si 𝑓𝑘 denota la frecuencia relativa para 𝑘 errores observados, los valores pedidos se pueden
obtener como
4
𝑥̄ = ∑ 𝑘𝑓𝑘 = (12 + 18 + 18 + 8)/40 = 56/40 = 1.4
𝑘=0

Con este valor podemos calcular la varianza como


4
1
𝑠2 = ∑(𝑘 − 𝑥)̄ 2 𝑛𝑓𝑘 = (1.42 × 11 + 0.42 × 12 + 0.62 × 9 + 1.62 × 6 + 2.62 × 2)/39
𝑛 − 1 𝑘=0
= 1.426

38
2. Podemos escoger el valor del parámetro 𝜆 aplicando la condición de que la esperanza de
la distribución coincida con la media de los datos en la muestra. Para ello seleccionamos
𝜆 = 𝐸[𝑋] = 𝑥̄ = 1.4.
3. Para calcular la función de distribución emplearemos la fórmula de los valores de la función
de probabilidad
1.4𝑘 exp(−1.4)
Pr(𝑋 = 𝑘) =
𝑘!

Obtenemos los siguientes valores:

# Errores 0 1 2 3 4 5
Probs 0.2466 0.3452 0.2417 0.1128 0.0395 0.0110

Acumulando estas probabilidades obtenemos la función de distribución como

# Errores 0 1 2 3 4 5
𝐹 0.2466 0.5918 0.8335 0.9463 0.9857 0.9968

4. Por una parte, tenemos que la media y la varianza de la distribución se parecen mucho (la
media coincide) a la media y varianza de la muestra.
Por otra parte, las frecuencias relativas de la muestra,

# Errores 0 1 2 3 4
Frecs 0.275 0.3 0.225 0.15 0.05

son algo distintas de los valores de la función de probabilidad, pero tampoco excesivamente,
por lo que el modelo de Poisson seleccionado parece razonable para estos datos.
5. A partir de la función de distribución podemos obtener el valor solicitado como

Pr(1 ≤ 𝑋 ≤ 3) = Pr(0 < 𝑋 ≤ 3) = 𝐹 (3) − 𝐹 (0) = 0.9463 − 0.2466 = 0.6997

4.4 Ejercicio 18
(Parcial 2019) Una compañía fabrica accesorios para otra empresa, que se encarga de integrarlos
en sus productos. La compañía fabricante sabe que en su proceso aproximadamente uno de cada
20 accesorios tiene algún defecto.
La empresa cliente recibe el producto en lotes. Su procedimiento para aceptar un lote consiste
en seleccionar (sin reemplazamiento) 4 accesorios de manera aleatoria y someterlos a prueba. Si
ninguno de los accesorios presenta defectos, el cliente acepta el lote.
1. Calcula los valores de la función de probabilidad de la variable aleatoria 𝑋, cuyo valor es el
número de accesorios defectuosos entre los 4 seleccionados.

39
2. Indica el valor esperado y la varianza de 𝑋.
3. Si se acepta el lote, la compañía fabricante recibe un ingreso por la venta del mismo de 2800
euros. Si se rechaza, la compañía no recibe ingresos y tiene que pagar 1000 euros por los
costes de las pruebas y la devolución del lote rechazado.
Calcular la ganancia esperada por la compañía fabricante.
4. Si los lotes son de 50 unidades y un lote contiene 3 productos defectuosos, calcula la proba-
bilidad de rechazar ese lote aplicando la regla anterior.

4.4.1 Solución - Ejercicio 18


1. Con los datos de que disponemos podemos suponer que la variable aleatoria 𝑋 seguirá una
distribución binomial con parámetros 𝑛 = 4 y 𝑝 = 1/20 = 0.05.
La función de probabilidad para esta variable aleatoria es

4 1 𝑘 19 4−𝑘 4 194−𝑘
Pr(𝑋 = 𝑘) = ( ) ( ) ( ) =( ) .
𝑘 20 20 𝑘 204
Los valores de la función son

# Defectos 0 1 2 3 4
Probs 0.8145 0.1715 0.0135 0.000475 0.00000625

2. Para una distribución binomial, su esperanza y su varianza vienen dadas por

𝐸[𝑋] = 𝑛𝑝 = 0.2, Var(𝑋) = 𝑛𝑝(1 − 𝑝) = 0.19

3. Tenemos que calcular el valor esperado de otra variable aleatoria, la ganancia 𝐺, que es una
función de 𝑋. El valor de 𝐺 se define como
2800 si 𝑋 = 0
𝐺={
−1000 si 𝑋 > 0.

Como la variable solo toma dos valores, su valor esperado es

𝐸[𝐺] = 2800 Pr(𝐺 = 2800) − 1000 Pr(𝐺 = −1000)


= 2800 Pr(𝑋 = 0) − 1000 Pr(𝑋 > 0) = 2800 × 0.8145 − 1000 × (1 − 0.8145)
= 2095.12

4. En este caso la distribución a emplear es una hipergeométrica con parámetros 𝑁 = 50, 𝐾 = 3,


𝑛 = 4. El valor que nos piden, aplicando las fórmulas de su función de probabilidad, es
3 47
( )( )
Pr(𝑋 = 0) = 0 4 = 0.7745
50
( )
4
Pr(rechazar lote) = Pr(𝑋 > 0) = 1 − 0.7745 = 0.2255

40
[ ]:

41

También podría gustarte