Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hoja 3 S
Hoja 3 S
Solución.
2) Sin reemplazamiento:
4 3
Pr(X ≥ 1) = 1 − P (X = 0) = 1 − × = 0,6
6 5
b) En este caso debemos calcular las probabilidades correspondientes a X = 0, 1, 2,
aunque en el apartado anterior ya hemos obtenido el valor para X = 0.
1) Con reemplazamiento. Tenemos que (obsérvese que se trata de una distribución
binomial con n = 2 y p = 2/6),
2 2
4 2
Pr(X = 0) = = 0,444, Pr(X = 2) = = 0,111
6 6
Pr(X = 1) = 1 − Pr(X = 0) − Pr(X = 2) = 0,444
O también
42
Pr(X = 1) = 2 = 0,444
66
1
2) Sin reemplazamiento (este caso corresponde a una distribución hipergeométrica):
4 3 2 1
Pr(X = 0) = × = 0,4, Pr(X = 2) = × = 0,067
6 5 6 5
Pr(X = 1) = 1 − Pr(X = 0) − Pr(X = 2) = 0,533
O también
42
Pr(X = 1) = 2 = 0,533
65
c) Las funciones de distribución se obtienen acumulando las probabilidades correspon-
dientes a las funciones de probabilidad. Se tiene
Con reeempl. Sin reeempl.
k 0 1 2 k 0 1 2
Pr(X ≤ k) 0,444 0,888 1 Pr(X ≤ k) 0,4 0,933 1
La representación gráfica de estas funciones de distribución, teniendo en cuenta que
son funciones constantes a tramos, será
2. Se venden 5000 boletos de loterı́a a 1 euro cada uno, para el sorteo de un premio de 2000
euros. Determinar la ganancia promedio de una persona que compra tres boletos de loterı́a.
La probabilidad de obtener el premio con estos tres boletos es (se obtiene como casos
favorables sobre casos totales),
3
Pr(L = 1) =
5000
La ganancia promedio vendrá dada por
4997 3
E[G] = G(0) Pr(L = 0) + G(1) Pr(L = 1) = (−3) × + 1997 × = −1,8 euros
5000 5000
2
3. En unas oposiciones el temario consta de 85 temas. Se seleccionan tres temas al azar entre
los 85, sin reemplazamiento. Si un opositor domina 35 de los 85 temas, calcular:
Solución. Denotamos como X el número de temas que el opositor domina, entre los tres
temas seleccionados. Por tanto, X toma valores en {0, 1, 2, 3}.
Suponemos que la selección de cada uno de los temas es independiente y se hace sin
reemplazamiento.
3
d ) De su definición tenemos que F (1,5) = Pr(X ≤ 1,5). Para calcular esta probabilidad
podemos emplear la función de probabilidad, y obtenemos
e) El valor esperado de X es
4
E[X] = kpk = 0,434 + 2 × 0,301 + 3 × 0,066 = 1,235
k=1
4. Un estanque contiene 500 peces de los cuales 300 están marcados. Un pescador logra sacar
50 peces. Hallar la probabilidad de que:
Solución. Denotamos por X el número de peces marcados entre los 50 extraı́dos. Si supo-
nemos que la extracción se realiza con reemplazamiento, podemos emplear una distribución
binomial con n = 50 y p = 300/500 para el número de peces marcados.
a) El valor pedido es
50 20
P (X = 20) = p (1 − p)30 = 0,0020
20
b) La probabilidad pedida es
4
Si los cálculos se hubiesen realizado suponiendo que no hay reemplazamiento, empleando
una distribución hipergeométrica, los valores resultantes serı́an 0,00133 y 1,96 10−22 .
5. Sea X la v.a. que representa el número de caras obtenidas en cuatro lanzamientos de una
moneda equilibrada.
Solución.
5
c) De los valores anteriores,
d ) A continuación se muestran los gráficos con las comparaciones pedidas, para una
muestra simulada de 100 observaciones de una distribución binomial con los paráme-
tros indicados.
6
6. Una máquina empaqueta pastillas en tubos de 20 unidades. El archivo 3Defectuosas.csv
proporciona el número de pastillas defectuosas producidas en cada uno de los 1000 tubos
examinados en un control de calidad. De los datos de dicho fichero se tiene la siguiente
tabla de frecuencias:
# defectos 0 1 2 3
Frecuencia 806 173 19 2
Solución.
7
Un procedimiento para obtener p consiste en ajustar el valor esperado de la distri-
bución binomial, np con n = 20, para que coincida con el valor medio de la muestra.
Obtenemos
x̄ 0,217
x̄ = 0,173 × 1 + 0,019 × 2 + 0,002 × 3 = 0,217 = np ⇒ p̂ = = = 0,01085
n 20
Para este valor p = p̂ las probabilidades teóricas y las proporciones en la muestra son
k 0 1 2 3 4
Pr(X = k) 0,804 0,176 0,018 0,0012 5,64 10−5
Proporción 0,806 0,173 0,019 0,002 0
y se tiene un ajuste bastante razonable.
b) La función de probabilidad vendrá dada por
20
Pr(X = k) = (1 − 0,01085)k 0,0108520−k , k = 0, . . . , 20
k
Los valores para k = 0, 1, 2, 3, 4) se han indicado en la tabla del apartado anterior.
c) Denotamos por Y la variable aleatoria que indica cuántos tubos no tienen pastillas
defectuosas en un lote de 25 tubos. La probabilidad de que un tubo no tenga ninguna
pastilla defectuosa es py = (1 − p̂)20 = 0,804.
Nuestra variable Y también sigue una distribución binomial, pero los valores de los
parámetros son n = 25, p = py = 0,804 y nos piden la probabilidad correspondiente
a Y = k = 20. Este valor es
25 20
Pr(Y = 20) = p (1 − py )5 = 0,1958
20 y
7. Una lı́nea de autobuses cubre una ruta con un autobús que tiene 50 plazas. La lı́nea aceptó
60 reservas para un viaje. Se supone que todos los pasajeros actúan en forma independiente
y se estima que 1 de cada 10 pasajeros que hacen la reserva no se presentan. El precio
del billete es 25 euros, pero si un pasajero se presenta y no puede ser embarcado, se le
reintegra su dinero más una compensación de 5 euros. Calcular:
Solución.
E[X] = np = 60 × 0,9 = 54
8
Su valor esperado se puede obtener como
10
10
E[Y ] = k Pr(Y = k) = k Pr(X = 50 + k) = 4,057
k=0 k=1
9
2) Los valores de las probabilidades (probabilidades de una distribución hiper-
geométrica) son ahora
200 199 198 197
Pr(X = 0) = × × × = 0,038
450 449 448 447
250 200 199 198
Pr(X = 1) = 4× × × × = 0,195
450 449 448 447
250 249 200 199
Pr(X = 2) = 6× × × × = 0,367
450 449 448 447
250 249 248 200
Pr(X = 3) = 4× × × × = 0,305
450 449 448 447
250 249 248 247
Pr(X = 4) = × × × × = 0,094
450 449 448 447
9. Se recibe un lote de 1000 bolı́grafos de los cuales 60 no escriben. Para decidir si se acepta
o no el lote se seleccionan 200 bolı́grafos al azar, sin remplazo, rechazando el lote si más
de x no escriben.
10
b) Respondemos a esta pregunta a partir de los valores de la función de distribución
de X, F (x), que obtenemos acumulando los valores de las probabilidades anteriores
(o directamente de la función de R phyper). Tenemos en cuenta que la condición a
cumplir es:
Tenemos que
k 15 16 17
F (k) 0,876 0,929 0,962
Por tanto, el valor pedido serı́a x = 17.
10. En un almacén se guardan 1000 piezas de las cuales 100 son defectuosas. Un inspector
toma una de las piezas al azar, y si no es defectuosa la devuelve al almacén.
Sea N el número de inspecciones de piezas no defectuosas antes de encontrar la primera
defectuosa. Calcular la probabilidad de que este número de inspecciones, N , esté entre 25
y 60, ambos incluidos.
11. El archivo 3LecturasBarras.csv recoge las lecturas erróneas (fallos) de un lector óptico
de barras en una muestra de 200 lecturas. Las frecuencias recogidas en dicho fichero son:
k 0 1
Frecuencias 191 9
Solución.
11
a) Suponiendo las lecturas independientes, podemos aproximar la variable aleatoria que
representa un fallo, X, mediante una distribución Bernoulli con p = 9/200, valor
obtenido a partir de la tabla de frecuencias.
b) El número de fallos en las siguientes 10 lecturas sigue una distribución binomial con
n = 10 y el valor de p anterior. Tenemos
Pr(X = 1) = 10p(1 − p)9 = 0,297
c) El número de lecturas sin fallos hasta el primer fallo sigue una distribución geométrica
con el valor de p anterior. Si denotamos el número de lecturas hasta el primer fallo
como N , nos piden calcular
Pr((N2 > 20) ∩ (N1 > 10)) Pr(N > 30)
Pr(N2 > 20|N1 > 10) = =
Pr(N1 > 10) Pr(N1 > 10)
Si tenemos en cuenta que
∞
1
Pr(N > k) = (1 − p)i p = (1 − p)k+1 p = (1 − p)k+1
1 − (1 − p)
i=k+1
obtenemos
(1 − p)31
Pr(N2 > 20|N1 > 10) = = (1 − p)20 = 0,398
(1 − p)11
12. El archivo 3Fallos.csv recoge los fallos por hora de un aparato eléctrico registrados en
20 horas de funcionamiento. La tabla de frecuencias de los datos del fichero es
k 0 1 2 3 4
Frecuencia 4 5 5 5 1
Se pide calcular:
a) Una estimación del número medio de fallos por hora que se espera que tenga el aparato
y de la varianza en este número de fallos por hora.
b) Suponiendo que la estimación es adecuada, examinar si una distribución de Poisson
es un buen modelo para el número de fallos por hora.
c) Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que el
aparato funcione bien durante una hora distinta de las consideradas en la muestra.
d ) Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que el
aparato funcione bien durante dos horas distintas de las consideradas en la muestra.
Solución.
a) Si denotamos por X el número de fallos por hora del aparato, el valor esperado en la
muestra, obtenido a partir de la tabla de frecuencias, es
x̄ = (5 + 2 × 5 + 3 × 5 + 4)/20 = 1,7
Y la varianza muestral es
s2 = ((4 × (−1,7)2 + 5 × (1 − 1,7)2 + 5 × (2 − 1,7)2 + 5 × (3 − 1,7)2 + (4 − 1,7)2 )/19
= (5 × 12 + 5 × 22 + 5 × 32 + 42 − 20 × 1,72 )/19 = 1,484
algo menor que la media muestral (para una distribución de Poisson, E[X] = Var[X]).
12
b) Para examinar si una distribución de Poisson es un buen modelo para el número
de fallos por hora, en primer lugar seleccionamos un valor para el parámetro λ.
Lo hacemos imponiendo la condición de que la media muestral y la media de la
distribución coincidan. Por ello, tomamos λ = 1,7.
A continuación representamos las probabilidades asociadas a una distribución de Pois-
son con ese valor de λ, calculadas mediante la fórmula
1,7k exp(−1,7)
Pr(X = k) =
k!
(o también mediante el comando de R dpois) y las frecuencias observadas, obteniendo
el gráfico
1,70 exp(−1,7)
Pr(X = 0) = = exp(−1,7) = 0,183
0!
d ) En este caso nos piden calcular el valor de Pr((X1 = 0) ∩ (X2 = 0)), donde X1 y
X2 son los fallos en la primera y segunda hora. Bajo una distribución Poisson ambos
sucesos son independientes, y por tanto
13. La siguiente tabla muestras las frecuencias absolutas del número de errores por 10.000
lı́neas de código en un proyecto de desarrollo de software, para una muestra de 950.000
lı́neas.
# errores 0 1 2 3 4 5 Total
frecuencia 41 29 15 7 2 1 95
Calcular:
a) Una estimación del número medio de errores por 10.000 lı́neas que se esperan en este
proyecto y de su varianza.
13
b) Suponiendo que la estimación es adecuada, examinar si una distribución de Poisson
es un buen modelo para el número de errores por 10.000 lı́neas de código.
c) Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que en
10.000 lı́neas escogidas al azar haya al menos un error.
Solución.
a) Denotando por X la variable que tiene como valor el número de errores por 10.000
lı́neas de código en el proyecto, de los valores de las frecuencias obtenemos
5
1
x̄ = kfk = (29 + 2 × 15 + 3 × 7 + 4 × 2 + 5)/95 = 0,979
n
k=0
0,979k exp(−0,979)
Pr(X = k) =
k!
o también mediante el comando de R dpois, y las frecuencias observadas, obteniendo
el gráfico
14
14. El coste de producción de cierta máquina que se fabrica por encargo es de 4300 euros
por máquina cuando se producen menos de cinco unidades. Si se producen de cinco a
nueve unidades, el coste por máquina baja a 4000 euros. Y cuando se producen diez o más
unidades el coste por unidad baja a 3500 euros.
La demanda de estas máquinas fluctúa según una distribución de Poisson con valor espe-
rado igual a 8.
a) Si el precio de venta unitario es de 5000 euros, calcular la ganancia neta esperada por
máquina.
b) Si vendemos cada máquina a 3810 euros, calcular la probabilidad de que la empresa
pierda dinero.
Solución. De los datos del problema tenemos que la distribución de Poisson correspon-
diente al número de máquinas demandadas, X, tiene como valor del parámetro λ = 8.
Para un precio de venta Pv , la ganancia de la empresa tiene la forma siguiente:
(Pv − 4300)X si X ≤ 4
G= (Pv − 4000)X si 4 < X ≤ 9
(Pv − 3500)X si 9 < X
15
b) Si Pv = 3810, entonces
4
9
∞
E[G] = −490 k Pr(X = k) − 190 k Pr(X = k) + 310 k Pr(X = k)
k=0 k=5 k=10
= −490 × 0,339 − 190 × 4,401 + 310 × 3,260 = 8,3
15. (Parcial 2019) Una variable aleatoria discreta, X, tiene función de probabilidad pk =
Pr(X = k) = 1/N para k = 1, . . . , N , donde N ≥ 2 es un valor entero. Justifica que se
cumple la siguiente igualdad:
N2 − 1
Var[X] =
12
Ayuda: se cumple que
N
N
N (N + 1) N (N + 1)(2N + 1)
k= , k2 =
2 6
k=1 k=1
16. (Parcial 2019) Una variable aleatoria discreta tiene la siguiente función de distribución:
Valor 0 1 2 3 4
Probabilidad 0,05 0,30 0,75 0,90 1
16
También se cumple que P (X = k) = F (k) − F (k − 1) (donde F denota la función de
distribución de X).
En nuestro caso tenemos que
4
4
E[X] = k Pr(X = k) = k(F (k) − F (k − 1))
k=0 k=0
= 0 × 0,05 + 1 × 0,25 + 2 × 0,45 + 3 × 0,15 + 4 × 0,1 = 2
17. (Parcial 2019) Dispones de una muestra (aleatoria simple) del número de errores que se
producen en un proceso durante un cierto periodo de tiempo.
La muestra recoge valores de errores para 40 periodos. Las frecuencias de los números de
errores en cada periodo son las siguientes:
# Errores 0 1 2 3 4 Total
Frecuencia 11 12 9 6 2 40
Solución.
a) Si fk denota la frecuencia relativa para k errores observados, los valores pedidos se
pueden obtener como
4
x̄ = kfk = (12 + 18 + 18 + 8)/40 = 56/40 = 1,4
k=0
17
b) Podemos escoger el valor del parámetro λ aplicando la condición de que la esperanza
de la distribución coincida con la media de los datos en la muestra.
Para ello seleccionamos λ = E[X] = x̄ = 1,4.
c) Para calcular la función de distribución emplearemos la fórmula de los valores de la
función de probabilidad
1,4k exp(−1,4)
Pr(X = k) =
k!
Obtenemos los siguientes valores
# Errores 0 1 2 3 4 5
Pr(X = k) 0,2466 0,3452 0,2417 0,1128 0,0395 0,0110
Acumulando estas probabilidades obtenemos la función de distribución como
# Errores 0 1 2 3 4 5
Pr(X ≤ k) 0,2466 0,5918 0,8335 0,9463 0,9857 0,9968
d ) Por una parte, tenemos que la media y la varianza de la distribución se parecen mucho
(la media coincide) a la media y varianza de la muestra.
Por otra parte, las frecuencias relativas de la muestra,
# Errores 0 1 2 3 4
Frec. rel. 0,275 0,3 0,225 0,15 0,05
son algo distintas de los valores de la función de probabilidad, pero tampoco excesi-
vamente, por lo que el modelo de Poisson seleccionado parece razonable para estos
datos.
e) A partir de la función de distribución podemos obtener el valor solicitado como
18. (Parcial 2019) Una compañı́a fabrica accesorios para otra empresa, que se encarga de inte-
grarlos en sus productos. La compañı́a fabricante sabe que en su proceso aproximadamente
uno de cada 20 accesorios tiene algún defecto.
La empresa cliente recibe el producto en lotes. Su procedimiento para aceptar un lote
consiste en seleccionar (sin reemplazamiento) 4 accesorios de manera aleatoria y someterlos
a prueba. Si ninguno de los accesorios presenta defectos, el cliente acepta el lote.
Solución.
18
a) De la descripción del problema serı́a razonable suponer que la variable aleatoria X
sigue una distribución hipergeométrica. Pero con los datos de que disponemos no
tenemos información suficiente para encontrar los valores de los tres parámetros de
dicha distribución, N , K y n. Con la información disponible solo podemos estimar
dos parámetros, n y p. Por ello, vamos a suponer que la variable aleatoria X sigue
aproximadamente una distribución binomial con parámetros n = 4 y p = 1/20 = 0,05.
La función de probabilidad para esta variable aleatoria es
k 4−k 4−k
4 1 19 4 19
Pr(X = k) = = .
k 20 20 k 204
Los valores de la función son
# Defectos 0 1 2 3 4
Pr(X = k) 0,8145 0,1715 0,0135 4,75 10−4 6,25 10−6
b) Para una distribución binomial, su esperanza y su varianza vienen dadas por
c) Tenemos que calcular el valor esperado de otra variable aleatoria, la ganancia G, que
es una función de X. El valor de G se define como
2800 si X = 0
G=
−1000 si X > 0.
19. (Final 2020) Una empresa ha recogido información entre clientes que compraron un aparato
electrónico, para realizar un estudio de fiabilidad. Se han estudiado dos categorı́as de fallos
(F1 , F2 ), y el estudio ha diferenciado entre los resultados de usuarios habituales, H, y de
usuarios ocasionales O = H c .
Entre los usuarios habituales, un 10,2 % han tenido un fallo de tipo F1 , un 9,3 % han
tenido un fallo de tipo F2 y un 84,6 % no han tenido ningún fallo. Un 9,5 % de los usuarios
ocasionales han tenido un fallo de tipo F1 , un 7,1 % han tenido un fallo de tipo F2 y un
3,9 % han tenido ambos tipos de fallos. Los usuarios habituales son un 42,4 % del total de
los clientes en la muestra.
Se pide que contestes a las preguntas siguientes, si seleccionas un cliente de la muestra al
azar:
19
a) ¿Cuál es la probabilidad de que el cliente no haya tenido ningún fallo y sea usuario
habitual?
b) Si el cliente seleccionado es un usuario ocasional, ¿cuál es la probabilidad de que haya
tenido algún tipo de fallos?
c) ¿Cuál es la probabilidad de que el cliente haya tenido un fallo de tipo F2 ?
d ) Si sabes que el cliente seleccionado ha tenido un fallo de tipo F1 , ¿cuál es la proba-
bilidad de que sea un usuario habitual? ¿Y de que sea un usuario ocasional?
e) ¿Qué distribución sigue el número de clientes que no han tenido ningún fallo en
su dispositivo, entre los 4 seleccionados? Indica el valor de los parámetros de dicha
distribución.
f ) Calcula la probabilidad de que el número de clientes entre los 4 que no ha tenido
ningún fallo sea mayor (estrictamente) que 2.
g) Calcula el valor esperado del coste de reparación para un cliente escogido al azar. Si
el cliente no ha tenido ningún fallo, el coste de reparación es 0.
a) Nos piden calcular Pr((F1 ∪ F2 )c ∩ H), valor que podemos obtener como
Si se quisiera verificar la igualdad anterior (lo cual no era necesario para el examen),
esta es consecuencia de
20
c) La probabilidad pedida es ahora Pr(F2 ), que podemos obtener como (probabilidad
total)
Pr(H)
Pr(H | F1 ) = Pr(F1 | H)
Pr(F1 )
Pr(F1 ) = Pr(F1 | H) Pr(H) + Pr(F1 | H c ) Pr(H c ) = 0,102 × 0,424 + 0,095 × 0,576
= 0,098
0,424
Pr(H | F1 ) = 0,102 = 0,441
0,098
e) Denotamos por N el número de clientes sin fallos en sus dispositivos entre los 4
seleccionados al azar. La distribución de N será una Binomial con parámetros n = 4
y p que será igual a la probabilidad de que un cliente no tenga ningún fallo, que vale
p = Pr((F1 ∪ F2 )c ) = 1 − Pr(F1 ∪ F2 )
Pr(F1 ∪ F2 ) = Pr(F1 ∪ F2 | H) Pr(H) + Pr(F1 ∪ F2 | H c ) Pr(H c )
= (1 − 0,846) × 0,424 + 0,127 × (1 − 0,424) = 0,138
p = 1 − 0,138 = 0,862
20. (Final 2020) Se ha recogido información sobre las preferencias de 60 personas sobre la
compra de un producto electrónico. Estas preferencias se miden en una escala entre 0
(menor preferencia) y 5 (mayor preferencia).
Sabemos que las 60 personas en la muestra procedı́an de dos regiones diferentes, 36 personas
de la región A y 24 personas de la región B. Los valores de sus respuestas se resumen en
la tabla de frecuencias siguiente:
21
Preferencia
0 1 2 3 4 5
Región A 0 1 2 10 15 8
Región B 0 0 0 2 13 9
Solución.
22