Está en la página 1de 22

Probabilidad I

Ejercicios Tema 3 – Soluciones

Funciones de probabilidad. Medias y varianzas


1. Un grupo está formado por personas de dos departamentos de una empresa: 2 pertenecen
al departamento A y 4 al B. Se eligen 2 de las personas del grupo al azar. Se pide calcular:

a) La probabilidad de que se seleccione al menos una persona del departamento A, si el


muestreo se hace:
1) Con reemplazamiento.
2) Sin reemplazamiento.
b) La función de probabilidad del número de personas del departamento A seleccionadas,
si el muestreo se hace:
1) Con reemplazamiento.
2) Sin reemplazamiento.
c) La función de distribución en los dos casos anteriores. Representar gráficamente ambas
funciones de distribución.

Solución.

a) Denotamos por X el número de personas del departamento A seleccionadas y que-


remos calcular el valor de Pr(X ≥ 1) = 1 − Pr(X = 0), esto es, uno menos la
probabilidad de seleccionar a dos personas del departamento B.
1) Con reemplazamiento:
󰀕 󰀖2
4
Pr(X ≥ 1) = 1 − P (X = 0) = 1 − = 0,556
6

2) Sin reemplazamiento:
4 3
Pr(X ≥ 1) = 1 − P (X = 0) = 1 − × = 0,6
6 5
b) En este caso debemos calcular las probabilidades correspondientes a X = 0, 1, 2,
aunque en el apartado anterior ya hemos obtenido el valor para X = 0.
1) Con reemplazamiento. Tenemos que (obsérvese que se trata de una distribución
binomial con n = 2 y p = 2/6),
󰀕 󰀖2 󰀕 󰀖2
4 2
Pr(X = 0) = = 0,444, Pr(X = 2) = = 0,111
6 6
Pr(X = 1) = 1 − Pr(X = 0) − Pr(X = 2) = 0,444

O también
42
Pr(X = 1) = 2 = 0,444
66

1
2) Sin reemplazamiento (este caso corresponde a una distribución hipergeométrica):
4 3 2 1
Pr(X = 0) = × = 0,4, Pr(X = 2) = × = 0,067
6 5 6 5
Pr(X = 1) = 1 − Pr(X = 0) − Pr(X = 2) = 0,533
O también
42
Pr(X = 1) = 2 = 0,533
65
c) Las funciones de distribución se obtienen acumulando las probabilidades correspon-
dientes a las funciones de probabilidad. Se tiene
Con reeempl. Sin reeempl.
k 0 1 2 k 0 1 2
Pr(X ≤ k) 0,444 0,888 1 Pr(X ≤ k) 0,4 0,933 1
La representación gráfica de estas funciones de distribución, teniendo en cuenta que
son funciones constantes a tramos, será

2. Se venden 5000 boletos de loterı́a a 1 euro cada uno, para el sorteo de un premio de 2000
euros. Determinar la ganancia promedio de una persona que compra tres boletos de loterı́a.

Solución. Suponemos que la probabilidad de que un boleto sea premiado es la misma


para todos los boletos.
Definimos una variable aleatoria L que toma el valor 1 si se obtiene el premio con los tres
boletos y el valor 0 en caso contrario. A partir de ella definimos otra variable aleatoria G
como la ganancia de este sorteo habiendo comprado tres boletos:
G(L) = 2000L − 3

La probabilidad de obtener el premio con estos tres boletos es (se obtiene como casos
favorables sobre casos totales),
3
Pr(L = 1) =
5000
La ganancia promedio vendrá dada por
4997 3
E[G] = G(0) Pr(L = 0) + G(1) Pr(L = 1) = (−3) × + 1997 × = −1,8 euros
5000 5000

2
3. En unas oposiciones el temario consta de 85 temas. Se seleccionan tres temas al azar entre
los 85, sin reemplazamiento. Si un opositor domina 35 de los 85 temas, calcular:

a) La función de probabilidad del número de temas seleccionados que domina.


b) La función de distribución del número de temas seleccionados que domina.
c) Representar gráficamente dicha función de distribución.
d ) El valor de F (1,5).
e) El número esperado de temas, entre los seleccionados, que domina.
f ) La varianza de dicho número de temas.
g) Si domina los dos primeros temas seleccionados, calcular la probabilidad de que tam-
bién domine el tercero.

Solución. Denotamos como X el número de temas que el opositor domina, entre los tres
temas seleccionados. Por tanto, X toma valores en {0, 1, 2, 3}.
Suponemos que la selección de cada uno de los temas es independiente y se hace sin
reemplazamiento.

a) La función de probabilidad se puede obtener a partir de los valores siguientes (que


corresponden a una distribución hipergeométrica):
50 49 48
Pr(X = 0) = × × = 0,198
85 84 83
50 49 35
Pr(X = 1) = 3 × × × = 0,434
85 84 83
50 35 34
Pr(X = 2) = 3 × × × = 0,301
85 84 83
35 34 33
Pr(X = 3) = × × = 0,066
85 84 83
b) La función de distribución vendrá dada por los valores acumulados de las probabili-
dades anteriores:
k 0 1 2 3
Pr(X ≤ k) 0,198 0,633 0,934 1
c) La función de distribución es una función continua a tramos, y su representación
gráfica es

3
d ) De su definición tenemos que F (1,5) = Pr(X ≤ 1,5). Para calcular esta probabilidad
podemos emplear la función de probabilidad, y obtenemos

F (1,5) = Pr(X ≤ 1,5) = Pr(X = 0) + Pr(X = 1) = 0,633

Alternativamente, empleando la función de distribución,

F (1,5) = Pr(X ≤ 1,5) = Pr(X ≤ 1) = F (1) = 0,633

e) El valor esperado de X es
4
󰁛
E[X] = kpk = 0,434 + 2 × 0,301 + 3 × 0,066 = 1,235
k=1

f ) Para obtener el valor de la varianza utilizaremos la fórmula Var(X) = E[X 2 ]−E[X]2 .


Necesitamos calcular
4
󰁛
E[X 2 ] = k 2 pk = 0,434 + 22 × 0,301 + 32 × 0,066 = 2,235
k=1

El valor pedido será

Var(X) = E[X 2 ] − E[X]2 = 2,235 − 1,2352 = 0,709

g) El valor pedido en este apartado es (denotamos por Dk el suceso correspondiente a


que el k-ésimo tema era uno de los que el opositor domina)
35 34 33
Pr(D3 ∩ D2 ∩ D1 ) 85 × 84 × 83 33
Pr(D3 |D1 ∩ D2 ) = = 35 34 = = 0,398
Pr(D1 ∩ D2 ) 85 × 84
83

Distribuciones para variables discretas

4. Un estanque contiene 500 peces de los cuales 300 están marcados. Un pescador logra sacar
50 peces. Hallar la probabilidad de que:

a) 20 de los peces estén marcados.


b) Ninguno de los peces esté marcado.

Solución. Denotamos por X el número de peces marcados entre los 50 extraı́dos. Si supo-
nemos que la extracción se realiza con reemplazamiento, podemos emplear una distribución
binomial con n = 50 y p = 300/500 para el número de peces marcados.

a) El valor pedido es
󰀕 󰀖
50 20
P (X = 20) = p (1 − p)30 = 0,0020
20

b) La probabilidad pedida es

P (X = 0) = (1 − p)50 = 1,27 10−20

4
Si los cálculos se hubiesen realizado suponiendo que no hay reemplazamiento, empleando
una distribución hipergeométrica, los valores resultantes serı́an 0,00133 y 1,96 10−22 .

5. Sea X la v.a. que representa el número de caras obtenidas en cuatro lanzamientos de una
moneda equilibrada.

a) Obtener y dibujar la función de probabilidad de X.


b) Obtener la función de distribución de X y dibujarla.
c) Calcular Pr(X ≤ 2) y Pr(1 < X ≤ 3).
d ) Simular 100 lanzamientos de las cuatro monedas y comparar las frecuencias relativas y
las frecuencias relativas acumuladas, respectivamente, con la función de probabilidad
y función de distribución.
e) Obtener y dibujar la función de probabilidad de la nueva v.a. Y = X/(1 + X).

Solución.

a) Se trata de una distribución binomial con n = 4 y p = 0,5, ya que corresponde a la


suma de cuatro variables Bernoulli con p = 0,5 (que modelan cada lanzamiento).
La función de probabilidad viene dada por
󰀕 󰀖 󰀕 󰀖
4 k 4−k 4
Pr(X = k) = 0,5 0,5 = 0,54 , k = 0, . . . , 4
k k
Los valores de cada una de las probabilidades son:
k 0 1 2 3 4
Pr(X = k) 0,0625 0,25 0,375 0,25 0,0625
El gráfico correspondiente a la función de probabilidad es

b) La función de distribución corresponde a las probabilidades acumuladas, F (k) =


Pr(X ≤ k),
k 0 1 2 3 4
F (k) 0,0625 0,3125 0,6875 0,9375 1
El gráfico correspondiente a la función de distribución es

5
c) De los valores anteriores,

Pr(X ≤ 2) = F (2) = 0,6875, Pr(1 < X ≤ 3) = F (3)−F (1) = 0,9375−0,3125 = 0,625

d ) A continuación se muestran los gráficos con las comparaciones pedidas, para una
muestra simulada de 100 observaciones de una distribución binomial con los paráme-
tros indicados.

Los valores simulados en R se han obtenido como:


sim.4coin = rbinom(100,4,0.5)
p6.pf$sim = table(sim.4coin)/100

e) La función de probabilidad pedida para Y se puede obtener de la correspondiente


función de probabilidad para X, sustituyendo k por k ′ = k/(1 + k) para cada valor
de k = 0, . . . , 4. Obtenemos
k′ 0 1/2 2/3 3/4 4/5
Pr(Y = k ′ ) 0,0625 0,25 0,375 0,25 0,0625
Su gráfico es

6
6. Una máquina empaqueta pastillas en tubos de 20 unidades. El archivo 3Defectuosas.csv
proporciona el número de pastillas defectuosas producidas en cada uno de los 1000 tubos
examinados en un control de calidad. De los datos de dicho fichero se tiene la siguiente
tabla de frecuencias:

# defectos 0 1 2 3
Frecuencia 806 173 19 2

a) Dar una estimación de la proporción de pastillas defectuosas producidas por la máqui-


na.
b) Calcular la función de probabilidad del número de pastillas defectuosas por tubo
suponiendo que la estimación del apartado anterior sea correcta.
c) Si los tubos se comercializan en cajas de 25 unidades, calcular la probabilidad de que
una caja (de tubos) contenga exactamente 20 tubos sin ninguna pastilla defectuosa.

Solución.

a) Denotamos por X el número de pastillas defectuosas en un tubo cualquiera.


Para obtener el valor de la proporción de pastillas defectuosas a introducir en el
modelo de X, p, como se pide en el enunciado, debemos emplear los valores de las
proporciones en la muestra para determinar un valor razonable de p.
Básicamente, debemos ajustar el valor de manera que las proporciones en la mues-
tra se correspondan con los valores de probabilidades asociados a una distribución
binomial con n = 20 y p desconocido.
La función de probabilidad de una distribución binomial es
󰀕 󰀖
20 k
Pr(X = k) = p (1 − p)20−k .
k

Y de los datos tenemos los valores siguientes:


k 0 1 2 3 4
Proporción 0,806 0,173 0,019 0,002 0

7
Un procedimiento para obtener p consiste en ajustar el valor esperado de la distri-
bución binomial, np con n = 20, para que coincida con el valor medio de la muestra.
Obtenemos
x̄ 0,217
x̄ = 0,173 × 1 + 0,019 × 2 + 0,002 × 3 = 0,217 = np ⇒ p̂ = = = 0,01085
n 20
Para este valor p = p̂ las probabilidades teóricas y las proporciones en la muestra son
k 0 1 2 3 4
Pr(X = k) 0,804 0,176 0,018 0,0012 5,64 10−5
Proporción 0,806 0,173 0,019 0,002 0
y se tiene un ajuste bastante razonable.
b) La función de probabilidad vendrá dada por
󰀕 󰀖
20
Pr(X = k) = (1 − 0,01085)k 0,0108520−k , k = 0, . . . , 20
k
Los valores para k = 0, 1, 2, 3, 4) se han indicado en la tabla del apartado anterior.
c) Denotamos por Y la variable aleatoria que indica cuántos tubos no tienen pastillas
defectuosas en un lote de 25 tubos. La probabilidad de que un tubo no tenga ninguna
pastilla defectuosa es py = (1 − p̂)20 = 0,804.
Nuestra variable Y también sigue una distribución binomial, pero los valores de los
parámetros son n = 25, p = py = 0,804 y nos piden la probabilidad correspondiente
a Y = k = 20. Este valor es
󰀕 󰀖
25 20
Pr(Y = 20) = p (1 − py )5 = 0,1958
20 y

7. Una lı́nea de autobuses cubre una ruta con un autobús que tiene 50 plazas. La lı́nea aceptó
60 reservas para un viaje. Se supone que todos los pasajeros actúan en forma independiente
y se estima que 1 de cada 10 pasajeros que hacen la reserva no se presentan. El precio
del billete es 25 euros, pero si un pasajero se presenta y no puede ser embarcado, se le
reintegra su dinero más una compensación de 5 euros. Calcular:

a) La esperanza del número de pasajeros que se presentan a abordar.


b) La esperanza del número de pasajeros que acuden y no pueden ser embarcados.
c) La ganancia esperada por la lı́nea.

Solución.

a) El número de pasajeros que se presentan se puede obtener como el valor de una


variable aleatoria X que sigue una distribución binomial con n = 60 y p = 0,9.
La esperanza del número de pasajeros que se presentan vendrá dada por

E[X] = np = 60 × 0,9 = 54

b) Los pasajeros que se presentan y no pueden ser embarcados Y se pueden obtener a


partir de X como Y = máx(0, X − 50). Con esta fórmula tenemos que

Pr(Y = k) = Pr(X = 50 + k), k = 1, . . . , 10


Pr(Y = 0) = Pr(X ≤ 50)

8
Su valor esperado se puede obtener como
10
󰁛 10
󰁛
E[Y ] = k Pr(Y = k) = k Pr(X = 50 + k) = 4,057
k=0 k=1

c) La ganancia para la lı́nea, G, se obtiene como


󰀝
25X si X ≤ 50
G=
25 × 50 − 30(X − 50) si X > 50
o análogamente como G = 25X − 30Y . Su valor esperado es
E[G] = 25E[X] − 30E[Y ] = 25 × 54 − 30 × 4,057 = 1228,29

8. En una academia están matriculados 200 alumnos en un curso A y 250 alumnos en un


curso B. Se eligen cuatro de ellos al azar. Calcular:
a) La probabilidad de que al menos dos de los elegidos sean alumnos del curso B si el
muestreo se hace:
1) Con reemplazamiento.
2) Sin reemplazamiento.
b) La función de probabilidad del número de alumnos del curso B escogidas si el muestreo
se hace:
1) Con reemplazamiento.
2) Sin reemplazamiento.

Solución. Denotamos por X el número de alumnos del curso B seleccionadas.


a) Nos piden calcular Pr(X ≥ 2) = 1 − (Pr(X = 0) + Pr(X = 1)).
1) Tenemos que X sigue una distribución binomial con n = 4 y p = 2,5/4,5. Se
cumple
Pr(X ≥ 2) = 1 − (Pr(X = 0) + Pr(X = 1)) = 1 − ((1 − p)4 + 4p(1 − p)3 )
= 0,766
2) Las probabilidades de interés son
200 199 198 197
Pr(X = 0) = × × × = 0,038
450 449 448 447
250 200 199 198
Pr(X = 1) = 4 × × × × = 0,195
450 449 448 447
Pr(X ≥ 2) = 1 − (Pr(X = 0) + Pr(X = 1)) = 0,767
b) La función de probabilidad de X es:
1) A partir de las probabilidades de una distribución binomial,
Pr(X = 0) = (1 − p)4 = 0,039
Pr(X = 1) = 4p(1 − p)3 = 0,195
Pr(X = 2) = 6p2 (1 − p)2 = 0,366
Pr(X = 3) = 4p3 (1 − p) = 0,305
Pr(X = 4) = p4 = 0,095

9
2) Los valores de las probabilidades (probabilidades de una distribución hiper-
geométrica) son ahora
200 199 198 197
Pr(X = 0) = × × × = 0,038
450 449 448 447
250 200 199 198
Pr(X = 1) = 4× × × × = 0,195
450 449 448 447
250 249 200 199
Pr(X = 2) = 6× × × × = 0,367
450 449 448 447
250 249 248 200
Pr(X = 3) = 4× × × × = 0,305
450 449 448 447
250 249 248 247
Pr(X = 4) = × × × × = 0,094
450 449 448 447

Estas fórmulas son equivalentes a aplicar las correspondientes a una distribución


hipergeométrica con N = 450, K = 250 y n = 4, con k = 0, . . . , 4,
󰀕 󰀖󰀕 󰀖
250 200
k 4−k
Pr(X = k) = 󰀕 󰀖
450
4

9. Se recibe un lote de 1000 bolı́grafos de los cuales 60 no escriben. Para decidir si se acepta
o no el lote se seleccionan 200 bolı́grafos al azar, sin remplazo, rechazando el lote si más
de x no escriben.

a) Obtener la función de probabilidad del número de bolı́grafos que no escriben entre


los 200 escogidos.
b) Escoger el menor valor de x (número de bolı́grafos que no escriben entre los 200) para
el que la probabilidad de rechazar el lote sea inferior al 5 %.

Solución. Si denotamos por X la variable aleatoria que representa el número de bolı́grafos


que no escriben entre los 200 escogidos, podemos observar que se trata de la extracción sin
reemplazamiento de n = 200 unidades de un conjunto que contiene N = 1000 elementos,
de los cuales K = 60 tienen una cierta propiedad (bolı́grafos que no escriben).
Esta es la caracterización que hemos dado para una variable aleatoria con distribución
hipergeométrica y parámetros N , K y n. Supondremos que X sigue esta distribución.

a) La función de probabilidad de una distribución hipergeométrica con los valores indi-


cados de los parámetros es:
󰀕 󰀖󰀕 󰀖
60 940
k 200 − k
Pr(X = k) = 󰀕 󰀖 , k = 0, 1, . . . , 60,
1000
200
y esta probabilidad es 0 para k > 60.
Estas probabilidades toman los siguientes valores (se indican solo algunos de ellos):
k 0 1 2 11 12 13
Pr(X = k) 9,64 10−7 1,56 10−5 1,24 10−4 1,28 10−1 1,32 10−1 1,22 10−1

10
b) Respondemos a esta pregunta a partir de los valores de la función de distribución
de X, F (x), que obtenemos acumulando los valores de las probabilidades anteriores
(o directamente de la función de R phyper). Tenemos en cuenta que la condición a
cumplir es:

Pr(X > x) ≤ 0,05 ⇔ 1 − Pr(X ≤ x) ≤ 0,05 ⇔ Pr(X ≤ x) ≥ 0,95 ⇔ F (x) ≥ 0,95

Tenemos que
k 15 16 17
F (k) 0,876 0,929 0,962
Por tanto, el valor pedido serı́a x = 17.

10. En un almacén se guardan 1000 piezas de las cuales 100 son defectuosas. Un inspector
toma una de las piezas al azar, y si no es defectuosa la devuelve al almacén.
Sea N el número de inspecciones de piezas no defectuosas antes de encontrar la primera
defectuosa. Calcular la probabilidad de que este número de inspecciones, N , esté entre 25
y 60, ambos incluidos.

Solución. La variable aleatoria N sigue una distribución geométrica (repetición de ensayos


Bernoulli hasta que se produce el primer fallo) con parámetro p = 100/1000.
La probabilidad pedida se puede obtener a partir de la función de probabilidad de una
distribución geométrica,
Pr(N = k) = (1 − p)k p
En nuestro caso, tenemos que calcular Pr(25 ≤ N ≤ 60). Reescribimos esta probabilidad
para poder escribirla en términos de la función de distribución de N , FN (k), como

Pr(25 ≤ N ≤ 60) = Pr(24 < N ≤ 60) = FN (60) − FN (24)

Obtenemos utilizando R (pgeom(60,0.1)-pgeom(24,0.1)),

Pr(25 ≤ N ≤ 60) = FN (60) − FN (24) = 0,0702

11. El archivo 3LecturasBarras.csv recoge las lecturas erróneas (fallos) de un lector óptico
de barras en una muestra de 200 lecturas. Las frecuencias recogidas en dicho fichero son:

k 0 1
Frecuencias 191 9

a) Estimar la probabilidad de fallo del lector.


b) Suponiendo que la estimación anterior es correcta, calcular la probabilidad de que
falle solo una vez en las siguientes 10 lecturas.
c) Calcular la probabilidad de que el lector no falle en las siguientes 20 lecturas, sabiendo
que no falló en las primeras 10 lecturas.

Solución.

11
a) Suponiendo las lecturas independientes, podemos aproximar la variable aleatoria que
representa un fallo, X, mediante una distribución Bernoulli con p = 9/200, valor
obtenido a partir de la tabla de frecuencias.
b) El número de fallos en las siguientes 10 lecturas sigue una distribución binomial con
n = 10 y el valor de p anterior. Tenemos
Pr(X = 1) = 10p(1 − p)9 = 0,297

c) El número de lecturas sin fallos hasta el primer fallo sigue una distribución geométrica
con el valor de p anterior. Si denotamos el número de lecturas hasta el primer fallo
como N , nos piden calcular
Pr((N2 > 20) ∩ (N1 > 10)) Pr(N > 30)
Pr(N2 > 20|N1 > 10) = =
Pr(N1 > 10) Pr(N1 > 10)
Si tenemos en cuenta que

󰁛 1
Pr(N > k) = (1 − p)i p = (1 − p)k+1 p = (1 − p)k+1
1 − (1 − p)
i=k+1

obtenemos
(1 − p)31
Pr(N2 > 20|N1 > 10) = = (1 − p)20 = 0,398
(1 − p)11

12. El archivo 3Fallos.csv recoge los fallos por hora de un aparato eléctrico registrados en
20 horas de funcionamiento. La tabla de frecuencias de los datos del fichero es
k 0 1 2 3 4
Frecuencia 4 5 5 5 1

Se pide calcular:
a) Una estimación del número medio de fallos por hora que se espera que tenga el aparato
y de la varianza en este número de fallos por hora.
b) Suponiendo que la estimación es adecuada, examinar si una distribución de Poisson
es un buen modelo para el número de fallos por hora.
c) Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que el
aparato funcione bien durante una hora distinta de las consideradas en la muestra.
d ) Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que el
aparato funcione bien durante dos horas distintas de las consideradas en la muestra.

Solución.
a) Si denotamos por X el número de fallos por hora del aparato, el valor esperado en la
muestra, obtenido a partir de la tabla de frecuencias, es
x̄ = (5 + 2 × 5 + 3 × 5 + 4)/20 = 1,7
Y la varianza muestral es
s2 = ((4 × (−1,7)2 + 5 × (1 − 1,7)2 + 5 × (2 − 1,7)2 + 5 × (3 − 1,7)2 + (4 − 1,7)2 )/19
= (5 × 12 + 5 × 22 + 5 × 32 + 42 − 20 × 1,72 )/19 = 1,484
algo menor que la media muestral (para una distribución de Poisson, E[X] = Var[X]).

12
b) Para examinar si una distribución de Poisson es un buen modelo para el número
de fallos por hora, en primer lugar seleccionamos un valor para el parámetro λ.
Lo hacemos imponiendo la condición de que la media muestral y la media de la
distribución coincidan. Por ello, tomamos λ = 1,7.
A continuación representamos las probabilidades asociadas a una distribución de Pois-
son con ese valor de λ, calculadas mediante la fórmula

1,7k exp(−1,7)
Pr(X = k) =
k!
(o también mediante el comando de R dpois) y las frecuencias observadas, obteniendo
el gráfico

El ajuste no es excesivamente bueno, pero el tamaño de la muestra también es muy


reducido.
c) La probabilidad pedida es

1,70 exp(−1,7)
Pr(X = 0) = = exp(−1,7) = 0,183
0!

d ) En este caso nos piden calcular el valor de Pr((X1 = 0) ∩ (X2 = 0)), donde X1 y
X2 son los fallos en la primera y segunda hora. Bajo una distribución Poisson ambos
sucesos son independientes, y por tanto

Pr((X1 = 0) ∩ (X2 = 0)) = Pr(X = 0)2 = 0,1832 = 0,033

13. La siguiente tabla muestras las frecuencias absolutas del número de errores por 10.000
lı́neas de código en un proyecto de desarrollo de software, para una muestra de 950.000
lı́neas.

# errores 0 1 2 3 4 5 Total
frecuencia 41 29 15 7 2 1 95

Calcular:

a) Una estimación del número medio de errores por 10.000 lı́neas que se esperan en este
proyecto y de su varianza.

13
b) Suponiendo que la estimación es adecuada, examinar si una distribución de Poisson
es un buen modelo para el número de errores por 10.000 lı́neas de código.
c) Suponiendo que el modelo anterior es adecuado, calcular la probabilidad de que en
10.000 lı́neas escogidas al azar haya al menos un error.

Solución.

a) Denotando por X la variable que tiene como valor el número de errores por 10.000
lı́neas de código en el proyecto, de los valores de las frecuencias obtenemos
5
1󰁛
x̄ = kfk = (29 + 2 × 15 + 3 × 7 + 4 × 2 + 5)/95 = 0,979
n
k=0

donde fk es la frecuencia (absoluta) del valor k.


Para la varianza obtenemos
5
2 1 󰁛 2
s = ( k fk − nx̄2 ) = 1,255
n−1
k=0

b) Para examinar si una distribución de Poisson es un buen modelo para el número de


fallos por hora, en primer lugar determinamos un valor para el parámetro λ impo-
niendo la condición de que la media muestral y la media de la distribución coincidan.
Para ello tomamos λ = 0,979.
A continuación representamos las probabilidades asociadas a una distribución de Pois-
son con ese valor de λ, calculadas mediante la fórmula

0,979k exp(−0,979)
Pr(X = k) =
k!
o también mediante el comando de R dpois, y las frecuencias observadas, obteniendo
el gráfico

El ajuste parece razonable en este caso.


c) El valor pedido es

Pr(X ≥ 1) = 1 − Pr(X = 0) = 1 − exp(−0,979) = 0,624

14
14. El coste de producción de cierta máquina que se fabrica por encargo es de 4300 euros
por máquina cuando se producen menos de cinco unidades. Si se producen de cinco a
nueve unidades, el coste por máquina baja a 4000 euros. Y cuando se producen diez o más
unidades el coste por unidad baja a 3500 euros.
La demanda de estas máquinas fluctúa según una distribución de Poisson con valor espe-
rado igual a 8.

a) Si el precio de venta unitario es de 5000 euros, calcular la ganancia neta esperada por
máquina.
b) Si vendemos cada máquina a 3810 euros, calcular la probabilidad de que la empresa
pierda dinero.

Solución. De los datos del problema tenemos que la distribución de Poisson correspon-
diente al número de máquinas demandadas, X, tiene como valor del parámetro λ = 8.
Para un precio de venta Pv , la ganancia de la empresa tiene la forma siguiente:
󰀻
󰀿 (Pv − 4300)X si X ≤ 4
G= (Pv − 4000)X si 4 < X ≤ 9
󰀽
(Pv − 3500)X si 9 < X

Su valor esperado vendrá dado por


4
󰁛 9
󰁛
E[G] = (Pv − 4300) k Pr(X = k) + (Pv − 4000) k Pr(X = k)
k=0 k=5

󰁛
+ (Pv − 3500) k Pr(X = k)
k=10
8k exp(−8)
Pr(X = k) =
k!
Podemos simplificar estas expresiones teniendo en cuenta que
4
󰁛
k Pr(X = k) = 0,339
k=0
󰁛9
k Pr(X = k) = 4,401
k=5

󰁛 9
󰁛
k Pr(X = k) = E[X] − k Pr(X = k) = 8 − (0,339 + 4,401) = 3,260
k=10 k=0

a) Si Pv = 5000, tenemos que


4
󰁛 9
󰁛 ∞
󰁛
E[G] = 700 k Pr(X = k) + 1000 k Pr(X = k) + 1500 k Pr(X = k)
k=0 k=5 k=10
= 700 × 0,339 + 1000 × 4,401 + 1500 × 3,260 = 9528,3

15
b) Si Pv = 3810, entonces
4
󰁛 9
󰁛 ∞
󰁛
E[G] = −490 k Pr(X = k) − 190 k Pr(X = k) + 310 k Pr(X = k)
k=0 k=5 k=10
= −490 × 0,339 − 190 × 4,401 + 310 × 3,260 = 8,3

En este caso la ganancia esperada serı́a aproximadamente igual a cero.

Exámenes años anteriores

15. (Parcial 2019) Una variable aleatoria discreta, X, tiene función de probabilidad pk =
Pr(X = k) = 1/N para k = 1, . . . , N , donde N ≥ 2 es un valor entero. Justifica que se
cumple la siguiente igualdad:
N2 − 1
Var[X] =
12
Ayuda: se cumple que
N
󰁛 N
󰁛
N (N + 1) N (N + 1)(2N + 1)
k= , k2 =
2 6
k=1 k=1

Solución. Calculamos la media de la variable X,


N
󰁛 N
1 󰁛 N (N + 1) N +1
E[X] = kpk = k= = .
N 2N 2
i=1 i=1

Podemos obtener ahora el valor de la varianza como


󰁛N 󰀕 󰀖 N
2 2 2 N +1 2 1 󰁛 2 (N + 1)2
Var(X) = E[X ] − (E[X]) = k pk − = k −
2 N 4
i=1 i=1
󰀕 󰀖
N (N + 1)(2N + 1) (N + 1)2 N + 1 2N + 1 N + 1 N +1N −1
= − = − =
6N 4 2 3 2 2 6
2
N −1
=
12

16. (Parcial 2019) Una variable aleatoria discreta tiene la siguiente función de distribución:

Valor 0 1 2 3 4
Probabilidad 0,05 0,30 0,75 0,90 1

Calcula su esperanza y su varianza.

Solución. La esperanza de X se define como


4
󰁛
E[X] = k Pr(X = k)
k=0

16
También se cumple que P (X = k) = F (k) − F (k − 1) (donde F denota la función de
distribución de X).
En nuestro caso tenemos que
4
󰁛 4
󰁛
E[X] = k Pr(X = k) = k(F (k) − F (k − 1))
k=0 k=0
= 0 × 0,05 + 1 × 0,25 + 2 × 0,45 + 3 × 0,15 + 4 × 0,1 = 2

Para la varianza tenemos como definición


4
󰁛
Var(X) = (k − E[X])2 Pr(X = k)
k=0

y en nuestro caso obtenemos


4
󰁛
Var(X) = (k − 2)2 (F (k) − F (k − 1))
k=0
= 4 × 0,05 + 1 × 0,25 + 0 × 0,45 + 1 × 0,15 + 4 × 0,1 = 1

17. (Parcial 2019) Dispones de una muestra (aleatoria simple) del número de errores que se
producen en un proceso durante un cierto periodo de tiempo.
La muestra recoge valores de errores para 40 periodos. Las frecuencias de los números de
errores en cada periodo son las siguientes:
# Errores 0 1 2 3 4 Total
Frecuencia 11 12 9 6 2 40

a) Calcula la media y varianza muestral de los errores en un periodo.


b) Definimos una variable aleatoria X cuyo valor es el número de errores durante cada
periodo de tiempo. Suponemos que X sigue una distribución de Poisson. Determina
un valor del parámetro de dicha distribución que ajuste lo mejor posible los datos de
la muestra.
c) Calcula la función de distribución de esta variable aleatoria X.
d ) Comenta si te parece razonable utilizar una distribución de Poisson para X.
e) Calcula la probabilidad de que el número de errores en un periodo de tiempo sea
igual o superior a 1 e igual o inferior a 3.

Solución.
a) Si fk denota la frecuencia relativa para k errores observados, los valores pedidos se
pueden obtener como
4
󰁛
x̄ = kfk = (12 + 18 + 18 + 8)/40 = 56/40 = 1,4
k=0

Con este valor podemos calcular la varianza como


4
1 󰁛
s2 = (k − x̄)2 nfk = (1,42 × 11 + 0,42 × 12 + 0,62 × 9 + 1,62 × 6 + 2,62 × 2)/39
n−1
k=0
= 1,426

17
b) Podemos escoger el valor del parámetro λ aplicando la condición de que la esperanza
de la distribución coincida con la media de los datos en la muestra.
Para ello seleccionamos λ = E[X] = x̄ = 1,4.
c) Para calcular la función de distribución emplearemos la fórmula de los valores de la
función de probabilidad

1,4k exp(−1,4)
Pr(X = k) =
k!
Obtenemos los siguientes valores
# Errores 0 1 2 3 4 5
Pr(X = k) 0,2466 0,3452 0,2417 0,1128 0,0395 0,0110
Acumulando estas probabilidades obtenemos la función de distribución como
# Errores 0 1 2 3 4 5
Pr(X ≤ k) 0,2466 0,5918 0,8335 0,9463 0,9857 0,9968
d ) Por una parte, tenemos que la media y la varianza de la distribución se parecen mucho
(la media coincide) a la media y varianza de la muestra.
Por otra parte, las frecuencias relativas de la muestra,
# Errores 0 1 2 3 4
Frec. rel. 0,275 0,3 0,225 0,15 0,05
son algo distintas de los valores de la función de probabilidad, pero tampoco excesi-
vamente, por lo que el modelo de Poisson seleccionado parece razonable para estos
datos.
e) A partir de la función de distribución podemos obtener el valor solicitado como

Pr(1 ≤ X ≤ 3) = Pr(0 < X ≤ 3) = F (3) − F (0) = 0,9463 − 0,2466 = 0,6997

18. (Parcial 2019) Una compañı́a fabrica accesorios para otra empresa, que se encarga de inte-
grarlos en sus productos. La compañı́a fabricante sabe que en su proceso aproximadamente
uno de cada 20 accesorios tiene algún defecto.
La empresa cliente recibe el producto en lotes. Su procedimiento para aceptar un lote
consiste en seleccionar (sin reemplazamiento) 4 accesorios de manera aleatoria y someterlos
a prueba. Si ninguno de los accesorios presenta defectos, el cliente acepta el lote.

a) Calcula los valores de la función de probabilidad de la variable aleatoria X, cuyo valor


es el número de accesorios defectuosos entre los 4 seleccionados.
b) Indica el valor esperado y la varianza de X.
c) Si se acepta el lote, la compañı́a fabricante recibe un ingreso por la venta del mismo
de 2800 euros. Si se rechaza, la compañı́a no recibe ingresos y tiene que pagar 1000
euros por los costes de las pruebas y la devolución del lote rechazado.
Calcular la ganancia esperada por la compañı́a fabricante.
d ) Si los lotes son de 50 unidades y un lote contiene 3 productos defectuosos, calcula la
probabilidad de rechazar ese lote aplicando la regla anterior.

Solución.

18
a) De la descripción del problema serı́a razonable suponer que la variable aleatoria X
sigue una distribución hipergeométrica. Pero con los datos de que disponemos no
tenemos información suficiente para encontrar los valores de los tres parámetros de
dicha distribución, N , K y n. Con la información disponible solo podemos estimar
dos parámetros, n y p. Por ello, vamos a suponer que la variable aleatoria X sigue
aproximadamente una distribución binomial con parámetros n = 4 y p = 1/20 = 0,05.
La función de probabilidad para esta variable aleatoria es
󰀕 󰀖 󰀕 󰀖k 󰀕 󰀖4−k 󰀕 󰀖 4−k
4 1 19 4 19
Pr(X = k) = = .
k 20 20 k 204
Los valores de la función son
# Defectos 0 1 2 3 4
Pr(X = k) 0,8145 0,1715 0,0135 4,75 10−4 6,25 10−6
b) Para una distribución binomial, su esperanza y su varianza vienen dadas por

E[X] = np = 0,2, Var(X) = np(1 − p) = 0,19

c) Tenemos que calcular el valor esperado de otra variable aleatoria, la ganancia G, que
es una función de X. El valor de G se define como
󰀝
2800 si X = 0
G=
−1000 si X > 0.

Como la variable solo toma dos valores, su valor esperado es

E[G] = 2800 Pr(G = 2800) − 1000 Pr(G = −1000)


= 2800 Pr(X = 0) − 1000 Pr(X > 0) = 2800 × 0,8145 − 1000 × (1 − 0,8145)
= 2095,12

d ) En este caso la distribución a emplear es una hipergeométrica con parámetros N = 50,


K = 3, n = 4. El valor que nos piden, aplicando las fórmulas de su función de
probabilidad, es
󰀕 󰀖󰀕 󰀖
3 47
0 4
Pr(X = 0) = 󰀕 󰀖 = 0,7745
50
4
Pr(rechazar lote) = Pr(X > 0) = 1 − 0,7745 = 0,2255

19. (Final 2020) Una empresa ha recogido información entre clientes que compraron un aparato
electrónico, para realizar un estudio de fiabilidad. Se han estudiado dos categorı́as de fallos
(F1 , F2 ), y el estudio ha diferenciado entre los resultados de usuarios habituales, H, y de
usuarios ocasionales O = H c .
Entre los usuarios habituales, un 10,2 % han tenido un fallo de tipo F1 , un 9,3 % han
tenido un fallo de tipo F2 y un 84,6 % no han tenido ningún fallo. Un 9,5 % de los usuarios
ocasionales han tenido un fallo de tipo F1 , un 7,1 % han tenido un fallo de tipo F2 y un
3,9 % han tenido ambos tipos de fallos. Los usuarios habituales son un 42,4 % del total de
los clientes en la muestra.
Se pide que contestes a las preguntas siguientes, si seleccionas un cliente de la muestra al
azar:

19
a) ¿Cuál es la probabilidad de que el cliente no haya tenido ningún fallo y sea usuario
habitual?
b) Si el cliente seleccionado es un usuario ocasional, ¿cuál es la probabilidad de que haya
tenido algún tipo de fallos?
c) ¿Cuál es la probabilidad de que el cliente haya tenido un fallo de tipo F2 ?
d ) Si sabes que el cliente seleccionado ha tenido un fallo de tipo F1 , ¿cuál es la proba-
bilidad de que sea un usuario habitual? ¿Y de que sea un usuario ocasional?

Escogemos al azar y con reemplazamiento 4 clientes de esta muestra.

e) ¿Qué distribución sigue el número de clientes que no han tenido ningún fallo en
su dispositivo, entre los 4 seleccionados? Indica el valor de los parámetros de dicha
distribución.
f ) Calcula la probabilidad de que el número de clientes entre los 4 que no ha tenido
ningún fallo sea mayor (estrictamente) que 2.

El coste de la reparación de un fallo de tipo F1 es de 40 euros, y el coste de reparación


para un fallo de tipo F2 es 25 euros.

g) Calcula el valor esperado del coste de reparación para un cliente escogido al azar. Si
el cliente no ha tenido ningún fallo, el coste de reparación es 0.

Solución. Denotamos por F1 y F2 los sucesos correspondientes a que se hayan producido


los distintos tipos de fallos, y por H el suceso de que un cliente sea usuario habitual.
De los datos del problema, para un cliente seleccionado al azar tenemos que

Pr(F1 | H) = 0,102, Pr(F2 | H) = 0,093, Pr((F1 ∪ F2 )c | H) = 0,846


Pr(F1 | H c ) = 0,095, Pr(F2 | H c ) = 0,071, Pr(F1 ∩ F2 | H c ) = 0,039
Pr(H) = 0,424

a) Nos piden calcular Pr((F1 ∪ F2 )c ∩ H), valor que podemos obtener como

Pr((F1 ∪ F2 )c ∩ H) = Pr((F1 ∪ F2 )c | H) Pr(H) = 0,846 × 0,424 = 0,359

b) En este caso debemos calcular Pr(F1 ∪ F2 | H c ). Se tiene que

Pr(F1 ∪ F2 | H c ) = Pr(F1 | H c ) + Pr(F2 | H c ) − Pr(F1 ∩ F2 | H c )


= 0,095 + 0,071 − 0,039 = 0,127

Si se quisiera verificar la igualdad anterior (lo cual no era necesario para el examen),
esta es consecuencia de

Pr((F1 ∪ F2 ) ∩ H c ) = Pr((F1 ∩ H c ) ∪ (F2 ∩ H c ))


Pr((F1 ∩ H c ) ∪ (F2 ∩ H c )) = Pr(F1 ∩ H c ) + Pr(F2 ∩ H c ) − Pr((F1 ∩ H c ) ∩ (F2 ∩ H c ))
Pr((F1 ∩ H c ) ∩ (F2 ∩ H c )) = Pr((F1 ∩ F2 ) ∩ H c )

y dividiendo todo por Pr(H c ) se cumple que


Pr((F1 ∪ F2 ) ∩ H c ) Pr(F1 ∩ H c ) Pr(F2 ∩ H c ) Pr((F1 ∩ F2 ) ∩ H c )
= + − .
Pr(H c ) Pr(H c ) Pr(H c ) Pr(H c )

20
c) La probabilidad pedida es ahora Pr(F2 ), que podemos obtener como (probabilidad
total)

Pr(F2 ) = Pr(F2 | H) Pr(H) + Pr(F2 | H c ) Pr(H c ) = 0,093 × 0,424 + 0,071 × (1 − 0,424)


= 0,080

d ) El primer valor a obtener es Pr(H | F1 ). Aplicando Bayes,

Pr(H)
Pr(H | F1 ) = Pr(F1 | H)
Pr(F1 )
Pr(F1 ) = Pr(F1 | H) Pr(H) + Pr(F1 | H c ) Pr(H c ) = 0,102 × 0,424 + 0,095 × 0,576
= 0,098
0,424
Pr(H | F1 ) = 0,102 = 0,441
0,098

Para calcular el valor de Pr(H c | F1 ) basta aplicar

Pr(H c | F1 ) = 1 − Pr(H | F1 ) = 1 − 0,441 = 0,559.

e) Denotamos por N el número de clientes sin fallos en sus dispositivos entre los 4
seleccionados al azar. La distribución de N será una Binomial con parámetros n = 4
y p que será igual a la probabilidad de que un cliente no tenga ningún fallo, que vale

p = Pr((F1 ∪ F2 )c ) = 1 − Pr(F1 ∪ F2 )
Pr(F1 ∪ F2 ) = Pr(F1 ∪ F2 | H) Pr(H) + Pr(F1 ∪ F2 | H c ) Pr(H c )
= (1 − 0,846) × 0,424 + 0,127 × (1 − 0,424) = 0,138
p = 1 − 0,138 = 0,862

f ) El valor a calcular es Pr(N > 2), que podemos obtener como


󰀕 󰀖 󰀕 󰀖
n 3 n 4
Pr(N > 2) = Pr(N = 3) + Pr(N = 4) = p (1 − p) + p
3 4
= 4 × 0,8623 × (1 − 0,862) + 0,8624 = 0,906

g) Denotamos por C la variable aleatoria correspondiente al coste de reparación para un


cliente. Esta variable aleatoria se puede representar como C = 40B1 +25B2 , donde B1
es una variable Bernoulli con probabilidad igual a p1 = Pr(F1 ), y B2 es otra variable
Bernoulli con probabilidad igual a p2 = Pr(F2 ).
Por tanto,
E[C] = 40E[B1 ] + 25E[B2 ] = 40p1 + 25p2 ,
donde p1 = 0,098 y p2 = 0,080, de los apartados anteriores. Obtenemos E[C] = 5,92
euros.

20. (Final 2020) Se ha recogido información sobre las preferencias de 60 personas sobre la
compra de un producto electrónico. Estas preferencias se miden en una escala entre 0
(menor preferencia) y 5 (mayor preferencia).
Sabemos que las 60 personas en la muestra procedı́an de dos regiones diferentes, 36 personas
de la región A y 24 personas de la región B. Los valores de sus respuestas se resumen en
la tabla de frecuencias siguiente:

21
Preferencia
0 1 2 3 4 5
Región A 0 1 2 10 15 8
Región B 0 0 0 2 13 9

Se pide que contestes a las siguientes preguntas, justificando tus respuestas:

a) Se escogen seis personas al azar. Calcula la esperanza y varianza de la valoración media


asignada por estas seis personas (la suma de las valoraciones individuales dividida por
6).

Solución.

a) Haremos uso de la independencia de las puntuaciones de las seis personas. La pun-


tuación media se define como
1
V = (P1 + · · · + P6 ),
6
donde todas las variables aleatorias Pi son independientes y tienen la misma distri-
bución que P . En particular, tenemos que

E[Pi ] = (1 × 1 + 2 × 2 + 12 × 3 + 28 × 4 + 17 × 5)/60 = 3,967


Var[Pi ] = (1 × 12 + 2 × 22 + 12 × 32 + 28 × 42 + 17 × 52 − 60E[Pi ]2 )/59 = 0,779.

El valor esperado y la varianza de la valoración media V de estas personas será


󰀥 6 󰀦 6
1󰁛 1󰁛 1
E[V ] = E Pi = E[Pi ] = 6E[P ] = E[P ] = 3,967
6 6 6
i=1 i=1
󰀥󰁓 󰀦 6
6
i=1 Pi 1 󰁛 1 1 1
Var[V ] = Var = Var[Pi ] = 6Var[P ] = Var[P ] = 0,779 = 0,130.
6 36 36 6 6
i=1

22

También podría gustarte