Está en la página 1de 99

Universidad Técnica Federico Santa Marı́a

Departamento de Matemática/ Campus Vitacura

Probabilidad y Estadı́stica
Evaluaciones resueltas
Recopilado por Francisca González López

Santiago, 4 de abril de 2012


Índice general

1. Estadı́stica Descriptiva 2
1.1. Estadı́stica univariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Estadı́stica bivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2. Probabilidades 23
2.1. Probabilidad básica y condicionada. Independencia. . . . . . . . . . . . . . . . . . . 23
2.2. Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3. Esperanza, varianza y funciones de variables aleatorias . . . . . . . . . . . . . . . . 47
2.4. Vectores Aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.5. Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

3. Inferencia Estadı́stica 80
3.1. Estimación puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.2. Estimación intervalar y Pruebas de Hipótesis . . . . . . . . . . . . . . . . . . . . . . 89
3.3. Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

1
Capı́tulo 1

Estadı́stica Descriptiva

1.1. Estadı́stica univariada


1. La tabla presentada a continuación representa el consumo de energı́a eléctrica de 80 usuarios:

Consumo (Kwh) Número de usuarios


05 - 25 04
25 - 45 06
45 - 65 14
65 - 85 26
85 - 105 14
105 - 125 08
125 - 145 06
145 - 165 02
Total 80

a) Determine la media y la mediana de la variable consumo.


b) Calcule el percentil 25 y 75 para la variable consumo.
c) Calcule la desviación estándar de la variable consumo.
d ) ¿Qué porcentaje de usuarios consumen más de 90 Kwh ?

Solución:

Ya que los datos están agrupados los cálculos son como sigue:

a) La media del consumo de energı́a es


1X
x= M C i · ni
n
1
= (15 · 4 + 35 · 6 + 55 · 14 + 75 · 26 + 95 · 14 + 115 · 8 + 135 · 6 + 155 · 2)
80
= 79,5

2
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

La mediana debe ubicarse en la clase 4, 65-85, ya que esta clase es la primera en obtener
una frecuencia relativa acumalada mayor al 50 % (62.5 %) y su valor se calcula:

n/2 − NM e
M e = lM e + ·I
nM e
80/2 − 24
= 65 + · 20
26
= 77,3

b) Calculamos P25 y P75 . La clase 3 acumula un 30 % por lo que en ella se encunetra el


primer cuartil.

n · q/100 − Nq−
P25 = lq + ·I
nq
80 · 25/100 − 10
= 45 + · 20
14
= 45 + 14,28
= 59,28

y el tercer cuartil está en la clase 5, 85-105, por lo tanto

n · q/100 − Nq−
P75 = lq + ·I
nq
80 · 75/100 − 50
= 85 + · 20
14
= 85 + 14,28
= 99,28

c) Calculamos la varianza:
1X
s2 = ni · M Ci2 − x2
n
1
= · (4 · 152 + 6 · 352 + 14 · 552 + 26 · 752 + 14 · 952 + 8 · 1152 + 6 · 1352 + 2 · 1552 ) − 79,52
80
= 7330 − 6320,25
= 1009,75

Por lo tanto la desviación estándar es 31,77.


d ) Lo que queremos es el valor tal que Pq = 90, por lo tanto en la ecuación

n · q/100 − Nq−
Pq = 90 = lq + ·I
nq

Probabilidad y Estadı́stica 3
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

debemos encontrar el valor de q. La clase a la que corresponde es la C5 , por lo tanto

80 · q/100 − 50
Pq = 85 + · 20 = 90
14
80 · q/100 − 50 90 − 85
=
14 20
80 · q/100 − 50 = 0,25 · 14
100
q = (3,5 + 50) ·
80
q = 66,87

Es decir, alrededor del 67 % consume menos de 90 Kwh, y por lo tanto, el 33 % consume


más de 90 Kwh.

2. El departamento de personal de una cierta firma realizó un estudio sobre los salarios, en
unidades monetarias(u.m.) de 120 funcionarios del sector administrativo, con los siguientes
resultados :

Salario / Salario Mı́nimo Frecuencia Relativa


0-2 0.25
2-4 0.40
4-6 0.20
6-10 0.15

a) Calcule la media, mediana, varianza y desviación estándar.


b) ¿Qué ocurre con la media si se aumentan los salarios en 100 %?, ¿y con la varianza?.
Justifique.
c) ¿Qué ocurre con la varianza si se aumentan los salarios en 0.8 u.m.? Justifique.

Solución:

a) Completamos la tabla
Salario / Salario Mı́nimo M Ci ni fi Ni Fi
0-2 1 30 0.25 30 0.25
2-4 3 48 0.40 78 0.65
4-6 5 24 0.20 102 0.85
6-10 8 18 0.15 120 1
Aplicando las fórmulas tenemos que:
k
1X
x= ni · M Ci = 3,65
n i=1

Probabilidad y Estadı́stica 4
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

n − 120
2
− NM e 2
− 30
Me = lMe + I =2+ 2 = 3,25
nM e 48

k
2 1 X
s = · ni · (M Ci − x)2 = 5,12
n i=1

Por lo tanto, s = 2.264


b) Si los salarios aumentan en un 100 % quiere decir que el salario se aumenta al doble,
por lo que ahora en vez de contar con M Ci contamos con M Ci∗ = 2M Ci . Ası́, la media
será
k
∗ 1X
x = ni · M Ci∗
n i=1
k
1X
= ni · 2 · M C i
n i=1
k
1X
=2· ni · M Ci
n i=1
=2·x
= 2 · 3,65
= 7,3

Por lo tanto la media aumenta al doble.

Para la varianza,
k
1X ∗
s2T = ni · (M Ci∗ − X )2
n i=1
k
1X
= ni · (2 · M Ci − 2 · X)2
n i=1
k
1X
= 4 · ni · (M Ci − X)2
n i=1
k
1X
=4· ni · (M Ci − X)2
n i=1
= 4 · s2

Por lo tanto, si los sueldos se duplican, el sueldo promedio se duplica y la varianza se


cuadriplica.

Probabilidad y Estadı́stica 5
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) El el punto anterior vimos que si multiplicamos todas las observaciones por una cons-
tante a, entonces, la media aumenta a veces y la varianza de los datos transformados
es σT2 = a2 σ 2 , donde σ 2 es la varianza de los datos originales.
En este caso, lo que hacemos es sumar a todas las observaciones una constante, con esto
media y varianza quedan de la siguiente manera:
k
∗ 1X
x = ni · (M Ci + a)
n i=1
k k
1 X X
= ( ni · M C i + a · ni )
n i=1 i=1
k
1 X a·n
= ( ni · M C i + )
n i=1 n
=x+a

k
1X
s2T = ni · (M Ci + a − (x∗ + a))2
n i=1
k
1X
= ni · (M Ci − x)2
n i=1
= s2

Por lo tanto, si aumentamos en 0.8 u.m. los sueldos, la varianza media aumentará en
(0,8) u.m con respecto al valor original, mientras que la varianza se mantendrá igual a
la de los datos originales.

3. ¿Qué ocurre con la mediana, media y desviación estándar de una secuencia de datos , cuando:

i) cada observación es multiplicada por 2?


ii) se le suma 10 a cada observación?

Solución:

i) Supongamos que nuestros datos son x1 , x2 , . . . , xn . Si multiplicamos todos los datos por
2, la nueva secuencia será 2x1 , 2x2 , . . . , 2xn . La mediana será el doble del valor anterior,
y la media:

Probabilidad y Estadı́stica 6
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

n
∗ 1X
x = 2 · xi
n i=1
n
2 X
= · xi
n i=1
n
1X
=2· xi
n i=1
=2·x

Por lo tanto la mediana y la media aumentarán al doble, mientras que la varianza s2


aumentará 4 veces s2T = 4 · s2 , esto ya que

n
1X
s2T = (2 · xi + 2 · x)2
n i=1
n
1X
= 4 · (xi − x)2
n i=1
= 4 · s2

Si multiplicamos todas las observaciones por una constante, la media y la mediana au-
mentarán en la misma magnitud de la constante, mientras que la varianza aumentará en
el cuadrado de la constante utilizada.
ii) Si sumamos 10 unidades a cada observación, la nueva secuencia será (x1 + 10), (x2 +
10), . . . , (xn + 10). Al aumentar todos los valores en la misma magnitud, la nueva me-
diana será la mediana anterior más 10 unidades.

n
∗ 1X
x = (xi + 10)
n i=1
n n
1X 1X
= xi + 10
n i=1 n i=1
= x + 10

La media y la mediana aumentarán en 10 unidades.

Probabilidad y Estadı́stica 7
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

La varianza
n
1X
s2T = [(xi + 10) − (x + 10)]2
n i=1
n
1X
= (xi − x)2
n i=1
= s2
por lo que la varianza no cambiará.

Si sumamos igual cantidad a todas las observaciones, las medidas de localización (media,
mediana) se verán alteradas, aumentando en la misma cantidad sumada, mientras que
la dispersión se mantendrá.
4. Demuestre que:
a) El valor que minimiza la función
n
1X
f (a) = (xi − a)2
n i=1
es a = x
b) La varianza s2 satisface:
n
2 1X 2
s = xi − x2
n i=1

Solución:
a) Sea la función:
n
1X
f (a) = (xi − a)2
n i=1
Si minimizamos esta función para a
n
df (a) 1X
= 2(xi − a) · (−1) = 0
da n i=1
X X
(xi ) − a=0
X
xi = n · a
x=a
Para comprobar que es mı́nimo calculamos la segunda derivada:
 n
d2 f (a)

d 1X
= 2(xi − a) · (−1)
da2 da n i=1
 
d 2X 2X
= − xi + a
da n n
=2>0

Probabilidad y Estadı́stica 8
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Por lo tanto, la varianza se minimiza con a = x


b) Desarrollamos el cuadrado
1X 1X 2
(xi − x)2 = (xi − 2x · xi + x2 )
n n
1X 2 1X 1X 2
= xi − 2x · xi + x
n n n
1X 2 1X 1
= xi − 2x · xi + n · x2
n n n
1X 2
= xi − 2x · x + x2
n
1X 2
= xi − 2x2 + x2
n
1X 2
= xi − x2
n

Probabilidad y Estadı́stica 9
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

1.2. Estadı́stica bivariada


1. Se desarrolló un experiemento para estudiar las propiedades de fragilidad del hidrógeno con
base en mediciones de presión electrolı́tica de hidrógeno. Se controló la densidad de corriente
de carga catódica y se varió en cuatro niveles. Se observó la presión efectiva del hidrógeno
como la respuesta. Sean

X: densidad de corriente de carga (mA/cm2 ),


Y: presión efectiva de hidrógeno (atm).

Los datos son los siguientes:

Corrida X Y
1 1.65 86.1
2 1.65 92.1
3 1.65 64.7
4 1.65 74.7
5 1.65 223.6
6 4.48 202.1
7 4.48 132.9
8 4.48 413.5
9 12.2 231.5
10 12.2 466.7
11 12.2 365.3
12 12.2 493.7
13 33.1 382.3
14 33.1 447.2
15 33.1 563.8
a) Calcule media, mediana, varianza y desviación estándar de Y. ¿Qué puede decir de la
distribución de esta variable?
b) Calcule la correlación entre X e Y. ¿Cuál es el R2 del modelo Y = a + bX?
c) ¿Existe alguna transformación de las variables que aumente el valor de la correlación
antes caculada?
d) Determine cuál es el mejor modelo de regresión lineal utlizando el valor del coeficiente
de determinacion.

Solución:
a) Los valores pedidos son
y = 282,7
M e = 231,5
s2 = 29937,5
s = 173,02

Probabilidad y Estadı́stica 10
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

La alta variabilidad s=173.02 respecto de la media y la diferencia de ésta y la mediana


nos indican que los datos se encuentran altamente dispersos (respecto de la media).
b) Corr(X, Y ) = 0,84 lo que nos indica que el valor de R2 del modelo Y = a + bX es
R2 ≈ 0,70
c) Si transformamos x0 = log(x) obtenemos que Corr(X 0 , Y ) = 0,93 y el R2 del modelo
Y = a0 + b0 X 0 es 0,85.
d) El mejor modelo es el que tiene mayor R2 , por lo tanto el mejor modelo es Y = a0 +
b0 log(X).

2. Se ha encuestado a 100 familias en una ciudad sobre su gasto mensual en ocio, Y , y sus
ingresos mensuales, X. En la siguiente tabla se presentan los resultados obtenidos, donde las
variables vienen expresadas en euros:

Y
X 0-100 100-200 200-800
600-1500 13 9 4
1500-2000 9 12 23
2000-5000 6 9 15

a) Calcule el gasto mensual promedio en ocio y el ingreso mensual promedio.


b) Calcule la varianza de cada variable. ¿Cuál le parece más homogénea?
c) ¿Quiénes gastan más en ocio: las familias con ingresos entre 1500 y 2000 o los que ganan
más de 2000?
d) Calcule la mediana de gasto mensual en ocio.
e) Calcule la covarianza entre las variables, ¿qué sugiere sobre la relación entre ellas?
f) Calcule la correlación lineal, ¿confirma o desestima lo obtenido en (e)?
g) Calcule los coeficientes del ajuste lineal e interprételos.
h) ¿Le parece que este modelo es adecuado? Justifique.

Solución:

a) Consideramos n = 100 observaciones y construimos las tablas univariadas de frecuencia


para X e Y sumando por filas y columnas, respectivamente, y queda:

X Y
M Ci ni M Cj nj
1050 26 50 28
1750 44 150 30
3500 30 500 42

Probabilidad y Estadı́stica 11
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Con esto, aplicando la fórumla para el cálculo de la media para variables agrupadas
queda
1
x= (1050 · 26 + 1750 · 44 + 3500 · 30) = 2093
100
análogamente,

1
y= (50 · 28 + 150 · 30 + 500 · 42) = 269
100
b) Para X:
1
s2x = · (10502 · 26 + 17502 · 44 + 35002 · 30) − 20932 = 928501
100
Para Y :
1
s2y = · (502 · 28 + 1502 · 30 + 5002 · 42) − 2692 = 40089
100
La más homogénea es X, ya que la desviación estándar de Y , el gasto en ocio, es muy
similar a la media, lo que indica una mayor variabilidad.

(También es posible concluir a partir del coeficiente de variación y ver que el de X es


menor, CVx = 0,46, que el de Y , CVy = 0,74)
c) Es posible calcular la distribución condicional del gasto en ocio para las familias de
ingresos mensuales entre 1500-2000 y 2000-5000 como se muestra en las siguientes tablas:
M Cj fj/i=1500−2000 fj/i=2000−5000
50 20.5 20.0
150 27.3 30.0
500 52.3 50.0
Estos porcentajes son prácticamente iguales, de hecho, al calcular el promedio para cada
nivel de ingreso mensual es 312.5 y 305, siendo levemente mayor, el gasto en ocio de las
familias que perciben ingresos mensuales entre 1500 y 2000 euros.
d) Aplicamos la fórmula percentil para el percentil 50:

n · q/100 − NM e 50 − 28
M e = lM e + · I = 100 + · 100 = 173,3
nM e 30

El 50 % de las familias tiene un gasto mensual en ocio menor o igual a 173.3 euros.
e) Para realizar este cálculo debemos considerar una modificación de la fórmula usual,
ya que no tenemos las observaciones, sino que la información tabulada. Para esto con-
sideremos, cada variable será representada por su marca de clase, y cada una de las
combinaciones de éstas (3 clases de X y 3 clases de Y , 9 en total) está repetida nij
veces, con i,j=1,2,3. Entonces, la fórmula de covarianza queda

Probabilidad y Estadı́stica 12
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

1X
Cov(X, Y ) = xi y i − x · y
n
1X
= nij · M Cxi · M Cyj − x · y
n
1
= · (13 · 1050 · 50 + 9 · 1050 · 150 + . . . + 9 · 3500 · 150 + 15 · 3500 · 500)
100
− 2093 · 269
= 602875 − 563017
= 39858

Ya que esta cantidad es positiva, sugiere que las variables se relaicionan de manera
directa, es decir, en la medida que una crece, la otra también lo harı́a.
f) Para el cálculo de este coeficiente, utilizamos los valores antes obtenidos y reemplazamos
Cov(X, Y ) 39858
ρ= p 2 2 = √ = 0,2065
sx · sy 928501 · 40089
Es concordante ya que es positivo, pero es un valor bajo como para asegurar que la
relación entre las variables es lineal.
g) Los coeficientes son

bb = Cov(X, Y ) = 39858 = 0,042


s2x 928501

a = y − bb · x = 269 − 0,085 · 2093 = 179,15


b
Por lo que el modelo queda
yb = 179,15 + 0,042 · x
donde la interpretación del intercepto no tiene sentido, ya que supone que el ingreso
mensual es cero, valor que no está en nuestro análisis. El otro valor se interpreta como
el incremento en 0.042 euros el gasto en ocio que se produce al incrementar en un euro
el ingreso mensual por familia.
h) No parece adecuado, por el bajo valor de la correlación (ρ = 0,21) que implica que
R2 = 0,04, es decir, más de un 90 % de la variabilidad del gasto en ocio serı́a atribuido
al azar.
3. Un comerciante al detalle lleva a cabo un estudio para determinar la relación entre los costos
semanales por publicidad y las ventas. Sean

X: costos de publicidad($)
Y: ventas ($)

Se registran los siguientes datos:

Probabilidad y Estadı́stica 13
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

X Y X2 Y2 XY Y −Y
40 385 1600 148225 15400 -68.7
20 400 400 160000 8000 -53.7
25 395 625 156025 9875 -58.7
20 365 400 133225 7300 -88.7
30 475 900 225625 14250 21.2
50 440 2500 193600 22000 -13.7
40 490 1600 240100 19600 36.3
20 420 400 176400 8400 -33.8
50 560 2500 313600 28000 106.3
40 525 1600 275625 21000 71.3
25 480 625 230400 12000 26.3
50 510 2500 260100 25500 56.3
a) Calcule los valores estimados de a y b del modelo Y = a + bX.
b) Estime las ventas semanales cuando los costos de publicidad son $20, $25, $30, $40 y
$50.
c) El coeficiente de determinación R2 se puede calcular como
(yi − ybi )2
P
2
R =1− P
(yi − y)2
Calcule este valor y determine si el ajuste es confiable.
d) ¿A qué se debe que la estimación sea o no fiable?

Solución:
a) Calculamos

bb = Cov(X, Y )
s2x
1
P
xi yi − x y
= n1P 2
n
x i − x2
1
· 191325 − 15503,12
12
= 1
· 15650 − 1167,4
12
440,63
=
136,77
= 3,22
Con esto el valor ajustado de a es
a = y − bbx
b
1 X 1 X
= yi − 3,22 · xi
12 12
1 1
= · 5445 − 3,22 · · 410
12 12
= 343,73

Probabilidad y Estadı́stica 14
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

enta = 343,73 + 3,22 · costo


Por lo que el modelo que da v\
b) Con el modelo antes calculado obtenemos

Costo V\enta
20 408.13
25 424.23
30 440.33
40 472.53
50 504.73
c) El coeficiente de determinación R2 se puede calcular como

(yi − yb)2
P
2
R =P
(yi − y)2

Calcule este valor y determine si el ajuste es confiable.


Y Yb Y −Y Y − Yb
385 472.53 -68.7 -87.5
400 408.13 -53.7 -8.12
395 424.23 -58.7 -29.22
365 408.13 -88.7 -43.12
475 440.33 21.2 34.67
440 504.73 -13.7 -64.74
490 472.53 36.3 17.46
420 408.13 -33.8 11.87
560 504.73 106.3 55.25
525 472.53 71.3 52.46
480 424.23 26.3 55.77
510 504.73 56.3 5.25
Por lo tanto
25226,21
R2 = 1 −
42256,25
= 1 − 0,596
= 0,403

d) Depende del valor del coeficiente de determinación que en este caso es inferior al 70 %
lo que genera un estimación poco confiable.

4. Se quiere explicar la respuesta a un estı́mulo a lo largo del tiempo. Sean X, el tiempo de


respuesta e Y , el estı́mulo entregado. A continuación se muestran medidas de resumen para
las 14 observaciones:

Probabilidad y Estadı́stica 15
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

X X X X
xi = 82 x2i = 662,5 yi = 20,97 yi2 = 64,26
X X X
log(yi ) = −3,72 (log yi )2 = 22,70 xi yi = 54,43
X X X
xi log(yi ) = −82,48 ei = 7,187 e0i = 1,523
En clases vimos gráficamente que el ajuste exponencial era “mejor” que el ajuste lineal.

Calcule correlación entre X e Y y entre X y log(Y ). Calcule además el coeficiente de de-


terminación de ambos ajustes. ¿Son consistentes estos resultados con lo comentado en clases?

Solución:

De las cantidades entregadas calculamos los siguientes estadı́sticos:

x = 5,857 s2x = 13,015


y = 1,497 s2y = 2,347
log(y) = −0,266 s2log(y) = 1,551
Cov(x, y) = −4,885 Cov(x, log(y)) = −4,332

Con esto,

−4,885
Corr(x, y) = √ = −0,883
13,015 · 2,347
y
−4,332
Corr(x, log(y)) = √ = −0,964
13,015 · 1,551

El modelo lineal ajustado es


y = 3,70 − 0,375 · x
2
y el R es
e2i
P
2
R =1− P
(y − y)2
P 2i
ei
=1−
n · s2y
7,187
=1−
14 · 2,347
= 1 − 0,218
= 0,781

Probabilidad y Estadı́stica 16
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Por lo que X explica un 78 % de la variabilidad de Y .


El modelo exponencial ajustado es

log(y) = 1,684 − 0,332 · x

El coeficiente R2 es
P 0 2
2 (ei )
R =1− P
(log(y ) − log(y))2
P 0 2i
(ei )
=1−
n · s2log(y)
1,523
=1−
14 · 1,551
= 1 − 0,070
= 0,929

y la variable X explica un 92.9 % de la variabilidad de log(Y ), con lo que comprobamos que


el ajuste exponencial es mejor que el ajuste lineal.

5. Los datos a continuación representan el tamaño y precio de 6 terrenos de una determinada


localidad.

Tamaño, X (cien m2 ) 4.4 8.2 10.3 15.3 19 30.2


Precio, Y (millones) 0.3 0.57 0.93 1.48 2.42 4.07

El Principio de Parsimonia establece que si hay más de una solución posible a un problema,
se debe escoger la más simple.
Bajo este criterio y el análisis de los estadı́sticos que se presentan, determine qué modelo
representa mejor la relación entre las variables. Interprete el modelo escogido.

corr(X,Y) a
b bb R2
Lineal 0.992 -0.583 0.151 0.985
Exponencial 0.958 -1.303 0.099 0.919
Polinomial 0.994 -3.363 1.401 0.989

Solución:
Las variables y sus transformaciones presentan una correlación mayor al 95 %, lo que nos
indica que se justifica el ajuste de los tres modelos. De los tres, el de menor correlación es el
modelo esponencial, por lo que decidiremos entre los otros dos modelos.

Tanto el modelo lineal como el modelo polinomial presentan un 99 % de correlación y un


R2 superior al 98 %, siendo mayor el del modelo polinomial. Como ambos indicadores son
similares, y aun cuando el modelo polinomial parece más adecuado, por parsimonia el mejor
ajuste será el lineal, ya es más simple y explica lo mismo que el modelo polinomial.

Probabilidad y Estadı́stica 17
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

El modelo ajustado es
ybi = −0,583 + 0,151 · xi
lo que quiere decir que cuando el tamaño del terreno aumenta en 100 m2 el precio aumenta
en 0.151 millones. El intercepto no tiene una interpretación en el contexto de las variables.
6. El crecimiento de una colonia de abejas está determinado por la siguiente ecuación:
230
y=
1 + α · e−β·t
Donde y representa el número de abejas y t el tiempo medido en meses. Se obtuvieron los
siguientes datos.

t 1 13 23 33 53 63
y 5,746 157,496 227,412 229,935 235,000 235,000

Determine una estimación de α y β.

Solución:

230
y= depejando en términos de y
1 + α · e−β·t
230 − y
α · e−β·t = aplicando logaritmo natural para linealizar
y
 
230 − y
ln (α) − β · t = ln que es una representación lineal
y

Realizando el cambio de variable pertinente:

t y ln((230 − y)/y)
1 5,746 3,664
13 157,496 0,776
23 227,412 4,476
33 229,935 8,171
53 235,000 -3,850
63 235,000 -3,850

Se obtiene:

Coeficiente de correlación múltiple 0,602143


Coeficiente de determinación R2 0,362576
R2 ajustado 0,203221
Error tı́pico 3,563255
Observaciones 6

Probabilidad y Estadı́stica 18
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Coeficientes
Intercepto 0,238998
Variable X1 -0,101574

β = −0, 101574,
ln (α) = 0, 238998,
α = 1, 269976

Por lo que el modelo a ajustar es:

230
y=
1 + 1, 269976 · e0,101574·t

Probabilidad y Estadı́stica 19
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

1.3. Propuestos
1. Los datos a continuación presentan el precio medio por factor de carga en tarifas no horarias
de uso general.

Donde,

Tarifa 2: Cargo fijo mensual y cargo por energı́a consumida.


Tarifa 3: Cargo por demanda máxima medida y cargo por energı́a consumida.
Tarifa O-M: Cargo por demanda máxima medida y cargo por energı́a consumida.

Determinar el mejor ajuste entre factor y cargo de acuerdo a tarifa

2. El % de permeabilidad en una tela es una medida de calidad de este producto. El encargado


de control de calidad tiene la sospecha de que este indicador se encuentra estrechamente
relacionado con el % de poliéster de la misma. La siguiente tabla muestra los análisis de una
muestra de 120 telas.

Probabilidad y Estadı́stica 20
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Y
X 17.12 18.76 20.4 22.04 23.68
60.69 0 0 0 2 4
61.82 0 0 0 6 1
62.95 0 1 2 8 9
64.08 0 6 34 5 1
65.21 2 2 12 0 0
66.34 15 9 0 0 0
67.47 0 1 0 0 0

Si X: % de permeabilidad e Y : % de poliéster.

a) ¿Qué usarı́a para decidir (considerando los distintos niveles de poliéster) qué telas tienen
un % de permeabilidad más homogéneo? Determı́nelo.
b) Determine la covarianza Cov(X,Y)
c) ¿Está sustentada, en los datos obtenidos, la sospecha del fabricante?

3. Considere los siguientes datos de la variable salario actual (en cientos de dólares) de 474
trabajadores de una empresa

Comente las estadı́sticas de resumen y esboce una gráfica adecuada para dicha variable. La
paradoja de Simpson o efecto Yule-Simpson describe el cambio en el sentido de una aso-
ciación entre dos variables cuando se controla el efecto de una tercera variable.

4. Considere el siguiente estudio en que interesa el efecto de una campaña para crear conciencia
en conductores de los peligros de conducir bajo la influencia del alcohol. Previo a la campaña
se le realizó alcoholemia a 550 conductores y posterior a la campaña, a 650. Los datos se
presentan a continuación:

Probabilidad y Estadı́stica 21
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Campaña
Previo Posterior
Alcoholemia Positiva 126 150
Negativa 424 500
Total 550 650

Los mismos datos fueron disgregados por sexo del conductor (H:hombre; M:mujer) como se
muestra a continuación.
Campaña
Previo Posterior
H M H M
Alcoholemia Positiva 45 81 120 30
Negativa 100 324 335 165
Total 145 405 455 195

¿Qué podemos decir acerca del éxito de la campaña? ¿Disminuye el número de alcoholemias
positivas? Analice los datos conjuntos y separados por sexo.
5. En un proceso de destilación quı́mico, el porcentaje Y de pureza de oxı́geno producido está re-
lacionado con el porcentaje X de hidrocarburo, presente en el condensador principal de la
unidad de destilación. Se efectuaron 55 mediciones, en las cuales se observaron conjuntamente
las variables X e Y , cuyos resultados se incluyen en la siguiente tabla:

% pureza del oxı́geno


% hidrocarburo 87-90 90-93 93-96 96-99
0.87-1.07 10 5 0 0
1.07-1.27 5 12 2 1
1.27-1.47 1 4 9 2
1.47-1.67 0 1 2 1

Calcule el porcentaje de variabilidad del nivel de pureza del oxı́geno para los casos en que se
observa en el condensador principal un nivel de hidrocarburo inferior a 1.27 %
6. Se determinaron las siguientes mediciones del pulso a 40 personas saludables, de edad similar,
de sexo masculino, al serles inoculado un antibiótico que se estima provoca cierta alteración
en el ritmo del pulso. Se determinaron 4 medidas distintas 0.1 ml, 0.2ml, 0.3ml, 0.4ml y los
resultados fueron (el ritmo normal es de 60 pulsaciones por minuto)

0.1: 53 65 54 55 60 65 58 59 60 63
0.2: 51 67 68 58 59 54 57 65 68 69
0.3: 56 52 57 59 60 66 65 64 53 58
0.4: 54 65 66 68 69 70 52 51 50 69

(Considere normalidad entre 60 ± 2 pulsaciones por minuto). Determine el pulso promedio


de un individuo al que se le inocula 0,25 ml de la droga.

Probabilidad y Estadı́stica 22
Capı́tulo 2

Probabilidades

2.1. Probabilidad básica y condicionada. Independencia.


1. Un banco debe elegir una directiva compuesta por 5 cargos: director, subdirector, interventor,
cajero y cobrador, entre 8 candidatos. Los candidatos son:

3 hombres: Felipe, Gonzalo y Joaquı́n.


5 mujeres: Alicia, Bárbara, Evelyn, Claudia y Natalia.

Suponga que si una persona pertenece a esta directiva, esta persona puede ocupar sólo un
cargo y suponga que todas las posibles directivas que pueden formarse tienen la misma
probabilidad de ocurrir.

a) Determine el número de directivas diferentes que es posible formar.


b) Calcule la probabilidad que Felipe y Gonzalo NO estén simultáneamente en la directiva.
c) Calcule la probabilidad que la directiva esté compuesta por al menos 3 mujeres.

Solución:

a) Usando el Principio Multiplicativo, el número de directivas diferentes que pueden for-


marse es: 8 · 7 · 6 · 5 · 4. )
b) Defina el evento A : “Gonzalo y Felipe no están simultáneamente en la directiva”.
Alternativa 1: Note que P(A) = 1 − P(A{ ).
Para saber cuántos elementos tiene A{ , considere lo siguiente:
(i). Hay 52 · 2! = 20 formas de Felipe y Gonzalo ocupen un cargo en la directiva


(pues, cargos son diferentes).


(ii). Una vez asignados los cargos de Felipe y Gonzalo, hay 6 · 5 · 4 formas de llenar
los cargos restantes.
Luego, A{ tiene 20 · 6 · 5 · 4 elementos (Principio Multiplicativo).
Por tanto, dada la equiprobabilidad entre todas las directivas posibles, la probabi-

23
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

lidad pedida es:


 
P (A) = 1 − P A{
20 · 6 · 5 · 4
=1−
8·7·6·5·4
Alternativa 2: Defina los eventos:
G : “Gonzalo está en la directiva, pero Felipe no lo está”.
F : “Felipe está en la directiva, pero Gonzalo no lo está”.
N : “Ni Gonzalo ni Felipe están en la directiva”.
Note que A = G ∪ F ∪ N y además los eventos G, F y N son disjuntos dos a dos.
Por tanto, P(A) = P(G) + P(F ) + P(N ).
Para saber cuántos elementos tiene G, considere lo siguiente:
(i) Hay 5 formas de elegir el cargo que ocupará Gonzalo (pues, cargos son diferen-
tes).
(ii) Una vez asignado el cargo de Gonzalo, hay 6 · 5 · 4 · 3 formas de llenar los cargos
restantes (pues, Felipe no debe estar en la directiva).
Luego, el número de elementos de G es: 5 · 6 · 5 · 4 · 3.
Por tanto, dada la equiprobabilidad entre todas las directivas posibles,
5·6·5·4·3 15
P (G) = =
8·7·6·5·4 56
Análogamente, P(F ) = 15/56.
Para obtener el número de elementos de N , note que si Gonzalo y Felipe no deben
estar en la directiva, entonces N tiene 6 · 5 · 4 · 3 · 2 elementos.
Por tanto, dada la equiprobabilidad entre todas las directivas posibles,
6·5·4·3·2 6
P (N ) = =
8·7·6·5·4 56
Finalmente, la probabilidad pedida es: P(A) = P(G) + P(F ) + P(N ) = 36/56 =
9/14.
c) Para cada j ∈ {3, 4, 5}, defina el evento Mj : “En la directiva hay exactamente j
mujeres”.
Para calcular el número de elementos que tiene M3 considere lo siguiente:
(i) Hay 53 formas de elegir los cargos que ocuparán mujeres (pues los cargos son


diferentes).
(ii) Una vez hecho lo anterior, estos cargos pueden ser llenados de 5 · 4 · 3 formas.
(iii) Una vez hecho (i) y (ii), hay 3 · 2 formas de llenar los cargos compuestos por
hombres.
Luego, M3 tiene 53 · 5 · 4 · 3 · 3 · 2 = 3600 elementos (Principio Multiplicativo).


Usando argumentos similares, se tiene que:


M4 tiene 54 · 5 · 4 · 3 · 2 · 3 = 1800 elementos.


Probabilidad y Estadı́stica 24
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

M5 tiene 5 · 4 · 3 · 2 · 1 = 120 elementos.


Por tanto, la probabilidad pedida en esta parte es:
3600 + 1800 + 120
P (M3 ) + P (M4 ) + P (M5 ) =
8·7·6·5·4

2. Sea Ω un espacio muestral y P(·) una medida de probabilidad. Sean A, B, C ⊆ Ω. Determine


si la siguiente proposición es verdadera o falsa.

Si P(A | C) ≥ P(B | C) y P(A | C { ) ≥ P(B | C { ), entonces P(A) ≥ P(B).

Si la proposición es verdadera, demuéstrela. Si es falsa, provea un contraejemplo. Contraejem-


plos deben incluir: el espacio muestral Ω, los eventos A, B y C, y la medida de probabilidad
P(·).

Solución:

La proposición es verdadera.

Demostración: Según la definición de probabilidad condicional

P (A ∩ C) P (B ∩ C)
P (A | C) ≥ P (B | C) ⇒ ≥
P (C) P (C)
⇒ P (A ∩ C) ≥ P (B ∩ C)

 

{
 
{
 P A ∩ C{ P B ∩ C{
P A|C ≥P B|C ⇒  ≥ 
P C{ P C{
   
⇒ P A ∩ C{ ≥ P B ∩ C{

Luego,
   
{ {
P (A ∩ C) + P A ∩ C ≥ P (B ∩ C) + P B ∩ C
⇒ P (A) ≥ P (B)

lo que completa la demostración.

3. Sean A, B y C tres eventos tales que A ∩ C = ∅, demostrar que:

P ((A ∪ C) | B) = P (A | B) + P (C | B)

Probabilidad y Estadı́stica 25
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Solución:

P ((A ∪ C) ∩ B)
P ((A ∪ C) | B) =
P (B)
P ((A ∩ B) ∪ (C ∩ B))
=
P (B)
P (A ∩ B) P (C ∩ B)
= + (2.1)
P (B) P (B)
= P (A | B) + P (C | B)

(2.1) ya que si A ∩ C = ∅ entonces A ∩ B y C ∩ B son disjuntos.

4. Sean A y B dos eventos tales que P(A) = 1/4, P(B | A) = 1/2, y P(A | B) = 1/4. Decir si
son ciertas o falsas las siguientes relaciones:

a) A ⊂ B
b) A y B son independientes
c) A{ y B { son independientes.
d) A y B son disjuntos.
e) P(A{ | B { ) = 1/2
f) P(A | B) + P(A{ | B { ) = 1

Solución:

a) Si A ⊂ B, entonces A ∩ B = A, y por lo tanto se cumplirı́a que

P(A ∩ B) P(A) 1
P(B/A) = = = 1 6=
P(A) P(A) 2

Lo que nos dice que no se cumple A ⊂ B


b) Si A y B son independientes se debe cumplir que

P(A | B) = P(A)

lo que en este caso se cumple, ya que ambas probabilidades son 1/4.


También se cumple que
1 1 1
P(A ∩ B) = P(B | A) · P(A) = · = = P(A) · P(B)
2 4 8

c) Basta probar que P(B { | A{ ) = P(B { ). Notemos por (b) que P(B) = P(B | A) = 1/2

Entonces,

Probabilidad y Estadı́stica 26
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

P(A{ ∩ B { )
P(A{ | B { ) =
P(B { )
P((A ∪ B){ )
=
P(B { )
1 − P(A ∪ B)
=
P(B { )
1 − (P(A) + P(B) − P(A ∩ B))
=
P(B { )
1 − (P(A) + P(B) − P(A) · P(B))
=
1 − P(B)
1 − (1/4 + 1/2 − 1/4 · 1/2)
=
1 − 1/2
1 − 5/8
=
1/2
3/8
=
1/2
= 1/4 = P(A{ )

Por lo tanto, A{ y B { también son independientes.


d) A y B no pueden ser disjuntos, ya que son independientes. En efecto, si son disjuntos,
A ∩ B = ∅ y como son independientes se tiene que

P(A ∩ B)
P(A | B) = , si son disjuntos
P(B)
P(∅)
=
P(B)
= 0 6= P(A)

e) En (c) calculamos lo pedido, que es claramente distinto a 1/2.


f) Es claro que no se cumple, ya que

P(A/B) = 1/4 y P(A{ /B { ) = 1/4

entonces
P(A/B) + P(A{ | B { ) = 1/2 6= 1

5. Un ingeniero desea escoger, entre los dos diseños de circuitos que se muestran en la figura,
aquel que brinda una mayor probabilidad de que la corriente circule entre el punto A y el
punto B. Si las componentes (resistencias) funcionan de forma independiente y cada una
tiene una probabilidad q de fallar. ¿Cuál de los dos diseños debiera escoger el ingeniero?.
Justifique su respuesta.

Probabilidad y Estadı́stica 27
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Solución:

Sean los eventos:

SD: La componente Superior Derecha funciona.


SI: La componente Superior Izquierda funciona.
ID: La componente Inferior Derecha funciona.
II: La componente Inferior Izquierda funciona.
Fi : El circuito i funciona (i = 1, 2).

Entonces la probabilidad de que cada componente funcione es p = 1 − q y

P (F1 ) = P ((SI ∪ II) ∩ (SD ∪ ID))


= [P (SI ∪ II)]2 (por independencia e igualdad de las componentes)
= [P (SI) + P (II) − P (SI ∩ II)]2
= [p + p − p2 ]2
= p2 (2 − p)2

P (F2 ) = P ((SI ∩ SD) ∪ (II ∩ ID))


= P (SI ∩ SD) + P (II ∩ ID) − P ((SI ∩ SD) ∩ (II ∩ ID))
= p2 + p2 − p4 (por independencia e igualdad de las componentes)
2 2
= p (2 − p )

Comparando, tenemos que (2 − p)2 ≥ 2 − p2 ya que:


4 − 4p + p2 ≥ 2 − p2
2 − 4p + 2p2 ≥0
1 − 2p + p2 ≥0
(p − 1)2 ≥0 ∀ 0≤p≤1
Por tanto, el primer diseño debe ser el elegido pues tiene una mayor probabilidad de funcionar
cualquiera sea el valor de p.

Probabilidad y Estadı́stica 28
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

6. Un banco revisa su polı́tica de tarjetas de crédito, con el objetivo de cancelar algunas de ellas.
En el pasado, el 5 % de los clientes con tarjeta ha pasado a ser moroso, esto es ha dejado de
pagar sin que el banco pudiera recuperar la deuda. Además, el banco ha comprobado que
la probabilidad de que un cliente normal se atrase en un pago es de 0,2. Naturalmente, la
probabilidad de que un cliente moroso se atrase en un pago es 1.

a) Identifica y da nombre a los sucesos que aparecen en el enunciado.


b) Elegido un cliente al azar, ¿qué probabilidad hay de que el cliente se atrase en un pago
mensual?
c) Si un cliente se atrasa en un pago mensual, calcular la probabilidad de que el cliente se
convierta en moroso.
d ) Al banco le gustarı́a cancelar la lı́nea de crédito de un cliente si la probabilidad de que
éste acabe convirtiéndose en moroso es mayor de 0,25. De acuerdo con los resultados
anteriores, ¿debe cancelar una lı́nea si un cliente se atrasa en un pago? ¿Por qué?

Solución:

a) Sean los eventos:


M : Clientes Morosos.
M { : Clientes no Morosos.
A: Clientes atrasado en un pago.

   
P (M ) = 0, 05 , P M { = 0, 95 , P (A | M ) = 1 , P A | M { = 0, 2

b) Utilizando la ley de probabilidad total,

   
P (A) = P (A | M ) · P (M ) + P A | M { · P M { = 1 · 0, 05 + 0, 2 · 0, 95 = 0, 24

c) Aplicando el teorema de Bayes,

P (A | M ) · P (M ) 1 · 0, 05
P (M | A) = = = 0, 208
P (A) 0, 24
d ) Para cancelar la lı́nea de crédito se debe cumplir que P (M | A) > 0, 25, dado que se
tiene que: 0, 208 > 0, 25, entonces no existe posibilidad de cerrarla.

7. Los directivos de la agencia de viajes de Barcelona Cabarna S.A. quieren plantear una es-
trategia de expansión hacia el resto de comarcas, por lo que se plantea si fusionarse con la
empresa Sol S.A., compran la empresa de la competencia o bien ampliar sus instalaciones. La
decisión se tomará en función de la evolución futura de las ventas. El departamento comercial
prevé que las ventas pueden ser altas, medias o bajas, con una probabilidad del 25 %, 45 % y
30 % respectivamente. Por otra parte, las ganancias de acuerdo con la estrategia seleccionada
con las siguientes:

Probabilidad y Estadı́stica 29
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

ALTERNATIVAS VENTAS ALTAS VENTAS MEDIAS VENTAS BAJAS


25 % 45 % 35 %
FUSION 350000 140000 60000
COMPRAR 300000 180000 50000
AMPLIACION 275000 160000 80000

Determinar las ganancias esperadas y decidir por cuál alternativa optar.

Solución:

F = 350000 · 0, 25 + 140000 · 0, 45 + 60000 · 0, 3 = 168500


C = 300000 · 0, 25 + 180000 · 0, 45 + 50000 · 0, 3 = 171000
A = 275000 · 0, 25 + 160000 · 0, 45 + 80000 · 0, 3 = 164750

Por lo tanto la alternativa es comprar, ya que es la que tiene la mayor ganancia esperada.

8. Se ha nominado a tres miembros de un club privado para ocupar la presidencia del mismo.
La probabilidad de que se elija al señor A es de 0.3; la que se haga lo propio con el señor B,
de 0.5, y la de que gane la señora C, de 0.2. En caso que se elija al señor A, la probabilidad
de que la cuota de ingreso incremente es de 0.8, si se elije al señor B o a la señora C, las
correspondientes probabilidades de que haya un incremento en la cuota son de 0.1 y 0.4.

a) ¿Cuál es la probabilidad de que haya un incremento en la cuota de membresı́a?


b) Dado que la cuota se ha incrementado, ¿cuál es el candidato con mayor probabilidad
de haber sido electo presidente?
¿Tenı́a este candidato la mayor probabilidad de ser electo inicialmente? Comente.

Solución:

a) Definamos los eventos de interés:


A: “el señor A es elegido como presidente”.
B: “el señor B es elegido como presidente”.
C: “el señor C es elegido como presidente”.
E: “el candidato electo incrementa la cuota”.
Para esto utilizamos probabilidades totales (equivalentemente, podemos definir un dia-
grama de árbol), ya que necesitamos P(E). Del enunciado tenemos que:

P(A) = 0,3 P(B) = 0,5 P(C) = 0,2


P(E | A) = 0,8 P(E | B) = 0,1 P(E | C) = 0,4

Probabilidad y Estadı́stica 30
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Por lo tanto,

P(E) = P(E | A) · P(A) + P(E | B) · P(B) + P(E | C) · P(C)


= 0,3 · 0,8 + 0,5 · 0,1 + 0,2 · 0,4
= 0,37

por lo tanto, la probabilidad de que la couta se incremente es de un 37 %.


b) Necesitamos utilizar el teorema de Bayes para calcular las probabilidades a posteriori
de aumentar la cuota.

Ası́,

P(E | A)P(A)
P(A | E) =
P(E)
0,3 · 0,8
=
0,37
= 0,65

P(E | B)P(B)
P(B | E) =
P(E)
0,5 · 0,1
=
0,37
= 0,14

P(E | C)P(C)
P(C | E) =
P(E)
0,2 · 0,4
=
0,37
= 0,21

Dado que la cuota se incrementa, el candidato con mayor probabilidad de ser electo es
el señor A. Aun cuando a priori sabı́amos que el señor B tenı́a mayor probabilidad de
ser electo, el aumento de cuota resulta ser un beneficio para la candidatura del señor A.

9. Un inversionista tiene tres opciones de inversión que le presenta el mercado, I1 , I2 e I3 . Él


decide por una de éstas y le presenta su propuesta al cliente, el cual puede cambiarla o
mantener la sugerida por el inversionista. Sean los eventos Di , el cliente decide la opción de
inversión i, i = 1, 2, 3

La tabla adjunta presenta la probabilidad de que el cliente decida por la opción Dj dado que
el inversionista le presenta la inversión Ik .

Probabilidad y Estadı́stica 31
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

D1 D2 D3
I1 0.7 0.1 0.2
I2 0.1 0.8 0.1
I3 0.0 0.1 0.9

Suponga que la probabilidad de que el inversionista escoja cada una de las tres opciones es:
P(I1 ) = 0,10
P(I2 ) = 0,40
P(I3 ) = 0,50

a) Calcule la probabilidad de que el cliente decida por la segunda opción de inversión D2 .


b) Dado que el cliente escogió la segunda opción de inversión, calcule la probabilidad de
que el inversionista le sugirió esa opción.
c) Para cada k por separado, calcule la probabilidad de que el inversionista decida por la
opción k y el cliente la acepte.
d) En términos de los eventos I y los eventos D defina el evento:
C: la decisión del inversionista y el cliente es la misma.
e) Calcule la probabilidad del evento C.

Solución:

a) Por teorema de probabilidad total,

P(D2 ) = P(D2 | I1 )P(I1 ) + P(D2 | I2 )P(I2 ) + P(D2 | I3 )P(I3 )

Con los datos de la tabla y las probabilidades de Ik , obtenemos

P(D2 ) = P(D2 | I1 )P(I1 ) + P(D2 | I2 )P(I2 ) + P(D2 | I3 )P(I3 )


= 0,1 · 0,1 + 0,8 · 0,4 + 0,1 · 0,5
= 0,38

Por lo tanto, la probabilidad de que el cliente escoja la segunda opción de opción de


inversión, sin importar lo que sugiere el inversionista es 0.38.
b) Se pide calcular
P(I2 | D2 )
Aplicando el teorema de Bayes, nos queda
P(D2 | I2 ) · P(I2 )
P(I2 | D2 ) =
P(D2 )
0,8 · 0,40
=
0,38
= 0,842

Por lo tanto, dado que el cliente escogió la segunda opción, la probabilidad que el
inversionista la haya sugerido es 0.84.

Probabilidad y Estadı́stica 32
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Para cada k = 1,

P(D1 ∩ I1 ) = P(D1 | I1 )P(I1 ) = 0,7 · 0,1 = 0,07

Para cada k = 2,

P(D2 ∩ I2 ) = P(D2 | I2 )P(I2 ) = 0,8 · 0,4 = 0,32

Para cada k = 3,

P(D3 ∩ I3 ) = P(D3 | I3 )P(I3 ) = 0,9 · 0,5 = 0,45

d) Sea C: la decisión del inversionista y el cliente es la misma. Entonces

C = (D1 ∩ I1 ) ∪ (D2 ∩ I2 ) ∪ (D3 ∩ I3 )

e) Como los eventos son independientes, entonces

P(C) = P((D1 ∩ I1 ) ∪ (D2 ∩ I2 ) ∪ (D3 ∩ I3 ))


= P(D1 ∩ I1 ) + P(D2 ∩ I2 ) + P(D3 ∩ I3 )
= 0,07 + 0,45 + 0,32
= 0,84

Probabilidad y Estadı́stica 33
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

2.2. Variables Aleatorias


1. Sea X = número de sustancias nocivas en un material de trabajo escogido al azar.

a) ¿Cuál de las siguientes tres funciones de probabilidad es una función de probabilidad


legitima para X, ¿Por qué no se permiten las otras 2?
x 0 1 2 3 4
p(x) 0.3 0.2 0.1 0.05 0.05
p(x) 0.4 0.1 0.1 0.1 0.3
p(x) 0.4 0.2 -0.3 0.5 0.2
b) Para la función de probabilidad legitima de la parte anterior. Calcule P(2 ≤ X ≤ 4),
P(X ≤ 2) y P(X 6= 0)
c) Escriba la función de probabilidad acumulada.

Solución:

a) Para que una función p(x) sea función distribución de una variable aleatoria debe cum-
plir que:
i) p(x) ≥ 0 ∀ x ∈ R
X
ii) p(x) = 1
x∈R

Es claro que la primera función no cumple la segunda condición y la tercera, no cumple


la primera (p(2) < 0). Por lo tanto la única función de probabilidad legı́tima es la
segunda.
b)
P(2 ≤ X ≤ 4) = P(X = 2) + P(X = 3) + P(X = 4)
= 0,1 + 0,1 + 0,3
= 0,5

P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)


= 0,4 + 0,1 + 0,1
= 0,6

P(X 6= 0) = P(X > 0)


= 1 − P(X ≤ 0)
= 1 − 0,4
= 0,6

Probabilidad y Estadı́stica 34
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Recordemos que la función distribución acumulada (f.d.a) se define como

F (x) = P(X ≤ x), x∈R

Por lo tanto la f.d.a para la función elegida es


x 0 1 2 3 4
F(x) 0.4 0.5 0.6 0.7 1

2. Si p(x) = c · (5 − x) para x = 0, 1, 2, 3. ¿Cuál es el valor de c?

Solución:

P
Recordemos que la si p(x) es función de probabilidad debe cumplir que p(x) = 1, por lo
tanto para calcular c debemos verificar que cumpla esta propiedad. Ası́,
3
X 3
X
p(x) = c · (5 − x)
x=0 x=0
= c · (5 − 0) + c · (5 − 1) + c · (5 − 2) + c · (5 − 3)
= c · (5 + 4 + 3 + 2)
= c · 14

1
Por lo tanto 14 · c = 1 y el valor de c que hace que p(x) sea función de probabilidad es c = 14
.

3. Una multinacional produce determinado artı́culo electrónico que se emplea en el área médica,
y las especificaciones dicen que solo un 2 % de los artı́culos producidos presentan fallas. Dos
ingenieros, expertos en control de calidad, realizan su propio plan de inspección: el ingeniero
A comienza a inspeccionar los artı́culos de uno a la vez hasta detectar el primer defectuoso
y acepta las especificaciones si realiza más de dos extracciones; el ingeniero B toma una
muestra de tamaño 5 y acepta las especificaciones del fabricante si no encuentra defectuosos.
¿Cuál de los dos ingenieros tiene mayor probabilidad de rechazar las especificaciones dadas
por el fabricante?

Solución:

Calculemos la probabilidad de rechazar las especificaciones de cada ingeniero, y notemos que


p = P(encontrar un artı́culo defectuoso) = 0.02.

Ingeniero A: el experimento que realiza es inspeccionar artı́culos de uno a la vez de manera


independiente hasta detectar el primer defectuoso, lo que corresponde a la realización de una
v.a. Geométrica de parámetro p.
Acepta las especificaciones si realiza más de dos extracciones (X > 2), por lo que las rechaza

Probabilidad y Estadı́stica 35
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

cuando realiza a lo más dos extracciones (X ≤ 2).

Entonces, sea
X: número artı́culos inspeccionados hasta detectar el primero defectuoso,

X ∼ Geom(p = 0.02)

y la probabilidad pedida es

P(X ≤ 2) = P(X = 1) + P(X = 2)


= (1 − 0,02)1−1 0,02 + (1 − 0,02)2−1 0,02
= 0,02 + 0,0196
= 0,0396

Ingeniero B: el experimento que realiza es tomar una muestra de tamaño 5 e inspeccionarla.


Acepta las especificaciones del fabricante si no encuentra defectuosos, esto es, no encuentra
“éxitos” en su muestra, lo que corresponde a una v.a. Binomial de parámetros n y p.

Entonces, sea
Y: número artı́culos defectuosos en la muestra de tamaño 5,

Y ∼ Bin(n=5,p=0.02)

y la probabilidad pedida es

P(Y > 0) = 1 − P(Y = 0)


 
5
=1− (1 − 0,02)5−0 (0,02)0
0
= 0,096

Como el ingeniero A rechaza las especificaciones el 4 % de las veces, mientras que el ingeniero
B, un 9 %, es éste ingeniero quien tiene mayor probabilidad de rechazar las especificaciones.

4. El 70 % de los aviones ligeros que desaparecen en vuelo en cierto paı́s son descubiertos
posteriormente. De las naves descubiertas, el 60 % tiene localizador de emergencia, en tanto
que el 90 % de las naves no descubiertas no tiene ese localizador.

a) Calcule la probabilidad que un avión ligero tenga localizador de emergencia.

En las partes (b), (c) y (d), suponga que la probabilidad que un avión ligero tenga localizador
de emergencia es del 45 %.

b) Considere 10 aviones ligeros desaparecidos. ¿Cuál es la probabilidad que exactamente


2 de ellos tengan localizador de emergencia?

Probabilidad y Estadı́stica 36
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Ud. observa independientemente aviones ligeros hasta obtener el primer avión con lo-
calizador de emergencia. ¿Cuál es la probabilidad que el proceso finalice en a lo más 10
observaciones?
d) Ud. observa independientemente aviones ligeros hasta obtener el tercer avión con lo-
calizador de emergencia. ¿Cuál es la probabilidad que el proceso finalice al menos 4
observaciones?
Solución:
a) Defina los siguientes eventos:
D : “Avión ligero descubierto”
L : “Avión ligero tiene localizador de emergencia”
Según enunciado, P(L | D) = 6/10, P(L{ | D{ ) = 9/10 y P(D) = 7/10.
Usando la probabilidades totales, la probabilidad pedida es:
P(L) = P(L | D) · P(D) + P(L | D{ ) · P(D{ )
6 7 1 3 45
= · + · =
10 10 10 10 100
b) Sea X : número de aviones con localizador de emergencia, de entre los 10 aviones
disponibles. Claramente, Rec(X) = {0, 1, . . . , 10} y además X ∼ Bin(n = 10; p =
0,45). Por tanto, la probabilidad pedida es:
 
10
P(X = 2) = · (0,45)2 · (0,55)8
2
c) Sea Y : Número de aviones que es necesario observar hasta obtener el primer avión
con localizador de emergencia. Claramente, Rec(Y ) = {1, 2, 3, . . .} y además Y ∼
Geom(p = 0,45). Por tanto, la probabilidad pedida es:
10
X
P(Y ≤ 10) = (1 − 0,45)y−1 · (0,45)
y=1

d ) Sea Z : Número de aviones que es necesario observar hasta obtener el tercer avión
con localizador de emergencia. Claramente, Rec(Z) = {3, 4, 5, . . .} y además Z ∼
BinNeg(r = 3; p = 0,45). Por tanto, la probabilidad pedida es:
P(Z ≥ 4) = 1 − P(Z = 3)
 
3−1
=1− · (0,45)3 · (0,55)3−3
3−1
5. En una determinada región la distribución de ingresos por familia en unidades monetarias
(u.m) es una variable aleatoria X con función de densidad de probabilidad dada por:
 x 1

 + , si 0 ≤ x ≤ 2;
 10 10

f (x) = 3x 9
− + , si 2 < x ≤ 6;
 40 20



0, en otro caso.

Probabilidad y Estadı́stica 37
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Verifique que f (x) es función densidad.


b) Determine la función de distribución acumulada de la variable aleatoria X.
c) Se seleccionan familias al azar hasta encontrar 3 con ingreso superior a 3 u.m. Hacien-
do los supuestos que sean necesarios, determine la probabilidad de que sea necesario
entrevistar a más de 5 familias.
d ) Suponga que se seleccionan 50 familias. Haciendo los supuestos que sean necesarios
determine la probabilidad de que al menos 3 tengan ingreso inferior a 1 u.m.
Solución:
a) Para mostrar que es función densidad debemos mostrar dos propiedades:
(i) f (x) ≥ 0 ∀ x ∈ R

x+1 18−3x
Es claro que f (x) = 10
≥ 0, cuando 0 ≤ x ≤ 2 y f (x) = 40
≥ 0 cuando
2 < x ≤ 6.
R
(ii) f (x)dx = 1 ∀ x ∈ R.
Z 6 2 Z 6
18 − 3x
Z
x+1
f (x)dx = dx + dx
0 0 10 2 40
 2  x=2   x=6
x x 18x 3x2
= + + −
20 10 x=0 40 80 x=2
4 2 18 · 6 3 · 18 2 · 18 6
= + + − − +
20 10 40 40 40 40
=1
b) Debemos hacerlo por tramos:
Si 0 ≤ x ≤ 2,
Z x
1
F (x) = (t + 1)dt
10 0
x
t2

1
= +t
10 2 0

x2 x
= +
20 10
Si 2 < x ≤ 6,
Z 2 Z x
1 1
F (x) = (t + 1)dt + (−3t + 18) dt
10 0 40 2
x
3t2

1
= F (2) + − + 18t
40 2 2

2 3x2 9x 3
= − + −
5 80 20 4

Probabilidad y Estadı́stica 38
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Entonces la función de distribución acumulada queda:




 0, si x < 0;
2
x x


+ , si 0 ≤ x ≤ 2;



F (x) = 20 10
2
3x 9x 7
− − , si 2 < x ≤ 6;


 +



 80 20 20
1, si x > 6.

c) Definir Y como el número de familias seleccionadas hasta encontrar 3 con ingreso su-
perior a 3 u.m. Con esto, Y ∼ BinNeg(3, p), donde

p = P (X > 3) = 1 − P (X ≤ 3)
 
−27 27 7
=1− + −
80 20 20
≈ 0, 3375 .

Entonces,

P (Y > 5) = 1 − P (Y ≤ 5)
5  
X y−1
=1− (1 − p)y−3 p3 = 0,925
y=3
2

Notar que y = 3, 4, . . .
d ) Sea Z el número de familias que tienen ingreso inferior a 1 u.m. de un total de 50. Con
esto, Z ∼ Bin(50, q), donde
1 1 3
q = P (X < 1) = + = = 0,15 .
20 10 20
Entonces,

P (Z ≥ 3) = 1 − P (Z < 3)
2  
X 50 z
=1− q (1 − q)50−z = 0,98.
z=0
z

6. Demuestre que si X es una variable aleatoria con distribución geométrica, entonces cumple
que
P(X > n + k | X > n) = P(X > k)
Interprete esta propiedad.

Probabilidad y Estadı́stica 39
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Solución:

P(X > n + k, X > n)


P(X > n + k | X > n) =
P(X > n)

P(X > n + k)
=
P(X > n)

p · (1 − p)x−1
P
x=n+k+1
= P∞
p · (1 − p)x−1
x=n+1

(1 − p)n+k+1
= (∗)
(1 − p)n+1

= (1 − p)k

= P(X > k)

Lo que se interpreta como que el número de ensayos Bernoulli que ya se han realizado bus-
cando el primer éxito no influyen en que se realicen k ensayos más.

(*) se deduce de

X
ax = ak + ak+1 + . . . (2.2)
x=k

X
a ax = ak+1 + ak+2 + . . . (2.3)
x=k

Restando (2.2) y (2.3)



X
(1 − a)ax = ak , o bien
x=k

X ak
ax =
x=k
1−a

7. La función distribución acumulada de una variable aleatoria Rayleigh es

x2
 
F (x) = 1 − exp − 2 , x>0

a) Muestre que esta función es efectivamente una función de distribución acumulada.


b) Encuentre la función densidad Rayleigh.

Probabilidad y Estadı́stica 40
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Encuentre el percentil 25 de esta distribución.

Solución:

a) Mostramos cumpla dos propiedades:


i) lı́mx→∞ F (x) = 1

Calculamos dicho lı́mite:


x2 x2
    
lı́m 1 − exp − 2 = 1 − lı́m exp − 2
x→∞ 2σ x→∞ 2σ
=1−0
=1

ii) lı́mx→−∞ F (x) = 0

En este caso, calculamos el lı́mite de x tendiendo a cero, que es el menor valor


que puede tomar y a lo que hace referencia la expresión anterior (hacer tender x al
menor valor que puede tomar).

x2 x2
    
lı́m 1 − exp − 2 = 1 − lı́m exp − 2
x→−∞ 2σ x→0 2σ
0
=1−e =1−1
=0

Como también se cumple esta propiedad, F(x) es función distribución acumulada.


b) Derivamos la f.d.a y queda

d
f (x) = F (x)
dx
x2
 
2x
= 0 − exp − 2 · − 2
2σ 2σ
x2
 
x
→ f (x) = 2 exp − 2 , x>0
σ 2σ

c) P25 corresponde al valor de x que satisface que F (x) = 0,25. despejamos esta ecuación
y obtenemos

Probabilidad y Estadı́stica 41
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

x2
 
→ 1 − exp − 2 = 0,25

2
 
x
→ exp − 2 = 0,75

2
x
→ − 2 = ln(0,75)

→ x = −2σ 2 ln(0,75)
2
p
→ x = σ 0,575
→ x = 0,75σ

8. Los procesos de falla de cada una de 10 componentes se comportan de manera probabilı́sti-


camente independientes y siguiendo un mismo modelo probabilı́stico. Sea Xi el tiempo de
falla de la i-ésima componente, expresado en miles de horas. Suponga que su densidad de
probabilidad es

0,8e−x + 0,4e−2x , x ≥ 0;

f (x) =
0, e.o.c.

para cualquier i = 1, 2, . . . , 10

a) Determine la función distribución acumulada de X3


b) Calcule la probabilidad de que a lo más 3 componentes fallen antes de 1.5 horas.

Solución:

a) La función distribución de la variable X3 viene dada por:



 0,
 si x ≤ 0
Z x
FX3 (x) =

 0,8e−t + 0,4e−2t dx, si x >0
0

 0, Z
 si x ≤ 0
x Z x
= −t

 0,8 e d + 0,4 e−2t dx, si x >0
0 0

 0, si x ≤ 0
=
 0,8(1 − e−x ) − 0,2e−2x , si x >0

 0, si x ≤ 0
=
 1 − 0,8e−x − 0,2e−2x , si x >0

Probabilidad y Estadı́stica 42
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

b) La probabilidad de que una componente cualquiera falle antes de las 1.5 horas, viene
dada por:
P(Xj < 1, 5) = FXj (1, 5) = 1 − 0, 8e−1,5 − 0, 2e−2·1,5
Denotemos esta probabilidad por p, o sea,

p = 1 − 0, 8e−1,5 − 0, 2e−2·1,5 = 0,81

Sea ahora
Y: número de componentes que fallan antes de 1.5 horas.
Entonces, Y ∼ Bin(10, p) y lo que se pide es
3  
X 10
P(Y ≤ 3) = · px · (1 − p)10−x = 0,00001
x=0
x

9. Se efectuaron 10 mediciones independientes X1 , X2 , . . . , X10 en una población donde cada


una de ellas sigue una distribución N (µ, σ 2 ).

a) ¿Cuál es la probabilidad que la tercera medición realizada se encuentre entre (µ − σ) y


(µ + σ)?
b) Para cualquier distribución de probabilidad se define el Rango intercuantil como la
distancia que hay entre los percentiles 25 y 75.
Calcule el Rango intercuantil para una distribución N(µ, σ 2 ).

Solución:

a) Se pide la probabilidad que la tercera medición efectuada se encuentre entre (µ − σ) y


(µ + σ), luego se tiene que
 
X3 − µ
P(µ − σ < X3 < µ + σ) = P − 1 < <1
σ
= Φ(1) − Φ(−1)
= Φ(1) − (1 − Φ(1))
= 2Φ(1) − 1
= 2 · 0,8413 − 1
= 0,6826

b) Si X ∼ N(µ, σ), se tiene entonces que el percentil 25, x25 , cumple con que

Probabilidad y Estadı́stica 43
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

P(X ≤ x25 ) = 0,25


 
X −µ x25 − µ
⇒P ≤ = 0,25
σ σ
x25 − µ
⇒ Φ( ) = 0,25
σ
x25 − µ
⇒ 1 − Φ( ) = 1 − 0,25
σ
x25 − µ
⇒ Φ(− ) = 0,75
σ
x25 − µ
⇒− = 0,675
σ
⇒ x25 = µ − 0,675σ

Por otra parte el percentil 75, x75 , cumple con que

P(X ≤ x75 ) = 0, 75
 
X −µ x75 − µ
⇒P ≤ = 0,75
σ σ
 
x75 − µ
⇒Φ = 0,75
σ
x75 − µ
⇒ = 0,675
σ
x75 = µ + 0,675σ

Luego, el Rango intercuantil (RI) es igual a:

RI = x75 − x25 = µ + 0, 675σ − µ + 0, 675σ = 1, 35σ

10. Un analista financiero señala que la rentabilidad Y de los bonos del gobierno a largo plazo,
tendrá al cabo de un año una distribución normal con valor esperado de 70 dólares y varianza
de 9.
a) Si el gobierno destina un porcentaje extra a polı́ticas públicas cuando cualquiera de
los bonos tiene rentabilidad entre 67 y 75, ¿Cuál es la probabilidad que se destine este
porcentaje extra?
b) Si la rentabilidad aceptable de un bono es (70−c; 70+c) ¿Para qué valores de c tendrı́an
el 95 % de los bonos con rentabilidad aceptable?
c) ¿Cuál es la probabilidad de que a lo sumo ocho de diez bonos, seleccionados indepen-
dientemente, tengan una rentabilidad menor a 73,84?
Solución:

Probabilidad y Estadı́stica 44
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Sea la variable aleatoria


Y : rentabilidad de los bonos del gobierno a largo plazo
donde Y ∼ N (70, 9)

Se pide calcular P(67 < Y < 75), por lo que debemos estandarizar.

P(67 < Y < 75) = P(Y < 75) − P(Y < 67)
   
Y − 70 75 − 70 Y − 70 67 − 70
=P < −P <
3 3 3 3
= P(Z < 1,66) − P(Z < −1)
= P(Z < 1,66) − (1 − P(Z < 1))
(por simetrı́a de la distribución normal)

= Φ(1,66) + Φ(1) − 1
= 0,9515 + 0,8413 − 1
= 0,7928

Por lo tanto, existe un 79 % de probabilidad de que se destine el porcentaje extra.


b) Al igual que en (a) debemos estandarizar.

0,95 = P(70 − c < Y < 70 + c)


 
70 − c − 70 Y − 70 70 + c − 70
=P < <
3 3 3
= P(Z < c/3) − P(Z < −c/3)
= P(Z < c/3) − (1 − P(Z < c/3))
(por simetrı́a de la distribución normal)

= 2 · P(Z < c/3) − 1


(0,95 + 1)/2 = P(Z < c/3)
0,975 = P(Z < c/3)
1,96 = c/3

Por lo tanto con c = 5,88 se tendrı́a el 95 % de los bonos con rentabilidad aceptable.
c) Sea la variable aleatoria
X: número de bonos de un total de 10 con rentabilidad menor a 73.84 dólares
por lo que X ∼ Bin(10, P(Y < 73,84)), y se pide P(X ≤ 8)

Probabilidad y Estadı́stica 45
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Calculemos la probabilidad de éxito utilizando la variable Y antes definida.

 
Y − 70 73,84 − 70
P(Y < 73,84) = P <
3 3
= P(Z < 1,28)
= 0,8997

Ası́, la probabilidad pedida queda

P(X ≤ 8) = 1 − P(X > 8)


10  
X 10
=1− (0,8997)x (1 − 0,8897)10−x
x=9
x
= 0,7349

Probabilidad y Estadı́stica 46
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

2.3. Esperanza, varianza y funciones de variables aleato-


rias
1. Se desean rodamientos de un centı́metro de radio, con tolerancia de 0.05 centı́metros. El fa-
bricante gana US$0.10 por cada rodamiento aceptado. Si el radio es menor de lo permitido, el
rodamiento se debe refundir, produciendo una pérdida de US$0.05; por otra parte, si el radio
es mayor de lo aceptado, se debe rebajar el rodamiento, con una pérdida de US$0.03. Supon-
ga que el radio de los rodamientos tiene una distribución normal con media 1.01 centı́metro
y una varianza de 0.0009 cm2 . ¿Cuál es la ganancia esperada?
Solución:

Sean los eventos:

A: el rodamiento es aceptado.
B: el rodamiento debe ser refundido.
C: el rodamiento debe ser rebajado.

Sea la variable aleatoria X : radio del rodamiento

X ∼ N (1,01; 0,032 )

Luego

P(A) = P(1 − 0,05 < X < 1 + 0,05)


= Φ(1,33) − Φ(−2)
= 0,9082 − 0,0228
= 0,8854
P(B) = P(X < 1 − 0,05)
= Φ(−2)
= 0,0228
P(C) = P(X > 1 + 0,05)
= 1 − Φ(1,33)
= 1 − 0,9082
= 0,0918

Sea la variable aleatoria U : utilidad de un rodamiento. Esta variable es discreta, ya que sólo
toma 3 valores y su función de cuantı́a está dada por:

u 0.10 -0.05 -0.03


P(U = u) 0.8854 0.0228 0.0918

Probabilidad y Estadı́stica 47
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Luego, la utilidad esperada es

E(U ) = 0,1 · 0,8854 + (−0,05) · 0,0228 + (−0,03) · 0,0918


= 0,0846

2. Un fabricante de equipos electrónicos somete cada unidad a una prueba muy rigurosa. De los
equipos recién ensamblados, el 84 % pasa la prueba sin ninguna modificación. Los que fallan
en la prueba inicial son reelaborados; de éstos, el 75 % pasa la prueba. Aquellos equipos que
fallan en la segunda prueba se rehacen por segunda vez y se vuelven a probar; el 90 % de
ellos pasan la prueba y el resto se desarman. Defina Y como el número de veces que falla un
equipo seleccionado al azar.

a) Especifique los posibles valores de Y . ¿Qué tipo de variable es Y ?


b) Calcule la distribución de probabilidad de Y .
Puede serle útil desarrollar un árbol de probabilidad.
c) Determine la función generadora de momentos de Y .
d) Determine esperanza y varianza de Y . Interprete estas cantidades.
e) Cada falla de un equipo genera una pérdida para el fabricante de 20 dólares, es decir, si
falla en la primera prueba, el fabricante pierde 20 dólares; si falla en la segunda prueba,
pierde 40 dólares, y ası́ sucesivamente.
Determine la perdida esperada por falla en un equipo.

Solución:

a) Sean los eventos Fi : el equipo falla en la i-ésima prueba y la variable aleatoria Y :


número de veces que falla un equipo

Si el equipo pasa la primera prueba, entonces falla cero veces y Y = 0.


Si no pasa la primera prueba, entonces Y = 1, sólo si pasa la segunda prueba. Si no,
entonces Y = 2 si pasa la tercera prueba. Si no pasa la tercera prueba, entonces Y = 3
y no hay más opciones de ue vuelva a fallar, ya que el equipo se desarma.

Y = {0, 1, 2, 3} → Y es una variable discreta

b) Considere el siguiente diagrama de árbol

Probabilidad y Estadı́stica 48
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Las probabilidades de los eventos definidos en (a) son


P(F1 ) = 0,16, , P(F2 ) = 0,25, P(F3 ) = 0,1. A partir de éstas podemos definir las
probabilidades de cada valor de Y como sigue:
P(Y = 0) = P(F1c ) = 0,84
P(Y = 1) = P(F1 ∩ F2c ) = 0,16 · 0,75 = 0,12
P(Y = 2) = P(F1 ∩ F2 ∩ F3c ) = 0,16 · 0,25 · 0,9 = 0,036
P(Y = 3) = P(F1 ∩ F2 ∩ F3 ) = 0,16 · 0,25 · 0,1 = 0,004

y se cumple que
3
X
P (Y = y) = 1
y=0

c)
3
X
My (t) = eyt · P (Y = y)
y=0

= e · 0,84 + e1·t · 0,12 + e2·t · 0,036 + e3·t · 0,004


0·t

= 0,84 + 0,12 · et + 0,036 · e2·t + 0,004 · e3·t

d) Utilizamos la f.g.m. de Y

My0 (t) = 0 + 0,12 · et + 2 · 0,036 · e2·t + 3 · 0,004 · e3·t t=0 = E(Y )


entonces
E(Y ) = 0,12 · 1 + 2 · 0,036 · 1 + 3 · 0,004 · 1
= 0,204

Probabilidad y Estadı́stica 49
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática


My00 (t) t 2·t 3·t

= 0,12 · e + 4 · 0,036 · e + 9 · 0,004 · e
= E(Y 2 )
t=0

V (Y ) = E(Y 2 ) − E2 (Y )
= 0,12 · 1 + 4 · 0,036 1 + 9 · 0,004 · 1 − 0,2042
= 0,258

e) Sea X: pérdida por fallas en un equipo.


Los posibles valores de X son:

Si Y =0 → X=0
Si Y =1 → X=20
Si Y =2 → X=40
Si Y =3 → X=60
Para calcular E(X) debemos calcular su distribución de probabilidad, que corresponde
a las probabilidades de Y

x 0 20 40 60
P(X = x) 0 0.12 0.036 0.004

La pérdida esperada por falla en un equipo está dada por:

X
E(X) = x · P (X = x)
x
= 0 + 20 · 0,12 + 40 · 0,036 + 60 · 0,004
= 4,08

3. Sea Y ∼ U (0, 1) y sea FX una función distribución continua y estrictamente creciente.

a) Encontrar la función distribución de Y .


b) Demostrar que FX−1 (Y ) tiene distribución FX .

Solución:

a) Si Y ∼ U (0, 1), entonces F (y) = y → f (y) = 1, 0<y<1

Probabilidad y Estadı́stica 50
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

b) Sea Z = FX−1 (Y ), entonces,


FZ (z) = P(Z ≤ z)
= P(FX−1 (Y ) ≤ z)
= P(Y ≤ FX (z))
= FY (FX (z))
= FX (z)
Luego Z tiene distribución FX
4. Suponga que X tiene distribución FX . Demostrar que si Y = FX , entonces
a) 0 ≤ Y ≤ 1
b) Y ∼ U (0, 1)
(Recuerde que F es creciente y por tanto invertible y F (F −1 (x)) = x)

Solución:

a) Por definición, sabemos que si F es función distribución acumulada, debe cumplir que
0 ≤ FX ≤ 1,
por lo tanto, se cumple que 0 ≤ Y ≤ 1.
b) Por demostrar, f (y) = 1.
FY (y) = P(Y ≤ y)
= P(FX ≤ y), FX−1
= P(X ≤ FX−1 (y))
= FX (FX−1 (y))
=y (ya que F es invertible)
Por lo tanto, para obtener la función densidad calculamos
d
fY (y) = FY (y)
dy
d
= y
dy
=1
Ası́, Y ∼ U (0, 1)
5. Una compañı́a de seguros recibe informes mensuales de agentes independientes. Sea X, la
variable aleatoria que modela la proporción de informes que requieren un estudio de actua-
lización, con función densidad dada por
 2
1
f (x) = c · x − , 0<x<1
2

Probabilidad y Estadı́stica 51
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Determine varianza y curtosis de la variable aleatoria X.


b) Encuentre la función distribución acumulada de X.
c) Calcule la probabilidad que más de un 50 % de los informes mensuales requieran estudio
de actualización.

Solución:

a) Primero que todo, es necesario obtener el valor de c para luego proseguir con el resto
de cálculos.
Sea X: proporción de informes que requieren estudio
 2
1
f (x) = c · x −
2
La función en estudio se tiene que integrar en todo el recorrido de la variable y luego
igualarla a 1 para poder despejar el valor de c

Z 1
f (x)dx = 1
0
Z 1  2
1 1
x− dx =
0 2 c
Z 1 
1
2 1
x −x+ dx =
0 4 c
 3  1
x x2 x 1
− + =
3 2 4 0 c
1 1
=
12 c

→ c = 12

Se sabe que V (X) = E(X 2 ) − E 2 (X), por lo tanto se calcula cada uno de los términos
de la varianza por separado

Probabilidad y Estadı́stica 52
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Z 1  
2 1
E(X) = x · 12 · x − x + dx
0 4
Z 1 
3 2 x
= 12 x −x + dx
0 4
 4  1
x x3 x2
= 12 − +
4 3 8 0
1
→ E(X) =
2
1
→ E 2 (X) =
4

Ahora se calcula el otro término de la varianza

Z 1  
2 2 2 1
E(X ) = x · 12 · x − x + dx
0 4
Z 1
x2

4 3
= 12 x −x + dx
0 4
 5  1
x x4 x3
= 12 − +
5 4 12 0
2
=⇒ E(X 2 ) =
5
Por lo tanto, la varianza de la variable X es:

2 1 8−5
− =
V (X) =
5 4 20
3
=⇒ V (X) =
20
b) Por definición

Z x 
2 1
F (x) = 12 t − t + dt
0 4
 3  x
t t2 t
= 12 − +
3 2 4 0
x3 x2 x
= − +
4 6 3

Probabilidad y Estadı́stica 53
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática



 0 , x≤1



x3 x2 x
F (x) = 4
− 6
+ 3
, 0<x<1




1 , x>1

c) El cálculo pedido es

P (X > 0,5) = 1 − P (X ≤ 0,5)


= 1 − F (0,5)
 
1 1 1 1
= 1− · − +
2 16 12 3
= 0,84375

d) Sea Y : número de meses donde más del 50 % de los informes requiere estudios de ac-
tualización

Por lo tanto, Y ∼ Bin(12, p). El parámetro p se obtiene del item anterior, es decir,
p = 0,84375  
12
Se pide P (Y = 6) = · p6 · (1 − p)6
6

6. Sea X una variable aleatoria con función de distribución acumulada F (x) definida por:
 x
ae , x ≤ 0;
F (x) =
− 12 e−x + b, x > 0.
siendo a y b constantes.
a) Determine el(los) valor(es) de a y b para que X tenga función densidad.
b) Determine a través de MX (t), E(X) y V(X)
Solución:
a) Como F (x) es f.d.a. debe cumplirse que

lı́m F (x) = 1
x→∞

en este caso,
1 1
lı́m − e−x + b = − lı́m e−x + b = 0 + b = 1
x→∞ 2 2 x→∞
Por lo tanto b = 1.

Por otro lado, podemos calcular f(x), derivando F (x)


 x
ae , x ≤ 0;
f (x) = 1 −x
2
e , x > 0.

Probabilidad y Estadı́stica 54
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

y debe cumplirse que Z ∞


f (x) = 1
−∞
entonces Z 0 Z ∞
x 1 −x
ae + e =1
−∞ 0 2
y de aquı́ se obtiene que a = 1/2.
y entonces las funciones distribución y densidad, respectivamente, son,
1 x

 2e ,

 x ≤ 0;
F (x) = 1 −x
 − e + 1, x > 0.


2

1 x

 2 e , x ≤ 0;


f (x) = 1 −x
 e , x > 0.


2

b) Se pide encontrar la función generadora de moemntos que queda

MX (t) = E(eXt )
Z ∞
= ext f (x)d x
−∞
Z 0 Z ∞
xt 1 x 1
= e e d x+ ext e−x d x
−∞ 2 0 2
Z 0 Z ∞
1
= e x(t+1)
d x+ e−x(1−t) d x
2 −∞ 0

1 1
= −
2(t + 1) 2(t − 1)
1
= , | t |6= 1
1 − t2
y entonces
1
0 d 1−t2
MX (t) =
dx
−1(t2 − 1) + 2t

=
(t2 − 1)2
t=0

=1

Probabilidad y Estadı́stica 55
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

(−2t − 2)(t2 − 1)2 + (t2 − 2t − 1)2(t2 − 1)2t



00
MX (t) =
(t2 − 1)4
t=0

=2

Entonces E(X) = 1 y V(X) = 2 − 12 = 1

7. Demuestre que la función generadora de momentos de Y = aX + b es

MY (t) = ebt MX (at)

que si X es una variable aleatoria con función generadora de momentos MX (t).


Ya que X puede ser continua o discreta, trabajamos con la definición de función generadora
de momentos:

MY (t) = E(eY t )
= E(e(aX+b)t )
= E(eaXt · ebt )
= ebt E(eXat ) (ya que la esperanza es un operador lineal)
= ebt MX (at) (por definición de fgm)

8. Sea la función
pX (x) = ke−|x| , −∞ < x < ∞

a) Determinar la constante k tal que pX sea función densidad.


b) Si X tiene función densidad pX , determinar su f.g.m.
c) Si X tiene función densidad pX e Y = 25X 2 , encontrar E(X) y V (X).

Solución:

a) Z ∞ Z ∞
−|x|
1= ke dx = 2 ke−x dx
−∞ 0
1
Luego k = 2
b)
Z ∞
1
MX (t) = ext e−|x| dx
−∞ 2
1 0 xt x 1 ∞ xt −x
Z Z
= e e dx + e e dx
2 −∞ 2 0
1
=
1 − t2

Probabilidad y Estadı́stica 56
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Utilizando lo obtenido en (b),



0 2t
E(X) = MX (0) = =0
(1 − t2 )2 t=0
2 + 6t2

2
E(X ) = =2
(1 − t2 )3 t=0
24t − 24t3

3
E(X ) = =0
(1 − t2 )4 t=0
E(X 4 ) = 24

Además,

E(Y ) = E(25X 2 ) = 25E(X 2 ) = 25 · 2 = 50


E(Y 2 ) = E(625X 4 ) = 625E(X 4 ) = 625 · 24 = 15000

Por lo tanto, V (X) = 15000 − 2500 = 12500.

9. Sea la variable aleatoria X ∼ Gama(α, λ), es decir,

λα α−1 −λx
f (x) = x e , x>0
Γ(α)

a) Determine la f.g.m. de X.
b) Determine E(X).
c) Determine V(X)
d) Determine la f.g.m. de Y = λX, e identifique su distribución.

Solución:

a) Por definición de f.g.m



λα α−1 −λx
Z
MX (t) = etx · x e dx
0 Γ(α)

Que se puede resolver por partes, pero puede que se demore “un poco”más de la cuenta.
La otra opción es identificar los parámetros para completar una distribución Gama

Probabilidad y Estadı́stica 57
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

dentro de la integral como sigue:


Z ∞
λα α−1 −λx
MX (t) = etx · x e dx
0 Γ(α)
Z ∞ α
λ
= xα−1 e−λx+tx dx
0 Γ(α)
Z ∞
λα
= xα−1 e−(λ−t)x dx
Γ(α) 0
Z ∞
(λ − t)α λα
= α
xα−1 e−(λ−t)x dx
(λ − t) Γ(α) 0
Z ∞
λα (λ − t)α α−1 −(λ−t)x
= x e dx
(λ − t)α 0 Γ(α)
| {z }
Gama(α,λ − t)
| {z }
=1

Por lo tanto,
 
λ
MX (t) = , λ 6= t
λ−t

b) Utilizando la parte (a), calculamos su primera derivada:

λα

d
MX (t) = −α · α+1
· −1
dt (λ − t) t=0
λα
=α·
(λ − 0)α+1
α
→ E(X) =
λ

c) Buscamos la segunda derivada de la f.g.m.:

d2 λα


MX (t) = −α(α + 1) · · −1
dt2 (λ − t)α+2
t=0
λα
= α(α + 1) ·
(λ − 0)α+2
α(α + 1)
→ E(X 2 ) =
λ2
y con esto,

V(X) = E(X 2 ) − E2 (X)


α(α + 1) α2 α
= 2
− 2 → V(X) = 2
λ λ λ

Probabilidad y Estadı́stica 58
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

d) Recordando el teorema de clases: Si Y = cX + d, entonces MY (t) = etd MX (ct)

Con esto, haciendo c = λ y d = 0,

MY (t) = MX (λt)
 α
λ
=
λ − λt
 α
1
=
1−t

Esta f.g.m. tiene la misma estructura de la f.g.m. de X en la parte (a), con λ = 1, por
lo tanto, Y ∼ Gama(α, 1)

10. Una partı́cula de masa m tiene velocidad aleatoria que se distribuye de forma normal, con
velocidad media 0 y desviación estándar σ. Encuentre la función densidad de la energı́a
cinética,
1
E = mV 2
2
Solución:

Primero obtenemos la función distribución acumulada de Y


 
1 2
P(Y ≤ y) = P mV ≤ y
2
 
2 y
= P V ≤2
m
 r 
y
= P |V | ≤ 2
m
 r r 
y y
= P − 2 ≤V ≤ 2
m m
 r  r 
y y
= P V ≤ 2 − P(V ≤ − 2
m m
 r 
y
= 2P 0 ≤ V ≤ 2 (ya que tiene media 0)
m
 p y
0 V 2m
= 2P ≤ ≤
σ σ σ
r 
y
= 2Φ 2 −1 (ya que V /σ ∼ N (0, 1))
mσ 2

Probabilidad y Estadı́stica 59
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

dF x
Además sabemos que f (x) = dx
, por lo tanto

dP(Y ≤ y)
f (y) =
dy
r  r
y 1 1
= 2φ 2 2
· 2 2
· y −1/2
mσ mσ 2
En resumen, r r 
2 y
f (y) = ·φ 2 , y≥0
myσ 2 mσ 2

11. Sea X una variable aleatoria con distribución normal de parámetros µ y σ 2 . Sea Y =| X |.
Determine:

a) La función distribución acumulada de Y .


b) La función densidad de Y .

Solución:

a) Calculamos la f.d.a por definición:

F (y) = P(Y ≤ y)
= P(| X |≤ y)
= P(−y ≤ X ≤ y)
= P(X ≤ y) − P(X ≤ −y)

Como X tiene distribución normal, es simétrica y P(X ≤ −y) = 1 − P(X ≤ y)

Por lo tanto

F (y) = P(X ≤ y) − (1 − P(X ≤ y))


= 2P(X ≤ y) − 1
= 2 · FX (y) − 1

b)

f (y) = 2 · fX (y)
 
2 1 2
=√ exp − 2 (y − µ) , y≥0
2πσ 2 2σ

12. Considere una variable aleatoria Z con función distribución densidad dada por:
 cαβ
z β+1
, z ≥ α, β >1, α >0;
fZ (z) =
0, e.o.c.

a) Calcule el valor de c.

Probabilidad y Estadı́stica 60
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

b) Calcule E(Z).
c) Sea X = ln(Z), calcule fX (x).

Solución:

a) Por definición se tiene que


Z ∞
fZ (z)dz = 1
−∞

cαβ
Z
⇒ dz = 1
α z β+1
 ∞
β 1
⇒ cα − β =1
βz α
1
⇒ cαβ =1
βαβ
⇒c=β

b) Por definición se tiene que


Z ∞
E(Z) = zfZ (z)dz
−∞

βαβ
Z
= z dz
α z β+1

βαβ
Z
= dz
α zβ
 ∞
β 1
=α β −
(β − 1)z β−1 α
1
= 0 − αβ β · −
(β − 1)αβ−1
β

β−1

c) Se tiene que X = ln(Z) ⇔ Z = eX , luego por teorema de cambio de variable se tiene


que
x
x de

fX (x) = fZ (e )
dx
βαβ
= x(β−1) |ex |, x ≥ ln(α)
e
= βαβ e−βx , x ≥ ln(α)

Probabilidad y Estadı́stica 61
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

2.4. Vectores Aleatorios


1. El número de accidentes en una autoruta sigue una distribución de Poisson cuyo parámetro
depende de una variable aleatoria X que mide condiciones climáticas, cuya densidad está dada
por
3
f (x) = 4 , x≥1
x
Más precisamente, Y |X = x ∼ P oisson(ax)
a) Calcule E(Y )
b) Calcule V(Y )
Solución

Recordemos que si X ∼ P oisson(λ), entonces E(X) = λ y V(X) = λ.


a) Utilizando esperanza condicional tenemos que
E(Y ) = E(E(Y |X))
pero como E(Y |X = x) = ax → E(Y |X) = aX

Luego, se tiene que


E(Y ) = E(E(Y |X))
= E(aX)
= aE(X)
Z ∞
3
=a x 4 dx
x
Z1 ∞
3
=a dx
1 x3
 ∞ 
3 1
=a −
2 x2
1
3a
=
2
b) Ocupando el mismo argumento que en (a), pero ahora bajo varianza condicional se tiene
que
V(Y ) = V(E(Y |X)) + E(V(Y |X))
pero como V(Y |X = x) = ax → V(Y |X) = aX

Luego tenemos
V(Y ) = V(E(Y |X)) + E(V(Y |X))
= V(aX) + E(aX)
= a2 V(X) + aE(X)

Probabilidad y Estadı́stica 62
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

pero V(X) = E(X 2 ) − E2 (X), donde


Z ∞ Z ∞  ∞ 
2 2 3 3 3
E(X ) = x 4 dx = dx = − =3
1 x 1 x2 x 1
lo que implica que  2
3 3
V(X) = 3 − =
2 4
luego, reemplazando se tiene que
3a2 3a
V(Y ) = + ·a
4 2
3a2 3a2
= +
4 2
9
= a2
4
2. Sea X e Y variables aleatorias independientes con funciones densidades marginales
f (x) = xe−x , x>0 y f (y) = e−y y>0
Sean
X
Z = X + Y, y W =
X +Y
a) Determine las respectivas densidades marginales de Z y W .
b) ¿Son Z y W variables aleatorias independientes?

Solución:
a) Por independencia se tiene que
fX,Y (x, y) = xe−(x+y) , x > 0, y>0

Usando el cambio de variable propuesto


X
Z =X +Y W =
X +Y
⇒ X = ZW Y = Z(1 − W )
Calculamos el Jacobiano
 
∂(x, y) w z
|J| =
=
= | − z| = z
∂(z, w) 1 − w −z
Luego, por el teorema de cambio de variables la función de distribución densidad con-
junta de Z y W es:
fZ,W (z, w) = fX,Y (zw, z(1 − w))|J|
= (zw)e−z |z|
= z 2 e−z w, z > 0, 0 < w < 1

Probabilidad y Estadı́stica 63
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Para obtener las marginales de Z y W procedemos de la siguiente manera:


Z 1
2 −z
fZ (z) = z e wdw
0
z2
= e−z , z > 0
2
Z ∞
fW (w) = w z 2 e−z dz
0
= wΓ(3)
= 2w, 0 < w < 1
b) Como el producto de las marginales
z 2 −z
fZ (z)fW (w) = e · 2w
2
= z 2 e−z w
= fZ,W (z, w)
es igual a la conjunta, se tiene entonces que Z y W son variables aleatorias indepen-
dientes.
3. Sea X1 , X2 , . . . , Xn una muestra aleatoria con función densidad f , es decir,
iid
Xi ∼ f (x), i = 1, . . . , n
Determine la densidad de X(1) = mı́n{X1 , . . . Xn }
Solución:

Calculamos primero FX(1) (x)

FX(1) (x) = P(X(1) ≤ x)

= 1 − P(X(1) > x)

= 1 − P(X1 > x, X2 > x, . . . , Xn > x)

= 1 − P(X1 > x)P(X2 > x) · · · P(Xn > x) (por independencia de las v.a.)

= 1 − (1 − P(X1 ≤ x))(1 − P(X2 ≤ x)) · · · (1 − P(Xn ≤ x))


n
Y
= 1− (1 − P(Xi ≤ x))
i=1
 n
= 1 − 1 − FX (x) (ya que todas tienen la misma distribución)

Probabilidad y Estadı́stica 64
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Por lo tanto, la función densidad de X(1) es

dFX(1) (x)
fX( 1) (x) =
dx
n−1 d(1 − F (x))
= 0 − n[1 − FX (x) ·
dx
n−1
= −n[1 − FX (x) · −f (x)
n−1
= n[1 − FX (x) · f (x)

4. Sea (X, Y ) un vector aleatorio con función de densidad conjunta

fX,Y (x, y) = c|y|e−x , 0 ≤ x ≤ ∞; −x ≤ y ≤ x

a) Encuentre la densidad marginal de X en término de la constante c. Demuestre que c =


1/2.
b) Encuentre la densidad marginal de Y y obtenga E(Y ).
c) Encuentre la densidad condicional de Y dado X = 1.

Solución:

a) La densidad marginal de X se obtiene de la siguiente manera


Z x
fX (x) = c |y|e−x dy, x > 0
−x
Z x
−x
= ce 2 ydy, x > 0
 0x
= ce−x y 2 , x > 0
0
= cx2 e−x , x>0

Para demostrar que c = 1/2, por comparación con la densidad de Gamma(3,1) y por
definición de Γ(3) se deduce c = 1/2.
b) La densidad de Y se obtiene de la siguiente manera
Z ∞
1
fY (y) = |y| e−x dx
2 |y|
1
= |y|e−|y| , −∞ < y < ∞
2
Luego, por simetrı́a de la densidad se tiene que E(Y ) = 0.

Probabilidad y Estadı́stica 65
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c)
fX,Y (x, y)
fY |X (y|x) =
fX (x)
|y|e−x
= 2 −x , −x ≤ y ≤ x
xe
fY |X (y|1) = |y|, −1 ≤ y ≤ 1

5. Un grupo de empresas destina sus beneficios a una inversión y a pago de dividendos a sus
accionistas. Sean X e Y variables aleatorias que representan porcentajes destinados a nuevas
inversiones y a pagos de dividendos respectivamente, con función densidad conjunta:

f (x, y) = k, 0 < x < 1, 0<y<x

a) Determinar la constante k, para que sea función desidad conjunta.


b) Determinar las funciones densidad marginales.
c) Verificar si X e Y son independientes.
d) Supongamos que el porcentaje dedicado a dividendos sea de 45 %.¿ Cuál será la proba-
bilidad de que el porcentaje para nuevas inversiones sea superior al 50 %?

Solución:
a) Sean
X: porcentaje destinado a nuevas inversiones
Y: porcentaje destinado a pago de dividendos.

Para que sea función distribución debe cumplirse que


Z Z
fXY (x, y)dydx = 1

El área de integración es el área en gris


Entonces
Z 1Z x
1= k dy dx
0 0
Z 1 x

=k y dx
0
Z 1 0
=k x dx
0
1
x2
=k
2 0
k
=
2
Por lo tanto, k = 2 y f (x, y) = 2, 0 < y < x < 1.

Probabilidad y Estadı́stica 66
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

b) Calculamos las distribuciones marginales a partir de la distribución conjunta antes de-


terminada Z x
f (x) = 2 dy = 2x, 0 ≤ x ≤ 1
0
y Z 1
f (y) = 2 dx = 2(1 − y), 0≤y≤1
y

c) Para verificar independencia se debe cumplir que

fXY (x, y) = fX (x)fY (y)

En este caso
fX (x)fY (y) = 2x · 2(1 − y) 6= 2
Por lo tanto, X e Y no son independientes.
d) Debemos determinar fX|Y (x)

Por definición
fXY (x, y)
fX|Y (x) =
fY (y)
2
=
2(1 − y)
1
= , 0 ≤ x ≤ 1, 0 ≤ y ≤ x.
1−y

Ası́, con fX|Y =0,45 = 1/(1 − 0,45)


Z 1
1
P (X ≥ 0,5|Y = 0,45) = dx
0,5 1 − 0,45
1
20
= ·x
11 0,5
20 1
= ·
11 2
10
=
11
= 0,91

6. Una compañı́a que ofrece servicios telefónicos transoceánicos cree que los factores clave del
costo variable de una llamada son X, número de segundos que tarda el sistema en ingresar
la llamada e Y , número de minutos que tarda una operadora en ingresar una llamada. La
estructura de las probabilidades puede representarse por medio de la siguiente densidad
conjunta:
f (x, y) = 0,0625 · xe−0,5y−x/y , 0 < x < ∞, 0 < y < ∞

Probabilidad y Estadı́stica 67
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Encuentre la función
R ∞de densidad de Y .
Puede asumir que 0 xe−kx = 1/k 2

Solución:

Z ∞
f (y) = 0,0625 · x · e−0,5·y−x/y dx
0
Z ∞
−0,5·y
= 0,0625 · e x · e−x/y dx
0
= 0,0625 · e−0,5·y · y 2 ;y > 0

b) Encuentre la densidad condicionada de X dado que Y = y.

Solución:

f (x, y)
f (y) =
f (y)
0,0625 · x · e−0,5·y−x/y
=
0,0625 · e−0,5·y · y 2
x · e−x/y
= ;x > 0 ;y > 0
y2

c) Calcule la probabilidad de que dado que la operadora se demora 5 minutos en ingresar


la llamada, el sistema la ingrese en menos de 2 minutos.

Solución:

Sea Y=5

2
x · e−x/y
Z
P (X < 2/Y = 5) = dx ;y = 5
0 y2
Z 2
1
= xe−x/5 dx
25 0

Integrando por partes con los cambios de variable se tiene:


x=u dv = e−x/5 dx
dx = du v = −5e−x/5

Probabilidad y Estadı́stica 68
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

 2 Z 2 
1 −x/5
−x/5
= xe · −5 + 5 xe dx
25 0 0
 
1 −2/5 −2/5 0
= − 10e + 5 · −5e + 5 · 5e
25
 
1 −2/5
= − 35e + 25
25
 
1 −2/5
= − 7e +5
5

d) En la práctica, ¿deberı́an ser independientes X e Y ?, ¿lo son en esta densidad conjunta?


Solución:

Para comprobar independencia se tiene que cumplir que f (x) · f (y) = f (x, y)
En este caso no son independientes ya que es claro que el término e−x/y no es posible
descomponerlo como un producto entre funciones de x y de y.
e) Calcule la distribución de Z = eY .
Solución:

Z = eY ⇔ ln(Z) = Y ⇒ 1
Z
=Y0

f (z) = fy (ln(z)) · 1/z


= 0,0625 · [ln(z)]2 · e−0,5·ln(z) · 1/z
−0,5 )
= 0,0625 · [ln(z)]2 · eln(z · 1/z ;z > 0

1
=⇒ f (z) = 0,0625 · [ln(z)]2 · ; z>0
z 3/2
7. Dos lı́neas de producción manufacturan cierto tipo de artı́culos. Suponga que la capacidad
(en cualquier dı́a dado) es dos artı́culos para la lı́nea I y 3 para la lı́nea II. Con base en la
tabla adjunta que muestra la distribución de probabilidades conjunta:

X=I— Y=II 0 1 2 3
0 0 0.04 0.12 0.09
1 0.02 0.14 0.21 0.14
2 0.07 0.06 0.06 0.05

a) Obtener las funciones marginales de X e Y .


b) Calcule P(1 <X≤ 2, 0 <Y< 2).

Solución:

Probabilidad y Estadı́stica 69
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

P
a) Recordemos que P(X = x) = y P(X = x, Y = y), por lo tanto

P(X = 0) = 0 + 0,04 + 0,12 + 0,09 = 0,25


P(X = 1) = 0,02 + 0,14 + 0,21 + 0,14 = 0,51
P(X = 2) = 0,07 + 0,06 + 0,06 + 0,05 = 0,24

Ası́, la distribución marginal de X está dada por


x 0 1 2
P(X = x) 0.25 0.51 0.24
Análogamente para Y

P(Y = 0) = 0 + 0,02 + 0,07 = 0,09


P(Y = 1) = 0,04 + 0,14 + 0,06 = 0,24
P(Y = 2) = 0,12 + 0,21 + 0,06 = 0,39
P(Y = 3) = 0,09 + 0,14 + 0,05 = 0,28

Por lo tanto,
y 0 1 2 3
P(Y = y) 0.09 0.24 0.39 0.28
b)

P(1 < X ≤ 2, 0 < Y < 2) = P(X = 2, Y = 1)


= 0,06

8. El ministerio de economı́a estudia conjuntamente las tasas de crecimiento de las exportaciones


(X, en porcentajes) y del PIB (Y , en porcentajes). El servicio de estudios del ministerio ha
investigado el comportamiento de probabilı́stico de ambas variables, que viene dada por la
función densidad conjunta siguiente:

fXY (x, y) = k · x · y, , 5 < x < 20, 2<y<6

a) Obtener el valor de k
b) Obtener la probabilidad que las exportaciones crezcan por encima del 8 %.
c) Obtener el crecimiento esperado de las exportaciones.

Solución:
RR
a) Recordemos que fXY dxdy = 1

Probabilidad y Estadı́stica 70
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Entonces
20 6 20
6
y 2
Z Z Z
k · x · y dy dx = k · x · dx
5 2 5 2
Z 202
36 − 4
=k· x dx
2 5
20
x2
= 16k ·
2 5
400 − 25
= 16k ·
2
= 3000k = 1
Por lo tanto, k = 1/3000
b) Debemos encontrar la distribución marginal de X.
Z
fX (x) = k · x · y dy
y
Z 6
=k·x· y dy
2
2 6

y
=k·x·
2 2
36 − 4
=k·x·
2
16x
= , 5 < x < 20
3000
Con esto
Z 20
16x
P(X > 8) = dx
8 3000
20
16 x2
= ·
3000 2 8
16 400 − 64
= ·
3000 2
= 0,896
c) Calculamos el valor esperado de X
Z 20
16x
E(X) = dx
x
5 3000
20
16 x3
= ·
3000 3 5
16 203 − 53
= ·
3000 3
= 14
Por lo tanto, en promedio, el crecimiento de las exportaciones es de un 14 %.

Probabilidad y Estadı́stica 71
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

9. Considere una placa rectangular, cuyo largo (X) y ancho (Y) son variables aleatorias con
función de densidad conjunta:

k(x + y), 0 < x < 1 0 < y < 2;
f (x, y) =
0, e.o.c.

a) Determine k para que f sea función densidad.


b) ¿Son el largo y el ancho variables aleatorias independientes? Justifique.
c) Calcule la probabilidad de que el largo de la placa no exceda la mitad de su ancho.

Solución:

a) Sabemos que Z Z
f (x, y) dx dy = 1

Entonces

Z 1 Z 2
1 = k(x + y) dy dx
0 0

1
2
y 2
Z
= k (xy + ) dx
0 2 0
Z 1
= k (2x + 2) dx
0
1
2
= k(x + 2x)
0

= k(1 + 2)

Por lo tanto k = 1/3.


b) Las distribuciones marginales son:
Z 2
1
f (x) = (x + y) dy
0 3
2
1 y 2
= (xy + )
3 2 0

1 22
= (2x + )
3 2
2
= (x + 1), 0<x<1
3

Probabilidad y Estadı́stica 72
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Z 1
1
f (y) = (x + y) dx
0 3
1
1 x2
= (xy + )
3 2 0
1 1
= (y + )
3 2
y 1
= + , 0<y<2
3 6

c) Nos piden calcular P(X ≤ Y /2) que gráficamente es


Por lo tanto,
Z 2 Z y/2
1
P(X ≤ Y /2) = (x + y) dx dy
0 0 3
 y/2
2
x2
Z 
1
= + xy dy
3 0 2 0

1 2 y2 y2
Z  
= + dy
3 0 8 2
 2
1 y 3 y 3

= +
3 24 6 0

1 23 23
 
= +
3 24 6
5
=
9

Probabilidad y Estadı́stica 73
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

2.5. Propuestos
1. a) Cuatro libros distintos de matemáticas, seis diferentes de fı́sica y dos diferentes de
quı́mica se colocan en un estante. De cuántas formas distintas es posible ordenarlos si:
1) Los libros de cada asignatura deben estar todos juntos.
2) Solamente los libros de matemáticas deben estar juntos.
b) Se tienen 5 urnas distintas, todas vacı́as. Si se tienen 8 bolas idénticas, ¿de cuántas
maneras diferentes se pueden colocar éstas si no puede haber ninguna urna vacı́a?

2. La contaminación en los rı́os es un problema que genera daños tanto en la salud de las
personas como en el ecosistema. Considere los siguientes eventos:

A: el rı́o está contaminado


B: una prueba en una muestra de agua detecta contaminación
C: se permite la pesca

Suponga que:

P(A) = 0,3 P(B | A) = 0,75


{
P(B | A ) = 0,2 P(C | A ∩ B) = 0,2
P(C | A ∩ B ) = 0,8 P(C | A{ ∩ B) = 0,15
{

P(C | A{ ∩ B { ) = 0,9

a) Encuentre e interprete P(A ∩ B ∩ C).


b) Encuentre e interprete P(B { ∩ C).
c) Encuentre e interprete P(C).
d ) Encuentre la probabilidad de que el rı́o esté contaminado, dado que se permite la pesca
y la muestra no detecte contaminación.

3. Para un juego de tenis se tiene un canasto con seis pelotas usadas y ocho nuevas. Un jugador
selecciona tres pelotas al azar, juega y luego devuelve las pelotas al canasto. En ese instante
ingresa un nuevo jugador que seleccona tres pelotas al azar del mismo canasto.

a) ¿Cuál es la probabilidad de que el nuevo jugador seleccione exactamente dos pelotas


nuevas?
b) Si el nuevo jugador seleccionó dos pelotas nuevas, ¿cuál es la probabilidad de que el
jugador anterios haya usado dos pelotas nuevas?

4. Suponga que usted puede acceder al registro de un sismógrafo cada una hora y que por
motivos de seguridad no le pueden decir cuántos terremotos ha registrado, pero le reportan
el evento terremoto, que indica si ha ocurrido un terremoto o no en esa hora. Suponga
además que la ocurrencia de terremoto en una hora es independiente de lo ocurrido en la
hora anterior. Si la probabilidad de que ocurra terremoto en una hora es p y X es la variable
aleatoria “número de horas transcurridas hasta que ocurre terremoto”.

Probabilidad y Estadı́stica 74
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Determine el recorrido de la variable aleatoria X.


b) Determine la función de probabilidad de X.
c) Calcule la probabilidad de tener que observar 4 horas el sismógrafo hasta que ocurre
terremoto.
d ) Dado que has pasado 5 horas sin terremoto, calcule la probabilidad que ocurra terremoto
después de 6 horas.

Hint: ∞
X ak
ar =
r=k
1−a

5. De una población de 40 personas divididas en cuatro grupos A, B, C y D de tamaño 10 cada


uno, se extrae al azar una muestra de 8 personas.

a) Suponiendo que el muestro es CON reemplazo


1) Calcule la probabilidad de que la muestra contenga exactamente dos personas del
mismo grupo.
2) Calcule la probabilidad de que no aparezca nadie del grupo A.
b) Suponiendo que el muestro es SIN reemplazo
1) Calcule la probabilidad de que la muestra contenga exactamente dos personas del
mismo grupo.
2) Calcule la probabilidad de que no aparezca nadie del grupo A.

6. Usted decide gastar su primer sueldo apostando en el casino en un juego que consite en dos
etapas.
Etapa I: lanzar dos dados y observar la variable aleatoria X, la suma de los números. Si esta
suma es mayor o igual a 7 usted pasa a la segunda etapa.

a) Determine la distribución de probabilidad de X.


b) ¿Cuál es la probabilidad que tenga que lanzar los dados 3 veces hasta lograr pasar a la
siguiente etapa?
c) Si lanzó 10 veces los dados, ¿cuál es la probabilidad de que en 3 juegos haya pasado a
la segunda etapa?

Etapa II: hay dos urnas, U1 con 3 bolitas rojas y 5 blancas y U2 con 4 bolitas rojas y 5
blancas. Usted es asignado a una urna al azar y extrae dos bolitas sin reposición. Gana
el juego si son del mismo color.
d ) Si usted fue asignado a U1 , determine la probabilidad de ganar el juego.
e) Si ganó el juego con dos bolitas blancas, ¿cuál es la probabilidad de que lo hayan
asignado a U2 ?

Probabilidad y Estadı́stica 75
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

7. Suponga que la duración (medida en meses y fracciones) de un cierto reproductor MP3, es una
variable aleatoria con distribución exponencial con parámetro β = 10. Si la duración de dicho
reproductor supera los 10 meses, éste es considerado aceptable, y es considerado inaceptable
en caso contrario. Durante un control de calidad, se realizan los siguientes experimentos:

I Se hacen funcionar 10 reproductores MP3 eligidos al azar, y se cuenta el número (X) de


reproductores que fallaron antes de los 10 meses.
II Se hacen funcionar tantos reproductores como sea necesario hasta obtener 10 fallas, y se
cuenta el número (Y) de reproductores que no fallaron.

Entonces

a) Determine la distribución de X e Y en (I) y (II), respectivamente, y calcule la probabi-


lidad de encontrar más de 5 reproductores MP3 aceptables en cada experimento.
b) Calcule la esperanza y la varianza de X e Y usando sus funciones generadoreas de
momentos.

8. a) El 90 % de los árboles plantados en una campaña de reforestación sobrevive. ¿Cuál es


la probabilidad de que sobrevivan 8 o más árboles de 10 árboles que acaban de ser
plantados?
b) Un libro tiene en promedio 1 error cada hoja. Si la variable aleatoria X se define como el
número de errores por hoja, ¿cuál es la función de cuantı́a asignada?. Calcule P(X > 2).

9. El tiempo T de CPU requerido para realizar un trabajo, elegido aleatoriamente entre los que
llegan a un centro de cálculo siguen una distribución hiperexponencial, dada por:

P (T > t) = ae−λt + (1 − a)e−ξt , t≥0

donde 0 ≤ a ≤ 1, λ, ξ > 0.

La producción G se determina por

G(T ) = ln(T )

a) Determine una expresión para la esperanza de la producción.


b) Determine una expresión para la variablidad de la producción.
c) Determine la f.g.m. de la variable aleatoria T .

10. Sea X una variable aleatoria con densidad



1 − k|x|, |x| ≤ k,
f (x) =
0, e.o.c.

a) Encuentre el valor de k.
b) Determine F (x).

Probabilidad y Estadı́stica 76
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Calcule la distribución de |X|.


d ) Determine c de manera que P(|X| < c) = 0,75

11. Supongamos que cierta prueba para detectar la presencia de una enfermedad en un individuo,
da resultado positivo (detecta la presencia de la enfermedad) en un individuo enfermo con
probabilidad 0.99 y en un individuo sano con probabilidad 0.02 (falso positivo). Se supone,
en base a estudios previos, que la incidencia de esa enfermedad en cierta población es 0.001.
Se selecciona al azar un individuo de esa población, se le aplica la prueba y el resultado es
positivo, ¿cuál es la probabilidad de que en efecto padezca la enfermedad?

12. Se sabe que en una empresa el 23 % de los trabajadores gana menos de 4.8 dólares por hora
y el 90 % gana menos de 5.6 dólares por hora.

a) Suponiendo que la distribución de los salarios es normal, ¿cuál es la media de pago por
hora de los trabajadores de esta empresa?, ¿cuál es la desviación estándar?
b) Usted selecciona trabajadores hasta encontrar uno que gane más de 5.3 dólares por
hora, ¿cuál es la probabilidad de que tenga que seleccionar más de 6 trabajadores?
c) ¿Cuál es la probabilidad que de mil trabajadores seleccionados 200 ganen menos de 4.5
dólares por hora?
d ) Para desincentivar el trabajo fuera de horario, la empresa acordó autorizar sólo una hora
extra y pagarla de acuerdo al salario del empleado. Si gana más de 6 dólares por hora,
se le pagan 6.5 dólares; si gana entre 5.1 y 6.0 dólares por hora se le paga 5 dólares; al
resto le pagan sólo 3 dólares. Considere la variable Z,“gasto esperado por horas extra
para un trabajador”.
1) ¿Cuál es el valor esperado de Z? Interprete.
2) Determine la función generadora de momentos de Z.

13. La empresa XY Z está estudiando la posibilidad de lanzar un nuevo producto al mercado


cuyo desarrollo consta de dos etapas (I y II). El tiempo (en dı́as) que demora en realizarse la
etapa II es una variable aleatoria con distribución normal y su ejecución es externalizada. Se
tienen datos estadı́sticos que la empresa externa ha respondido en 27 dı́as o menos un 20 %
de las veces que ha realizado esta etapa. Además, cuando se le ha solicitado que se demore
32 dı́as o menos, ha cumplido el 70 % de las veces. ¿Cuál es el tiempo que se espera demore
esta empresa?, ¿con qué desviación estándar?

14. Suponga que los errores de un procedimiento de medición tienen distribución normal con
media 0 y desviación estándar 2, en milı́metros. Usted toma 10 mediciones independientes.

a) Calcule la probabilidad que una medición tenga un error de medición menor o igual a
2 mm (error de categorı́a 1), entre 2 y 3 mm (error de categorı́a 2) y mayor o igual a 3
mm (error de categorı́a 3).
b) Sean X1 , X2 y X3 las variables aleatorias que cuentan el número de errores, de un total
de 10 mediciones, que pertenecen a las categorı́as 1, 2 y 3, respectivamente. Obtenga la
distribución conjunta de X1 , X2 y X3

Probabilidad y Estadı́stica 77
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Calcule la probabilidad que por lo menos 9 mediciones tengan errores menores que 2
mm y que no más de una medición tenga error mayor que 3 mm.

15. Suponga que X, el gasto en publicidad semanal (en millones de pesos) e Y , la ganacia semanal
(en millones de pesos), son variables aleatorias que conjuntamente siguen una distribución
normal bivariada, con parámetros µX = 15, µY = 18, σX = 3, σY = 2.

a) Suponga que ρ = 0,75.


1) Si una semana se gasta 14 millones en publicidad, ¿cuánto esperarı́a ganar?, ¿con
cuánta variabilidad?
2) ¿Cuál es la probabilidad de que en una semana cualquiera gane menos de lo que
gastó en publicidad?
b) Suponga que ρ = 0.
1) Determine la distribución conjunta de Z = X + Y y W = X.
2) ¿Cuál es la distribución marginal de Z?

16. Suponga que usted lanza dos dados y considere las variables aleatorias
X: número de puntos del primer dado
Y : número máximo de los dos obtenidos

a) Construya una tabla con la distribución de probabilidad conjunta de X e Y


b) Determine funciones de cuantı́a marginales de X e Y .
c) Calcular las probabilidades de los distintos valores de X si sabemos que Y = 4. Calcule
E(X | Y = 4)

17. Sean Z1 , Z2 , . . . , Zk variables aleatorias independientes tales que siguen una distribución
N (0, 1). La variable aleatoria

Y = Z12 + Z22 + . . . + Zk2

sigue una distribución χ2k donde k representa los grados de libertad de la distribución Ji-
cuadrado, que tiene función densidad dada por

2−k/2 (k/2)−1 y/2


f (y) = y e , y>0
Γ(k/2)

Para k = 1, demuestre que Y ∼ χ21 , utilizando que Γ(1/2) = π

18. Dada una variable aleatoria bidimensional (X, Y ) , con función densidad conjunta

f (x, y) = k · (cos(x) + cos(y)) · I[0, π2 ]×[0, π2 ] (x, y)

a) Determine k.
b) Encuentre la marginal de Y

Probabilidad y Estadı́stica 78
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Determine la distribución condicional de X | Y = y


d) ¿Son X e Y independientes?

19. Sea (X, Y ) el resultado de escoger un punto en el plano al azar de la región de dos dimensiones
acotada por las rectas x = −1, x = 2, y = 1 − x, y y = −1 − x. Calcule:

a) Las densidades marginales de X e Y .


b) P(XY > 0)
c) E(Y |X = x)

20. Sean X e Y variables aleatorias independientes con distribución exponencial de parámetro


λ = 1. Se definen
X
U= , V =X +Y
X +Y
a) Determine la densidad conjunta de (U, V ).
b) Determine las densidades marginales de U y V .
c) ¿Son U y V variables aleatorias independientes?

Probabilidad y Estadı́stica 79
Capı́tulo 3

Inferencia Estadı́stica

3.1. Estimación puntual


1. Sea X1 , . . . , Xn una muestra aleatoria de la distribución Pareto, con función densidad dada
por
fX (x) = θαθ x−(θ+1) , x ≥ α, θ ≥ 1.
Asuma que α es conocido y encuentre el EMV de θ.

Solución:

Siguiendo los pasos vistos en clases:

n
Y
L(x, θ) = f (xi )
i=1
n
−(θ+1)
Y
= θαθ xi
i=1
n
Y −(θ+1)
n nθ
=θ α xi
i=1

Ası́, la log-verosimilitud queda


n
X
logL(x, θ) = nlogθ + nθlogα − (θ + 1) logxi
i=1
n
∂ n X
logL = + nlogα − logxi = 0
∂θ θ i=1 θ=θb
n
⇒ θb = Pn
i=1 logxi − nlogα

80
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

2. Sea X1 y X2 una muestra aleatoria de tamaño 2 proveniente de una población X con media
µ y varianza σ 2 . Si disponemos de dos estimadores para µ,
X1 + X2 X1 + 2X2
µ
b1 = y µ
b2 =
2 3

¿Cuál de los dos es el mejor?

Solución:

Calculemos el sesgo de los dos estimadores


 
X1 + X2
E(b
µ1 ) = E
2
1
= (µ + µ)
2

 
X1 + 2X2
E(b
µ2 ) = E
3
1
= (µ + 2µ)
3

Como los dos son insesgados, calculemos sus varianzas


 
X1 + X2
V(bµ1 ) = V
2
1 2
= (σ + σ 2 )
4
1
= σ2
2

 
X1 + 2X2
V(b
µ2 ) = V
3
1 2
= (σ + 4σ 2 )
9
5
= σ2
9

Dado que µ
b1 tiene menor varianza que µ
b2 , entonces µ
b1 es mejor estimador que µ
b2 .

Probabilidad y Estadı́stica 81
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

3. Sea X una variable aleatoria con densidad


θ3 2 −θx
f (x) = xe , x>0
2
donde θ > 0 es desconocido.
a) Muestre que θb = 2/X es un estimador insesgado para θ
b) Encuentre la varianza de θb
c) Encuentre la Información de Fisher para el parámetro θ.
d) ¿Alcanza el estimador la cota de Cramér- Rao?
Solución:
a) Para mostrar que es insesgado debe cumplirse que E(θ)
b = θ, por lo tanto
 
2
E(θ) = E
b
X
Z ∞
2 θ3 2 −θx
= xe dx
0 x2
Z ∞
= θ3 xe−θx dx
0


θ2 2−1 −θx
Z
= θ · Γ(2) x e dx
0 Γ(2)
= θ·1
Por lo tanto es insesgado para θ.
b) Para calcular la varianza, recordemos que
V(X) = E(X 2 ) − E2 (X)
Entonces sólo nos falta calcular E(2 )
 
b2 4
E(θ ) = E
X2
Z ∞
4 θ3 2 −θx
= xe dx
0 x2 2
Z ∞
= 2θ3 e−θx dx
0

−1 θx
= 2θ3 · e
θ
= 2θ2

Probabilidad y Estadı́stica 82
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

y con esto
b = 2θ2 − θ2 = θ2
V(θ)
c) Sabemos que la Información de Fisher está dada por
 2 
d logL(x, θ)
I(θ) = −E
dθ2

En este caso, como sólo contamos con una observación, L(x, θ) = f (x), por lo tanto

θ3 2 −θx
L(x, θ) = xe
2
log(L) = 3 log(θ) − log(2) − 2 log(x) − θx

d log(L) 3
= −x
dθ θ
d2 log(L) 3
= −
dθ2 θ2
Por lo tanto
3 3
I(θ) = −E(− 2
)= 2
θ θ
b = I −1 (θ). En este caso
d) Un estimador insesgado alcanza la cota si V(θ)

θ2
b = θ2 >
V(θ) = I −1 (θ)
3
por lo tanto, no alcanza la cota de Cramér- Rao.

4. Considere una muestra aleatoria X1 , . . . , Xn con función distribución densidad dada por:
α α−1 −xα


 x exp{ }, x ≥ 0, θ >0, α >0, conocido;
 θ
 θ
f (x) =


 0, e.o.c.

a) Demuestre que la distribución de Y = X α es exponencial de parámetro 1/θ. (Y ∼


exp(1/θ))
b) Calcule el EMV de θ.
c) Muestre que es insesgado y calcule su varianza.
d ) Calcule la cota de Cramér-Rao de θb y determine si el estimador es eficiente.

Solución:

Probabilidad y Estadı́stica 83
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Usando teorema de cambio de variable,

dg −1 1
Y = g(X) = X α , g −1 (y) = y 1/α |J| = = y 1/α−1
dy α
ası́,

fY (y) = fX (y 1/α ) · |J|


α −y 1
= (y 1/α )α−1 exp{ } · y 1/α−1
θ θ α
α 1−1/α −y 1 1/α−1
= y exp{ } · y
θ θ α
1/ −y/θ
= e
θ
Por lo tanto, Y ∼ exp(1/θ).
b) Para encontrar el EMV:
n
Y α α−1 −xαi
L(x, θ) = xi exp{ }
i=1
θ θ
 n Y n P α
α α−1 xi
= · xi · exp{− }
θ i=1
θ

n
X 1X α
log L(x, θ) = n log α − n log θ + (α − 1) log xi − xi
i=1
θ


d log L n 1 X α
=− + 2 xi = 0
dθ θ θ θ=θb

Por lo tanto,
n
1X α
θb = x
n i=1 i

b = θ. Recordemos que si Y ∼
c) Para mostrar que es insesgado, debe cumplirse que E(θ)
exp(1/θ), entonces E(Y ) = θ y V(Y ) = θ2 .

Probabilidad y Estadı́stica 84
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

n
b = E( 1
X
E(θ) xαi )
n i=1
n
1 X
= E(xαi )
n i=1
n
1X
= θ
n i=1

Por lo tanto, el estimador encontrado es insesgado.

Calculamos su varianza:
n
b = V( 1
X
V(θ) xαi )
n i=1
n
1 X
= 2 V(xαi )
n i=1
n
1 X 2
= θ
n2 i=1
θ2
=
n

d ) Calculamos la cota de Cramér- Rao I(θ)−1


 2 
d L(x, θ)
I(θ) = −E
dθ2
 n 
n 2 X α
= −E 2 − 3 x
θ θ i=1 i
2 X n
= 3 (E(xi )α ) − 2
θ θ
2 X n
= 3 (θ) − 2
θ θ
2 n
= 3 nθ − 2
θ θ
n
= 2
θ
Por lo tanto, la cota es I(θ)−1 = θ2 /n, por lo tanto, como la varianza del estimador es
igual a la cota, el estimador es eficiente.
iid
5. a) Sean X1 , X2 ∼ exp(λ). Determinar la función densidad de Y = X1 + X2

Probabilidad y Estadı́stica 85
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

b) Sea Y1 , . . . , Yn una muestra aleatoria con función densidad

fY (y) = λ2 y e−λy , y > 0, λ>0

Determinar un estimador insesgado y eficiente para µ = 1/λ. Determinar la cota de


Cramér- Rao para el estimador encontrado.
x
c) Verifique que Q = e µ es un pivote, es decir, su distribución no depende de µ. Use lo
hecho en la parte anterior.
Solución:

a) Sea Y = X1 + X2 y Z = X1 . Con esto, las funciones inversas son X1 = Z y X2 = Y − Z,


por lo que
1 0
|J| = =1
−1 1
Como 0 < X1 < X1 + X2 , entonces 0 < Z < Y
Ası́, la distribución conjunta de Y, Z queda

fY Z (y, z) = fX1 x2 (z, y − z)|J|


= fX2 (z) · fX1 (y − z)|1| (por independencia de X1 y X2 )
−λ·z −λ·(y−z)
= λe · λe
2 −λy
=λ e , 0<z<y

Por lo tanto, la función densidad marginal de Y es


Z y
fY (y) = λ2 e−λ·y dz
0
y
2 −λ·y

=λ e · z
0
2 −λ·y
= λ ye , y>0

Es decir, Y ∼ Gamma(2, λ)
b) Por máxima verosimilitud, determinemos un EMV para µ.

n
Y
L(y, µ) = µ−2 yi e−yi /µ
i=1
n
Y 
P
−2n
=µ (yi )e− yi /µ log
i=1

X X d
log(L) = −2n log(µ) + log(yi ) − yi /µ


d log(L) −2n 1 X
= + 2 yi = 0
dµ µ µ µ=b
µ

Probabilidad y Estadı́stica 86
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Por lo tanto,
n
1 X
µ
b= yi
2n i=1
Para comprobar que sea insesgado, recordemos que si Y ∼ Gamma(2, λ) entonces,
E(Y ) = 2/λ y V(Y ) = 2/λ2

1 X
E(b
µ) = E( yi )
2n
1 X
= E(yi )
2n
1 X
= 2/λ
2n
1 X
= 2µ
2n
1
= · n · 2µ
2n

Por lo tanto, µ
b es insesgado.

Calculemos su varianza y comparémosla con la cota de Cramér-Rao.

1 X
V(b
µ) = V( yi )
2n
1 X
= V(yi )
4n2
1 X
= 2
2/λ2
4n
1 X 2
= 2µ
4n2
1
= 2
· n · 2µ2
4n
µ2
=
2n

Probabilidad y Estadı́stica 87
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

La cota está dada por I(µ)−1 donde


d2 L
I(µ) = −E( )
dµ2
2n 2 X
= −E( 2 − 3 yi )
µ µ
2 X 2n
= 3 E(yi ) − 2
µ µ
2 2n
= 3 2nµ − 2
µ µ
4n 2n
= 2 − 2
µ µ
2n
= 2
µ
Entonces
µ2
I(µ)−1 = = V(b µ)
2n
Por lo tanto, el estimador alcanza la cota, por lo que es eficiente.
6. Sea X1 , . . . , Xn una muestra aleatoria de la distribución Rayleigh, es decir,
x2
 
x
f (x) = 2 exp − 2 , x > 0, θ > 0.
θ 2θ
a) Determine el estimador de máxima verosimilitud de θ2 , θb2 .
b) Determine si θb2 es insesgado
c) Calcule la varianza de θb2 .
d ) Determine si θb2 es consistente en error cuadrático medio.
Hint: Si X ∼ Raileigh(θ), entonces X 2 distribuye exponencial de media 2θ2 )

Solución:
a) Planteamos la función de verosimilitud para resolverla en función de θb2 .

n
x2
 
Y xi
2
L(x, θ ) = exp − i2
i=1
θ2 2θ
 P 2
Y 1 xi
= (xi ) 2n exp −
θ 2θ2
P 2
X xi
log L = log(xi ) − 2n log(θ) −
2θ2
P 2
d log L 2n x
= − + 3i =0
dθ θ θ
Probabilidad y Estadı́stica 88
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Por lo tanto
1 X 2
θb2 = xi
2n
b) Para ver si θb2 es insesgado
 X 
b2 1
E(θ ) = E x2i
2n
1 X
= E(x2i )
2n
1 X 2
= 2θ
2n
= θ2

∴ θb2 es insesgado
c) Calculamos su varianza
 
1 X 2
V(θb2 ) = V xi
2n
1 X
= V(x2i )
4n2
1 X 4
= 4θ
4n2
θ4
=
n

d ) En este caso, ECM(θ)


b = V(θ),
b ya que es insesgado. Como

θ4
lı́m ECM(θ)
b = lı́m =0
n→∞ n→∞ n

entonces el estimador encontrado es consistente en error cuadrático medio.

3.2. Estimación intervalar y Pruebas de Hipótesis


1. En un estudio de mercado se desea analizar la preferencia del consumidor con respecto a dos
marcas de bebidas gaseosas. Se seleccionan al azar 50 personas, se dividen en dos grupos y se
les pide que clasifiquen la bebida que se les asignó mediante una nota (X) en el rango [1,10].
Los encargados del estudio suponen que la evaluación de las bebidas es distinta, hipótesis
que quieren probar bajo dos criterios:

Criterio 1 La diferencia será evaluada de acuerdo a la nota promedio que entreguen las
personas seleccionadas.

Probabilidad y Estadı́stica 89
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Criterio 2 La diferencia será evaluada de acuerdo a la proporción de personas que evaluó la


bebida con nota mayor a 4.

Los datos del estudio se presentan a continuación:

n x s x>4
Bebida A 25 6.0 2.41 9
Bebida B 25 3.84 2.01 10

a) Determine si hay diferencias entre las bebidas según el Criterio 1, con un nivel de
significancia del 5 %.
b) Determine si hay diferencias entre las bebidas según el Criterio 2, con un nivel de
significancia del 5 %.
c) Los investigadores concluirán a favor de su hipótesis sólo si los dos criterios concluyen
que hay diferencias. De acuerdo a lo anterior, ¿podemos afirmar que las bebidas obtienen
una evaluación distinta?

Solución:

a) Las hipótesis de interés son


H0 : µ1 = µ2
H1 : µ1 6= µ2
Pero primero debemos saber si las varianzas poblacionales son iguales o no. Planteamos
las hipótesis:
σ12
H0 : σ22
=1
σ12
H1 : σ22
6= 1
 
s21 2,412
El estadı́stico de prueba es s22
= 2,012
= 1,437

Los valores crı́ticos son F24,24,0,025 = 0,44 y F24,24,0,975 = 2,269

En esta caso, no podemos rechazar H0 , por lo tanto, no podemos rechazar que las
varianzas poblacionales son iguales con 5 % de significancia.
Como no podemos asumir que las varianzas poblacionales son distintas (ya que la evi-
dencia no nos permitió rechazar la igualdad), entonces realizaremos la comparación de
medias utilizando varianzas poblacionales iguales. Usamos la prueba para diferencia de
medias con varianzas desconocidas pero iguales.

La regla es rechazar H0 si |T0 | > tν,1−α/2 , donde ν = n1 + n2 − 2.


Para calcular T0 , primero calculamos s2p

(n1 − 1)s21 + (n2 − 1)s22 24 · 2,412 + 24 · 2,012


s2p = = = 4,92
n1 + n2 − 2 25 + 25 − 2

Probabilidad y Estadı́stica 90
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Entonces
6,0 − 3,84
T0 = q = 4,867
2
2,219 50
y la región crı́tica con α = 0,05 es

tν,1−α/2 = t25+25−2,1−0,025 = t48,0,975 = 2,01

Comparando el valor crı́tico con el estadı́stico de prueba vemos que los datos nos entre-
gan evidencia en contra de H0 (rechazamos H0 ), por lo que podemos afirmar con 5 %
de significancia que las calificaciones de las bebidas son distintas.
b) Bajo el segundo criterio, debemos realizar una comparación de proporciones. Las hipóte-
sis son
H0 : p1 = p2
H1 : p1 6= p2
La regla es rechazar H0 si |z0 | > z1−α/2

la región de rechazo con α = 0,05 está dada por

z1−α/2 = z1−0,025 = z0,975 = 1,96

y el estadı́stico de prueba
0,36 − 0,40
z0 = q = −0,291
0,36·0,64 0,4·0,6
25
+ 25

En consecuencia, y con una significancia del 5 %, no podemos rechazar H0 , es decir, no


podemos afirmar que la cantidad de notas mayores a 4 sea distinta para cada bebida.
c) Bajo el criterio 1, las bebidas obtienen una evaluación distinta, mientras que bajo el
criterio 2 no podemos afirmar que la proporción de notas mayores a 4 sea distinta
dependiendo de la bebida, por lo que para efectos de las hipótesis planteadas en este
estudio, no podemos concluir que las bebidas obtienen una evaluación distinta.

2. Se toman dos muestras independientes para comparar las medias de dos poblaciones.

Muestra n X s
A 50 57.5 6.2
B 50 54.4 10.6

a) ¿Se puede concluir que, al nivel del 0.02, la media de la población A ha de ser mayor
que la de B?
b) Verifique con qué valor de (1 − α) % tales valores de n son aceptables.

Solución:

Probabilidad y Estadı́stica 91
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

a) Primero, necesitamos saber si las varianzas poblacionales son iguales o distintas. Para
eso, necesitamos testear las hipótesis
H0 : σ12 = σ22
6 σ22
H1 : σ12 =
con α = 0,05. El estadı́stico para la comparación de varianzas es F0 = s11 /s22 el cual se
compara con los percentiles α/2 y 1 − α/2 de la distribución F de Fisher.
(6,2)2
F0 = = 0,34
(10,6)2
Rechazamos H0 si F0 < F( n1 − 1, n2 − 1, α/2) ó F0 > F( n1 − 1, n2 − 1, 1 − α/2), es decir,
basta que se cumpla una de las dos desigualdades para que rechazemos la hipótesis nula.
En este caso
F(49,59,0,01) = 0,52 > 0,34
F(49,59,0,99) = 1,88
Ası́, se rechaza H0 y las varianzas poblacionales son distintas.

Ahora testeamos las hipótesis de interés


H0 : µA ≤ µB ↔ µA − µB ≤ 0
H1 : µA > µB ↔ µA − µB > 0
Rechazamos H0 cuando
(xA − xB ) − 0
T0 = q 2 ∼ tν
sA s2B
nA
+ nB
y rechazo H0 si T0 ≤ −tν,1−α donde

s2A s2B 2
nA
+ nB
ν= (s2A /nA )2 (s2 /nB )2
nA −1
+ nBB −1

s2A (6,2)2 s2A (10,6)2


= = 0,768, = = 1,872
nA 50 nA 60
 2 2  2  2 2  2
sA (6,2)2 sA (10,6)2
= = 0,589, = = 3,506
nA 50 nA 60
Ası́,

(0,768 + 1,872)2
ν=
0,589/49 + 3,506/59
6,969
=
0,0714
= 97,55

Probabilidad y Estadı́stica 92
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Con ν > 30, ocupamos la aproximación al percentil normal.


Ası́,

57,5 − 54,4
T0 = √
0,768 + 1,872
= 1,907

El percentil es −z1−α/2 = -2.326, y como T0 > −z1−α/2 , no rechazamos H0 y no podemos


afirmar que la media de A sea mayor a la de B.
b) Debemos encontrar el mı́nimo α tal que

T0 = −z1−α/2

Entonces

P(Z < 1,907) = 0,9717

es decir, con (1 − α) % ≥ 0,9717 aceptamos la hipótesis nula. (α = 0,028)

3. Muchos estudiantes se han quejado de que la máquina vendedora de refrescos A despacha


menos bebidas que la máquina B. Los siguientes son los datos de las muestras:

Máquina A n1 = 10 x1 =4.38 s21 =1.59


Máquina B n1 = 12 x2 =5.92 s22 =0.83

a) Construya un intervalo de confianza para la diferencia de despacho medio de cada


máquina, asumiendo que σ12 = σ22 .
b) Con α = 0,05, ¿Respalda la evidencia la hipótesis de que la cantidad media despachada
por la máquina A es menor que la despachada por la máquina B? Asuma que las
varianzas poblacionales son iguales.
c) ¿Qué sucederá con el intervalo de confianza en (a) si aumentamos la confianza con que
lo construimos?
¿Qué sucederá si sólo hubiéramos tomado dos muestras de tamaño 5? Comente
d ) Determine con 95 % de confianza si las varianzas poblacionales son efectivamente iguales.

Solución:

a) Un IC para la diferencia de medias con 95 % de confianza, suponiendo varianzas iguales


está dado por
 r 
1 1
(µA − µB ) ∈ (xA − xB ) ± z1−α/2 · sp · +
nA nB

Probabilidad y Estadı́stica 93
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

Entonces,

(nA − 1)s2A + (nB − 1)s2B


s2p =
nA + nB − 2
9 · 1,59 + 11 · 0,83
=
10 + 12 − 2
23,44
=
20
= 1,172
sp = 1,082

El IC queda
 r 
1 1
→ (4,38 − 5,92) ± z0,975 · 1,082 · +
10 12
 
→ − 1,54 ± 1,96 · 1,082 · 0,428
 
→ − 1,54 ± 0,907
 
→ − 1,54 ± 0,907
 
→ − 2,447; −0,633

b) Planteamos las hipótesis de acuerdo a la pregunta


H0 : µA ≥ µB ↔ µA − µB ≥ 0
H1 : µA < µB ↔ µA − µB < 0
Rechazamos H0 si
x − yB
T0 = pA ≤ −t(nA +nB −2),1−α
sp · 1/nA + 1/nB

Con α = 0,05, −t(nA +nB −2),1−α = −t20,0,95 = −1,724

y T0 = −1,54/(1,082 · 0,428) = −3,324, por lo tanto, rechazamos H0 y se respalda la


evidencia de que la máquina A despacha menos refrescos que la máquina B, con 95 %
de confianza.
c) Al aumentar la confianza, aumenta el ancho del intervalo, ya que cometemos un error
menor en la estimación. Por otro lado, si disminuimos los tamaños muestrales, aumen-
tamos el error de estimación y el intervalo también aumenta su ancho.
d ) Construyamos un IC de 95 % para el cuociente entre las varianzas. Este intervalo está da-
do por

Probabilidad y Estadı́stica 94
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

σB2 σB2
σ22 /σ12 ∈ ( · F nA −1,nB −1,α/2 , · FnA −1,nB −1,1−α/2 )
σA2 σA2
Entonces

σ22 /σ12 = 0,83/1,59 = 0,522


y

FnA −1,nB −1,α/2 = F9,11,0,025 = 0,255

FnA −1,nB −1,1−α/2 = F9,11,0,975 = 3,587

Por lo tanto,
σ22 /σ12 ∈ (1,915 · 0,255, 1,915 · 3,587)
Entonces el intervalo es (0.133, 3.587), por lo que concluimos que con 95 % de confianza
las varianzas son iguales, ya que el 1 pertenece al intervalo.

Probabilidad y Estadı́stica 95
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

3.3. Propuestos
1. Sea X1 , . . . , Xn una muestra aleatoria con densidad

f (x) = α · x−(α+1) · I(1,∞) (x), α>0


1
a) Encontrar el estimador máximo verosı́mil βb de β = α

b) Verificar si βb es insesgado o no.


c) Determinar si βb es eficiente.

2. Usted como encargado de un departamento de producción en una fábrica, recibe un lote de


2000 piezas necesarias para la fabricación de un artı́culo y tiene la responsabilidad de aceptar
o rechazar el lote, si estima que la calidad de éste no es suficiente.

a) ¿Cuántas piezas decide examinar para que con un nivel de confianza del 95 %, el error
que cometa en la estimación de la proporción poblacional de piezas defectuosas no sea
mayor que 0.05? Suponga que la proporción estimada fuera la más desfavorable.
b) El fabricante dice que, en este lote, no hay más de 100 piezas defectuosas, ¿cuál serı́a el
tamaño de la muestra para que la estimación de la verdadera proporción de defectuosas
tenga un error de estimación de 0.05? Use una confianza del 95 %.
c) Si decide tomar una muestra de 100 artı́culos escogidos al azar del lote y realiza el
recuento de piezas defectuosas en la muestra, encontrando 4 artı́culos defectuosos, cons-
truya un intervalo de confianza del 95 % para la proporción de defectuosas. ¿Contradice
esto lo afirmado por el fabricante?

3. a) Sea una muestra aleatoria de tamaño 15 de X tal que

X1 , . . . , X6 ∼ N (0, σ 2 ) y X7 , . . . , X15 ∼ N (0,3, σ 2 )

1) Determine el estimador de máxima verosimilitud de σ 2 usando la muestra de tamaño


15.
2) Demuestre que el estimador encontrado en (a) es insesgado.
b) Una muestra de 8 ejecutivos fue enviado a un curso de técnicas modernas de gestión.
Los puntajes de rendimiento, evaluado por el jefe directo, antes y después del curso son
los siguientes:
Ejecutivo
Ptje antes 67 75 64 72 69 82 63 60
Ptje después 78 74 69 72 73 83 75 56
1) Calcule un intervalo de confianza para el puntaje medio previo al curso con un 98 %
de confianza.
2) Determine un intervalo de confianza para la varianza del puntaje posterior al curso
con 95 % de confianza.
3) ¿Es posible afirmar que el puntaje promedio mejora? Utilice un 5 % de significación.

Probabilidad y Estadı́stica 96
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

c) Un banco decide estudiar las caracterı́sticas de los clientes que llevan más de 3 meses sin
pagar. Para esto, estudia la relación entre el historial del cliente y algunos indicadores,
como se muestra en la siguiente tabla, la distribución del nivel educacional y el historial
de impagos anteriores

1) El banco quiere determinar si dichas variables están asociadas. Plantee las hipótesis,
la regla de rechazo y concluya con los datos entregados.
2) Realice una prueba de hipótesis que le permita determinar si el porcentaje de clien-
tes con impagos anteriores es mayor entre quienes no completaron el bachillerato
que entre los que alcanzaron estudios superiores.
3) Calcule el valor-p de la prueba realizada en (b). ¿Es posible cambiar el valor de la
significancia para poder rechazar H0 ?
Utilice α = 5 %

4. Sean X1 , . . . , Xn una muestra aleatoria de uns distribución de Rayleight con función densidad
dada por:
x x2
f (x) = e− 2θ , x>0
θ
a) Muestre que E(X 2 ) = 2θ. Sugerencia: use la sustitución u = x2 .
b) Construya un estimador insesgado para θ basándose en ni=1 Xi2 .
P

c) Encuentre el EMV de θ.
d ) Calcule la cota de Cramer-Rao para θ, ¿es eficiente?

Probabilidad y Estadı́stica 97
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática

5. Sea X1 , . . . , Xn una muestra aleatoria con densidad


f (x) = β · x−(β+1) , x > 1, β>0
a) Determine la distribución de probabilidad de Y = log(X).
1
b) Encontrar el estimador máximo verosı́mil λ = β

c) Verificar si λ
b es insesgado o no.
d ) Determinar si λb es eficiente.

6. En un estudio realizado a 32 mujeres en los últimos 3 meses de embarazo se midieron niveles


de ácido ascórbico en plasma, obteniéndose los siguientes resultados:

No fumadoras Fumadoras
0.97 1.16 0.48
0.72 0.86 0.71
1.00 0.85 0.98
0.81 0.58 0.68
0.62 0.57 1.18
1.32 0.64 1.36
1.24 0.98 0.78
0.99 1.09 1.64
0.90 0.92
0.74 0.78
0.88 1.24
0.94 1.18

a) Determine un intervalo de confianza del 95 % para la diferencia de medias. Interprete.


b) ¿Qué tamaño muestral necesita para afirmar con un 95 % de confianza que las fumadoras
tienen niveles de ácido ascórbico menores a 1.00? La varianza poblacional es 0.35.

7. Un investigador sugiere utilizar el medicamento A para aumentar la concentración en el


desarrollo de ciertas tareas. Para probar su hipótesis, selecciona 10 alumnos quienes rinden
un test antes y después de tomar el medicamento A, obteniendo los siguientes puntajes:

Antes 35 56 72 43 67 54 46 48 68 66
Después 42 58 75 55 64 61 48 48 71 86

a) Calcule la correlación entre los puntajes, ¿le parece que las muestras son independientes?
b) Determine si al tomar el medicamento A aumenta el puntaje promedio obtenido en el
test.
c) Un grupo de investigadores plantea que para considerar el medicamento como efectivo,
el puntaje debe aumentar en al menos 10 puntos. Verifique esta hipótesis con un 5 % de
significancia.
d ) ¿Cuál es el menor valor de α para el cual rechaza la hipótesis planteada en (c)?

Probabilidad y Estadı́stica 98

También podría gustarte