Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Solución
Solución
1. Una compañía de fondo mutualista ofrece a sus clientes varios fondos diferentes: uno
de mercado de dinero, tres fondos diferentes de bonos(a corto, mediano y largo plaza),
dos de acciones (riesgo moderado y alto) y uno balanceado. Entre los clientes que
poseen acciones en uno solo de los fondos, los porcentajes de clientes en los diferentes
fondos son los siguientes:
Se selecciona al azar un cliente que tenga acciones en sólo uno de los fondos.
a. ¿Cuál es la probabilidad de que el cliente tenga acciones en el fondo balanceado?
b. ¿Cuál es la probabilidad de que el cliente tenga acciones en un fondo de bonos?
c. ¿Cuál es la probabilidad de que el cliente no tenga acciones en un fondo de
acciones?
Solución
Solución
a. P (A B) = P (A) + P (B) – P (A B)
2
A B’
Solución
c. A1 A2 A3 Se otorgue el proyecto 1, el 2 o el 3
P (A1 A2 A3) = P (A1) + P (A2) + P (A3) – P (A1 A2) – P (A1 A3)
- P (A2 A3) + P (A1 A2 A3)
= 0.22 + 0.25 + 0.28 – 0.11 – 0.05 – 0.07 + 0.01 = 0.53
d. A1’ A2’ A3’ = (A1 A2)’ A3’ = (A1 A2 A3)’ No se otorgue ningún
proyecto
P (A1 A2 A3)’ = 1- P (A1 A2 A3) = 1- 0.53 = 0.47
3
0.5 x 0 x2
f ( x)
0 de otra manera
Calcule las siguientes probabilidades:
a. P(X ≤ 1)
b. P(0.5 ≤ X ≤ 1.5)
c. P(1.5 < X)
Solución
1
1 x2
1
1
a. P( X 1) 0.5 xdx 0.25
0 2 2 0
4
1.5
1.5
1 1 1
b. P(0.5 X 1.5) 0.5 xdx x 2 (2.25 0.25) (2) 0.5
0.5 4 0.5 4 4
1.5
1.5
1 2
P( X 1.5) 1 P( X 1.5) 1 0.5 xdx 1 x
0 4 0
c.
1
1 (2.25) 1 0.5625 0.4375
4
2. Suponga que la temperatura de reacción X (en º C) de cierto proceso químico tiene una
distribución uniforme con A = -5 y B = 5. Calcule:
a. P(X < 0)
b. P(-2.5 < X < 2.5)
c. P(-2 ≤ X ≤ 3)
d. Si k satisface -5 < k < k + 4 < 5, calcule P (k < X < k + 4).
Solución
0
0
P( X 0) 1
10 dx 101 x 5
101 (0 5) 0.5
5
5
2.5
b. P(2.5 X 2.5) 101 dx 101 x
2.5
2.5
101 (2.5 2.5) 0.5
2.5
k 4
d. P(k X k 4) 101 x k
101 (k 4 k ) 101 (4) 0.4
3. Suponga que el error al hacer cierta medición es una va continua X con fdp
0.09375(4 x 2 ) 2 x 2
f ( x)
0 de otra manera
a. Trace la gráfica de f (x).
b. Calcule P (X > 0).
c. Calcule P(-1 < X < 1)
d. Calcule P (X < - 0.5 o X > 0.5)
Solución
a.
f ( x)
2
x3 8
2
b. P( X 0) 0.09375 2
(4 x )dx 0.09375 4 x 0.09375 8 0.5
0 3 0
3
1
x3
1
P(1 X 1) 0.9375 (4 x )dx 0.09375 4 x
2
1 3 1
c.
1 1 22
0.09375 4 4 0.09375 0.6875
3 3 3
6
0.5
x3 1 1
d. P(0.5 X 0.5) 0.9375 4 x 0.09375 2 2 0.3672
3 0.5 24 24
4. Simbolice con X el esfuerzo vibratorio (lb / pulg2) en la paleta de una turbina de viento,
a una velocidad particular en el túnel de viento. El artículo “Blade Fatigue Life
Assessment with Aplication to Vawts” (J. Solar Energy Engr. 1982) propone la
distribución de Rayleigh, con fdp
x x 2 /( 2 2 )
e x0
f ( x; ) 2
0 de otra manera
Solución
a.
f ( x)dx 1
x / 2 2 / 2 2
e x dx e x (0 e0 ) 1
2 2
0 2 0
200
x / 2 2 / 2 2
200
P( X 200) e x dx e x (e 2 e 0 )
2 2
b. 0 2
0
(0.1353 1) 0.8647
200
x / 2 2 / 2 2
200
P(100 X 200) e x dx e x (e 2 e 0.5 )
2 2
c. 100 2 100
x
x / 2 2 / 2 2
x
/ 2 2
P( X x) e x dx e x ( e x e0 )
2 2 2
d. 0 2
0
/ 2 2
(1 e x
2
)
7
kx2 0 x2
f ( x)
0 de otra manera
a. Encuentre el valor de k
b. ¿Cuál es la probabilidad de que la clase termine a menos de 1 minuto después de
que suene la campana?
c. ¿Cuál es la probabilidad de que la clase continúe entre 60 y 90 s después de que
suene la campana?
d. ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 s después de que
suene la campana?
Solución
a. Se sabe que
f ( x)dx 1 y por tanto
2
x3 8
2
3
kx dx k k 1
2
k
0 3 0 3 8
1
3 x3 31 1
1
b. P( X 1) k x dx 0.125
2
0 8 3 0 8 3 8
1.5
3 x3 3 27 1 3 19 19
c. P(1 X 1.5) 0.2969
8 3 1 8 24 3 8 24 64
1.5
3 x3 3 27 27 37
d. P( X 1.5) 1 P( X 1.5) 1 1 1 0.5781
8 3 0 8 24 64 64
6. El peso real de apoyo de una pastilla de estéreo, que actualmente está puesta a 3g en
un tocadiscos, puede considerarse una va X continua con fdp
k 1 ( x 3) 2
f ( x)
2 x4
0 de otra manera
a. Dibuje la gráfica de f (x).
b. Encuentre el valor de k
c. ¿Cuál es la probabilidad de que el peso real de apoyo sea mayor que el peso
especificado?
d. ¿Cuál es la probabilidad de que el peso real sea menor de 0.25g del peso
especificado?
e. ¿Cuál es la probabilidad de que le peso real difiera del peso especificado más de
0.5g?
8
Solución
a.
f ( x)
1 ( x 3) dx 1
4
2
b. k
2
4
( x 3) 3 1 1 4 3
k x k 4 2 k k
3 2 3 3 3 4
4
3 ( x 3) 3
4
3 1
P( X 3) k 1 ( x 3) dx x
2
4 (3 0)
3 4 3 3 4 3
c.
32 1
0.5
43 2
2.75
3 ( x 3) 3
2.75
P( X 2.75) k 1 ( x 3) dx x
2
2 4 3 2
d.
3 1 3
(2.75 5.208 10 3 ) 2 (0.4218) 0.316
4 3 4
1
3
(3.4583) (2.5416) 1 0.6875 0.3125
4
Solución
a. Para una distribución uniforme la función de distribución de probabilidad es:
1
BX A
f ( x) B A
0 de otra manera
En este caso tenemos:
1
25 X 35
f ( x) 10
0 de otra manera
35
b. P( X 33) dx 101 x 33 101 (35 33) 102 0.2
1 35
10
33
35
1 x2
35
c. E ( X ) 1
10 xdx 30
25 10 2 25
30 2 es de 28 a 32
32
P(28 X 32) 101 dx 101 x 28 101 (32 28) 0.4
32
28
a2
d. P(a X a 2) 101 x a 0.1(a 2 a) 0.2
8. Para trasladarme la trabajo, primero debo abordar un autobús cerca de casa y después
transbordar otro. Si el tiempo de espera (en minutos) en cada parada tiene una
distribución uniforme con A = 0 y B = 5, entonces se puede demostrar que mi tiempo
total de espera Y tiene una fdp
251 y 0 y5
f ( y ) 52 251 y 5 y 10
0 y0 o y 10
f. ¿Cuál es la probabilidad de que el tiempo total de espera sea menos de 2 min o más
de 6?
Solución
a. Falta gráfica
5 10
f ( y )dy 1
25 ydy ( 52 251 y )dy
b. 0 5
1
25 ( y / 2) ( 52 y 25
2 5
0
1
5 2 (2 2 ) 2 2 1
y 2 / 2)10 1 3 1 1
3
y2
3
9
c. P(Y 3) 1
25 ydy 0.18
0 50 0
50
5
y2
ydy (
5 8
P(Y 8) 1
25
2
5 1
25 y )dy ( 52 y 501 y 2 ) 85
d. 0 5 50 0
( )
1
2
48
25
3
2
1
2
21
50 23
25 0.92
2 10 2 10
P(Y 2 o Y 6) 1
25 ydy ( 52 25
1
y )dy 1
50 y 2 ( 52 y 501 y 2 )
f. 0 6 0 6
2
25 (2 42
25 ) 5 0.4
2
Solución
6 6
a. P( X 6) 0.15e 0.15( x 0. 5) dx e 0.15( x 0. 5) (0.4382 1) 0.5618
0.5 0.5
6 6
c. P(5 X 6) 0.15e 0.15( x 0. 5) dx e 0.15( x 0. 5) (0.4382 0.5092) 0.071
5 5
10. Una familia de funciones de densidad de probabilidad que se emplea para aproximar
la distribución del ingreso, la distribución de la población urbana y la distribución del
tamaño de las empresas, es la familia Pareto. Esta familia tiene dos parámetros, k y ,
ambos >0 y la fdp es
k k
x
f ( x; k , ) x k 1
0 x
Solución
a. Falta gráfica
k k k
b.
x k 1
dx
xk
(0 1) 1
b
k k k k
k
b
c. P( X b) k 1
dx k k 1 1
x x b b
b
k k k k k
k k
b
d. P(a X b) k 1
dx k k k
a x x a b a a b
0 x0
2
x
F ( x) 0 x2
4
1 2 x
a. P(X ≤ 1)
b. P(0.5 ≤ X ≤ 1)
c. P(X >0.5)
d. La duración mediana de tiempo de préstamo de libros ~ [resuelva 0.5 = F ( ~)
e. F’(x) para obtener la función de densidad f(x).
Solución
(1) 2 1
a. P( X 1) F (1) 0.25
4 4
p F (n( p)) 1
4 n( p)2
4 p n( p) 4(0.5) n( p)
2 2
n( p) 2 1.4142 ~ 1.4142
e. f(x) = F ‘(x) = 1
2 x
1
x 0 x2
f ( x) 2
0 de otra manera
0 x 2
1 3 x3
F ( x) 4 x 2 x 2
2 32 3
2 x
1
a. Calcule P(X < 0)
b. Calcule P(-1 < X < 1)
c. Calcule P(0.5 < X)
d. Encuentre la función de densidad f(x).
e. Verifique que ~ = 0
Solución
d. f ( x) F ' ( x) 3
32 (4 x 2 ) por tanto
3 (4 x 2 ) 2 x 2
f ( x) 32
0 de otra manera
0.5 F ( )
~
12 323 (4n n3 )
3
1
e. 2
0 4n n3 n(4 n3 )
3 2
0.5 x 0 x2
f ( x)
0 de otra manera
a. Calcule E(X).
b. Calcule V(X) y .
c. Si a la persona que solicita el libro se le cobra una cantidad h(X) = X 2 cuando la
duración del préstamo es X, calcule el cobro esperado E [h(X).
Solución
2
x3
2
8 4
a. E ( X ) 0.5 x xdx 0.5
0 3 0 6 3
2
x4
2
b. E ( X ) 0.5
2
x xdx 0.5 2
2
0 4 0
Puesto que V ( X ) E ( X 2 ) E ( X ) 2
4 2
2
3 3
2
x4
2
c. E h( X ) 2
h( x) f ( x)dx x (0.5 x)dx 0.5 2
2
0 4 0
Solución
a.
15
1. Un taller de servicios para automóviles sabe que 45% de las afinaciones se efectúa en
automóviles de 4 cilindros, 40% en automóviles de 6 cilindros y 15 % en automóviles
de 8 cilindros. Sea X = número de cilindros del siguiente automóvil que se afinará.
a. ¿Cuál es la fpm de X?
b. Dibuje una gráfica lineal y un histograma de probabilidad a partir de la fpm del
inciso a.
Solución
a.
x 4 6 8
p(x) 0.45 0.40 0.15
b.
x 0 1 2 3 4
p(x) .4 .1 .1 .1 .3
p(x) .4 .1 .2 .1 .3
b. Para la fpm legítima del inciso a calcule P (2 ≤ X ≤ 4), P(X ≤ 2) y P(X ≠ 0).
4
c. Si p(x) = c (5 – x) para x = 1,2,3, 4, ¿cuál es el valor de c? (Sugerencia : p( x) 1
x 0
Solución
x 0 1 2 3 4
p(x) 0.4 0.1 0.1 0.1 0.3
c. p (x) = c (5 – x)
c (5 – 0) + c (5 – 1) + c (5 – 2) + c (5 – 3) + c (5 – 4) = 1
5c + 4c + 3c + 2c + c = 1
15 c = 1, por tanto c = 1/ 15
3. Un negocio de computadoras que atiende pedidos por correo tiene seis líneas
telefónicas. Simbolicemos con X el número de líneas en uso en un momento
específico. Supongamos que la fpm de X está dada en la tabla siguiente.
x 0 1 2 3 4 5 6
p(x) .10 .15 .20 .25 .20 .06 .04
Solución
Solución
17
b.
y 1 2 3 4 5
1 2 3 4 5
p(y) 15 15 15 15 15
y 1
p( y ) y
y 1
2
/ 50 1
50 504 509 16
50 50
25 55
50 1
Solución
a. (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5)
b.
p(0) P(3,4), (3,5), (4,5) 103 0.3
p(1) P(1,3), (1,4), (1,5), (2,3), (2,4), (2,5) 106 0.6
p(2) P(1,2) 101 0.1
x 0 1 2
p(x) 0.3 0.6 0.1
18
c. F (0) = P (X 0) = 0.3
F (1) = P (X 1) = 0.9
F (2) = P (X 2) = 1.0, entonces la función de distribución acumulada es:
0 x0
0.3 0 x 1
F ( x)
0.9 1 x 2
1.0 x2
Solución
a.
Resultados X P(X) Resultados x P(X)
SSSS 4 (.3)4 = 0.0081 SSFF 2 (.7)2(.3)2 = 0.0441
FSSS 3 (.7)(.3)3 = 0.0189 SFFS 2 (.7)2(.3)2 = 0.0441
SFSS 3 (.7)(.3)3 = 0.0189 FFFS 1 (.7)3(.3) = 0.1029
SSFS 3 (.7)(.3)3 = 0.0189 FFSF 1 (.7)3(.3) = 0.1029
SSSF 3 (.7)(.3)3 = 0.0189 FSFF 1 (.7)3(.3) = 0.1029
FFSS 2 (.7)2(.3)2 = 0.0441 SFFF 1 (.7)3(.3) = 0.1029
FSSF 2 (.7)2(.3)2 = 0.0441 FSFS 2 (.7)2(.3)2 = 0.0441
SFSF 2 (.7)2(.3)2 = 0.0441 FFFF 0 (.7)4 = 0.2401
x 0 1 2 3 4
p(x) 0.2401 0.4116 0.2646 0.0756 0.0081
b.
c. El valor mas probable de X es x = 1
d. P (X 2) = 0.2646 + 0.0756 + 0.0081 = 0.3483
19
7. El voltaje de una batería nueva puede se aceptable (A) o no aceptable (I). Cierta
linterna de mano necesita dos baterías, las cuales necesitarán seleccionarse y probarse
independientemente hasta encontrar dos aceptables. Supongamos que el 90 % de
todas las baterías tienen voltaje aceptable. Señale con Y el número de baterías que
tienen que ser probadas.
a. ¿Cuál es p (2), es decir, P (Y = 2)?
b. ¿Cuál es p(3)? (Sugerencia: Hay dos resultados diferentes que confluyen en Y = 3)
c. Para tener Y = 5, ¿qué debe ser cierto en la quinta batería seleccionada? Haga una
lista de cuatro resultados para los que Y = 5 y luego determine p (5).
d. Utilice el modelo de sus respuestas en los incisos a y c para obtener una fórmula
general de p (y).
Solución
Solución
Si se denota por A el individuo que tiene sagre tipo O+ y por B, C y D los otros tres,
entonces:
p (1) = P (Y = 1) = P (A sea clasificado primero) = ¼
p (2) = P (Y = 2) = P (B, C o D primero y A después)
= P (B, C o D primero) P(A después/B, C o D primero)
= 34 13 14 0.25
p (3) = P (Y = 3) = P (B, C o D primero y segundo y A después)
= 34 23 12 14 0.25
p (4) = P (Y = 4) = P (B, C y D primero y A después)
= 34 23 12 14 0.25
20
y 1 2 3 4
p(y) 0.25 0.25 0.25 0.25
10. Una biblioteca se suscribe a dos semanarios. Cada uno puede llegar, el miércoles,
jueves, viernes o sábado. Suponga que cada uno llegan independiente uno de otro y
para cada P (Mié.) = 0.4, P ( Jue.) = 0.3, P( Vie.) = 0.2 y P (Sáb.) = 0.1. Sea Y = al
número de días después del miércoles que tardan ambos semanarios en llegar (por lo
cual los posibles valores de Y son 0, 1, 2, 3). Calcule la fpm de Y. (Sugerencia: hay 16
resultados posibles; Y (M,M) = 0, Y (V,J) = 2, etc.)
Solución
P (Y = 0) = (0.4)(0.4) = 0.16
P (Y = 1) = (0.4)(0.3) + (0.3)(0.3) + (0.3)(0.4) = 0.33
P (Y = 2) = (0.4)(0.2) + (0.3)(0.2) + (0.2)(0.4) + (0.2)(0.3) + (0.2)(0.2) = 0.32
P (Y = 3) = 2(0.4)(0.1) + 2(0.3)(0.1) + 2(0.2)(0.1) + (0.1)(0.1) = 0.19
y 0 1 3 3
p (y) 0.16 0.33 0.32 0.19
11. Un negocio de computadoras que atiende pedidos por correo tiene seis líneas
telefónicas. Simbolicemos con X el número de líneas en uso en un momento
específico. Supongamos que la fpm de X está dada en la tabla siguiente.
x 0 1 2 3 4 5 6
p(x) .10 .15 .20 .25 .20 .06 .04
Calcule y grafique la fda F(x), después utilícela para calcular la probabilidad de cada
uno de los siguientes eventos.
a. {A lo sumo tres líneas estén en uso}l
b. {Menos de tres líneas estén en uso}
c. {Por lo menos tres líneas estén en uso}
d. {Entre 2 y 5 líneas estén en uso}
Solución
21
0 x0
0.10 0 x 1
0.25 1 x 2
0.45 2 x3
F ( x)
0.70 3 x 4
0.90 4 x5
0.96 5 x6
1 x6
a. P (X 3) = F (3) = 0.70
b. P (X < 3) = F (2) = 0.45
c. P (X 3) = 1 – P(X < 3) = 1 – 0.45 = 0.55
d. P (2 X 5) = F (5) – F(1) = 0.96 – 0.25 = 0.71
0 x0
.06 0 x 1
.19 1 x 2
.39 2 x3
F ( x)
.67 3 x 4
.92 4 x5
.97 5 x6
1 6 x
Calcule las siguientes probabilidades directamente de fpa.
a. p(2), esto es P (X = 2)
b. P(X >3)
c. P(2 ≤ x ≤ 5)
d. P(2< x < 5)
Solución
13. Una compañía de seguros ofrece a sus tenedores de pólizas varias opciones
diferentes para el pago de primas. Para un tenedor seleccionado al azar, sea X =
número de meses entre pagos sucesivos. La fpa de X es como sigue:
22
0 x 1
.30 1 x 3
.40 3 x 4
F ( x)
.45 4 x6
.60 6 x 12
1 12 x
a. ¿Cuál es la fpm de X?
b. Sólo con el uso de fpa, calcule P (3 ≤ X ≤ 6) y P (4 ≤ X).
Solución
a.
x 1 3 4 6 12
p (x) 0.30 0.10 0.05 0.15 0.40
14. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la
siguiente tabla:
xi 2 3 4 5
p(x) 0.2 0.4 0.3 0.1
15. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la
siguiente tabla:
x -5 -2 0 1 3 8
p(x) 0.1 0.2 0.1 0.2 a 0.1
a. Calcule la constante a.
b. Encuentre la función de distribución acumulada F(x).
c. Calcule P(X = 1), P(X = 2), P(X < 3), P(X ≥ 0) y P( -2 ≤ X ≤ 3)
23
SERIE 4
a. b(3; 8, 6)
b. b(5; 8, 6)
c. P(3 ≤ X ≤ 5) cuando n = 8 y p = 0.6
d. P(1 ≤ X) cuando n = 12 y p = 0.1
Solución
n x n x
p (1 p) x 0,1, 2, 3,, n
b( x; n, p) x
0 de otra manera
8
a. b(3; 8, 0.6) (0.6) 3 (1 0.6) 83 0.1238
3
8
b. b(5; 8, 0.6) (0.6) 3 (1 0.6) 3 0.2787
5
12
d. P(1 X ) 1 P( X 1) 1 (0.1) 0 (0.9)12 1 0.28243 0.71757
0
Solución
b. b (4; 10, 0.3) = B (4; 10, 0.3) - B (3; 10, 0.3) = 0.850 – 0.650 = 0.200
24
c. b (6; 10, 0.7) = B (6; 10, 0.7) – B (5; 10, 0.7) = 0.350 – 0.150 = 0.200
g. P (2 < X < 6) = B (5; 10, 0.3) – B (2; 10, 0.3) = 0.953 – 0.383 = 0.570
a. Determine P(X ≤ 2)
b. Determine P(X ≥ 5)
c. Determine P(1 ≤ X ≤ 4)
d. ¿Cuál es la probabilidad de que ninguna de las 25 tarjetas esté defectuosa?
e. Calcule el valor esperado y la desviación estándar de X.
Solución
25
d. P (X = 0) = b (0; 25, 0.05) = (0.05) 0 (0.95) 24 0.291
0
4. Una compañía que produce cristal fino sabe por experiencia que 10% de sus copas
tienen imperfecciones y deben clasificarse como de “segunda”.
a. Entre seis copas seleccionadas al azar, ¿cuál es la probabilidad de que por lo menos
dos sean de “segunda”?
b. Entre seis copas seleccionadas al azar, ¿qué tan probable es que sólo una sea de
“segunda”?
c. Si las copas se examinan una por una, ¿cuál es la probabilidad de que por lo menos
sean seleccionadas cinco para encontrar cuatro que no sean de segunda?
Solución
25
a. P (X 2) = 1- P (X < 2) = 1 -
6 6
(0.1) (0.9) (0.1) (0.9) 1 0.8857 0.114
0 6 1 5
0 1
6
b. P( X 1) (0.1)(0.9) 5 0.3542
1
5. Suponga que solo 20% de los automóviles se detienen por completo en el crucero,
donde hay un semáforo con luz roja intermitente, cuando no ven otros automóviles.
¿Cuál es la probabilidad de que entre 20 automóviles seleccionados al azar:
Solución
d. E (X) = np = 20 (0.2) = 4
y 0 1 2 3
p( y) .60 .25 .10 .05
c. P (5 X 10) = B (10; 15, 0.4) – B (4; 15, 0.4) = 0.991 – 0.217 = 0.774
Solución
8. Veinte por ciento de todos los teléfonos de cierto tipo se remiten para repararse
mientras todavía está vigente su garantía. De estos 60 % pueden ser reparados y el
otro 40% debe sustituirse por aparatos nuevos. Si una compañía compra 10 de estos
teléfonos, ¿Cuál es la probabilidad de que exactamente se cambien 2 dentro del
período de garantía?
Solución
c. Sea B el evento en que 2 llega a la final. Haga una lista de los eventos en B
d. ¿Cuáles son los resultados en A ⋃ B y en A ∩ B? ¿Cuáles son los resultados en A’?
Solución
a. S = {1324, 3124, 1342, 3142, 1423, 1432, 4123, 4132, 2314, 2341, 3214, 3241,
4213, 2413, 4231, 2431}
b. A = {1324, 1342, 1423, 1432}
d. A B = {1324, 1342, 1423, 1432, 2314, 2341, 3214, 3241, 4213, 4231, 2431,
2413}
A B = porque son disjuntos
A’ = {3124, 3142, 4123, 4132, 2314, 2341, 3214, 3241, 4213, 2413, 4231, 2431}
2. Suponga que los vehículos que toman una determinada salida de la autopista pueden
dar vuelta a la derecha (R), a la izquierda (L) o seguir derecho (S). Imagine que observa
la dirección de tres vehículos sucesivos.
a. Haga una lista de todos los resultados en el evento A, donde tres vehículos toman
la misma dirección.
b. Haga una lista de todos los resultados en el evento B donde tres vehículos toman
direcciones distintas
c. Haga una lista de todos los resultados en el evento C donde sólo dos de los tres
vehículos dan vuelta a la derecha.
d. Haga una lista de todos los resultados en el evento D donde sólo dos vehículos van
en la misma dirección.
e. Haga una lista de los resultados en D’, C D y C D .
Solución
El espacio muestral es el siguiente:
1
1 3
Solución
4. Cada muestra de cuatro hipotecas para vivienda está clasificada como de tasa fija (F)
o tasa variable (V).
Solución
29
5. Una familia formada por tres personas A, B y C asisten a una clínica médica que
siempre tiene un médico en cada uno de los puestos 1, 2 y 3. Durante cierta semana
cada miembro de la familia visita una vez la clínica y le asignan al azar un médico: el
experimento consiste en registrar el número de puesto asignado a cada miembro de la
familia. Un resultado de (1, 2,1) es para A el puesto 1, para B el puesto 2 y C el puesto
1.
Solución
6. Una biblioteca en una universidad tiene cinco ejemplares de un cierto texto en reserva.
Dos ejemplares (1,2) son primeras impresiones y los otros tres (3, 4,5) son segundas
impresiones. Un estudiante examina estos libros en orden aleatorio, deteniéndose solo
cuando selecciona una segunda impresión. Dos posibles resultados son 5, 2, 1,3.
a. Haga una lista de los resultados en S.
b. Si A simboliza el evento cuando exactamente un libro es examinado, ¿cuáles
resultados están es A?
c. Si B es el evento cuando el libro 5 es seleccionado, ¿cuáles resultados están en B?
d. Si C es el evento cuando el libro 1 no se examina, ¿cuáles resultados están en C?
Solución
30
7. Un departamento académico acaba de terminar una votación secreta para elegir jefe de
departamento. La urna de votos contiene cuatro papeletas con votos para el candidato
A y tres papeletas con votos para el candidato B. supongamos que las papeletas se
sacan de la caja una por una.
a. Haga una lista de todos los resultados posibles.
b. Suponga que se realiza un conteo a medida que se sacan las papeletas. ¿En cuáles
resultados A se mantiene delante de B en todo el conteo?
Solución
Solución
A1 A2 A3 A1 A2 A3
A1 (A2 A3)
9. Utilice un diagrama de Venn para verificar las siguientes relaciones para cualquiera de
los eventos A y B (estas se llaman leyes de Morgan):
a. ( A B)' A'B'
32
b. ( A B)' A'B'
Solución
a. ( A B)' A'B'
=
(A B)’ A’ B’
b. ( A B)' A'B'
=
(A B)’ A’ B’
33
ESTADISTICA DESCRIPTIVA
1. Los valores de densidad relativa adjuntos para varios tipos de maderas utilizados en la
construcción se publicaron en el artículo “Bolted Connection Design Values Based
on European Yield Model” (J. of Structural Engr., 1993; 2169 – 2186):
0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40 0.40 0.41 0.41 0.42 0.42
0.42 0.42 0.42 0.43 0.44 0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51
0.54 0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.67 0.75
122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
b. Construya un histograma usando las clases de igual amplitud con la primera clase
con un límite inferior de 122 y un límite superior de 124. Luego comente acerca
de cualquier característica interesante del histograma.
Solución
a.
Tallo y hoja de Resistencia a la tensión N = 153
Unidad de hoja = 1.0
12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13 44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
14 77
Por la simetría observándose que en los valores de 134 y 135 se encuentra este
valor representativo.
b. Distribución de frecuencias
Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa
122 x <124 1 0.00654 136 x < 138 22 0.14379
Resistencia a la Tensión
40
35
30
Frecuencia 25
20
15
10
0
124 128 132 136 140 144 148
ksi
Número de artículos 1 2 3 4 5 6 7 8
Frecuencia 784 204 127 50 33 28 19 19
Número de artículos 9 10 11 12 13 14 15 16 17
Frecuencia 6 7 6 7 4 4 5 3 3
a. Construya un histograma que corresponda a esta distribución de frecuencias. ¿Cuál
es la característica más interesante de la forma de la distribución?
b. ¿Qué proporción de estos autores publicaron por lo menos cinco artículos? ¿Por lo
menos diez artículos? ¿Más de diez artículos?
c. Suponga que los cinco números 15, los tres 16 y los tres 17 se hubieran agrupado
en una sola categoría mostrada como “≥ 15”. ¿Se podría trazar un histograma?
Explique.
d. Suponga que en lugar de que los valores 15,16 y 17 se listen por separado, se
hubieran combinado en una categoría 15 a 17 con frecuencia 11. ¿Se podría trazar
un histograma. Explique.
Solución:
36
a.
Artículos publicados
800
700
Frecuencia 600
500
400
La 300
200
100
0
2 4 6 8 10 12 14 16 18
No. de artículos
1280 5320 4390 2100 1240 3060 4770 1050 360 3330
3380 340 1000 960 1320 530 3350 540 3870 1250
2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770
3150 1890 510 240 396 1419 2109
a. Trace un diagrama de tallo y hojas con la cifra de los miles como tallo y la cifra de
los cientos como hoja, y comente las diversas propiedades del diagrama.
37
b. Trace un histograma usando los límites de clase 0, 1000, 2000, 3000, 4000, 5000 y
6000. ¿Qué proporción de las subdivisiones tienen una longitud total menor que
2000? ¿Entre 2000 y 4000? ¿Cómo describiría la forma del histograma?
Solución
a. Tallo y hoja de Suministro de energía eléctrica N = 47
Unidad de hoja = 100
0 123334555599 Tallo: millares
1 00122234688 Hojas: Centenas
2 1112344477
3 0113338
4 37
5 23778
El histograma
muestra la misma
forma que el
diagrama de
tallo y hojas, con
un sesgo
Positivo y
con la frecuencia mayor en el primer intervalo, no tiene simetría.
La proporción de subdivisiones con longitud menor que 2000 es
x 23
p p 0.489
n 47
38
x 9
Entre 2000 y 4000 la proporción es p p 0.191 0 19.1%
n 47
5. Una transformación de valores de datos por medio de alguna función matemática, por
ejemplo x o 1 / x, puede producir un conjunto de números que tiene propiedades
estadísticas “mas bonitas” que los datos originales. En particular puede ser posible
hallar una función para la que el histograma de valores transformados sea mas
simétrico (o todavía mejor, más parecido a una curva en forma de campana) que los
datos originales. Por ejemplo el artículo “Time Lapse Cinematographic Análisis of
Beryllium – Luna Fibroblast Interaction” (Environ. Research, 1983, pp. 34-43)
reportó los resultados de experimentos diseñados para estudiar el comportamiento de
ciertas células individuales que habían sido expuestas al berilio. Una característica
importante de tal célula es su tiempo de ínter división (TID), Se determinaron los TID
para un gran número de células en condiciones expuestas (tratamiento) y no expuestas
(de control). Los autores del artículo científico usaron una transformación logarítmica
consistente en: valor transformado = log10 (valor original). Examine los siguientes
datos representativos de TDI:
Utilice intervalos de clase 10 - < 20, 20 - < 30,… para construir un histograma con
la información original. Utilice intervalos 1.1 - < 1.2, 1.2 - < 1.3,… para hacer lo
mismo con la información transformada. ¿Cuál es el efecto de la transformación?
Solución
40
a.
7. Se determinó el índice de claridad para los cielos sobre Bagdad para cada uno de los
365 días durante un determinado año (“Contribution to the Study of the Solar
Radiation Climate of the Baghdad Environment”, Solar Energy, 1990: 7 – 12). En la
tabla siguiente se dan los resultados.
clase Frecuencia
0.15-< 0.25 8
0.25- < 0.35 14
0.35 - < 0.45 28
0.45 - < 0.50 24
0.50 - < 0.55 39
0.55 -< 0.60 51
0.60 - < 0.65 106
0.65 - < 0.70 84
0.70 - < 0.75 11
Solución:
41
a.
Frecuencia
clase
relativa
0.15-< 0.25 0.022
0.25- < 0.35 0.038
0.35 - < 0.45 0.077
0.45 - < 0.50 0.066
0.50 - < 0.55 0.107
0.55 -< 0.60 0.140
0.60 - < 0.65 0.290
0.65 - < 0.70 0.230
0.70 - < 0.75 0.030
b. La proporción de días nublados son los que tienen un índice de claridad menor que
0.35
8 4
Entonces p 0.06 o p = 6%
365
c. Los días con claridad son aquellos de por lo menos un índice de 0.65, entonces
84 11
p 0.26 o p = 26%
365
8. Construya un diagrama de puntos y dígitos para la serie de tiempo adjunta. Los datos
son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la
radiación solar promedio en la banda de 385 a 530 nm como porcentaje de la radiación
total (“Global Energy in the Different Spectral Bands at Dhanhran, Saudi Arabia”, J.
Solar Energy Engr. 1991: 290 294). Comente acerca de las características de los datos.
20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
42
19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9
Solución:
Presenta cierta simetría, el valor representativo está entre 19 y 19.5 no parece haber
valores atípicos.
43
ESTADISTICA DESCRIPTIVA
MEDIDAS DE LOCALIZACION
22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5
xi 514.9
i 1
a. x , x 46.81 x 46.81
N 11
b. Ordenando los valores: 4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5
109.9 el valor que queda en el centro es x 36.6
La diferencia tan grande entre la media y la mediana es porque la diferencia entre
el valor mínimo y el máximo es grande.
N
xi 400.6
i 1
c. x xrec 44.51 xrec 44,51
N 9
El Porcentaje recortado es 1/11 = 0.0909 o bien 9.1%
La media recortada se acerca más al valor de la mediana y se encuentra entre la
media y la mediana.
en las cantidades la mediana puede ser altamente sensible aunque los cambios sean
pequeños.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
Estadísticas descriptivas
Máximo
513.0
Máximo
141.00
Máximo
248.00
Se observa que la media recortada se aproxima más al valor de la mediana
55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
45
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3
Máximo
94.60
60.7 60.9
x 60.8
2
b. Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
26 59.18 1.39 7.11 45.90 55.00 60.80 65.05
Máximo
69.30
Media del
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
40 58.35 1.86 11.76 36.70 47.47 60.80 67.73
Máximo
77.10
MEDIDAS DE VARIABILIDAD
29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6
Calcule lo siguiente:
a. El intervalo de la muestra
b. La varianza muestral s2 de la definición (es decir calcular primeramente las
desviaciones con respecto a la media y luego elevarlas al cuadrado, etc.)
c. La desviación estándar muestral
d. s2 usando el método breve
Solución:
a. Intervalo de la muestra o rango = xmax xmin
46
(x x )
i
2
443.801
s2 i 1
s2 49.3112 s 2 49.3112
n 1 9
x2
i
n
443.81
10
s2 s2 49.3112 s 2 49.3112
n 1 9
x
xi x 14438 2887.6 x 2887.6 x 2888
n 5
xi ( xi x ) ( xi x ) 2
2781 -106.6 11363.56
2900 12.4 153.76
3013 125.4 15725.16
2856 -31.6 998.56
2888 0.4 0.16
xi 14438 ( xi x ) = 0 ( xi x ) 2 = 28241.2
n
(x x )
i
2
28241.2
s2 i 1
s2 7060.3 s 2 7060.3
n 1 4
3. El artículo “A Thin – film Oxygen Uptake Test for the Evaluation of Automotive
Carnkcase Lubricants” (Lubric. Engr., 1984, pp. 153-159) publicó los siguientes datos
del tiempo de oxidación – inducción (en minutos) de varios aceites comerciales:
87 103 130 160 180 195 132 145 211 105 145 153 138 87
99 93 119 129 152
Solución:
a. Variable N Media Desv.Est. Mínimo Q1 Mediana Q3
Tiempo 19 134.89 35.56 87.00 103.00 132.00 153.00
48
35.65 1264.52
b. 1 h = 60 min, por tanto sh 0.593 y sh2 0.3513
60 3600
22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5
Solución:
Hay un ligero sesgo positivo, hay dispersión en los datos, es decir mucha
variabilidad, no hay valores atípicos.
c. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
26.25 – (1.5)(43.75) = - 39.375 o 70 + (1.5)(43.75) = 135.62
En este caso no hay valores menores que – 39.375 ni mayores que 135.62
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
26.25 – (3.0)(43.75) = - 105 o 70 + (3.0)(43.75) = 201.25
30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511
Trace un diagrama de caja que muestre los valores atípicos y comente sus
particularidades.
Solución:
Hay un sesgo positivo en los datos, hay un valor extremo (x = 511), presenta una ligera
dispersión, los valores con los que fue construida la caja son:
xmin 30, xmax 511, x 119, Q1 87, Q3 182, f s 95 , 1.5fs = 142.5, 3.0fs =
285
Q3 3.0 f s 182 285 467 , de ahí que 511 > 467 es un valor extremo
DE 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.3 0.3 0.3 0.4 0.5 0.7
0.8
1.0 1.5 2.7 2.8 3.5 4.0 8.9 9.2 11.7 21.0
Sin DE 0 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.2 0.3 0.3 0.3 0.4 0.5
0.5 0.6 0.8 0.9 1.0 1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 4.3 4.8
5.0 5.6 5.9 6.0 6.4 7.9 8.3 8.7 9.1 9.6 9.9 11.0 11.5 12.2
12.7 14.0 16.6 17.8
a. Determine las medianas, los cuartos y las cuartas dispersiones en las dos muestras.
b. ¿Hay valores atípicos en alguna de las dos muestras? ¿Hay valores atípicos
extremos?
c. Trace un diagrama de caja comparativo y utilícelo como base para comparar las
muestras con DE y sin DE.
Solución:
a. Para la muestra DE, x 0.4, Q1 0.1, Q3 2.75 f s 2.75 0.1 2.65
Para la muestra sin DE, x 1.6, Q1 0.3, Q3 7.9 f s 7.9 0.3 7.6
b. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
para la muestra de DE
0.1 – (1.5)(2.65) = - 3.875 o 2.75 + (1.5)(2.65) = 6.725
En este caso no hay valores menores que – 3.875 pero si hay valores mayores que
6.725, estos son 8.9, 9.2
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
0.1 – (3.0)(2.65) = - 7.65 o 2.75 + (3.0)(2.65) = 10.7
Para este caso no hay valores extremos en el lado izquierdo de los datos porque la
observación mínima es 0.1, pero en el lado derecho los valores extremos son
aquellos mayores de 10.7, esto es 11.7 y 21.0
c.
51
Flujo
125 2.6 2.7 3.0 3.2 3.8 4.6
160 3.6 4.2 4.2 4.6 4.9 5.0
200 2.9 3.4 3.5 4.1 4.6 5.1
Compare las observaciones de uniformidad que resultan de estos tres diferentes flujos.
Solución:
Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391
391 392
Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383
388 392
Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380
380 392
Solución:
a. Los resúmenes de 5 números: x , los dos cuartiles y las observaciones menor y
mayor, son idénticos en los tres tipos y no hay valores atípicos, por tanto los tres
diagramas de caja individuales, resultan idénticos.
53
T1
T2
T3
c. El diagrama de caja del inciso (a) no es capaz de detectar las diferencias entre los
tres conjuntos de datos, la razón principal es que los diagramas de caja dan solo
algunos detalles porque se usa un resumen de sólo 5 datos para comparar el conjunto
de datos.
54
ESTADISTICA DESCRIPTIVA
MEDIDAS DE LOCALIZACION
xi 2696
a. x i 1
, x 192.57 x 192.57 x 189
N 14
La media es mayor que la mediana y se observa que están muy cercanas.
b. La mediana no cambiaría porque no cambia la posición y x 189.71 porque el
valor del
dato disminuyó.
c. xrec 191 el porcentaje recortado es 1/14 = 0.07 o 7%
N
xi N N
d. x i 1
, x ( N ) xi , 119.8 13 1557.4 para n = 14, xi = 1557.4 +
N i 1 i 1
159
N
xi 1716.4
i 1
x , x 122.57 x 122.57
N 14
22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5
xi 514.9
i 1
a. x , x 46.81 x 46.81
N 11
b. Ordenando los valores: 4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5
109.9 el valor que queda en el centro es x 36.6
La diferencia tan grande entre la media y la mediana es porque la diferencia entre
el valor mínimo y el máximo es grande.
N
xi 400.6
i 1
c. x xrec 44.51 xrec 44,51
N 9
El Porcentaje recortado es 1/11 = 0.0909 o bien 9.1%
La media recortada se acerca más al valor de la mediana y se encuentra entre la
media y
la mediana.
389 356 359 363 375 424 325 394 402 373 373 370 364 366
364
325 339 393 392 369 374 359 356 403 334 397
a. Trace un diagrama de tallo y hojas con los datos. ¿De que manera esto hace pensar
que
la media y la mediana muestrales están correlacionadas?
b. Calcule los valores de la media y la mediana muestrales. Sugerencia: xi 9638
c. ¿Cuánto se puede aumentar el tiempo máximo que es de 424, sin que se afecte el
valor de la mediana muestral? ¿Cuánto se puede disminuir ese tiempo sin que afecte
dicho valor?
d. ¿Cuáles son los valores de x y ~ x cuando se expresan las observaciones en
minutos?
Solución:
a. Tallo y hoja del tiempo de evacuación N = 26
Unidad de hoja = 1.0
xi
9638
i 1
b. x , x
370.7 x 370.7 x 369.5
N 25
c. El tiempo máximo se puede aumentar indefinidamente porque la posición de la
mediana
no cambia.
El tiempo máximo puede disminuir hasta un valor que no sea menor de 370
porque entonces tomaría la posición de uno de los datos con que se calcula
mediana.
d. Para expresar la media y la mediana en minutos basta dividir entre 60 para hacer
la
conversión, no es necesario convertir todos los datos:
370.7 369.5
x 6.18 x 6.18 min. x 6.16 x 6.16 min.
60 60
xi 100.4
i 1
x , x 12.55x 12.55
N 8
14.5 12
x 13.25 x 13.25
2
La media recortada al 12.5% requiere quitar un dato en cada extremo, el mínimo y
el
74.4
Máximo, entonces: xrec 12.4 xrec 12.4
6
Los tres valores presentan poca diferencia indicando poca dispersión en los datos.
b. El valor podría aumentar hasta un número menor a 12 sin que afecte el valor de la
mediana.
c. No es necesario convertir cada valor en las otras unidades .Para expresar la media
en ksi
57
1ksi
12.55 psi 5.70 psi x 5.70 psi
2.2 psi
6.5 12.0 14.9 10.0 10.7 7.9 21.9 12.5 14.5 9.2
xi 120.1
i 1
x , x 12.01
x 12.01
N 10
10.7 12
x 11.35 x 11.35
2
91.7
xrec 11.46 xrec (10) 11.46
8
La mediana podría ser elegida ya que es la más alejada del valor de 21.9
10. Los valores de presión sanguínea se reportan a veces a los 5 mm Hg más cercanos
(100, 105, 110, etc.). Suponga que los valores reales de presión sanguínea para nueve
individuos seleccionados al azar son:
11. La propagación de grietas por fatiga en diversas partes de aeronaves han sido objeto
de profundo estudio en años recientes. Los datos que aparecen a continuación constan
de tiempo de propagación (horas de vuelo/ 104) para llegar a un tamaño de grieta dado
en agujeros sujetadores que se usan en aeronaves militares (“Statistical Crack
Propagation in Fastener Holes Ander Spectrum Loading”, J.Aaircraft, 1983, pp. 1028
– 1032):
xi 16.475
i 1
x , x 1.0297 x 1.0297
N 16
1.007 1.011
x 1.009 x 1.009
2
b. El valor mayor 1.394 puede disminuir hasta 1.394 – 1.011 = 0.383, si disminuye
mas
de 0.383 la mediana cambiará.
12. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture,
2002: 301- 305) aparecen las observaciones siguientes, listadas en orden creciente, del
tiempo de vida del taladro (número de agujeros que maquina un taladro antes de
romperse) cuando se hacen agujeros en cierta aleación de latón.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
Estadísticas descriptivas
Máximo
513.0
Máximo
141.00
Máximo
248.00
Se observa que la media recortada se aproxima más al valor de la mediana
13. Se seleccionó una muestra de n = 10 automóviles y cada uno se sometió a una prueba
de choque a una velocidad de 5 millas/hora. Si se denota por S (éxito) un automóvil
sin daños visibles Y por F Uno con daños, los resultados serían los siguientes:
S S F S S S F F S S
xi 7
i 1
x , x 0.7 x 0.7 La media y la proporción son iguales
N 10
s
c. p , s p(n), s 0.8(25) 20 el total de éxitos es 20, pero había 7 por tanto
n
de los 15 adicionales 13 deben ser éxitos.
a. y
yi ( xi c) xi nc x c y x c
n n n n
y mediana de ( x1 c, x2 c, x3 c,...xn c)
mediana de ( x1 , x2 , x3 ,...xn ) c x c y xc
b. y
yi cxi c xi cx y cx
n n n
60
48 79 100+ 35 92 86 57 100+ 17 29
¿Cuál de las medidas de tendencia central analizadas hasta ahora se pueden
calcular?(Nota: se dice que los datos de este experimento están “censurados a la
derecha”)
Solución:
Ordenando los datos 17 29 35 48 57 79 86 92 100+ 100+
Como no se conocen los valores reales de las medidas mas grandes, podemos calcular
la
Mediana y la media recortada al 20% o mayor recorte
57 79
x 68.0 x 68.0
2
397
xrec (20) 66.167 xrec (20) 66.167
6
270
xrec (30) 67.5 xrec (30) 67.5
4
55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3
Máximo
94.60
61
60.7 60.9
x 60.8
2
b. Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
26 59.18 1.39 7.11 45.90 55.00 60.80 65.05
Máximo
69.30
Media del
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
40 58.35 1.86 11.76 36.70 47.47 60.80 67.73
Máximo
77.10
MEDIDAS DE VARIABILIDAD
13. Un estudio de la relación entre la edad y varias funciones visuales, por ejemplo
agudeza y percepción de profundidad, reportó las siguientes observaciones sobre el
área de la lámina esclerótica (mm2) de cabezas de nervios ópticos humanos (
“Morphometry of Nerve Fiber Bundle Pores in the Optic Nerve Head of the Human”,
Experimental Eye Research, 1988, pp. 559-568):
2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88 4.33 3.46 4.52 2.43 3.65
2.78 3.56 3.01
a. Calcule xi y xi2
b. Utilice los valores calculados en el inciso (a) para determinar la varianza muestral
s2 y la desviación estándar muestral s.
Solución:
a. xi 56.8 xi2 197.804
xi 56.8
2 2
x 2
i
n
197.804
17
b. s 2
s2 0.5016 s 2 0.5016
n 1 16
s = 0.7082
Intervalos de
Frecuencia Intervalos de clase frecuencia
clase
10 ≤ x < 20 121 60 ≤ x < 70 120
20 ≤ x < 30 165 70 ≤ x 80 118
62
Solución:
2
p
p p fi xi
fi xi fi xi2 i 1
n
x i 1
s2 i 1
xi = marcas de clase
n n 1
fi = frecuencia del intervalo
15. El artículo “Oxygen Consumption During Fire Suppresión: Error of Heart Rate
Estimation” (Ergonomics, 1991) presentó los datos siguientes sobre el consumo de
oxígeno en ml/ kg/min, para una muestra de 10 bomberos que hicieron una simulación
de combate de incendio:
29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6
Calcule lo siguiente:
e. El intervalo de la muestra
f. La varianza muestral s2 de la definición (es decir calcular primeramente las
desviaciones con respecto a la media y luego elevarlas al cuadrado, etc.)
g. La desviación estándar muestral
h. s2 usando el método breve
Solución:
a. Intervalo de la muestra o rango = xmax xmin
R 49.30 23.50 25.8 R 25.8
b. x 31.03
xi ( xi x ) ( xi x ) 2 xi2
29.5 - 1.53 2.3409 870.25
49.3 18.27 333.7929 2340.49
30.6 - 0.43 0.1849 936.36
28.2 - 2.83 8.0089 795.24
28.0 - 3.03 9.1809 784.00
26.3 - 4.73 22.3729 691.69
33.9 2.87 8.2369 1149.21
29.4 - 1.63 2.6569 864.36
23.5 - 7.53 56.7009 552.25
31.6 0.57 0.3249 998.56
63
(x x )
i
2
443.801
s2 i 1
s2 49.3112 s 2 49.3112
n 1 9
x2
i
n
443.81
10
s2 s2 49.3112 s 2 49.3112
n 1 9
16. Se determinó el valor del módulo de elasticidad, en GPa de placas coladas, formadas
por varios sustratos intermetálicos y se obtuvieron las siguientes observaciones
muestrales (“Strength and Modulus of a Molybdenum-Coated Ti-25 Al-10 Nb-3 U-
1Mo Intermetallic”, Journal of Material Engeenering and Performance, 1997, pp. 46-
50):
a. x
xi x 577.9 115.58
n 5
xi ( xi x ) ( xi x ) 2 xi2
116.4 0.82 0.6724 13548.96
115.9 0.32 0.1024 13432.81
114.6 - 0.98 0.9604 13133.16
64
(x x ) i
2
1.929
s2 i 1
s2 0.48225 s 2 0.48225
n 1 4
xi 577.9
2 2
x 2
i
n
66795.61
5
c. s 2
s2 0.482 s 2 0.482
n 1 4
d.
xi xi2
16.4 268.96
15.9 252.81
14.6 213.16
15.2 231.04
15.8 249.64
xi 77.9 xi = 1215.61
2
xi 77.9
2 2
x 2
i
n
1215.61
5
s2 s2 0.482 s 2 0.482
n 1 4
Resultan iguales
x
xi x 14438 2887.6 x 2887.6 x 2888
n 5
xi ( xi x ) ( xi x ) 2
65
(x x ) i
2
28241.2
s2 i 1
s2 7060.3 s 2 7060.3
n 1 4
18. Calcule e interprete los valores de la media y la desviación estándar muestrales para
las siguientes determinaciones de la resistencia a la fractura (en MPa, tomados de la
gráfica en “Heat-Resistant Active Brazing of Silicon Nitride: Mechanical Evaluation
of Braze Joints”, Welding J., agosto de 1997):
x
xi x
1162
116.2 x 116.2
n 10
xi xi2
xi
2
xi2 n
87 7569
s
2
93 8649
n 1 96 9216
1162
2
98 9604
140992 105 11025
s2 10 663.0667
9 114 12996
128 16384
131 17161
s 2 663.0667 s 25.75 142 20164
168 28224
xi 1162 xi =140992
2
66
Sobre el promedio se espera que una fractura se encuentre alrededor de 116.2 MPa.
En general el tamaño de una desviación típica de la media muestral es alrededor de
25.75. Algunas observaciones pueden desviarse mas del valor de 116.2 y otras menos.
389 356 359 363 375 424 325 394 402 373 373 370 364 366
364
325 339 393 392 369 374 359 356 403 334 397
xi 9638
2 2
x 2
i
n
3587566
26 593.3415
s2 s2
n 1 25
s 2 593.3415 s 24.36
En general el tamaño de una desviación típica de la media muestral de 370.7 es cerca
de 24.4. Algunas observaciones pueden desviarse un poco mas de este valor y otras
un poco menos.
a. x
xi x 374.1 53.44 x 53.44 x 66.3
n 7
El hecho de que x x sugiere que las observaciones del extremo izquierdo (menores)
de la muestra están más cercanas que las del extremo derecho (mayores).
b.
xi 374.1
2 2
x2
i
n
23488.03
7
s2 s2 582.51
n 1 6
s 582.51
2
s 24.14
67
21. El artículo “A Thin – film Oxygen Uptake Test for the Evaluation of Automotive
Carnkcase Lubricants” (Lubric. Engr., 1984, pp. 153-159) publicó los siguientes datos
del tiempo de oxidación – inducción (en minutos) de varios aceites comerciales:
87 103 130 160 180 195 132 145 211 105 145 153 138 87
99 93 119 129 152
Solución:
error
a. Variable N Media estándar Desv.Est. Mínimo Q1 Mediana
Q3
Tiempo 19 134.89 8.16 35.56 87.00 103.00 132.00
153.00
35.65 1264.52
b. 1 h = 60 min, por tanto sh 0.593 y sh2 0.3513
60 3600
xi 115 116 117 118 119 120 121 122 123 124
fi 4 6 9 13 15 19 20 18 15 10
- 10 ≤ x < 0 3
0 ≤ x < 10 8
10 ≤ x < 20 12
20 ≤ x < 30 16
30 ≤ x < 40 9
40 ≤ x < 50 4
50 ≤ x < 60 2
Solución:
24. Consulte los datos del problema 7 sobre áreas de lámina esclerótica.
25. Vuelva a examinar los datos adjuntos de mediciones de resistencia al corte, en MPa,
que se mencionaron en el problema 1 de esta serie.
22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5
69
Solución:
Hay un ligero sesgo positivo, hay dispersión en los datos, es decir mucha
variabilidad
No hay valores atípicos.
e. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
26.25 – (1.5)(43.75) = - 39.375 o 70 + (1.5)(43.75) = 135.62
En este caso no hay valores menores que – 39.375 ni mayores que 135.62
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
26.25 – (3.0)(43.75) = - 105 o 70 + (3.0)(43.75) = 201.25
26. A continuación vemos el diagrama de tallo y hojas de los datos del tiempo de
evacuación mostrados en el ejercicio 3
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4
b. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
359 – (1.5)(33) = 309.5 o 392 + (1.5)(33) = 441.5
En este caso no hay valores menores que 309.5 ni mayores que 441.5
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
359 – (3.0)(33) = 260 o 392 + (3.0)(33) = 491
Como en este caso la observación mínima es 325 y la máxima 424 se concluye que
no hay valores atípicos ni extremos.
c.
Hay un ligero sesgo positivo, no tiene mucha simetría y la dispersión parece grande.
71
d. Hasta un valor que no fuera menor que 392 , es decir no mas de 32 unidades.
30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511
Trace un diagrama de caja que muestre los valores atípicos y comente sus
particularidades.
Solución:
Hay un sesgo positivo en los datos, hay un valor extremo (x = 511), presenta una ligera
dispersión, los valores con los que fue construida la caja son:
xmin 30, xmax 511, x 119, Q1 87, Q3 182, f s 95 , 1.5fs = 142.5, 3.0fs =
285
Q3 3.0 f s 182 285 467 , de ahí que 511 > 467 es un valor extremo
Solución:
a. f s 216.8 196 20.8, 1.5 f s 31.2, 3.0 f s 62.4 ,
O
8. En una empresa se usan dos máquinas distintas para fabricar partes de cierto tipo.
Durante un solo turno, se obtuvo una muestra de n = 20 partes que produce cada
máquina, se determinó el valor de una dimensión crítica determinada. Con estos datos
se construyó el diagrama de caja comparativo. Compare y describa las diferencias de
las dos muestras,
Solución:
Se observa del diagrama de caja que la muestra tomada en la máquina 2 presenta
considerablemente mayor variabilidad que la muestra de la máquina 1, parece que el
valor de la mediana es el mismo, sin embargo hay mayor simetría en los datos de la
máquina 2 que en los de la 1.En los datos de la muestra de máquina 2 no hay valores
atípicos y en los de la máquina 1 hay un valor atípico.
73
DE 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.3 0.3 0.3 0.4 0.5 0.7
0.8
1.0 1.5 2.7 2.8 3.5 4.0 8.9 9.2 11.7 21.0
Sin DE 0 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.2 0.3 0.3 0.3 0.4 0.5
0.5
0.6 0.8 0.9 1.0 1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 4.3 4.8 5.0
5.6
5.9 6.0 6.4 7.9 8.3 8.7 9.1 9.6 9.9 11.0 11.5 12.2 12.7 14.0
16.6 17.8
a. Determine las medianas, los cuartos y las cuartas dispersiones en las dos muestras.
b. ¿Hay valores atípicos en alguna de las dos muestras? ¿Hay valores atípicos
extremos?
c. Trace un diagrama de caja comparativo y utilícelo como base para comparar las
muestras con DE y sin DE.
Solución:
a. Para la muestra DE, x 0.4, Q1 0.1, Q3 2.75 f s 2.75 0.1 2.65
Para la muestra sin DE, x 1.6, Q1 0.3, Q3 7.9 f s 7.9 0.3 7.6
b. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
para la muestra de DE
0.1 – (1.5)(2.65) = - 3.875 o 2.75 + (1.5)(2.65) = 6.725
En este caso no hay valores menores que – 3.875 pero si hay valores mayores que
6.725, estos son 8.9, 9.2
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
0.1 – (3.0)(2.65) = - 7.65 o 2.75 + (3.0)(2.65) = 10.7
Para este caso no hay valores extremos en el lado izquierdo de los datos porque la
observación mínima es 0.1, pero en el lado derecho los valores extremos son
aquellos mayores de 10.7, esto es 11.7 y 21.0
c.
74
Se observa que los procedimientos son muy diferentes, el de prueba presenta mucha
variabilidad, no presenta simetría, se observa una dispersión considerable de los
datos pero no presenta valores atípicos.
75
0.19 0.78 0.96 1.31 2.78 3.16 4.15 4.67 4.85 6.50 7.35 8.01 8.27 12.06
31.75 32.52 33.91 36.71 72.89
88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 95.6 93.3 94.7 91.1
91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.2
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1 89.2 88.3 85.3 87.9
88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7 91.8 91.6 90.4 91.1
92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7
76
Frec. Frec.
Intervalo Frecuencia Intervalo
relativa Frecuencia relativa
83 x < 85 2 0.02531 93 x < 95 10 0.12658
b. y c.
Variable N Media Desv.Est. Mínimo Q1 Mediana Q3
79 90.671 0.316 2.806 83.400 88.700 90.500
92.200
Variable Máximo
100.300
xi - 4 -3 -2 -1 0 1 2 3 4
77
xi - 4 -3 -2 -1 0 1 2 3 4
fi 60 120 180 200 240 190 160 90 30
fxi - 240 -360 -360 -200 0 190 360 270 120
2
fxi 960 1080 720 200 0 190 640 810 480
fx i i
220
x i 1
0.173 x 0.173
n 1270
2
p
p fi xi
f i xi2 (220) 2
i 1
4900
n 1270 3.831
s 2 i 1
n 1 1269
s 2 3.831 s 1.957
xn / 2 x( n / 2)1 00
b. Para este conjunto de datos: n = 1270 (par) x 0 x0
2 2
Solución:
78
2
p
p p fi xi
fx fi xi2
i 1
i i
n
x i 1
s 2 i 1 xi = marcas de clase
n n 1
fi = frecuencia del intervalo
Solución:
2
p
p p fi xi
fx fi xi2
i 1
i i
n
x i 1
s i 1
2
xi = marcas de clase
n n 1
fi = frecuencia del intervalo
Para simplificar algo el algebra podemos restar a los datos 76000, esta transformación
afectará a cada dato y la media, pero no afectará a la desviación estándar.
x1 683 x4 1048 x 831
nx 4(831) 3324, entonces x1 x2 x3 x4 3324 y x2 x3 3324 x1 x4
x2 x3 1593, x3 1593 x2 .............(1)
Usando la fórmula para la varianza
( xi ) 2 (3324) 2
xi
2
xi2
s2
n 1
n s 2 (180) 2
3
4
xi2 2859444
x12 x22 x32 x42 2859444 x22 x32 2859444 x12 x42 1294651............(2)
Sustituyendo (1) en la ec.(2) se obtiene
Flujo
125 2.6 2.7 3.0 3.2 3.8 4.6
160 3.6 4.2 4.2 4.6 4.9 5.0
200 2.9 3.4 3.5 4.1 4.6 5.1
Compare las observaciones de uniformidad que resultan de estos tres diferentes flujos.
Solución:
Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391
391 392
Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383
388 392
Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380
380 392
Solución:
b. Los resúmenes de 5 números: x , los dos cuartiles y las observaciones menor y
mayor, son idénticos en los tres tipos y no hay valores atípicos, por tanto los tres
diagramas de caja individuales, resultan idénticos.
81
T1
T2
T3
d. El diagrama de caja del inciso (a) no es capaz de detectar las diferencias entre los
tres conjuntos de datos, la razón principal es que los diagramas de caja dan solo
algunos detalles porque se usa un resumen de sólo 5 datos para comparar el conjunto
de datos.
82
SERIE 1
DIAGRAMAS DE TALLO Y HOJAS, HISTOGRAMAS
1. Honda 41 0.34
2. Yamaha 27 0.23
3. Kawasaki 20 0.17
4. Suzuki 18 0.15
5. Harley-Davidson 3 0.03
6. Otros 11 0.09
120 1.01
40
30
Número
20
10
0
Honda Yamaha Kawasaki Suzuki Otros Harley-Dadvison
Marca
5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0
8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7
a. Trace un diagrama de tallo y hojas de los datos. ¿Cuál parece ser un valor
representativo de la resistencia? Las observaciones, ¿parecen estar muy
concentradas cerca del valor representativo, o solo están dispersas?
b. El diagrama, ¿parece ser razonablemente simétrico respecto a su valor
representativo, o describiría su forma de otra manera?
c. ¿Parece haber algún valor extraño o atípico?
d. ¿Qué proporción de las observaciones de resistencia fueron mayores de 10 MPa en
esta muestra?
Solución
5 9
6 33588
7 00234677889
8 127
9 077
10 7
11 368
6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
a. Trace un diagrama comparativo de tallo y hojas, de los datos para vigas y cilindros
y a continuación conteste las preguntas de los incisos (b), (c), y (d) del problema
anterior para las observaciones con cilindros.
b. ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias
entre las observaciones para vigas y para cilindros?
c. Construya una gráfica de puntos de los datos del cilindro.
Solución
a. . concreto cilindros
9 5 8 Tallo: unidades
88553 6 16 Hojas: décimos
98877643200 7 012488
721 8 13359
770 9 278
7 10
863 11 2
12 6
13
14 1
c.
74 89 80 93 64 67 72 70 66 85 89 81 81 71 74 82 85
63
72 81 81 95 84 81 80 70 69 66 60 83 85 98 84 68 90
82
69 72 87 88
Solución:
Tallo y hoja de calificaciones N = 40
Unidad de hoja = 1.0
6 034
6 667899
7 00122244
7
8 001111122344
8 5557899
9 03
9 58
13. Los valores de densidad relativa adjuntos para varios tipos de maderas utilizados en
la construcción se publicaron en el artículo “Bolted Connection Design Values Based
on European Yield Model” (J. of Structural Engr., 1993; 2169 – 2186):
85
0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40 0.40 0.41 0.41 0.42 0.42
0.42 0.42 0.42 0.43 0.44 0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51
0.54 0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.67 0.75
14. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un
artículo de Technometrics (vol. 19 p. 425), revista dedicada a las aplicaciones
estadísticas en ciencias físicas e ingeniería.
88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 95.6 93.3 94.7 91.1
91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.2
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1 89.2 88.3 85.3 87.9
88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7 91.8 91.6 90.4 91.1
92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7
Trace un diagrama de tallo y hojas para estos datos. ¿Por qué es relativamente fácil
identificar un valor de octanaje? ¿Revela el diagrama algunas propiedades importantes
de los datos?
Solución
98 8
99
100 3
Porque las hojas están alrededor del valor de 90 y 91 y están cercanamente simétricas
a
estos valores, además la dispersión de los datos es pequeña con respecto al valor
representativo. Presenta dos huecos.
122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13 44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
87
14 77
Por la simetría observándose que en los valores de 134 y 135 se encuentra este
valor representativo.
b. Distribución de frecuencias
Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa
122 x <124 1 0.00654 136 x < 138 22 0.14379
Resistencia a la Tensión
40
35
30
25
Frecuencia
20
15
10
0
124 128 132 136 140 144 148
ksi
16. El conjunto de datos adjuntos está formado con observaciones del gasto de agua en
regaderas (l / min) para una muestra de n = 129 casa en Perth, Australia.
4.6 12.3 7.1 7.0 4.0 9.2 6.7 6.9 11.5 5.1 11.2 10.5
14.3 8.0 8.8 6.4 5.1 5.6 9.6 7.5 7.5 6.2 5.8 2.3
3.4 10.4 9.8 6.6 3.7 6.4 8.3 6.5 7.6 9.3 9.2 7.3
5.0 6.3 13.8 6.2 5.4 4.8 7.5 6.0 6.9 10.8 7.5 6.6
5.0 3.3 7.6 3.9 11.9 2.2 15.0 7.2 6.1 15.3 18.9 7.2
5.4 5.5 4.3 9.0 12.7 11.3 7.4 5.0 3.5 8.2 8.4 7.2
10.3 11.9 6.0 5.6 9.5 9.3 10.4 9.7 5.1 6.7 10.2 6.2
8.4 7.0 4.8 5.6 10.5 14.6 10.8 15.5 7.5 6.4 3.4 5.5
88
6.6 5.9 15.0 9.6 7.8 7.0 6.9 4.1 3.6 11.9 3.7 5.7
6.8 11.3 9.3 9.6 10.4 9.3 6.9 9.8 9.1 10.6 4.5 6.2
8.3 3.2 4.9 5.0 6.0 8.2 6.3 3.8 6.0
2 23
3 2344567789
4 01356889
5 00001114455666789
6 0000122223344456667789999
7 00012223455555668
8 02233448
9 012233335666788
10 2344455688
11 2335999
12 37
13 8
14 36
15 0035
16
17
18 9
b. El valor representativo es el 6
c. La gráfica presenta cierta dispersión
d. No es simétrica, presenta un ligero sesgo positivo.
e. El valor 18.9 parece ser un valor atípico.
Cremoso 56 44 62 36 39 53 50 65 45 40 56 68
41 30 40 50 56 30 22
Crujiente 62 53 75 42 47 40 34 62 52 50 34 42
36 75 80 47 56 62
Construya una presentación comparativa de tallo y hojas, ponga en una lista los tallos
(en el centro de la página), las hojas cremosas a la derecha y las hojas crujientes a la
izquierda. Describa las similitudes y diferencias para los dos tipos.
Solución:
Crujiente Cremoso
2 2
644 3 0069
77220 4 00145
6320 5 003666
222 6 258
55 7
0 8
2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3
Solución:
a.
Transductores Frecuencia
Frecuencia
defectuosos relativa
0 7 0.177
1 12 0.200
2 13 0.217
3 14 0.233
4 6 0.100
5 3 0.050
6 3 0.050
7 1 0.017
8 1 0.017
Totales 60 1.000
b. El número de lotes que tienen cuando mas cinco transductores defectuosos es:
90
55
n = 7 + 12 + 13 + 14 + 6 + 3 = 55, entonces la proporción es, p 0.917
60
52
Menos de cinco transductores defectuosos n = 53, p 0.867
60
8
Cuando menos cinco unidades defectuosas, n = 8, p 0.133
60
c.
Transductores defectuososo
25
20
Porcentaje
15
10
0
0 1 2 3 4 5 6 7 8
Número
Número de artículos 1 2 3 4 5 6 7 8
Frecuencia 784 204 127 50 33 28 19 19
Número de artículos 9 10 11 12 13 14 15 16 17
Frecuencia 6 7 6 7 4 4 5 3 3
Solución:
91
a.
Artículos publicados
800
700
Frecuencia 600
500
400
300
200
100
0
2 4 6 8 10 12 14 16 18
No. de artículos
Cantidad de
Partículas 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Frecuencia 1 2 3 12 11 15 18 10 12 4 5 3 1 2 1
a. ¿Qué proporción de las obleas muestreadas tenían por lo menos de una partícula?
¿Cuándo menos cinco partículas?
b. ¿Qué proporción de las obleas muestreadas tenían entre cinco y diez partículas,
inclusive? ¿Y estrictamente entre cinco y diez partículas (más de cinco y menos de
diez)?
c. Trace un histograma con la frecuencia relativa en el eje vertical. ¿Cómo describiría
la forma del histograma?
92
Solución:
a. Por lo menos una partícula n = 100 – 1 = 99, por tanto p = 0.99 o 99%
Por lo menos de 5 partículas n = 15 + 18 + 10 + 12 + 4 + 5 +3 + 1 + 2 +1 = 71 p =
0.71
Es decir 71%
b. Entre 5 y 10 partículas n = 15 + 18 + 10 + 12 + 4 + 5 = 64 p = 0.64 o 64%
Estrictamente entre 5 y 10 n = 18 + 10 + 12 + 4 = 44 p = 0.44 o 44%
c.
Partículas contaminantes en una oblea de Silicio
20
15
Frecuencia
10
0
0 2 4 6 8 10 12 14
Número de partículas contaminantes
1280 5320 4390 2100 1240 3060 4770 1050 360 3330
3380 340 1000 960 1320 530 3350 540 3870 1250
2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770
3150 1890 510 240 396 1419 2109
a. Trace un diagrama de tallo y hojas con la cifra de los miles como tallo y la cifra de
los cientos como hoja, y comente las diversas propiedades del diagrama.
b. Trace un histograma usando los límites de clase 0, 1000, 2000, 3000, 4000, 5000 y
6000. ¿Qué proporción de las subdivisiones tienen una longitud total menor que
2000? ¿Entre 2000 y 4000? ¿Cómo describiría la forma del histograma?
Solución
a.
Tallo y hoja de Suministro de energía eléctrica N = 47
Unidad de hoja = 100
2 1112344477
3 0113338
4 37
5 23778
El histograma muestra la misma forma que el diagrama de tallo y hojas, con un sesgo
Positivo y con la frecuencia mayor en el primer intervalo, no tiene simetría.
La proporción de subdivisiones con longitud menor que 2000 es
x 23
p p 0.489
n 47
x 9
Entre 2000 y 4000 la proporción es p p 0.191 0 19.1%
n 47
22. El artículo citado en el ejercicio anterior también proporciona los valores siguientes
de las variables y = número de calles sin salida y z = número de intersecciones:
y 1 0 1 0 0 2 0 1 1 1 2 1 0 0 1 1 0 1 1
z 1 8 6 1 1 5 3 0 0 4 4 0 0 1 2 1 4 0 4
94
y 1 1 0 0 0 1 1 2 0 1 2 2 1 1 0 2 1 1 0
z 0 3 0 1 1 0 1 3 2 4 6 6 0 1 1 8 3 3 5
y 1 5 0 3 0 1 1 0 0
z 0 5 2 3 1 0 0 0 3
23. En un estudio de ruptura por torsión durante el tejido de telas (Technometrics, 1982,
p. 63) se probaron 100 muestras de hilo. El número de ciclos de tensión hasta la
ruptura se registro para cada muestra de hilo. La información resultante es la siguiente:
30
25
Frecuencia
20
15
10
0
0 100 200 300 400 500 600 700 800 900
ciclos
24. Una transformación de valores de datos por medio de alguna función matemática, por
ejemplo x o 1 / x, puede producir un conjunto de números que tiene propiedades
estadísticas “mas bonitas” que los datos originales. En particular puede ser posible
hallar una función para la que el histograma de valores transformados sea mas
simétrico (o todavía mejor, más parecido a una curva en forma de campana) que los
datos originales. Por ejemplo el artículo “Time Lapse Cinematographic Análisis of
Beryllium – Luna Fibroblast Interaction” (Environ. Research, 1983, pp. 34-43)
reportó los resultados de experimentos diseñados para estudiar el comportamiento de
ciertas células individuales que habían sido expuestas al berilio. Una característica
importante de tal célula es su tiempo de ínter división (TID), Se determinaron los TID
para un gran número de células en condiciones expuestas (tratamiento) y no expuestas
(de control). Los autores del artículo científico usaron una transformación logarítmica
consistente en: valor transformado = log10 (valor original). Examine los siguientes
datos representativos de TDI:
Utilice intervalos de clase 10 - < 20, 20 - < 30,… para construir un histograma con
la información original. Utilice intervalos 1.1 - < 1.2, 1.2 - < 1.3,… para hacer lo
mismo con la información transformada. ¿Cuál es el efecto de la transformación?
5434 4948 4521 4570 4990 5702 5241 5112 5015 4659 4806
4637 5670 4381 4280 5043 4886 4599 5288 5299 4848 5378
5260 5055 5828 5218 4859 4780 5027 5008 4609 4772 5133
5095 4618 4848 5089 5518 5333 5164 5342 5069 4755 4925
5001 4803 4951 5679 5256 5207 5621 4918 5138 4786 4500
5461 5049 4974 4592 4173 5296 4965 5170 4740 5173 4568
5653 5078 4900 4968 5248 5245 4723 5275 5419 5205 4452
5227 5555 5388 5498 4681 5076 4774 4931 4493 5309 5582
4308 4823 4417 5364 5640 5069 5188 5764 5273 5042 5189
4986
Solución
Distribución de Frecuencias
55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3
8 58 - No tiene simetría
9 02368 - Presenta dispersión
10 57 - El valor representativo es el 9
11 0 - Presenta un hueco
12 12 - Un posible valor atípico es el 15.6
13 27
14
15 6
c.
100
a.
- Tiene bastante
simetría, poca dispersión es unimodal
n
b. p N = Número total de datos, por tanto la proporción de observaciones
N
menores
13
que 85 es p 0.0769 o 7.69%
169
153
la proporción de observaciones menores que 95 es: p 0.9053 o 90.53%
169
103
c. Aproximadamente p 0.6094 o 60.94%
169
29. La carga de fuego (MJ/m2) es la energía calorífica que puede liberarse por metro
cuadrado de área de piso por combustión del contenido y de la estructura misma de
un recinto. El artículo “Fire Loads in Office Buildings” (J. of Structural Engr., 1997,
365 – 368) presenta los siguientes porcentajes acumulados, leídos en un gráfica, de
cargas de fuego en un muestra de 388 recintos:
a.
30. El período de almacén (vida de anaquel) de una película fotográfica de alta velocidad
está siendo investigada por un fabricante. Se dispone de los siguientes datos:
El histograma no tiene simetría, su valor representativo esta entre 125 y 130 y presenta
una ligera dispersión.
6.3 6.4 7.7 8.4 8.5 8.8 8.9 9.0 9.1 10.0 10.1 10.2
10.6 10.6 10.7 10.7 10.8 10.9 11.1 11.2 11.2 11.4 11.9 11.9
12.2 13.1
32. Considere los siguientes datos sobre tiempo activo de reparación (en horas) para una
muestra n = 46 receptores de comunicaciones en aeronaves:
0.2 0.3 0.5 0.5 0.5 0.6 0.6 0.7 0.7 0.7 0.8 0.8 0.8
1.0 1.0 1.0 1.0 1.1 1.3 1.5 1.5 1.5 1.5 2.0 2.0 2.2
2.5 2.7 3.0 3.0 3.3 3.3 4.0 4.0 4.5 4.7 5.0 5.4 5.4
7.0 7.5 8.8 9.0 10.3 22.0 24.5
Construya lo siguiente:
a. Un diagrama de tallo y hoja en la que los dos valores más grandes se representarán
en forma separada en un renglón llamado HI.
b. Un histograma basado en seis intervalos de clase con cero como límite inferior del
primer intervalo y longitudes de intervalo de 2, 2, 2, 4, 10 y 10, respectivamente.
Solución:
0 2355566777888
1 0000135555
2 00257
3 0033
4 0057
5 044
6
7 05
8 8
9 0
10 3
HI 05
33. Se determinó el índice de claridad para los cielos sobre Bagdad para cada uno de los
365 días durante un determinado año (“Contribution to the Study of the Solar
105
clase Frecuencia
0.15-< 0.25 8
0.25- < 0.35 14
0.35 - < 0.45 28
0.45 - < 0.50 24
0.50 - < 0.55 39
0.55 -< 0.60 51
0.60 - < 0.65 106
0.65 - < 0.70 84
0.70 - < 0.75 11
Frecuencia
clase
relativa
0.15-< 0.25 0.022
0.25- < 0.35 0.038
0.35 - < 0.45 0.077
0.45 - < 0.50 0.066
0.50 - < 0.55 0.107
0.55 -< 0.60 0.140
0.60 - < 0.65 0.290
0.65 - < 0.70 0.230
0.70 - < 0.75 0.030
106
b. La proporción de días nublados son los que tienen un índice de claridad menor que
0.35
8 4
Entonces p 0.06 o p = 6%
365
c. Los días con claridad son aquellos de por lo menos un índice de 0.65, entonces
84 11
p 0.26 o p = 26%
365
34. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture,
2002: 301- 305) aparecen las observaciones siguientes, listadas en orden creciente,
del tiempo de vida del taladro (número de agujeros que maquina un taladro antes de
romperse) cuando se hacen agujeros en cierta aleación de latón.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
Frecuencia
Intervalos Frecuencia
relativa
0 x < 80 20 0.40
80 x < 160 20 0.40
160 x < 240 4 0.08
240 x < 320 3 0.06
320 x < 400 2 0.04
400 x < 480 0 0.00
480 x < 540 1 0.02
Totales 50 1.00
Un valor representativo está entre 50 y 100, hay mucha variabilidad en los datos y
35. Construya un diagrama de puntos y dígitos para la serie de tiempo adjunta. Los datos
son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la
radiación solar promedio en la banda de 385 a 530 nm como porcentaje de la radiación
total (“Global Energy in the Different Spectral Bands at Dhanhran, Saudi Arabia”, J.
Solar Energy Engr. 1991: 290 294). Comente acerca de las características de los datos.
20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9
Solución:
Presenta cierta simetría, el valor representativo está entre 19 y 19.5 no parece haber
valores atípicos.
108
36. Un diagrama de Pareto es una variación de un histograma con datos categóricos que
resultan de un estudio de control de calidad. Cada categoría representa un tipo
diferente de producto que incumple las especificaciones o problema de producción.
Las categorías están ordenadas de modo que las que tienen la frecuencia más grande
aparezcan en el extremo izquierdo, luego la categoría con la segunda frecuencia mas
grande y así sucesivamente. Suponga que se obtiene la siguiente información sobre
discordancia en paquetes de circuitos componentes con fallas, 126; componente
incorrecto, 210; soldadura insuficiente, 67; exceso de soldadura, 54; componente
faltante, 131. Construya un diagrama de Pareto.
Solución
109109ESTIMACION PUNTUAL
1. Se dan siguientes datos de resistencia a la flexión (en MPa) de vigas de concreto de cierto tipo
5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0
8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7
a. Calcule un estimado puntual del valor medio de resistencia para la población conceptual
de todas las vigas fabricadas de esta forma y diga que estimador usó. (Sugerencia: xi =
219.8).
b. Calcule un estimador puntual del valor de la resistencia que separa al 50% más débil de las
vigas, del 50% más fuerte y diga que estimador usó
c. Calcule e interprete un estimado puntual de la desviación estándar poblacional . ¿Qué
estimador usó? (Sugerencia: xi2 = 1860.94).
d. Calcule un estimado puntual de la proporción de las vigas cuya resistencia a la flexión es
mayor que 10 MPa. (Sugerencia: imagine que una observación es un “éxito” si es mayor
de 10).
e. Calcule un estimado puntual del coeficiente poblacional de variación, / y diga que
estimador usó.
Solución:
a. Usando la media muestral x para estimar la media poblacional , tenemos:
219.8
ˆ x 8.14074
27
b. En este caso se puede usar la mediana muestral y se obtiene: x 7.7
c. Usando la desviación estándar de la muestra:
s
2 xi2 ( xi ) 2 / n
, s2
1860.94 (219.8)2 / 27
2.754
n 1 26
s 2.754 1.659, ˆ s 1.659
d. Con los datos dados, se observa que el número de observaciones mayores que 10 es x = 4,
por lo que podemos usar como estimador de la proporción;
x 4
pˆ , pˆ 0.1481
n 27
e. Para estimar el coeficiente poblacional podemos usar la desviación estándar muestral y la
media muestral y tenemos:
ˆ s 1.659
0.2038
x 8.14074
T T H T C T T S C H
S S T H C T T T H T
b. Estime la verdadera proporción de todos los estudiantes que tengan calculadora Texas
Instruments.
c. Algunas calculadoras fabricadas por Hewlett-Packard utilizan lógica polaca inversa
(ningún otro fabricante produce calculadoras de ese tipo). Tres de cuatro calculadoras HP
en la muestra fueron de ese tipo. Estime la proporción de todos los estudiantes que poseen
calculadora sin lógica polaca inversa.
Solución:
a. Se observa que en la muestra hay 10 estudiantes con calculadora Texas, el estimador será:
x 10
pˆ , pˆ 0.50
n 20
110
b. El número de estudiantes que no poseen calculadora con lógica polaca inversa son 17, ya
que sólo tres la poseen, entonces esta proporción la podemos estimar como:
x 17
pˆ , pˆ 0.85
n 20
4. El artículo de donde se tomaron los datos del ejercicio 1 también mostraba las siguientes
observaciones de resistencia de los cilindros:
6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
Antes de obtener datos, se representan las resistencias de las vigas por X1,…, Xm y las de los
cilindros por Y1,…, Yn. Suponga que las Xi forman una muestra aleatoria de la distribución con
111
media μ1 y desviación estándar σ1, y las Yi forman una muestra aleatoria, independiente de las
Xi, de otra distribución cuya media es μ2 y desviación estándar σ2.
a. Aplique las reglas del valor esperado para demostrar que X Y es un estimador
insesgado de μ1 – μ2 . Calcule el estimado para los datos.
b. Aplique las reglas de la varianza y la desviación estándar (error estándar) del estimador
del inciso a), y a continuación calcule el error estándar estimado.
c. Calcule un estimado puntual de la relación σ1 /σ2 de las dos desviaciones estándar.
d. Suponga que se seleccionan una sola viga y un solo cilindro. Calcule un estimado puntual
de la varianza de la diferencia X – Y entre la resistencia de las vigas y la de los cilindros.
Solución:
s1 1.66
c. 0.7890
s2 2.104
d.
V ( X Y ) V ( X ) V (Y ) s12 s22
V ( X Y ) 1.662 2.1042 7.1824
Factura
1 2 3 4 5
Valor en libros 300 720 526 200 127
Valor auditado 300 520 526 200 157
Error 0 200 0 0 - 30
112
Sea
Y valor medio muestral en libros
X valor medio muestral auditado
D error medio muestral
Se han propuesto diferentes estadísticas para estimar el valor total auditado (correcto). Estos
incluyen:
Estadística de media por unidad = N X
Estadística de diferencia = T N D
Estadística de razón = T ( X Y )
Si N = 5000 y T = 1 761 300, calcule las tres estimaciones puntuales correspondientes. (El
artículo “Statistical Models and Analysis in Auditing”, Statistical Science, 1982: 2 -33, discute
las propiedades de estos estimadores.)
Solución:
Con N = 5000, T = 1 761 300, y 374.6 , x 340.6 y d 34 llamemos:
x
ˆ1 Nx , ˆ2 T Nd , ˆ3 T
y
ˆ1 (5000)(340.6) 1703000 ˆ1 1703000
ˆ2 1761300 (5000)(34) 1591300 ˆ2 1591300
340.6
ˆ3 1761300 1601438.281 ˆ3 1601438.281
374.6
6. a. Se selecciona una muestra aleatoria de 10 casas de una zona en particular, cada una tiene
calefacción con gas natural y se determina la cantidad de gas (termias, es decir, 25200 calorías)
empleadas durante el mes de enero para cada casa. Las observaciones resultantes son las
siguientes: 103, 156, 118, 89, 125, 147, 122, 109, 138, 99. Represente con el consumo
promedio de gas durante enero por todas las casas de la zona. Calcule una estimación puntual
de .
b. Suponga que 10 000 casas de esta zona utilizan gas natural para la calefacción. Represente
con la cantidad de gas total empleada por todas estas casas durante enero. Estime
mediante los datos del inciso (a). ¿Cuál estimador usó en el cálculo de su estimación?
c. Utilice los datos del inciso (a) para estimar p, la proporción de todas las casas que utilizaron
por lo menos 100 termias.
d. De una estimación puntual de la mediana de la población del consumo (el valor intermedio
de la población de todas las casas) con base en la muestra del inciso (a). ¿Cuál estimador
usó?
Solución:
a. ˆ x
xi 1206 120.6 ˆ 120.6
n 10
b. ˆ nx 10000(120.6) 1206000
c. Los que utilizan por lo menos 100 termias son 8, así que estimando la proporción tenemos:
8
pˆ 0.80
10
d. Ordenando los valores en orden ascendente tenemos:
89 99 103 109 118 122 125 138 147 156
118 122
El estimador de la mediana puede ser la mediana muestral, esto es: ˆ 120
2
8. Se examina cada pieza de 150 recién fabricadas y se registra el número de rayones por pieza
(se supone que las piezas no deben tener rayones) y resultan los siguientes datos:
Número de
0 1 2 3 4 5 6 7
rayones por pieza
Frecuencia
18 37 42 30 13 7 2 1
observada
Sea X = número de rayones en una pieza seleccionada al azar y suponga que X tiene una
distribución de Poisson con parámetro .
a. Encuentre un estimador insesgado de y calcule la estimación para los datos anteriores.
[Sugerencia: E(X) = para X de Poisson, por lo que E ( X ) ]
b. ¿Cuál es la desviación estándar (error estándar) de su estimador? Calcule el error estándar
estimado. (Sugerencia: X2 para X de Poisson.)
Solución:
a. Ya que E ( X ) E( X ) , entonces X es un estimador insesgado para el parámetro de
Poisson . Calculando la media de los datos tenemos:
x
fi ( xi ) 317 2.113 ˆ 2.1143
fi 150
b. Para el error estándar tenemos que ˆ V (ˆ) , en este caso:
X así que el estimado del error estándar de es:
n
ˆ 2.113
ˆ 0.1187
n 150
10. Con una larga varilla de longitud se va a trazar una gráfica cuadrada en la cual la longitud
de cada lado es . Por consiguiente el área de la gráfica será 2. Sin embargo, no se conoce el
valor de así que se decide hacer n mediciones independientes X1 , X 2 ..., X n de la longitud.
Suponga que cada Xi tiene una media (mediciones insesgadas) y varianza 2.
a. Determine que X 2 no es un estimador insesgado de 2. [Sugerencia: con cualquier variable
aleatoria Y, E (Y 2 ) V (Y ) E (Y ) . Aplique ésta con Y X .]
2
b. ¿Para que valor del estimador X 2 kS 2 , k es insesgado para 2? [Sugerencia: calcule
E ( X 2 kS 2 ) ]
Solución:
a. Usando la sugerencia, tenemos:
2 2
E ( X 2 ) V ( X ) E ( X ) 2 , se observa que el estimador X 2 tiende a
n
2
sobrevalorar a 2 por la presencia del término , por tanto no es un estimador insesgado.
n
b. Aplicando las reglas del valor esperado, tenemos:
2 1
E ( X 2 kS 2 ) E ( X 2 ) kE ( S 2 ) 2 k 2 , así con k tenemos
n n
E ( X 2 kS 2 ) 2
115
11. De n1 fumadores seleccionados al azar, X1 fuman cigarrillos con filtro, mientras que de n2
fumadoras seleccionadas al azar, X2 fuman cigarrillos con filtro. Sean p1 y p2 las probabilidades
de que un varón y una mujer seleccionados al azar fumen, respectivamente, cigarrillos con
filtro.
a. Demuestre que X1 / n1 X 2 / n2 es un estimador insesgado de p1 p2 . [Sugerencia:
E ( X i ) npi con i = 1, 2.]
b. ¿Cuál es el error estándar del estimador en el inciso (a)?
c. ¿Cómo utilizaría los valores x1 y x2 para estimar el error estándar del estimador?
d. Si n1 = n2 = 200, x1 = 127 y x2 = 176, use el estimador del inciso (a) para obtener una
estimación de p1 p2 .
e. Use el resultado del inciso (c) y los datos del inciso (d) para estimar el error estándar del
estimador.
Solución:
a.
X X 1 1 1 1
E 1 2 E ( X 1 ) E ( X 2 ) n1 p1 n2 p2 p1 p2
n1 n2 n1 n2 n1 n2
X X
E 1 2 p1 p2
n1 n2
b.
2 2
X X X X 1 1 1 1
V 1 2 V 1 V 2 V ( X 1 ) V ( X 2 ) 2 (n1 p1q1 ) 2 (n2 p2 q2 )
n1 n2 n1 n2 n1 n2 n1 n2
p1q1 p2 q2 p1q1 p2 q2
p1 p2
n1 n2 n1 n2
c.
x1 x2
Con pˆ1 , qˆ1 1 pˆ1 , pˆ 2 , qˆ2 1 pˆ 2 , el error estándar del estimador es :
n1 n2
pˆ1qˆ1 pˆ 2 qˆ2
p1 p2
n1 n2
d. Con n1 = n2 = 200, x1= 127 y x2 = 176
127 176
pˆ1 pˆ 2 0.635 0.880 0.245
200 200
e.
pˆ1qˆ1 pˆ 2 qˆ2 (0.635)(0.365) (0.880)(0.120)
p1 p2 0.041 p1 p2 0.041
n1 n2 200 200
12. Suponga que un tipo de fertilizante rinde 1 por acre con una varianza 2, mientras que el
rendimiento esperado de un segundo tipo de fertilizante es 2, con la misma varianza 2. Sean
S12 y S22 las varianzas muestrales de los rendimientos basadas en tamaños muestrales n1 y n2,
respectivamente, de los dos fertilizantes. Demuestre que el estimador combinado
n1 1 S12 n2 1 S 22 n1 1 n2 1
E
E ( S12 ) E ( S 22 )
n1 n2 2 n1 n2 2 n1 n2 2
n1 1 2 n2 1 2 n1 1 n2 1 2 2
n1 n2 2 n1 n2 2 n1 n2 2
n 1 S12 n2 1 S 22
E 1
2
n n 2
1 2
f ( x; ) 0.5(1 x) 1 x 1
14. Si X1 , X 2 ..., X n representa una muestra aleatoria tomada de una distribución de Rayleigh con
función de densidad de probabilidad
x /(2 )
f ( x; )
2
e x x0
a. Se puede demostrar que E ( X 2 ) 2 . Use este hecho para construir un estimador
n
insesgado de basado en X i 1
i
2
(y use las reglas del valor esperado para demostrar que es
insesgado).
b. Calcule a partir de las siguientes n = 10 observaciones de esfuerzo vibratorio de un aspa
de turbina en condiciones específicas:
16.88 10.23 4.59 6.66 13.68 14.23 19.87 9.40 6.51 10.95
Solución:
X2
a. E ( X ) 2 , esto implica que E
2 ˆ
. Considerando
X i2
, entonces tenemos
2 2n
que:
X i2 1 2 2n
2n 2n i
E (ˆ) E E
1
2n
X 2 E ( X i2 )
2n 2n
Con esto se demuestra que ˆ es un estimador insesgado para .
15. Suponga que el crecimiento promedio verdadero de un tipo de planta durante un período de
1 año es idéntico al de un segundo tipo, aunque la varianza del crecimiento del primer tipo es
117
2, en tanto que para el segundo es 42. Sean X1 , X 2 ..., X m m observaciones de crecimiento
independientes del primer tipo [por consiguiente E ( X i ) , V ( X i ) 2 ], y sean Y1 , Y2 ..., Yn
n observaciones de crecimiento independientes del primer tipo [por consiguiente
E (Yi ) , V (Yi ) 4 2 ].
a. Demuestre que para cualquier entre 0 y 1, el estimador ˆ X (1 )Y es insesgado
para .
b. Con m y n fijas, calcule V ( ˆ ) y luego determine el valor de que reduzca al mínimo
V ( ˆ ) . [Sugerencia: diferencie V ( ˆ ) con respecto a .]
Solución:
a. E X (1 )Y E ( X ) (1 ) E(Y ) (1 )
b.
2 2
4(1 )2 2 2 4(1 )2
V X (1 )Y 2V ( X ) (1 )2 V (Y ) , V ( ˆ )
m n m n
Para hallar el mínimo de V ( ˆ ) , derivemos con respecto a la expresión e igualemos a cero
d 2 2 8(1 ) 2
V (ˆ ) 0, despejando a 2n 8m 8m
d m n
4m
(8m 2n) 8m
4m n
16. Anteriormente se definió la variable aleatoria binomial negativa como el número de fallas que
ocurren antes del r – ésimo éxito en una secuencia de ensayos con éxitos y fallos
independientes e idénticos. La función de masa de probabilidad (fmp) de X es
x r 1 r
nb( x; r , p) p (1 p)
x
x 0,1,2,...
x
r 1
a. Suponga que r 2. Demuestre que pˆ es un estimador insesgado de p.
X r 1
[Sugerencia: Escriba E ( pˆ ) y elimine x + r – 1 dentro de la suma.]
b. Un reportero desea entrevistar a cinco individuos que apoyan a un candidato y comienzan
preguntándoles si (S) o no (F) apoyan al candidato. Si la secuencia de respuestas es
SFFSFFFSSS, estime p = la proporción verdadera que apoya al candidato.
Solución:
a.
r 1 x r 1 r
r 1 ( x r 1)!
E ( pˆ ) x p (1 p)
x
p r (1 p) x
x 0 x r 1 x 0 x r 1 x !( x r 1 x )!
r 1
( x r 2)! r
( x r 2)! r 1
x r 2
p (1 p) x p p (1 p) x p p r 1 (1 p) x
x 0 x !( r 2)! x 0 x !( r 2)! x 0 x
E ( pˆ ) p bn( x; r 1, p) p
x 0
b. Para la secuencia de resultados dada, tenemos que x = 5 y r = 5, estimando el valor de p
5 1 4
pˆ 0.444 pˆ 0.444
5 5 1 9
118
17. Sean X1 , X 2 ..., X n una muestra aleatoria de densidad de probabilidad f(x) que es simétrica
respecto a , de modo que X es un estimador insesgado de . Si n es grande se puede
demostrar que V ( X ) 1/ 4n f ( ) .
2
a. Compara V ( X ) con V ( X ) cuando la distribución subyacente es normal.
b. Cuando la función de densidad de probabilidad subyacente es de Cauchy, V ( X ) , por
lo tanto X es un estimador terrible. ¿Cuál es V ( X ) en este caso cuando n es grande?
Solución:
a. Para una distribución normal, la función de densidad es:
1 ( x )2 / 2 2
f ( x; , ) e así que si x , tendremos que:
2
1 1 2 2 2
f ( ; , ) y por tanto sustituyendo
2 4n f ( )
2
4n 2 n
Ya que 1, V ( X ) V ( X )
2
b. La función de distribución de Cauchy es:
1
f ( x) x , esta es una distribución simétrica con respecto
1 ( x )2
a , tiene forma de campana pero con colas mucho más gruesas que la distribución normal,
así
f ( )
1
y como V ( X ) 1/ 4n f ( ) , entonces V ( X )
2 2
4n
INTERVALOS DE CONFIANZA
x z / 2 , x z / 2 o bien x z / 2 , entonces tenemos que z / 2 2.81
n n n
Esto implica que:
z / 2 1 (2.81) 1 0.9975 0.0025 así = 0.005 y el nivel de confianza es
100(1 0.005) = 95%
b. z / 2 1.44 esto implica que:
z / 2 1 (1.44) 1 0.9251 0.0749 así = 0.1498 y el nivel de confianza es
100(1 0.1498) = 85.02% 85%
2. Cada uno de los siguientes es un intervalo de confianza de μ = promedio real (es decir media
poblacional) de la frecuencia de resonancia, en Hz, de todas las raquetas de tenis de cierto
tipo:
3. Suponga que se selecciona una muestra aleatoria de 50 botellas de una marca de jarabe para
la tos, en particular, y que se determina el contenido de alcohol de cada frasco. Sea μ el
contenido promedio de alcohol en la población de todos los frascos de la marca que se estudia.
Suponga que el intervalo de confianza de 95% resultante es (7.8, 9.4).
a. Un intervalo de confianza de 90% calculado para la misma muestra, ¿sería más angosto o
más ancho que el anterior? Explique su razonamiento.
b. Examine la siguiente afirmación: hay 95% de probabilidades de que μ esté entre 7.8 y 9.4.
¿Es correcta esta afirmación? ¿Por qué sí o por qué no?
c. Examine la siguiente afirmación: podemos confiar mucho en que 95% de todos los frascos
de esta marca de jarabe para la tos tengan un contenido de alcohol entre 7.8 y 9.4. ¿Es
correcta? ¿Por qué sí o por qué no?
d. Examine la siguiente afirmación: Si el proceso de seleccionar una muestra de tamaño 50 y
después calcular el intervalo de confianza de 95% correspondiente se repite 100 veces, 95
de los intervalos que resulten incluirán a μ. ¿Es correcta esta afirmación? ¿Por qué sí o por
qué no?
Solución:
a. Sería mas angosto ya que el nivel de confianza es menor, además el valor crítico de z para
un nivel de confianza de 90% es 1.645, menor que el valor del nivel de confianza de 95%
que es 1.96, entonces éste produce un intervalo mas ancho.
b. No es correcta esta afirmación. Porque una vez creado el intervalo de una muestra, la media
puede estar contenida o no en él. El 95% de confianza está en el procedimiento general,
para muestreo repetitivo.
para una velocidad de 1500 rpm. Suponga que la pérdida de carga está normalmente
distribuida con σ = 3.0.
a. Calcule un IC de 95% para μ cuando n = 25 y x = 58.3
b. Calcule un IC de 95% para μ cuando n = 100 y x = 58.3
c. Calcule un IC de 99% para μ cuando n = 100 y x = 58.3
d. Calcule un IC de 82% para μ cuando n = 100 y x = 58.3
e. ¿Qué tan grande debe ser n si la longitud del intervalo de 99% para μ debe ser 1.0?
Solución.
a. x z / 2
n
1 = 0.95 = 1 – 0.95 = 0.05 /2 = 0.025 z / 2 1.96
3.0
58.3 1.96 58.3 1.176 (57.124, 59.476)
25
b. 1 = 0.95 = 1 – 0.95 = 0.05 /2 = 0.025 z / 2 1.96
3.0
58.3 1.96 58.3 0.588 (57.712, 58.888)
100
c. 1 = 0.99 = 1 – 0.99 = 0.01 /2 = 0.005 z / 2 2.575
3.0
58.3 2.575 58.3 0.7725 (57.527, 59.073)
100
d. 1 = 0.82 = 1 – 0.82 = 0.18 /2 = 0.09 z / 2 1.34
3.0
58.3 1.34 58.3 0.402 (57.9, 58.7)
100
2 2
2(2.575)(3.0)
e. n 2 z / 2 , n 238.7 n 239
w 1.0
5. Suponga que la porosidad al helio (en porcentaje) de muestras de carbón, tomadas de cualquier
veta en particular, está normalmente distribuida con una desviación estándar verdadera de
0.75.
a. Calcule un IC de 95% para el verdadero promedio de la porosidad de cierta veta, si el
promedio de porosidad de 20 especimenes de la veta fue 4.85.
b. Calcule un IC de 98% para el verdadero promedio de la porosidad de otra veta, basado en
16 especímenes con un promedio de porosidad muestral de 4.56.
c. ¿Qué tan grande debe ser el tamaño muestral si la longitud del intervalo de 95% es de 0.40?
Solución:
a. x z 2 , 1 0.95, 0.05, 2 0.025, z 2 1.96
n
0.75
4.85 1.96 4.85 0.329, entonces el intervalo será: (4.521,5.179)
20
b. x z 2 , 1 0.98, 0.02, 2 0.01, z 2 2.33
n
0.75
4.56 2.33 4.56 0.4368, entonces el intervalo será: (4.123,4.997)
16
2 2
2(1.96)(0.75)
c. n 2 z 2 , n 54, entonces n 54
w 0.40
121
6. Con base en pruebas detalladas, se sabe que el límite elástico (punto de cedencia) de
determinado tipo de varilla de acero de refuerzo tiene una distribución normal con σ = 100.
Se ha modificado un poco la composición del acero, pero se cree que la modificación no ha
afectado ni la normalidad ni el valor de σ.
a. Suponiendo que así sea, si una muestra de 25 varillas modificadas dio como resultado un
punto de cedencia con promedio muestral de 8439 lb., calcule un intervalo de confianza de
90% para el punto real promedio de cedencia de la varilla modificada.
b. ¿Cómo modificaría el intervalo del inciso a) para obtener un nivel de confianza de 92%?
Solución:
a. x z 2 , 1 0.90, 0.10, 2 0.05, z 2 1.645
n
100
8439 1.645 8439 32.9, entonces el intervalo será: (8406.1,8471.9)
25
b. x z 2 , 1 0.92, 0.08, 2 0.04, z 2 1.75
n
100
8439 1.75 8439 35, entonces el intervalo será: (8404,8474)
25
Para un nivel de confianza mayor, aumenta la longitud del intervalo
7. ¿Cuánto debe aumentar el tamaño muestral n si la longitud del IC (ec. 7.5) debe reducirse a
x z / 2 , x z / 2 (7.5)
n n
a la mitad? Si el tamaño muestral aumenta en un factor de 25, ¿Qué efecto tendrá esto en la
longitud del intervalo? Justifique sus afirmaciones.
Solución:
Si L = 2 z 2 y se incrementa el tamaño de la muestra por un factor de 4, la longitud es
n
1 L
L ' 2 z 2 2 z 2 , entonces se obtiene la longitud deseada si se
4n n 2 2
aumenta n cuatro veces.
L
Si n’ = 25n, entonces L ' , por lo que la longitud decreció por un factor de 5
5
X
P z1 z 2 1
/ n
a. Utilice esta ecuación para obtener una expresión mas general para un IC de 100(1-α)% para
µ, del cual el intervalo (7.5) es un caso especial.
b. Sea α = 0.05 y α1 = α / 4, α2 = 3 α /4. ¿El resultado es un intervalo más corto o más largo
que el intervalo (7.5)?
Solución:
a. Con probabilidad 1
X
z1 z2 , estas desigualdades pueden manipularse para obtener
/ n
122
z1 X z2 , X z1 X z2
n n n n
X z1 X z 2 , X z 2 X z1
n n n n
Por lo que el intervalo será
X z2 , X z1
n n
b. Con = 0.05, el intervalo es de 95% y tiene longitud 3.92 , mientras este intervalo
n
tiene longitud
( z1 z2 ) , con 0.05, 1 / 4, 2 3 / 4
n
z1 z0.0125 2.24 z 2 z0.0375 1.78 la longitud es: (2.24 1.78) 4.02
n n
Este intervalo es mayor
b. x z ,
n
c. , x z . Del problema 4(a) x 58.3, 3.0, n 25
n
3.0
58.3 2.33 58.3 1.398 59.698 el intervalo es ( , 59.698)
25
10. Una muestra aleatoria de n = 15 bombas de calor, de cierto tipo, produjeron las siguientes
observaciones en duración (en años):
2.0 1.3 6.0 1.9 5.1 0.4 1.0 5.3 15.7 0.7 4.8 0.9
12.2 5.3 0.6
b. ¿Cómo debe modificarse el intervalo del inciso (a) para alcanzar un nivel de confianza de
99%?
c. ¿Cuál es un intervalo de confianza de 95% para la desviación estándar de la distribución
de la duración? (Sugerencia: ¿Cuál es la desviación estándar de una variable aleatoria
exponencial?).
Solución:
a. Cuando la distribución de probabilidad es exponencial, si hacemos:
h( X1 , X 2 , X 3 ,..., X n ; ) 2 xi , se ha demostrado que está variable aleatoria tiene una
distribución de probabilidad ji cuadrada (2) con 2n grados de libertad, con esto cuando n
= 15 y v = 30 grados de libertad,, entonces el intervalo es:
P 2 / 2 2 xi 12 / 2 0.95
Consultando en tablas los valores de ji cuadrada para un nivel de confianza de 95%,
tenemos:
P 46.979 2 xi 16.971 0.95, despejando a
46.979 16.971 46.979 16.971
P 0.95, el intervalo es
2 x 2 xi
i 2 xi 2 xi
Con los datos dados
46.979 16.971
xi 63.2, el intervalo queda 2(63.2) 2(62.2) (0.37167 0.13642)
1
Para una distribución exponencial sabemos que , así el intervalo para la media queda:
1 1
, (2.69, 7.33)
0.37167 0.13642
b. Para un intervalo de 99%, solo cambian los valores de 2, esto es /2 = 0.005, así:
0.005
2
53.672, 0.995
2
13.787 , por tanto el intervalo queda:
53.672 13.787
(0.42462 0.10907)
2(63.2) 2(63.2)
1 1
, (2.355, 9.168)
0.42462 0.10907
1
c. Para una distribución exponencial V ( X ) , así que la desviación estándar es igual a la
2
media, por tanto el intervalo para es el mismo que para la media encontrado en el inciso
(a) (2.69, 7.33)
11. Considere los siguientes 1000 intervalos de confianza al 95% para µ que un consultor en
estadística obtendrá para varios clientes. Suponga que los conjuntos de datos sobre los que
están basados los intervalos se seleccionan de manera independiente entre sí. ¿Cuántos de
estos 1000 intervalos espera que capturen el valor correspondiente de µ? ¿Cuál es la
probabilidad de que entre 940 y 960 de estos intervalos contengan el valor correspondiente
de µ? (Sugerencia: sea Y = número entre los 1000 intervalos que contienen µ, ¿qué clase de
variable aleatoria es Y?).
Solución:
Atendiendo a la sugerencia, observamos que Y tiene una distribución binomial, por lo que
con n = 1000 y p = 0.95, tenemos que E(Y ) np 950 este es el valor esperado del número
de intervalos que capturan a y Y npq 1000(0.95)(0.05) 6.892
Usando una aproximación normal para la distribución binomial
124
1. Una muestra aleatoria de 110 relámpagos, en cierta región, tuvieron una duración de eco de
radar promedio muestral de 0.81s (“Lightning Strikes to an Airplane in a Thunderstorm”, J.
of Aircraft, 1984, pp. 607 – 611). Calcule un intervalo de confianza de 99% para el verdadero
promedio de duración de eco µ e interprete el intervalo resultante.
Solución:
Para muestras grandes podemos tomar la desviación estándar muestral, por tanto:
s
x z 2 , 1 0.99, 0.01, 2 0.005, z 2 2.58, x 0.81, s 0.34
n
0.34
0.81 2.58 0.81 0.083, entonces el intervalo será: (0.73,0.89)
110
x 654.16, s 164.43, n 50
s
x z 2 , 1 0.95, 0.05, 2 0.025, z 2 1.96
n
164.43
654.16 1.96 654.16 45.5777, entonces el intervalo será: (608.58,699.74)
50
2 2
s 2(1.96)(175)
b. n 2 z 2 , n 188.23, entonces n 188
w 50
4. El artículo “Evaluating Tunnel Kiln Performance”(Amer. Ceramic Soc. Bull., agosto de 1997,
pp. 59 – 63) contiene la siguiente información resumida de resistencia a la fractura, en MPa,
de n = 169 barras de cerámica quemadas en determinado horno: x 89.10 , s = 3.73.
a. Calcule un intervalo de confianza bilateral de la resistencia real promedio a la fractura con
un nivel de confianza del 95%. ¿Parece que se ha estimado con precisión esa resistencia?
b. Suponga que los investigadores creían a priori, que la desviación estándar de la población
era 4 MPa. Con ésta hipótesis, ¿de que tamaño se hubiera requerido una muestra para
estimar µ con 0.5 MPa de precisión y 95% de confianza?
Solución:
a.
x 89.10, s 3.73, n 169
s
x z 2 , 1 0.95, 0.05, 2 0.025, z 2 1.96
n
3.73
89.10 1.96 89.10 0.5624, entonces el intervalo será: (88.5376,89.6624)
169
Si, el intervalo es muy estrecho y parece bastante preciso.
b. En este caso para una precisión de 0.5 MPa se requiere que el ancho del intervalo sea de
1.0 MPa.
2 2
2(1.96)(4)
n 2 z 2 , n 245.86, entonces n 246
w 1.0
5. Determine el nivel de confianza de cada una de las siguientes cotas unilaterales de confianza
para la muestra grande:
c. Cota superior: x 0.84s / n
d. Cota inferior: x 2.05s / n
e. Cota superior: x 0.67 s / n
Solución;
a. El límite de confianza superior de una muestra grande para es:
s
x z , entonces z 0.84, (0.84) 0.7995 0.80 , así que el nivel de
n
confianza es 80%
b. El límite de confianza inferior de una muestra grande para es:
s
x z , entonces z 2.05, (2.05) 0.9798 0.98 , así que el nivel de
n
confianza es 98 %
c. Aquí z 0.67, (0.67) 0.7486 0.75 , así que el nivel de confianza es 75 %
6. El tiempo entre carga y vaciado de un horno de hogar abierto, para acero al carbón, se
determinó para cada carga en una muestra de tamaño 46 y el resultado fue el tiempo promedio
126
muestral de 382.1 y desviación estándar muestral de 31.5. Calcule una cota superior de
confianza de 95% para el tiempo real promedio de carga y vaciado.
Solución:
El límite de confianza superior de una muestra grande para es:
s
x z , entonces para el nivel de confianza es 95 % z 1.645 , sustituyendo
n
s 31.5
x z 382.1 1.645 382.1 7.64 389.74 , la cota superior es 389.74
n 46
8. El artículo “Ultimate Load Capacities of Expansion Anchor Bolts” (J. of Energy Engr., 1993,
pp. 139 – 158) reporta el resumen de los siguientes datos, sobre resistencia al corte, para una
muestra de pernos de anclaje de 3/8 pulg: n = 78, x 4.25 kip y s = 1.30. Calcule una cota
inferior de confianza utilizando un nivel de 90% de confianza para la resistencia promedio real
al corte.
Solución:
Para n = 78, x 4.25 kip y s = 1.30
s
x z , 1 0.90, 0.10, z0.10 1.28
n
1.30
4.25 1.28 4.25 0.188 4.062, entonces la cota inferior es: 4.062
78
9. El artículo “Limited Yield Estimation for Visual Defect Sources”, (IEEE Trans. on
Semiconductor Manuf., 1997, pp. 17 – 23) reporta que en un estudio de determinado proceso
de inspección de obleas, se examinaron con un sensor de inspección 356 troqueles, de los
cuales 201 pasaron la prueba. Suponga que el proceso es estable, calcule un intervalo bilateral
de confianza de 95% para la proporción de las matrices que pasaron la prueba.
Solución:
201
El estimado de la proporción es pˆ 0.5646 y qˆ 0.4354 . Para el nivel de confianza
356
de 95% z / 2 1.96
z2 / 2 ˆ ˆ z2
pq
pˆ z / 2
p 2n n 4n 2 sustituyendo los valores dados, se tiene
1 z2 / 2 n
(1.96)2 (0.5646)(0.4354) (1.96)2
0.5646 1.96
2(356) 356 4(356)2 0.5700 0.0518
p
(1.96)2 1.01079
1
356
127
10. La Associated Press (16 de diciembre de 1991) informó que en una muestra de 507
estadounidenses adultos, sólo 142 describieron de manera correcta la Ley de derechos y las
diez primeras enmiendas de la Constitución de Estados Unidos. Calcule un intervalo bilateral
de confianza, con un nivel de 99 % de confianza para la proporción de todos los adultos
estadounidenses que pueden dar una descripción correcta de la Ley de derechos.
Solución:
142
El estimado de la proporción es pˆ 0.28 y qˆ 0.72 . Para el nivel de confianza de 99
507
% z / 2 2.58
z2 / 2 ˆ ˆ z2
pq
pˆ z / 2
p 2n n 4n 2 sustituyendo los valores dados, se tiene
1 z2 / 2 n
(2.58)2 (0.28)(0.72) (2.58)2
0.28 2.58
2(507) 507 4(507)2 0.2866 0.0519
p
(2.58)2 1.0131
1
507
El intervalo es (0.2317, 0.3341)
11. Se seleccionó una muestra aleatoria de 539, de cierta ciudad ubicada en el Medio Oeste
estadounidense. Se determinó que 133 de ellos poseían por lo menos un arma de fuego (en
“The Social Determinants of Gun Ownership: Self-Protection in an Urban Environment”,
Criminology, 1997, pp. 629 -640). Con un nivel de confianza de 95%, calcule la cota inferior
para la proporción de propietarios de armas de esa población.
Solución:
133
El estimado de la proporción es pˆ 0.2468 y qˆ 0.7532 . Para el nivel de confianza
539
de 95 % z z0.05 1.645
z2 ˆ ˆ z2
pq
pˆ z
p 2n n 4n 2 sustituyendo valores se tiene:
1 z2 n
(1.645) 2 (0.2468)(0.7532) (1.645) 2
0.2468 1.645
2(539) 539 4(539) 2 0.2493 0.0307
p 0.218
(1.645) 2 1.005
1
539
Por tanto la cota inferior es 0.218
12. Se seleccionó una muestra aleatoria de 487 mujeres no fumadoras de peso normal (índice de
masa corporal entre 19.8 y 26.0) que dieron a luz en un gran centro médico metropolitano
(“The Effects of Cigarette Smoking and Gestational Weigth Change of Birth Outcomes in
Obese and Normal Weigth Women”, Amer. J. of Public Health, 1997, pp. 591 -596). Se
determinó que en el 7.2% de esos nacimientos resultaron niños de bajo peso al nacer, con
menos de 2500g. Calcule una cota superior de confianza de 99% para la proporción de
nacimientos que dan como resultado niños de bajo peso al nacer.
Solución:
Para la cota superior con: pˆ 0.072, y una condición de frontera superior del 99%
1 0.99, 0.01, z0.01 2.33
128
z2 ˆ ˆ z2
pq
pˆ z
p 2n n 4n 2
1 z2 n
13. El artículo “An Evaluation of Football Helmets Under Impact Conditions” (Amer. J. Sports
Medicine, 1994, pp. 233 -237) reporta que cuando se sometió a cada casco de fútbol, de una
muestral aleatoria de 37 del tipo de suspensión, a cierta prueba de impacto, 24 mostraron
daños. Sea p la proporción de todos los cascos de este tipo que muestran daños al probarse de
la manera descrita.
a. Calcule un intervalo de confianza de 99% para p.
b. ¿Qué tamaño de muestra se requeriría para que el ancho de un intervalo de confianza del
99% fuera 0.10 a lo sumo, independientemente de p̂ ?
Solución:
24
El estimado de la proporción es pˆ 0.6486 y qˆ 0.3514 . Para el nivel de confianza de
37
99 % z / 2 2.58
z2 / 2 ˆ ˆ z2
pq
pˆ z / 2
p 2n n 4n 2 sustituyendo los valores dados, se tiene
1 z2 / 2 n
(2.58)2 (0.6486)(0.3514) (2.58)2
0.6486 2.58
2(37) 37 4(37)2 0.7386 0.2216
p 2
(2.58) 1.1799
1
37
El intervalo es (0.4382, 0.8138)
b. Para una proporción el cálculo del tamaño de la muestra se calcula de la expresión que
resulta de despejar n del intervalo del CI.
ˆ ˆ z 2 w2 4 z 4 pq
2 z 2 pq ˆ ˆ w2 ) w 2 z 4
ˆ ˆ ( pq
n
w2
Sin embargo cuando no se conoce p̂ , un método conservador es aprovechar el hecho de
ˆ ˆ pˆ (1 pˆ ) es un máximo cuando p̂ = 0.5, por consiguiente se usa p̂ = q̂ = 0.5 en
que pq
la expresión anterior, así tenemos:
2(2.58) 2 (0.25) (2.58) 2 (0.01) 4(2.58) 4 (0.25)(0.25 0.01) 0.01(2.58) 4
n
0.01
3.261636 3.3282
658.98 n 659
.01
15. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer que
proporción del electorado conoce la opinión de ella, respecto al uso de los fondos estatales
para pagar abortos.
a. ¿Qué tamaño de muestra se necesita si el intervalo de confianza de 95% para p debe tener
un ancho máximo de 0.10, independientemente de p?
b. Si la legisladora tiene fuertes motivos para creer que a lo sumo 23 del electorado conoce su
posición, ¿qué tamaño de muestra le recomendaría?
Solución:
a. Para una proporción el cálculo del tamaño de la muestra se calcula de la expresión que
resulta de despejar n del intervalo del CI.
ˆ ˆ z 2 w2 4 z 4 pq
2 z 2 pq ˆ ˆ w2 ) w 2 z 4
ˆ ˆ ( pq
n
w2
Sin embargo cuando no se conoce p̂ , un método conservador es aprovechar el hecho de
que pqˆ ˆ pˆ (1 pˆ ) es un máximo cuando p̂ = 0.5, por consiguiente se usa p̂ = q̂ = 0.5 en
la expresión anterior, así tenemos:
2(1.96) 2 (0.25) (1.96) 2 (0.01) 4(1.96) 4 (0.25)(0.25 0.01) 0.01(1.96) 4
n
0.01
1.8824 1.9208
380.32 n 380
.01
b. Ahora se conoce el valor de p̂ , así que usamos la expresión inicial y sustituyendo tenemos:
2(1.96)2 ( 13 32 ) (1.96)2 (0.01) 4(1.96)4 ( 13 32 )( 13 32 0.01) 0.01(1.96)4
n
0.01
1.667 1.71217
337.9 n 338
.01
16. El superintendente de un gran distrito escolar, que alguna vez cursó Probabilidad y Estadística,
piensa que el número de maestros ausentes en cierto día dado tiene una distribución de Poisson
con parámetro . Utilice los siguientes datos de ausencias para 50 días, a fin de obtener un
intervalo de confianza de muestras grandes para . [Sugerencia: la media y varianza de una
distribución de Poisson son iguales a , de modo que
X
Z tiene una distribución de probabilidad aproximadamente normal estándar. Ahora,
/n
proceda como en la obtención para p: construya un enunciado de probabilidad (con
probabilidad (1 - ) y despeje una de las desigualdades resultantes.]
Número de
0 1 2 3 4 5 6 7 8 9 10
ausencias
130
Frecuencia 1 4 8 10 8 7 5 3 2 1 1
Solución:
Considerando , un estimador de este será ˆ X y ˆ por tanto el estimador
n
X
de la desviación estándar es ˆˆ . Para muestras grandes el IC es entonces
n
x 203
x z / 2 . Calculando de la tabla xi 203, x 4.06 y un intervalo para es:
n 50
4.06
4.06 1.96 4.06 0.56, (3.50, 4.62)
50
2. Determine el valor crítico de t que contenga el área deseada de la curva t en cada uno de los
casos siguientes.
a. Area central = 0.95, gl (grados de libertad) = 10
b. Area central = 0.95, gl = 20
c. Area central = 0.99, gl = 20
d. Area central = 0.99, gl = 50
e. Area de la cola superior = 0.01, gl = 25
f. Area de la cola inferior = 0.025, gl = 5
Solución:
a. Para que el área central sea de 0.95, /2 = 0.025, así t 0.025, 10 = 2.228
b. Para que el área central sea de 0.95, /2 = 0.025, así t 0.025, 20 = 2.086
131
c. Para que el área central sea de 0.99, /2 = 0.005, así t 0.005, 20 = 2.845
d. Para que el área central sea de 0.95, /2 = 0.025, así t 0.005, 50 = 2.678
e. Para que el área de la cola superior sea de 0.01, = 0.01, así t 0.01, 25 = 2.485
f. Para que el área de la cola inferior sea de 0.025, = 0.025, así t 0.025, 5 = 2.571
3. Determine el valor crítico de t para un intervalo bilateral de confianza en cada uno de los
siguientes casos:
a. Nivel de confianza = 95%, gl = 10
b. Nivel de confianza = 95%, gl = 15
c. Nivel de confianza = 99%, gl = 15
d. Nivel de confianza = 99%, n = 5
e. Nivel de confianza = 98%, gl = 24
f. Nivel de confianza = 99%, n = 38
Solución:
a. Para un nivel de confianza de 95% y gl = 10, /2 = 0.025, por tanto t 0.025, 10 = 2.228
b. Para un nivel de confianza de 95% y gl = 15, /2 = 0.025, por tanto t 0.025, 15 = 2.131
c. Para un nivel de confianza de 99% y gl = 15, /2 = 0.005, por tanto t 0.005, 15 = 2.947
d. Para un nivel de confianza de 99% y gl = 4, /2 = 0.005, por tanto t 0.005, 4 = 4.604
e. Para un nivel de confianza de 98% y gl = 24, /2 = 0.01, por tanto t 0.01, 24 = 2.492
f. Para un nivel de confianza de 99% y gl = 37, /2 = 0.005, por tanto t 0.005, 37 = 2.712
4. Determine el valor crítico de t para una cota inferior o superior de confianza, para cada uno de
los casos del ejercicio 3.
Solución:
a. Para un nivel de confianza de 95% y gl = 10, = 0.05, por tanto t 0.05, 10 = 1.812
b. Para un nivel de confianza de 95% y gl = 15, = 0.05, por tanto t 0.05, 15 = 1.753
c. Para un nivel de confianza de 99% y gl = 15, = 0.01, por tanto t 0.01, 15 = 2.602
d. Para un nivel de confianza de 99% y gl = 4, = 0.01, por tanto t 0.01, 4 = 3.747
e. Para un nivel de confianza de 98% y gl = 24, = 0.02, por tanto t 0.02, 24 2.064
f. Para un nivel de confianza de 99% y gl = 37, = 0.01, por tanto t 0.01, 37 = 2.429
6. El artículo “Measuring and Understanding the Aging of Kraft Insulating Paper in Power
Transformers” (IEEE Electrical Insul. Mag., 1996, pp. 28 – 34) contenía las siguientes
informaciones sobre el grado de polimerización de muestras de papel donde la viscosidad
multiplicada por la concentración caía entre determinados límites intermedios.
418 421 421 422 425 427 431 434 437 439 446 447
448 453 454 463 465
132
Error
estándar
de la
N Media media Desv.Est. Mínimo Q1 Mediana Q3 Máximo
17 438.29 3.67 15.14 418.00 423.50 437.00 450.50 465.00
b. Basados en una gráfica de probabilidad normal parece razonable suponer que los datos de
la muestra provienen de una población con distribución normal.
c. En este caso par un nivel de confianza de 95%, /2 = 0.025 y t/ 2 , v = t0.025, 16 = 2.120
s 15.14
x t / 2, v 438.29 2.120 438.29 7.785 (430.505, 446.075)
n 17
Es factible que el valor de la media del grado de polimerización sea 440, no así 450 ya que
este valor está fuera del intervalo.
133
7. Con una muestra de 14 especimenes de uniones de cierto tipo, se obtuvo una resistencia
proporcional límite media muestral de 8.48 MPa y desviación estándar muestral de 0.79 MPa
(“Caracterization of Bearing Strength Factors in Pegged Timber Connections”, J. of
Structural Engr., 1997, pp. 326 – 332).
a. Calcule e interprete una cota inferior de 95% de confianza para el esfuerzo límite promedio
proporcional real de todas estas uniones. ¿Qué hipótesis, si es que formuló alguna, necesito
acerca de la distribución del esfuerzo límite proporcional?
b. Calcule e interprete una cota inferior de predicción del esfuerzo proporcional límite de una
sola unión de ese tipo.
Solución:
a. Con n = 14, x = 8.48 y s = 0.79, t0.05,13 1.771
s 0.79
x t ,n 1 , 8.48 (1.771) 8.48 0.374 8.11, la cota inferior es 8.11
n 14
Con un nivel de confianza de 95% el valor de la verdadera media del límite de resistencia
de estas uniones en el intervalo (8.11, ∞), esto significa que cuando este intervalo es
calculado uno tras otro, a la larga el 95% de estos incluyen la verdadera media del límite
proporcional de resistencia de una muestra de este tipo de juntas. Se supuso que la muestra
provenía de una población con distribución normal.
b. La cota inferior de predicción para un nivel de predicción de 95% está dada por:
1 1
x t ,n 1s 1 , 8.48 1.771(0.79) 1 8.48 1.448 7.032
n 14
la cota inferior es 7.031
Si esta frontera es calculada muestra por muestra a la larga 95% de estas proporcionarán
una cota inferior para valores futuros del esfuerzo proporcional límite de una muestra de
uniones de este tipo.
389 356 359 363 375 424 325 394 402 373 373 370 364 366 364 325
339 393 392 369 374 359 356 403 334 397
s 24.36
x t ,n 1
, 370.69 (1.708) 370.69 8.16 378.85, la cota superior es 378.85
n 26
b. La cota superior de predicción para un nivel de predicción de 95% esta dada por:
1 1
x t ,n 1s 1 , 370.69 1.708(24.36) 1 370.69 42.45 413.14,
n 26
la cota superior es 413.14
Se observa que está cota es mayor que la cota de confianza, debido a que el error de predicción
es, X X n1 , una diferencia entre dos variables aleatorias, mientras que el error de
135
estimación es, X , la diferencia entre una variable aleatoria y un valor fijo. El intervalo
de predicción es más amplio que el intervalo de confianza porque hay más variabilidad en el
error de predicción que en el error de estimación.
9. En un estudio para medir la destreza de las personas para caminar en línea recta (Can We
Really Walk Straight?” Amer. J. of Physical Antro. 1992, pp. 19 – 27) se muestran los datos
siguientes de la cadencia (pasos por segundo) para una muestra de n = 20 hombres saludables
seleccionados al azar.
Una gráfica de probabilidad normal respalda la hipótesis de que la distribución poblacional
de la cadencia es aproximadamente normal.
a. Calcule e interprete un intervalo de confianza de 95% para la cadencia promedio
poblacional.
b. Calcule e interprete un intervalo de predicción de 95% para la cadencia de un solo
individuo, seleccionado al azar entre esa población.
c. Calcule un intervalo que comprenda un mínimo de 99% de las cadencias en la distribución
poblacional usando un nivel de confianza de 95%.
11. Una tabulación más extensa de valores críticos t que la presentada, indica que para la
distribución t con 20 grados de libertad, las áreas a la derecha de los valores 0.687, 0.860 y
1.064 son 0.25, 0.20 y 0.15, respectivamente. ¿Cuál es el nivel de confianza para cada uno de
136
los siguientes tres intervalos de confianza, para la media de una población con distribución
normal? ¿Cuál de los tres intervalos recomendaría y por qué?
a. x 0.687s / 21, x 1.725s / 21
b. x 0.860s / 21, x 1.325s / 21
c. x 1.064s / 21, x 1.064s / 21
b. 0.1,25
2
c. .01,25
2
d. 0.005,25
2
e. 0.99,25
2
f. 0.995,25
2
137
2. Determine lo siguiente:
a. El 95to percentil de la distribución ji-cuadrada con v = 10.
b. El quinto percentil de distribución ji-cuadrada con v = 10.
c. P (10.98 2 36.78) donde 2 es una variable aleatoria ji – cuadrada con v = 22.
d. P (2 < 14.611 o 2 > 37.652) donde 2 es una variable aleatoria ji – cuadrada con v = 25.
69.5 71.9 72.6 73.1 73.3 73.5 75.5 75.7 75.8 76.1 76.2
76.2 77.0 77.9 78.1 79.6 79.7 79.9 80.1 82.2 83.7 93.7
Calcule un intervalo de confianza de 99% para la desviación estándar de la distribución de la
resistencia a la fractura. ¿Es válido este intervalo, cualquiera que sea la naturaleza de la
distribución? Explique.
Solución:
Estadísticas descriptivas:
Variable N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3
X 22 77.33 5.04 25.37 69.50 73.45 76.20 79.75
Variable Máximo
X 93.70
(n 1) S 2 (n 1) S 2
El intervalo para la varianza es: 2
2 / 2,n 1 12 / 2, n1
0.005,21
2
41.399, 0.995,21
2
8.033, s 2 25.37
21(25.37) 21(25.37)
2 , 12.869 2 66.322), (12.869,66.322)
41.399 8.033
La validez del intervalo requiere que la resistencia a la fractura este distribuida normalmente
o en último caso aproximadamente.
26.7 25.8 24.0 24.9 26.4 25.9 24.4 21.7 24.1 25.9
27.3 26.9 27.3 24.8 23.6
a. ¿Es posible que se haya seleccionado esta muestra de una población con distribución
normal?
b. Calcule una cota superior de confianza con nivel de 95% para la desviación estándar
poblacional de turbiedad.
138
6. El tiempo de reacción (TR) para un estímulo es el período que comienza con la presentación
de un estímulo y termina con el primer movimiento discernible de cierto tipo. El artículo
“Relationship of Reaction Time and Movement Time in a Gross Motor Skill” (Perceptual and
Motor Skills, 1973, pp. 453 – 454) reporta que el TR promedio muestral para 16 nadadores
experimentados, al arranque con un disparo, fue de 0.214 s y la desviación estándar muestral
fue 0.036 s.
a. Planteada cualquier suposición necesaria, determine un intervalo de confianza de 90% para
el verdadero promedio de tiempo de reacción de todos los nadadores experimentados.
b. Calcule una cota superior de confianza de 90% para la desviación estándar de la
distribución de tiempos de reacción.
c. Pronostique el tiempo de reacción para otro individuo, en una forma que muestre
información sobre la precisión y fiabilidad.
139
DISTRIBUCION NORMAL
1. Sea Z una va normal estándar, calcule las siguientes probabilidades, dibujando figuras
siempre que sea posible.
a. P(0 ≤ Z ≤ 2.17)
b. P(0 ≤ Z ≤ 1)
c. P(-2.50 ≤ Z ≤ 0)
d. P(- 2.50 ≤ Z ≤ 2.50)
e. P(Z ≤ 1.37)
f. P(- 1.75 ≤ Z)
g. P(- 1.50 ≤ Z ≤ 2)
h. P(1.37 ≤ Z ≤ 2.50)
i. P(1.50 ≤ Z)
j. P(Z ≤ 2.50)
Solución:
a. P(0 Z 2.17) (2.17) (0) 0.985 0.500 0.485
b. P(0 Z 1) (1) (0) 0.8413 0.500 0.3413
c, P(2.50 Z 0) (0) (2.50) 0.500 0.0062 0.4938
d. P(2.50 Z 2.50) (2.50) (2.50) 0.9938 0.0062 0.9876
e. P(Z 1.37) (1.37) 0.9147
f. P(1.75 Z ) 1 P(Z 1.75) 1 (1.75) 1 0.0401 0.9599
g. P(1.50 Z 2.00) (2.00) (1.50) 0.9772 0.0668 0.9104
h. P(1.37 Z 2.50) (2.50) (1.37) 0.9938 0.9147 0.0791
i. P(1.50 Z ) 1 P(Z 1.50) 1 (1.50) 1 0.9332 0.0668
j. P( Z 2.5) P(2.5 Z 2.5) (2.5) (2.5) 0.9876
(c) (d)
140
(e) (g)
(h) (i)
e.
P c Z 0.016, 1 P Z c 0.016, 1 P(c Z c) 0.016
1 (c) (c) 0.016, 1 (c) (1 (c)) 0.016
2 0.016
2 2(c) 0.016, (c) 0.992 c 2.41
2
5. Si X es una va normal con media 80 y desviación estándar 10, calcule las siguientes
probabilidades mediante estandarización.
a. P(X ≤ 100)
b. P(X ≤ 80)
c. P(65 ≤ X ≤ 100)
d. P(70 ≤ X)
e. P(85 ≤ X ≤ 95)
f. P(X - 80 ≤ 10)
Solución:
x
Para estandarizar a la variable normal usamos la va Z . Con = 80 y
= 10
100 80
a. P( X 100) P Z (2) 0.9772 P( X 100) 0.9772
10
80 80
b. P( X 80) P Z (0) 0.500 P( X 80) 0.500
10
c.
65 80 100 80
P(65 X 100) P Z (2) (1.5)
10 10
0.9772 0.0668 0.9104 P(65 X 100) 0.9104
d.
70 80
P(70 X ) 1 P( X 70) 1 P Z 1 (1)
10
P(70 X ) 1 0.1587 0.8413 P(70 X ) 0.8413
e.
85 80 95 80
P(85 X 95) P Z (1.5) (0.5)
10 10
0.9332 0.6915 0.2417 P(65 X 100) 0.9104
f.
P(| X 80 | 10) P(10 X 80 10) P(70 X 90)
70 80 90 80
P Z (1) (1)
10 10
0.8413 0.1587 0.6826 P(| X 80 | 10) 0.6826
6. Suponga que la fuerza que actúa sobre una columna, que ayuda a sostener un edificio,
está normalmente distribuida con media de 15.0 kips y desviación estándar 1.25 kips.
¿Cuál es la probabilidad de que la fuerza:
a. sea a lo sumo 17 kips?
b. Se encuentre entre 10 y 12 kips?
c. difiera de 15 kips en a lo sumo 2 DE?
Solución:
x
a. Para una distribución normal con = 15.0 y = 1.25, la va Z ,
143
17 15
P( X 17) P Z (1.60) 0.9452 P( X 17) 0.9452
1.25
10 15 12 15
P(10 X 12) P Z (2.4) (4)
b. 1.25 1.25
0.0082 0 0.0082 P(10 X 12) 0.0082
c.
P(| X 15 | 2.5) P(2.5 X 15 2.5) P(12.5 X 17.5)
12.5 15 17.5 15
P Z (2) (2)
1.25 1.25
0.9772 0.0228 0.9544 P(| X 15 | 2.5) 0.9544
9. Hay dos máquinas para cortar corchos destinados a usarse en botellas de vino. La
primera produce corchos con diámetros normalmente distribuidos con media de 3 cm
y desviación estándar de 0.1 cm. La segunda máquina produce corchos con diámetros
que tienen una distribución normal con media de 3.04 cm y desviación estándar de
0.02 cm. Los corchos aceptables tienen diámetros entre 2.9 cm y 3.1 cm. ¿Cuál
máquina tiene más probabilidad de producir un corcho aceptable?
Solución:
Para la primera máquina con = 3.0 y = 0.1, tenemos:
2.9 3.0 3.1 3.0
P(2.9 X 3.1) P Z (1) (1)
0.1 0.1
P(2.9 X 3.1) 0.8413 0.1587 0.6826 P(2.9 X 3.1) 0.6826
Por tanto la segunda máquina tiene más probabilidad de producir corchos aceptables
x 3.000 x 3.0
P( X x) 0.90, P Z 0.90, entonces 0.90
0.150 0.15
x 3.00
1.28 despejando x, x 3.192 90no percentil 3.192
0.15
11. En el artículo “Monte Carlo Simulation – Tool for Better Understanding of LRFD”(J.
Structural Engr., 1993, pp. 1586 – 1599) se indica que la resistencia a la deformación
permanente (ksi) para acero grado A36 está normalmente distribuida con = 43 y
= 4.5.
a. ¿Cuál es la probabilidad de que la resistencia a la deformación permanente sea a lo
sumo 40? y ¿mayor de 60?
b. ¿Cuál valor de resistencia a la deformación permanente separa al 75% más fuerte
de los otros?
Solución:
a. Para una distribución normal con = 43 y = 4.5, tenemos:
40 43
P( X 40) P Z (0.667) 0.2514 P( X 40) 0.2514
4.5
60 43
P( X 60) 1 P( X 60) 1 P Z 1 (5.11) 1 1 0 P( X 60) 0
4.5
b. Se requiere encontrar el 25 percentil, entonces, sea c este valor:
c 43 c 43
P( X c) 0.75, P Z 0.25, (0.67) 0.25, entonces 0.67
4.5 4.5
despejando el valor de c, c (0.67)(4.5) 43 39.985 c 39.985
0.1
0.025, (1.96) 0.025
0.1 0.1
1.96 0.051
1.96
14. La distribución de resistencia para resistores de cierto tipo es normal, 10% de todos
los resistores tienen una resistencia que excede los 10.256 ohms y 5% una resistencia
menor de 9.671 ohms. ¿Cuáles son los valores de la media y la desviación estándar de
la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
10.256 9.671
P Z 0.90 y P Z 0.05,
10.256 9.671
(1.28) 0.90 y (1.645) 0.05, entonces: 1.28, 1.645
Obtenemos las ecuaciones: 1.28 10.256 y 1.645 9.671
resolviendo el sistema tenemos:10.256 1.28 9.671 1.645 , 2.925 0.585
0.2 10
1.5 1.5
P Z (1.5) (1.5)
0.9332 0.0668) 0.8664
P (dentro de 1.5 DE) = 0.8664
b.
30.5 31
P( X 30.5) 1 P( X 30.5) 1 P Z 1 (2.5)
0.2
P( X 30.5) 1 0.0062 0.9938
30.5 31 31.5 31
P(30.5 X 31.5) P Z (2.5) (2.5)
b. 0.2 0.2
P(30.5 X 31.5) 0.9938 0.0062 0.9876
c.
30.4 31
P( X 30.4) P Z (3) 0.0013
0.2
Ahora tenemos una distribución binomial, b (x; 4, 0.0014) y la probabilidad deseada
es:
P( X 1) 1 P( X 1) 1 b(0; 4, 0.0013)
4
1 (0.0013)0 (0.9987)4 1 0.9948 0.0052
0
P( X 1) 0.0052
67 70 75 70
P(67 X 75) P Z (1.67) (1)
3 3
P(67 X 75) 0.9525 0.1587 0.7938 P(67 X 75) 0.7938
b.
149
70 c 70 70 c 70
P Z 0.95
3 3
c c
P Z 0.95
3 3
c c
0.95
3 3
c c
0.025 o 0.975
3 3
c c
1.96 o 1.96
3 3
c. Ahora se tiene una distribución binomial b(x; 10, 0.7938) y para esta distribución
E(X) = np por tanto E(X) = 10(0.7938) = 7.938 o E(X) = 8
19. La distribución de peso de paquetes enviados en cierto modo, es normal con valor
medio de 10 lb y desviación estándar de 2 lb. El servicio de paquetería desea establecer
un valor de peso c, más allá del cual habrá un cargo extra. ¿Cuál valor de c es tal que
99% de todos los paquetes pesen por lo menos una libra abajo del peso con cargo
extra?
Solución:
Con = 10 y = 2 . La condición deseada es que el 99% del área este ubicada a la
izquierda de c – 1 lo que implica que c – 1 es el 99 percentil de la distribución,
entonces:
c 1 10 c 11
P X c 1 0.99, P Z 0.99, 0.99
2 2
c 11
2.33, c 15.66
2
20. Considere a los bebés que nacen en un intervalo “normal” de 37 a 43 semanas de edad
de gestación. Gran cantidad de datos apoyan la suposición de que para esos niños que
nacen en Estados Unidos, el peso de nacimiento tiene una distribución normal con
media igual a 3432 g y desviación estándar de 482 g. [En el artículo “ Are Babies
Normal” (The American Statistician (199): 298 – 302) se analizan datos de un año
150
2000 3432
P( X 2000) P Z (2.97) 0.0015, P( X 2000) 0.0015
482
5000 3432
P( X 5000) 1 P( X 5000) 1 P Z
482
1 (3.25) 1 0.9994 0.0006 P( X 5000) 0.0006
x 3432 x 3432
PZ 0.995, 0.995
482 482
x 3432
2.575 x 4673
482
e.
21. En respuesta a las preocupaciones acerca del contenido nutrimental de la comida
rápida, McDonald’s anunció que empleará un nuevo aceite de cocina para sus papas
fritas, que disminuirá en forma sustancial la concentración de ácidos grasos, e
incrementará la cantidad de grasas poliinsaturadas más benéficas. La compañía afirma
que 97 de cada 100 personas no detectan una diferencia de sabor entre los aceites
nuevo y antiguo. Suponiendo que esta cifra sea correcta (como proporción a largo
plazo), ¿cuál es la probabilidad aproximadamente de que una muestra de 100
individuos elegidos al azar que compraron papas en McDonald’s,
a. por lo menos 40 noten la diferencia entre los dos aceites?
b. a lo sumo 5% noten la diferencia entre los dos aceites?
Solución:
a. La distribución es binomial con p = 0.97 y n = 100, sin embargo podemos
aproximarla a una distribución normal, con = np y 2 = npq, entonces = 97 y
= 1.7059
La probabilidad de que por lo menos 40 noten la diferencia, corresponde a que menos
de 40 no lo noten y en este caso la va X = persona que no nota la diferencia, por
tanto:
40 0.5 97
P( X 40) P Z (33.12) 0 P( X 40) 0
2.91
22. La desigualdad de Chebyshev es válida tanto para las distribuciones continuas como
discretas. La desigualdad establece que para cualquier número k 1,
P(| X | k ) 1/ k 2 .
Obtenga esta probabilidad en el caso de una distribución normal para k = 1, 2 y 3, y
compare con el límite superior.
Solución:
P(| X | k ) 1 P(| X | k ) ,
Pero, tenemos que | X | k , k X k , k X k ,
así:
P(| X | k ) P(k X k )
k k
P Z P( k Z k )
Para k = 1, P(1 Z 1) (1) (1) 0.8413 0.1587 0.6826
P(| X | ) 1 0.6826 0.3174 1
152
23. Sea X (una variable de valores enteros) la cantidad de defectos de un rollo de 100m
de cinta magnética. Suponga que X tiene una distribución aproximadamente normal
con = 25 y = 5. Use la corrección de continuidad para calcular la probabilidad de
que la cantidad de defectos sea:
a. entre 20 y 30 inclusive.
b. A lo sumo 30, menos de 30.
Solución:
x 0.5 np
a. P(X x) = B(x; n, p) =
npq
Esta aproximación es adecuada para np 10 y nq 10. En este caso = 25 y =
5
20 0.5 25 30 0.5 25
P(20 X 30) P Z (1.1) (1.1)
5 5
P(20 X 30) 0.8643 0.1357 0.7286 P(20 X 30) 0.7286
30 0.5 25
b. P( X 30) P Z (1.1) 0.8643 P( X 30) 0.8643
5
29.5 25
P( X 30 0.5) P Z (0.9) 0.8159
5
24. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una
de las siguientes probabilidades usando la aproximación normal (con la corrección de
continuidad) para los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades
exactas calculadas de la tabla correspondiente.
a. P(15 ≤ X ≤ 20)
b. P(X ≤ 15)
c. P(20 ≤ X)
Solución:
a. n 25, p 0.5, np 12.5, npq 2.5
15 0.5 12.5 20 0.5 12.5
P(15 X 20) P Z (3.2) (0.8)
2.5 2.5
P(15 X 20) 0.9993 0.7881 0.2112 P(15 X 20) 0.7286
15 0.5 12.5
b. Para p = 0.5 P( X 15) P Z (1.2) 0.8840
2.5
15 0.5 15
Para p = 0.6 P( X 15) P Z (0.2040) 0.5793
2.45
15 0.5 20
Para p = 0.8 P( X 15) P Z (2.25) 0.0122
2
c.
19.5 12.5
Para p 0.5 P( X 20) 1 P( X 19.5) 1 P Z 1 (2.8)
2.5
P( X 20) 1 0.9974 0.0026
19.5 15
Para p 0.6 P( X 20) 1 P( X 19.5) 1 P Z 1 (1.837)
2.45
P( X 20) 1 0.9671 0.0329
19.5 20
Para p 0.8 P( X 20) 1 P( X 19.5) 1 P Z 1 (0.25)
2
P( X 20) 1 0.4013 0.5987
Comparando con las probabilidades exactas:
Para p 0.5 n 25
P(15 X 20) B(20; 25, 0.5) B(14; 25, 0.5) 1.000 0.778 0.212
Para p 0.6 n 25
P(15 X 20) B(20; 25, 0.6) B(14; 25, 0.6) 0.991 0.414 0.577
Para p 0.8 n 25
P(15 X 20) B(20; 25, 0.8) B(14; 25, 0.8) 0.579 0.006 0.573
Para p 0.5 n 25 Para p 0.6 n 25
P( X 15) B(15; 25, 0.5) 0.885 P( X 15) B(15; 25, 0.6) 0.575
Para p 0.8 n 25
P( X 15) B(15; 25, 0.8) 0.017
Para p 0.5 n 25
P( X 20) 1 B(19; 25, 0.5) 1 0.998 0.002
Para p 0.6 n 25
P( X 20) 1 B(19; 25, 0.6) 1 0.971 0.029
Para p 0.8 n 25
P( X 20) 1 B(19; 25, 0.8) 1 0.383 0.617
Haciendo un cuadro comparativo
154
25. Suponga que 10% de todos los ejes de acero producidos por cierto proceso están fuera
de las especificaciones, pero que se pueden volver a trabajar (en lugar de tener que
enviarlos a la chatarra). Considere una muestra aleatoria de 200 ejes y exprese con X
el número de los que estén fuera de las especificaciones y se puedan volver a trabajar.
¿Cuál es la probabilidad (aproximada) de que X sea:
a. a lo sumo 30?
b. Menos de 30?
c. entre 15 y 25 inclusive?
Solución:
a. La distribución es binomial, pero podemos calcular estas probabilidades con una
aproximación normal, con = np = 20 y 2 = npq= 18 entonces:
30 0.5 20
P( X 30) P Z (2.47) 0.9932 P( X 30) 0.9932
18
29 0.5 20
b. P( X 30) P Z (2.24) 0.9875 P( X 30) 0.9875
18
c.
14 0.5 20 25 0.5 20
P(15 X 25) P Z (1.30) (1.30)
18 18
P(15 X 25) 0.9032 0.0968 0.8064 P(15 X 25) 0.8064
26. Suponga que solo 40% de todos los automovilistas de cierta ciudad usan con
regularidad el cinturón de seguridad. Se selecciona al azar una muestra de 500
automovilistas. ¿Cuál es la probabilidad de que:
a. entre 180 y 230 de los automovilistas de la muestra usen su cinturón con
regularidad?
b. Menos de 175 de los de la muestra utilicen su cinturón con regularidad? y ¿menos
de 150?
Solución:
a. Usando la aproximación de binomial a normal, tenemos: p = 0.4, n = 500, = np
= 200
2 = npq = 120, entonces:
155
174.5 200
b. P( X 175) (2.328) 0.0099 P( X 175) 0.0099
120
149.5 200
P( X 150) (4.61) 0.00 P( X 150) 0.00
120
27. a. Demuestre que si X tiene una distribución normal con parámetros y , entonces
Y = aX + b (una función lineal de X) también tiene distribución normal. ¿Cuáles son
los parámetros de la distribución Y [es decir E(X) y V(X)]? [Sugerencia… escriba la
fda de Y, P(Y = y), como una integral donde aparece la fdp de X y fuego derive respecto
a y para obtener la fdp de Y]
b. Si cuando se mide en ºC, la temperatura tiene una distribución normalcon media
115 y desviación estándar 2, ¿qué se puede decir acerca de la distribución de
temperatura medida en ºF?
Solución:
y b
F ( y ) P(Y y ) P(aX b y ) P X
a
1
f ( x; , ) e ( x ) / 2
2 2
2
Entonces la fda es:
2
yb
y y 1 / 2 2
P(Y y ) f ( x; , )dy e a
dy
2
1
y 1 y b a 2
e 2a
2 2
dy
2
1
1 y ( a b ) 2
f ( y ) F '( y ) e 2a
2 2
2
Se observa que Y es normal con media = a + b y varianza = a2 2.
9
b. º F º C 32 es una función lineal, por tanto la temperatura en ºF también está
5
normalmente distribuido con:
2
9 9
(115) 32 239 y 2 (2)2 12.96
5 5
28. El voltaje de ruptura de un diodo de cierto tipo seleccionado al azar, está normalmente
distribuido con valor medio de 40 V y desviación estándar de 1.5V.
a. ¿Cuál es la probabilidad de que el voltaje de un solo diodo esté entre 39 y 42V?
b. ¿Cuál valor es tal que sólo 15% de todos los diodos tenga voltajes que rebasen ese
valor?
156
39 40 42 40
P(39 X 42) P Z (1.333) (0.667)
1.5 1.5
0.9082 0.2546 0.6536 P(39 X 42) 0.6536
b. Se necesita hallar el 85 percentil, es decir:
x 40
P( X x) 0.85, PZ 0.85
1.5
x 40 x 40
0.85 1.04, despejando a x
1.5 1.5
x 1.5(1.04) 40 41.56 x 41.56
c. Calculamos primero P(X 42)
42 40
P( X 42) 1 P( X 42) 1 P Z 1 (1.33)
1.5
P( X 42) 1 0.9082 0.0918
Ahora tenemos una distribución binomial con n = 4 y p = 0.0918
4
P( X 1) 1 P( X 1) 1 (0.0918)0 (0.9082) 4 1 0.68034
0
P( X 1) 0.3196
29. El artículo “Computer Assisted Net Weight Control” (Quality Progress, 1983, pp. 22
-25) sugiere una distribución normal, con media de 137.2 onzas y desviación estándar
de 1.6 onzas, para el contenido real de frascos de cierto tipo. El contenido establecido
era de 135 onzas.
a. ¿Cuál es la probabilidad de que un solo frasco contenga más que el contenido
establecido?
b. Entre 10 frascos seleccionados al azar, ¿cuál es la probabilidad de que por lo menos
8 contengan más del contenido establecido?
c. Si se supone que la media permanece en 137.2, ¿a qué valor tendría que haberse
cambiado la desviación estándar para que 95% de todos los frascos contengan más
de lo establecido?
Solución:
a. Con = 137.2 oz y = 1.6 oz
135 137.2
P( X 135) 1 P( X 135) 1 Z 1 (1.38) 1 0.0838 0.9162
1.6
P( X 135) 0.9162
b. Con Y = Número entre 10 frascos que contienen más de lo establecido, Y tiene una
distribución binomial b(y; 10, 0.9162), por tanto la probabilidad pedida es:
P(Y 8) 1 P(Y 8) 1 B(7;10,0.9162) 1 0.04512 0.95488 P(Y 8) 0.95488
c.
157
Solución:
a. La distribución es binomial, pero podemos calcular esta probabilidad con una aproximación
normal con = np = 12.5 y 2 = npq= 11.875 entonces el 10% de 250 = 25 y la
probabilidad pedida es:
24 0.5 12.5
P( X 25) 1 B(24;250,0.05) 1 P Z
11.875
1 (3.482) 1 0.9997 0.0003 P( X 25) 0.003
250
b. P( X 10) (0.05) (0.95) 0.0963
10 240
P( X 10) 0.0963
10
50 96 75 96
P(50 X 75) P Z (1.5) (3.2857)
14 14
P(50 X 75) 0.0668 0.0005 0.0663 P(50 X 75) 0.0663
c. Se requiere encontrar el 5 percentil y el 95 percentil, es decir:
158
a 96 a 96
P( X a) 0.05, P Z 0.05, 0.05
14 14
a 96
1.645, despejando a, tenemos: a 72.97
14
b 96 b 96
P( X b) 0.95, P Z 0.95, 0.95
14 14
b 96
1.645, despejando b, tenemos: b 119.03
14
Entonces el intervalo (a, b) = (72.97, 119.03)
10000 10000
P Z 0.01, (2.33) 0.01, 2.33
600 600
despejando a , (2.33)600 10000 11398 11398 horas
d.
Solución:
a. Para = 5mm y = 0.2mm
5.5 5
P( X 5.5) 1 P( X 5.5) 1 P Z 1 (2.5)
0.2
P( X 5.5) 1 0.9938 0.0062 P( X 5.5) 0.0062
b.
4.5 5 5.5 5
P(4.5 X 5.5) P Z (2.5) (2.5)
0.2 0.2
P(4.5 X 5.5) 0.9938 0.0062 0.9876 P(4.5 X 5.5) 0.9876
c. En este caso se requiere encontrar el 90 percentil, es decir
x 5 x 5
P( X x) 0.90, P Z 0.90, 0.90
0.2 0.2
x 5
1.28, entonces x 5.256
0.2
160
DISTRIBUCION GAMMA
1. Evalúe lo siguiente:
a. (6)
b. (5/2)
c. F(4;5) (función gamma incompleta)
d. F(5,4)
e. F (0,4)
Solución:
a. De la propiedad de la función gamma (n) (n 1)! , tenemos:
(6) (6 1)! 5! 120 (6) 120
b. De las propiedades de la función gamma
1
(n) (n 1)! , y ( ) ( 1)( 1) , tenemos
2
5 5 3 3 3 1 3 5 3
1 1
2 2 2 2 2 2 4 2 4
c. De la tabla para la función Gamma incompleta:
F(4, 5) = 0.371
d. F(5, 4) = 0.375
e. F(0, 4) = P(X 0; 4) = 0
2. Considere que X tiene una distribución gamma estándar con = 7. Evalúe lo siguiente:
a. P(X ≤ 5)
b. P(X < 5)
c. P(X > 8)
d. P(3 ≤X ≤ 8)
e. P(3 <X < 8)
f. P(X < 4 o X > 6)
Solución:
x
a. Para la función gamma estándar = 1 y la fda. F , F ( x, )
P( X 5) F (5,7) 0.238 P( X 5) 0.238
161
3. Suponga que el tiempo en horas tomado por el propietario de una casa para podar el
césped de su jardín es una va X, que tiene una distribución gamma con parámetros
= 2 y = ½. ¿Cuál es la probabilidad de que tarde:
a. a lo sumo una hora para podar su césped?
b. Por lo menos 2 horas?
c. entre 0.5 y 1.5 horas?
Solución:
x
a. Con = 2 y = ½, la distribución gamma acumulada es: F , y consultando en
tablas:
1
P( X 1) F , 2 F (2, 2) 0.594 P( X 1) 0.594
1
2
b.
2
P( X 2) 1 P( X 2) 1 F , 2 1 F (4, 2) 1 0.908 0.092 P( X 2) 0.092
1
2
3 1
P(0.5 X 1.5) F 2 , 2 F 2 , 2 F (3, 2) F (1, 2) 0.801 0.264
c. 1 1
2 2
P(0.5 X 1.5) 0.537
4. Suponga que el tiempo empleado por un estudiante seleccionado al azar, que utiliza
una terminal conectada a un centro local de cómputo de tiempo compartido, tiene una
distribución gamma con media de 20 min. Y varianza de 80 min2.
a. ¿Cuáles son los valores de y ?
b. ¿Cuál es la probabilidad de que un estudiante utilice la terminal a lo sumo 24 min?
c. ¿Cuál es la probabilidad de que un estudiante utilice entre 20 y 40 minutos la
terminal?
Solución:
a. Para una distribución gamma E( X ) , V ( X ) 2 2 , entonces:
20
20, 2 80, despejando , , sustituyendo en la otra ecuación
2
20 400 20
80, 80 y 5, 4
5
162
5. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de
vida útil, la duración X (en semanas) tiene una distribución gamma con media de 24
semanas y desviación estándar de 12 semanas.
a. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
b. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas?
c. ¿Cuál es el 99avo percentil de la distribución de duración?
d. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es
tal que solo la mitad del 1% de todos lo transistores estarán funcionando al terminar
la prueba?
Solución:
a. Para una distribución gamma E( X ) , V ( X ) 2 2 , entonces:
24
24, 2 144, despejando , , sustituyendo en la otra ecuación
2
24 576 24
144, 144 y 4, 6
4
Teniendo los valores de = 4 y = 6, calculamos las probabilidades pedidas
24 12
P(12 X 24) F , 4 F , 4 F (4, 4) F (2, 4) 0.567 0.143
6 6
P(0.5 X 1.5) 0.424
b. P( X 24) F (4,4) 0.567 P( X 24) 0.567
Del resultado obtenido se deduce que P( X ) 0.5 24 . Esto se debe al sesgo
positivo de la distribución gamma.
x x
c. P( X x) 0.99, F ,4 0.99, F (10,4) 0.99, 10, x 60
6 6
El 99 percentil = 60
d. Para 1% = 0.01, la mitad es 0.005, entonces:
t t
P( X t ) 0.995, F ,4 0.995, F (11,4) 0.995, 11, t 66
6 6
7. En una cierta ciudad el consumo de agua diario (en millones de litros) sigue
aproximadamente una distribución gamma con = 2 y = 3. Si la capacidad diaria
de dicha ciudad es 9 millones de litros de agua:
163
8. Suponga que el tiempo en horas, que toma reparar una bomba de calor es una variable
aleatoria X que tiene una distribución gamma con parámetros = 2 y = ½ . ¿Cuál
es la probabilidad de que la siguiente llamada de servicio requiera
a. a lo mas una hora para reparar la bomba de calor?
b. Al menos dos horas para reparar la bomba de calor?
DISTRIBUCION EXPONENCIAL
10. Sea X = tiempo entre dos llegadas sucesivas en la ventanilla de atención de un banco
local. Si X tiene una distribución exponencial con = 1, calcule lo siguiente:
d. El tiempo esperado entre dos llegadas sucesivas.
e. La desviación estándar entre dos llegadas sucesivas.
f. P(X ≤ 4)
g. P(2 ≤ X ≤ 5)
11. Sea X la distancia en metros que un animal se mueve desde su lugar de nacimiento
hasta el primer territorio vacante que encuentra. Suponga que para las ratas canguro,
X tiene una distribución exponencial con parámetro = 0.01386 (como sugiere el
artículo “Competition and Dispersal from Multiple Nests”, Ecology, 1997, pp. 873 –
883).
a. ¿Cual es la probabilidad de que la distancia sea a lo sumo 100 m?¿Cuando mucho
200 m? ¿Entre 100 y 200 m?
b. ¿Cuál es la probabilidad de que la distancia sea mayor que la distancia promedio en
más de dos desviaciones estándar?
c. ¿Cuál es el valor de la distancia mediana?
12. Una amplia experiencia en ventiladores de cierto tipo, empleados en motores diesel,
ha sugerido que la distribución exponencial es un buen modelo para el tiempo hasta
que se presente una falla. Suponga que el tiempo medio hasta una falla es de 25000 h.
¿Cuál es la probabilidad de que:
a. un ventilador seleccionado al azar dure por lo menos 20000 h? ¿A lo sumo 30000?
Y ¿entre 20000 y 30000 h?
b. ¿cuál es la probabilidad de que un ventilador exceda el valor medio en más de 2
desviaciones estándar? Y ¿en mas de 3 DE?
164
1 2 3 4 5
14. Si X tiene una distribución exponencial con parámetro , deduzca una expresión
general para el percentil (100p) de la distribución. Después, especifique como obtener
la mediana.
15. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo
Method” (Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución
exponencial, con parámetro = 0.93, como modelo para la distribución de la longitud
(m) de la trayectoria libre de un fotón bajo ciertas circunstancias. Suponga que el
modelo es correcto.
a. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la
longitud de la trayectoria?
b. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es
la probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
c. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro =0.93
1 1 1 1
E ( X ) , V ( X ) 2 2 , así: 1.075, 1.075 = = 1.075
0.93
0 x 0
b. Usando la fda F ( x; ) x
1 e x0
b.
E c(1 0.5e ax )
0
c(1 0.5e ax ) e x dx c
0
e x dx 0.5
0
e ( a ) x dx
1 0.5 ( a ) x
1 0.5
c e x e c (0 1) (0 1)
0 a 0
a
0.5c c ca 0.5c c(0.5 a)
c
a a a
c (0.5 a )
E c(1 0.5e ax )
a
Solución:
166
1
Para una distribución exponencial con parámetro , la función de distribución acumulada
5
0 x0
está dada por: F ( x; ) x
, entonces:
1 e x0
20. Según un reporte del periódico Uno Más Uno (octubre de 1998), muchos funcionarios
y servidores públicos del gobierno mexicano ocupan la mayoría de sus horas de
trabajo haciendo llamadas telefónicas personales. Suponga que la duración de las
conferencias telefónicas personales de una funcionaria de la Secretaria de
Gobernación es una variable aleatoria X que sigue una distribución exponencial, con
parámetro = 0.012 (en minutos). Calcule:
a. La duración promedio de una conversación telefónica de esta funcionaria.
b. La desviación estándar de la duración de una llamada.
c. La probabilidad de que una conversación telefónica dura más de 50 minutos.
d. La probabilidad de que dure a lo sumo 30 minutos.
Solución:
1 1
a. Para una distribución exponencial E ( X ) , V (X ) 2 y la fda. es:
2
0 x0 1
F ( x; ) x
, entonces: E ( X ) 83.33 E ( X ) 83.33 minutos
1 e x0 0.012
1
b. V ( X ) 6944.444, X V ( X ) 6944.444 83.33 X 83.33
(0.012)2
c. P( X 50) 1 P( X 50) 1 1 e(0.012)50 0.5488 P( X 50) 0.5488
(0.012)30
d. P( X 30) F (30;0.012) 1 e 1 0.6977 0.3023 P( X 30) 0.3023
21. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que
presentaran un examen de termodinámica, de manera individual. Para cualquiera de
ellos se estima que el tiempo promedio de solución del examen es de 1h 20 min y
además la distribución del tiempo se asume que es exponencial. Si el examen inició a
las 9:00 a.m., calcule la probabilidad de que:
a. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
b. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso
comprendido entre las 9:50 y 10:00 a.m.
c. Determine el número más probable de estudiantes que terminaran el examen antes
de las 10:10 a.m.
d. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado
para el tiempo de solución de un examen?
Solución:
1 1
a. Como = 1h 20 min = 80 min y E ( X ) , entonces 0.0125 y la probabilidad
80
deseada será:
167
DISTRIBUCION LOGNORMAL
y = 1.2
E( X ) e
3.5 1.2
2
2 e4.22 68.0335 E ( X ) 68.0335
V (X ) e 7 1.44
(e 1.44
1) 14907.167, X V ( X ), X 14907.167 122.095
ln 50 3.5 ln 250 3.5
P(50 X 250) P Z (1.684) (0.343)
b. 1.2 1.2
0.9535 0.6331 0.3204 P(50 X 250) 0.3204
ln 68.0335 3.5
c. P( X 68.0335) P Z (0.60) 0.757 P( X 68.0335) 0.757
1.2
Esta probabilidad no es 0.5 porque la distribución lognormal no es simétrica
168
V ( X ) e2 (e 1) y con = 5 y
2 2
= 0.1
E( X ) e
5 0.1
2
2 e5.005 149.157 E ( X ) 149.157
10 0.001
V (X ) e (e 0.001
1) 223.594, V ( X ) 223.594
ln120 5
P( X 120) 1 P( X 120) 1 P Z
b. 0.1
1 (2.125) 1 0.0168 0.9832 P( X 120) 0.9832
ln110 5 ln130 5
P(110 X 130) P Z (1.324) (2.995)
c. 0.1 0.1
0.0934 0.0014 0.092 P(110 X 300) 0.092
d. e , e5 148.41 =148.41
ln x 5 ln x 5
P Z 0.05, (1.645) 0.05, 1.645, despejando a x,
0.1 0.1
ln x (1.645)(0.1) 5, ln x 4.8355, x e4.8355 125.9 x 125.9
4. El artículo “The Statistics of Phytotoxic Air Pollutants” (J. Royal Stat. Soc., 1989, pp.
183 – 198) sugiere la distribución lognormal como un modelo para la concentración
de SO2, sobre cierto bosque. Suponga que los parámetros son = 1.9 y = 0.9.
a. ¿Cuáles son el valor medio y la desviación estándar de la concentración?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo 10? ¿Entre 5 y 10?
Solución:
c. Para una distribución lognormal E ( X ) e
,
2
2
y = 0.9
169
2
1.9 (0.9)
E( X ) e 2
10.024 E ( X ) 10.024
V (X ) e 3.9 (0.9)2
(e (0.9)2
1) 125.395, X 125.395 11.2 X 11.2
ln10 1.9
P( X 10) P Z (0.45) 0.6736 P( X 10) 0.6736
0.9
ln 5 1.9 ln10 1.9
d. P(5 X 10) P Z (0.45) (0.32)
0.9 0.9
0.6736 0.3745 0.2991 P(5 X 10) 0.2991
5. Se sabe que la tasa promedio de uso de agua (miles de litros por hora) en cierta
comunidad implica una distribución logarítmica normal con parámetros = 5 y =
2.5 Es importante para propósitos de planeación obtener una apreciación de los
períodos de alta utilización.
a. ¿Cuál es la probabilidad de que para cualquier hora dada, se usen a lo sumo 50 000
litros de agua?
b. ¿Cuál es la probabilidad de que se usen entre 30 000 y 50 000?
c. ¿Cuál es el valor esperado de galones de agua que se usan en cualquier hora dada?
d. En un período de 15 horas, ¿Durante cuantas horas se esperaría que se usaran a lo
sumo 10 000?
Solución:
ln 50000 5
a. P( X 50000) P Z (2.3279) 0.9901 P( X 50000) 0.9901
2.5
ln 30000 5 ln 50000 5
P(30000 X 50000) P Z (2.3279) (2.1236)
b. 2.5 2.5
0.9901 0.983 0.0071 P(30000 X 50000) 0.0071
ln10000 5
c. P( X 10000) P Z (1.684) 0.954 .Con n = 15 y p = 0.954, el valor
2.5
esperado E(X) = np, por tanto E(X) = 15(0.954) = 14.3 E(X) = 14.3 horas
DISTRIBUCION WEIBULL
1. La vida útil X (en cientos de horas) de cierto tipo de tubos al vacío tiene una
distribución de Weibull con parámetros = 2 y = 3. Calcule lo siguiente:
a. E(X) y V(X)
b. P(X 6)
c. P(1.5 X 6)
Solución:
170
x e x0
f ( x; , )
x0
0
0 x0
F ( x; , )
1 e x 0
x
1 2 1
2
1 , 2 2 1 1
V ( X ) 3 (2) 9 1
2 2
9(1 0.7854) 1.93 V ( X ) 1.93
2 2
3 1 e4 0.9817
2
6
b. P( X 6) F (6;2,3) 1 e P( X 6) 0.9817
1.5
2
2. Los autores del artículo “A Probabilistic Insulation Life Model for Combined
Thermal-Electrical Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522)
expresan que la distribución de Weibull se utiliza ampliamente en problemas de
estadística relacionados con la obsolescencia de materiales aislantes sólidos sujetos a
envejecimiento y esfuerzo. Proponen el uso de la distribución como modelo para el
tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos a un voltaje
de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
= 2.5 y = 200 (los datos de este artículo indican estos valores).
a. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200?
¿Menos de 200? ¿Mas de 300?
b. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
c. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que
exceden ese valor?
Solución:
a.
2.5
x x
F ( x; , ) 1 e , en este caso: F ( x;2.5, 200) 1 e 200
1 e 1 0.632
2.5
200
P( X 200) 1 e 200
P( X 200) 0.632
P( X 200) 0.632, ya que es una distribución de probabilidad continua
P( X 300) 1 P( X 300) 1 F (300;2.5, 200)
300
200
2.5
2.7556
1 1 e e 0.06357 P( X 300) 0.06357
171
20 20 20
c. 100
1
(100)20 ln(0.5) 20
98.18 98.18
5. En el artículo “Response of SiCf /Si3N4 Composites Under Static and Cyclic Loading
– An Experimental and Statistical Analysis” (J. Engr. Materials and Technology,
1997: 186 – 193) se sugiere que la resistencia a la tensión en MPa de materiales
compuestos bajo las condiciones especificadas se puede modelar mediante una
distribución de Weibull con = 9 y = 180.
172
175
9
b. Sea Y = {uno de las especímenes tiene resistencia a la tensión entre 150 y 175}
P(Y 1) = 1 P(Y < 1) = 1- P(Y = 0), P(Y 1) = 1 (1- 0.3636)2 = 0.5950
P(Y 1) = 0.5950
c. Se requiere hallar el 10 percentil, esto es:
x
9
x
9
PROBLEMAS RESUELTOS
PROBABILIDAD CONDICIONAL
173
color
Blanco Azul Negro Rojo
Solución:
a. P(A) = 0.15 + 0.10 + 0.10 + 0.10 = 0.45
P (B) = 0.10 + 0.25 = 0.25
P(A B) =0.10
P( A B) 0.10
b. P( A / B) 0.40
P( B) 0.25
Probabilidad de que el automóvil tenga transmisión automática si se adquirió en
color negro.
P( A B) 0.10
P( B / A) 0.22
P( A) 0.45
Probabilidad de que el automóvil sea negro si se adquirió con transmisión
automática.
P( A C ) 0.15
c. P( A / C ) 0.5
P(C ) 0.30
P( A C ' )
P( A / C ' ) P(C ' ) 0.70 P( A' ) 0.55
P(C ' )
(A’ C)’ = A C’
P (A C’) = P(A) – P(A C) = 0.45 – 0.15 = 0.30
P( A C ' ) 0.30
P( A / C ' ) 0.429
P(C ' ) 0.70
Solución:
P(A/ B); es la probabilidad de que el individuo tenga una estatura de más de 6 pies
si es jugador de baloncesto.
P (B/A); es la probabilidad de que el individuo sea un jugador de baloncesto si tiene
una estatura de más de 6 pies.
P( A B) P( A B)
P( A / B) P( B / A)
P( B) P( A)
La P(A) > P (B) pues hay más individuos que tienen estatura mayor de 6 pies que
individuos jugadores profesionales de baloncesto, por tanto:
Solución
P( A B) 0.25
a. P( B / A) 0.5
P( A) 0.5
La probabilidad de que el individuo seleccionado tenga una tarjeta Master Card dado
que tiene una Visa
P( A B' ) 0.25
b. P( B' / A) 0.5
P( A) 0.50
La probabilidad de que el individuo seleccionado no tenga tarjeta Master Card si tiene
una Visa
P( A B) 0.25
c. P( A / B) 0.625
P( B) 0.40
La probabilidad de que el individuo seleccionado tenga una tarjeta Visa, dado que tiene
Una Master Card
P( A'B) 0.15
d. P( A' / B) 0.375
P( B) 0.40
La probabilidad de que individuo seleccionado no tenga una tarjeta Visa si tiene una
Master Card
A B’ A’ B
4. Un sistema puede tener tres tipos de defectos: Ai ( i = 1,2,3) es cuando este sistema puede
tener un defecto del tipo i. Suponga que
P(A1) = 0.12 P(A2) = 0.07 P(A3) = =.05 P(A1 A2) = 0.13 P(A1 A3) = 0.14
P(A2 A3) = 0.10 P(A1 A2 A3) = 0.01
176
a. Si el sistema tiene defecto tipo 1, ¿cuál es la probabilidad de que tenga un defecto tipo
2?
b. Si el sistema tiene un defecto tipo 1, ¿cuál es la probabilidad de que tenga los tres tipos
de defectos?
c. Si el sistema tiene al menos un tipo de defecto, ¿cuál es la probabilidad de que tenga
exactamente un tipo de defecto?
d. Si el sistema tiene los dos primeros tipos de defectos a la vez, ¿cuál es la probabilidad
de que no tenga el tercer tipo de defecto?
Solución
P( A1 A2 ) P( A1 ) P( A2 ) P( A1 A2 )
0.12 0.07 0.13 0.06
P( A2 A3 ) P( A2 ) P( A3 ) P( A2 A3 )
0.07 0.05 0.10 0.02
P( A1 A3 ) P( A1 ) P( A3 ) P( A1 A3 )
0.12 0.05 0.14 0.03
a.
P( A1 A2 0.06
P( A2 / A1 ) 0.05
P( A1 ) 0.12
P( A1 A2 A3 ) 0.01
b. P( A1 A2 A3 / A1 ) .0833
P( A1 ) 0.12
P(E) = 0.01
P(B) = 0.05 + 0.08 + 0.01 = 0.14
0.05
P(C / B) 0.357
0.14
Solución
P [(ambos sean de 75W) (al menos uno sea de 75) = P( ambos sean de 75W)
6 9
=
2 0 15 5
15 105 35
2
Por tanto
5
5
P (ambos focos sean de 75W / al menos uno es de 75W) = 35 23
0.2174
35 23
P ( ambos sean de la misma potencia / al menos uno no es de 75W)
5 30
= 1
35 35
Ahora
P [(ambos sean iguales) (al menos uno no es de 75W) =
4 11 5 10
P (ambos sean de 40W o ambos de 60W) =
2 0 2 0 16
15 15 105
2 2
Por tanto
16
8
P (ambos sean iguales / al menos uno no es de 75W) = 105
30
0.1778
35 45
6. Una gran tienda de departamentos vende camisas deportivas en tres tallas (pequeña,
mediana y grande), en tres modelos (a cuadros, estampadas y de franjas) y con dos largos
de manga (corta y larga). Las siguientes tablas presentan las proporciones de camisas
vendidas que caben en varias combinaciones de categorías.
Manga corta
Modelo
Talla cuadros estampada franjas
pequeña 0.04 0.02 0.05
mediana 0.08 0.07 0.12
grande 0.03 0.07 0.08
Manga larga
Modelo
Talla cuadros estampada franjas
pequeña 0.03 0.02 0.03
mediana 0.10 0.05 0.07
grande 0.04 0.02 0.08
Solución
P( D H ) 0.10
P( D / H ) 0.555
P( H ) 0.18
7. Una caja contiene seis bolas rojas y cuatro verdes, y una segunda caja contiene siete bolas
rojas y tres verdes. Se escoge al azar una bola de la primera caja y se pone en la segunda
caja. Después, se selecciona una bola de la segunda caja y se pone en la primera caja.
a. ¿Cuál es la probabilidad de que se seleccione una bola roja de la primera caja y una
bola roja de la segunda?
b. En la conclusión del proceso de selección, ¿cuál es la probabilidad de que los números
de las bolas rojas y verdes de la primera caja sean idénticos a los números del
comienzo?
Solución
6 8 48
P (roja de la 1ª roja de la 2ª) = 0.436
10 11 110
b. P (mismo número) = P(las bolas seleccionadas en ambas cajas sean del mismo color)
= P (ambas sean rojas) + P (ambas sean verdes)
4 4
= 0.436 + 0.436 0.145 0.581
10 11
Solución
0.01
0.01 21 q 0.07
q
0.01 + 2(q – 0.01) = 0.07
2q = 0.07 – 0.01 + 0.02 = 0.08
q = 0.04
0.01
r 0.25
0.04
9. Cierto taller repara componentes de audio y video. Señalemos con A el evento donde el
siguiente componente en reparación sea un componente de audio y como B el evento
donde el siguiente componente sea un reproductor de discos compactos (por lo mismo, el
evento B está contenido en A). Suponga que P(A) = 0.6 y P (B) = 0.05. ¿Cuál es la
probabilidad de P (B/A)?
Solución
181
P( A B)
P( A / B)
P( A)
0.05
Como B A, A B = A, por tanto P( A / B) 0.0833
0.6
P( A1 A2 A3 ) 0.01
b. P( A2 A3 / A1 ) 0.0455
P( A1 ) 0.22
PA1 ( A2 A3 ) P( A1 A2 ) ( A1 A3 )
P( A2 A3 / A1 )
P( A1 ) P( A1 )
P( A1 A2 ) P( A1 P( A3 ) P( A1 A2 A3 )
c.
P( A1 )
0.11 0.05 0.01 0.15
0.6818
0.22 0.22
d.
P( A1 A2 A3 ) ( A1 A2 A3 )
P( A1 A2 A3 / A1 A2 A3 )
P( A1 A2 A3 )
P( A1 A2 A3 )
P( A1 ) P( A2 ) P( A3 ) P( A1 A2 ) P( A1 A3 ) P( A2 A3 ) P( A1 A2 A3 )
0.01 0.01
.0189
0.22 0.25 0.28 0.11 0.05 0.07 0.01 0.53
La probabilidad de este evento corresponde a la probabilidad de que se otorguen los tres
proyectos dado que se ha otorgado el proyecto 1 o el 2 o el 3.
182
11. Si P (B /A) > P (B), demuestre que P (B’ /A) < P (B’)
Solución
12. Para cualquier evento A y B con P (B) > 0, demuestre que P (A /B) + P (A’/B) = 1
Solución
P( A B) P( A'B) P( A B) P( A'B) P( B)
P( A / B) P( A' / B) 1
P( B) P( B) P( B) P( B)
+ =B
A’ B AB
13. Demuestre que para cualquiera de los tres eventos A, B y C con P (C) > 0, P (A B / C)
= P (A / C) + P (B / C) – P(A B / C)
Solución
P( A B) C P( A C ) ( B C )
P( A B / C )
P(C ) P(C )
P( A C ) P( B C ) P( A B C )
P(C )
P( A C ) P( B C ) P( A B C )
P(C ) P(C ) P(C )
P( A / C ) P( B / C ) P( A B / C )
14. En cierta gasolinería, 40% de los clientes utilizan gasolina regular sin plomo (A1), 35%
gasolina extra sin plomo (A2) y 25% gasolina Premium sin plomo (A3). De los clientes que
consumen gasolina regular, sólo 30% llenan sus tanques (evento B). De los que consumen
183
gasolina extra, 60% llenan sus tanques, mientras que de los que usan Premium, 50% llenan
sus tanques.
a. ¿Cuál es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y
llene su tanque (A2 ∩ B)?
b. ¿Cuál es la probabilidad de que el siguiente cliente llene su tanque?
c. Si el siguiente cliente llena su tanque, ¿cuál es la probabilidad de que pida gasolina
regular?, ¿extra? Y ¿Premium?
Solución
P( A1 B) 0.12
c. P( A1 / B) 0.264
P( B) 0.455
P( A2 B) 0.21
P( A2 / B) 0.462
P( B) 0.455
P( A3 B) 0.125
P( A3 / B) 0.274
P( B) 0.455
15. Sesenta por ciento de los aviones que desaparecen en vuelo, en cierto país, son
descubiertos posteriormente. De las naves descubiertas, 60% tienen localizador de
emergencia, mientras que 90% de los no descubiertos no tienen ese localizador. Suponga
que desaparece un avión ligero.
a. Si tiene localizador de emergencia, ¿cuál es la probabilidad de que no sea localizado?
b. Si no tiene localizador de emergencia, ¿cuál es la probabilidad de que sea localizado?
184
Solución 0.36
0.6
Loc.
0.4
0 .6
No tienen 0.24
desc. Loc.
0.10 0.04
0.4
Loc.
No desc.
0.9
No tienen
a. P (No sea loc. / tiene Loc. 0.36 localizador) =
0.04 0.04
0.10
0.04 0.36 0.40
0.24 0.24
= 0.40
0.24 0.36 0.60
185
Estadística Descriptiva
5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0
8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7
e. Trace un diagrama de tallo y hojas de los datos. ¿Cuál parece ser un valor representativo
de la resistencia? Las observaciones, ¿parecen estar muy concentradas cerca del valor
representativo, o solo están dispersas?
f. El diagrama, ¿parece ser razonablemente simétrico respecto a su valor representativo,
o describiría su forma de otra manera?
g. ¿Parece haber algún valor extraño o atípico?
h. ¿Qué proporción de las observaciones de resistencia fueron mayores de 10 MPa en esta
muestra?
Solución
a. Tallo y hoja de C1 N = 27
Unidad de hoja = 0.10
1 5 9
6 6 33588
(11) 7 00234677889
10 8 127
7 9 077
4 10 7
3 11 368
38. El artículo citado en el problema anterior también presenta las siguientes observaciones
de resistencia en cilindros:
186
6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
a. Trace un diagrama comparativo de tallo y hojas, de los datos para vigas y cilindros y a
continuación conteste las preguntas de los incisos (b), (c), y (d) del problema anterior
para las observaciones con cilindros.
b. ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias entre
las observaciones para vigas y para cilindros?
c. Construya una gráfica de puntos de los datos del cilindro.
Solución
a. concreto cilindros
9 5 8 Tallo: unidades
88553 6 16 Hojas: décimos
98877643200 7 012488
721 8 13359
770 9 278
7 10
863 11 2
12 6
13
14 1
c.
39. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un
artículo de Technometrics (vol. 19 p. 425), revista dedicada a las aplicaciones estadísticas
en ciencias físicas e ingeniería.
88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 95.6 93.3 94.7 91.1
91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.2
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1 89.2 88.3 85.3 87.9
88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
187
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7 91.8 91.6 90.4 91.1
92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7
a. Trace un diagrama de tallo y hojas para estos datos. ¿Por qué es relativamente fácil
identificar un valor de octanaje? ¿Revela el diagrama algunas propiedades importantes
de los datos?
b. Elabore una distribución de frecuencias y un histograma.
c. Calcule la media, la varianza y la desviación estándar de la muestra.
d. Determine la mediana de la muestra.
Solución
a.
Tallo y hoja de C1 N = 79
Unidad de hoja = 0.10
Porque las hojas están alrededor del valor de 90 y 91 y están cercanamente simétricas a
estos valores, además la dispersión de los datos es pequeña con respecto al valor
representativo. Presenta dos huecos.
b. Distribución de frecuencias
Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa
83 x < 85 2 0.02531 93 x < 95 10 0.12658
c. y d.
Error
Variable N N* Media estándar Desv.Est. Mínimo Q1 Mediana Q3
79 0 90.671 0.316 2.806 83.400 88.700 90.500
92.200
Variable Máximo
100.300
40. Los siguientes valores de densidad relativa para diversos tipos de madera usados en la
construcción aparecieron en el artículo “Bolted Connection Design Values Based on
European Yield Model” (J. of Structural Engr.,1993: 2169 – 2186):
.31 .35 .36 .37 .38 .40 .40 .40 .41 .41 .42 .42 .42 .42 .42
.43 .44 .45 .46 .46 .47 .48 .48 .48 .51 .54 .54 .55 .58 .62
.66 .66 .67 .68 .75
Trace un diagrama de tallo y hojas que use tallos repetidos y haga comentarios sobre
las características interesantes que aprecie.
Solución
Tallo y hoja de C2 N = 31
Unidad de hoja = 0.010
1 3 1 Tallo: décimos
5 3 5678 Hojas: centésimos
15 4 0001122234
(7) 4 5667888
9 5 144
6 5 5
5 6
5 6 6678
189
1 7
1 7 5
41. El artículo “Determination of Most Representative Subdivisión” (J. of Energy Eng., 1993,
pp. 43-55) presentó datos con diversas características de subdivisiones que podrían usarse
para decidir si suministrar energía eléctrica con líneas aéreas o con líneas subterráneas.
A continuación vemos los valores de la variable x = longitud total de las calles dentro de
una subdivisión:
1280 5320 4390 2100 1240 3060 4770 1050 360 3330
3380 340 1000 960 1320 530 3350 540 3870 1250
2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770
3150 1890 510 240 396 1419 2109
a. Trace un diagrama de tallo y hojas con la cifra de los miles como tallo y la cifra de los
cientos como hoja, y comente las diversas propiedades del diagrama.
b. Trace un histograma usando los límites de clase 0, 1000, 2000, 3000, 4000, 5000 y
6000. ¿Qué proporción de las subdivisiones tienen una longitud total menor que 2000?
¿Entre 2000 y 4000? ¿Cómo describiría la forma del histograma?
Solución
a.
Tallo y hoja de N = 47
Unidad de hoja = 100
El histograma muestra la misma forma que el diagrama de tallo y hojas, con un sesgo
Positivo y con la frecuencia mayor en el primer intervalo, no tiene simetría.
42. El conjunto de datos adjuntos está formado por observaciones sobre resistencia al corte
(en libras) de soldadura de punto ultrasónico hecho en un cierto tipo de lámina de
duraluminio. Construya una distribución de frecuencias relativa y un histograma con base
en 10 intervalos de clase, con el primer intervalo que tenga un límite inferior de 4000 y
límite superior de 4200. Comente las características del histograma.
5434 4948 4521 4570 4990 5702 5241 5112 5015 4659 4806
4637 5670 4381 4280 5043 4886 4599 5288 5299 4848 5378
5260 5055 5828 5218 4859 4780 5027 5008 4609 4772 5133
5095 4618 4848 5089 5518 5333 5164 5342 5069 4755 4925
5001 4803 4951 5679 5256 5207 5621 4918 5138 4786 4500
5461 5049 4974 4592 4173 5296 4965 5170 4740 5173 4568
5653 5078 4900 4968 5248 5245 4723 5275 5419 5205 4452
5227 5555 5388 5498 4681 5076 4774 4931 4493 5309 5582
4308 4823 4417 5364 5640 5069 5188 5764 5273 5042 5189
4986
Solución
Distribución de Frecuencias
43. Un diagrama de Pareto es una variación de un histograma con datos categóricos que
resultan de un estudio de control de calidad. Cada categoría representa un tipo diferente
de producto que incumple las especificaciones o problema de producción. Las categorías
están ordenadas de modo que las que tienen la frecuencia más grande aparezcan en el
extremo izquierdo, luego la categoría con la segunda frecuencia mas grande y así
sucesivamente. Suponga que se obtiene la siguiente información sobre discordancia en
paquetes de circuitos componentes con fallas, 126; componente incorrecto, 210;
soldadura insuficiente, 67; exceso de soldadura, 54; componente faltante, 131. Construya
un diagrama de Pareto.
Solución
55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3
Solución:
a.
193
2 7 Tallo: decenas
3 01356799 Hojas: unidades y décimos
4 02457789
5 256689
6 0001112455568999
7 1145678
8 37
9 14
e. Porque serían muchos intervalos para el número de datos y además no se puede tomar
el mismo número en dos intervalos distintos.
f. Distribución de frecuencias
e. Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
50 58.54 2.33 16.46 27.10 45.57 60.80 69.42
Máximo
94.60
60.7 60.9
x 60.8
2
Error
f. N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
26 59.18 1.39 7.11 45.90 55.00 60.80 65.05
Máximo
69.30
Media del
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
40 58.35 1.86 11.76 36.70 47.47 60.80 67.73
Máximo
77.10
194
9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1 9.8
Solución
a.
8 58 Tallo: Unidades
9 02368 Hojas: Décimos
10 57
11 0
12 12
13 27
14
15 6
40
Porcentaje
30
20
10
0
8 10 12 14 16
Concentración de monóxido de carbono en ppm
f. s 2
i
x 10.88 s2
( x 10.88)
i
2
4.3345
n 1 14
g. s s 2 s 4.3345 2.08196
x
2
(163.2)2
x 1836.3
2 i
i
h. s 2 n s2 15 4.3345
n 1 14
Intervalos de
Frecuencia Intervalos de clase frecuencia
clase
10 ≤ x < 20 121 60 ≤ x < 70 120
20 ≤ x < 30 165 70 ≤ x 80 118
30 ≤ x < 40 184 80 ≤ x < 90 110
40 ≤ x <50 173 90 ≤ x <100 90
50 ≤ x < 60 142
Solución:
196
2
p
p p fi xi
fx fi xi2
i 1
i i
n
x i 1
s 2 i 1 xi = marcas de clase
n n 1
fi = frecuencia del intervalo
47. En “Applied Life Data Analysis” se presenta el tiempo de falla de un fluido aislante entre
electrodos a 34 kV. Los tiempos en minutos son:
0.19 0.78 0.96 1.31 2.78 3.16 4.15 4.67 4.85 6.50 7.35 8.01 8.27 12.06
31.75 32.52 33.91 36.71 72.89
Solución:
a.
Distribución de frecuencias
Intervalos Frecuencias Marcas de clase
0 x < 15 14 7.5
15 x < 30 0 22.5
30 x < 45 4 37.5
45 x < 60 0 52.5
60 x < 75 1 67.5
22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5
Solución:
Hay un ligero sesgo positivo, hay dispersión en los datos, es decir mucha variabilidad
No hay valores atípicos.
g. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
26.25 – (1.5)(43.75) = - 39.375 o 70 + (1.5)(43.75) = 135.62
En este caso no hay valores menores que – 39.375 ni mayores que 135.62
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor que
Q3 + 3.0 fs, por tanto sería:
26.25 – (3.0)(43.75) = - 105 o 70 + (3.0)(43.75) = 201.25
30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511
Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.
Solución:
Hay un sesgo positivo en los datos, hay un valor extremo (x = 511), presenta una ligera
dispersión, los valores con los que fue construida la caja son:
xmin 30, xmax 511, x 119, Q1 87, Q3 182, f s 95 , 1.5fs = 142.5, 3.0fs = 285
Q3 3.0 f s 182 285 467 , de ahí que 511 > 467 es un valor extremo
50. Se seleccionó una muestra de 20 botellas de vidrio de cierto tipo y se midió la resistencia
de cada una a la presión interna. Examine la siguiente información parcial de la muestra:
Solución:
a. f s 216.8 196 20.8, 1.5 f s 31.2, 3.0 f s 62.4 ,
O
51. El artículo “A Thin – film Oxygen Uptake Test for the Evaluation of Automotive
Carnkcase Lubricants” (Lubric. Engr., 1984, pp. 153-159) publicó los siguientes datos
del tiempo de oxidación – inducción (en minutos) de varios aceites comerciales:
87 103 130 160 180 195 132 145 211 105 145 153 138 87
99 93 119 129 152
Solución:
error
a. Variable N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
Tiempo 19 134.89 8.16 35.56 87.00 103.00 132.00 153.00
35.65 1264.52
c. 1 h = 60 min, por tanto sh 0.593 y sh2 0.3513
60 3600
d.
Gráfica de caja del tiempo de oxidación de ciertos aceites lubricantes
52. Se seleccionaron muestras de tres tipos distintos de cable de acero y se determinó el límite
de fatiga, en MPa, para cada muestra con los resultados siguientes:
Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391 391 392
Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383 388 392
Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380 380 392
e. Trace un diagrama de puntos comparativo (un diagrama de puntos para cada muestra
con una escala común). Comente acerca de semejanzas y diferencias.
f. ¿El diagrama de caja comparativo del inciso (a) proporciona una información
evaluativa de las semejanzas y diferencias? Explique por qué.
Solución:
c. Los resúmenes de 5 números: x , los dos cuartiles y las observaciones menor y mayor,
son idénticos en los tres tipos y no hay valores atípicos, por tanto los tres diagramas
de caja individuales, resultan idénticos.
d.
T1
T2
T3
b.
Límite de fatiga para tres tipos diferentes de cables de acero
Variable
T1
T1 T2
T2 T3
T3
354 360 366 372 378 384 390
MPa
202
e. El diagrama de caja del inciso (a) no es capaz de detectar las diferencias entre los tres
conjuntos de datos, la razón principal es que los diagramas de caja dan solo algunos
detalles porque se usa un resumen de sólo 5 datos para comparar el conjunto de datos.
Probabilidad
10. Suponga que los vehículos que toman una determinada salida de la autopista pueden dar
vuelta a la derecha (R), a la izquierda (L) o seguir derecho (S). Imagine que observa la
dirección de tres vehículos sucesivos.
a. Haga una lista de todos los resultados en el evento A, donde tres vehículos toman la
misma dirección.
b. Haga una lista de todos los resultados en el evento B donde tres vehículos toman
direcciones distintas
c. Haga una lista de todos los resultados en el evento C donde sólo dos de los tres
vehículos dan vuelta a la derecha.
d. Haga una lista de todos los resultados en el evento D donde sólo dos vehículos van en
la misma dirección.
e. Haga una lista de los resultados en D’, C D y C D .
Solución
El espacio muestral es el siguiente:
11. Una biblioteca en una universidad tiene cinco ejemplares de un cierto texto en reserva.
Dos ejemplares (1,2) son primeras impresiones y los otros tres (3, 4,5) son segundas
203
Solución
A1 A2 A3 A1 A2 A3
204
A1 (A2 A3)
Solución
205
a. A1 ⋃ A2 Se otorga el proyecto 1 0 el 2
P(A1 ⋃ A2) = P(A1) + P(A2) - P(A1 ∩ A2) = 0.22 + 0.25 – 0.11 = 0.36
b. A1’∩ A2’ = (A1 ⋃ A2)’ No se otorgue el proyecto 1 ni el 2
P(A1 ⋃ A2)’ = 1 – P(A1 ⋃ A2) = 1 – 0.36 = 0.64
c. A1 ⋃ A2 ⋃ A3 Se otorga el proyecto 1 o el 2 o el 3
P(A1 ⋃ A2 ⋃ A3) = P(A1) + P(A2) + P(A3) - P(A1 ∩ A2) - P(A1 ∩ A3) - P(A2 ∩ A3)
+ P(A1 ∩ A2 ∩ A3) = 0.22 + 0.25 + 0.28 – 0.05 – 0.07 – 0.11 + 0.01 = 0.53
A1 A2
A1 A2
.08
.08 .07 .10
.07 .10
.01
.01 .06
.06 .04
.04
.17
.17 A3
A3
14. Una biblioteca tiene cinco ejemplares de cierto texto, de los cuales 1 y 2 son primeras
impresiones y 3, 4 y 5 son segundas impresiones. Serán seleccionados al azar dos
ejemplares para ser puestos en reserva de 2 horas (lo que indica 10 resultados igualmente
probables).
a. ¿Cuál es la probabilidad de que ambos ejemplares seleccionados sean primeras
impresiones?
b. ¿Cuál es la probabilidad de que ambos ejemplares seleccionados sean segundas
impresiones?
c. ¿Cuál es la probabilidad de que, al menos uno de los ejemplares seleccionados sea una
primera impresión?
d. ¿Cuál es la probabilidad de que los ejemplares seleccionados sean de diferentes
impresiones?
206
Solución
(1, 2) (1,3) (1, 4) (1,5) (2,3)
S
(2, 4) (2,5) (3, 4) (3,5) (4,5)
n( A)
i. P( A) P(A) es la probabilidad del evento A, n(A) son los resultados favorables
n
1
y N el número total de resultados, por tanto n(A) = 1, N = 10 P( A) 0.1
10
3
ii. n(B) = 3 P( B) 0.3
10
7
iii. n(C) = 7 P(C ) 0.7 Al menos uno significa uno o ambos ejemplares sean
10
primeras impresiones.
6
iv. n(D) = 6 P( D) 0.6
10
15. Un sistema puede tener tres tipos de defectos: Ai ( i = 1,2,3) es cuando este sistema puede
tener un defecto del tipo i. Suponga que
P(A1) = 0.12 P(A2) = 0.07 P(A3) = 0.05 P(A1 A2) = 0.13 P(A1 A3) = 0.14
P(A2 A3) = 0.10 P(A1 A2 A3) = 0.01
a. ¿Cuál es la probabilidad de que el sistema no tenga el defecto tipo 1?
b. ¿Cuál es la probabilidad de que el sistema tenga defectos tipo 1 y 2 al mismo tiempo?
c. ¿Cuál es la probabilidad de que el sistema tenga defectos tipo 1 y tipo 2 al mismo
tiempo pero no tenga defectos tipo 3?
d. ¿Cuál es la probabilidad de que el sistema tenga a lo sumo dos de esos defectos?
Solución
A1 A2
0.0
.04 .05
.01
.01
.02
.01
A3
b. P(A1 A2) = P(A1) + P(A2) - P(A1 A2) P(A1 A2) = 0.12 + 0.07 – 0.13 = 0.06
f. P(a lo sumo tenga dos defectos) = 1 – P(tenga los tres defectos) = 1 – 0.01 = 0.99
207
16. Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta
compañía, presentan grietas en la parte inferior del bastidor principal; suponga que una
ciudad tiene 20 de estos autobuses y que han aparecido grietas en 8 de ellos.
a. ¿Cuántas formas hay de seleccionar una muestra de 5 autobuses de los 20 para una
inspección completa?
b. ¿En cuántas formas puede una muestra de cinco autobuses contener exactamente 4 con
grietas visibles?
c. Si se escoge al azar una muestra de 5 autobuses, ¿cuál es la probabilidad de que
exactamente 4 de los 5 tengan grietas visibles?
d. Si se seleccionan los autobuses como en el inciso (c), ¿cuál es la probabilidad de que
al menos 4 de los seleccionados tengan grietas visibles?
Solución
20
a. Número de formas = 15504
5
8 12
b. Número de formas = 840
4 1
8 12
c. P( X 4)
4 1 840
0.0542
20 15504
5
P( X 4) P( X 4) P( X 5)
8 12 8 12
d.
P( X 4) 0.0542 0.0036 0.0578
4 1 5 0
20 20
5 5
17. Una planta de producción emplea 20 trabajadores de turno de día y 15 en el segundo turno
y 10 en el de la noche, Un consultor de control de calidad selecciona 6 de estos
trabajadores para hacerles una entrevista. Supongamos que la selección se hace en tal
forma que cualquier grupo de 6 trabajadores tiene la misma probabilidad de ser
seleccionado, del mismo modo que cualquier otro grupo (seleccionar 6 sin sustitución de
entre 45).
a. ¿De cuántas maneras se pueden seleccionar 6 trabajadores que provengan del turno de
día? ¿Cuál es la probabilidad de que los 6 trabajadores seleccionados sean del turno de
día?
b. ¿Cuál es la probabilidad de que los 6 trabajadores seleccionados sean del mismo turno?
c. ¿Cuál es la probabilidad de que, al menos dos turnos diferentes sean representados
entre los trabajadores seleccionados?
208
25 30 35
P( A1 ) 6
, P( A2 ) 6
, P( A3 )
6
P(A1 A2) = P( todos del turno
45 46 46
6 6 6
nocturno)
10 15 20
P( A1 A2 ) , P( A1 A3 ) , P( A2 A3 ) , P(A1 A2 A3) = 0
6 6 6
45 45 45
6 6 6
25 30 35 10 15 20
P( D) 0.2885
6 6 6 6 6 6
45
6
Solución:
i. Sea T = 3, P = 4 y C = 5, entonces n1 = 3, n2 = 4, n3 = 5
Entonces N = (3)(4)(5) = 60
19. En el problema anterior suponga que se hacen cinco corridas experimentales diferentes
el primer día de experimentación. Si las cinco se seleccionan al azar de entre todas las
posibilidades, de tal modo que cualquier grupo de cinco tiene la misma probabilidad de
selección, ¿Cuál es la probabilidad de que se utilice un catalizador diferente en cada
corrida?
Solución
60
Sea A ={uso de un catalizador diferente en cada corrida}, hay formas de seleccionar
5
las cinco corridas y además ya que 60/5 = 12, en doce corridas diferentes se usa el mismo
catalizador, así que el número de forma de seleccionar una corrida de de cada uno de
estos grupo es 125, entonces la probabilidad de A es:
125
P( A) 0.0456
60
5
Probabilidad Condicional
20. Cierto automóvil deportivo está equipado con transmisión automática o con transmisión
manual y se puede adquirir en uno de cuatro colores. Las probabilidades relevantes de las
diversas combinaciones de tipo de transmisión y color son las siguientes:
color
Blanco Azul Negro Rojo
Solución:
f. P(A) = 0.15 + 0.10 + 0.10 + 0.10 = 0.45
P (B) = 0.10 + 0.25 = 0.25
P(A B) =0.10
P( A B) 0.10
g. P( A / B) 0.40
P( B) 0.25
Probabilidad de que el automóvil tenga transmisión automática si se adquirió en
color negro.
P( A B) 0.10
P( B / A) 0.22
P( A) 0.45
Probabilidad de que el automóvil sea negro si se adquirió con transmisión automática.
P( A C ) 0.15
h. P( A / C ) 0.5
P(C ) 0.30
P( A C ' )
P( A / C ' ) P(C ' ) 0.70 P( A' ) 0.55
P(C ' )
(A’ C)’ = A C’
P (A C’) = P(A) – P(A C) = 0.45 – 0.15 = 0.30
P( A C ' ) 0.30
P( A / C ' ) 0.429
P(C ' ) 0.70
21. Un sistema puede tener tres tipos de defectos: Ai (i = 1, 2, 3) es cuando este sistema
puede tener un defecto del tipo i. Suponga que:
P (A1) = 0.12, P (A2) = 0.07, P (A3) = 0.05, P (A1⋃ A2) = 0.13, P (A1 ⋃ A3) = 0.14
P (A2 ⋃ A3) = 0.10, P (A1 ∩ A2 ∩ A3) = 0.01
e. Si el sistema tiene defecto tipo 1, ¿cuál es la probabilidad de que tenga un defecto tipo
2?
f. Si el sistema tiene un defecto tipo 1, ¿cuál es la probabilidad de que tenga los tres tipos
de defectos?
g. Si el sistema tiene al menos un tipo de defecto, ¿cuál es la probabilidad de que tenga al
menos un tipo de defecto?
h. Si el sistema tiene los dos primeros tipos de defectos a la vez, ¿cuál es la probabilidad
de que no tenga el tercer tipo de defecto?
Solución
211
P( A1 A2 ) P( A1 ) P( A2 ) P( A1 A2 )
0.12 0.07 0.13 0.06
P( A2 A3 ) P( A2 ) P( A3 ) P( A2 A3 )
0.07 0.05 0.10 0.02
P( A1 A3 ) P( A1 ) P( A3 ) P( A1 A3 )
0.12 0.05 0.14 0.03
P( A1 A2 ) 0.06
a. P( A2 / A1 ) 0.5
P( A1 ) 0.12
P( A1 A2 A3 ) 0.01
b. P( A1 A2 A3 / A1 ) .0833
P( A1 ) 0.12
0.05
P(C / B) 0.357
0.14
22. Para clientes que compran un juego completo de neumáticos en cierta distribuidora,
considere los eventos:
212
Solución 0.80
a. P( A B C) 0.75 0.9 0.8 0.54 C
0.90
B C’
P( B C ) P( A B C ) P( A ' B C )
b. 0.10 0.60
0.54 (0.25 0.8 0.7) 0.68
0.75 B’ C
c, A
P(C ) P( A B C ) P( A ' B C ) C’
23. En cierta gasolinería, 40% de los clientes utilizan gasolina regular sin plomo (A1), 35%
gasolina extra sin plomo (A2) y 25% gasolina Premium sin plomo (A3). De los clientes
que consumen gasolina regular, sólo 30% llenan sus tanques (evento B). De los que
consumen gasolina extra, 60% llenan sus tanques, mientras que de los que usan Premium,
50% llenan sus tanques.
d. ¿Cuál es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y
llene su tanque (A2 ∩ B)?
e. ¿Cuál es la probabilidad de que el siguiente cliente llene su tanque?
f. Si el siguiente cliente llena su tanque, ¿cuál es la probabilidad de que pida gasolina
regular?, ¿extra? Y ¿Premium?
Solución
213
0.40
A1 P(A 2 B) = 0.35 0.6 = 0.210
0.60
B
0.35
A2
0.25
A3
0.50
P(A3 B) = 0.25 0.5 = 0.125
a. P( A1 B) 0.21
P( A1 B) 0.12
c. P( A1 / B) 0.264
P( B) 0.455
P( A2 B) 0.21
P( A2 / B) 0.462
P( B) 0.455
P( A3 B) 0.125
P( A3 / B) 0.274
P( B) 0.455
Independencia
Solución
2. Una compañía de prospección petrolera tiene dos proyectos activos, uno en Asia y otro en
Europa. Sea A, el evento donde el proyecto asiático tiene éxito y B el evento donde el
proyecto europeo sea exitoso. Suponga que A y B son independientes con P(A) = 0.4 y
P (B) = 0.7.
a. Si fracasa el proyecto asiático, ¿cuál es la probabilidad de que también fracase el
proyecto europeo? Explique su razonamiento.
b. ¿Cuál es la probabilidad de que por lo menos uno de los proyectos tenga éxito?
c. Dado que por lo menos uno de los dos proyectos es exitoso, ¿cuál es la probabilidad
de que sólo el proyecto asiático tenga éxito?
Solución
P( A ( A B)) 0.12
c. P( A / A B) 0.146
P( A B) 0.82
3. Una costura hecha en un avión necesita 25 remaches. La costura tendrá que volver a
realizarse si cualquiera de los remaches está defectuoso. Suponga que los remaches están
defectuosos independientemente unos de otros, cada uno con la misma probabilidad.
a. Si 14% de todas las costuras necesitan volver a efectuarse, ¿Cuál es la probabilidad de
que un remache esté defectuoso?
b. ¿Qué tan pequeña debe ser la probabilidad de un remache defectuoso para asegurar
que solo 10% de todas las costuras necesiten volver a ejecutarse?
Solución:
q = 0.006015
q 1 0.99579 0.00421
q = 0.00421
Solución:
5. Dos bombas conectadas en paralelo fallan independientemente una de otra en un día dado.
La probabilidad de que la bomba más vieja falle es 0.10 y la probabilidad de que solo la
bomba más nueva falle es 0.05. ¿Cuál es la probabilidad de que el sistema de bombeo falle
en cualquier día dado (lo que sucederá si ambas bombas fallan)?
Solución:
Sea B1 la bomba mas vieja falla
11
Sea B2 la bomba nueva falla
La probabilidad de que el sistema falle P (B1 B2)
Sea P (B1 B2) = x, entonces P (B1) = 0.10 + x y
2
P (B2) = 0.05 + x
P( B1 B2 ) P( B1 ) P( B2 ) (0.10 x)(0.05 x)
(0.10 x)(0.05 x) x
0.005 0.15 x x 2 x x 2 0.85 x 0.005 0
0.85 0.7225 9.020 0.85 0.838
x
2 2
x1 0.844 x2 0.0059
1 2
4
3
Solución:
Sea P(Ai), la probabilidad de que el componente i = 1, 2, 3, 4 funcionen y
P(A1) = P(A2) = P(A3) = 0.90 y P(A4) = 0.95, entonces
3 4
Solución:
P(sist. funcione) P A1 A2 P( A3 A4 )
P A1 A2 P A3 A4 P ( A1 A2 ) ( A3 A4 )
=P( A1 ) P( A2 ) ( A1 A2 ) P( A3 ) P( A4 )
P ( A1 A3 A4 ) A2 A3 A4
P( A1 ) P( A2 ) P( A1 ) P( A2 ) P( A3 ) P( A4 ) P( A1 ) P( A3 ) P( A4 )
P( A2 ) P( A3 ) P( A4 ) P( A1 ) P( A2 ) P( A3 ) P( A4 )
0.9 0.9 0.92 0.92 0.93 0.93 0.9 4
1.8 1.458 0.6561 0.9981
P (sist. funcione) = 0.9981
8. En la siguiente configuración, ¿Cuál debe ser la probabilidad P(Ai) para que el coeficiente
de confiabilidad del tiempo de vida media del sistema sea 0.99? (Sugerencia: sea P(Ai) =
p, exprese la confiabilidad del sistema en términos de p y luego sea x = p2.)
1 2
3 4
Solución:
Teorema de Bayes
218
1. Una compañía telefónica regional opera tres estaciones relevadoras idénticas en diferentes
sitios. Durante un período de un año, el número de desperfectos reportados por cada
estación y las causas se muestran abajo.
Estaciones A B C
Problemas con el suministro de
2 1 1
electricidad
Desperfecto de la computadora 4 3 2
Suponga que se reporta una falla y se encuentra que fue ocasionada por errores humanos.
¿Cuál es la probabilidad de que provenga de la estación C?
3. Una compañía fabrica empaques de hule para tuberías en tres sitios distintos de una
ciudad, llamémosles S1, S2 y S3, los cuales producen respectivamente 45, 30 y 25% del
total. Se estima que 8% de los empaques de S1 son defectuosos, mientras que para S2 y
S3 las cifras correspondientes son 6% y 3%. Los fabricados en los tres sitios se concentran
luego en bodega. Si un inspector de control de calidad toma un empaque al azar y lo
encuentra defectuoso, ¿qué probabilidad hay de que provenga de S1?
4. Sesenta por ciento de los aviones que desaparecen en vuelo, en cierto país, son
descubiertos posteriormente. De las naves descubiertas, 60% tienen localizador de
emergencia, mientras que 90% de los no descubiertos no tienen ese localizador. Suponga
que desaparece un avión ligero.
a. Si tiene localizador de emergencia, ¿cuál es la probabilidad de que no sea localizado?
b. Si no tiene localizador de emergencia, ¿cuál es la probabilidad de que sea localizado?
5. Se envían componentes de cierto tipo a un proveedor en lotes de 10. Suponga que 50% de
estos lotes no tienen componentes defectuosos, 30% un componente defectuoso y 20%
219
6. En una fábrica los obreros trabajan tres turnos distintos. En el último año ocurrieron 200
accidentes. Algunos de estos pueden atribuir por lo menos en parte a las condiciones
inseguras de trabajo, en tanto que otros se relacionan con las condiciones de trabajo. En
la tabla siguiente se proporciona el porcentaje de accidentes que caen en cada tipo de
categoría accidente - turno.
Condiciones Condiciones no
inseguras relacionadas
Diurno 10% 35%
Turno Vespertino 8% 20%
Nocturno 5% 22%
Suponga que se elige al azar uno de los 200 informes de accidentes de un archivo y
redetermina el turno y tipo de accidente.
1. ¿Cuáles son los eventos simples?
2. ¿Cuál es la probabilidad de que el evento seleccionado se atribuya a condiciones
inseguras?
3. ¿Cuál es la probabilidad de que no ocurra en el turno diurno?
7. Los datos recopilados por el departamento de justicia, acerca del número de personas
arrestadas por diversos crímenes en 1998, revelaron que 89% eran hombres y 11%
mujeres. De ellos, 30% contaban con menos de 18 años, mientras que 27% de ellas tenían
menos de 18 años.
a. ¿Cuál es la probabilidad de que el arrestado por un crimen tuviera menos de 18 años?
b. Si una persona arrestada por un crimen tenía menos de 18 años, ¿cuál es la probabilidad
de que sea una mujer?
8. Una compañía de seguros ha recopilado los siguientes datos relativos a la edad de los
conductores y la tasa de accidentes dentro de cada grupo.
% de conductores Tasa de
Grupo de edad
asegurados accidentes
Menos de 25 0.16 0.055
25- 44 0.40 0.025
45 - 64 0.30 0.02
65 o más 0.14 0.40
220
1. Cuando un automóvil es detenido por una patrulla, se revisa el desgaste de cada neumático y cada
faro delantero, para ver si está correctamente alineado. Representemos con X el número de faros
delanteros que necesitan ajuste y con Y el número de neumáticos defectuosos.
a. Si X y Y son independientes con px(0) = 0.5, px(1) = 0.3, px(2) = 0.2 y py(0) = 0.6, py(1) = 0.1,
py(2) = py(3) = 0.05 py(4) = 0.2, presente la fpm conjunta de (X, Y) en una tabla de probabilidad
conjunta.
b. Calcule P(X ≤ 1 y Y ≤ 1) de la tabla de probabilidad conjunta y verifique que sea igual al
producto de P(X ≤ 1) · P(Y ≤ 1).
c. ¿Cuál es P(X + Y = 0) (la probabilidad de no violaciones)?
d. Calcule P(X + Y ≤ 1).
Solución:
a.
x 0 1 2 y 0 1 2 3 4
p(x) 0.5 0.3 0.2 p(y) 0.6 0.1 0.05 0.05 0.2
y
p(x, y) 0 1 2 3 4
0 0.30 0.05 0.025 0.025 0.10
x 1 0.18 0.03 0.015 0.015 0.06
2 0.12 0.02 0.010 0.010 0.04
c. P( X Y 0) p(0,0) 0.30
x
y 8 9 10 11
1.20 0.1 0.04 0 0
1.25 0.05 0.11 0.2 0
1.30 0 0.1 0.15 0.1
222
Cov( X , Y )
b. XY , Cov( X , Y ) E ( XY ) E ( X ) E (Y ) , E h( X , Y ) h( x, y) p( x, y)
XY x y
A partir de estas distribuciones obtenemos E(X) = 9.65 y E(Y) = 1.2755, entonces la covarianza
es, Cov.(X, Y) = 12.3395 – (9.65)(1.2755) = 0.030925
V ( X ) E( X 2 ) E( X ) , V (Y ) E(Y 2 ) E(Y ) , X V ( X ), Y V (Y )
2 2
0.030925
0.70587 0.70587
(0.963)(0.0455)
3. Sea X el número de veces que falla cierta máquina de control numérico: 1, 2 o 3 veces en un día
dado. Sea Y el número de veces que se llama a un técnico para una emergencia. Su distribución
de probabilidad conjunta está dada como:
p(x, y) x 1 2 3
1 0.05 0.05 0.10
y 2 0.05 0.10 0.35
3 0 0.20 0.10
a. b.
x 1 2 3 y 1 2 3
c. P(Y = 3 /X =2)
p ( x, y ) p(2, y )
P Y X , P Y X 2
px ( x) px (2)
p(2,1) 0.05 p(2, 2) 0.10 p(2,3) 0.20
0.1428, 0.2857, 0.5715
px (2) 0.35 px (2) 0.35 px (2) 0.35
y 1 2 3
P(Y = 3 /X = 2) = 0.5715
x
y 2 3 3.5 4 5
3 2 1
2 35 35 35 0 0
1 10 2 1
3 35 35 35 35 0
1 5 1 1
3.5 0 35 35 35 35
3 2
4 0 0 0 35 35
1 1
5 0 0 0 35 35
Solución:
a.
x 2 3 3.5 4 5
4 13 8 6 4
px (x) 35 35 35 35 35
224
y 2 3 3.5 4 5
6 14 8 5 2
Py (y) 35 35 35 35 35
y 2 3 3.5 4 5
1 1 3 1
p( y / x 4) 0
6 6 6 6
1 1 1
c. P(Y 3/ X 4) 0 P(Y 3/ X 4)
6 6 6
x
y 2 5 8
0.4 0.15 0.12 0.03
0.8 0.05 0.30 0.35
Solución:
a.
x 2 5 8 y 0.4 0.8
px ( x) 0.20 0.42 0.38 py ( y) 0.30 0.70
y 0.4 0.8
p( y / x 8) 0.0789 0.9211
Cov( X , Y )
c. XY , Cov( X , Y ) E ( XY ) E ( X ) E (Y )
XY
V ( X ) E( X 2 ) E( X ) , V (Y ) E(Y 2 ) E(Y ) , X V ( X ), Y V (Y )
2 2
0.2088
0.5131 0.5131
(2.22)(0.1833)
e ( x y ) x 0, y0
f ( x, y )
0 de otro modo
Solución:
a. Para que una fdp sea legítima, (i) f(x, y) > 0 y (ii)
f ( x, y)dxdy 1 , en este caso por la
forma en que esta definida la función f(x, y) > 0 , cumpliéndose la primera condición.
e ( x y ) dxdy e y e x dy e y ((0 1))dy e y dy
0 0 0 0 0 0
y
e
0
(0 1) 1
0 0
e ( x y ) dxdy 1
226
Se cumple la segunda condición por tanto f(x, y) es una distribución de probabilidad legítima
e ( x y ) dxdy e y e x dy e y ((e 1 1))dy
2 1 2 1 2
P( X 1, Y 2)
0 0 0 0 0
b.
(1 e1 ) e y (1 e1 )(1 e2 ) 0.5466
2
P( X 1, Y 2) 0.5466
0
f ( x, y )
f ( x / y) , f y ( y ) e ( x y ) dx e y (e x ) e y (0 1) e y
f y ( y) 0 0
c.
f ( x, 2) e ( x 2)
f ( x / y 2) 2 e x , las variables son independientes, por tanto
f y (2) e
1
P(0 X 1/ Y 2) e x dx e x
1
(e1 1) 0.6321 P(0 X 1/ Y 2) 0.6321
0 0
4 xy , 0 x 1. 0 y 1
f ( x, y)
0 en cualquier otro caso
a. Encuentre P(0 X 12 y 14 Y 12 )
b. P(X < Y)
c. Determine si las va X y Y son independientes.
Solución:
0.5 0.5 0.5 0.5
P(0 X 12 , 14 Y 12 ) 4 xydxdy dy 12
0.5
2 y x2 ydy
0.25 0 0.25 0 0.25
0.5
a. 14 y 2 14 ( 14 161 ) 643 0.04687
0.25
P(0 X 12 , 14 Y 12 ) 0.04687
1 y 1 1 1
b. P( X Y ) 4 xydxdy 2 y x 2 dy 2 y 3dy 12 y 4
y 1
0 0 0 0 0 0 2
1
P( X Y )
2
1
f x ( x) 4 xydy 2 x y 2
1
2 x,
0 0
1
f y ( y ) 4 xydx 2 y x 2
1
c. 2y
0 0
Puesto que f x ( x) f y ( y ) 2 xy f ( x, y )
Son independientes
8. Sea X el diámetro de un cable eléctrico blindado y Y el diámetro del molde cerámico que tiene el
cable. X y Y tienen una escala tal que están entre 0 y 1. Suponga que X y Y tienen una fdp conjunta:
227
1
, 0 x y 1
f ( x, y ) y
0
de cualquier otra forma
Solución:
a.
1
1 y 1 y 1
P( X Y 12 ) 1 dxdy 1
2
1y
dxdy
4 y 2 2
0 y
2 1
1 11
1 x 1 y dy 1 x 0
y y
4 y 2 2 y
1
1 1 11
1 y y dy 12 ( y )dy
2
4 y 2 y
2 1
1 1
1 2 dy 1 dy
4
2y 2
1 1 1 1 1 2 1 1
2 y 12 ln y 12 y 1 2( 12 14 ) ln (1 12 ) 0.3466 0.6534
1
4 2 4 2 2 1 4 2 2
P( X Y 12 ) 0.6534
Cov( X , Y )
b. XY , Cov( X , Y ) E ( XY ) E ( X ) E (Y )
XY
V ( X ) E( X 2 ) E( X ) , V (Y ) E(Y 2 ) E(Y ) , X V ( X ), Y V (Y )
2 2
1 y 1 11 1 1 1 1
E ( XY ) xy dxdy x 2 dy y 2 dy y 3
y 1
0 0
y 0 2 0 2 0 6 0 6
1 y 1 1 1 1 1 1 1
E( X ) x dxdy x 2 dy ydy y 2
y 1
0 0
y 0 2y 0 2 0 4 0 4
1 1 y 1 1 1 1
E (Y )
y dxdy x 0 dy ydy y 2
1
y
0
y 0 0 0 2 0 2
1 1 1 1 1
Cov.( X , Y ) Cov.( X , Y )
6 4 2 24 24
228
1 y 1 1 1 1 1 1 1
E( X 2 ) x 2 dxdy x 3 dy y 2 dy y 3
y 1
0 0
y 0 3y 0 3 0 9 0 9
1 y 1 1 1 1 1
E (Y 2 ) y 2 dxdy y x 0 dy y 2 dy y 3
1
y
0 0
y 0 0 3 0 3
2 2
1 1 7 1 1 1
V (X ) , V (Y ) , X 0.22048, Y 0.28867
9 4 144 3 2 12
1 24
0.6546 0.6546
(0.22048)(0.28867)
2, 0 x y, 0 y 1
f ( x, y )
0 de otra manera
a. x 0
f x ( x) f y ( y ) 4 y (1 x) f ( x, y ) No son independientes
f ( x, y ) f ( x, 34 ) 2 4
f ( x / y) , f ( x / y 34 ) 3
3
f y ( y) f y ( 4 ) 2( 4 ) 3
b.
4 0 x 3
f ( x / y 34 ) 3 4
0 de otra manera
1
4 4 1 41 1 1 1
P( 14 X 12 / Y 43 ) 1 dx x 12 P( 14 X 12 / Y 34 )
2
4 3 3 4 3 2 4 3 3
6 x, 0 x 1, 0 y 1 x
f ( x, y)
0 en cualquier otro caso
Solución:
a.
1 x 1 x
f x ( x) 6 xdy 6 x y 0
6 x(1 x)
0
1 y 1 y
f y ( y) 6 xdx 3 x 2 3(1 y ) 2
0 0
f x ( x) f y ( y ) 18(1 x)(1 y ) 2 f ( x, y )
No son independientes
b.
f ( x, y ) f ( x,0.5) 6x
f ( x / y) , f ( x / y 0.5) 8x
f y ( y) f y (0.5) 3 1 12 2
8 x 0 x 0.5
f ( x / y 0.5)
0 de otra manera
0.5
P( x 0.3/ y 0.5) 8 xdx 4 x 2
0.5
4(0.25 0.09) 0.64 P( x 0.3/ y 0.5) 0.64
0.3 0.3
3x y
, 1 x 3, 1 y 2
f ( x, y ) 9
0 en cualquier otro caso
1 32
b. f x ( x) f y ( y) 3x 6 y f ( x. y), No son independientes
9 29
3
1 3 3 1 3x 2 3x 1 16 6 5 5
c. P( X 2) 3x dx P( X 2) 0.555
9 2 2 9 2 2 2 9 2 2 9 9
230
12. Se miden la tensión superficial y la acidez de un producto químico. Estas variables se codifican
de modo tal que la tensión superficial se mide en una escala 0 ≤ X1 ≤ 2, y la acidez se mide en una
escala 2 ≤ X2 ≤ 4. La función de densidad de probabilidad de X1 y X2 está dada por
k (6 x1 x2 ) 0 x1 2, 2 x2 4
f ( x1 , x2 )
0 en otro caso
a. Encuentre el valor de k.
b. Calcule P(X1 < 1, X2 < 3)
c. Calcule P(X1 + X2 ≤ 4)
d. Encuentre P(X1 < 1.5)
e. Encuentre las densidades marginales de X1 y X2.
Solución:
a.
2
4 2 x2
4 4
k (6 x1 x2 )dx1dx2 k 6 x1 1 x2 x1 dx2 k (10 2 x2 )dx2
2 0 2
2 0 2
1 2 4 x1
2
6 4 x1 x1 (4 x1 ) (10 2 x1 ) dx1
8 0 2
2
1 2 x2 1 x3 2
6 4 x1 1 dx1 6 x1 2 x12 1
8
0 2 8 6 0 3
2
P( X 1 X 2 4)
3
d. y e. Se obtendrán primero las distribuciones marginales.
231
4
x2 1 1
f x1 ( x1 ) (6 x1 x2 )dx2 6 x2 x1 x2 2 16 4 x1 10 2 x1 (3 x1 )
4
2
2 2 8 4
2
x2 1 1
f x 2 ( x2 ) (6 x1 x2 )dx1 6 x1 x1 x2 1 10 2 x2 (5 x2 )
2
0
2 0 8 4
1 1
(3 x1 ) 0 x1 2 (5 x2 ) 2 x1 4
f x1 ( x1 ) 4 f x2 ( x2 ) 4
0 de otra manera 0 de otra manera
1.5
1 1.5 1 x2 1
P( X 1 1.5) (3 x1 )dx1 3x1 1 (4.5 1.125) 0.84375
4 0 4 2 0 4
P( X 1 1.5) 0.84375
13. Un instructor ha aplicado un breve cuestionario que consta de dos partes. Para un estudiante
seleccionado al azar, sea X = número de aciertos en la primera parte, Y = número de aciertos en
la segunda parte y suponga que la fpm conjunta de X y Y está dada en la tabla siguiente
y
p(x,y) 0 5 10 15
0 0.02 0.06 0.02 0.10
x 5 0.04 0.15 0.20 0.10
10 0.01 0.15 0.14 0.01
x 0 5 10 y 0 5 10 15
px ( x) 0.20 0.49 0.31 py ( y) 0.07 0.36 0.36 0.21
E(X) = 5.55, E(Y) = 8.55, E(X 2) = 43.25, E(Y 2) = 92.25
Cov.(X, Y) = E(XY) – E(X)E(Y)
Cov.(X, Y) = 44.25 – (5.55)(8.55) = -3.2025 Cov.(X, Y) = 3.2025
1. Hay dos semáforos en mi camino hacia el trabajo. Suponga que X1 es el número de semáforos en
los debo detenerme y que la distribución de X1 es como sigue:
x1 0 1 2
= 1.1 2 = 0.49
Sea X2 el número de semáforos en los que debo detenerme al regresar a casa; X2 tiene la misma
distribución que X1, de modo que X1, X2 es una muestra aleatoria de tamaño n = 2.
a. Sea To = X1 + X2 y determine la distribución de probabilidad de To.
b. Calcule To. ¿Cómo se relaciona con , la media poblacional?
c. Calcule 2To. ¿Cómo se relaciona con 2, la varianza poblacional?
Solución:
a.
2. Una compañía mantiene tres oficinas en cierta región, cada una manejada por dos empleados. La
información de salarios anuales (miles de dólares) es la siguiente:
Oficina 1 1 2 2 3 3
Empleado 1 2 3 4 5 6
Salario 19.7 23.6 20.2 23.6 15.8 19.7
a. Suponga que dos empleados se seleccionan al azar de entre los seis (sin reemplazo). Determine
la distribución muestral del salario medio muestral X .
b. Suponga que una de las tres oficinas se selecciona al azar y denote por X1 y X2 los salarios de
los dos empleados. Determine la distribución muestral de X .
c. ¿Cómo se compara E( X ) de los incisos (a) y (b) con el salario medio poblacional ?
233
Variables Aleatorias
Discretas
d. Tres automotores se seleccionan al azar y cada uno se clasifica como equipado con motor diesel
(S) o no diesel (F) (por lo cual los resultados son SSS, SSF, etc.). Si X = número de automóviles
entre los tres motores diesel, enumere cada resultado de S y su valor X asociado.
Solución:
e. Dé tres ejemplos de variable aleatoria de Bernoulli (que no sean los mencionados en clase).
Solución;
f. Para cada variable aleatoria definida a continuación describa el conjunto de valores posibles de la
variable e indique si es discreta o continua.
a. X = número de huevos que no están quebrados, en una caja de cartón estándar seleccionada al
azar.
b. Y = número de estudiantes ausentes el primer día de clases, de la lista de su grupo.
c. U = número de veces que un novato intenta golpear una pelota de golf, antes de lograrlo.
d. X = longitud de una serpiente de cascabel seleccionada al azar.
e. Z = pH de una muestra de suelo seleccionada al azar.
f. X = tensión a la que una raqueta de tenis seleccionada al azar ha sido encordada.
g. X = número total de veces que haya necesidad de lanzar una moneda al aire para que tres
personas obtengan una partida (AAA o SSS).
Solución:
g. A veces las aerolíneas registran más pasajeros del cupo normal de los vuelos. Supóngase que para
un avión con 50 asientos, 55 pasajeros tienen boleto. Defina la variable aleatoria Y como el
234
número de pasajeros con boleto que en realidad se presentan para el vuelo. En la tabla siguiente
se ilustra la función masa de probabilidad de Y.
y 45 46 47 48 49 50 51 52 53 54 55
p(y) 0.050 0.10 0.12 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01
a. ¿Cuál es la probabilidad de que se pueda acomodar a todos los pasajeros con boleto que se
presentan para realizar el vuelo?
b. ¿Cuál es la probabilidad de que no todos los pasajeros con boleto que se presentan para realizar
el vuelo puedan ser acomodados?
c. Si el lector es la primera persona en lista de espera (lo que significa que será el primero en
abordar el avión si hay asientos disponibles después que han sido acomodados todos los
pasajeros con boleto), ¿cuál es la probabilidad de que pueda realizar el vuelo? ¿Cuál es la
probabilidad si es la tercera persona en lista de espera?
Solución:
a. P(Y 50) = 0.050 + 0.10 + 0.12 + 0.14 + 0.25 + 0.17 = 0.83 P(Y 50) = 0.83
b. P(Y > 50) = 1 - P(Y 50) = 1 – 0.83 = 0.17 P(Y > 50) = 0.17
c. P(Y 49) = 0.050 + 0.10 + 0.12 + 0.14 + 0.25 = 0.66 P(Y 49) = 0.66
P(Y 47) = 0.050 + 0.10 + 0.12 = 0.27 P(Y 47) = 0.27
Solución:
y2
p( y )
50
f. 5 5
y 1
p( y ) y
y 1
2
/ 50 1
50 504 509 16
50 50
25 55
50 1
Solución:
c. (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5)
d.
p(0) P(3,4), (3,5), (4,5) 103 0.3
p(1) P(1,3), (1,4), (1,5), (2,3), (2,4), (2,5) 106 0.6
p(2) P(1,2) 101 0.1
x 0 1 2
p(x) 0.3 0.6 0.1
d. F (0) = P (X 0) = 0.3
F (1) = P (X 1) = 0.9
F (2) = P (X 2) = 1.0, entonces la función de distribución acumulada es:
0 x0
0.3 0 x 1
F ( x)
0.9 1 x 2
1.0 x2
236
e.
Resultados X P(X) Resultados x P(X)
SSSS 4 (.3)4 = 0.0081 SSFF 2 (.7)2(.3)2 = 0.0441
FSSS 3 (.7)(.3)3 = 0.0189 SFFS 2 (.7)2(.3)2 = 0.0441
SFSS 3 (.7)(.3)3 = 0.0189 FFFS 1 (.7)3(.3) = 0.1029
SSFS 3 (.7)(.3)3 = 0.0189 FFSF 1 (.7)3(.3) = 0.1029
SSSF 3 (.7)(.3)3 = 0.0189 FSFF 1 (.7)3(.3) = 0.1029
FFSS 2 (.7)2(.3)2 = 0.0441 SFFF 1 (.7)3(.3) = 0.1029
FSSF 2 (.7)2(.3)2 = 0.0441 FSFS 2 (.7)2(.3)2 = 0.0441
SFSF 2 (.7)2(.3)2 = 0.0441 FFFF 0 (.7)4 = 0.2401
x 0 1 2 3 4
p(x) 0.2401 0.4116 0.2646 0.0756 0.0081
f.
g. El valor mas probable de X es x = 1
h. P (X 2) = 0.2646 + 0.0756 + 0.0081 = 0.3483
k. El voltaje de una batería nueva puede se aceptable (A) o no aceptable (I). Cierta linterna
de mano necesita dos baterías, las cuales necesitarán seleccionarse y probarse
independientemente hasta encontrar dos aceptables. Supongamos que el 90 % de todas
las baterías tienen voltaje aceptable. Señale con Y el número de baterías que tienen que
ser probadas.
e. ¿Cuál es p (2), es decir, P (Y = 2)?
237
Solución
d. Sea P (A) = 0.9, entonces P (AA) = p (2) = (0.9)(0.9) = 0.81
e. p (2) = (0.9)2
p (3) = 2 (0.9)2 (0.1)
p (4) = 3 (0.9)2 (0.1)2
p (5) = 4 (0.9)2 (0.1)3
Generalizando estos resultados, tenemos:
p (y) = (y – 1) (0.9)2(0.1) y – 2
l. Un negocio de computadoras que atiende pedidos por correo tiene seis líneas telefónicas.
Simbolicemos con X el número de líneas en uso en un momento específico. Supongamos que la
fpm de X está dada en la tabla siguiente.
x 0 1 2 3 4 5 6
p(x) .10 .15 .20 .25 .20 .06 .04
Calcule y grafique la fda F(x), después utilícela para calcular la probabilidad de cada uno de los
siguientes eventos.
e. {A lo sumo tres líneas estén en uso}
f. {Menos de tres líneas estén en uso}
g. {Por lo menos tres líneas estén en uso}
h. {Entre 2 y 5 líneas estén en uso}
Solución
0 x0
0.10 0 x 1
0.25 1 x 2
0.45 2 x3
F ( x)
0.70 3 x 4
0.90 4 x5
0.96 5 x6
1 x6
238
e. P (X 3) = F (3) = 0.70
f. P (X < 3) = F (2) = 0.45
g. P (X 3) = 1 – P(X < 3) = 1 – 0.45 = 0.55
h. P (2 X 5) = F (5) – F(1) = 0.96 – 0.25 = 0.71
m. Una compañía de seguros ofrece a sus tenedores de pólizas varias opciones diferentes para el pago
de primas. Para un tenedor seleccionado al azar, sea X = número de meses entre pagos sucesivos.
La fpa de X es como sigue:
0 x 1
.30 1 x 3
.40 3 x 4
F ( x)
.45 4 x6
.60 6 x 12
1 12 x
c. ¿Cuál es la fpm de X?
d. Sólo con el uso de fpa, calcule P (3 ≤ X ≤ 6) y P (4 ≤ X).
Solución
c.
x 1 3 4 6 12
p (x) 0.30 0.10 0.05 0.15 0.40
Solución:
d. h(X) = X – 0.01X 2
Solución:
a.
y 45 46 47 48 49 50 51 52 53 54 55
p(y) 0.050 0.10 0.12 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01
P(46.72 Y 50.96) 0.12 0.14 0.25 0.17 0.68 P(46.72 Y 50.96) = 0.68
3. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la siguiente tabla:
x -2 0 x3 12
1 1 1
p(x) 2 4 p3 16
5
Si se sabe que E(X) = 4
, calcule x3 y p3.
Solución:
1 1 1 13 3 3
Se tiene que p( x ) 1,
xi
i entonces p3 1,
2 4 16
p3 1
16 16
p3
16
1 1 3 1 5
Se tiene que E ( X ) xi p( xi ), entonces E ( X ) (2) 0 x3 12
2 4 16 16 4
3 3 3 1 5 3 1 3/ 2
E ( X ) 1 x3 x3 x3 x3 8 x3=8
16 4 16 4 4 16 4 3/16
4. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la siguiente tabla:
x 1 x2 5 10 20
Solución:
a. Se tiene que p( x ) 1,
xi
i entonces 0.5 0.25 0.1 0.1 p5 1, 0.95 p5 1
p5 = 0.05
E ( X ) 1 (0.5) x (0.25) 5 (0.1) 10 (0.1) 20 (0.05) 37
2 2 2
2
2 2 2
1 p x0
f ( x) p x 1
0 x 0,1
Solución:
a. E( X 2 ) 02 (1 p) 12 ( p) p E(X2) = p
b. Usando la definición:
V ( X ) ( x ) 2 p( x)
V ( X ) (0 p) 2 (1 p) (1 p) 2 p
p 2 (1 p) (1 2 p p 2 ) p
p 2 p3 p 2 p 2 p3 p p 2
V ( X ) p(1 p)
c. E( X 19 ) 019 (1 p) 119 p p E ( X 19 ) p
6. Un contratista ofrece realizar un proyecto, y los días X requeridos para la terminación siguen la
distribución de probabilidad dada como:
x 10 11 12 13 14
p(x) 0.1 0.3 0.4 0.1 0.1
Solución:
a. Y = 2000(12 – X)
Binomiales
242
9. Una compañía que produce cristal fino sabe por experiencia que 10% de sus copas tienen
imperfecciones y deben clasificarse como de “segunda”.
a. Entre seis copas seleccionadas al azar, ¿qué tan probable es que sólo una sea de “segunda”?
b. Entre seis copas seleccionadas al azar, ¿cuál es la probabilidad de que por lo menos dos sean
de “segunda”?
c. Si las copas se examinan una por una, ¿cuál es la probabilidad de que por lo menos sean
seleccionadas cinco para encontrar cuatro que no sean de segunda?
Solución:
Para n = 6, p = 0.1 X Bin (x ; 6, 0.1)
n
p( x) p x (1 p) n x
x
6
a. P( X 1) (0.1)(0.9)5 0.3542 P(X = 1) = 0.3542
1
b. P(X 2) = 1 - P(X < 2)
6 6
= 1 - (0.1)0 (0.9)6 (0.1)1 (0.9)5 1 0.8857 0.1142
0 1
P(X 2) = 0.1142
10. Se selecciona al azar un individuo que tenga un seguro automotriz de cierta empresa. Sea Y la
cantidad de multas que ha recibido durante los últimos 3 años, la fpm de Y es:
y 0 1 2 3
p( y) .60 .25 .10 .05
Solución:
f. P (5 X 10) = B (10; 15, 0.4) – B (4; 15, 0.4) = 0.991 – 0.217 = 0.774
11. Según el fabricante de un líquido limpiador de manchas, este tiene un grado de efectividad de 0.8,
es decir, elimina en promedio 8 de cada 10 manchas. Para comprobar que lo que afirma es cierto,
se usará el producto en 15 manchas elegidas al azar, bajo el entendido de que si desaparecen por
lo menos 11 de ellas y solo en ese caso se dará por válida la afirmación del fabricante.
a. Calcule la probabilidad de que la aseveración del fabricante sea rechazada cuando en realidad
es cierta.
b. Determine la probabilidad de que por error se acepte lo que sostiene el fabricante, cuando la
efectividad de su producto es en realidad de 0.6.
Solución:
a. Para que la aseveración sea rechazada la probabilidad buscada es P(X 10)
Con n = 15 y p = 0.8 P(X 10) = B (10; 15, 0.8) = 0.164 P (sea rechazada) = 0.164
12. Un lote muy grande de componentes ha llegado a un distribuidor. El lote se puede clasificar como
aceptable sólo si la proporción de componentes defectuosos es a lo sumo 0.10. El distribuidor
decide seleccionar al azar 10 componentes y aceptar el lote sólo si el número de componentes
defectuosos en la muestra es a lo sumo 2.
a. ¿Cuál es la probabilidad de que el lote sea aceptado cuando la proporción real de piezas
defectuosas es 0.01?, ¿0.05?, ¿0.10?, ¿0.20? y ¿0.25?
b. Sea p la proporción real de piezas defectuosas del lote. Una gráfica de P(lote aceptado) como
función de p con p en el eje horizontal y P(lote aceptado) en el vertical, se llama curva
característica de operación para el plan de muestreo de aceptación del lote. Utilice los
resultados del inciso (a) para construir esta curva en 0 ≤ p ≤ 1.
c. Repita los incisos (a) y (b) con “1” sustituyendo a “2” en el plan de muestreo de aceptación del
lote.
d. Repita los incisos (a) y (b) con “15” sustituyendo a “10” en el plan de muestreo de aceptación
del lote.
e. ¿Cuál de los tres planes de muestreo, de los incisos (a), (c) o (d) parece más satisfactorio y por
qué?
Solución:
a. P(lote sea aceptable) = P(X 2) = B(2;10, p) con P = 0.01, 0.05, 0.10, 0.20 y 0.25
B(2; 10, 0.01) = 1, B(2; 10, 0.05) = 0.988, B(2; 10, 0.10) = 0.930, B(2; 10, 0.20) = 0.618, B(2;
10, 0.25) = 0.526
b. Falta gráfica
244
d. Puesto que queremos un plan para el cual P(aceptar) sea baja para p > 0.1 y altas para
p 0.1, entonces, el plan del inciso d parece el más satisfactorio con las
consideraciones anteriores.
13. Un estudio realizado por periodistas del diario Crónica (octubre del 2000) mostró que en las
oficinas de los servidores públicos (burócratas) de las distintas dependencias gubernamentales de
México, aproximadamente 30% de las llamadas telefónicas que entran en horario de trabajo no
son contestadas porque las personas no se encuentran en su lugar. Determine la probabilidad de
que en las siguientes 20 llamadas que entran a una de tales oficinas en horario de trabajo:
a. mas de 7 no sean contestadas.
b. Entre 5 y 10 inclusive, no sean contestadas.
c. Por lo menos 10 no sean contestadas.
Solución:
a. Con n = 20 y p = 0.3 P(X > 7) = 1 – P(X 7) = 1 – B(7; 20, 0.3) = 0.228
P(X 7) = 0.228
b. P(5 X 10) = B(10; 20, 0.3) – B(4; 20, 0.3) = 0.983 – 0.238 = 0.745
P(5 X 10) = 0.745
c. P(X 10) = 1 – P(X < 10) = 1 – B(9; 20, 0.3) = 1 – 0.925 = 0.048
P(X 10 = 0.048
6. Un fabricante de productos electrónicos de consumo espera que 2% de las unidades fallen durante
el período de garantía. Se hace un seguimiento del cumplimiento de la garantía de una muestra
de 500 unidades independientes.
a. ¿Cuál es la probabilidad de que ninguna falle?
b. ¿Cuál es el número esperado de fallas durante el período de garantía?
c. ¿Cuál es la probabilidad de que más de dos unidades fallen durante el período de garantía?
Solución:
a. Con n = 500 y p = 0.02
500 5
P( X 0) b(0;500,0.02) (0.02) (0.98) 4.1024 10
0 500
P(X =0) = 0.0000412
0
b. E(X) = np para una distribución binomial, entonces: E(X) = 500(0.02) E(X) = 10
245
P( X 2) 1 P( X 2)
c. 500 500 500 498
1 (0.02) (0.98)
0 500
(0.02) (0.98)
1 499
(0.02) (0.98) 1 0.00259
2
0 1 2
P(X > 2) = 0.997
2. Cierto tipo de cámara digital viene en una versión de tres megapixeles y una de cuatro
megapixeles. Una tienda de cámaras recibió un envío de 15 de estas cámaras, de las cuales seis
tienen una resolución de tres megapixeles. Suponga que se eligen al azar cinco de estas cámaras
para colocarlas en el mostrador; las otras 10 se colocan en el almacén. Sea X = número de cámaras
de tres megapixeles, entre las cinco elegidas para colocarlas en el mostrador.
a. ¿Qué clase de distribución tiene X (nombre y valores de los parámetros)?
b. Calcule P(X = 2), P(X 2) y P(X 2).
c. Calcule el valor medio y la desviación estándar de X.
Solución:
a. Es una distribución Hipergeométrica h(x; n, M, N) con n = 5, M = 6 y N = 15, n = número de
elementos en la muestra, M = número de éxitos en la población y N = número de elementos en
la población.
M n M
nx
P( X x) h( x; n, M , N )
x
N
n
6 15 6 6 9
2 5 2 2 3
P( x 2) 0.4195 P( X 2) 0.4195
b. 15 15
5 2
6 9 6 9 6 9 6 9
2
x n x 0 5 1 4 2 3
P( X 2) 0.71328 P( X 2) 0.71328
x 0 N 15
n 5
P( X 2) 1 P( X 2) 1 0.2937 0.7063 P( X 2) 0.7063
M N n M M
E( X ) n V (X ) n 1
N N 1 N N
6 15 5 6 6
c. E ( X ) 5 2 V (X ) (2) 1 0.857
15 14 15 7
X V ( X ) 0.857 0.925 E( X ) 2 X 0.925
3. Un profesor que el último período escolar dio dos secciones de estadística en ingeniería, el primero
con 20 alumnos y el segundo con 30, decidió asignar un proyecto para los cursos. Después de
246
recibidos todos los proyectos, los apilo en orden aleatorio antes de calificarlos. Considere los 15
primeros proyectos que se califican.
a. ¿Cuál es la probabilidad de que exactamente 10 de ellos provengan de la segunda sección?
b. ¿Cuál es la probabilidad de que al menos 10 de ellos provengan de la segunda sección?
c. ¿Cuál es la probabilidad de que al menos 10 de ellos provengan de la misma sección?
d. ¿Cuáles son el valor medio y la desviación estándar de la cantidad entre los 15, que provengan
de la segunda sección?
e. ¿Cuáles son el valor medio y la desviación estándar, del número de proyectos que estén entre
los primeros 15 y que provengan de la primera sección?
Solución:
M n M
x n x
P( X x) h( x; n, M , N )
N
n
30 50 30 30 20
10 15 10 10 5
h(10;15,30,50) 0.207
50 50
15 15
P( X 10) 0.207
b. P(X 10) = h(10;15, 30, 50) + h(11;15, 30, 50) + h(12;15, 30, 50) + h(13;15, 30, 50) + h(14;15,
30, 50) + h(15;15, 30, 50)
P(X 10) = 0.207 + 0.1176 +0.0438 + 0.0101 + 0.0013 + 0.000067 = 0.3798
P(X 10) = 0.3798
c. Sea Y = Número de proyectos de la primera sección con h(y; 15, 20, 50), entonces la
probabilidad pedida es: P(X 10) + P(Y 10)
P(Y 10) = h(10;15, 20, 50) + h(11;15, 20, 50) + h(12;15, 20, 50) + h(13;15, 20, 50) +
h(14;15, 20, 50) + h(15;15, 20, 50)
P(Y 10) = 0.0116974 + 0.002045 + 0.0002272 + 0.0000150 + 0.0000005 + 0 = 0.01398
P(Y 10) = 0.01398
P(X 10 o Y 10) = 0.3798 + 0.01398 = 0.3938
M N n M M
E( X ) n V (X ) n 1
N N 1 N N
30 50 15 30 126
d. E ( X ) 15 9 V (X ) (9) 1 2.5714
50 49 50 49
X V ( X ) 2.5714 1.6036 E ( X ) 9 X 1.6036
20 50 15 20
E (Y ) 15 6 V (Y ) 6 1 2.57
e. 50 49 50
Y V (Y ) 2.57 1.6036 E (Y ) 6 Y 1.6036
247
Solución:
a. Es una distribución hipergeométrica con n =15, M = 10 y N = 20, por tanto la función de
probabilidad de masa es h(x; 15, 10, 20)
b. P(X = 10) = h(10; 15, 10, 20)
10 10
P( X 10) 0.0163 Puesto que los especímenes de cada tipo es el mismo:
10 5
20
15
P(X = 10 o Y = 10) = 0.0163 + 0.0163 = 0.0326
M N n M M
E( X ) n V (X ) n 1
N N 1 N N
10 20 15 10 75
c. E ( X ) 15 7.5 V (X ) (7.5) 1 0.98684
20 19 20 76
X V ( X ) 0.98684 0.9934 E ( X ) 7.5 X 0.9934
X X 7.5 0.9934 (6.5,8.5)
Entonces la probabilidad pedida es P( X = 8 o X =7)
P(X = 8 o X =7) = h(8) + h(7) = 0.3483 + 0.3483 =0.6966 P( X = 8 o X =7) = 0.6966
Solución:
a. La distribución es hipergeométrica h(x; 7, 4 12) con n = 7, M = 4 y N = 12.
M 4 7
b. E ( X ) n E( X ) 7 E ( X ) 2.33
N 12 3
6. Un lote de 75 arandelas contiene cinco en las que la variabilidad del espesor alrededor de la
circunferencia de la arandela es inaceptable. Se selecciona al azar una muestra de 10 arandelas.
a. ¿Cuál es la probabilidad de que ninguna de las arandelas inaceptables esté en la muestra?
b. ¿Cuál es la probabilidad de que al menos una de las arandelas inaceptables esté en la muestra?
c. ¿Cuál es la probabilidad de que exactamente una de las arandelas inaceptables esté un la
muestra?
d. ¿Cuál es el número promedio de arandelas inaceptables en la muestra?
Solución:
a. La distribución es hipergeométrica
248
M N M
nx
h( x; n, M , N )
x
con n 10, M 5, N 75 por tanto
N
n
5 70 5 70
x 10 x
h(0;10,5,75) 0.4785
0 10
h( x;10,5,75) , P( X 0) 0.4785
75 75
10 10
b. P( X 1) 1 P( X 1) 1 P( X 0) 1 0.4785 0.5215 P( X 1) 0.5215
5 70
c. P( X 1) h(1;10,5,75) 0.3923
1 9
P( X 1) 0.3923
75
10
M 5
d. E ( X ) n E ( X ) 10 0.667 E ( X ) 0.667
N 75
7. Suponga que p = P (de que nazca un varón) = 0.5. Una pareja desea tener exactamente dos niñas
en su familia. Tendrán hijos hasta que se satisfaga la condición.
f. ¿Cuál es la probabilidad de que la familia tenga x hijos varones?
g. ¿Cuál es la probabilidad de que la familia tenga cuatro hijos?
h. ¿Cuál es la probabilidad de que la familia tenga a lo sumo cuatro hijos?
i. ¿Cuántos varones se esperaría que tenga esa familia? ¿cuántos hijos se esperaría que tenga esa
familia?
Solución:
a. Sea X = Nº de varones antes que se tengan 2 niñas, entonces la distribución es binomial
x r 1 r
negativa con P(X = x) = bn(x; r, p) P( X x) p (1 p)
x
r 1
b. P(X = 2) ya que serán dos varones y dos niñas, entonces P(X = 2) = bn(2; 2, 0.5)
3
P( X 2) (0.5)2 (1 0.5) 2 0.1875 P( X 2) 0.1875
1
c. A lo sumo 4 hijos corresponde a P(X 2)
2
1 2 3
P( X 2) nb( x;2,0.5) (0.5) 2 (0.5)0 (0.5) 2 (0.5) (0.5) 2 (0.5)2 0.6875
x 0 1 1 1
P(X 2) = 0.6875
r (1 p) 2(0.5)
d. E ( X ) E( X ) 2
p 0.5
Número esperado de varones = 2, Número esperado de hijos = 4
Solución:
a. La distribución es binomial negativa con X + r el número de ensayos para obtener r éxitos, en
este caso, tenemos:
r 5
E( X ) , E( X ) 5.618 E ( X ) 5.618
p 0.89
9. La probabilidad de que un submarino hunda un barco enemigo con un disparo de sus torpedos es
0.8. Si los disparos son independientes, determine la probabilidad de un hundimiento dentro de
los primeros dos disparos, y dentro de los primeros tres.
Solución:
Esta es una distribución geométrica donde X = Número de ensayos para alcanzar el primer éxito,
por tanto:
q x 1 p x 1, 2,3...
p ( x)
0 en otro caso La probabilidad pedida es :
2
P( X 2) q x 1 p P( X 2) (0.2)0 (0.8) (0.2)(0.8) 0.96
x 1
P( X 1 o X 2) 0.96
10. De acuerdo con la revista Chess Life, 40% de los grandes maestros de ajedrez del mundo
consideran que Garry Kaspárov es el mejor ajedrecista de todos los tiempos. Si se les pregunta a
varios grandes maestros su opinión a este respecto, encuentre la probabilidad de que le octavo a
quien se le planteó la pregunta sea el cuarto que considera a Kaspárov el mejor ajedrecista de todos
los tiempos.
Solución:
La distribución es binomial negativa con X = Número de fracasos antes de obtener r éxitos, por
tanto, tenemos que:
x r 1 r x
nb( x; r , p) p q
r 1
La probabilidad pedida es:
4 4 1
P( X 4) (0.40) (0.60) 0.1161
4 4
P( X 4) 0.1161
4 1
Distribución de Poisson
250
1. Suponga que la cantidad de conductores que viajan entre cierto origen y destino, durante
determinado período, tiene una distribución de Poisson con parámetro = 20 (sugerido en el
artículo “Dynamic Ride Sharing: Theory and Practice”, J. ofTransport Engr., 1997, pp. 308 - 312).
¿Cuál es la probabilidad de que la cantidad de conductores:
b. sea máximo 10?
c. Sea mayor que 20?
d. esté entre 10 y 20 inclusive? ¿Esté estrictamente entre 10 y 20?
e. sea mayor que la cantidad media en más de dos desviaciones estándar?
Solución:
e x
Para una distribución de Poisson p( x; ) x 0,1, 2,...
x!
a. Aquí = 20 y usando tablas de distribución acumulada P(X 10) = F (10; 20) = 0.011
P(X 10) = 0.011
b. P(X > 20) = 1 – P(X 20) = 1 – F (20; 20) = 1 – 0.559 = 0.441 P(X > 20) = 0.441
c. P(10 X 20) = F(20; 20) – F(9; 20) = 0.559 – 0.005 = 0.554 P(10 X 20) = 0.554
d. E(X) = = 20, X 20 4.472
P(X > + 2) = P(X > 20 + 8.944) = P(X > 29) = 1 – P(X 29) = 1 – F(29; 20) = 0.022
P(X > + 2) = 0.022
Solución:
a. Para un período t = 1h, = 8. Usando tablas de distribución acumulada, tenemos:
P(X = 5) = F(5; 8) – F(4; 8) = 0.191 – 0.100 = 0.091 P(X =5) = 0.091
P(X 5) = 1 – P(X < 5) = 1 – F(4; 8) = 1 – 0.100 = 0.900 P(X 5) = 0.900
P(X 10) = 1- P(X < 10) = 1 – F(9; 8) = 1 – 0.717 = 0.283 P(X 10) = 0.283
251
4. Suponga que hay árboles distribuidos en un bosque según un proceso de Poisson de dos
dimensiones, con parámetro y que el número esperado de árboles por acre es igual a 80.
a. ¿Cuál es la probabilidad de que en cierto lote de un cuarto de acre haya a lo sumo 16 árboles?
b. Si el bosque cubre 85, 000 acres, ¿Cuál es el número esperado de árboles en el bosque?
c. Suponga que se selecciona un punto del bosque y se construye un círculo de 0.1 milla de radio.
Sea X el número de árboles dentro de esa región circular, ¿Cuál es la fdm de X? ( 1 milla
cuadrada = 640 acres)
Solución:
a. Para un cuarto de acre, el parámetro = 0.25 (80) = 20, entonces:
P(X 16) = F(16; 20) = 0.221 P(X 16) = 0.221
b. E(X) = , entonces E(X) = 80(85000) = 6 800 000 árboles E(X) = 6 800 000
c. El área de ese círculo es A = r , A = (0.1 milla) (640acres/milla ) = 20.1062 acres, entonces
2 2 2
6. Suponga que sólo 0.10% de las computadoras de cierto tipo experimentan falla del CPU durante
el período de garantía. Considere una muestra de 10 000 computadoras.
a. ¿Cuál es el valor esperado y la desviación estándar del número de computadoras de la muestra
que tienen el defecto?
252
7. Se supone que el número de imperfecciones en los rollos de tela de una fábrica textil tiene una
distribución de Poisson con una media de 0.1 imperfecciones por metro cuadrado.
a. ¿Cuál es la probabilidad de que haya 2 imperfecciones en un metro cuadrado de tela?
b. ¿Cuál es la probabilidad de que haya una imperfección en 10 metros cuadrados de tela?
c. ¿Cuál es la probabilidad de que no haya imperfecciones en 20 metros cuadrados de tela?
d. ¿Cuál es la probabilidad de que haya al menos una imperfección en 10 metros cuadrados de
tela?
Solución:
a. Si E(X) = = 0.1 Para 1 m2, entonces La fpm es p(x; 0.1)
P(X = 2) = F(2; 0.1) – F(1; 0.1) = 1 – 0.995 = 0.005 P(X = 2) = 0.005
b. Para 10 m , = 0.1(10) = 1, p(x; 1), entonces P(X = 1) = F(1; 1) – F(0; 1)
2
11. Un maestro universitario nunca termina su clase antes de que suene la campana y siempre termina
su clase a menos de 2 min después de que suena la campana. Sea X = el tiempo que transcurre
entre la campana y el término de clase y suponga que la fdp de X es:
kx2 0 x2
f ( x)
0 de otra manera
a. Encuentre el valor de k
b. ¿Cuál es la probabilidad de que la clase termine a menos de 1 minuto después de que suene la
campana?
c. ¿Cuál es la probabilidad de que la clase continúe entre 60 y 90 s después de que suene la
campana?
d. ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 s después de que suene la
campana?
Solución
Se sabe que
f ( x)dx 1 y por tanto
253
2
2 x3 8 3
0 k 1 k
2
a. kx dx k
3 0 3 8
1
1 3 x3 3 1 1
b. P( X 1) k x 2 dx 0.125 P(X < 1) = 0.125
0 8 3 0 8 3 8
1.5
3 x3
c. P(1 X 1.5) 0.2969
3 27 1 3 19 19
P(1 X 1.5) 0.2969
8 3 1 8 24 3 8 24 64
1.5
3 x3
d. P( X 1.5) 1 P( X 1.5) 1 1 1 0.5781
3 27 27 37
8 3 0 8 24 64 64
12. Suponga que el error al hacer cierta medición es una va continua X con fdp
Solución 0.4
a.
f ( x) 0.2
2 0 2
x
2
x3
c. P( X 0) 0.09375 (4 x )dx 0.09375 4 x 0.09375 8 0.5
2
2 8
0
30 3
1
1 x3
P(1 X 1) 0.9375 (4 x )dx 0.09375 4 x
2
1
3 1
c.
1 1 22
0.09375 4 4 0.09375 0.6875
3 3 3
0.5
x3 1 1
d. P(0.5 X 0.5) 0.9375 4 x 0.09375 2 2 0.3672
3 0.5 24 24
254
13. El peso real de apoyo de una pastilla de estéreo, que actualmente está puesta a 3g en un tocadiscos,
puede considerarse una va X continua con fdp
k 1 ( x 3)
2
2 x4
f ( x)
0 de otra manera
a. Dibuje la gráfica de f (x).
b. Encuentre el valor de k
c. ¿Cuál es la probabilidad de que el peso real de apoyo sea mayor que el peso especificado?
d. ¿Cuál es la probabilidad de que el peso real sea menor de 0.25g del peso especificado?
e. ¿Cuál es la probabilidad de que le peso real difiera del peso especificado más de 0.5g?
Solución
a.
1
0.75
f ( x) 0.5
0.25
0 1 2 3 4 5
x
4
b. k 2 1 ( x 3)2 dx 1
4
( x 3)3 1 1 4 3
k x k 4 2 k k
3 2 3 3 3 4
4
4 3 ( x 3)3 3 1
P( X 3) k 1 ( x 3) 2 dx x 4 (3 0)
3 4 3 3 4 3
d.
3 2 1
0.5 P( X 3) 0.5
4 3 2
2.75
2.75 3 ( x 3)3
P( X 2.75) k 1 ( x 3) 2 dx x
2 4 3 2
3 1 3
e. (2.75 5.208 103 ) 2 (0.4218) 0.316
4 3 4
P( X 2.75) 0,316
255
14. El tiempo X (minutos) para que un asistente de laboratorio prepare el equipo para un experimento
tiene una distribución uniforme con A = 25 y B = 35.
a. Escriba la fdp de X y trace su gráfica.
b. ¿Cuál es la probabilidad de que el tiempo de preparación exceda de 33 min?
c. ¿Cuál es la probabilidad de que el tiempo de preparación se encuentre a 2 minutos del tiempo
medio?
d. Para cualquier a tal que 25 < a < a + 2 < 35, ¿cuál es la probabilidad de que el tiempo de
preparación esté entre a y a + 2 minutos?
Solución
a. Para una distribución uniforme la función de distribución de probabilidad es:
1
B X A
f ( x) B A
0 de otra manera
En este caso tenemos:
1
25 X 35
f ( x) 10
0 de otra manera
35
b. P( X 33) 33 101 dx 101 x 33 101 (35 33) 102 0.2 P( X 33) 0.2
35
35
35 1 x2
c. E ( X ) 101 xdx 30
25 10 2 25
30 2 es de 28 a 32
32
P(28 X 32) 101 dx 101 x 28 101 (32 28) 0.4
32
P(28 X 32) = 0.4
28
a2
e. P(a X a 2) 101 x a 0.1(a 2 a) 0.2 P(a X a 2) = 0.2
0 x 2
1 3 x
3
F ( x) 4 x 2 x 2
2 32 3
2 x
1
a. Calcule P(X < 0)
b. Calcule P(-1 < X < 1)
c. Calcule P(0.5 < X)
d. Encuentre la función de densidad f(x).
Solución
323 (4 x )
2
2 x2
f ( x)
0 de otra manera
16. Simbolice con X el tiempo que dura un libro prestado con fdp
0.5 x 0 x2
f ( x)
0 de otra manera
a. Calcule E(X).
b. Calcule V(X) y .
c. Si a la persona que solicita el libro se le cobra una cantidad h(X) = X 2 cuando la duración del
préstamo es X, calcule el cobro esperado E [h(X)].
Solución
2
2 x3 8 4
c. E ( X ) 0.5 0 x xdx 0.5 E(X) = 4/3
3 0 6 3
2
2 x4
d. E ( X ) 0.5
2
x xdx 0.5 2
2
0
4 0
4 2
Puesto que V ( X ) E ( X 2 ) E ( X ) 2
2
V(X) = 2/3
3 3
257
2
x4
d. E h( X ) E h( X ) 2
2
h( x) f ( x)dx x (0.5 x)dx 0.5 2
2
0
4 0
17. “Avance del Tiempo” en flujo de tránsito es el tiempo transcurrido entre el tiempo en que un
automóvil termina de pasar un punto fijo y el instante en que el siguiente automóvil comienza a
pasar por ese punto. Sea X = avance entre dos automóviles consecutivos elegidos al azar. Suponga
que en un cierto ambiente de tráfico, la distribución del tiempo de avance tiene la forma
k
x 1
f ( x) x 4
0 x 1
Solución:
x
x k 1 1 1 1
b. Integrando la fdp tenemos: 1 x 4
dx k 3 3 3 1 3 , entonces
3x 1 3x 3 x
0 x 1
F ( x) 1
1 x3 x 1
1 1
P( X 2) 1 P( X 2) 1 F (2); P( X 2) 1 1 3 P( X 2) 0.125
2 8
c.
1 1 1 1
P(2 X 3) F (3) F (2) 1 3 1 3 0.0879 P(2 X 3) 0.088
3 2 8 27
1 1 1 1
d. E ( X ) xf ( x)dx, E ( X ) 3 x 4 dx 3 3 dx 3 2 3 0
1
x 1
x 2x 1 2
E(X) = 1.5
258
1 1
E( X ) 2 2
x f ( x)dx; E ( X ) 3
2
x 4 dx 3 2 3(0 1) 3
2
1
x x 1
V ( X ) E X 2 E ( X ) V ( X ) 3 1.5 0.75
2 2
18. Exprese con X el tiempo para la falla (en años) de cierto componente hidráulico. Suponga que la
fdp de X es f(x) = 32/(x + 4)3 para x ≥ 0.
a. Verifique que f(x) sea una fdp legítima.
b. Determine la fda.
c. Utilice el resultado del inciso (b) para calcular la probabilidad de que el tiempo para la falla
sea entre 2 y 5 años.
d. ¿Cuál es el tiempo esperado para la falla?
e. Si el componente tiene un valor de rescate igual a 100/(4 + x) cuando su tiempo para fallar sea
x, ¿cuál es el valor esperado de rescate?
Solución:
1
32 1
dx 1 32 2
32 0 1
0 x 4 2( x 4) 0
3
2(4)2
Por tanto f(x) es una distribución legítima
b. Integrando la fdp tenemos:
x
1 1
x
32 32 1 16
dx 16 1 , entonces
0 ( x 4) 3
2 ( x 4)2 0 ( x 4) 16
2
( x 4)2
0 x0
F ( x) 16
1 ( x 4)2 x0
16 16 20
c. P(2 X 5) F (5) F (2) 1 2
1 2
P(2 X 5) =0.247
(5 4) (2 4) 81
259
32 x x
dx
E( X ) xf ( x)dx, E( X ) dx 32
0 ( x 4) 3
2( x 4)
2
0
0 2( x 4) 2
d.
1
1
E ( X ) 32 0 32 0 4 E( X ) 4
2( x 4) 0
8
100
e. Sea Y el valor de rescate, Y , entonces E (Y ) Y ( x) f ( x)dx
x4
100 32 dx 1
E (Y ) dx 3200 3200 3
0 x 4 ( x 4)3 0 ( x 4) 4
3( x 4) 0
1 3200
3200 (0 16.67 E (Y ) 16.67
3(64) 192
25
1
y 0 y5
2 1
f ( y ) 5 25 y 5 y 10
0
de otra manera
a. Calcule y grafique la fda de Y. (Sugerencia: considere de forma separada 0 ≤ y < 5 y 5 ≤ y ≤
10 al calcular F(y). Una gráfica de la fdp podría ser útil.)
b. Obtenga una expresión para el (100p)mo percentil. (Sugerencia: considere en forma separada
0 < p < .5 y .5 < p < 1.
c. Calcule E(Y) y V(Y). ¿Cómo se comparan con el tiempo esperado y la varianza de un solo
autobús cuando el tiempo es uniformemente distribuido en 0,5 ?
Solución:
a. Integrando la función f(y) para obtener la fda, tenemos:
y y
ydy y 2 y2 2 y 2 y2 y2 3
y y
2
dy y y
0 25 50 0
50 5 5 25 5 50 5 5 50 2
Para la segunda integral hay que aumentar ½ (observar la figura) por tanto:
0 y0
2
y 0 y5
50
F ( y) 2
2 y y 1 5 y 10
5 50
1 y 10
Gráfica de f (y)
260
Gráfica de F (y)
5 y 10 2 y
E (Y ) yf ( y )dy, entonces E (Y ) y dy y dy
0
25 5
5 25
c. 5 10
y3 y 2 y3 125 1000 125
E (Y ) 20 5 5 E (Y ) 5
75 0 5 75 5 75 75 75
Este valor se puede obtener también de la gráfica por su simetría
5 y 10 2 y
E (Y 2 ) y 2 dy y 2 dy
0
25 5
5 25
5 10
y4 2 y3 y 4 625 2000 250 625 175
E (Y 2 ) 100
100 0 15 100 5 100 15 15 100 6
175 25
V (Y ) E (Y 2 ) E (Y ) ,
2
V (Y ) (5) 2 4.167 V (Y ) 4.167
6 6
25
Para una distribución uniforme en el intervalo (0, 5), E(X) = 2.5 y V(X) = , se observa que
12
estos valores son la mitad de los de f (y)
10. El diámetro (en centímetros) de unos balines metálicos para uso industrial, es una va aleatoria
continua X cuya función de densidad de probabilidad está dada por:
261
1.1
cx 4 cx5 0.99cx3
1.1
E( X ) 2
x (2cx cx 0.99c)dx
2 2
0.9 2 5 3 0.9
x
cx3 cx3
x
(2cx cx 0.99c)dx cx 2
2
0.99cx cx 2 0.99cx (0.324c)
0.9 3 0.9 3
2 x3
x 0.99 x 0.324 c 0.5, 750 x 250 x 742.5 x 242.5 0
2 3
3
Resolviendo la ecuación el valor de x adecuado corresponde a la mediana
Por la simetría de la función se observa que x = 1, por tanto 1
c.
262
Gráfica de f(x)
Distribución Normal
22. El artículo “ Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr., 1995, pp.
785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en un reactor se distribuye
normalmente con = 0.30 y = 0.06.
a. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
c. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de concentración?
Solución:
x
a. Para una distribución normal con = 0.30 y = 0.06, la va Z , y la probabilidad pedida
es:
0.25 0.30 0.25 0.30
P( X 0.25) P Z 1 P Z 1 (0.833)
0.06 0.06
P( X 0.25) 1 0.2033 0.7967 P( X 0.25) 0.7967
0.10 0.30
b. P( X 0.10) P Z (3.333) 0.0004 P( X 0.10) 0.0004
0.06
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son mas grandes),
el 95 percentil de la distribución normal estándar es 1.645, entonces:
c 0.30 c 0.30
P Z 0.95, (1.645) 0.95 1.645
0.06 0.06
despejando a c, c 1.645(0.06) 0.30 0.3987 c 0.3987mg/cm3
23. Suponga que el diámetro de los árboles de determinado tipo, se distribuye normalmente con =
8.8 y = 2.8, como se sugiere en el artículo “Simulating Harvester – Forwarder Softwood
Thinning” (Forest Products J., mayo de 1997, pp. 36 - 41).
a. ¿Cuál es la probabilidad de que el diámetro de un árbol, seleccionado al azar, sea a lo sumo de
10 pulg? y ¿qué sea mayor de 10 pulg?
b. ¿Cuál es la probabilidad de que el diámetro de un árbol seleccionado al azar sea mayor de 20
pulg?
c. ¿Cuál es la probabilidad de que el diámetro de un árbol seleccionado al azar esté entre 5 y 10
pulg?
d. ¿Qué valor de c es tal que el intervalo (8.8 – c, 8.8 + c) incluya el 98% de todos los valores del
diámetro?
e. Si se eligen cuatro árboles de forma independiente, ¿cuál es la probabilidad de que por lo menos
uno tenga un diámetro mayor que 10 pulgadas?
Solución:
a. Para la distribución normal con = 8.8 y = 2.8, tenemos:
10 8.8
P( X 10) P Z (0.428) 0.6664 P( X 10) 0.6664
2.8
P( X 10) 1 P( X 10) 1 0.6664 0.3336 P( X 10) 0.3336
263
20 8.8
b. P( X 20) 1 P( X 20) 1 P Z 1 (4.35) 1 1 0 P( X 20) 0
2.8
5 8.8 10 8.8
P(5 X 10) P Z (0.43) (1.36)
c. 2.8 2.8
P(5 X 10) 0.6664 0.0869 0.5795 P(5 X 10) 0.5795
8.8 c 8.8 8.8 c 8.8
d. P Z 0.98, esto significa que en los extremos quedará sólo el
2.8 2.8
1%, así encontrando el valor de c en el extremo izquierdo:
c c
P Z 0.01, (2.33) 0.01 2.33
2.8 2.8
c (2.33)(2.8) 6.524 c 6.524
e. Esta es una distribución binomial con n = 4 y p = 0.3336 y la distribución pedida es:
P( X 1) 1 P( X 1) 1 b(0;4,0.3336)
4
P( X 1) 1 (0.3336)0 (0.6664) 4 1 0.1972 0.8028 P( X 1) 0.8028
0
24. El artículo “Monte Carlo Simulation – Tool for Better Understanding of LRFD”(J. Structural
Engr., 1993, pp. 1586 – 1599) sugiere que la resistencia a la ruptura (ksi) para acero grado A36
está normalmente distribuida con = 43 y = 4.5.
c. ¿Cuál es la probabilidad de que la resistencia a la ruptura sea a lo sumo 40? y ¿mayor de 60?
d. ¿Cuál valor de resistencia a la ruptura separa de los otros al 75% más fuerte?
Solución:
a. Para una distribución normal con = 43 y = 4.5, tenemos:
40 43
P( X 40) P Z (0.667) 0.2514 P( X 40) 0.2514
4.5
60 43
P( X 60) 1 P( X 60) 1 P Z 1 (5.11) 1 1 0 P( X 60) 0
4.5
b. Se requiere encontrar el 25 percentil, entonces, sea c este valor:
c 43 c 43
P( X c) 0.75, P Z 0.25, (0.67) 0.25, entonces 0.67
4.5 4.5
despejando el valor de c, c (0.67)(4.5) 43 39.985 c 39.985
25. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una de las
siguientes probabilidades usando la aproximación normal (con la corrección de continuidad) para
los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades exactas calculadas de la tabla
correspondiente.
d. P(15 ≤ X ≤ 20)
e. P(X ≤ 15)
f. P(20 ≤ X)
Solución:
a. La aproximación normal para una binomial está dada por:
x 0.5 np
P( X x) B( x; n, p) , cuando np 10 y np 10 , para p = 0.5, 0.6 y 0.8
npq
tenemos: = np y npq
264
15 0.5 12.5
P( X 15) P Z (1.2) 0.8849
2.5
15 0.5 15
b. P( X 15) P Z (0.204) 0.5808
2.45
15 0.5 20
P( X 15) P Z (2.25) 0.01222
2.0
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X 15) B(15;25,0.5) 0.8852
P( X 15) B(15;25,0.6) 0.5754
P( X 15) B(15;25,0.8) 0.0173
Haciendo la comparación:
19.5 12.5
P( X 20) 1 P( X 20) 1 P Z 1 (2.8) 1 0.99744 0.00256
2.5
19.5 15
c. P( X 20) 1 P( X 20) 1 P Z 1 (1.837) 1 0.9669 0.0331
2.45
19.5 20
P( X 20) 1 P( X 20) 1 P Z 1 ( 0.25) 1 0.40129 0.5987
2.0
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X 20) 1 P( X 20) 1 B(19;25,0.5) 1 0.99790 0.0021
P( X 20) 1 P( X 20) 1 B(19;25,0.6) 1 0.97064 0.0293
P( X 20) 1 P( X 20) 1 B(19;25,0.8) 1 0.38331 0.6167
Haciendo la comparación:
26. Suponga que 10% de todos los ejes de acero producidos por cierto proceso están fuera de las
especificaciones, pero que se pueden volver a trabajar (en lugar de tener que enviarlos a la
chatarra). Considere una muestra aleatoria de 200 ejes y exprese con X el número de los que estén
fuera de las especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada)
de que X sea:
d. a lo sumo 30?
e. Menos de 30?
f. entre 15 y 25 inclusive?
Solución:
a. La distribución es binomial, pero podemos calcular estas probabilidades con una aproximación
normal, con = np = 20 y 2 = npq= 18 entonces:
30 0.5 20
P( X 30) P Z (2.47) 0.9932 P( X 30) 0.9932
18
29 0.5 20
b. P( X 30) P Z (2.24) 0.9875 P( X 30) 0.9875
18
14 0.5 20 25 0.5 20
P(15 X 25) P Z (1.30) (1.30)
c. 18 18
P(15 X 25) 0.9032 0.0968 0.8064 P(15 X 25) 0.8064
27. Cuando se prueban tarjetas de circuito que se usan en la fabricación de reproductores de discos
compactos, el porcentaje de defectuosos a largo plazo es 5%. Suponga que recibe un lote de 250
tarjetas y que la condición de cualquier tarjeta es independiente de las demás.
c. ¿Cuál es la probabilidad aproximada de que al menos 10% de las tarjetas del lote estén
defectuosas?
d. ¿Cuál es la probabilidad aproximada de que haya exactamente 10 defectuosas en el lote?
Solución:
266
a. La distribución es binomial, pero podemos calcular esta probabilidad con una aproximación
normal con = np = 12.5 y 2 = npq= 11.875 entonces el 10% de 250 = 25y la probabilidad
pedida es:
24 0.5 12.5
P( X 25) 1 B(24;250,0.05) 1 P Z
11.875
1 (3.482) 1 0.9997 0.0003 P( X 25) 0.003
250
b. P( X 10) (0.05) (0.95) 0.0963
10 240
P( X 10) 0.0963
10
28. El artículo “Computer Assisted Net Weight Control” (Quality Progress, 1983, pp. 22 -25) sugiere
una distribución normal, con media de 137.2 onzas y desviación estándar de 1.6 onzas, para el
contenido real de frascos de cierto tipo. El contenido establecido era de 135 onzas.
d. ¿Cuál es la probabilidad de que un solo frasco contenga más que el contenido establecido?
e. Entre 10 frascos seleccionados al azar, ¿cuál es la probabilidad de que por lo menos 8
contengan más del contenido establecido?
f. Si se supone que la media permanece en 137.2, ¿a qué valor tendría que haberse cambiado la
desviación estándar para que 95% de todos los frascos contengan más de lo establecido?
Solución:
a. Con = 137.2 oz y = 1.6 oz
135 137.2
P( X 135) 1 P( X 135) 1 Z 1 (1.38) 1 0.0838 0.9162
1.6
P( X 135) 0.9162
b. Con Y = Número entre 10 frascos que contienen más de lo establecido, Y tiene una distribución
binomial b(y; 10, 0.9162), por tanto la probabilidad pedida es:
P(Y 8) 1 P(Y 8) 1 B(7;10,0.9162) 1 0.04512 0.95488 P(Y 8) 0.95488
135 137.2 136 137.2
P Z 0.05, (1.65) 0.05, entonces, 1.65
c.
135 137.2
despejando , 1.333 1.333
1.65
29. a. Si una distribución normal tiene = 25 y = 5, ¿cuál es el 91 percentil de la distribución?
b. ¿Cuál es el sexto percentil de la distribución del inciso (a)?
d. El ancho de una línea grabada en un chip de circuito integrado está normalmente distribuido
con media de 3.000 m y desviación estándar 0.150. ¿Qué valor separa al 10% más ancho de
todas las líneas del otro 90%?
Solución:
a. Con = 25 y = 5, el 91 percentil será:
x 25 x 25
P Z 0.91, (1.34) 0.91, entonces, 1.34
5 5
despejando x, x (1.34)5 25 31.7 91 percentil = 31.7
b. De la misma forma:
x 25 x 25
P Z 0.06, (1.555) 0.06, entonces, 1.555
5 5
despejando x, x (1.555)5 25 17.225 6 percentil = 17.225
c. Con = 3.000 y = 0.150, se requiere encontrar el 90 percentil que será:
267
x 3 x 3
P Z 0.90, (1.28) 0.90, entonces, 1.28
0.15 0.15
despejando x, x (1.28)0.15 3 3.192 90 percentil = 3.192
30. La distribución de resistencia para resistores de cierto tipo es normal, 10% de los resistores tienen
una resistencia que excede los 10.256 ohms y 5% una resistencia menor de 9.671 ohms. ¿Cuáles
son los valores de la media y la desviación estándar de la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
10.256 9.671
P Z 0.90 y P Z 0.05,
10.256 9.671
(1.28) 0.90 y (1.645) 0.05, entonces: 1.28, 1.645
Obtenemos las ecuaciones: 1.28 10.256 y 1.645 9.671
resolviendo el sistema tenemos:10.256 1.28 9.671 1.645 , 2.925 0.585
0.2 10
31. La vida de un láser de semiconductores con una alimentación de energía constante tiene una
distribución normal con una vida media de 7000 horas y una desviación estándar de 600 horas.
a. ¿Cuál es la probabilidad de que un láser falle antes de 5800 horas?
b. ¿Cuál es la vida en horas que excede 90% de los láseres?
c. ¿Qué valor deberá tener la vida media para que 99% de los láseres excedan 10000 horas antes
de fallar?
d. Un producto contiene tres láseres y el producto falla si cualquiera de ellos falla. Suponga que
fallan de manera independiente. ¿Qué valor deberá tener la vida media para que 99% de los
productos excedan 10000 horas antes de fallar?
Solución:
a. Con = 7000 horas y = 600, la probabilidad pedida es:
5800 7000
P( X 5800) P Z (2.0) 0.0228 P( X 5800) 0.0228
600
b. Se requiere encontrar el 10 percentil, para tener el 90% de los que exceden ese valor.
x 7000 x 7000
P Z 0.10, (1.28) 0.10, 1.28, despejando a x
600 600
x (1.28)600 7000 6232 x 6232 horas
d.
22. Suponga que el tiempo en horas tomado por el propietario de una casa para podar el césped de su
jardín es una va X, que tiene una distribución gamma con parámetros = 2 y = ½. ¿Cuál es la
probabilidad de que tarde:
a. a lo sumo una hora para podar su césped?
b. Por lo menos 2 horas?
c. entre 0.5 y 1.5 horas?
Solución:
x
a. Con = 2 y = ½, la distribución gamma acumulada es: F , y consultando en tablas:
1
P( X 1) F , 2 F (2, 2) 0.594 P( X 1) 0.594
1
2
2
b. P( X 2) 1 P( X 2) 1 F , 2 1 F (4, 2) 1 0.908 0.092 P( X 2) 0.092
1
2
3 1
P(0.5 X 1.5) F 2 , 2 F 2 , 2 F (3, 2) F (1, 2) 0.801 0.264
c. 1 1
2 2
P(0.5 X 1.5) 0.537
23. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de vida útil, la
duración X (en semanas) tiene una distribución gamma con media de 24 semanas y desviación
estándar de 12 semanas.
a. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
b. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas? ¿Es la mediana de la
distribución de duración menor de 24 semanas? ¿Por qué sí o porqué no?
c. ¿Cuál es el 99avo percentil de la distribución de duración?
d. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es tal que solo
la mitad del 1% de todos lo transistores estarán funcionando al terminar la prueba?
Solución:
a. Para una distribución gamma E( X ) , V ( X ) 2 2 , entonces:
24
24, 2 144, despejando , , sustituyendo en la otra ecuación
2
24 576 24
144, 144 y 4, 6
4
Teniendo los valores de = 4 y = 6, calculamos las probabilidades pedidas
24 12
P(12 X 24) F , 4 F , 4 F (4, 4) F (2, 4) 0.567 0.143
6 6
P(0.5 X 1.5) 0.424
b. P( X 24) F (4,4) 0.567 P( X 24) 0.567
Del resultado obtenido se deduce que P( X ) 0.5 24 . Esto se debe al sesgo
positivo de la distribución gamma.
x x
c. P( X x) 0.99, F ,4 0.99, F (10,4) 0.99, 10, x 60
6 6
El 99 percentil = 60
d. Para 1% = 0.01, la mitad es 0.005, entonces:
269
t t
P( X t ) 0.995, F ,4 0.995, F (11,4) 0.995, 11, t 66
6 6
24. Las llamadas partículas (o rayos) son en realidad electrones ordinarios expulsados de manera
excepcional del núcleo de algunos átomos de ciertos elementos radiactivos. Dichas partículas
jamás existen como tales dentro del núcleo, pero a veces llegan a crearse durante las
transformaciones nucleares, pudiendo escapar a grandes velocidades para ser detectadas en una
placa fotográfica. Si una pequeña porción de un elemento radiactivo expulsa en promedio 4
partículas por segundo, calcule la probabilidad de que transcurran:
a. Más de dos segundos para que se emitan dos partículas ;
b. Menos de tres segundos para que se emitan 10 partículas .
[Sugerencia: suponga que el tiempo de emisión de de dichas partículas sigue una distribución
gamma.
Solución:
a.
25. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo Method”
(Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución exponencial, con
parámetro = 0.93, como modelo para la distribución de la longitud (m) de la trayectoria libre
de un fotón bajo ciertas circunstancias. Suponga que el modelo es correcto.
a. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la longitud
de la trayectoria?
b. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es la
probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
c. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro =0.93
1 1 1 1
E ( X ) , V ( X ) 2 2 , así: 1.075, 1.075 = = 1.075
0.93
0 x0
b. Usando la fda F ( x; ) x
1 e x0
1
a. Aplicando la propiedad E(cX) = cE(X), ya que para una distribución logarítmica E ( X ) ,
c
tenemos: E (cX )
E c(1 0.5e ax )
0
c(1 0.5e ax ) e x dx c
0
e x dx 0.5
0
e ( a ) x dx
1
0.5 ( a ) x 1 0.5
c e x e c (0 1) (0 1)
b. 0 a 0
a
0.5c c ca 0.5c c(0.5 a)
c
a a a
c (0.5 a )
E c(1 0.5e ax )
a
27. Un mecanismo de aire acondicionado funciona con base en cinco componentes independientes, y
la vida útil de cada uno sigue una distribución exponencial con parámetro 15 (en años). Para
que el mecanismo de aire acondicionado funcione se requiere que por lo menos dos de sus cinco
componentes aún sirvan. Calcule la probabilidad de que el mecanismo de aire acondicionado
continúe funcionando después de 8 años.
Solución:
1
Para una distribución exponencial con parámetro , la función de distribución acumulada está
5
0 x0
dada por: F ( x; ) x
, entonces:
1 e x0
28. Según un reporte del periódico Uno Más Uno (octubre de 1998), muchos funcionarios y servidores
públicos del gobierno mexicano ocupan la mayoría de sus horas de trabajo haciendo llamadas
telefónicas personales. Suponga que la duración de las conferencias telefónicas personales de una
funcionaria de la Secretaria de Gobernación es una variable aleatoria X que sigue una distribución
exponencial, con parámetro = 0.012 (en minutos). Calcule:
a. La duración promedio de una conversación telefónica de esta funcionaria.
b. La desviación estándar de la duración de una llamada.
c. La probabilidad de que una conversación telefónica dura más de 50 minutos.
d. La probabilidad de que dure a lo sumo 30 minutos.
Solución:
1 1
a. Para una distribución exponencial E ( X ) , V (X ) 2 y la fda. Es:
2
0 x0 1
F ( x; ) x
, entonces: E ( X ) 83.33 E ( X ) 83.33 minutos
1 e x0 0.012
271
1
b. V ( X ) 6944.444, X V ( X ) 6944.444 83.33 X 83.33
(0.012)2
c. P( X 50) 1 P( X 50) 1 1 e(0.012)50 0.5488 P( X 50) 0.5488
(0.012)30
d. P( X 30) F (30;0.012) 1 e 1 0.6977 0.3023 P( X 30) 0.3023
29. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que presentaran un
examen de termodinámica, de manera individual. Para cualquiera de ellos se estima que el tiempo
promedio de solución del examen es de 1h 20 min y además la distribución del tiempo se asume
que es exponencial. Si el examen inició a las 9:00 a.m., calcule la probabilidad de que:
a. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
b. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso comprendido entre las
9:50 y 10:00 a.m.
c. Determine el número más probable de estudiantes que terminaran el examen antes de las 10:10
a.m.
d. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado para el
tiempo de solución de un examen?
Solución:
1 1
a. Como = 1h 20 min = 80 min y E ( X ) , entonces 0.0125 y la probabilidad
80
deseada será:
P( X 40) 1 e(0.0125)40 1 0.6065 0.39347 P( X 40) 0.39347 , con esta probabilidad
se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la probabilidad
pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:
P(Y 1) 1 P(Y 1) 1 B(0;5,0.39347) 1 0.08208 0.9179 P(Y 1) 0.9171
b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:
Distribución Lognormal
2. Sea X = la mediana de la potencia horaria (en decibelios) de señales de radio que se transmiten y
reciben entre dos ciudades. Los autores del artículo “Families of Distributions for Hourly Median
Power and Instantaneous Power of Received Radio Signals” (J. Research Natinal Bereau of
Standars, vol. 67D, 1963, pp. 753 – 762) argumentan que la distribución lognormal es un modelo
272
de probabilidad razonable para X. Si los valores de los parámetros son = 3.5 y = 1.2, calcule
lo siguiente:
a. El valor medio y la desviación estándar de la potencia recibida.
b. La probabilidad de que la potencia recibida esté entre 50 y 250 dB.
c. La probabilidad de que X sea menor que su valor medio. ¿Por qué esa probabilidad no es 0.5?
Solución:
= 1.2
E( X ) e
3.5 1.2
2
2 e4.22 68.0335 E ( X ) 68.0335
V (X ) e 7 1.44
(e 1.44
1) 14907.167, X V ( X ), X 14907.167 122.095
ln 50 3.5 ln 250 3.5
P(50 X 250) P Z (1.684) (0.343)
e. 1.2 1.2
0.9535 0.6331 0.3204 P(50 X 250) 0.3204
ln 68.0335 3.5
f. P( X 68.0335) P Z (0.60) 0.757 P( X 68.0335) 0.757
1.2
Esta probabilidad no es 0.5 porque la distribución lognormal no es simétrica
3. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de fundamento
a la suposición de que la resistencia a la ductilidad X de un material tiene una distribución
lognormal. Suponga que los parámetros son = 5 y = 0.1
a.Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana de la ductilidad?
e. Si diez muestras diferentes de una aleación de acero de ese tipo se someten a una prueba de
resistencia, ¿cuántas debería esperarse que tuvieran resistencia de por lo menos 120?
f. Si fueran 5% de los valores más pequeños de resistencia inaceptables, ¿cuál sería la resistencia
mínima aceptable?
Solución:
a. Para una distribución lognormal E ( X ) e
,
2
2
V ( X ) e2 (e 1) y con = 5 y =
2 2
0.1
E( X ) e
5 0.1
2
2 e5.005 149.157 E ( X ) 149.157
10 0.001
V (X ) e (e 0.001
1) 223.594, V ( X ) 223.594
ln120 5
P( X 120) 1 P( X 120) 1 P Z
b. 0.1
1 (2.125) 1 0.0168 0.9832 P( X 120) 0.9832
ln110 5 ln130 5
P(110 X 130) P Z (1.324) (2.995)
c. 0.1 0.1
0.0934 0.0014 0.092 P(110 X 300) 0.092
d. e , e5 148.41 =148.41
273
ln x 5 ln x 5
P Z 0.05, (1.645) 0.05, 1.645, despejando a x,
0.1 0.1
ln x (1.645)(0.1) 5, ln x 4.8355, x e4.8355 125.9 x 125.9
4. El artículo “The Statistics of Phytotoxic Air Pollutants” (J. Royal Stat. Soc., 1989, pp. 183 – 198)
sugiere la distribución lognormal como un modelo para la concentración de SO2, sobre cierto
bosque. Suponga que los parámetros son = 1.9 y = 0.9.
a. ¿Cuáles son el valor medio y la desviación estándar de la concentración?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo 10? ¿Entre 5 y 10?
Solución:
a. Para una distribución lognormal E ( X ) e
,
2
2
= 0.9
2
1.9 (0.9)
E( X ) e 2
10.024 E ( X ) 10.024
V ( X ) e3.9 (0.9) (e(0.9) 1) 125.395, X 125.395 11.2 X 11.2
2 2
ln10 1.9
P( X 10) P Z (0.45) 0.6736 P( X 10) 0.6736
0.9
ln 5 1.9 ln10 1.9
b. P(5 X 10) P Z (0.45) (0.32)
0.9 0.9
0.6736 0.3745 0.2991 P(5 X 10) 0.2991
5. Se sabe que la tasa promedio de uso de agua (miles de litros por hora) en cierta comunidad implica
una distribución logarítmica normal con parámetros = 5 y = 2.5 Es importante para propósitos
de planeación obtener una apreciación de los períodos de alta utilización.
a. ¿Cuál es la probabilidad de que para cualquier hora dada, se usen a lo sumo 50 000 litros de
agua?
b. ¿Cuál es la probabilidad de que se usen entre 30 000 y 50 000?
c. ¿Cuál es el valor esperado de litros de agua que se usan en cualquier hora dada?
d. En un período de 15 horas, ¿Durante cuantas horas se esperaría que se usaran a lo sumo 10
000?
Solución:
ln 50000 5
a. P( X 50000) P Z (2.3279) 0.9901 P( X 50000) 0.9901
2.5
ln 30000 5 ln 50000 5
P(30000 X 50000) P Z (2.3279) (2.1236)
b. 2.5 2.5
0.9901 0.983 0.0071 P(30000 X 50000) 0.0071
274
ln10000 5
c. P( X 10000) P Z (1.684) 0.954 .Con n = 15 y p = 0.954, el valor
2.5
esperado E(X) = np, por tanto E(X) = 15(0.954) = 14.3 E(X) = 14.3 horas
Distribución Weibull
1. La vida útil X (en cientos de horas) de cierto tipo de tubos al vacío tiene una distribución de
Weibull con parámetros = 2 y = 3. Calcule lo siguiente:
a. E(X) y V(X)
b. P(X 6)
c. P(5 X 6)
(Esta distribución Weibull está sugerida como modelo para el tiempo de servicio en “On the
Assessment of Equipment Reliability: Trading Data Collection Costs for Precision”, J. Engr,
.Manuf., 1991,pp. 105 – 109)
Solución:
a. Para una distribución Weibull las funciones de densidad de probabilidad y la función de
distribución acumulada son:
1 x
x e x0
f ( x; , )
x0
0
0 x0
F ( x; , )
1 e x 0
x
1
2 2 1
2
1 2
, 1 1
1 3 1 1 3
E ( X ) 3 1 3 3 2.659 E ( X ) 2.659
2 2 2 2 2
3
2
1
2
V ( X ) 3 (2) 9 1
2 2
9(1 0.7854) 1.93 V ( X ) 1.93
2 2
2
6
b. P( X 6) F (6;2,3) 1 e 3 1 e4 0.9817 P( X 6) 0.9817
1.5
2
2. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical
Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522) expresan que la distribución de
Weibull se utiliza ampliamente en problemas de estadística relacionados con la obsolescencia de
materiales aislantes sólidos sujetos a envejecimiento y esfuerzo. Proponen el uso de la distribución
como modelo para el tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos a
un voltaje de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
= 2.5 y = 200 (los datos de este artículo indican estos valores).
a. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200? ¿Menos de
200? ¿Mas de 300?
275
b. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
c. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que exceden ese
valor?
Solución:
2.5
x x
F ( x; , ) 1 e , en este caso: F ( x;2.5, 200) 1 e 200
1 e 1 0.632
2.5
200
P( X 200) 1 e 200
P( X 200) 0.632
a. P( X 200) 0.632, ya que es una distribución de probabilidad continua
P( X 300) 1 P( X 300) 1 F (300;2.5, 200)
300
200
2.5
2.7556
1 1 e e 0.06357 P( X 300) 0.06357
2. Suponga que la vida de servicio, en años, de la batería de un aparato para sordos es una variable
aleatoria que tiene una distribución de Weibull con = 2 y = 2.
a. ¿Cuánto se puede esperar que dure la batería?
b. ¿Cuál es la probabilidad de que tal batería esté en operación después de 2 años?
Solución:
x
1
a. Para = 2 y = 2, 1 , F ( x; , ) 1 e , entonces:
1 1 1 1
E ( X ) 1 , E ( X ) 2 1 2 E ( X ) 1.77
2 2 2
2
2
3. Sea X la resistencia a la tensión (ksi) a – 200ºC de un espécimen de acero de acero de cierto tipo
que exhibe “fragilidad en frío” a bajas temperaturas. Suponga que X tiene una distribución de
Weibull con = 20 y = 100.
Solución:
1 0.70418 0.929
20
105
a. P( X 105) F (105;20,100) 1 e 100
P( X 105) 0.929
276
100
20
100
20
20 20
c. 100
1
(100)20 ln(0.5) 20
98.18 98.18
4. En el artículo “Response of SiCf /Si3N4 Composites Under Static and Cyclic Loading – An
Experimental and Statistical Analysis” (J. Engr. Materials and Technology, 1997: 186 – 193) se
sugiere que la resistencia a la tensión en MPa de materiales compuestos bajo las condiciones
especificadas se puede modelar mediante una distribución de Weibull con = 9 y = 180.
a. Trace la gráfica de función de distribución acumulada.
b. ¿Cuál es la probabilidad de que la resistencia de un espécimen seleccionado al azar sea mayor
de 175? ¿De que esté entre 150 y 175?
c. Si se escogen al azar dos especímenes y sus resistencias son independientes entre sí, ¿cuál es
la probabilidad de que al menos uno tenga resistencia entre 150 y 175?
d. ¿Qué valor de resistencia separa al 10% más débil de especímenes del 90% restante?
Solución:
x
1
a. Para = 9 y = 180, 1 , F ( x; , ) 1 e
, entonces:
175
9
d. Sea Y = {uno de las especímenes tiene resistencia a la tensión entre 150 y 175}
P(Y 1) = 1 P(Y < 1) = 1- P(Y = 0), P(Y 1) = 1 (1- 0.3636)2 = 0.5950
P(Y 1) = 0.5950
e. Se requiere hallar el 10 percentil, esto es:
277
0.10, ln(0.90) x
9 9
x
F ( x;9,180) 0.10, 1 e 180
180
x 180 ln(0.90) 2.0899 10 , x 140.178
9 9 19
278
32. El artículo “ Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr., 1995, pp.
785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en un reactor se distribuye
normalmente con = 0.30 y = 0.06.
d. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
e. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
f. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de concentración?
Solución:
x
a. Para una distribución normal con = 0.30 y = 0.06, la va Z , y la probabilidad pedida
es:
0.25 0.30 0.25 0.30
P( X 0.25) P Z 1 P Z 1 (0.833)
0.06 0.06
P( X 0.25) 1 0.2033 0.7967 P( X 0.25) 0.7967
0.10 0.30
b. P( X 0.10) P Z (3.333) 0.0004 P( X 0.10) 0.0004
0.06
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son mas grandes),
el 95 percentil de la distribución normal estándar es 1.645, entonces:
c 0.30 c 0.30
P Z 0.95, (1.645) 0.95 1.645
0.06 0.06
despejando a c, c 1.645(0.06) 0.30 0.3987 c 0.3987mg/cm3
33. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una de las
siguientes probabilidades usando la aproximación normal (con la corrección de continuidad) para
los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades exactas calculadas de la tabla
correspondiente.
g. P(15 ≤ X ≤ 20)
h. P(X ≤ 15)
i. P(20 ≤ X)
Solución:
a. La aproximación normal para una binomial está dada por:
x 0.5 np
P( X x) B( x; n, p) , cuando np 10 y np 10 , para p = 0.5, 0.6 y 0.8
npq
tenemos: = np y npq
p 0.5 0.6 0.8
12.5 15.0 20.0
2.5 2.45 2.0
15 0.5 12.5 20 0.5 12.5
P(15 X 20) P Z (3.2) (0.8) 0.2112
2.5 2.5
15 0.5 15 20 0.5 15
P(15 X 20) P Z (2.24) ( 0.204) 0.5668
2.45 2.45
15 0.5 20 20 0.5 20
P(15 X 20) P Z (0.25) (2.75) 0.5957
2.0 2.0
279
15 0.5 12.5
P( X 15) P Z (1.2) 0.8849
2.5
15 0.5 15
b. P( X 15) P Z (0.204) 0.5808
2.45
15 0.5 20
P( X 15) P Z (2.25) 0.01222
2.0
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X 15) B(15;25,0.5) 0.8852
P( X 15) B(15;25,0.6) 0.5754
P( X 15) B(15;25,0.8) 0.0173
Haciendo la comparación:
19.5 12.5
P( X 20) 1 P( X 20) 1 P Z 1 (2.8) 1 0.99744 0.00256
2.5
19.5 15
c. P( X 20) 1 P( X 20) 1 P Z 1 (1.837) 1 0.9669 0.0331
2.45
19.5 20
P( X 20) 1 P( X 20) 1 P Z 1 ( 0.25) 1 0.40129 0.5987
2.0
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X 20) 1 P( X 20) 1 B(19;25,0.5) 1 0.99790 0.0021
P( X 20) 1 P( X 20) 1 B(19;25,0.6) 1 0.97064 0.0293
P( X 20) 1 P( X 20) 1 B(19;25,0.8) 1 0.38331 0.6167
Haciendo la comparación:
280
34. La distribución de resistencia para resistores de cierto tipo es normal, 10% de los resistores tienen
una resistencia que excede los 10.256 ohms y 5% una resistencia menor de 9.671 ohms. ¿Cuáles
son los valores de la media y la desviación estándar de la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
10.256 9.671
P Z 0.90 y P Z 0.05,
10.256 9.671
(1.28) 0.90 y (1.645) 0.05, entonces: 1.28, 1.645
Obtenemos las ecuaciones: 1.28 10.256 y 1.645 9.671
resolviendo el sistema tenemos:10.256 1.28 9.671 1.645 , 2.925 0.585
0.2 10
4. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de vida útil, la
duración X (en semanas) tiene una distribución gamma con media de 24 semanas y desviación
estándar de 12 semanas.
e. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
f. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas? ¿Es la mediana de la
distribución de duración menor de 24 semanas? ¿Por qué sí o porqué no?
g. ¿Cuál es el 99avo percentil de la distribución de duración?
h. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es tal que solo
la mitad del 1% de todos lo transistores estarán funcionando al terminar la prueba?
Solución:
e. Para una distribución gamma E( X ) , V ( X ) 2 2 , entonces:
24
24, 2 144, despejando , , sustituyendo en la otra ecuación
2
24 576 24
144, 144 y 4, 6
4
Teniendo los valores de = 4 y = 6, calculamos las probabilidades pedidas
24 12
P(12 X 24) F , 4 F , 4 F (4, 4) F (2, 4) 0.567 0.143
6 6
P(0.5 X 1.5) 0.424
f. P( X 24) F (4,4) 0.567 P( X 24) 0.567
Del resultado obtenido se deduce que P( X ) 0.5 24 . Esto se debe al sesgo
positivo de la distribución gamma.
x x
g. P( X x) 0.99, F ,4 0.99, F (10,4) 0.99, 10, x 60
6 6
El 99 percentil = 60
h. Para 1% = 0.01, la mitad es 0.005, entonces:
281
t t
P( X t ) 0.995, F ,4 0.995, F (11,4) 0.995, 11, t 66
6 6
5. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo Method”
(Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución exponencial, con
parámetro = 0.93, como modelo para la distribución de la longitud (m) de la trayectoria libre
de un fotón bajo ciertas circunstancias. Suponga que el modelo es correcto.
d. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la longitud
de la trayectoria?
e. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es la
probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
f. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro =0.93
1 1 1 1
E ( X ) , V ( X ) 2 2 , así: 1.075, 1.075 = = 1.075
0.93
0 x0
b. Usando la fda F ( x; ) x
1 e x0
6. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que presentaran un
examen de termodinámica, de manera individual. Para cualquiera de ellos se estima que el tiempo
promedio de solución del examen es de 1h 20 min y además la distribución del tiempo se asume
que es exponencial. Si el examen inició a las 9:00 a.m., calcule la probabilidad de que:
e. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
f. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso comprendido entre las
9:50 y 10:00 a.m.
g. Determine el número más probable de estudiantes que terminaran el examen antes de las 10:10
a.m.
h. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado para el
tiempo de solución de un examen?
Solución:
1 1
a. Como = 1h 20 min = 80 min y E ( X ) , entonces 0.0125 y la probabilidad
80
deseada será:
P( X 40) 1 e(0.0125)40 1 0.6065 0.39347 P( X 40) 0.39347 , con esta probabilidad
se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la probabilidad
pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:
P(Y 1) 1 P(Y 1) 1 B(0;5,0.39347) 1 0.08208 0.9179 P(Y 1) 0.9171
b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:
282
7. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de fundamento
a la suposición de que la resistencia a la ductilidad X de un material tiene una distribución
lognormal. Suponga que los parámetros son = 5 y = 0.1
a. Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana de la ductilidad?
ln120 5
P( X 120) 1 P( X 120) 1 P Z
g. 0.1
1 (2.125) 1 0.0168 0.9832 P( X 120) 0.9832
ln110 5 ln130 5
P(110 X 130) P Z (1.324) (2.995)
h. 0.1 0.1
0.0934 0.0014 0.092 P(110 X 300) 0.092
i. e , e5 148.41 =148.41
ln x 5 ln x 5
P Z 0.05, (1.645) 0.05, 1.645, despejando a x,
0.1 0.1
ln x (1.645)(0.1) 5, ln x 4.8355, x e4.8355 125.9 x 125.9
8. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical
Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522) expresan que la distribución de
Weibull se utiliza ampliamente en problemas de estadística relacionados con la obsolescencia de
materiales aislantes sólidos sujetos a envejecimiento y esfuerzo. Proponen el uso de la distribución
como modelo para el tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos
a un voltaje de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
= 2.5 y = 200 (los datos de este artículo indican estos valores).
283
d. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200? ¿Menos de
200? ¿Mas de 300?
e. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
f. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que exceden ese
valor?
Solución:
2.5
x x
F ( x; , ) 1 e , en este caso: F ( x;2.5, 200) 1 e 200
1 e 1 0.632
2.5
200
P( X 200) 1 e 200
P( X 200) 0.632
a. P( X 200) 0.632, ya que es una distribución de probabilidad continua
P( X 300) 1 P( X 300) 1 F (300;2.5, 200)
300
200
2.5
2.7556
1 1 e e 0.06357 P( X 300) 0.06357
35. El artículo “ Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr., 1995, pp.
785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en un reactor se distribuye
normalmente con = 0.30 y = 0.06.
g. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
h. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
i. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de concentración?
Solución:
x
a. Para una distribución normal con = 0.30 y = 0.06, la va Z , y la probabilidad pedida
es:
0.25 0.30 0.25 0.30
P( X 0.25) P Z 1 P Z 1 (0.833)
0.06 0.06
P( X 0.25) 1 0.2033 0.7967 P( X 0.25) 0.7967
0.10 0.30
b. P( X 0.10) P Z (3.333) 0.0004 P( X 0.10) 0.0004
0.06
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son mas grandes),
el 95 percentil de la distribución normal estándar es 1.645, entonces:
c 0.30 c 0.30
P Z 0.95, (1.645) 0.95 1.645
0.06 0.06
despejando a c, c 1.645(0.06) 0.30 0.3987 c 0.3987mg/cm3
36. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una de las
siguientes probabilidades usando la aproximación normal (con la corrección de continuidad) para
los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades exactas calculadas de la tabla
correspondiente.
j. P(15 ≤ X ≤ 20)
k. P(X ≤ 15)
l. P(20 ≤ X)
Solución:
a. La aproximación normal para una binomial está dada por:
x 0.5 np
P( X x) B( x; n, p) , cuando np 10 y np 10 , para p = 0.5, 0.6 y 0.8
npq
tenemos: = np y npq
p 0.5 0.6 0.8
12.5 15.0 20.0
2.5 2.45 2.0
15 0.5 12.5 20 0.5 12.5
P(15 X 20) P Z (3.2) (0.8) 0.2112
2.5 2.5
15 0.5 15 20 0.5 15
P(15 X 20) P Z (2.24) ( 0.204) 0.5668
2.45 2.45
15 0.5 20 20 0.5 20
P(15 X 20) P Z (0.25) (2.75) 0.5957
2.0 2.0
285
15 0.5 12.5
P( X 15) P Z (1.2) 0.8849
2.5
15 0.5 15
b. P( X 15) P Z (0.204) 0.5808
2.45
15 0.5 20
P( X 15) P Z (2.25) 0.01222
2.0
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X 15) B(15;25,0.5) 0.8852
P( X 15) B(15;25,0.6) 0.5754
P( X 15) B(15;25,0.8) 0.0173
Haciendo la comparación:
19.5 12.5
P( X 20) 1 P( X 20) 1 P Z 1 (2.8) 1 0.99744 0.00256
2.5
19.5 15
c. P( X 20) 1 P( X 20) 1 P Z 1 (1.837) 1 0.9669 0.0331
2.45
19.5 20
P( X 20) 1 P( X 20) 1 P Z 1 ( 0.25) 1 0.40129 0.5987
2.0
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X 20) 1 P( X 20) 1 B(19;25,0.5) 1 0.99790 0.0021
P( X 20) 1 P( X 20) 1 B(19;25,0.6) 1 0.97064 0.0293
P( X 20) 1 P( X 20) 1 B(19;25,0.8) 1 0.38331 0.6167
Haciendo la comparación:
286
37. La distribución de resistencia para resistores de cierto tipo es normal, 10% de los resistores tienen
una resistencia que excede los 10.256 ohms y 5% una resistencia menor de 9.671 ohms. ¿Cuáles
son los valores de la media y la desviación estándar de la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
10.256 9.671
P Z 0.90 y P Z 0.05,
10.256 9.671
(1.28) 0.90 y (1.645) 0.05, entonces: 1.28, 1.645
Obtenemos las ecuaciones: 1.28 10.256 y 1.645 9.671
resolviendo el sistema tenemos:10.256 1.28 9.671 1.645 , 2.925 0.585
0.2 10
6. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de vida útil, la
duración X (en semanas) tiene una distribución gamma con media de 24 semanas y desviación
estándar de 12 semanas.
i. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
j. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas? ¿Es la mediana de la
distribución de duración menor de 24 semanas? ¿Por qué sí o porqué no?
k. ¿Cuál es el 99avo percentil de la distribución de duración?
l. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es tal que solo
la mitad del 1% de todos lo transistores estarán funcionando al terminar la prueba?
Solución:
i. Para una distribución gamma E( X ) , V ( X ) 2 2 , entonces:
24
24, 2 144, despejando , , sustituyendo en la otra ecuación
2
24 576 24
144, 144 y 4, 6
4
Teniendo los valores de = 4 y = 6, calculamos las probabilidades pedidas
24 12
P(12 X 24) F , 4 F , 4 F (4, 4) F (2, 4) 0.567 0.143
6 6
P(0.5 X 1.5) 0.424
j. P( X 24) F (4,4) 0.567 P( X 24) 0.567
Del resultado obtenido se deduce que P( X ) 0.5 24 . Esto se debe al sesgo
positivo de la distribución gamma.
x x
k. P( X x) 0.99, F ,4 0.99, F (10,4) 0.99, 10, x 60
6 6
El 99 percentil = 60
l. Para 1% = 0.01, la mitad es 0.005, entonces:
287
t t
P( X t ) 0.995, F ,4 0.995, F (11,4) 0.995, 11, t 66
6 6
7. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo Method”
(Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución exponencial, con
parámetro = 0.93, como modelo para la distribución de la longitud (m) de la trayectoria libre
de un fotón bajo ciertas circunstancias. Suponga que el modelo es correcto.
g. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la longitud
de la trayectoria?
h. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es la
probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
i. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro =0.93
1 1 1 1
E ( X ) , V ( X ) 2 2 , así: 1.075, 1.075 = = 1.075
0.93
0 x0
b. Usando la fda F ( x; ) x
1 e x0
7. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que presentaran un
examen de termodinámica, de manera individual. Para cualquiera de ellos se estima que el tiempo
promedio de solución del examen es de 1h 20 min y además la distribución del tiempo se asume
que es exponencial. Si el examen inició a las 9:00 a.m., calcule la probabilidad de que:
i. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
j. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso comprendido entre las
9:50 y 10:00 a.m.
k. Determine el número más probable de estudiantes que terminaran el examen antes de las 10:10
a.m.
l. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado para el
tiempo de solución de un examen?
Solución:
1 1
a. Como = 1h 20 min = 80 min y E ( X ) , entonces 0.0125 y la probabilidad
80
deseada será:
P( X 40) 1 e(0.0125)40 1 0.6065 0.39347 P( X 40) 0.39347 , con esta probabilidad
se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la probabilidad
pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:
P(Y 1) 1 P(Y 1) 1 B(0;5,0.39347) 1 0.08208 0.9179 P(Y 1) 0.9171
b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:
288
9. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de fundamento
a la suposición de que la resistencia a la ductilidad X de un material tiene una distribución
lognormal. Suponga que los parámetros son = 5 y = 0.1
a. Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana de la ductilidad?
e. Si diez muestras diferentes de una aleación de acero de ese tipo se someten a una prueba de
resistencia, ¿cuántas debería esperarse que tuvieran resistencia de por lo menos 120?
f. Si fueran 5% de los valores más pequeños de resistencia inaceptables, ¿cuál sería la resistencia
mínima aceptable?
Solución:
V ( X ) e2 (e 1) y con = 5 y =
2 2
0.1
E( X ) e
5 0.1
2
2 e5.005 149.157 E ( X ) 149.157
10 0.001
V (X ) e (e 0.001
1) 223.594, V ( X ) 223.594
ln120 5
P( X 120) 1 P( X 120) 1 P Z
m. 0.1
1 (2.125) 1 0.0168 0.9832 P( X 120) 0.9832
ln110 5 ln130 5
P(110 X 130) P Z (1.324) (2.995)
n. 0.1 0.1
0.0934 0.0014 0.092 P(110 X 300) 0.092
o. e , e5 148.41 =148.41
ln x 5 ln x 5
P Z 0.05, (1.645) 0.05, 1.645, despejando a x,
0.1 0.1
ln x (1.645)(0.1) 5, ln x 4.8355, x e4.8355 125.9 x 125.9
10. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical
Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522) expresan que la distribución de
Weibull se utiliza ampliamente en problemas de estadística relacionados con la obsolescencia de
materiales aislantes sólidos sujetos a envejecimiento y esfuerzo. Proponen el uso de la distribución
como modelo para el tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos
a un voltaje de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
= 2.5 y = 200 (los datos de este artículo indican estos valores).
g. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200? ¿Menos de
200? ¿Mas de 300?
h. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
i. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que exceden ese
valor?
Solución:
a.
2.5
x x
F ( x; , ) 1 e , en este caso: F ( x;2.5, 200) 1 e 200
1 e 1 0.632
2.5
200
P( X 200) 1 e 200
P( X 200) 0.632
P( X 200) 0.632, ya que es una distribución de probabilidad continua
P( X 300) 1 P( X 300) 1 F (300;2.5, 200)
300
200
2.5
2.7556
1 1 e e 0.06357 P( X 300) 0.06357
5. En el artículo “Response of SiCf /Si3N4 Composites Under Static and Cyclic Loading – An
Experimental and Statistical Analysis” (J. Engr. Materials and Technology, 1997: 186 – 193) se
sugiere que la resistencia a la tensión en MPa de materiales compuestos bajo las condiciones
especificadas se puede modelar mediante una distribución de Weibull con = 9 y = 180.
a. Trace la gráfica de función de distribución acumulada.
b. ¿Cuál es la probabilidad de que la resistencia de un espécimen seleccionado al azar sea mayor
de 175? ¿De que esté entre 150 y 175?
c. Si se escogen al azar dos especímenes y sus resistencias son independientes entre sí, ¿cuál es
la probabilidad de que al menos uno tenga resistencia entre 150 y 175?
d. ¿Qué valor de resistencia separa al 10% más débil de especímenes del 90% restante?
290
Solución:
x
1
a. Para = 9 y = 180, 1 , F ( x; , ) 1 e , entonces:
175
9
f. Sea Y = {uno de las especímenes tiene resistencia a la tensión entre 150 y 175}
P(Y 1) = 1 P(Y < 1) = 1- P(Y = 0), P(Y 1) = 1 (1- 0.3636)2 = 0.5950
P(Y 1) = 0.5950
g. Se requiere hallar el 10 percentil, esto es:
x
180
9
x
9
Temperatura
170 172 173 174 174 175 176 177 180 180 180 180
Relación 0.84 1.31 1.42 1.03 1.07 1.08 1.04 1.42 1.45 1.60 1.61 2.13
Temperatura 180 181 181 182 182 182 182 184 184 185 186 188
Relación 2.15 0.84 1.43 0.90 1.81 1.94 2.68 1.49 2.52 3.00 1.87 3.08
a. Trace un diagrama de tallo y hojas de la temperatura y la relación de eficiencia y comente
sobre las propiedades interesantes.
b. ¿El valor de la relación de eficiencia está determinado en forma total y única por la
temperatura del tanque? Explique su razonamiento.
c. Trace un diagrama de dispersión de los datos. ¿Al parecer la relación de eficiencia se puede
predecir bien por el valor de la temperatura? Explique su razonamiento.
Solución:
a.
17 0 0 889
17 23 1 0000
17 445 1 3
17 67 1 44444
17 1 66
18 0000011 1 889
18 2222 2 11
18 445 2
18 6 2 5
18 8 2 6
2
3 00
c. En la gráfica de dispersión los puntos presentan bastante variabilidad y no todos están muy
cercanos a una
Gráfica de dispersión de Temperatura vs.relación
línea recta o una
curva simple.
3.0
2.5
Relación de eficiencia
2.0
1.5
1.0
2. El artículo “Exhaust Emissions from Tour – Stroke Lawn Mower Engines” (J. of the Air and Water
Mgmnt. Assoc., 1997, pp. 945 – 952) presenta datos de un estudio donde se usaron una mezcla
base de gasolina y una gasolina reformulada. Examine las siguientes observaciones sobre edad
(años) y emisiones de NOx, en g/kW-h
Motor 1 2 3 4 5 6 7 8 9 10
Edad 0 0 2 11 7 16 9 0 12 4
Base 1.72 4.38 4.06 1.26 5.31 0.57 3.37 3.44 0.74 1.24
Reformulada 1.88 5.93 5.54 2.67 6.53 0.74 4.94 4.89 0.69 1.42
Trace diagramas de dispersión de las emisiones de NOx contra la edad. ¿Cuál parece ser la
naturaleza de la relación entre estas dos variables? (Nota: los autores del artículo comentaron la
relación).
293
Solución:
294
4. Una compañía de fondo mutualista ofrece a sus clientes varios fondos diferentes: uno de
mercado de dinero, tres fondos diferentes de bonos(a corto, mediano y largo plaza), dos
de acciones (riesgo moderado y alto) y uno balanceado. Entre los clientes que poseen
acciones en uno solo de los fondos, los porcentajes de clientes en los diferentes fondos
son los siguientes:
Se selecciona al azar un cliente que tenga acciones en sólo uno de los fondos.
d. ¿Cuál es la probabilidad de que el cliente tenga acciones en el fondo balanceado?
e. ¿Cuál es la probabilidad de que el cliente tenga acciones en un fondo de bonos?
f. ¿Cuál es la probabilidad de que el cliente no tenga acciones en un fondo de acciones?
Solución
Solución
d. P (A B) = P (A) + P (B) – P (A B)
= 0.5 + 0.4 – 0.25 = 0.65
e. Sea C = {No tenga ninguna de esas tarjetas}
P (C) = P (A B)’ = 1- P (A B) = 1 – 0.65 = 0.35
A B’
Solución
i. A1 A2 A3 Se otorgue el proyecto 1, el 2 o el 3
P (A1 A2 A3) = P (A1) + P (A2) + P (A3) – P (A1 A2) – P (A1 A3)
- P (A2 A3) + P (A1 A2 A3)
296
j. A1’ A2’ A3’ = (A1 A2)’ A3’ = (A1 A2 A3)’ No se otorgue ningún proyecto
P (A1 A2 A3)’ = 1- P (A1 A2 A3) = 1- 0.53 = 0.47