Está en la página 1de 296

1

AXIOMAS, INTERPRETACIONES Y PROPIEDADES

1. Una compañía de fondo mutualista ofrece a sus clientes varios fondos diferentes: uno
de mercado de dinero, tres fondos diferentes de bonos(a corto, mediano y largo plaza),
dos de acciones (riesgo moderado y alto) y uno balanceado. Entre los clientes que
poseen acciones en uno solo de los fondos, los porcentajes de clientes en los diferentes
fondos son los siguientes:

Mercado de dinero 20% Acciones de alto riesgo 18%


Bono a corto plazo 15% Acciones de riesgo moderado 25%
Bono a mediano plazo 10% Fondo balanceado 7%
Bono a largo plazo 5%

Se selecciona al azar un cliente que tenga acciones en sólo uno de los fondos.
a. ¿Cuál es la probabilidad de que el cliente tenga acciones en el fondo balanceado?
b. ¿Cuál es la probabilidad de que el cliente tenga acciones en un fondo de bonos?
c. ¿Cuál es la probabilidad de que el cliente no tenga acciones en un fondo de
acciones?

Solución

Sean los siguientes eventos:


A = {Tenga acciones en Mercado de dinero} P (A) = 0.20
B = {tenga fondo de bono a corto plazo} P (B) = 0.15
C = {tenga fondo de bono a medio plazo} P (C) = 0.10
D = {Bono a largo plazo} P (D) = 0.05
E = {Acciones de alto riesgo} P (E) = 0.18
F = {Acciones de riesgo moderado} P (F) = 0.25
G = {Fondo balanceado} P (G) = 0.07

a. P (Fondo balanceado) = P (G) = 0.07


b. P (Fondo de bonos) = P (B) + P (C) + P (D) = 0.15 + 0.10 + 0.05 = 0.30
c. P (No tenga acciones en fondo de acciones) = 1 – P (E) – P (F)
= 1 - 0.18 – 0.25 = 0.57

2. Se selecciona al azar un alumno de cierta universidad y señalamos como A el evento


en el que el individuo seleccionado tiene una tarjeta de crédito Visa y como B el
evento análogo para una MasterCard. Supongamos que P(A) = 0.5, P (B) = 0.4 y P(A
 B) = 0.25.
a. Calcule la probabilidad de que el individuo seleccionado tenga al menos una de las
dos tarjetas, esto es la probabilidad del evento A  B.
b. ¿Cuál es la probabilidad de que el individuo seleccionado no tenga ninguna de esas
tarjetas?
c. Describa en términos de A y B, el evento en que el alumno seleccionado tenga una
tarjeta Visa, pero no una MasterCard, y a continuación calcule la probabilidad de
este evento.

Solución

a. P (A  B) = P (A) + P (B) – P (A  B)
2

= 0.5 + 0.4 – 0.25 = 0.65


b. Sea C = {No tenga ninguna de esas tarjetas}
P (C) = P (A  B)’ = 1- P (A  B) = 1 – 0.65 = 0.35

c. Sea D = {Se tenga una tarjeta Visa pero no una MasterCard}


D = A  B’, por tanto P (D) = P (A  B’) = P (A  B) – P (B)
= 0.65 – 0.40 = 0.25

A  B’

3. Una empresa de consultoría de computadoras ha licitado en tres proyectos.


Supongamos que Ai = {proyecto i otorgado}, para i = 1, 2, 3, y P(A1) = 0.22, P(A2) =
0.25, P(A3) = 0.28, P(A1 ∩ A2) = 0.11, P(A1 ∩ A3) = 0.05, P(A2 ∩ A3) = 0.07, P(A1 ∩
A2 ∩ A3) = 0.01. Exprese con palabras cada uno de los siguientes eventos y calcule la
probabilidad.
a. A1 ⋃ A2
b. A1’∩ A2’
c. A1 ⋃ A2 ⋃ A3
d. A’1 ∩ A’2 ∩ A’3
e. A’1 ∩ A’2 ∩ A3
f. (A’1 ∩ A’2) ⋃ A3

Solución

a. A1  A2 Se otorgue el proyecto 1 o el 2 (o ambos)


P (A1  A2) = P (A1) + P (A2) – P (A1  A2) = 0.22 + 0.25 – 0.11 = 0.36

b. A1’  A2’ = (A1  A2)’ No se otorgue el proyecto 1 ni el 2


P (A1  A2)’ = 1 - P (A1  A2) = 1 – 0.36 = 0.64

c. A1  A2  A3 Se otorgue el proyecto 1, el 2 o el 3
P (A1  A2  A3) = P (A1) + P (A2) + P (A3) – P (A1  A2) – P (A1  A3)
- P (A2  A3) + P (A1  A2  A3)
= 0.22 + 0.25 + 0.28 – 0.11 – 0.05 – 0.07 + 0.01 = 0.53

d. A1’  A2’  A3’ = (A1  A2)’  A3’ = (A1  A2  A3)’ No se otorgue ningún
proyecto
P (A1  A2  A3)’ = 1- P (A1  A2  A3) = 1- 0.53 = 0.47
3

e. A1’  A2’  A3 = (A1  A2)’  A3 Solo se otorgue el proyecto 3


P (A1  A2)’= 0.64 P [(A1  A2)’  A3 = 0.17

f. (A1’  A2’)  A3 = (A1  A2)’  A3 No se otorgue el proyecto 1 o el 2, o se otorgue


el 3
P [(A1  A2)’  A3 = P [(A1  A2)’ +P (A3) – P [(A1  A2)’  A3
= 0.64 + 0.28 – 0.17 = 0.75
4

DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS


CONTINUAS

VARIABLES ALEATORIAS CONTINUAS

1. Simbolice con X la cantidad de tiempo de préstamo para un libro, disponible durante


2 horas en la biblioteca de una Universidad, solicitado por un estudiante seleccionado
la azar, suponga que X tiene una función de densidad

0.5 x 0 x2
f ( x)  
0 de otra manera
Calcule las siguientes probabilidades:
a. P(X ≤ 1)
b. P(0.5 ≤ X ≤ 1.5)
c. P(1.5 < X)

Solución

1
1 x2

1
1
a. P( X  1)  0.5 xdx    0.25
0 2 2 0
4

1.5


1.5
1 1 1
b. P(0.5  X  1.5)  0.5 xdx  x 2  (2.25  0.25)  (2)  0.5
0.5 4 0.5 4 4

1.5


1.5
1 2
P( X  1.5)  1  P( X  1.5)  1  0.5 xdx  1  x
0 4 0
c.
1
 1  (2.25)  1  0.5625  0.4375
4

2. Suponga que la temperatura de reacción X (en º C) de cierto proceso químico tiene una
distribución uniforme con A = -5 y B = 5. Calcule:
a. P(X < 0)
b. P(-2.5 < X < 2.5)
c. P(-2 ≤ X ≤ 3)
d. Si k satisface -5 < k < k + 4 < 5, calcule P (k < X < k + 4).

Solución

a. Puesto que la distribución es uniforme tiene la forma


 1 1
 A X  B  5  X  5
f ( x)   B  A f ( x)  10

 0 de otra manera 
0 de otra manera


0
0
P( X  0)  1
10 dx  101 x 5
 101 (0  5)  0.5
5
5


2.5
b. P(2.5  X  2.5)  101 dx  101 x
2.5
 2.5
 101 (2.5  2.5)  0.5
 2.5

c. P(2  X  3)  101 x 2  101 (3  2)  0.5


3

k 4
d. P(k  X  k  4)  101 x k
 101 (k  4  k )  101 (4)  0.4

3. Suponga que el error al hacer cierta medición es una va continua X con fdp

0.09375(4  x 2 ) 2 x  2
f ( x)  
 0 de otra manera
a. Trace la gráfica de f (x).
b. Calcule P (X > 0).
c. Calcule P(-1 < X < 1)
d. Calcule P (X < - 0.5 o X > 0.5)

Solución
a.

f ( x)

2
 x3   8

2
b. P( X  0)  0.09375 2

(4  x )dx  0.09375 4 x    0.09375 8    0.5
0  3 0
 3

1
 x3 

1
P(1  X  1)  0.9375 (4  x )dx  0.09375 4 x  
2

1  3 1
c.
 1  1   22 
 0.09375 4      4    0.09375   0.6875
 3  3   3 
6

0.5
 x3   1   1 
d. P(0.5  X  0.5)  0.9375 4 x    0.09375 2      2    0.3672
 3 0.5  24   24 

P( X  0.5 o X  0.5)  1  P(0.5  X  0.5)  1  0.3672  0.6328

4. Simbolice con X el esfuerzo vibratorio (lb / pulg2) en la paleta de una turbina de viento,
a una velocidad particular en el túnel de viento. El artículo “Blade Fatigue Life
Assessment with Aplication to Vawts” (J. Solar Energy Engr. 1982) propone la
distribución de Rayleigh, con fdp

 x  x 2 /( 2 2 )
 e x0
f ( x; )   2

 0 de otra manera

como modelo para la distribución X.


a. Verifique que f (x, ) sea una fdp legítima.
b. Suponga que  = 100 (un valor sugerido por una gráfica en el artículo).¿Cuál es la
probabilidad de que X sea a lo sumo 200? y ¿menor de 200? ¿Por lo menos 200?
c. ¿Cuál es la probabilidad de que X esté entre 100 y 200?
d. Dé una expresión para P (X ≤ x)

Solución


a.
 f ( x)dx  1



x / 2 2 / 2 2 
e x dx  e  x  (0  e0 )  1
2 2

0  2 0


200
x / 2 2 / 2 2
200
P( X  200)  e x dx   e  x  (e  2  e 0 )
2 2

b. 0  2
0

 (0.1353  1)  0.8647

P (X < 200) = P (X  200) = 0.8647 ya que X es continua


P(X  200) = 1 – P (X < 200) = 1 – 0.8647 = 0.1353


200
x / 2 2 / 2 2
200
P(100  X  200)  e x dx   e  x  (e 2  e 0.5 )
2 2

c. 100 2 100

 (0.1353  0.6065)  0.4712


x
x / 2 2 / 2 2
x
/ 2 2
P( X  x)  e x dx   e  x  ( e  x  e0 )
2 2 2

d. 0  2
0

/ 2 2
 (1  e  x
2
)
7

5. Un maestro universitario nunca termina su clase antes de que suene la campana y


siempre termina su clase a menos de 2 min después de que suena la campana. Sea X
= el tiempo que transcurre entre la campana y el término de clase y suponga que la
fdp de X es:

kx2 0 x2
f ( x)  
0 de otra manera
a. Encuentre el valor de k
b. ¿Cuál es la probabilidad de que la clase termine a menos de 1 minuto después de
que suene la campana?
c. ¿Cuál es la probabilidad de que la clase continúe entre 60 y 90 s después de que
suene la campana?
d. ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 s después de que
suene la campana?

Solución


a. Se sabe que
 f ( x)dx  1 y por tanto

2
 x3  8

2
3
kx dx  k    k    1
2
k 
0  3 0  3 8

1
3  x3  31 1

1
b. P( X  1)  k x dx         0.125
2

0 8  3 0 8  3  8

1.5
3  x3  3  27 1  3  19  19
c. P(1  X  1.5)             0.2969
8  3 1 8  24 3  8  24  64

1.5
3  x3  3  27  27 37
d. P( X  1.5)  1  P( X  1.5)  1     1     1    0.5781
8  3 0 8  24  64 64

6. El peso real de apoyo de una pastilla de estéreo, que actualmente está puesta a 3g en
un tocadiscos, puede considerarse una va X continua con fdp


k 1  ( x  3) 2
f ( x)  

2 x4
 0 de otra manera
a. Dibuje la gráfica de f (x).
b. Encuentre el valor de k
c. ¿Cuál es la probabilidad de que el peso real de apoyo sea mayor que el peso
especificado?
d. ¿Cuál es la probabilidad de que el peso real sea menor de 0.25g del peso
especificado?
e. ¿Cuál es la probabilidad de que le peso real difiera del peso especificado más de
0.5g?
8

Solución

a.

f ( x)

 1  ( x  3) dx  1
4
2
b. k
2

4
 ( x  3) 3   1  1  4 3
k x    k  4     2    k    k
 3 2  3  3  3 4

4
3   ( x  3) 3 
 
4
3  1 
P( X  3)  k 1  ( x  3) dx   x  
2
   4    (3  0)
3 4   3  3 4  3 
c.
32 1
     0.5
43 2

2.75
3 ( x  3) 3 
  
2.75
P( X  2.75)  k 1  ( x  3) dx   x 
2

2 4 3 2
d.
3  1  3
  (2.75  5.208  10 3 )   2    (0.4218)  0.316
4  3  4

P x  3  0.5  1  P x  3  0.5  1  P(2.5  X  3.5)


3.5
3 ( x  3) 3 
  
3.5
3
e.  1 1  ( x  3) dx  1   x 
2

4 2.5 4 3  2.5

 1
3
(3.4583)  (2.5416)  1  0.6875  0.3125
4

7. El tiempo X (minutos) para que un asistente de laboratorio prepare el equipo para un


experimento tiene una distribución uniforme con A = 25 y B = 35.
a. Escriba la fdp de X y trace su gráfica.
b. ¿Cuál es la probabilidad de que el tiempo de preparación exceda de 33 min?
9

c. ¿Cuál es la probabilidad de que el tiempo de preparación se encuentre a 2 minutos


del tiempo medio?
d. Para cualquier a tal que 25 < a < a + 2 < 35, ¿cuál es la probabilidad de que el
tiempo de preparación esté entre a y a + 2 minutos?

Solución
a. Para una distribución uniforme la función de distribución de probabilidad es:

 1
 BX A
f ( x)   B  A

 0 de otra manera
En este caso tenemos:

1
 25  X  35
f ( x)  10

0 de otra manera


35
b. P( X  33)  dx  101 x 33  101 (35  33)  102  0.2
1 35
10
33

35
1  x2 

35
c. E ( X )    1
10 xdx     30
25 10  2  25

30  2 es de 28 a 32


32
P(28  X  32)  101 dx  101 x 28  101 (32  28)  0.4
32

28

a2
d. P(a  X  a  2)  101 x a  0.1(a  2  a)  0.2

8. Para trasladarme la trabajo, primero debo abordar un autobús cerca de casa y después
transbordar otro. Si el tiempo de espera (en minutos) en cada parada tiene una
distribución uniforme con A = 0 y B = 5, entonces se puede demostrar que mi tiempo
total de espera Y tiene una fdp

 251 y 0 y5

f ( y )   52  251 y 5  y  10
0 y0 o y  10

a. Trace la gráfica de fdp de Y.



b. Verifique que  f ( y)dy  1


c. ¿Cuál es la probabilidad de que el tiempo total de espera sea a lo sumo de 3 min?


d. ¿Cuál es la probabilidad de que el tiempo total de espera sea a lo sumo de 8 min?
e. ¿Cuál es la probabilidad de que el tiempo total de espera esté entre 3 y 8 min?
10

f. ¿Cuál es la probabilidad de que el tiempo total de espera sea menos de 2 min o más
de 6?

Solución

a. Falta gráfica

  
5 10
f ( y )dy  1
25 ydy  ( 52  251 y )dy
b.  0 5

 1
25 ( y / 2)  ( 52 y  25
2 5
0
1
5  2  (2  2 )  2  2  1
y 2 / 2)10 1 3 1 1

3
y2

3
9
c. P(Y  3)  1
25 ydy    0.18
0 50 0
50

5
y2
 ydy   (
5 8
P(Y  8)  1
25
2
5  1
25 y )dy   ( 52 y  501 y 2 ) 85
d. 0 5 50 0

 (  )  
1
2
48
25
3
2
1
2
21
50  23
25  0.92

e. P(3  Y  8)  P(Y  8)  P(Y  3)  0.92  0.18  0.74

 
2 10 2 10
P(Y  2 o Y  6)  1
25 ydy  ( 52  25
1
y )dy  1
50 y 2  ( 52 y  501 y 2 )
f. 0 6 0 6

 2
25  (2  42
25 )  5  0.4
2

9. “Intervalo” en la circulación de tránsito, es el tiempo transcurrido entre el instante en


que un automóvil termina de pasar por un punto fijo y el siguiente comienza a pasar
por ese punto. Sea X el intervalo para dos automóviles consecutivos en una autopista,
escogidos al azar, durante un período de mucho tráfico. La siguiente fdp de X está
sugerida en “The Statistical Properties of Freeway Traffic” (Transp. Research, vol.
11, pp. 221 -228):

0.15e 0.15( x 0. 5) x  0.5


f ( x)  
 0 de otra manera
¿Cuál es la probabilidad de que el intervalo sea
a. a lo sumo 6 s?
b. más de 6 s? ¿Por lo menos 6 s?
c. entre 5 y 6 s?

Solución


6 6
a. P( X  6)  0.15e 0.15( x 0. 5) dx  e 0.15( x 0. 5)  (0.4382  1)  0.5618
0.5 0.5

b. Puesto que es una distribución de probabilidad para va continua


11

P (X > 6) = P (X  6) = 1 – P (X  6) = 1- 0.5618 = 0.4382


6 6
c. P(5  X  6)  0.15e 0.15( x 0. 5) dx  e 0.15( x 0. 5)  (0.4382  0.5092)  0.071
5 5

10. Una familia de funciones de densidad de probabilidad que se emplea para aproximar
la distribución del ingreso, la distribución de la población urbana y la distribución del
tamaño de las empresas, es la familia Pareto. Esta familia tiene dos parámetros, k y ,
ambos >0 y la fdp es

 k  k
 x 
f ( x; k , )   x k 1
 0 x 

a. Trace la gráfica de f(x; k, ).


b. Verifique que el área total bajo la gráfica sea igual a 1.
c. Si la va X tiene fdp f(x; k, ) para cualquier valor fijo de b > , obtenga una
expresión para P(X  b)
d. Para  < a < b, obtenga una expresión para la probabilidad P(a  X  b).

Solución

a. Falta gráfica



k  k k
b.
 x k 1
dx  
xk 
 (0  1)  1

b
k  k k  k   
k


b
c. P( X  b)  k 1
dx   k   k  1  1   
 x x  b  b

b
k  k k  k  k     
k k


b
d. P(a  X  b)  k 1
dx   k   k  k       
a x x a b a  a b

VARIANZA DE UNA VARIABLE ALEATORIA

1. La fda de la duración X de tiempo de préstamo de un libro es:

0 x0
 2
x
F ( x)   0 x2
4
1 2 x

Utilícela para calcular lo siguiente:


12

a. P(X ≤ 1)
b. P(0.5 ≤ X ≤ 1)
c. P(X >0.5)
d. La duración mediana de tiempo de préstamo de libros ~ [resuelva 0.5 = F ( ~) 
e. F’(x) para obtener la función de densidad f(x).

Solución

(1) 2 1
a. P( X  1)  F (1)    0.25
4 4

b. P(0.5  X  1)  F (1)  F (0.5)  0.25  (0.5) 2 / 4)  0.25  0.0625  0.1875

c. P (X  0.5) = 1- P (X < 0.5) = 1 – 0.0625) = 0.9375

d. La mediana satisface 0.5 = F ( ~)

p  F (n( p))  1
4 n( p)2
4 p  n( p) 4(0.5)  n( p)
2 2

n( p)  2  1.4142 ~  1.4142

e. f(x) = F ‘(x) = 1
2 x

1
 x 0 x2
f ( x)   2

0 de otra manera

2. La fda para X (= error de medición) es

 0 x  2

1 3  x3 
F ( x)     4 x    2  x  2
 2 32  3
 2 x
 1
a. Calcule P(X < 0)
b. Calcule P(-1 < X < 1)
c. Calcule P(0.5 < X)
d. Encuentre la función de densidad f(x).
e. Verifique que ~ = 0

Solución

a. P( X  0)  F (0)  12  323 (0)  12  0.5


13

P(1  X  1)  F (1)  F (1)  12  323 (4  13 )  12  323 (4  13 )


b.
 27
32  325  22
32  0.6875

c. P( X  0.5)  1  P( X  0.5)  1  F (0.5)  1  12  323 (2  24


1
)  1  175
256 
81
256  0.3164

d. f ( x)  F ' ( x)  3
32 (4  x 2 ) por tanto

 3 (4  x 2 ) 2 x  2
f ( x)   32
 0 de otra manera
0.5  F (  )
~
 12  323 (4n  n3 )
3
1
e. 2

0  4n  n3  n(4  n3 )
3 2

Los valores posibles de n son n = 0 y n  12 , por tanto el único valor posible es


el de n = 0

3. Simbolice con X el tiempo que dura un libro prestado con fdp

0.5 x 0 x2
f ( x)  
0 de otra manera
a. Calcule E(X).
b. Calcule V(X) y .
c. Si a la persona que solicita el libro se le cobra una cantidad h(X) = X 2 cuando la
duración del préstamo es X, calcule el cobro esperado E [h(X).

Solución

2
 x3 

2
8 4
a. E ( X )  0.5 x  xdx  0.5   
0  3 0 6 3

2
 x4 

2
b. E ( X )  0.5
2
x  xdx  0.5   2
2

0  4 0

Puesto que V ( X )  E ( X 2 )  E ( X )  2 
4 2

2

3 3

2
 x4 
 

 
2
c. E h( X )  2
h( x)  f ( x)dx  x (0.5 x)dx  0.5   2
2

 0  4 0

4. El artículo “Modeling Sediment and Water Column Interactions for Hydrophobic


Pollutants” (Water Research, 1984, pp. 1169 – 1174) sugiere la distribución uniforme
en el intervalo (7.5, 20) como un modelo para la profundidad (cm) de la capa de
bioturbación del sedimento de cierta región.
14

a. ¿Cuáles son la media y la varianza de la profundidad?


b. ¿Cuál es la fda de la profundidad?
c. ¿Cuál es la probabilidad de que la profundidad observada sea a lo sumo 10? ¿Entre
10 y 15?
d. ¿Cuál es la probabilidad de que la profundidad observada se encuentre a 1 DE del
valor medio? y ¿a 2 DE?

Solución

a.
15

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS


DISCRETAS

1. Un taller de servicios para automóviles sabe que 45% de las afinaciones se efectúa en
automóviles de 4 cilindros, 40% en automóviles de 6 cilindros y 15 % en automóviles
de 8 cilindros. Sea X = número de cilindros del siguiente automóvil que se afinará.
a. ¿Cuál es la fpm de X?
b. Dibuje una gráfica lineal y un histograma de probabilidad a partir de la fpm del
inciso a.

Solución

a.
x 4 6 8
p(x) 0.45 0.40 0.15

b.

2. Sea X = número de neumáticos con baja presión de un automóvil seleccionado al azar.


a. ¿Cuál de las siguientes tres funciones de p(x) es una fpm legítima para X y por qué
no se permiten las otras dos?

x 0 1 2 3 4

P(x) .3 .2 .1 .05 .05

p(x) .4 .1 .1 .1 .3

p(x) .4 .1 .2 .1 .3

b. Para la fpm legítima del inciso a calcule P (2 ≤ X ≤ 4), P(X ≤ 2) y P(X ≠ 0).
4
c. Si p(x) = c (5 – x) para x = 1,2,3, 4, ¿cuál es el valor de c? (Sugerencia :  p( x)  1
x 0
Solución

a. La función de probabilidad de masa legítima es:

x 0 1 2 3 4
p(x) 0.4 0.1 0.1 0.1 0.3

Las otras dos no se permiten porque  p(x)  1


b. P (2  X  4) = 0.1 + 0.1 + 0.3 = 0.5
P (X  2) = 0.4 + 0.1 + 0.1 = 0.6
P (X  0) = 0.1 + 0.1 + 0.1 + 0.3 = 0.6
16

c. p (x) = c (5 – x)
c (5 – 0) + c (5 – 1) + c (5 – 2) + c (5 – 3) + c (5 – 4) = 1
5c + 4c + 3c + 2c + c = 1
15 c = 1, por tanto c = 1/ 15

3. Un negocio de computadoras que atiende pedidos por correo tiene seis líneas
telefónicas. Simbolicemos con X el número de líneas en uso en un momento
específico. Supongamos que la fpm de X está dada en la tabla siguiente.

x 0 1 2 3 4 5 6
p(x) .10 .15 .20 .25 .20 .06 .04

Calcule la probabilidad de cada uno de los siguientes eventos.


a. {A lo sumo tres líneas estén en uso}l
b. {Menos de tres líneas estén en uso}
c. {Por lo menos tres líneas estén en uso}
d. {Entre 2 y 5 líneas estén en uso}
e. {Entre dos y cuatro líneas no estén en uso}
f. {Por lo menos cuatro líneas no estén en uso}

Solución

a. P (A) = P (X  3) = 0.10 + 0.15 + 0.20 + 0.25 = 0.70


b. P (B) = P (X < 3) = 0.10 + 0.15 + 0.20 = 0.45
c. P (C) = P ( X  3) = 0.25 + 0.20 + 0.06 + 0.04 = 0.55
d. P (D) = P (2  X  5) = 0.20 + 0.25 + 0.20 + 0.06 = 0.71
e. Sea E = {Entre 2 y 4 líneas no están en uso}
Si 4 están en uso, entonces 2 no están en uso
Si 2 están en uso, entonces 4 no están en uso, por tanto:
P (E) = P (2  X  4) = 0.20 + 0.25 + 0.20 = 0.65
f. Sea F = {Por lo menos 4 líneas no están en uso}
Si a lo sumo 2 líneas están en uso por lo menos cuatro no están en uso, entonces:
P (F) = P (X  2) = 0.10 + 0.15 + 0.20 = 0.45

4. Un contratista es requerido por un departamento de planeación de un municipio para


que remita una, dos, tres, cuatro o cinco formas (dependiendo de la naturaleza del
proyecto) para solicitar permiso de construcción. Sea Y = número de formas
requeridas del siguiente solicitante. La probabilidad de que y formas se requieren es
proporcional a y, esto es p (y) = ky para y = 1, 2, 3, 4, 5.
a. ¿Cuál es el valor de k?
b. ¿Cuál es la probabilidad de que por lo menos se necesiten 3 formas?
c. ¿Cuál es la probabilidad de que se necesiten entre dos y cuatro formas?
d. ¿Podría ser p (y) = y2/ 50 para y = 1, 2, 3, 4, 5 la fpm de Y?

Solución
17

 p( y)  k (1)  k (2)  k (3)  k (4)  k (5)  15k  1


y 1
a.
1
 k
15

b.
y 1 2 3 4 5
1 2 3 4 5
p(y) 15 15 15 15 15

P(Y  3)  153  154  155  12


15  0.8

c. P(2  Y  4)  152  153  154  159  0.6


y2
p( y ) 
50
d. 5 5

y 1
p( y )  y
y 1
2
/ 50  1
50  504  509  16
50  50 
25 55
50 1

Por tanto no puede ser una fpm

5. Muchos fabricantes tienen programas de control de calidad que incluyen la inspección


de materiales recibidos para verificar que no tengan defectos. Supongamos que un
fabricante de computadoras recibe tarjetas de computadoras en lotes de cinco y se
seleccionan dos tarjetas de cada lote para inspeccionarlas. Podemos representar los
posibles resultados del proceso de selección por pares. Por ejemplo, el par (1,2)
representa la selección de la tarjeta 1 y 2 para inspeccionarlas.
a. Haga una lista de diez posibles resultados diferentes.
b. Supongamos que las tarjetas 1 y 2 son las únicas defectuosas de un lote de cinco y
se van a escoger dos lotes al azar. Defina X como el número de tarjetas defectuosas
observado entre las inspeccionadas. Encuentre la distribución de probabilidad de X.
c. Señale con F(x) la dpa de X. Primero defina F(0) = P(X ≤ 0), F(1) y F(2) y después
obtenga F(x) para cualquier x.

Solución

a. (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5)
b.
p(0)  P(3,4), (3,5), (4,5)  103  0.3
p(1)  P(1,3), (1,4), (1,5), (2,3), (2,4), (2,5)  106  0.6
p(2)  P(1,2)  101  0.1

 La distribución de probabilidad de masa es:

x 0 1 2
p(x) 0.3 0.6 0.1
18

c. F (0) = P (X  0) = 0.3
F (1) = P (X  1) = 0.9
F (2) = P (X  2) = 1.0, entonces la función de distribución acumulada es:
0 x0
0.3 0  x  1

F ( x)  
0.9 1  x  2
1.0 x2

6. Algunas regiones de California son particularmente propensas a temblores.


Supongamos que en una parte de la región 30% de todos los propietarios de casa están
asegurados contra daños por temblores. Cuatro propietarios son seleccionados al azar;
sea X el número de propietarios, entre los cuatro, con seguro contra temblores.
a. Encuentre la distribución de probabilidad de X. (Sugerencia: denotemos por S a un
propietario de casa asegurado y con F a uno sin seguro. Entonces un posible
resultado es SFSS, con probabilidad (0.3)(0.7)(0.3)(0.3) y valor 3 asociado a X. Hay
otros 15 resultados.).
b. Dibuje el histograma de probabilidad correspondiente.
c. ¿Cuál es el valor más probable para X?
d. ¿Cuál es la probabilidad de que al menos dos de los cuatro seleccionados tenga un
seguro contra temblores?

Solución
a.
Resultados X P(X) Resultados x P(X)
SSSS 4 (.3)4 = 0.0081 SSFF 2 (.7)2(.3)2 = 0.0441
FSSS 3 (.7)(.3)3 = 0.0189 SFFS 2 (.7)2(.3)2 = 0.0441
SFSS 3 (.7)(.3)3 = 0.0189 FFFS 1 (.7)3(.3) = 0.1029
SSFS 3 (.7)(.3)3 = 0.0189 FFSF 1 (.7)3(.3) = 0.1029
SSSF 3 (.7)(.3)3 = 0.0189 FSFF 1 (.7)3(.3) = 0.1029
FFSS 2 (.7)2(.3)2 = 0.0441 SFFF 1 (.7)3(.3) = 0.1029
FSSF 2 (.7)2(.3)2 = 0.0441 FSFS 2 (.7)2(.3)2 = 0.0441
SFSF 2 (.7)2(.3)2 = 0.0441 FFFF 0 (.7)4 = 0.2401

Por tanto la distribución de probabilidad es:

x 0 1 2 3 4
p(x) 0.2401 0.4116 0.2646 0.0756 0.0081

b.
c. El valor mas probable de X es x = 1
d. P (X  2) = 0.2646 + 0.0756 + 0.0081 = 0.3483
19

7. El voltaje de una batería nueva puede se aceptable (A) o no aceptable (I). Cierta
linterna de mano necesita dos baterías, las cuales necesitarán seleccionarse y probarse
independientemente hasta encontrar dos aceptables. Supongamos que el 90 % de
todas las baterías tienen voltaje aceptable. Señale con Y el número de baterías que
tienen que ser probadas.
a. ¿Cuál es p (2), es decir, P (Y = 2)?
b. ¿Cuál es p(3)? (Sugerencia: Hay dos resultados diferentes que confluyen en Y = 3)
c. Para tener Y = 5, ¿qué debe ser cierto en la quinta batería seleccionada? Haga una
lista de cuatro resultados para los que Y = 5 y luego determine p (5).
d. Utilice el modelo de sus respuestas en los incisos a y c para obtener una fórmula
general de p (y).

Solución

a. Sea P (A) = 0.9, entonces P (AA) = p (2) = (0.9)(0.9) = 0.81


b. p (3) = P (AIA) + P (IAA) = (0.9)(0.1)(0.9) + (0.1)(0.9)(0.9) = 0.162
c. Para tener Y = 5, la quinta batería debe ser aceptable
{(AIIIA), (IAIIA), (IIAIA), (IIIAA)}
p (5) = 4 (0.9)2 (0.1)3 = 0.00324
d. p (2) = (0.9)2
p (3) = 2 (0.9)2 (0.1)
p (4) = 3 (0.9)2 (0.1)2
p (5) = 4 (0.9)2 (0.1)3
Generalizando estos resultados, tenemos:
p (y) = (y – 1) (0.9)2(0.1) y – 2

8. Dos dados de seis caras no cargados se tiran independientemente. Sea M = el máximo


de los dos tiros (así que M (1,5) = 5, M (3,3) = 3, etc.).
a. ¿Cuál es la fpm de M? [Sugerencia: primero determine p(1), después p(2), etc.]
b. Determine la fpa de M y colóquela en la gráfica.

9. Considere un grupo de cuatro donadores potenciales de sangre, A, B, C, D, de los


cuales solo uno tiene sangre tipo O+. Si se clasifican las muestras en orden aleatorio
hasta que sea identificado un individuo O+. Sea Y = número de clasificaciones
necesarias para identificar un individuo tipo O+. Calcule la fpm de Y.

Solución

Si se denota por A el individuo que tiene sagre tipo O+ y por B, C y D los otros tres,
entonces:
p (1) = P (Y = 1) = P (A sea clasificado primero) = ¼
p (2) = P (Y = 2) = P (B, C o D primero y A después)
= P (B, C o D primero)  P(A después/B, C o D primero)
= 34  13  14  0.25
p (3) = P (Y = 3) = P (B, C o D primero y segundo y A después)
= 34  23  12  14  0.25
p (4) = P (Y = 4) = P (B, C y D primero y A después)
= 34  23  12  14  0.25
20

entonces la función de distribución de probabilidad de masa queda como:

y 1 2 3 4
p(y) 0.25 0.25 0.25 0.25

10. Una biblioteca se suscribe a dos semanarios. Cada uno puede llegar, el miércoles,
jueves, viernes o sábado. Suponga que cada uno llegan independiente uno de otro y
para cada P (Mié.) = 0.4, P ( Jue.) = 0.3, P( Vie.) = 0.2 y P (Sáb.) = 0.1. Sea Y = al
número de días después del miércoles que tardan ambos semanarios en llegar (por lo
cual los posibles valores de Y son 0, 1, 2, 3). Calcule la fpm de Y. (Sugerencia: hay 16
resultados posibles; Y (M,M) = 0, Y (V,J) = 2, etc.)

Solución

Y = número de días después del miércoles que tardan ambas en llegar


Los posibles resultados son:

Y(M, M) = 0 Y(J, M) = 1 Y(V, M) = 2 Y(S, M) = 3


Y(M, J) = 1 Y(J, J) = 1 Y(V, J) = 2 Y(S, J) = 3
Y(M, V) = 2 Y(J, V) = 2 Y(V, V) = 2 Y(S, V) = 3
Y(M, S) = 3 Y(J, S) = 3 Y(V, S) = 3 Y(S, S) = 3

P (Y = 0) = (0.4)(0.4) = 0.16
P (Y = 1) = (0.4)(0.3) + (0.3)(0.3) + (0.3)(0.4) = 0.33
P (Y = 2) = (0.4)(0.2) + (0.3)(0.2) + (0.2)(0.4) + (0.2)(0.3) + (0.2)(0.2) = 0.32
P (Y = 3) = 2(0.4)(0.1) + 2(0.3)(0.1) + 2(0.2)(0.1) + (0.1)(0.1) = 0.19

Entonces, la distribución de probabilidad es:

y 0 1 3 3
p (y) 0.16 0.33 0.32 0.19

11. Un negocio de computadoras que atiende pedidos por correo tiene seis líneas
telefónicas. Simbolicemos con X el número de líneas en uso en un momento
específico. Supongamos que la fpm de X está dada en la tabla siguiente.

x 0 1 2 3 4 5 6
p(x) .10 .15 .20 .25 .20 .06 .04

Calcule y grafique la fda F(x), después utilícela para calcular la probabilidad de cada
uno de los siguientes eventos.
a. {A lo sumo tres líneas estén en uso}l
b. {Menos de tres líneas estén en uso}
c. {Por lo menos tres líneas estén en uso}
d. {Entre 2 y 5 líneas estén en uso}

Solución
21

0 x0
0.10 0  x 1

0.25 1 x  2

0.45 2 x3
F ( x)  
0.70 3 x 4
0.90 4 x5

0.96 5 x6
1 x6

a. P (X  3) = F (3) = 0.70
b. P (X < 3) = F (2) = 0.45
c. P (X  3) = 1 – P(X < 3) = 1 – 0.45 = 0.55
d. P (2  X  5) = F (5) – F(1) = 0.96 – 0.25 = 0.71

12. Una organización de consumidores que evalúa automóviles nuevos, reporta


regularmente el número de defectos importantes en cada examen. Sea X el número de
defectos importantes en un automóvil seleccionado al azar de cierto tipo. La fpa de X
es como sigue:

0 x0
.06 0  x 1

.19 1 x  2

.39 2 x3
F ( x)  
.67 3 x 4
.92 4 x5

.97 5 x6
1 6 x

Calcule las siguientes probabilidades directamente de fpa.
a. p(2), esto es P (X = 2)
b. P(X >3)
c. P(2 ≤ x ≤ 5)
d. P(2< x < 5)

Solución

a. P (X = 2) = F (2) – F (1) = 0.39 – 0.19 = 0.20


b. P (X > 3) = 1 – P (X  3) = 1 – F (3) = 1- 0.67 = 0.33
c. P (2  X  5) = F (5) – F (1) = 0.97 – 0.19 = 0.78
d. P (2 < X < 5) = F (4) – F (2) = 0.92 – 0.39 = 0.53

13. Una compañía de seguros ofrece a sus tenedores de pólizas varias opciones
diferentes para el pago de primas. Para un tenedor seleccionado al azar, sea X =
número de meses entre pagos sucesivos. La fpa de X es como sigue:
22

0 x 1
.30 1 x  3

.40 3 x 4
F ( x)  
.45 4 x6
.60 6  x  12

1 12  x

a. ¿Cuál es la fpm de X?
b. Sólo con el uso de fpa, calcule P (3 ≤ X ≤ 6) y P (4 ≤ X).

Solución

a.
x 1 3 4 6 12
p (x) 0.30 0.10 0.05 0.15 0.40

b. P (3 ≤ X ≤ 6) = F (6) – F(1) = 0.60 – 0.30 = 0.30 y


P (4 ≤ X) = 1 – P (X < 4) = 1 – F (3) = 1 – 0.40 = 0.60

14. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la
siguiente tabla:

xi 2 3 4 5
p(x) 0.2 0.4 0.3 0.1

a. Obtenga la función de distribución acumulada de la variable X


b. Calcule P(X < 3.5) y P(3 ≤ X < 4.5)

15. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la
siguiente tabla:

x -5 -2 0 1 3 8
p(x) 0.1 0.2 0.1 0.2 a 0.1

a. Calcule la constante a.
b. Encuentre la función de distribución acumulada F(x).
c. Calcule P(X = 1), P(X = 2), P(X < 3), P(X ≥ 0) y P( -2 ≤ X ≤ 3)
23

SERIE 4

DISTRIBUCION DE PROBABILIDAD BINOMIAL

1. Calcule las siguientes probabilidades binomiales directamente de la fórmula para b(x;


n, p).

a. b(3; 8, 6)
b. b(5; 8, 6)
c. P(3 ≤ X ≤ 5) cuando n = 8 y p = 0.6
d. P(1 ≤ X) cuando n = 12 y p = 0.1

Solución

 n  x n x
  p (1  p) x  0,1, 2, 3,, n
b( x; n, p)   x 

 0 de otra manera

8
a. b(3; 8, 0.6)   (0.6) 3 (1  0.6) 83  0.1238
 3

8
b. b(5; 8, 0.6)   (0.6) 3 (1  0.6) 3  0.2787
 5

8 8 8


c. P(3  X  5)   (0.6) 3 (0.4) 3   (0.6) 4 (0.4) 4   (0.6) 5 (0.4) 3  0.6348
 3  4  5

12  
d. P(1  X )  1  P( X  1)  1   (0.1) 0 (0.9)12   1  0.28243  0.71757
 0  

2. Utilice una tabla para obtener las siguientes probabilidades:

a. B(4; 10, 0.3)


b. b(4; 10, 0.3)
c. b(6; 10, 0.7)
d. P(2 ≤ X ≤ 4) cuando X  Bin(10, 0.3)
e. P(2 ≤ X) cuando X  Bin(10, 0.3)
f. P(X ≤ 1) cuando X  Bin(10, 0.7)
g. P(2 < X < 6) cuando X  Bin( 10, 0.3)

Solución

a. B (4; 10, 0.3) = 0.850

b. b (4; 10, 0.3) = B (4; 10, 0.3) - B (3; 10, 0.3) = 0.850 – 0.650 = 0.200
24

c. b (6; 10, 0.7) = B (6; 10, 0.7) – B (5; 10, 0.7) = 0.350 – 0.150 = 0.200

d. P (2  X  4) = B (4; 10, 0.3 ) – B (1; 10, 0.3) = 0.850 – 0.149 = 0.701

e. P (2  X) = 1 – P (X < 1) = 1 – B (1; 10, 0.3) = 1 – 0.149 = 0.851

f. P (X  1) = B (1; 10, 0.3) = 0

g. P (2 < X < 6) = B (5; 10, 0.3) – B (2; 10, 0.3) = 0.953 – 0.383 = 0.570

3. Cuando se prueban tarjetas de circuito empleadas en la manufactura de reproductores


de discos compactos, a la larga el porcentaje de partes defectuosas es del 5%. Sea X =
número de tarjetas defectuosas en una muestra seleccionada al azar de tamaño n = 25,
entonces X  Bin(25, 0.05).

a. Determine P(X ≤ 2)
b. Determine P(X ≥ 5)
c. Determine P(1 ≤ X ≤ 4)
d. ¿Cuál es la probabilidad de que ninguna de las 25 tarjetas esté defectuosa?
e. Calcule el valor esperado y la desviación estándar de X.

Solución

a. P (X  2) = B (2; 25, 0.05) = 0.873

b. P (X  5) = 1 – P (X < 5) = 1 – B (4; 25, 0.05) = 1 – 0.993 = 0.007

c. P (1  X  4) = B (4; 25, 0.05) – B (0; 25, 0.05) = 0.993 – 0.277 = 0.716

 25 
d. P (X = 0) = b (0; 25, 0.05) =  (0.05) 0 (0.95) 24  0.291
0

e. E (X) = np = 25(0.05) = 1.25


V (X) = npq = 25(0.05)(0.95) = 1.1875
 X  1.0897

4. Una compañía que produce cristal fino sabe por experiencia que 10% de sus copas
tienen imperfecciones y deben clasificarse como de “segunda”.

a. Entre seis copas seleccionadas al azar, ¿cuál es la probabilidad de que por lo menos
dos sean de “segunda”?
b. Entre seis copas seleccionadas al azar, ¿qué tan probable es que sólo una sea de
“segunda”?
c. Si las copas se examinan una por una, ¿cuál es la probabilidad de que por lo menos
sean seleccionadas cinco para encontrar cuatro que no sean de segunda?

Solución
25

a. P (X  2) = 1- P (X < 2) = 1 -
 6   6 
 (0.1) (0.9)   (0.1) (0.9)   1  0.8857  0.114
0 6 1 5

 0  1 

 6
b. P( X  1)   (0.1)(0.9) 5  0.3542
1

c. P (no sea de segunda) = 0.9


 4
P( X  0)   (0.1) 0 (0.9) 4  0.6561
 0
Sea el evento A = {Seleccionar 4 copas, una de las cuales tiene un defecto} y la
quinta es buena, entonces
 4  
P( A)   (0.1)(0.9) 3   (0.9)  0.2624
 1  
P (deseada) = 0.6561 + 0.2624 = 0.9185

5. Suponga que solo 20% de los automóviles se detienen por completo en el crucero,
donde hay un semáforo con luz roja intermitente, cuando no ven otros automóviles.
¿Cuál es la probabilidad de que entre 20 automóviles seleccionados al azar:

a. a lo sumo 6 se detengan por completo?


b. exactamente 6 se detengan por completo?
c. al menos 6 se detengan por completo?
d. ¿Cuántos, de los siguientes 20 automóviles, espera que se detengan por completo?

Solución

a. X  Bin (20, 0.2)


P (X  6) = B (6; 20, 0.2) = 0.913

b. P (X = 6) = B (6; 20, 0.2) – B (5; 20, 0.2) = 0.913 – 0.804 = 0.109

c. P (X  6) = 1 – P (X < 6) = 1 – B (5; 20, 0.2) = 1 – 0.804 = 0.196

d. E (X) = np = 20 (0.2) = 4

6. Se selecciona al azar un individuo que tenga un seguro automotriz de cierta empresa.


Sea Y la cantidad de multas que ha recibido durante los últimos 3 años, la fpm de Y
es:

y 0 1 2 3
p( y) .60 .25 .10 .05

¿Cuál es la probabilidad de que entre 15 individuos seleccionados al azar:


a. cuando menos 10 no tengan multas?
b. mas de la mitad tenga al menos una multa?
26

c. la cantidad de quienes tengan al menos una multa sea entre 5 y 10 inclusive?


Solución

a. P (X  10), para n = 15 y p = 0.6 es una distribución binomial


P (X  10) = 1 – P (X <10) = 1 – B (9; 15, 0.6) = 1 – 0.597 = 0.403

b. P (X  8), para n = 15 y p = 0.40


P (X  8) = 1 – P (X < 8) = 1 – B (7; 15, 0.4) = 1 – 0.787 = 0.213

c. P (5  X  10) = B (10; 15, 0.4) – B (4; 15, 0.4) = 0.991 – 0.217 = 0.774

7. Un tipo particular de raqueta de tenis se fabrica en tamaños mediano y extragrande.


60% de todos los clientes de cierta tienda buscan el tamaño extragrande.
a. Entre 10 clientes seleccionados al azar, ¿cuál es la probabilidad de que por lo menos
6 busquen el tamaño extragrande?
b. Entre 10 clientes seleccionados al azar, ¿cuál es la probabilidad de que el número
que buscan el tamaño extragrande esté dentro de 1 DE del valor medio?
c. La tienda tiene actualmente siete raquetas de cada modelo. ¿Cuál es la probabilidad
de que los siguientes 10 clientes puedan comprar el modelo que buscan?

Solución

a. X  Bin (10, 0.6)


P (X  6) = 1 – P (X < 6) = 1- B (5; 10, 0.6) = 1 – 0.367 = 0.633

b. V (X) = npq = 10  0.6  0.4 = 2.4 X = 1.55


E (X) = np = 10  0.6 = 6, entonces E(X)  X = (4.45, 7.55) y la probabilidad
pedida es:
P (5  X  7) = B (7; 10, 0.6) – B (4; 10, 0.6) = 0.833 – 0.166 = 0.667

c. P (3  X  7) = B (7; 10, 0.6) – B (2; 10 0.6) = 0.833 – 0.012 = 0.821

8. Veinte por ciento de todos los teléfonos de cierto tipo se remiten para repararse
mientras todavía está vigente su garantía. De estos 60 % pueden ser reparados y el
otro 40% debe sustituirse por aparatos nuevos. Si una compañía compra 10 de estos
teléfonos, ¿Cuál es la probabilidad de que exactamente se cambien 2 dentro del
período de garantía?

Solución

ESPACIOS MUESTRALES Y EVENTOS

1. En un torneo de baloncesto vacacional participan cuatro universidades: 1, 2, 3, y 4.


En la primera ronda, 1 jugará contra 2 y 3 contra 4. Los dos ganadores jugarán por el
campeonato y los dos perdedores también jugarán. Un posible resultado se puede
representar por 1324 (1 le gana a 2 y 3 le gana a cuatro en la primera ronda y después
1 derrota a 3 y 2 le gana a cuatro).
a. Haga una lista de todos los resultados en S.
b. Sea A el evento en que 1 gana el torneo. Haga una lista de los resultados en A.
27

c. Sea B el evento en que 2 llega a la final. Haga una lista de los eventos en B
d. ¿Cuáles son los resultados en A ⋃ B y en A ∩ B? ¿Cuáles son los resultados en A’?

Solución

a. S = {1324, 3124, 1342, 3142, 1423, 1432, 4123, 4132, 2314, 2341, 3214, 3241,
4213, 2413, 4231, 2431}
b. A = {1324, 1342, 1423, 1432}

c. B = {2314, 2341, 3214, 3241, 4213, 4231, 2431, 2413}

d. A  B = {1324, 1342, 1423, 1432, 2314, 2341, 3214, 3241, 4213, 4231, 2431,
2413}
A  B =  porque son disjuntos
A’ = {3124, 3142, 4123, 4132, 2314, 2341, 3214, 3241, 4213, 2413, 4231, 2431}

2. Suponga que los vehículos que toman una determinada salida de la autopista pueden
dar vuelta a la derecha (R), a la izquierda (L) o seguir derecho (S). Imagine que observa
la dirección de tres vehículos sucesivos.
a. Haga una lista de todos los resultados en el evento A, donde tres vehículos toman
la misma dirección.
b. Haga una lista de todos los resultados en el evento B donde tres vehículos toman
direcciones distintas
c. Haga una lista de todos los resultados en el evento C donde sólo dos de los tres
vehículos dan vuelta a la derecha.
d. Haga una lista de todos los resultados en el evento D donde sólo dos vehículos van
en la misma dirección.
e. Haga una lista de los resultados en D’, C  D y C  D .

Solución
El espacio muestral es el siguiente:

 RRR RRS LRL SSR SSL RLS SRL 


 RRL LRS SLR
 RSR LLR LLL LSS
S  
 RLR SRR RSS LLS SLS LSR SLL 
 LRR RLL SRS LSL SSS RSL 

a. A = {RRR, LLL, SSS}


b. B = {RLS, RSL, LRS, LSR, SRL, SLR}
c. C = {RRL, RRS, LRR, SRR, RLR, RSR}
d. D = { RRL, RRS, LRR, SRR, RLR, RSR, RLL, LLR, LRL, SLL, LLS, LSL, SSR,
SSL, RSS, SRS, SLS, LSS}
e. D’ = {RLS, RSL, LRS, LSR, SRL, SLR, RRR, LLL, SSS}
Puesto que C  D, entonces C  D = D y C  D = C
C  D = {RRL, RRS, LRR, SRR, RLR, RSR, RLL, LLR, LRL, SLL, LLS, LSL, SSR,
SSL, RSS, SRS, SLS, LSS}
C  D = {RRL, RRS, LRR, SRR, RLR, RSR}
28

3. Tres componentes se conectan para formar un sistema como indica el siguiente


diagrama. Como los componentes en el subsistema 2 – 3 están conectados en paralelo,
ese subsistema funcionará, si por lo menos, uno de los dos componentes funciona. Pero
para que funciones todo el sistema, deberá servir el componente 1 y el subsistema 2-
3.

1
1 3

El experimento consiste en determinar la condición de cada componente [S (éxito)


para un componente que funciona y F (falla) para uno que no funciona].

a. ¿Cuáles resultados están contenidos en el evento A, donde funcionan exactamente


dos de los tres componentes?
b. ¿Qué resultados están contenidos en el evento B, donde al menos dos de los
componentes funcionan?
c. ¿Qué resultados están contenidos en el evento C, donde funciona el sistema?
d. Haga una lista de los resultados en C’, A  C, A  C, B  C y B  C.

Solución

a. A = {SSF, SFS, FSS}


b. B = {SSF, SFS, FSS, SSS}
c. C = {SSS, SSF, SFS}
d. C’ = {FSS, FSF, FFS, SFF, FFF}
e. A  C = {SSF, SFS, FSS, SSS}
A  C = {SSF, SFS}
B  C = {SSF, SFS, FSS, SSS} = B
B  C = {SSS, SSF, SFS} = C

4. Cada muestra de cuatro hipotecas para vivienda está clasificada como de tasa fija (F)
o tasa variable (V).

a. ¿Cuáles son los 16 resultados en S?


b. ¿Cuáles resultados están en el evento donde exactamente tres de las hipotecas
seleccionadas son de tasa fija?
c. ¿Cuáles resultados están en el evento donde las cuatro hipotecas son del mismo
tipo?
d. ¿Cuáles resultados están en el evento donde a lo sumo, una de las cuatro hipotecas
es de tasa variable?
e. ¿Cuál es la unión de los eventos del inciso (c) y (d) y cuál es la intersección de estos
eventos?
f. ¿Cuáles son la unión e intersección de los eventos de los incisos (b) y (c)?

Solución
29

 FFFF VFFF VFVF VVFV 


 FFFV FFVV VVFF VFVV 
 
a. S   
 FFVF FVFV VFFV FVVV 
 FVFF FVVF VVVF VVVV 
b. A = {FFFV, FFVF, FVFF, VFFF}
c. B = {FFFF, VVVV}
d. D = {FFFF, FFFV, FFVF, FVFF, VFFF}
e. B  D = {FFFF, VVVV, FFFV, FFVF, FVFF, VFFF}
B  D = {FFFF}
f. A  B = { FFFV, FFVF, FVFF, VFFF, FFFF, VVVV}
AB=

5. Una familia formada por tres personas A, B y C asisten a una clínica médica que
siempre tiene un médico en cada uno de los puestos 1, 2 y 3. Durante cierta semana
cada miembro de la familia visita una vez la clínica y le asignan al azar un médico: el
experimento consiste en registrar el número de puesto asignado a cada miembro de la
familia. Un resultado de (1, 2,1) es para A el puesto 1, para B el puesto 2 y C el puesto
1.

a. Haga una lista de los 27 resultados del espacio muestral.


b. Haga una lista de todos los resultados del evento en el cual las tres personas de la
familia vayan al mismo puesto.
c. Haga una lista de todos los resultados del evento en el cual todos los miembros de
la familia vayan a diferentes puestos.
d. Haga una lista de todos los resultados del evento en el cual ningún miembro de la
familia vaya al puesto 2.

Solución

a. (1, 1, 1) (1, 1, 2) (1, 2, 1) (2, 1, 1) (1, 1, 3) (1, 3, 1) (3, 1, 1)


(2, 2, 2) (2, 2, 1) (2, 1, 2) (1, 2, 2) (2, 2, 3) (2, 3, 2) (3, 2, 2)
(3, 3, 3) (3, 3, 1) (3, 1, 3) (1, 3, 3) (3, 3, 2) (3, 2, 3) (2, 3, 3)
(1, 2, 3) (2, 1, 3) (2, 3, 1) (1, 3, 2) (3, 1, 2) (3, 2, 1)

b. A = {(1, 1, 1), (2, 2, 2), (3, 3, 3)}


c. B = {(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)}
d. C = {(1, 1, 3), (1, 3, 1), (3, 1, 1), (1, 1, 1), (3, 3, 3), (3, 3, 1), (3, 1, 3), (1, 3, 3)}

6. Una biblioteca en una universidad tiene cinco ejemplares de un cierto texto en reserva.
Dos ejemplares (1,2) son primeras impresiones y los otros tres (3, 4,5) son segundas
impresiones. Un estudiante examina estos libros en orden aleatorio, deteniéndose solo
cuando selecciona una segunda impresión. Dos posibles resultados son 5, 2, 1,3.
a. Haga una lista de los resultados en S.
b. Si A simboliza el evento cuando exactamente un libro es examinado, ¿cuáles
resultados están es A?
c. Si B es el evento cuando el libro 5 es seleccionado, ¿cuáles resultados están en B?
d. Si C es el evento cuando el libro 1 no se examina, ¿cuáles resultados están en C?

Solución
30

(1,2,3) (2,1,3) (1,3) (2,3) (3) 


 
a. S  (1,2,4) (2,1,4) (1,4) (2,4) (4)
(1,2,5) (2,1,5) (1,5) (2,5) (5) 
 
b. A = {(3), (4), (5)}
c. B = {(1, 2, 5), (2, 1, 5), (1, 5), (2, 5), (5)}
d. C = {(2, 3), (2, 4), (2, 5), (3), (4), (5)}

7. Un departamento académico acaba de terminar una votación secreta para elegir jefe de
departamento. La urna de votos contiene cuatro papeletas con votos para el candidato
A y tres papeletas con votos para el candidato B. supongamos que las papeletas se
sacan de la caja una por una.
a. Haga una lista de todos los resultados posibles.
b. Suponga que se realiza un conteo a medida que se sacan las papeletas. ¿En cuáles
resultados A se mantiene delante de B en todo el conteo?

Solución

a. AAAABBB AAABBBA ABBABAA BAABBAA


AAABABB AABBBAA ABABBAA BABBAAA
AABAABB ABBBAAA ABBABAA BAAABBA
ABAAABB BBBAAAA BBABAAA BAAAABB
BAAAABB AABABAB BBAABAA ABBAABA
AAABBAB ABAABAB BBAAABA AABBABA
AABBAAB BAAABAB BBAAAAB ABBAABA
ABBAAAB AABABBA BBABAAA BAABBAA
BBAAAAB ABABABA BBAAAAB

b. A = {AAAABBB, AAABABB, AABAABB, AAABBAB, AABABAB}

8. Una compañía de ingenieros constructores está actualmente trabajando en plantas


eléctricas en tres lugares diferentes. Señalemos como A, el evento en que la planta del
lugar i se termina para la fecha del contrato. Utilice las operaciones de unión,
intersección y complemento para describir cada uno de los siguientes eventos, en
términos de A1, A2 y A3, dibuje un diagrama de Venn e ilumine la región
correspondiente a cada uno.
a. Por lo menos una planta se termina para la fecha del contrato.
b. Todas las plantas se terminan para la fecha del contrato.
c. Solo se termina la planta del lugar 1 para la fecha del contrato.
d. Exactamente una planta se termina para la fecha del contrato.
e. La planta del lugar 1, o cualquiera de las otras dos plantas, se terminan para la fecha
del contrato.

Solución

a. Ai = {la planta del lugar i se termina para la fecha de contrato}


B = {Por lo menos una planta se termina para la fecha de contrato}
B = A1  A2  A3
31

A1  A2  A3 A1  A2  A3

b. C = {Todas las plantas se terminan para la fecha de contrato}


C = A1  A2  A3
c. D = {Sólo se termina la planta del lugar 1}
D = (A2  A3)’  A1

(A2  A3)’  A1 ( A1  A2 ' A3 ' )  ( A1 ' A2 ' A3 )  ( A1 ' A3 ' A2 )

d. E = {Exactamente una planta se termina}


E  ( A2  A3 )' A1   ( A1  A2 )' A3   ( A1  A3 )' A2 
 ( A1  A2 ' A3 ' )  ( A1 ' A2 ' A3 )  ( A1 ' A3 ' A2 )

e. F = {La planta del lugar 1 o cualquiera de las otras dos}


F = A1  (A2  A3)

A1  (A2  A3)

9. Utilice un diagrama de Venn para verificar las siguientes relaciones para cualquiera de
los eventos A y B (estas se llaman leyes de Morgan):

a. ( A  B)'  A'B'
32

b. ( A  B)'  A'B'

Solución

a. ( A  B)'  A'B'


=

(A  B)’ A’ B’

b. ( A  B)'  A'B'

= 

(A  B)’ A’ B’
33

ESTADISTICA DESCRIPTIVA
1. Los valores de densidad relativa adjuntos para varios tipos de maderas utilizados en la
construcción se publicaron en el artículo “Bolted Connection Design Values Based
on European Yield Model” (J. of Structural Engr., 1993; 2169 – 2186):

0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40 0.40 0.41 0.41 0.42 0.42
0.42 0.42 0.42 0.43 0.44 0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51
0.54 0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.67 0.75

Construya un diagrama de tallo y hojas usando tallos repetidos y comente acerca de


las características interesantes del diagrama.
Solución:
Tallo y hoja de densidad relativa N = 36
Unidad de hoja = 0.010

3 1 - El diagrama muestra que 0.45 puede ser un buen valor


3 56678 representativo.
4 000112222234 - No hay simetría, presenta cierto sesgo positivo.
4 5667888 - Presenta un hueco en los valores de 7 menores
5 144 - Hay cierta dispersión lo que constituye variabilidad
5 58 en los datos
6 2 - El valor 0.75 puede ser un posible calor atípico
6 6677
7
7 5

2. Las propiedades mecánicas permisibles para diseño estructural de vehículos


aeroespaciales metálicos, requiere un método aprobado para analizar estadísticamente
los datos de prueba empíricos. En el artículo “Establishing Mechanical Property
Allowables for Metals” (J. of Testing and Evaluation, 1998: 293 – 299), se emplearon
los datos adjuntos de resistencia última a la tensión (ksi) como base para superar
dificultades en el desarrollo del método.

122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7

a. Construya un diagrama de tallo y hojas de los datos eliminando (truncando)


primero el dígito de las decenas y luego repitiendo cada valor del tallo cinco veces
(una vez para las hojas 1 y 2, una segunda vez para las hojas 3 y 4, etc.) ¿Por qué
es relativamente fácil identificar un valor de resistencia representativo?
34

b. Construya un histograma usando las clases de igual amplitud con la primera clase
con un límite inferior de 122 y un límite superior de 124. Luego comente acerca
de cualquier característica interesante del histograma.
Solución
a.
Tallo y hoja de Resistencia a la tensión N = 153
Unidad de hoja = 1.0

12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13 44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
14 77

Por la simetría observándose que en los valores de 134 y 135 se encuentra este
valor representativo.

b. Distribución de frecuencias
Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa
122  x <124 1 0.00654 136  x < 138 22 0.14379

124  x < 126 3 0.01961 138  x < 140 18 0.11765

126  x < 128 7 0.04575 140  x < 142 10 0.06536

128  x <130 6 0.03921 142  x < 144 7 0.04575

130  x < 132 11 0.07189 144  x < 146 3 0.01961

132  x < 134 25 0.16340 146  x < 148 2 0.01307

134  x < 136 38 0.24836 Totales 153 0.99999


35

Resistencia a la Tensión
40

35

30

Frecuencia 25

20

15

10

0
124 128 132 136 140 144 148
ksi

El histograma presenta cierta simetría, poca dispersión, sin huecos


3. En un estudio de productividad de autores (“Lotka’s Test”, Collection Mgmt., 1982:
111 – 118), se clasificó a un gran número de autores según la cantidad de artículos
que publicaron durante cierto período. Los resultados se presentan en la distribución
de frecuencias adjunta:

Número de artículos 1 2 3 4 5 6 7 8
Frecuencia 784 204 127 50 33 28 19 19

Número de artículos 9 10 11 12 13 14 15 16 17
Frecuencia 6 7 6 7 4 4 5 3 3
a. Construya un histograma que corresponda a esta distribución de frecuencias. ¿Cuál
es la característica más interesante de la forma de la distribución?
b. ¿Qué proporción de estos autores publicaron por lo menos cinco artículos? ¿Por lo
menos diez artículos? ¿Más de diez artículos?
c. Suponga que los cinco números 15, los tres 16 y los tres 17 se hubieran agrupado
en una sola categoría mostrada como “≥ 15”. ¿Se podría trazar un histograma?
Explique.
d. Suponga que en lugar de que los valores 15,16 y 17 se listen por separado, se
hubieran combinado en una categoría 15 a 17 con frecuencia 11. ¿Se podría trazar
un histograma. Explique.
Solución:
36

a.
Artículos publicados

800

700

Frecuencia 600

500

400
La 300

200

100

0
2 4 6 8 10 12 14 16 18
No. de artículos

característica mas importante es que presenta un gran sesgo positivo y mucha


dispersión en los datos
b. Por lo menos cinco artículos n = 33 + 28 + 19 + 19 + 6 + 7 + 6 + 7 + 4 + 4 + 5 +
3+3
144
n = 144, entonces p   0.11 0 11%
1309
39
Por lo menos 10 artículos n = 7 + 6 + 7 + 4 + 4 + 5 + 3 + 3 = 39 P   0.0298
1309
o
Aproximadamente 3%
32
Mas de 10 artículos P   0.0245 0 aproximadamente 2.5%
1309
c. No, por porque estrictamente hablando la clase descrita por mayor o igual a 15 no
tiene una cota superior así que es imposible dibujar un rectángulo con un área no
definida.
d. En este caso si se puede dibujar, usando la frecuencia acumulada de 11 y calculando
la altura que debe tener el rectángulo.
d. En este caso si se puede dibujar, usando la frecuencia acumulada de 11 y calculando
la altura que debe tener el rectángulo.
4. El artículo “Determination of Most Representative Subdivisión” (J. of Energy Eng.,
1993, pp. 43-55) presentó datos con diversas características de subdivisiones que
podrían usarse para decidir si suministrar energía eléctrica con líneas aéreas o con
líneas subterráneas. A continuación vemos los valores de la variable x = longitud total
de las calles dentro de una subdivisión:

1280 5320 4390 2100 1240 3060 4770 1050 360 3330
3380 340 1000 960 1320 530 3350 540 3870 1250
2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770
3150 1890 510 240 396 1419 2109
a. Trace un diagrama de tallo y hojas con la cifra de los miles como tallo y la cifra de
los cientos como hoja, y comente las diversas propiedades del diagrama.
37

b. Trace un histograma usando los límites de clase 0, 1000, 2000, 3000, 4000, 5000 y
6000. ¿Qué proporción de las subdivisiones tienen una longitud total menor que
2000? ¿Entre 2000 y 4000? ¿Cómo describiría la forma del histograma?

Solución
a. Tallo y hoja de Suministro de energía eléctrica N = 47
Unidad de hoja = 100
0 123334555599 Tallo: millares
1 00122234688 Hojas: Centenas
2 1112344477
3 0113338
4 37
5 23778

El valor representativo esta en 0, no tiene simetría, poca dispersión y no presenta


valores
atípicos.
b.
Distribución de Frecuencia

Intervalo Frecuencia Frecuencia relativa

0  x < 1000 12 0.2553


1000  x < 2000 11 0.2340
2000  x < 3000 10 0.2128
3000  x < 4000 7 0.1489
4000  x < 5000 2 0.0426
5000  x < 6000 5 0.1064
Totales 47 1.0000

El histograma
muestra la misma
forma que el
diagrama de
tallo y hojas, con
un sesgo
Positivo y
con la frecuencia mayor en el primer intervalo, no tiene simetría.
La proporción de subdivisiones con longitud menor que 2000 es
x 23
p p  0.489
n 47
38

x 9
Entre 2000 y 4000 la proporción es p  p  0.191 0 19.1%
n 47
5. Una transformación de valores de datos por medio de alguna función matemática, por
ejemplo x o 1 / x, puede producir un conjunto de números que tiene propiedades
estadísticas “mas bonitas” que los datos originales. En particular puede ser posible
hallar una función para la que el histograma de valores transformados sea mas
simétrico (o todavía mejor, más parecido a una curva en forma de campana) que los
datos originales. Por ejemplo el artículo “Time Lapse Cinematographic Análisis of
Beryllium – Luna Fibroblast Interaction” (Environ. Research, 1983, pp. 34-43)
reportó los resultados de experimentos diseñados para estudiar el comportamiento de
ciertas células individuales que habían sido expuestas al berilio. Una característica
importante de tal célula es su tiempo de ínter división (TID), Se determinaron los TID
para un gran número de células en condiciones expuestas (tratamiento) y no expuestas
(de control). Los autores del artículo científico usaron una transformación logarítmica
consistente en: valor transformado = log10 (valor original). Examine los siguientes
datos representativos de TDI:

TDI log10(TDI) TDI log10(TDI) TDI log10(TDI)

28.1 1.45 60.1 1.78 21.0 1.32


31.2 1.49 23.7 1.37 22.3 1.35
13.7 1.14 18.6 1.27 15.5 1.19
46.0 1.66 21.4 1.33 36.3 1.56
25.8 1.41 26.6 1.42 19.1 1.28
16.8 1.23 26.2 1.42 38.4 1.58
34.8 1.54 32.0 1.51 72.8 1.86
62.3 1.79 43.5 1.64 48.9 1.69
28.0 1.45 17.4 1.24 21.4 1.33
17.9 1.25 38.8 1.59 20.7 1.32
19.5 1.29 30.6 1.49 57.3 1.76
21.1 1.32 55.6 1.75 40.9 1.61
31.9 1.50 25.5 1.41
28.9 1.46 52.1 1.72

Utilice intervalos de clase 10 - < 20, 20 - < 30,… para construir un histograma con
la información original. Utilice intervalos 1.1 - < 1.2, 1.2 - < 1.3,… para hacer lo
mismo con la información transformada. ¿Cuál es el efecto de la transformación?

Intervalo Frecuencia Intervalo Frecuencia


10  x < 20 8 50  x < 60 3
20  x < 30 14 60  x < 70 2
30  x < 40 8 70  x < 80 1
40  x < 50 4 Total 40

Intervalo Frecuencia Intervalo Frecuencia


39

1.1  x < 1.2 2 1.5  x < 1.6 6


1.2  x < 1.3 6 1.6  x < 1.7 4
1.3  x < 1.4 7 1.7  x < 1.8 5
1.4  x < 1.5 9 1.8  x < 1.9 1

El histograma sin transformación


presenta cierto sesgo positivo y el
histograma con la transformación ya
presenta cierta simetría, con la mayor
parte de los datos alrededor del valor
representativo.
6. La carga de fuego (MJ/m2) es
la energía calorífica que puede
liberarse por metro cuadrado de área
de piso por combustión del contenido
y de la estructura misma de un recinto.
El artículo “Fire Loads in Office
Buildings” (J. of Structural Engr.,
1997, 365 – 368) presenta los
siguientes porcentajes acumulados,
leídos en un gráfica, de cargas de
fuego en un muestra de 388 recintos:

frec. relativa frec. relativa


valor valor
acumulada acumulada
0 0 1050 0.957
150 0.193 1200 0.986
300 0.376 1350 0.991
450 0.627 1500 0.995
600 0.775 1650 0.996
750 0.872 1800 0.998
900 0.938 1950 1.000

a. Trace un histograma de frecuencia relativa y comente sus características


interesantes.
b. ¿Qué proporción de cargas de fuego son menores de 600? ¿Por lo menos 1200?
c. ¿Qué proporción de las cargas están entre 600 y 1200?

Solución
40

a.

El histograma presenta sesgo positivo y cierta dispersión, el valor representativo se


encuentra entre los 400 y 450.
n
b. p  N = Número total de datos, pero de los datos proporcionados en la tabla
N
se puede obtener la información, por tanto la proporción de cargas de fuego menores
que 600 es: p = 0.775. Por lo menos 1200: p = 1 – 0.986 = 0.014
c. La proporción entre 600 y 1200 es: p = 0.986 – 0.775 = 0.211

7. Se determinó el índice de claridad para los cielos sobre Bagdad para cada uno de los
365 días durante un determinado año (“Contribution to the Study of the Solar
Radiation Climate of the Baghdad Environment”, Solar Energy, 1990: 7 – 12). En la
tabla siguiente se dan los resultados.

clase Frecuencia
0.15-< 0.25 8
0.25- < 0.35 14
0.35 - < 0.45 28
0.45 - < 0.50 24
0.50 - < 0.55 39
0.55 -< 0.60 51
0.60 - < 0.65 106
0.65 - < 0.70 84
0.70 - < 0.75 11

a. Determine las frecuencias relativas y trace el histograma correspondiente.


b. Los días nublados son los que tienen un índice de claridad más pequeño que 0.35.
¿Qué porcentaje de los días fueron nublados?
c. Los días claros son aquellos para los que el índice es por lo menos 0.65. ¿Qué
porcentaje de los días fueron claros?

Solución:
41

a.

Frecuencia
clase
relativa
0.15-< 0.25 0.022
0.25- < 0.35 0.038
0.35 - < 0.45 0.077
0.45 - < 0.50 0.066
0.50 - < 0.55 0.107
0.55 -< 0.60 0.140
0.60 - < 0.65 0.290
0.65 - < 0.70 0.230
0.70 - < 0.75 0.030

b. La proporción de días nublados son los que tienen un índice de claridad menor que
0.35
8 4
Entonces p   0.06 o p = 6%
365
c. Los días con claridad son aquellos de por lo menos un índice de 0.65, entonces
84  11
p  0.26 o p = 26%
365
8. Construya un diagrama de puntos y dígitos para la serie de tiempo adjunta. Los datos
son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la
radiación solar promedio en la banda de 385 a 530 nm como porcentaje de la radiación
total (“Global Energy in the Different Spectral Bands at Dhanhran, Saudi Arabia”, J.
Solar Energy Engr. 1991: 290 294). Comente acerca de las características de los datos.

20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
42

19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9

Solución:

Presenta cierta simetría, el valor representativo está entre 19 y 19.5 no parece haber
valores atípicos.
43

ESTADISTICA DESCRIPTIVA
MEDIDAS DE LOCALIZACION

1. Examine las siguientes observaciones de resistencia al corte, en MPa, de una unión


pegada de cierta manera (tomadas de una gráfica en el artículo “Difusión of Silicon
Nitride to Austentitic Stainless Steel without Interlayers”, Metallurgical Trans., 1993,
pp.1835 – 1843):

22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5

a. Determine el valor de la media muestral


b. Determine el valor de la mediana muestral. ¿Por qué es tan diferente de la media?
c. Calcule la media recortada eliminando las observaciones mínima y máxima. ¿Cuál
es el porcentaje recortado correspondiente? ¿Cómo se compara el valor de esta x rec
con la media y la mediana?
Solución:
N

 xi 514.9
i 1
a. x , x  46.81 x  46.81
N 11
b. Ordenando los valores: 4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5
109.9 el valor que queda en el centro es x  36.6
La diferencia tan grande entre la media y la mediana es porque la diferencia entre
el valor mínimo y el máximo es grande.
N

 xi 400.6
i 1
c. x  xrec   44.51 xrec  44,51
N 9
El Porcentaje recortado es 1/11 = 0.0909 o bien 9.1%
La media recortada se acerca más al valor de la mediana y se encuentra entre la
media y la mediana.

2. Los valores de presión sanguínea se reportan a veces a los 5 mm Hg más cercanos


(100, 105, 110, etc.). Suponga que los valores reales de presión sanguínea para nueve
individuos seleccionados al azar son:

118.6 127.4 138.4 130.0 113.7 122.0 108.3 131.5 133.2

a. ¿Cuál es la mediana de los valores reportados de presión sanguínea?


b. Suponga que la presión del segundo individuo es 127.6 en lugar de 127.4 (un
pequeño cambio en un solo valor). ¿Cómo afecta esto a la mediana de los valores
reportados? ¿Qué dice esto sobre la sensibilidad de la mediana para redondear o
agrupara los datos?
Solución:
a. Ordenando los valores: 108.3 113.7 118.8 122.0 127.4 130.0 131.5 133.2
138.4
Como se reportan a los 5 mmHg más cercanos los valores quedarían:
110 115 120 120 125 130 130 135 140
Entonces la mediana es x  125 el valor reportado
b. x  127.4 es el valor exacto de la mediana, como este valor se modifica a 127.6
entonces se reportaría como 130 y es un cambio significativo. Donde hay redondeos
44

en las cantidades la mediana puede ser altamente sensible aunque los cambios sean
pequeños.

3. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture,


2002: 301- 305) aparecen las observaciones siguientes, listadas en orden creciente, del
tiempo de vida del taladro (número de agujeros que maquina un taladro antes de
romperse) cuando se hacen agujeros en cierta aleación de latón.

11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513

Calcule la mediana muestral, la media recortada al 25%, la media recortada al 10% y


la media muestral para los datos y compare estas mediciones.
Solución
Resultados para: Vida Media de un taladro

Estadísticas descriptivas

N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


50 119.3 97.5 9503.0 11.0 64.0 92.0 142.8

Máximo
513.0

Estadísticas descriptivas: media recortada al 25%

N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


26 95.38 22.34 498.97 65.00 77.50 92.00 106.75

Máximo
141.00

Estadísticas descriptivas: media recortada al 10%

N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


40 102.22 47.10 2218.03 36.00 68.75 92.00 132.75

Máximo
248.00
Se observa que la media recortada se aproxima más al valor de la mediana

4. La concentración de sólidos en agua de río es una característica ambiental importante.


El artículo científico “Water Quality Agricultural Watershed: Impact of Riparian
Vegetation During Base Flor”(Water Resources Bull., 1981, pp. 233 -239) reportó
sobre la concentración (en partes por millón, o ppm) en varios ríos diferentes.
Supongamos que se obtuvieron las siguientes 50 observaciones para un río en
particular:

55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
45

60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3

a. Calcule la mediana muestral,


b. La media recortada al 25% y al 10%
c. La media muestral, para los datos de concentración dados y compare estas
mediciones.
Solución:
a.
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
50 58.54 2.33 16.46 27.10 45.57 60.80 69.42

Máximo
94.60
60.7  60.9
x  60.8
2

b. Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
26 59.18 1.39 7.11 45.90 55.00 60.80 65.05

Máximo
69.30

Media del
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
40 58.35 1.86 11.76 36.70 47.47 60.80 67.73

Máximo
77.10

xrec 25%  59.18


xrec10%  58.35

c. x  58.54 y se observa que la media recortada se acerca más al valor de la mediana

MEDIDAS DE VARIABILIDAD

1. El artículo “Oxygen Consumption During Fire Suppresión: Error of Heart Rate


Estimation” (Ergonomics, 1991) presentó los datos siguientes sobre el consumo de
oxígeno en ml/ kg/min, para una muestra de 10 bomberos que hicieron una simulación
de combate de incendio:

29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6

Calcule lo siguiente:
a. El intervalo de la muestra
b. La varianza muestral s2 de la definición (es decir calcular primeramente las
desviaciones con respecto a la media y luego elevarlas al cuadrado, etc.)
c. La desviación estándar muestral
d. s2 usando el método breve
Solución:
a. Intervalo de la muestra o rango = xmax  xmin
46

R  49.30  23.50  25.8 R  25.8


b. x  31.03
xi ( xi  x ) ( xi  x ) 2 xi2
29.5 - 1.53 2.3409 870.25
49.3 18.27 333.7929 2340.49
30.6 - 0.43 0.1849 936.36
28.2 - 2.83 8.0089 795.24
28.0 - 3.03 9.1809 784.00
26.3 - 4.73 22.3729 691.69
33.9 2.87 8.2369 1149.21
29.4 - 1.63 2.6569 864.36
23.5 - 7.53 56.7009 552.25
31.6 0.57 0.3249 998.56
 xi  310.3  ( xi  x ) = 0  ( xi  x ) 2 = 443.801  xi2 = 10072.41

 (x  x )
i
2
443.801
s2  i 1
s2   49.3112 s 2  49.3112
n 1 9

c. s  s 2 s  49.3112  7.022 s  7.022


d.
  xi  10072.41
2

x2
i 
n
443.81 
10
s2  s2   49.3112 s 2  49.3112
n 1 9

2. Las siguientes mediciones de viscosidad estabilizada (en cP) de especímenes de


determinada clase de asfalto con 18% de hule se tomaron del artículo “Viscosity
Characteristics of Rubber-Modified Asphalts” (J. of Materials in Civil Engr., 1996,
pp. 153- 156):

2781 2900 3013 2856 2888

a. ¿Cuáles son los valores de la media y la mediana muestrales?


47

b. Calcule la varianza de la muestra con la fórmula de cálculo. Sugerencia: primero


reste un número adecuado a cada observación.
Solución:
a. Ordenando los valores: 2781 2856 2888 2900 3013

x
 xi x  14438  2887.6 x  2887.6 x  2888
n 5

xi ( xi  x ) ( xi  x ) 2
2781 -106.6 11363.56
2900 12.4 153.76
3013 125.4 15725.16
2856 -31.6 998.56
2888 0.4 0.16
 xi  14438  ( xi  x ) = 0  ( xi  x ) 2 = 28241.2
n

 (x  x )
i
2
28241.2
s2  i 1
s2   7060.3 s 2  7060.3
n 1 4

Si restamos 2700 a todos los números, tenemos:


xi ( xi  x ) ( xi  x ) 2
81 -106.6 11363.56
200 12.4 153.76
313 125.4 15725.16
156 -31.6 998.56
188 0.4 0.16
 xi  938  ( xi  x ) = 0  ( xi  x ) 2 = 28241.2
Se observa que la suma de las desviaciones de la media elevadas al cuadrado es la
misma por tanto se obtiene el mismo valor para la varianza.

3. El artículo “A Thin – film Oxygen Uptake Test for the Evaluation of Automotive
Carnkcase Lubricants” (Lubric. Engr., 1984, pp. 153-159) publicó los siguientes datos
del tiempo de oxidación – inducción (en minutos) de varios aceites comerciales:

87 103 130 160 180 195 132 145 211 105 145 153 138 87
99 93 119 129 152

a. Calcule la varianza muestral y la desviación estándar


b. Si las observaciones se volvieran a expresar en horas, ¿cuáles serían los valores
resultantes de la varianza muestral y desviación estándar muestral? Conteste sin
reescribir la expresión.

Solución:
a. Variable N Media Desv.Est. Mínimo Q1 Mediana Q3
Tiempo 19 134.89 35.56 87.00 103.00 132.00 153.00
48

Variable Máximo Varianza


Tiempo 211.00 1264.52

35.65 1264.52
b. 1 h = 60 min, por tanto sh   0.593 y sh2   0.3513
60 3600

4. Examine los datos adjuntos de mediciones de resistencia al corte, en MPa, que se


mencionaron en el problema 1 de esta serie.

22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5

a. ¿Cuáles son los valores de los cuartos, y cuál es el valor de fs?


b. Trace un diagrama de caja basado en el resumen de cinco números y comente sus
características?
c. ¿Cuánto debe valer una observación para considerarse como inusual? ¿Cómo valor
extremo?
d. ¿Cuánto podría disminuir la observación más grande sin que afecte a fs?

Solución:

a. Ordenando los valores


4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5 109.9

Q1 = 26.25 Q3 = 70 fs = Q3 – Q1 = 70 – 26.25 fs = 43.75

b. xmin  4.4 xmax  109.9 x  36.6

Hay un ligero sesgo positivo, hay dispersión en los datos, es decir mucha
variabilidad, no hay valores atípicos.

c. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
26.25 – (1.5)(43.75) = - 39.375 o 70 + (1.5)(43.75) = 135.62
En este caso no hay valores menores que – 39.375 ni mayores que 135.62

Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
26.25 – (3.0)(43.75) = - 105 o 70 + (3.0)(43.75) = 201.25

d. El valor de 109.9 podría disminuirse hasta no menos de 73.3, esto es no menor de


(109.9 – 73.3) = 36.6 unidades.
49

Gráfica de caja de resistencia al corte

0 10 20 30 40 50 60 70 80 90 100 110 120


Resistencia en MPa

5. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado


plástico, con una muestra de 26 especímenes y se obtuvieron los siguientes datos (“The
Lognormal Distribution for Modeling Quality Data when the Means Is Near Zero”, J.
of Quality Technology, 1990, pp. 105 – 110):

30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511

Trace un diagrama de caja que muestre los valores atípicos y comente sus
particularidades.
Solución:
Hay un sesgo positivo en los datos, hay un valor extremo (x = 511), presenta una ligera
dispersión, los valores con los que fue construida la caja son:
xmin  30, xmax  511, x  119, Q1  87, Q3  182, f s  95 , 1.5fs = 142.5, 3.0fs =
285
Q3  3.0 f s  182  285  467 , de ahí que 511 > 467 es un valor extremo

Cantidad de aluminio contaminante

0 50 100 150 200 250 300 350 400 450 500


ppm
50

6. Se determinó la concentración de cocaína en la sangre (mg/l) en una muestra de


individuos que murieron de delirio excitado (DE) inducido por cocaína y en una
muestra de quienes murieron por sobredosis de cocaína sin delirio excitado; el tiempo
de supervivencia en ambos grupos fue a lo sumo de seis horas. Los datos adjuntos se
obtuvieron de un diagrama de caja del artículo “Fatal Excited Delirium Following
Cocaine Use” (J. of Forensic Sciences, 1997: 25 – 31).

DE 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.3 0.3 0.3 0.4 0.5 0.7
0.8
1.0 1.5 2.7 2.8 3.5 4.0 8.9 9.2 11.7 21.0

Sin DE 0 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.2 0.3 0.3 0.3 0.4 0.5
0.5 0.6 0.8 0.9 1.0 1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 4.3 4.8
5.0 5.6 5.9 6.0 6.4 7.9 8.3 8.7 9.1 9.6 9.9 11.0 11.5 12.2
12.7 14.0 16.6 17.8

a. Determine las medianas, los cuartos y las cuartas dispersiones en las dos muestras.
b. ¿Hay valores atípicos en alguna de las dos muestras? ¿Hay valores atípicos
extremos?
c. Trace un diagrama de caja comparativo y utilícelo como base para comparar las
muestras con DE y sin DE.
Solución:
a. Para la muestra DE, x  0.4, Q1  0.1, Q3  2.75 f s  2.75  0.1  2.65
Para la muestra sin DE, x  1.6, Q1  0.3, Q3  7.9 f s  7.9  0.3  7.6
b. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
para la muestra de DE
0.1 – (1.5)(2.65) = - 3.875 o 2.75 + (1.5)(2.65) = 6.725
En este caso no hay valores menores que – 3.875 pero si hay valores mayores que
6.725, estos son 8.9, 9.2

Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
0.1 – (3.0)(2.65) = - 7.65 o 2.75 + (3.0)(2.65) = 10.7
Para este caso no hay valores extremos en el lado izquierdo de los datos porque la
observación mínima es 0.1, pero en el lado derecho los valores extremos son
aquellos mayores de 10.7, esto es 11.7 y 21.0

Para la muestra sin DE:


0.3 – (1.5)(7.6) = - 11.1 o 7.9 + (1.5)(7.6) = 19.3
En este caso no hay valores menores que – 11.1 ni mayores que 19.3 ya que el
valor mínimo es 0.3 y el máximo es 17.8, en consecuencia tampoco habrá valores
atípicos extremos.

c.
51

En el diagrama se observan claramente los valores atípicos de la muestra DE, hay


sesgo positivo en ambos, ninguno presenta simetría, la muestra sin DE presenta
mayor variabilidad que en la muestra DE, La muestra sin DE no presenta valores
atípicos.

8. Se examinaron tres flujos de C2F6 diferentes en un experimento para investigar el


efecto del flujo en la uniformidad (%) del grabado al ácido en una oblea de silicio
utilizada en la fabricación de circuitos integrados y se obtuvieron los datos siguientes:

Flujo
125 2.6 2.7 3.0 3.2 3.8 4.6
160 3.6 4.2 4.2 4.6 4.9 5.0
200 2.9 3.4 3.5 4.1 4.6 5.1

Compare las observaciones de uniformidad que resultan de estos tres diferentes flujos.

Solución:

Flujo mediana Q1 Q3 fs 1.5 fs 3.0 fs


125 3.1 2.7 3.8 1.1 1.65 3.3
160 4.4 4.2 4.9 0.7 1.05 2.1
200 3.8 3.4 4.6 1,2 1.80 3.6
52

No hay valores atípicos en ninguna de las muestras, sin embargo el diagrama


comparativo muestra que los tres flujos son muy diferentes con respecto a sus valores
centrales, las medianas son diferentes. El Flujo de 160, presenta menor variabilidad y
mayor simetría que los otros dos flujos.

8. Se seleccionaron muestras de tres tipos distintos de cable de acero y se determinó el


límite de fatiga, en MPa, para cada muestra con los resultados siguientes:

Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391
391 392

Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383
388 392

Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380
380 392

a. Trace un diagrama de caja comparativo y comente acerca de semejanzas y


diferencias.
b. Trace un diagrama de puntos comparativo (un diagrama de puntos para cada
muestra con una escala común). Comente acerca de semejanzas y diferencias.
c. ¿El diagrama de caja comparativo del inciso (a) proporciona una información
evaluativa de las semejanzas y diferencias? Explique por qué.

Solución:
a. Los resúmenes de 5 números: x , los dos cuartiles y las observaciones menor y
mayor, son idénticos en los tres tipos y no hay valores atípicos, por tanto los tres
diagramas de caja individuales, resultan idénticos.
53

Límite de fatiga de tres tipos diferentes de cable de acero

T1

T2

T3

350 360 370 380 390


MPa

b. Límite de fatiga de tres tipos diferentes de cable de acero

Se observa en el diagrama de puntos que existe diferente variabilidad en cada tipo,


la naturaleza de los huecos y la existencia de grupos diferentes para las tres
muestras.

c. El diagrama de caja del inciso (a) no es capaz de detectar las diferencias entre los
tres conjuntos de datos, la razón principal es que los diagramas de caja dan solo
algunos detalles porque se usa un resumen de sólo 5 datos para comparar el conjunto
de datos.
54

ESTADISTICA DESCRIPTIVA
MEDIDAS DE LOCALIZACION

5. En el artículo “The Pedaling Technique of Elite Endurance Cyclists” (Int. J. of Sport


Biomechanics, 1991: 29 – 53) aparecen los siguientes datos de energía en una sola
pierna con una alta carga de trabajo:
244 191 160 187 180 176 174
205 211 183 211 180 194 200

a. Calcule e interprete la media y la mediana de la muestra.


b. Suponga que la primera observación fue 204 y no 244 ¿Cómo cambiarían la media
y la mediana?
c. Calcule la media recortada eliminando las observaciones mínima y máxima de la
muestra. ¿Cuál es el porcentaje correspondiente de corte?
d. En el artículo también se proporcionan los valores de la energía de una sola pierna
para poca carga de trabajo. La media muestral para n = 13 observaciones fue x =
119.8 (en realidad, 119.7962) y la observación décimo cuarta, algo apartada fue
159. ¿Cuál es el valor de x para la muestra total?
Solución:
N

 xi 2696
a. x  i 1
, x  192.57 x  192.57 x  189
N 14
La media es mayor que la mediana y se observa que están muy cercanas.
b. La mediana no cambiaría porque no cambia la posición y x  189.71 porque el
valor del
dato disminuyó.
c. xrec  191 el porcentaje recortado es 1/14 = 0.07 o 7%
N

 xi N N
d. x  i 1
, x ( N )   xi , 119.8 13  1557.4 para n = 14,  xi = 1557.4 +
N i 1 i 1
159
N

 xi 1716.4
i 1
x , x  122.57 x  122.57
N 14

6. Examine las siguientes observaciones de resistencia al corte, en MPa, de una unión


pegada de cierta manera (tomadas de una gráfica en el artículo “Difusión of Silicon
Nitride to Austentitic Stainless Steel without Interlayers”, Metallurgical Trans., 1993,
pp.1835 – 1843):

22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5

d. Determine el valor de la media muestral


e. Determine el valor de la mediana muestral. ¿Por qué es tan diferente de la media?
f. Calcule la media recortada eliminando las observaciones mínima y máxima. ¿Cuál
es el porcentaje recortado correspondiente? ¿Cómo se compara el valor de esta x rec
con la media y la mediana?
Solución:
55

 xi 514.9
i 1
a. x , x  46.81 x  46.81
N 11
b. Ordenando los valores: 4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5
109.9 el valor que queda en el centro es x  36.6
La diferencia tan grande entre la media y la mediana es porque la diferencia entre
el valor mínimo y el máximo es grande.
N

 xi 400.6
i 1
c. x  xrec   44.51 xrec  44,51
N 9
El Porcentaje recortado es 1/11 = 0.0909 o bien 9.1%
La media recortada se acerca más al valor de la mediana y se encuentra entre la
media y
la mediana.

7. Una muestra de 26 trabajadores petroleros de cierta plataforma marina tomaron parte


en un simulacro de evacuación (para casos de emergencia) y se obtuvieron los datos
adjuntos de tiempo (segundos) para terminar el desalojo(“Oxygen Consumption and
Ventilation During Escape from an Offshore Plataform”, Ergonomics, 1977; 281 –
292).

389 356 359 363 375 424 325 394 402 373 373 370 364 366
364
325 339 393 392 369 374 359 356 403 334 397

a. Trace un diagrama de tallo y hojas con los datos. ¿De que manera esto hace pensar
que
la media y la mediana muestrales están correlacionadas?
b. Calcule los valores de la media y la mediana muestrales. Sugerencia:  xi  9638
c. ¿Cuánto se puede aumentar el tiempo máximo que es de 424, sin que se afecte el
valor de la mediana muestral? ¿Cuánto se puede disminuir ese tiempo sin que afecte
dicho valor?
d. ¿Cuáles son los valores de x y ~ x cuando se expresan las observaciones en
minutos?
Solución:
a. Tallo y hoja del tiempo de evacuación N = 26
Unidad de hoja = 1.0

32 55 El diagrama es razonablemente simétrico por lo que


33 49 la media y la mediana estarán cercanas
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4
56

 xi
9638
i 1
b. x , x
 370.7 x  370.7 x  369.5
N 25
c. El tiempo máximo se puede aumentar indefinidamente porque la posición de la
mediana
no cambia.
El tiempo máximo puede disminuir hasta un valor que no sea menor de 370
porque entonces tomaría la posición de uno de los datos con que se calcula
mediana.
d. Para expresar la media y la mediana en minutos basta dividir entre 60 para hacer
la
conversión, no es necesario convertir todos los datos:
370.7 369.5
x  6.18 x  6.18 min. x  6.16 x  6.16 min.
60 60

8. La presión (psi) mínima de inyección para ocho especímenes de moldeo de maíz de


alta amilasa se determinó y se vio que la presión mayor corresponde a mayor dificultad
de procesamiento. Se obtuvieron las siguientes observaciones (de “Thermoplastic
Starch Blends with a Polyethylene – C – Viny Alcohol: Processability and Physical
Properties”, Polimer Engr. And Science, 1994, pp. 17 - 23):

15.0 13.0 18.0 14.5 12.0 11.0 8.9 8.0


b. Determine los valores de la media, la mediana y la media recortada al 12.5%
muestral y compare esos valores.
c. ¿Cuánto podría aumentar la observación mínima de la muestra, que es 8.0 sin que
afectara el valor de la mediana muestral?
d. Suponga que se quieren los valores de la media y la mediana muestrales cuando las
observaciones se expresan en kilogramos por pulgada cuadrada (ksi) y no en psi.
¿Es necesario reexpresar cada observación en ksi, o se puede usar en forma directa
los valores calculados en el inciso (a)? Sugerencia: 1 kg = 2.2 lb.
Solución:
a. Ordenando los valores: 8.0 8.9 11.0 12.0 13.0 14.5 15.0 18.0
N

 xi 100.4
i 1
x , x  12.55x  12.55
N 8
14.5  12
x  13.25 x  13.25
2
La media recortada al 12.5% requiere quitar un dato en cada extremo, el mínimo y
el
74.4
Máximo, entonces: xrec   12.4 xrec  12.4
6
Los tres valores presentan poca diferencia indicando poca dispersión en los datos.

b. El valor podría aumentar hasta un número menor a 12 sin que afecte el valor de la
mediana.
c. No es necesario convertir cada valor en las otras unidades .Para expresar la media
en ksi
57

 1ksi 
12.55 psi    5.70 psi x  5.70 psi
 2.2 psi 

9. El artículo científico “Snow Cover and Temperature Relationships in North America


and Eurasia” (J. Climate and Applied Meteorology, 1993, pp. 460-469) utilizó técnicas
estadísticas para relacionar la cantidad de capa de nieve en cada continente para
promediar la temperatura continental. Los datos presentados incluyen las siguientes
diez observaciones de la capa de nieve en octubre, para Eurasia, durante los años 1970
– 1979 (en millones de km2):

6.5 12.0 14.9 10.0 10.7 7.9 21.9 12.5 14.5 9.2

¿Qué se reportaría como valor representativo, o típico, de la capa de nieve en octubre


para este período, y qué sugiere esta respuesta?
Solución:
Ordenando los valores en forma creciente 6.5 7.9 9.2 10.0 10.7 12.0 12.5
14.5 14.9 21.9
N

 xi 120.1
i 1
x , x  12.01
x  12.01
N 10
10.7  12
x  11.35 x  11.35
2
91.7
xrec   11.46 xrec (10)  11.46
8
La mediana podría ser elegida ya que es la más alejada del valor de 21.9

10. Los valores de presión sanguínea se reportan a veces a los 5 mm Hg más cercanos
(100, 105, 110, etc.). Suponga que los valores reales de presión sanguínea para nueve
individuos seleccionados al azar son:

118.6 127.4 138.4 130.0 113.7 122.0 108.3 131.5 133.2

c. ¿Cuál es la mediana de los valores reportados de presión sanguínea?


d. Suponga que la presión del segundo individuo es 127.6 en lugar de 127.4 (un
pequeño cambio en un solo valor). ¿Cómo afecta esto a la mediana de los valores
reportados? ¿Qué dice esto sobre la sensibilidad de la mediana para redondear o
agrupara los datos?
Solución:
a. Ordenando los valores: 108.3 113.7 118.8 122.0 127.4 130.0 131.5 133.2
138.4
Como se reportan a los 5 mmHg más cercanos los valores quedarían:
110 115 120 120 125 130 130 135 140
Entonces la mediana es x  125 el valor reportado
b. x  127.4 es el valor exacto de la mediana, como este valor se modifica a 127.6
entonces se reportaría como 130 y es un cambio significativo. Donde hay redondeos
en las cantidades la mediana puede ser altamente sensible aunque los cambios sean
pequeños.
58

11. La propagación de grietas por fatiga en diversas partes de aeronaves han sido objeto
de profundo estudio en años recientes. Los datos que aparecen a continuación constan
de tiempo de propagación (horas de vuelo/ 104) para llegar a un tamaño de grieta dado
en agujeros sujetadores que se usan en aeronaves militares (“Statistical Crack
Propagation in Fastener Holes Ander Spectrum Loading”, J.Aaircraft, 1983, pp. 1028
– 1032):

0.736 0.863 0.865 0.913 0.915 0.937 0.983 1.007


1.011 1.064 1.109 1.132 1.140 1.153 1.253 1.394

a. Calcule los valores de la media y la mediana muestrales.


b. ¿En cuánto se puede reducir la observación más grande, sin afectar el valor de la
mediana?
Solución
a.
N

 xi 16.475
i 1
x , x  1.0297 x  1.0297
N 16
1.007  1.011
x  1.009 x  1.009
2
b. El valor mayor 1.394 puede disminuir hasta 1.394 – 1.011 = 0.383, si disminuye
mas
de 0.383 la mediana cambiará.

12. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture,
2002: 301- 305) aparecen las observaciones siguientes, listadas en orden creciente, del
tiempo de vida del taladro (número de agujeros que maquina un taladro antes de
romperse) cuando se hacen agujeros en cierta aleación de latón.

11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513

Calcule la mediana muestral, la media recortada al 25%, la media recortada al 10% y


la media muestral para los datos y compare estas mediciones.
Solución
Resultados para: Vida Media de un taladro

Estadísticas descriptivas

N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


50 119.3 97.5 9503.0 11.0 64.0 92.0 142.8

Máximo
513.0

Estadísticas descriptivas: media recortada al 25%

N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


26 95.38 22.34 498.97 65.00 77.50 92.00 106.75
59

Máximo
141.00

Estadísticas descriptivas: media recortada al 10%

N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


40 102.22 47.10 2218.03 36.00 68.75 92.00 132.75

Máximo
248.00
Se observa que la media recortada se aproxima más al valor de la mediana

13. Se seleccionó una muestra de n = 10 automóviles y cada uno se sometió a una prueba
de choque a una velocidad de 5 millas/hora. Si se denota por S (éxito) un automóvil
sin daños visibles Y por F Uno con daños, los resultados serían los siguientes:

S S F S S S F F S S

b. ¿Cuál es el valor de la proporción muestral de éxitos s /n?


c. Sustituya cada S por 1 y cada F por 0. Luego, calcule x para ésta muestra codificada
numéricamente. ¿Cómo se compara x con s /n?
d. Suponga que se decide incluir otros 15 automóviles en el experimento. ¿Cuántos de
éstos tendrían que ser S para obtener s /n = 0.80 para la muestra total de 25
automóviles?
Solución:
s 7
a. p  , p   0.7 o bien p = 70%
n 10
b. 1 1 0 1 1 1 0 0 1 1
N

 xi 7
i 1
x , x  0.7 x  0.7 La media y la proporción son iguales
N 10
s
c. p  , s  p(n), s  0.8(25)  20 el total de éxitos es 20, pero había 7 por tanto
n
de los 15 adicionales 13 deben ser éxitos.

14. a. Si se agrega una constante c a cada xi en una muestra, obteniéndose yi = xi + c,


¿cómo se relacionan la media y la mediana muestrales de las yi con la media y la
mediana de las xi? Compruebe sus conjeturas.
b. Si cada xi se multiplica por una constante c, con lo que se obtiene yi = cxi conteste
las preguntas del inciso (a). De nuevo compruebe sus conjeturas.
Solución:

a. y 
 yi   ( xi  c)   xi  nc  x  c y  x c
n n n n
y  mediana de ( x1  c, x2  c, x3  c,...xn  c)
 mediana de ( x1 , x2 , x3 ,...xn )  c  x  c y  xc

b. y 
 yi   cxi  c xi  cx y  cx
n n n
60

y  mediana de (cx1 , cx2 , cx3 ,...cxn )


 c  mediana de ( x1 , x2 , x3 ,...xn )  cx y  cx

11. En un experimento para estudiar la vida útil de un componente (en horas) de


determinado componente se pusieron en funcionamiento diez componentes y se
tuvieron en observación por 100 horas. Durante este período fallaron ocho de los
componentes y se registraron los tiempos de vida. Denote los tiempos de vida de los
dos componentes que aún funcionan después de 100 horas por 100+. Las
observaciones muestrales obtenidas fueron:

48 79 100+ 35 92 86 57 100+ 17 29
¿Cuál de las medidas de tendencia central analizadas hasta ahora se pueden
calcular?(Nota: se dice que los datos de este experimento están “censurados a la
derecha”)
Solución:
Ordenando los datos 17 29 35 48 57 79 86 92 100+ 100+
Como no se conocen los valores reales de las medidas mas grandes, podemos calcular
la
Mediana y la media recortada al 20% o mayor recorte
57  79
x  68.0 x  68.0
2
397
xrec (20)   66.167 xrec (20)  66.167
6
270
xrec (30)   67.5 xrec (30)  67.5
4

12. La concentración de sólidos en agua de río es una característica ambiental importante.


El artículo científico “Water Quality Agricultural Watershed: Impact of Riparian
Vegetation During Base Flor”(Water Resources Bull., 1981, pp. 233 -239) reportó
sobre la concentración (en partes por millón, o ppm) en varios ríos diferentes.
Supongamos que se obtuvieron las siguientes 50 observaciones para un río en
particular:

55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3

d. Calcule la mediana muestral,


e. La media recortada al 25% y al 10%
f. La media muestral, para los datos de concentración dados y compare estas
mediciones.
Solución:
a.
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
50 58.54 2.33 16.46 27.10 45.57 60.80 69.42

Máximo
94.60
61

60.7  60.9
x  60.8
2

b. Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
26 59.18 1.39 7.11 45.90 55.00 60.80 65.05

Máximo
69.30

Media del
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
40 58.35 1.86 11.76 36.70 47.47 60.80 67.73

Máximo
77.10

xrec 25%  59.18


xrec10%  58.35

c. x  58.54 y se observa que la media recortada se acerca más al valor de la mediana

MEDIDAS DE VARIABILIDAD

13. Un estudio de la relación entre la edad y varias funciones visuales, por ejemplo
agudeza y percepción de profundidad, reportó las siguientes observaciones sobre el
área de la lámina esclerótica (mm2) de cabezas de nervios ópticos humanos (
“Morphometry of Nerve Fiber Bundle Pores in the Optic Nerve Head of the Human”,
Experimental Eye Research, 1988, pp. 559-568):

2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88 4.33 3.46 4.52 2.43 3.65
2.78 3.56 3.01
a. Calcule  xi y  xi2
b. Utilice los valores calculados en el inciso (a) para determinar la varianza muestral
s2 y la desviación estándar muestral s.
Solución:
a.  xi  56.8  xi2  197.804
  xi   56.8
2 2

x 2
i 
n
197.804 
17
b. s  2
s2   0.5016 s 2  0.5016
n 1 16

s = 0.7082

14. Calcule la media, la varianza y la desviación estándar de la muestra a partir de la


siguiente distribución de frecuencias.

Intervalos de
Frecuencia Intervalos de clase frecuencia
clase
10 ≤ x < 20 121 60 ≤ x < 70 120
20 ≤ x < 30 165 70 ≤ x 80 118
62

30 ≤ x < 40 184 80 ≤ x < 90 110


40 ≤ x <50 173 90 ≤ x <100 90
50 ≤ x < 60 142

Solución:

Para datos agrupados

2
 p 
p p   fi xi 
 fi xi  fi xi2   i 1 
n
x i 1
s2  i 1
xi = marcas de clase
n n 1
fi = frecuencia del intervalo

Para este conjunto de datos:


n   fi  1223 x  51.1243, s  24.2199 s  586.60356 2

15. El artículo “Oxygen Consumption During Fire Suppresión: Error of Heart Rate
Estimation” (Ergonomics, 1991) presentó los datos siguientes sobre el consumo de
oxígeno en ml/ kg/min, para una muestra de 10 bomberos que hicieron una simulación
de combate de incendio:

29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6

Calcule lo siguiente:
e. El intervalo de la muestra
f. La varianza muestral s2 de la definición (es decir calcular primeramente las
desviaciones con respecto a la media y luego elevarlas al cuadrado, etc.)
g. La desviación estándar muestral
h. s2 usando el método breve
Solución:
a. Intervalo de la muestra o rango = xmax  xmin
R  49.30  23.50  25.8 R  25.8
b. x  31.03
xi ( xi  x ) ( xi  x ) 2 xi2
29.5 - 1.53 2.3409 870.25
49.3 18.27 333.7929 2340.49
30.6 - 0.43 0.1849 936.36
28.2 - 2.83 8.0089 795.24
28.0 - 3.03 9.1809 784.00
26.3 - 4.73 22.3729 691.69
33.9 2.87 8.2369 1149.21
29.4 - 1.63 2.6569 864.36
23.5 - 7.53 56.7009 552.25
31.6 0.57 0.3249 998.56
63

x i  310.3  ( xi  x ) = 0  ( xi  x ) 2 = 443.801  xi2 = 10072.41

 (x  x )
i
2
443.801
s2  i 1
s2   49.3112 s 2  49.3112
n 1 9

c. s  s 2 s  49.3112  7.022 s  7.022


d.
  xi  10072.41
2

x2
i 
n
443.81 
10
s2  s2   49.3112 s 2  49.3112
n 1 9

16. Se determinó el valor del módulo de elasticidad, en GPa de placas coladas, formadas
por varios sustratos intermetálicos y se obtuvieron las siguientes observaciones
muestrales (“Strength and Modulus of a Molybdenum-Coated Ti-25 Al-10 Nb-3 U-
1Mo Intermetallic”, Journal of Material Engeenering and Performance, 1997, pp. 46-
50):

116.4 115.9 114.6 115.2 115.8

a. Calcule x y las desviaciones respecto a la media


b. Use las desviaciones que calculó en el inciso a para obtener la varianza y la
desviación estándar muestrales.
c. Calcule s 2 con el método breve
d. Reste 100 de cada observación para obtener una muestra de valores transformados.
Ahora calcule la varianza muestral de esos valores trasformados y compárela con
s2 para datos originales.
Solución:

a. x 
 xi x  577.9  115.58
n 5
xi ( xi  x ) ( xi  x ) 2 xi2
116.4 0.82 0.6724 13548.96
115.9 0.32 0.1024 13432.81
114.6 - 0.98 0.9604 13133.16
64

115.2 - 0.38 0.1444 13271.04


115.8 0.22 0.0484 13409.64
 ( xi  x ) 2 =
x i  577.9  ( xi  x ) = 0
1.929
 xi2 = 66795.61
b.
n

 (x  x ) i
2
1.929
s2  i 1
s2   0.48225 s 2  0.48225
n 1 4

s  s2 s  0.48225  0.6944 s  0.6944

  xi   577.9 
2 2

x 2
i 
n
66795.61 
5
c. s  2
s2   0.482 s 2  0.482
n 1 4
d.

xi xi2
16.4 268.96
15.9 252.81
14.6 213.16
15.2 231.04
15.8 249.64
 xi  77.9  xi = 1215.61
2

  xi   77.9
2 2

x 2
i 
n
1215.61 
5
s2  s2   0.482 s 2  0.482
n 1 4
Resultan iguales

17. Las siguientes mediciones de viscosidad estabilizada (en cP) de especímenes de


determinada clase de asfalto con 18% de hule se tomaron del artículo “Viscosity
Characteristics of Rubber-Modified Asphalts” (J. of Materials in Civil Engr., 1996,
pp. 153- 156):

2781 2900 3013 2856 2888

a. ¿Cuáles son los valores de la media y la mediana muestrales?


c. Calcule la varianza de la muestra con la fórmula de cálculo. Sugerencia: primero
reste un número adecuado a cada observación.
Solución:
a. Ordenando los valores: 2781 2856 2888 2900 3013

x
 xi x  14438  2887.6 x  2887.6 x  2888
n 5

xi ( xi  x ) ( xi  x ) 2
65

2781 -106.6 11363.56


2900 12.4 153.76
3013 125.4 15725.16
2856 -31.6 998.56
2888 0.4 0.16
 xi  14438  ( xi  x ) = 0  ( xi  x ) 2 = 28241.2
n

 (x  x ) i
2
28241.2
s2  i 1
s2   7060.3 s 2  7060.3
n 1 4

Si restamos 2700 a todos los números, tenemos:


xi ( xi  x ) ( xi  x ) 2
81 -106.6 11363.56
200 12.4 153.76
313 125.4 15725.16
156 -31.6 998.56
188 0.4 0.16
 xi  938  ( xi  x ) = 0  ( xi  x ) 2 = 28241.2
Se observa que la suma de las desviaciones de la media elevadas al cuadrado es la
misma
por tanto se obtiene el mismo valor para la varianza.

18. Calcule e interprete los valores de la media y la desviación estándar muestrales para
las siguientes determinaciones de la resistencia a la fractura (en MPa, tomados de la
gráfica en “Heat-Resistant Active Brazing of Silicon Nitride: Mechanical Evaluation
of Braze Joints”, Welding J., agosto de 1997):

87 93 96 98 105 114 128 131 142 168


Solución:

x
 xi x
1162
 116.2 x  116.2
n 10

xi xi2
  xi 
2

 xi2  n
87 7569
s 
2
93 8649
n 1 96 9216
1162 
2
98 9604
140992  105 11025
s2  10  663.0667
9 114 12996
128 16384
131 17161
s 2  663.0667 s  25.75 142 20164
168 28224
 xi  1162  xi =140992
2
66

Sobre el promedio se espera que una fractura se encuentre alrededor de 116.2 MPa.
En general el tamaño de una desviación típica de la media muestral es alrededor de
25.75. Algunas observaciones pueden desviarse mas del valor de 116.2 y otras menos.

19. Una muestra de 26 trabajadores de cierta plataforma marina tomaron parte en un


simulacro de evacuación (para casos de emergencia) y se obtuvieron los datos adjuntos
de tiempo (segundos) para terminar el desalojo.

389 356 359 363 375 424 325 394 402 373 373 370 364 366
364
325 339 393 392 369 374 359 356 403 334 397

Calcule e interprete la desviación estándar de la muestra. (Sugerencia:  xi = 9638 y 


xi2 =
3587 566)
Solución:

  xi   9638
2 2

x 2
i 
n
3587566 
26  593.3415
s2  s2 
n 1 25
s 2  593.3415 s  24.36
En general el tamaño de una desviación típica de la media muestral de 370.7 es cerca
de 24.4. Algunas observaciones pueden desviarse un poco mas de este valor y otras
un poco menos.

20. Los datos adjuntos corresponden a la carga de un rodamiento (en millones de


revoluciones), para rodamientos de cierto tipo cuando se les aplica una fuerza de 9.56
kN y fueron publicados en el artículo “The Load-Life Relationship for M50 Bearing
with Silicon Nitride Ceramic Balls” (Lubric, Engr., 1984, pp. 153-159):

14.5 25.6 52.4 66.3 69.3 69.8 76.2


a. Calcule los valores de la media y la mediana muestral. ¿Qué le dicen los valores
relativos, de uno a otro acerca de la muestra?
b. Calcule la varianza y la desviación estándar de la muestra.
Solución:

a. x 
 xi x  374.1  53.44 x  53.44 x  66.3
n 7
El hecho de que x  x sugiere que las observaciones del extremo izquierdo (menores)
de la muestra están más cercanas que las del extremo derecho (mayores).
b.
  xi   374.1
2 2

 x2 
i
n
23488.03 
7
s2  s2   582.51
n 1 6
s  582.51
2
s  24.14
67

21. El artículo “A Thin – film Oxygen Uptake Test for the Evaluation of Automotive
Carnkcase Lubricants” (Lubric. Engr., 1984, pp. 153-159) publicó los siguientes datos
del tiempo de oxidación – inducción (en minutos) de varios aceites comerciales:

87 103 130 160 180 195 132 145 211 105 145 153 138 87
99 93 119 129 152

c. Calcule la varianza muestral y la desviación estándar


d. Si las observaciones se volvieran a expresar en horas, ¿cuáles serían los valores
resultantes de la varianza muestral y desviación estándar muestral? Conteste sin
reescribir la expresión.

Solución:
error
a. Variable N Media estándar Desv.Est. Mínimo Q1 Mediana
Q3
Tiempo 19 134.89 8.16 35.56 87.00 103.00 132.00
153.00

Variable Máximo Varianza


Tiempo 211.00 1264.52

35.65 1264.52
b. 1 h = 60 min, por tanto sh   0.593 y sh2   0.3513
60 3600

22. Considere la siguiente distribución de frecuencias.

xi 115 116 117 118 119 120 121 122 123 124
fi 4 6 9 13 15 19 20 18 15 10

Calcule la media, la varianza y la desviación estándar de la muestra.


Solución:

Para datos agrupados


2
 p 
p p   fi xi 
fx  fi xi2   
i 1
i i
n
x i 1
s 2  i 1
n n 1

Para este conjunto de datos: n   fi  129 x  120.22, s  2.379 s 2  5.6596

23. Calcule la media, la desviación estándar, la varianza y la mediana aproximadas para


los datos de la siguiente distribución de frecuencias:

Intervalo de clase Frecuencia


68

- 10 ≤ x < 0 3
0 ≤ x < 10 8
10 ≤ x < 20 12
20 ≤ x < 30 16
30 ≤ x < 40 9
40 ≤ x < 50 4
50 ≤ x < 60 2

Solución:

Para datos agrupados


2
 p 
p p   fi xi 
fx  fi xi2   
i 1
i i
n
x i 1
s 
2 i 1
xi = marcas de clase
n n 1
fi = frecuencia del intervalo

Para este conjunto de datos: n   fi  54 x  22.407, s  14.43 s 2  208.225

24. Consulte los datos del problema 7 sobre áreas de lámina esclerótica.

a. Determine los cuartos inferior y superior.


b. Calcule el valor de la cuarta dispersión.
c. Si los dos valores muestrales más grandes, 4.33 y 4.52 hubieran sido 5.33 y 5.52,
¿cómo afectaría esto a fs? Explique.
d. ¿Cuánto se puede aumentar la observación 2.34 sin afectar fs? Explique.
e. Si a la muestra se le agrega una observación más, x18 = 4.60, ¿cuánto vale fs?
Solución:
a. 2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88 4.33 3.46 4.52 2.43
3.65 2.78 3.56 3.01
Ordenando los valores: 2.34 2.43 2.62 2.74 2.74 2.75 2.78 3.01 3.46
3.65 3.56 3.85 3.88 3.93 4.21 4.33 4.52
Q1 = 2.74 y Q3 = 3.88

b. fs = 3.88 – 2.74 = 1.14


c. Estos no cambiarían ya que se obtienen por su posición, cuando se ordenan los
valores.
d. Se podría aumentar un valor menor que 0.40 para que no alcanzara al 2.74.
e. Como ahora el número de datos es par:

Q1 = 2.74 y Q3 = 3.93 por tanto fs = 3.93 – 2.74 = 1.19

25. Vuelva a examinar los datos adjuntos de mediciones de resistencia al corte, en MPa,
que se mencionaron en el problema 1 de esta serie.

22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5
69

e. ¿Cuáles son los valores de los cuartos, y cuál es el valor de fs?


f. Trace un diagrama de caja basado en el resumen de cinco números y comente sus
características?
g. ¿Cuánto debe valer una observación para considerarse como inusual? ¿Cómo valor
extremo?
h. ¿Cuánto podría disminuir la observación más grande sin que afecte a fs?

Solución:

b. Ordenando los valores


4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5 109.9

Q1 = 26.25 Q3 = 70 fs = Q3 – Q1 = 70 – 26.25 fs = 43.75

b. xmin  4.4 xmax  109.9 x  36.6

Hay un ligero sesgo positivo, hay dispersión en los datos, es decir mucha
variabilidad
No hay valores atípicos.

e. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
26.25 – (1.5)(43.75) = - 39.375 o 70 + (1.5)(43.75) = 135.62
En este caso no hay valores menores que – 39.375 ni mayores que 135.62

Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
26.25 – (3.0)(43.75) = - 105 o 70 + (3.0)(43.75) = 201.25

f. El valor de 109.9 podría disminuirse hasta no menos de 73.3, esto es no menor de


(109.9 – 73.3) = 36.6 unidades.

Gráfica de caja de resistencia al corte

0 10 20 30 40 50 60 70 80 90 100 110 120


Resistencia en MPa
70

26. A continuación vemos el diagrama de tallo y hojas de los datos del tiempo de
evacuación mostrados en el ejercicio 3
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4

a. Determine el valor de la cuarta dispersión.


b. ¿Hay algunos valores atípicos en la muestra? ¿y algunos puntos atípicos extremos?
c. Trace un diagrama de caja y comente sus particularidades.
d. ¿Cuánto habría de disminuir la observación más grande, que por el momento es
424, sin que afecte el valor de la cuarta dispersión?
Solución:
a. Q1 = 359 Q3 = 392 fs = Q3 – Q1 = 392 – 359 fs = 33

b. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
359 – (1.5)(33) = 309.5 o 392 + (1.5)(33) = 441.5
En este caso no hay valores menores que 309.5 ni mayores que 441.5

Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
359 – (3.0)(33) = 260 o 392 + (3.0)(33) = 491
Como en este caso la observación mínima es 325 y la máxima 424 se concluye que
no hay valores atípicos ni extremos.

c.

Hay un ligero sesgo positivo, no tiene mucha simetría y la dispersión parece grande.
71

d. Hasta un valor que no fuera menor que 392 , es decir no mas de 32 unidades.

27. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado


plástico, con una muestra de 26 especímenes y se obtuvieron los siguientes datos (“The
Lognormal Distribution for Modeling Quality Data when the Means Is Near Zero”, J.
of Quality Technology, 1990, pp. 105 – 110):

30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511

Trace un diagrama de caja que muestre los valores atípicos y comente sus
particularidades.
Solución:
Hay un sesgo positivo en los datos, hay un valor extremo (x = 511), presenta una ligera
dispersión, los valores con los que fue construida la caja son:
xmin  30, xmax  511, x  119, Q1  87, Q3  182, f s  95 , 1.5fs = 142.5, 3.0fs =
285
Q3  3.0 f s  182  285  467 , de ahí que 511 > 467 es un valor extremo

Cantidad de aluminio contaminante

0 50 100 150 200 250 300 350 400 450 500


ppm

28. Se seleccionó una muestra de 20 botellas de vidrio de cierto tipo y se midió la


resistencia de cada una a la presión interna. Examine la siguiente información parcial
de la muestra:

Mediana = 202.2 cuarto inferior = 196.0 cuarto superior = 216.8

Tres observaciones mas pequeñas 125.8 188.1 193.7


Tres observaciones más grandes 221.3 230.5 250.2

a. ¿Hay algunos valores atípicos en la muestra? ¿Algunos valores atípicos extremos?


b. Trace un diagrama de caja que muestre los valores atípicos y comente las
características interesantes que encuentre.
72

Solución:
a. f s  216.8  196  20.8, 1.5 f s  31.2, 3.0 f s  62.4 ,

Q1  1.5 f s  196  31.2  164.6, Q1  3 f s  196  62.4  133.6


Q3  1,5 f s  216.8  31.2  248, Q3  3 f s  216.8  62.4  279.2
Los valores entre 133.6 < x < 164.6 son atípicos, en este caso no hay.
Los valores menores que 133.6 son atípicos extremos, en este caso x = 125.8 es un
valor
Atípico extremo en la izquierda.
Los valores entre 248 < x < 279.2 son atípicos, en este caso x = 250.2 es un valor
atípico
Los valores mayores que 279.2 son extremos, en la derecha no hay valores
extremos.
b.

O 

120 160 200 240

8. En una empresa se usan dos máquinas distintas para fabricar partes de cierto tipo.
Durante un solo turno, se obtuvo una muestra de n = 20 partes que produce cada
máquina, se determinó el valor de una dimensión crítica determinada. Con estos datos
se construyó el diagrama de caja comparativo. Compare y describa las diferencias de
las dos muestras,

Solución:
Se observa del diagrama de caja que la muestra tomada en la máquina 2 presenta
considerablemente mayor variabilidad que la muestra de la máquina 1, parece que el
valor de la mediana es el mismo, sin embargo hay mayor simetría en los datos de la
máquina 2 que en los de la 1.En los datos de la muestra de máquina 2 no hay valores
atípicos y en los de la máquina 1 hay un valor atípico.
73

8. Se determinó la concentración de cocaína en la sangre (mg/l) en una muestra de


individuos que murieron de delirio excitado (DE) inducido por cocaína y en una
muestra de quienes murieron por sobredosis de cocaína sin delirio excitado; el tiempo
de supervivencia en ambos grupos fue a lo sumo de seis horas. Los datos adjuntos se
obtuvieron de un diagrama de caja del artículo “Fatal Excited Delirium Following
Cocaine Use” (J. of Forensic Sciences, 1997: 25 – 31).

DE 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.3 0.3 0.3 0.4 0.5 0.7
0.8
1.0 1.5 2.7 2.8 3.5 4.0 8.9 9.2 11.7 21.0

Sin DE 0 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.2 0.3 0.3 0.3 0.4 0.5
0.5
0.6 0.8 0.9 1.0 1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 4.3 4.8 5.0
5.6
5.9 6.0 6.4 7.9 8.3 8.7 9.1 9.6 9.9 11.0 11.5 12.2 12.7 14.0
16.6 17.8
a. Determine las medianas, los cuartos y las cuartas dispersiones en las dos muestras.
b. ¿Hay valores atípicos en alguna de las dos muestras? ¿Hay valores atípicos
extremos?
c. Trace un diagrama de caja comparativo y utilícelo como base para comparar las
muestras con DE y sin DE.
Solución:
a. Para la muestra DE, x  0.4, Q1  0.1, Q3  2.75 f s  2.75  0.1  2.65
Para la muestra sin DE, x  1.6, Q1  0.3, Q3  7.9 f s  7.9  0.3  7.6
b. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
para la muestra de DE
0.1 – (1.5)(2.65) = - 3.875 o 2.75 + (1.5)(2.65) = 6.725
En este caso no hay valores menores que – 3.875 pero si hay valores mayores que
6.725, estos son 8.9, 9.2

Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
0.1 – (3.0)(2.65) = - 7.65 o 2.75 + (3.0)(2.65) = 10.7
Para este caso no hay valores extremos en el lado izquierdo de los datos porque la
observación mínima es 0.1, pero en el lado derecho los valores extremos son
aquellos mayores de 10.7, esto es 11.7 y 21.0

Para la muestra sin DE:


0.3 – (1.5)(7.6) = - 11.1 o 7.9 + (1.5)(7.6) = 19.3
En este caso no hay valores menores que – 11.1 ni mayores que 19.3 ya que el
valor mínimo es 0.3 y el máximo es 17.8, en consecuencia tampoco habrá valores
atípicos extremos.

c.
74

En el diagrama se observan claramente los valores atípicos de la muestra DE, hay


sesgo positivo en ambos, ninguno presenta simetría, la muestra sin DE presenta
mayor variabilidad que en la muestra DE, La muestra sin DE no presenta valores
atípicos.

8. Se realizaron mediciones de resistencia la explosión (lb/pulg2) para soldaduras de


cierre de toberas de prueba y para soldaduras de toberas de recipientes de producción
(“Proper Procedures Are the Key in Welding Radioactive Waste Cannisters”, Welding
J., agosto de 1997; 61 – 67).
Prueba 7200 6100 7300 7300 8000 7400 7300 7300 8000 6700
8300
Recipiente 5250 5625 5900 5900 5700 6050 5800 6000 5875 6100
5850
6600
Trace un diagrama de caja comparativo y comente acerca de las características
interesantes.

Se observa que los procedimientos son muy diferentes, el de prueba presenta mucha
variabilidad, no presenta simetría, se observa una dispersión considerable de los
datos pero no presenta valores atípicos.
75

En el de recipientes hay poca variabilidad, se observa poca dispersión y hay simetría,


pero presenta dos valores atípicos.

8. En “Applied Life Data Analysis” se presenta el tiempo de falla de un fluido aislante


entre electrodos a 34 kV. Los tiempos en minutos son:

0.19 0.78 0.96 1.31 2.78 3.16 4.15 4.67 4.85 6.50 7.35 8.01 8.27 12.06
31.75 32.52 33.91 36.71 72.89

a. Elabore una distribución de frecuencias para estos datos:


b. Calcule la media, la mediana, la varianza y la desviación estándar de la muestra.
c. A partir de la distribución y los intervalos de clase, repita los cálculos para encontrar
la media, la varianza y la desviación estándar y compare los resultados con los del
inciso (b).
Solución:
a.
Distribución de frecuencias
Intervalos Frecuencias Marcas de clase
0  x < 15 14 7.5
15  x < 30 0 22.5
30  x < 45 4 37.5
45  x < 60 0 52.5
60  x < 75 1 67.5

b. x  14.359 s  18.88 s 2  356.4716

c. x  16.9737 s  17.472 s 2  305.263


Se observa que la diferencia entre los valores calculados con los datos agrupados
y
los no agrupados es poca, si se considera que la variabilidad de los datos es muy
grande.

8. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un


artículo de Technometrics (vol. 19 p. 425), revista dedicada a las aplicaciones
estadísticas en ciencias físicas e ingeniería.

88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 95.6 93.3 94.7 91.1
91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.2
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1 89.2 88.3 85.3 87.9
88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7 91.8 91.6 90.4 91.1
92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7
76

a. Elabore una distribución de frecuencias y un histograma.


b. Calcule la media, la varianza y la desviación estándar de la muestra.
c. Determine la mediana de la muestra.
Solución:
a.
Distribución de frecuencias

Frec. Frec.
Intervalo Frecuencia Intervalo
relativa Frecuencia relativa
83  x < 85 2 0.02531 93  x < 95 10 0.12658

85  x < 87 3 0.03797 95  x < 97 2 0.02531

87  x < 89 16 0.20253 97  x < 99 1 0.01266


99  x <
89  x < 91 23 0.29114 1 0.01266
101
Totales de
91  x < 93 21 0.26582 las 79 0.99999
Frecuencias

b. y c.
Variable N Media Desv.Est. Mínimo Q1 Mediana Q3
79 90.671 0.316 2.806 83.400 88.700 90.500
92.200

Variable Máximo
100.300

8. Considere la siguiente distribución de frecuencias.

xi - 4 -3 -2 -1 0 1 2 3 4
77

fi 60 120 180 200 240 190 160 90 30

a. Calcule la media, la varianza y la desviación estándar de la muestra.


b. Calcule la mediana.
Solución:
a.
Para datos agrupados
2
 p 
p p   fi xi 
fx  fi xi2   
i 1
i i
n
x i 1
s 2  i 1
n n 1

xi - 4 -3 -2 -1 0 1 2 3 4
fi 60 120 180 200 240 190 160 90 30
fxi - 240 -360 -360 -200 0 190 360 270 120
2
fxi 960 1080 720 200 0 190 640 810 480

fx i i
220
x i 1
  0.173 x  0.173
n 1270
2
 p 
p   fi xi 
 f i xi2    (220) 2
i 1
4900 
n 1270  3.831
s 2  i 1 
n 1 1269

s 2  3.831 s  1.957

xn / 2  x( n / 2)1 00
b. Para este conjunto de datos: n = 1270 (par) x   0 x0
2 2

8. Calcule la media, la varianza y la mediana aproximadas de la muestra a partir de los


datos en la siguiente distribución de frecuencias.

Intervalos de clase Frecuencia


10 ≤ x < 20 121
20 ≤ x < 30 165
30 ≤ x < 40 184
40 ≤ x < 50 173
50 ≤ x < 60 142
60 ≤ x < 70 120
70 ≤ x < 80 118
80 ≤ x < 90 110
90 ≤ x < 100 90

Solución:
78

Para datos agrupados

2
 p 
p p   fi xi 
fx  fi xi2   
i 1
i i
n
x i 1
s 2  i 1 xi = marcas de clase
n n 1
fi = frecuencia del intervalo

Para este conjunto de datos:


n   fi  1223 x  51.1243, s  24.2199 s  586.60356 2

8. Calcule la media, la varianza y la mediana aproximadas de la muestra a partir de los


datos en la siguiente distribución de frecuencias.

Intervalos de clase Frecuencia


600 ≤ x < 650 41
650 ≤ x < 700 46
700 ≤ x < 750 50
750 ≤ x < 800 52
800 ≤ x < 850 60
850 ≤ x < 900 64
900 ≤ x < 950 65
950 ≤ x < 1000 70
1000 ≤ x < 1050 72

Solución:

Para datos agrupados

2
 p 
p p   fi xi 
fx  fi xi2   
i 1
i i
n
x i 1
s  i 1
2
xi = marcas de clase
n n 1
fi = frecuencia del intervalo

Para este conjunto de datos: n   fi  520 x  847.88, s  126.443 s 2  15987.81


NOTA: Estos dos últimos problemas se resolvieron usando una calculadora en modo
estadístico

8. Examine la siguiente información sobre la resistencia última a la tensión (lb/pulg) para


una muestra n = 4 especimenes de alambre de cobre al circonio duro (tomado de
“Characterization Methods for Fine Copper Wire”, Wire J.Intl., agosto de 1997, pp.
74 – 80).
x  76831 s  180 xi mínima  76683 xi máxima  77048

Determine los valores de las dos observaciones centrales de la muestra.


Solución:
79

Para simplificar algo el algebra podemos restar a los datos 76000, esta transformación
afectará a cada dato y la media, pero no afectará a la desviación estándar.
x1  683 x4  1048 x  831
nx  4(831)  3324, entonces x1  x2  x3  x4  3324 y x2  x3  3324  x1  x4
x2  x3  1593, x3  1593  x2 .............(1)
Usando la fórmula para la varianza
( xi ) 2 (3324) 2
 xi 
2
 xi2 
s2 
n 1
n s 2  (180) 2 
3
4
 xi2  2859444
x12  x22  x32  x42  2859444 x22  x32  2859444   x12  x42   1294651............(2)
Sustituyendo (1) en la ec.(2) se obtiene

x22  (1593  x2 )2  1294651  0 x22  1593x2  621499  0


Resolviendo esta ecuación, obtenemos el valor positivo x2  682.8635 y de aquí
x3  1593  682.8635  910.1365, entonces x2  76683 y x3  76910

8. Se examinaron tres flujos de C2F6 diferentes en un experimento para investigar el


efecto del flujo en la uniformidad (%) del grabado al ácido en una oblea de silicio
utilizada en la fabricación de circuitos integrados y se obtuvieron los datos siguientes:

Flujo
125 2.6 2.7 3.0 3.2 3.8 4.6
160 3.6 4.2 4.2 4.6 4.9 5.0
200 2.9 3.4 3.5 4.1 4.6 5.1

Compare las observaciones de uniformidad que resultan de estos tres diferentes flujos.
Solución:

Flujo mediana Q1 Q3 fs 1.5 fs 3.0 fs


125 3.1 2.7 3.8 1.1 1.65 3.3
160 4.4 4.2 4.9 0.7 1.05 2.1
200 3.8 3.4 4.6 1,2 1.80 3.6
80

No hay valores atípicos en ninguna de las muestras, sin embargo el diagrama


comparativo muestra que los tres flujos son muy diferentes con respecto a sus valores
centrales, las medianas son diferentes. El Flujo de 160, presenta menor variabilidad y
mayor simetría que los otros dos flujos.

8. Se seleccionaron muestras de tres tipos distintos de cable de acero y se determinó el


límite de fatiga, en MPa, para cada muestra con los resultados siguientes:

Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391
391 392

Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383
388 392

Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380
380 392

a. Trace un diagrama de caja comparativo y comente acerca de semejanzas y


diferencias.
b. Trace un diagrama de puntos comparativo (un diagrama de puntos para cada
muestra con una escala común). Comente acerca de semejanzas y diferencias.
c. ¿El diagrama de caja comparativo del inciso (a) proporciona una información
evaluativa de las semejanzas y diferencias? Explique por qué.

Solución:
b. Los resúmenes de 5 números: x , los dos cuartiles y las observaciones menor y
mayor, son idénticos en los tres tipos y no hay valores atípicos, por tanto los tres
diagramas de caja individuales, resultan idénticos.
81

Límite de fatiga de tres tipos diferentes de cable de acero

T1

T2

T3

350 360 370 380 390


MPa

b. Límite de fatiga de tres tipos diferentes de cable de acero

Se observa un el diagrama de puntos que existe diferente variabilidad en cada tipo,


la naturaleza de los huecos y la existencia de grupos diferentes para las tres
muestras.

d. El diagrama de caja del inciso (a) no es capaz de detectar las diferencias entre los
tres conjuntos de datos, la razón principal es que los diagramas de caja dan solo
algunos detalles porque se usa un resumen de sólo 5 datos para comparar el conjunto
de datos.
82

SERIE 1
DIAGRAMAS DE TALLO Y HOJAS, HISTOGRAMAS

9. Se pidió a cada miembro de una muestra de 120 individuos, dueños de motocicletas,


que dieran el nombre del fabricante de su máquina. La distribución de frecuencia de
los datos aparecen en la tabla.

Fabricante Frecuencia Frecuencia Relativa

1. Honda 41 0.34
2. Yamaha 27 0.23
3. Kawasaki 20 0.17
4. Suzuki 18 0.15
5. Harley-Davidson 3 0.03
6. Otros 11 0.09
120 1.01

Con estos datos trace un histograma de frecuencias.

Marcas de motocicletas mas usadas

40

30
Número

20

10

0
Honda Yamaha Kawasaki Suzuki Otros Harley-Dadvison
Marca

10. Las investigaciones sobre resistencia de materiales representan un área rica en


aplicaciones de métodos estadísticos. El artículo “Efects of Aggregates and
Microfillers on the Flexural Properties of Concrete” (Magazine of Concrete Research,
1997, pp. 81-89) reseñan un estudio de las propiedades de resistencia del concreto de
alta resistencia obtenido usante superplastificantes y ciertos aglutinantes. La
resistencia a la compresión de este concreto se había investigado con anterioridad,
pero no se conocía mucho acerca de la resistencia a la fricción (medida de la capacidad
de resistencia a la falla por flexión). Loa datos siguientes sobre resistencia a la presión
están en megapascales (MPa) (donde 1 Pa = 1.45  10-4 psi) y aparecieron en el
artículo citado:
83

5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0
8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7

a. Trace un diagrama de tallo y hojas de los datos. ¿Cuál parece ser un valor
representativo de la resistencia? Las observaciones, ¿parecen estar muy
concentradas cerca del valor representativo, o solo están dispersas?
b. El diagrama, ¿parece ser razonablemente simétrico respecto a su valor
representativo, o describiría su forma de otra manera?
c. ¿Parece haber algún valor extraño o atípico?
d. ¿Qué proporción de las observaciones de resistencia fueron mayores de 10 MPa en
esta muestra?
Solución

a. Tallo y hoja de resistencia N = 27


Unidad de hoja = 0.10

5 9
6 33588
7 00234677889
8 127
9 077
10 7
11 368

El valor representativo es el 7. Si, tiene dispersión


b. Tiene poca simetría, con cierto sesgo.
c. No presenta valores atípicos.
d. Hay 4 valores mayores que 10, por tanto la proporción p = 4 / 27 = 0.148, p =
14.8%

11. El artículo citado en el problema anterior también presenta las siguientes


observaciones de resistencia en cilindros:

6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
a. Trace un diagrama comparativo de tallo y hojas, de los datos para vigas y cilindros
y a continuación conteste las preguntas de los incisos (b), (c), y (d) del problema
anterior para las observaciones con cilindros.
b. ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias
entre las observaciones para vigas y para cilindros?
c. Construya una gráfica de puntos de los datos del cilindro.
Solución
a. . concreto cilindros
9 5 8 Tallo: unidades
88553 6 16 Hojas: décimos
98877643200 7 012488
721 8 13359
770 9 278
7 10
863 11 2
12 6
13
14 1

El valor representativo es el 7 y 8, pero presenta mayor dispersión


84

No presenta simetría, la mayoría de los valores están concentrados alrededor del 7


y8
El valor 14.1 parece ser un valor atípico y la proporción de valores mayores que 10
es
p = 3/20 = 0.15, p = 15%
b. La mayoría de los datos están entre 5 y 9, tanto para el concreto como para los
cilindros
con el valor representativo en ambos de 7 MPa. Las observaciones para los cilindros
tienen mayor variación o dispersión y los cilindros presentan un valor atípico.

c.

12. Cada puntuación en el siguiente lote de calificaciones de exámenes se encuentra en


60 y 69, 70 y 79, 80 y 89 o 90 y más. Un diagrama de tallo y hojas con sólo los cuatro
tallos 6, 7, 8 y 9 no proporcionaría una descripción detallada de la distribución de
calificaciones. En este tipo de situaciones, es recomendable usar tallos repetidos. Aquí
se podrìa repetir el tallo 6 dos veces, usando 6L, para las calificaciones bajas de 60
(hojas 0, 1, 2, 3 y 4) y 6H Para las calificaciones altas de 60 (hojas 5, 6, 7, 8 y 9). De
manera similar, los otros tallos se pueden repetir dos veces para obtener una muestra
que considere ocho renglones. Construya un diagrama para las calificaciones
suministradas. ¿Qué características de los datos se remarcan en este diagrama?

74 89 80 93 64 67 72 70 66 85 89 81 81 71 74 82 85
63
72 81 81 95 84 81 80 70 69 66 60 83 85 98 84 68 90
82
69 72 87 88
Solución:
Tallo y hoja de calificaciones N = 40
Unidad de hoja = 1.0

6 034
6 667899
7 00122244
7
8 001111122344
8 5557899
9 03
9 58

El valor representativo está en las calificaciones de 8 bajas, presenta un hueco en las


calificaciones de 7 altas poca dispersión.

13. Los valores de densidad relativa adjuntos para varios tipos de maderas utilizados en
la construcción se publicaron en el artículo “Bolted Connection Design Values Based
on European Yield Model” (J. of Structural Engr., 1993; 2169 – 2186):
85

0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40 0.40 0.41 0.41 0.42 0.42
0.42 0.42 0.42 0.43 0.44 0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51
0.54 0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.67 0.75

Construya un diagrama de tallo y hojas usando tallos repetidos y comente acerca de


las características interesantes del diagrama.
Solución:
Tallo y hoja de densidad relativa N = 36
Unidad de hoja = 0.010

3 1 - El diagrama muestra que 0.45 puede ser un buen valor


3 56678 representativo.
4 000112222234 - No hay simetría, presenta cierto sesgo positivo.
4 5667888 - Presenta un hueco en los valores de 7 menores
5 144 - Hay cierta dispersión lo que constituye variabilidad
5 58 en los datos
6 2 - El valor 0.75 puede ser un posible calor atípico
6 6677
7
7 5

14. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un
artículo de Technometrics (vol. 19 p. 425), revista dedicada a las aplicaciones
estadísticas en ciencias físicas e ingeniería.

88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 95.6 93.3 94.7 91.1
91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.2
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1 89.2 88.3 85.3 87.9
88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7 91.8 91.6 90.4 91.1
92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7

Trace un diagrama de tallo y hojas para estos datos. ¿Por qué es relativamente fácil
identificar un valor de octanaje? ¿Revela el diagrama algunas propiedades importantes
de los datos?
Solución

Tallo y hoja de Octanaje N = 79


Unidad de hoja = 0.10

83 4 Tallo: unidades y decenas


84 3 Hojas: décimos
85 3
86 77
87 456789
88 2333556679
89 0233678899
90 0113344456789
91 0001112256688
92 22236777
93 023347
94 2247
95 6
96 1
97
86

98 8
99
100 3

Porque las hojas están alrededor del valor de 90 y 91 y están cercanamente simétricas
a
estos valores, además la dispersión de los datos es pequeña con respecto al valor
representativo. Presenta dos huecos.

15. Las propiedades mecánicas permisibles para diseño estructural de vehículos


aeroespaciales metálicos, requiere un método aprobado para analizar estadísticamente
los datos de prueba empíricos. En el artículo “Establishing Mechanical Property
Allowables for Metals” (J. of Testing and Evaluation, 1998: 293 – 299), se emplearon
los datos adjuntos de resistencia última a la tensión (ksi) como base para superar
dificultades en el desarrollo del método.

122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7

c. Construya un diagrama de tallo y hojas de los datos eliminando (truncando)


primero el dígito de las decenas y luego repitiendo cada valor del tallo cinco veces
(una vez para las hojas 1 y 2, una segunda vez para las hojas 3 y 4, etc.) ¿Por qué
es relativamente fácil identificar un valor de resistencia representativo?
d. Construya un histograma usando las clases de igual amplitud con la primera clase
con un límite inferior de 122 y un límite superior de 124. Luego comente acerca
de cualquier característica interesante del histograma.
Solución
a.
Tallo y hoja de Resistencia a la tensión N = 153
Unidad de hoja = 1.0

12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13 44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
87

14 77

Por la simetría observándose que en los valores de 134 y 135 se encuentra este
valor representativo.

b. Distribución de frecuencias
Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa
122  x <124 1 0.00654 136  x < 138 22 0.14379

124  x < 126 3 0.01961 138  x < 140 18 0.11765

126  x < 128 7 0.04575 140  x < 142 10 0.06536

128  x <130 6 0.03921 142  x < 144 7 0.04575

130  x < 132 11 0.07189 144  x < 146 3 0.01961

132  x < 134 25 0.16340 146  x < 148 2 0.01307

134  x < 136 38 0.24836 Totales 153 0.99999

Resistencia a la Tensión
40

35

30

25
Frecuencia

20

15

10

0
124 128 132 136 140 144 148
ksi

El histograma presenta cierta simetría, poca dispersión, sin huecos

16. El conjunto de datos adjuntos está formado con observaciones del gasto de agua en
regaderas (l / min) para una muestra de n = 129 casa en Perth, Australia.

4.6 12.3 7.1 7.0 4.0 9.2 6.7 6.9 11.5 5.1 11.2 10.5
14.3 8.0 8.8 6.4 5.1 5.6 9.6 7.5 7.5 6.2 5.8 2.3
3.4 10.4 9.8 6.6 3.7 6.4 8.3 6.5 7.6 9.3 9.2 7.3
5.0 6.3 13.8 6.2 5.4 4.8 7.5 6.0 6.9 10.8 7.5 6.6
5.0 3.3 7.6 3.9 11.9 2.2 15.0 7.2 6.1 15.3 18.9 7.2
5.4 5.5 4.3 9.0 12.7 11.3 7.4 5.0 3.5 8.2 8.4 7.2
10.3 11.9 6.0 5.6 9.5 9.3 10.4 9.7 5.1 6.7 10.2 6.2
8.4 7.0 4.8 5.6 10.5 14.6 10.8 15.5 7.5 6.4 3.4 5.5
88

6.6 5.9 15.0 9.6 7.8 7.0 6.9 4.1 3.6 11.9 3.7 5.7
6.8 11.3 9.3 9.6 10.4 9.3 6.9 9.8 9.1 10.6 4.5 6.2
8.3 3.2 4.9 5.0 6.0 8.2 6.3 3.8 6.0

a. Construya un diagrama de tallo y hojas con los datos


b. ¿Cuál sería el valor de un gasto de agua común representativo?
c. ¿Le parece que la gráfica está muy concentrada o extendida?
d. ¿Parece que la distribución de valores es razonablemente simétrica? Si no es así,
¿cómo describiría la desviación a partir de la simetría?
e. ¿Encuentra alguna observación alejada del resto de los datos (un punto inusual o
atípico)?
Solución:
a.
Tallo y hoja del Gasto de agua en regaderas N = 129
Unidad de hoja = 0.10

2 23
3 2344567789
4 01356889
5 00001114455666789
6 0000122223344456667789999
7 00012223455555668
8 02233448
9 012233335666788
10 2344455688
11 2335999
12 37
13 8
14 36
15 0035
16
17
18 9

b. El valor representativo es el 6
c. La gráfica presenta cierta dispersión
d. No es simétrica, presenta un ligero sesgo positivo.
e. El valor 18.9 parece ser un valor atípico.

17. Un artículo de Consumer Reports sobre mantequilla de cacahuate (septiembre de


1990) reportó las siguientes calificaciones para varias marcas:

Cremoso 56 44 62 36 39 53 50 65 45 40 56 68
41 30 40 50 56 30 22
Crujiente 62 53 75 42 47 40 34 62 52 50 34 42
36 75 80 47 56 62

Construya una presentación comparativa de tallo y hojas, ponga en una lista los tallos
(en el centro de la página), las hojas cremosas a la derecha y las hojas crujientes a la
izquierda. Describa las similitudes y diferencias para los dos tipos.

Solución:

Diseño de tallo y hoja: Cremoso, Crujiente

Tallo y hoja de Cremoso N = 19


89

Tallo y hoja de Crujiente N = 18


Unidad de hoja = 1.0

Crujiente Cremoso
2 2
644 3 0069
77220 4 00145
6320 5 003666
222 6 258
55 7
0 8

 Ambos presentan poca dispersión


 Parecen no tener valores atípicos
 El crujiente tiene cierto sesgo y mayor variabilidad
 Ninguno tiene huecos

18. Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. se


seleccionó una muestra de 60 lotes y se determino la cantidad de transductores en cada
lote que no se apegaban a las especificaciones de diseño; y resultaron los siguientes
datos:

2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3

a. Determine las frecuencias y frecuencias relativas para los valores observados de x


= cantidad de transductores defectuosos de un lote.
b. ¿Qué proporción de lotes en la muestra tienen cuando más 5 transductores
defectuosos? ¿Qué proporción tiene menos de 5? ¿Qué proporción tienen cuando
menos 5 unidades defectuosas?
c. Trace un histograma de los datos con la frecuencia relativa en el eje vertical y
comente sus propiedades.

Solución:
a.
Transductores Frecuencia
Frecuencia
defectuosos relativa
0 7 0.177
1 12 0.200
2 13 0.217
3 14 0.233
4 6 0.100
5 3 0.050
6 3 0.050
7 1 0.017
8 1 0.017
Totales 60 1.000

b. El número de lotes que tienen cuando mas cinco transductores defectuosos es:
90

55
n = 7 + 12 + 13 + 14 + 6 + 3 = 55, entonces la proporción es, p   0.917
60
52
Menos de cinco transductores defectuosos n = 53, p   0.867
60
8
Cuando menos cinco unidades defectuosas, n = 8, p   0.133
60
c.

Transductores defectuososo
25

20
Porcentaje

15

10

0
0 1 2 3 4 5 6 7 8
Número

El valor representativo esta entre 2 y 3, muestra un sesgo positivo y además presenta


cierta dispersión.

19. En un estudio de productividad de autores (“Lotka’s Test”, Collection Mgmt., 1982:


111 – 118), se clasificó a un gran número de autores según la cantidad de artículos
que publicaron durante cierto período. Los resultados se presentan en la distribución
de frecuencias adjunta:

Número de artículos 1 2 3 4 5 6 7 8
Frecuencia 784 204 127 50 33 28 19 19

Número de artículos 9 10 11 12 13 14 15 16 17
Frecuencia 6 7 6 7 4 4 5 3 3

a. Construya un histograma que corresponda a esta distribución de frecuencias. ¿Cuál


es la característica más interesante de la forma de la distribución?
b. ¿Qué proporción de estos autores publicaron por lo menos cinco artículos? ¿Por lo
menos diez artículos? ¿Más de diez artículos?
c. Suponga que los cinco números 15, los tres 16 y los tres 17 se hubieran agrupado
en una sola categoría mostrada como “≥ 15”. ¿Se podría trazar un histograma?
Explique.
d. Suponga que en lugar de que los valores 15,16 y 17 se listen por separado, se
hubieran combinado en una categoría 15 a 17 con frecuencia 11. ¿Se podría trazar
un histograma. Explique.

Solución:
91

a.
Artículos publicados

800

700

Frecuencia 600

500

400

300

200

100

0
2 4 6 8 10 12 14 16 18
No. de artículos

La característica mas importante es que presenta un gran sesgo positivo y mucha


dispersión en los datos
b. Por lo menos cinco artículos n = 33 + 28 + 19 + 19 + 6 + 7 + 6 + 7 + 4 + 4 + 5 +
3+3
144
n = 144, entonces p   0.11 0 11%
1309
39
Por lo menos 10 artículos n = 7 + 6 + 7 + 4 + 4 + 5 + 3 + 3 = 39 P   0.0298
1309
o
Aproximadamente 3%
32
Mas de 10 artículos P   0.0245 0 aproximadamente 2.5%
1309
c. No, por porque estrictamente hablando la clase descrita por mayor o igual a 15 no
tiene una cota superior así que es imposible dibujar un rectángulo con un área no
definida.
d. En este caso si se puede dibujar, usando la frecuencia acumulada de 11 y calculando
la altura que debe tener el rectángulo.

20. Se determinó la cantidad de partículas contaminantes en una oblea de silicio antes de


cierto proceso de lavado, en una muestra de tamaño 100 y se obtuvieron las siguientes
frecuencias:

Cantidad de
Partículas 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Frecuencia 1 2 3 12 11 15 18 10 12 4 5 3 1 2 1

a. ¿Qué proporción de las obleas muestreadas tenían por lo menos de una partícula?
¿Cuándo menos cinco partículas?
b. ¿Qué proporción de las obleas muestreadas tenían entre cinco y diez partículas,
inclusive? ¿Y estrictamente entre cinco y diez partículas (más de cinco y menos de
diez)?
c. Trace un histograma con la frecuencia relativa en el eje vertical. ¿Cómo describiría
la forma del histograma?
92

Solución:
a. Por lo menos una partícula n = 100 – 1 = 99, por tanto p = 0.99 o 99%
Por lo menos de 5 partículas n = 15 + 18 + 10 + 12 + 4 + 5 +3 + 1 + 2 +1 = 71 p =
0.71
Es decir 71%
b. Entre 5 y 10 partículas n = 15 + 18 + 10 + 12 + 4 + 5 = 64 p = 0.64 o 64%
Estrictamente entre 5 y 10 n = 18 + 10 + 12 + 4 = 44 p = 0.44 o 44%
c.
Partículas contaminantes en una oblea de Silicio
20

15
Frecuencia

10

0
0 2 4 6 8 10 12 14
Número de partículas contaminantes

El histograma tiene cierta simetría y algo de dispersión el valor representativo está en


6.

21. El artículo “Determination of Most Representative Subdivisión” (J. of Energy Eng.,


1993, pp. 43-55) presentó datos con diversas características de subdivisiones que
podrían usarse para decidir si suministrar energía eléctrica con líneas aéreas o con
líneas subterráneas. A continuación vemos los valores de la variable x = longitud total
de las calles dentro de una subdivisión:

1280 5320 4390 2100 1240 3060 4770 1050 360 3330
3380 340 1000 960 1320 530 3350 540 3870 1250
2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770
3150 1890 510 240 396 1419 2109

a. Trace un diagrama de tallo y hojas con la cifra de los miles como tallo y la cifra de
los cientos como hoja, y comente las diversas propiedades del diagrama.
b. Trace un histograma usando los límites de clase 0, 1000, 2000, 3000, 4000, 5000 y
6000. ¿Qué proporción de las subdivisiones tienen una longitud total menor que
2000? ¿Entre 2000 y 4000? ¿Cómo describiría la forma del histograma?
Solución
a.
Tallo y hoja de Suministro de energía eléctrica N = 47
Unidad de hoja = 100

0 123334555599 Tallo: millares


1 00122234688 Hojas: Centenas
93

2 1112344477
3 0113338
4 37
5 23778

El valor representativo esta en 0, no tiene simetría, poca dispersión y no presenta


valores
atípicos.
b.
Distribución de Frecuencias

Intervalo Frecuencia Frecuencia relativa

0  x < 1000 12 0.2553


1000  x < 2000 11 0.2340
2000  x < 3000 10 0.2128
3000  x < 4000 7 0.1489
4000  x < 5000 2 0.0426
5000  x < 6000 5 0.1064
Totales 47 1.0000

El histograma muestra la misma forma que el diagrama de tallo y hojas, con un sesgo
Positivo y con la frecuencia mayor en el primer intervalo, no tiene simetría.
La proporción de subdivisiones con longitud menor que 2000 es
x 23
p p  0.489
n 47
x 9
Entre 2000 y 4000 la proporción es p  p  0.191 0 19.1%
n 47

22. El artículo citado en el ejercicio anterior también proporciona los valores siguientes
de las variables y = número de calles sin salida y z = número de intersecciones:

y 1 0 1 0 0 2 0 1 1 1 2 1 0 0 1 1 0 1 1
z 1 8 6 1 1 5 3 0 0 4 4 0 0 1 2 1 4 0 4
94

y 1 1 0 0 0 1 1 2 0 1 2 2 1 1 0 2 1 1 0
z 0 3 0 1 1 0 1 3 2 4 6 6 0 1 1 8 3 3 5
y 1 5 0 3 0 1 1 0 0
z 0 5 2 3 1 0 0 0 3

a. Construya un histograma para los datos de y. ¿Qué proporción de estas


subdivisiones no tuvo calles sin salida? ¿Por lo menos una calle sin salida?
b. Construya un histograma para los datos de z. ¿Qué proporción de estas
subdivisiones tuvo a lo sumo cinco intersecciones? ¿Menos de cinco
intersecciones?
Solución:
a. Distribución de frecuencias

y Frecuencia z Frecuencia z Frecuencia


0 17 0 13 6 3
1 22 1 11 7 0
2 6 2 3 8 2
3 1 3 7
4 0 4 5
5 1 5 3

La proporción de subdivisiones que


no tuvo calles sin salida es decir y = 0
17
p  0.362 o 36.2%
47
La proporción de subdivisiones que
tuvieron por lo menos una calle sin
salida es decir y  1
30
p  0.638 o 53.8%
47
La proporción de subdivisiones que
tuvo a lo sumo cinco intersecciones, es
decir z  5
42
p  0.894 o 89.4%
47
La proporción de subdivisiones que tuvo menos de 5 intersecciones, es decir z < 5
39
p  0.830 o 83%
47
95

23. En un estudio de ruptura por torsión durante el tejido de telas (Technometrics, 1982,
p. 63) se probaron 100 muestras de hilo. El número de ciclos de tensión hasta la
ruptura se registro para cada muestra de hilo. La información resultante es la siguiente:

86 146 251 653 98 249 400 292 131 169


175 176 76 264 15 364 195 262 88 264
157 220 42 321 180 198 38 20 61 121
282 224 149 180 325 150 196 90 229 166
38 337 65 151 341 40 40 135 597 246
211 180 93 315 353 571 124 279 81 186
497 182 423 185 229 400 338 290 398 71
246 185 188 568 55 55 61 244 20 284
393 396 203 829 239 236 286 194 277 143
198 264 105 203 124 137 135 350 193 188

a. Trace un histograma de frecuencia relativa basado en los intervalos de clase 0 - <


100, 100 - < 200, 200 - < 300, … y comente acerca de las características del
histograma.
b. Trace un histograma basado en los intervalos de clase siguientes: 0- < 50, 50 -
<100, 100 -<150, 150 - < 200, 200 - < 300, 300 - < 400, 400 - < 500, 500 - <600,
600 - < 900.
c. Si las especificaciones de tejido requieren una resistencia a la ruptura de por lo
menos 100 ciclos, ¿qué proporción de muestras de hilo debe considerarse
satisfactoria?
Solución
a.

Resistencia a la ruptura por torsión


35

30

25
Frecuencia

20

15

10

0
0 100 200 300 400 500 600 700 800 900
ciclos

El histograma presenta sesgo positivo, cierta dispersión, porque la mayoría de los


datos
están entre 0 y 300.
96

24. Una transformación de valores de datos por medio de alguna función matemática, por
ejemplo x o 1 / x, puede producir un conjunto de números que tiene propiedades
estadísticas “mas bonitas” que los datos originales. En particular puede ser posible
hallar una función para la que el histograma de valores transformados sea mas
simétrico (o todavía mejor, más parecido a una curva en forma de campana) que los
datos originales. Por ejemplo el artículo “Time Lapse Cinematographic Análisis of
Beryllium – Luna Fibroblast Interaction” (Environ. Research, 1983, pp. 34-43)
reportó los resultados de experimentos diseñados para estudiar el comportamiento de
ciertas células individuales que habían sido expuestas al berilio. Una característica
importante de tal célula es su tiempo de ínter división (TID), Se determinaron los TID
para un gran número de células en condiciones expuestas (tratamiento) y no expuestas
(de control). Los autores del artículo científico usaron una transformación logarítmica
consistente en: valor transformado = log10 (valor original). Examine los siguientes
datos representativos de TDI:

TDI log10(TDI) TDI log10(TDI) TDI log10(TDI)

28.1 1.45 60.1 1.78 21.0 1.32


31.2 1.49 23.7 1.37 22.3 1.35
13.7 1.14 18.6 1.27 15.5 1.19
46.0 1.66 21.4 1.33 36.3 1.56
25.8 1.41 26.6 1.42 19.1 1.28
16.8 1.23 26.2 1.42 38.4 1.58
34.8 1.54 32.0 1.51 72.8 1.86
62.3 1.79 43.5 1.64 48.9 1.69
28.0 1.45 17.4 1.24 21.4 1.33
17.9 1.25 38.8 1.59 20.7 1.32
19.5 1.29 30.6 1.49 57.3 1.76
21.1 1.32 55.6 1.75 40.9 1.61
31.9 1.50 25.5 1.41
28.9 1.46 52.1 1.72

Utilice intervalos de clase 10 - < 20, 20 - < 30,… para construir un histograma con
la información original. Utilice intervalos 1.1 - < 1.2, 1.2 - < 1.3,… para hacer lo
mismo con la información transformada. ¿Cuál es el efecto de la transformación?

Intervalo Frecuencia Intervalo Frecuencia


10  x < 20 8 50  x < 60 3
20  x < 30 14 60  x < 70 2
30  x < 40 8 70  x < 80 1
40  x < 50 4 Total 40
97

Intervalo Frecuencia Intervalo Frecuencia


1.1  x < 1.2 2 1.5  x < 1.6 6
1.2  x < 1.3 6 1.6  x < 1.7 4
1.3  x < 1.4 7 1.7  x < 1.8 5
1.4  x < 1.5 9 1.8  x < 1.9 1

El histograma sin transformación


presenta cierto sesgo positivo y el
histograma con la transformación ya
presenta cierta simetría, con la mayor
parte de los datos alrededor del valor
representativo.

25. El conjunto de datos adjuntos


está formado por observaciones sobre
resistencia al corte (en libras) de
soldadura de punto ultrasónico hecho
en un cierto tipo de lámina de
duraluminio. Construya una
distribución de frecuencias relativa y
un histograma con base en 10
intervalos de clase, con el primer
intervalo que tenga un límite inferior de 4000 y límite superior de 4200. Comente las
características del histograma.

5434 4948 4521 4570 4990 5702 5241 5112 5015 4659 4806
4637 5670 4381 4280 5043 4886 4599 5288 5299 4848 5378
5260 5055 5828 5218 4859 4780 5027 5008 4609 4772 5133
5095 4618 4848 5089 5518 5333 5164 5342 5069 4755 4925
5001 4803 4951 5679 5256 5207 5621 4918 5138 4786 4500
5461 5049 4974 4592 4173 5296 4965 5170 4740 5173 4568
5653 5078 4900 4968 5248 5245 4723 5275 5419 5205 4452
5227 5555 5388 5498 4681 5076 4774 4931 4493 5309 5582
4308 4823 4417 5364 5640 5069 5188 5764 5273 5042 5189
4986
Solución

Distribución de Frecuencias

Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa


4000  x < 4200 1 0.01 5000  x < 5200 22 0.22
4200  x < 4400 3 0.03 5200  x < 5400 20 0.20
4400  x < 4600 9 0.09 5400  x < 5600 7 0.07
98

4600  x < 4800 12 0.12 5600  x < 5800 7 0.07


4800  x < 5000 18 0.18 5800  x < 6000 1 0.01
Totales 100 1.00

El histograma presenta cierta simetría y poca dispersión.

26. La concentración de sólidos en agua de río es una característica ambiental importante.


Un artículo científico reportó sobre la concentración (en partes por millón, o ppm) en
varios ríos diferentes. Supongamos que se obtuvieron las siguientes 50 observaciones
para un río en particular:

55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3

a. Construya un diagrama de tallo y hoja


b. ¿Porqué una distribución de frecuencias no puede basarse en los intervalos de clase
0 – 10, 10 – 20, 20- 30,…, 90 – 100?
c. Construya una distribución de frecuencias con intervalos de clase 20 - <30, 30 -
<40,…, 90 - < 100.
d. ¿Qué proporción de las observaciones de concentración fue menor de 50?, y ¿por
lo menos 60?
Solución:
a.
2 7 Tallo: decenas
3 01356799 Hojas: unidades y décimos
4 02457789
5 256689
6 0001112455568999
7 1145678
8 37
9 14
99

b. Porque serían muchos intervalos para el número de datos y además no se puede


tomar el mismo número en dos intervalos distintos.
c. Distribución de frecuencias

Intervalo Frecuencia Intervalo Frecuencia


20 x < 30 1 60 x < 70 16
30 x < 40 8 70 x < 80 7
40 x < 50 8 80 x < 90 2
50 x < 60 6 90 x < 100 2
Totales 23 Totales 27

d. La proporción de concentración menor que 50 es:


p = 17/50 = 0.34 o p = 34%
La proporción de por lo menos 60 es el número de datos mayores o iguales a 60
p = 27/50 = 0.54 o p = 54%

27. Se obtuvieron quince muestras de aire de determinada región y se determinó la


concentración de monóxido de carbono en cada una. Los resultados, en ppm fueron
los siguientes:
9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1
9.8
a. Construya un diagrama de tallo y hojas con los datos
b. Comente sus observaciones sobre los dados (simetría, dispersión, valores
representativos y atípicos, etc.)
c. Trace un histograma con la frecuencia relativa en el eje vertical
d. ¿Cómo describiría la forma del histograma?
Solución:
a. y b. Tallo y hoja de la concentración de CO N = 15
Unidad de hoja = 0.10

8 58 - No tiene simetría
9 02368 - Presenta dispersión
10 57 - El valor representativo es el 9
11 0 - Presenta un hueco
12 12 - Un posible valor atípico es el 15.6
13 27
14
15 6

c.
100

d. El histograma no tiene simetría


Presenta sesgo positivo

28. La distribución adjunta de frecuencias en mediciones de resistencia a la fractura (en


MPa) para barras de cerámica quemadas en un horno, apareció en el artículo
“Evaluating Túnel Kiln Performance” ( Amer. Ceramic Soc. Bull., agosto de 1997,
pp. 59 -63)

clase frecuencia clase frecuencia


81≤ x < 83 6 91 ≤ x < 93 28
83 ≤ x < 85 7 93 ≤ x < 95 22
85 ≤ x < 87 17 95 ≤ x < 97 13
87 ≤ x < 89 30 97 ≤ x < 99 3
89 ≤ x < 91 43

a. Trace un histograma de frecuencias relativas y comente sus propiedades


interesantes.
b. ¿Qué proporción de las observaciones son menores de 85? Y ¿menores de 95?
c. Aproximadamente, ¿qué proporción de las mediciones fueron menores que 90?
Solución:
101

a.

- Tiene bastante
simetría, poca dispersión es unimodal
n
b. p  N = Número total de datos, por tanto la proporción de observaciones
N
menores
13
que 85 es p   0.0769 o 7.69%
169
153
la proporción de observaciones menores que 95 es: p   0.9053 o 90.53%
169
103
c. Aproximadamente p   0.6094 o 60.94%
169

29. La carga de fuego (MJ/m2) es la energía calorífica que puede liberarse por metro
cuadrado de área de piso por combustión del contenido y de la estructura misma de
un recinto. El artículo “Fire Loads in Office Buildings” (J. of Structural Engr., 1997,
365 – 368) presenta los siguientes porcentajes acumulados, leídos en un gráfica, de
cargas de fuego en un muestra de 388 recintos:

frec. relativa frec. relativa


valor valor
acumulada acumulada
0 0 1050 0.957
150 0.193 1200 0.986
300 0.376 1350 0.991
450 0.627 1500 0.995
600 0.775 1650 0.996
750 0.872 1800 0.998
900 0.938 1950 1.000
d. Trace un histograma de frecuencia relativa y comente sus características
interesantes.
e. ¿Qué proporción de cargas de fuego son menores de 600? ¿Por lo menos 1200?
f. ¿Qué proporción de las cargas están entre 600 y 1200?
Solución
102

a.

El histograma presenta sesgo positivo y cierta dispersión, el valor representativo se


encuentra entre los 400 y 450.
n
b. p  N = Número total de datos, pero de los datos proporcionados en la tabla
N
se puede obtener la información, por tanto la proporción de cargas de fuego menores
que 600 es: p = 0.775. Por lo menos 1200: p = 1 – 0.986 = 0.014
c. La proporción entre 600 y 1200 es: p = 0.986 – 0.775 = 0.211

30. El período de almacén (vida de anaquel) de una película fotográfica de alta velocidad
está siendo investigada por un fabricante. Se dispone de los siguientes datos:

Vida Vida Vida Vida Vida Vida Vida Vida


(días) (días) (días) (días) (días) (días) (días) (días)
125 120 140 127 121 121 141 121
127 121 125 130 127 126 147 124
140 142 124 131 128 124 150 131
135 151 122 141 134 125 132 141
126 160 121 137 140 127 143 127

Construya un histograma y comente las propiedades de los datos.


Solución:
103

El histograma no tiene simetría, su valor representativo esta entre 125 y 130 y presenta
una ligera dispersión.

31. La cantidad de radiación recibida en un invernadero juega un papel importante para


determinar la cantidad de fotosíntesis. Las observaciones sobre radiación solar
entrante se leyeron de una gráfica del artículo “Radiation Components over Bare and
Planted Soils in a Greenhouse” (Solar Energy, 1990, pp. 1011 – 1016):

6.3 6.4 7.7 8.4 8.5 8.8 8.9 9.0 9.1 10.0 10.1 10.2
10.6 10.6 10.7 10.7 10.8 10.9 11.1 11.2 11.2 11.4 11.9 11.9
12.2 13.1

Utilice algunos de los métodos estudiados para describir estos datos.


Solución:
Tallo y hoja de la cantidad de radiación N = 26
Unidad de hoja = 0.10

6 34 - El diagrama tiene cierto sesgo negativo


7 7 - No presenta huecos
8 4589 - El valor representativo está en 10
9 01 - No presenta valores atípicos
10 012667789
11 122499
12 2
13 1
104

Tanto el diagrama de caja como el histograma reafirman las características que se


observaron en el diagrama de tallo y hoja

32. Considere los siguientes datos sobre tiempo activo de reparación (en horas) para una
muestra n = 46 receptores de comunicaciones en aeronaves:

0.2 0.3 0.5 0.5 0.5 0.6 0.6 0.7 0.7 0.7 0.8 0.8 0.8
1.0 1.0 1.0 1.0 1.1 1.3 1.5 1.5 1.5 1.5 2.0 2.0 2.2
2.5 2.7 3.0 3.0 3.3 3.3 4.0 4.0 4.5 4.7 5.0 5.4 5.4
7.0 7.5 8.8 9.0 10.3 22.0 24.5

Construya lo siguiente:
a. Un diagrama de tallo y hoja en la que los dos valores más grandes se representarán
en forma separada en un renglón llamado HI.
b. Un histograma basado en seis intervalos de clase con cero como límite inferior del
primer intervalo y longitudes de intervalo de 2, 2, 2, 4, 10 y 10, respectivamente.

Solución:

a. Tallo y hoja del tiempo activo de reparación N = 46


Unidad de hoja = 0.10

0 2355566777888
1 0000135555
2 00257
3 0033
4 0057
5 044
6
7 05
8 8
9 0
10 3
HI 05

33. Se determinó el índice de claridad para los cielos sobre Bagdad para cada uno de los
365 días durante un determinado año (“Contribution to the Study of the Solar
105

Radiation Climate of the Baghdad Environment”, Solar Energy, 1990: 7 – 12). En la


tabla siguiente se dan los resultados.

clase Frecuencia
0.15-< 0.25 8
0.25- < 0.35 14
0.35 - < 0.45 28
0.45 - < 0.50 24
0.50 - < 0.55 39
0.55 -< 0.60 51
0.60 - < 0.65 106
0.65 - < 0.70 84
0.70 - < 0.75 11

d. Determine las frecuencias relativas y trace el histograma correspondiente.


e. Los días nublados son los que tienen un índice de claridad más pequeño que 0.35.
¿Qué porcentaje de los días fueron nublados?
f. Los días claros son aquellos para los que el índice es por lo menos 0.65. ¿Qué
porcentaje de los días fueron claros?
Solución:
a.

Frecuencia
clase
relativa
0.15-< 0.25 0.022
0.25- < 0.35 0.038
0.35 - < 0.45 0.077
0.45 - < 0.50 0.066
0.50 - < 0.55 0.107
0.55 -< 0.60 0.140
0.60 - < 0.65 0.290
0.65 - < 0.70 0.230
0.70 - < 0.75 0.030
106

b. La proporción de días nublados son los que tienen un índice de claridad menor que
0.35
8 4
Entonces p   0.06 o p = 6%
365
c. Los días con claridad son aquellos de por lo menos un índice de 0.65, entonces
84  11
p  0.26 o p = 26%
365

34. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture,
2002: 301- 305) aparecen las observaciones siguientes, listadas en orden creciente,
del tiempo de vida del taladro (número de agujeros que maquina un taladro antes de
romperse) cuando se hacen agujeros en cierta aleación de latón.

11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513

a. ¿Por qué no se puede basar una distribución de frecuencias en los intervalos de


clase 0 -50, 50 – 100, 100 – 150, etc.?
b. Construya una distribución de frecuencias y un histograma con los datos usando
los límites de clase 0, 50, 100, …, y comente acerca de las características
interesantes.
c. Construya una distribución de frecuencias e histograma de logaritmos naturales de
las observaciones de tiempo de vida media y comente acerca de las características
interesantes.
d. ¿Qué proporción de las observaciones de tiempo de vida de la muestra son menores
que 100? ¿Qué proporción de las observaciones son por lo menos 200?
Solución:
a. Porque una cantidad no puede pertenecer a dos intervalos y en este caso, el 50 -
100, etc.
Pertenecerían a dos intervalos.
b.
107

Frecuencia
Intervalos Frecuencia
relativa
0  x < 80 20 0.40
80  x < 160 20 0.40
160  x < 240 4 0.08
240  x < 320 3 0.06
320  x < 400 2 0.04
400  x < 480 0 0.00
480  x < 540 1 0.02
Totales 50 1.00

Un valor representativo está entre 50 y 100, hay mucha variabilidad en los datos y

35. Construya un diagrama de puntos y dígitos para la serie de tiempo adjunta. Los datos
son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la
radiación solar promedio en la banda de 385 a 530 nm como porcentaje de la radiación
total (“Global Energy in the Different Spectral Bands at Dhanhran, Saudi Arabia”, J.
Solar Energy Engr. 1991: 290 294). Comente acerca de las características de los datos.

20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9

Solución:

Presenta cierta simetría, el valor representativo está entre 19 y 19.5 no parece haber
valores atípicos.
108

36. Un diagrama de Pareto es una variación de un histograma con datos categóricos que
resultan de un estudio de control de calidad. Cada categoría representa un tipo
diferente de producto que incumple las especificaciones o problema de producción.
Las categorías están ordenadas de modo que las que tienen la frecuencia más grande
aparezcan en el extremo izquierdo, luego la categoría con la segunda frecuencia mas
grande y así sucesivamente. Suponga que se obtiene la siguiente información sobre
discordancia en paquetes de circuitos componentes con fallas, 126; componente
incorrecto, 210; soldadura insuficiente, 67; exceso de soldadura, 54; componente
faltante, 131. Construya un diagrama de Pareto.

Solución

Componente con fallas 126


Componente incorrecto 210
Soldadura insuficiente 67
Exceso de soldadura 54
Componente faltante 131
109

109109ESTIMACION PUNTUAL

1. Se dan siguientes datos de resistencia a la flexión (en MPa) de vigas de concreto de cierto tipo
5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0
8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7

a. Calcule un estimado puntual del valor medio de resistencia para la población conceptual
de todas las vigas fabricadas de esta forma y diga que estimador usó. (Sugerencia:  xi =
219.8).
b. Calcule un estimador puntual del valor de la resistencia que separa al 50% más débil de las
vigas, del 50% más fuerte y diga que estimador usó
c. Calcule e interprete un estimado puntual de la desviación estándar poblacional . ¿Qué
estimador usó? (Sugerencia:  xi2 = 1860.94).
d. Calcule un estimado puntual de la proporción de las vigas cuya resistencia a la flexión es
mayor que 10 MPa. (Sugerencia: imagine que una observación es un “éxito” si es mayor
de 10).
e. Calcule un estimado puntual del coeficiente poblacional de variación,  /  y diga que
estimador usó.
Solución:
a. Usando la media muestral x para estimar la media poblacional , tenemos:
219.8
ˆ  x   8.14074
27
b. En este caso se puede usar la mediana muestral y se obtiene: x  7.7
c. Usando la desviación estándar de la muestra:

s 
2  xi2  ( xi ) 2 / n
, s2 
1860.94  (219.8)2 / 27
 2.754
n 1 26
s  2.754  1.659, ˆ  s  1.659
d. Con los datos dados, se observa que el número de observaciones mayores que 10 es x = 4,
por lo que podemos usar como estimador de la proporción;
x 4
pˆ  , pˆ   0.1481
n 27
e. Para estimar el coeficiente poblacional podemos usar la desviación estándar muestral y la
media muestral y tenemos:
 ˆ  s 1.659
    0.2038
   x 8.14074

2. La muestra de 20 estudiantes, quienes recientemente tomaron un curso de estadística


elemental, dio la siguiente información sobre la marca de calculadora que tenían (T = Texas
Instruments, H = Hewlett- Packard, C = Casio, S = Sharp):

T T H T C T T S C H
S S T H C T T T H T
b. Estime la verdadera proporción de todos los estudiantes que tengan calculadora Texas
Instruments.
c. Algunas calculadoras fabricadas por Hewlett-Packard utilizan lógica polaca inversa
(ningún otro fabricante produce calculadoras de ese tipo). Tres de cuatro calculadoras HP
en la muestra fueron de ese tipo. Estime la proporción de todos los estudiantes que poseen
calculadora sin lógica polaca inversa.
Solución:
a. Se observa que en la muestra hay 10 estudiantes con calculadora Texas, el estimador será:
x 10
pˆ  , pˆ   0.50
n 20
110

b. El número de estudiantes que no poseen calculadora con lógica polaca inversa son 17, ya
que sólo tres la poseen, entonces esta proporción la podemos estimar como:
x 17
pˆ  , pˆ   0.85
n 20

3. Examine la siguiente muestra de observaciones de espesor de pintura de baja viscosidad (“


Achieving a Target Value of Manufacturing Process: A Case Study”, J. of Quality
Technology, 1992, pp 22 – 26):

0.83 0.88 0.88 1.04 1.09 1.12 1.29 1.31


1.48 1.49 1.59 1.62 1.65 1.71 1.76 1.83

Suponga que la distribución de espesores de pintura es normal (una gráfica de probabilidad


normal respalda esta hipótesis).
a. Calcule un estimado puntual del valor promedio del espesor de pintura y diga que
estimador usó.
b. Calcule un estimado puntual de la mediana de la distribución de espesores de pintura y
diga que estimador usó.
c. Calcule un estimado puntual del valor que separa 10% de los valores más altos de
espesores, del restante 90%, y diga que estimador usó. [Sugerencia: exprese lo que trata
de estimar en términos de μ y de σ.]
d. Estime P(X < 1.5), es decir la proporción de todos los valores de espesor menores que 1.5.
[Sugerencia: si conociera los valores de μ y σ, podría calcular esta probabilidad. Estos
valores no están disponibles pero se pueden estimar.]
e. ¿Cuál es el error estándar estimado del estimador que usó en el inciso (b)?
Solución:
Estadísticas descriptivas: Espesor de pintura

N Media Desv.Est. Mínimo Q1 Mediana Q3 Máximo


16 1.3481 0.3385 0.8300 1.0525 1.3950 1.6425 1.8300

a. x  1.3481 se usó la media muestral


b. Si se supone que la distribución es normal, la media y la mediana son iguales por tanto
  1.3481
c. Usando el 90 percentil de la distribución normal: ˆ  1.28 ˆ  x  (1.28)s
90 percentil  1.3481  (1.28)(0.3385)  1.7814
d. Suponiendo la distribución normal,
 1.5  x   1.5  1.3481 
P( X  1.5)  P  Z    P Z    (0.4487)  0.6736
 s   0.3385 
P( X  1.5)  0.6736
ˆ s 0.3385
e. El error estándar de la media es x     0.0846
n n 16

4. El artículo de donde se tomaron los datos del ejercicio 1 también mostraba las siguientes
observaciones de resistencia de los cilindros:

6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2

Antes de obtener datos, se representan las resistencias de las vigas por X1,…, Xm y las de los
cilindros por Y1,…, Yn. Suponga que las Xi forman una muestra aleatoria de la distribución con
111

media μ1 y desviación estándar σ1, y las Yi forman una muestra aleatoria, independiente de las
Xi, de otra distribución cuya media es μ2 y desviación estándar σ2.

a. Aplique las reglas del valor esperado para demostrar que X  Y es un estimador
insesgado de μ1 – μ2 . Calcule el estimado para los datos.
b. Aplique las reglas de la varianza y la desviación estándar (error estándar) del estimador
del inciso a), y a continuación calcule el error estándar estimado.
c. Calcule un estimado puntual de la relación σ1 /σ2 de las dos desviaciones estándar.
d. Suponga que se seleccionan una sola viga y un solo cilindro. Calcule un estimado puntual
de la varianza de la diferencia X – Y entre la resistencia de las vigas y la de los cilindros.

Solución:

Estadísticas descriptivas: Resistencia de los cilindros

N Media Desv.Est. Mínimo Q1 Mediana Q3 Máximo


20 0 8.575 2.104 5.800 7.125 8.200 9.575 14.100

a. E ( X  Y )  E ( X )  E (Y )  1  2 ; x  y  8.1407  8.275  0.434


b.
 12  22
V ( X  Y )  V ( X )  V (Y )   X2   Y2  
n1 n2
 12  22
 X Y  V ( X  Y )  
n1 n2
Un estimador podría ser usando la desviación estándar muestral, esto es:

s12 s22 1.662 2.1042


s X Y      0.5687
n1 n2 27 20

s1 1.66
c.   0.7890
s2 2.104
d.
V ( X  Y )  V ( X )  V (Y )  s12  s22
V ( X  Y )  1.662  2.1042  7.1824

5. Como ejemplo de una situación donde se podrían utilizar razonablemente diferentes


estadísticas para calcular una estimación puntual, considere una población de N facturas.
Relacionado con cada factura está su “valor en libros”, que es la cantidad registrada de esa
factura. Represente con T el valor total en libros, que es una cantidad conocida. Algunos de
estos valores en libros son erróneos. Se llevara a cabo una auditoria al seleccionar al azar n
facturas y determinar el valor auditado (correcto) de cada una. Suponga que la muestra
proporciona los siguientes resultados (en dólares).

Factura
1 2 3 4 5
Valor en libros 300 720 526 200 127
Valor auditado 300 520 526 200 157
Error 0 200 0 0 - 30
112

Sea
Y  valor medio muestral en libros
X  valor medio muestral auditado
D  error medio muestral

Se han propuesto diferentes estadísticas para estimar el valor total auditado (correcto). Estos
incluyen:
Estadística de media por unidad = N X
Estadística de diferencia = T  N D
Estadística de razón = T  ( X Y )

Si N = 5000 y T = 1 761 300, calcule las tres estimaciones puntuales correspondientes. (El
artículo “Statistical Models and Analysis in Auditing”, Statistical Science, 1982: 2 -33, discute
las propiedades de estos estimadores.)
Solución:
Con N = 5000, T = 1 761 300, y  374.6 , x  340.6 y d  34 llamemos:
x
ˆ1  Nx , ˆ2  T  Nd , ˆ3  T  
y
ˆ1  (5000)(340.6)  1703000 ˆ1  1703000
ˆ2  1761300  (5000)(34)  1591300 ˆ2  1591300
 340.6 
ˆ3  1761300    1601438.281 ˆ3  1601438.281
 374.6 

6. Considere las siguientes observaciones efectuadas en un flujo de corriente (miles de acres –


pies) registradas en una estación en Colorado para el período del 1º de Abril al 31 de agosto
durante un período de 31 años (de un artículo del volumen de 1974, Water Resources
Research).

127.96 210.07 203.24 108.91 178.21 285.37 100.85 89.56 185.36


126.94 200.19 66.24 274.11 299.87 109.64 125.86 114.79 109.11
330.33 85.54 117.64 302.74 280.55 145.11 95.36 204.91 311.13
150.58 262.09 477.08 94.33

Una gráfica apropiada de probabilidad apoya el uso de la distribución lognormal como un


modelo razonable para el flujo de corriente.

a. Estime los parámetros de la distribución. [Sugerencia: recuerde que X tiene una


distribución lognormal con parámetros  y 2 si ln(X) está normalmente distribuida con
media  y varianza 2.]
b. Utilice las estimaciones del inciso (a) para calcular una estimación del valor esperado del
caudal. [Sugerencia: ¿cuál es E(X)?]
Solución:
a. Si hacemos yi  ln xi para i = 1, 2, 3,…,31 tenemos:
4.8517 5.3474 5.3144 4.6905 5.1829 5.6538 4.6136 4.4949 5.2223
4.8437 5.2992 4.1933 5.6135 5.7033 4.6972 4.8352 4.7431 4.6923
5.8000 4.4490 4.7676 5.7129 5.6368 4.9775 4.5576 5.3226 5.7402
5.0145 5.5687 6.1677 4.5468
Ahora hallando la media y la desviación estándar de la muestra transformada, tenemos
113

y  5.1049, s y  0.4992 , por tanto tenemos que el estimado de la media y la desviación


estándar son: ˆ  5.1049, ˆ  0.4992 ˆ 2 ?0.2492
b. Para una distribución lognormal E ( X )  e 
2
/2
, usando los valores obtenidos en el inciso
(a)
E ( Xˆ )  e5.1049  0.2492/ 2  186.67

6. a. Se selecciona una muestra aleatoria de 10 casas de una zona en particular, cada una tiene
calefacción con gas natural y se determina la cantidad de gas (termias, es decir, 25200 calorías)
empleadas durante el mes de enero para cada casa. Las observaciones resultantes son las
siguientes: 103, 156, 118, 89, 125, 147, 122, 109, 138, 99. Represente con  el consumo
promedio de gas durante enero por todas las casas de la zona. Calcule una estimación puntual
de .
b. Suponga que 10 000 casas de esta zona utilizan gas natural para la calefacción. Represente
con  la cantidad de gas total empleada por todas estas casas durante enero. Estime 
mediante los datos del inciso (a). ¿Cuál estimador usó en el cálculo de su estimación?
c. Utilice los datos del inciso (a) para estimar p, la proporción de todas las casas que utilizaron
por lo menos 100 termias.
d. De una estimación puntual de la mediana de la población del consumo (el valor intermedio
de la población de todas las casas) con base en la muestra del inciso (a). ¿Cuál estimador
usó?
Solución:

a. ˆ  x 
 xi  1206  120.6 ˆ  120.6
n 10
b. ˆ  nx  10000(120.6)  1206000
c. Los que utilizan por lo menos 100 termias son 8, así que estimando la proporción tenemos:
8
pˆ   0.80
10
d. Ordenando los valores en orden ascendente tenemos:
89 99 103 109 118 122 125 138 147 156
118  122
El estimador de la mediana puede ser la mediana muestral, esto es: ˆ   120
2

7. En una muestra aleatoria de 80 componentes de cierto tipo, 12 se encontraron defectuosos.


a. Dé una estimación puntual de la proporción de todos los componentes que no están
defectuosos.
b. Se va a construir un sistema para seleccionar al azar dos de estos componentes y conectarlos
en serie, como se muestra en la figura

La conexión en serie implica que el sistema funcionará si y solo si ninguno de los


componentes está defectuoso (es decir, ambos componentes funcionan correctamente).
Estime la proporción de todos los componentes que funcionan correctamente. [Sugerencia:
si p representa la probabilidad de que un componente funciona correctamente, ¿cómo se
puede expresar P (sistema funciona) en términos de p?]
Solución:
a. Los componentes que no están defectuosos son 68, así la estimación de la proporción de
estos es:
68
pˆ   0.85
80
114

b. P(sistema funcione) = P( A1  A2 )  P( A1 ) P( A2 )  p 2 , Así que una estimación de esta


probabilidad es: pˆ 2  (0.85)2  0.7225

8. Se examina cada pieza de 150 recién fabricadas y se registra el número de rayones por pieza
(se supone que las piezas no deben tener rayones) y resultan los siguientes datos:

Número de
0 1 2 3 4 5 6 7
rayones por pieza
Frecuencia
18 37 42 30 13 7 2 1
observada

Sea X = número de rayones en una pieza seleccionada al azar y suponga que X tiene una
distribución de Poisson con parámetro .
a. Encuentre un estimador insesgado de  y calcule la estimación para los datos anteriores.
[Sugerencia: E(X) =  para X de Poisson, por lo que E  ( X ) ]
b. ¿Cuál es la desviación estándar (error estándar) de su estimador? Calcule el error estándar
estimado. (Sugerencia:  X2   para X de Poisson.)
Solución:
a. Ya que E ( X )    E( X )   , entonces X es un estimador insesgado para el parámetro de
Poisson . Calculando la media de los datos tenemos:

x
 fi ( xi )  317  2.113 ˆ  2.1143
 fi 150
b. Para el error estándar tenemos que  ˆ  V (ˆ) , en este caso:

X  así que el estimado del error estándar de  es:
n
ˆ 2.113
 ˆ    0.1187
n 150

10. Con una larga varilla de longitud  se va a trazar una gráfica cuadrada en la cual la longitud
de cada lado es . Por consiguiente el área de la gráfica será 2. Sin embargo, no se conoce el
valor de  así que se decide hacer n mediciones independientes X1 , X 2 ..., X n de la longitud.
Suponga que cada Xi tiene una media  (mediciones insesgadas) y varianza 2.
a. Determine que X 2 no es un estimador insesgado de 2. [Sugerencia: con cualquier variable
aleatoria Y, E (Y 2 )  V (Y )   E (Y ) . Aplique ésta con Y  X .]
2

b. ¿Para que valor del estimador X 2  kS 2 , k es insesgado para 2? [Sugerencia: calcule
E ( X 2  kS 2 ) ]
Solución:
a. Usando la sugerencia, tenemos:
2 2
E ( X 2 )  V ( X )   E ( X )     2 , se observa que el estimador X 2 tiende a
n
2
sobrevalorar a 2 por la presencia del término , por tanto no es un estimador insesgado.
n
b. Aplicando las reglas del valor esperado, tenemos:
2 1
E ( X 2  kS 2 )  E ( X 2 )  kE ( S 2 )   2   k 2 , así con k tenemos
n n
E ( X 2  kS 2 )   2
115

11. De n1 fumadores seleccionados al azar, X1 fuman cigarrillos con filtro, mientras que de n2
fumadoras seleccionadas al azar, X2 fuman cigarrillos con filtro. Sean p1 y p2 las probabilidades
de que un varón y una mujer seleccionados al azar fumen, respectivamente, cigarrillos con
filtro.
a. Demuestre que  X1 / n1    X 2 / n2  es un estimador insesgado de p1  p2 . [Sugerencia:
E ( X i )  npi con i = 1, 2.]
b. ¿Cuál es el error estándar del estimador en el inciso (a)?
c. ¿Cómo utilizaría los valores x1 y x2 para estimar el error estándar del estimador?
d. Si n1 = n2 = 200, x1 = 127 y x2 = 176, use el estimador del inciso (a) para obtener una
estimación de p1  p2 .
e. Use el resultado del inciso (c) y los datos del inciso (d) para estimar el error estándar del
estimador.
Solución:
a.
X X  1 1 1 1
E  1  2   E ( X 1 )  E ( X 2 )  n1 p1  n2 p2  p1  p2
 n1 n2  n1 n2 n1 n2
X X 
 E  1  2   p1  p2
 n1 n2 
b.

2 2
X X  X  X  1  1 1 1
V  1  2   V  1   V  2     V ( X 1 )    V ( X 2 )  2 (n1 p1q1 )  2 (n2 p2 q2 )
 n1 n2   n1   n2   n1   n2  n1 n2
p1q1 p2 q2 p1q1 p2 q2
    p1  p2  
n1 n2 n1 n2
c.
x1 x2
Con pˆ1  , qˆ1  1  pˆ1 , pˆ 2  , qˆ2  1  pˆ 2 , el error estándar del estimador es :
n1 n2
pˆ1qˆ1 pˆ 2 qˆ2
 p1  p2 

n1 n2
d. Con n1 = n2 = 200, x1= 127 y x2 = 176

127 176
pˆ1  pˆ 2    0.635  0.880  0.245
200 200
e.
pˆ1qˆ1 pˆ 2 qˆ2 (0.635)(0.365) (0.880)(0.120)
 p1  p2      0.041  p1  p2  0.041
n1 n2 200 200

12. Suponga que un tipo de fertilizante rinde 1 por acre con una varianza 2, mientras que el
rendimiento esperado de un segundo tipo de fertilizante es 2, con la misma varianza 2. Sean
S12 y S22 las varianzas muestrales de los rendimientos basadas en tamaños muestrales n1 y n2,
respectivamente, de los dos fertilizantes. Demuestre que el estimador combinado

(n1  1) S12  (n2  1) S22


ˆ 2 
n1  n2  2
es un estimador insesgado de 2
Solución:
116

  n1  1 S12   n2  1 S 22   n1  1  n2  1
E
   E ( S12 )  E ( S 22 )
 n1  n2  2  n1  n2  2 n1  n2  2


 n1  1  2   n2  1  2   n1  1  n2  1  2   2
 
n1  n2  2 n1  n2  2  n1  n2  2 
  n  1 S12   n2  1 S 22 
E 1   
2
 n  n  2
 1 2 

13. Considere una muestra aleatoria X1 , X 2 ..., X n de la función de densidad de probabilidad

f ( x; )  0.5(1   x) 1  x  1

donde – 1    1 (esta distribución se presenta en la física de partículas). Demuestre que


ˆ  3X es un estimador insesgado de . [Sugerencia: primero determine   E( X )  E ( X )
.]
Solución:
1  x2  x3   1 1  
1 1
1 
      1  (1)  
1
E ( X )   x  (1   x)dx   
1 2 2  2 1 3 1   4 4  6 3
 
1 1
E( X )   , E ( X )   , puesto que ˆ  3 X , entonces E (ˆ)  E (3 X )  3E ( X )
3 3
1
E (ˆ)  3     por tanto es un estimador insesgado
 3

14. Si X1 , X 2 ..., X n representa una muestra aleatoria tomada de una distribución de Rayleigh con
función de densidad de probabilidad

x /(2 )
f ( x; ) 
2
e x x0

a. Se puede demostrar que E ( X 2 )  2 . Use este hecho para construir un estimador
n
insesgado de  basado en X i 1
i
2
(y use las reglas del valor esperado para demostrar que es

insesgado).
b. Calcule  a partir de las siguientes n = 10 observaciones de esfuerzo vibratorio de un aspa
de turbina en condiciones específicas:

16.88 10.23 4.59 6.66 13.68 14.23 19.87 9.40 6.51 10.95
Solución:
 X2 
a. E ( X )  2 , esto implica que E 
2 ˆ
   . Considerando  
 X i2
, entonces tenemos
 2  2n
que:
  X i2  1  2  2n  
 2n  2n  i
E (ˆ)  E   E
1
2n

X 2   E ( X i2 ) 
2n 2n

 
Con esto se demuestra que ˆ es un estimador insesgado para .

15. Suponga que el crecimiento promedio verdadero  de un tipo de planta durante un período de
1 año es idéntico al de un segundo tipo, aunque la varianza del crecimiento del primer tipo es
117

2, en tanto que para el segundo es 42. Sean X1 , X 2 ..., X m m observaciones de crecimiento
independientes del primer tipo [por consiguiente E ( X i )   , V ( X i )   2 ], y sean Y1 , Y2 ..., Yn
n observaciones de crecimiento independientes del primer tipo [por consiguiente
E (Yi )   , V (Yi )  4 2 ].
a. Demuestre que para cualquier  entre 0 y 1, el estimador ˆ   X  (1   )Y es insesgado
para  .
b. Con m y n fijas, calcule V ( ˆ ) y luego determine el valor de  que reduzca al mínimo
V ( ˆ ) . [Sugerencia: diferencie V ( ˆ ) con respecto a .]
Solución:
a. E  X  (1   )Y    E ( X )  (1   ) E(Y )    (1   )  
b.

 2 2
4(1   )2  2 2 4(1   )2
V  X  (1   )Y    2V ( X )  (1   )2 V (Y )   , V ( ˆ )  
m n m n
Para hallar el mínimo de V ( ˆ ) , derivemos con respecto a  la expresión e igualemos a cero
d 2 2 8(1   ) 2
V (ˆ )    0, despejando a  2n  8m  8m
d m n
4m
(8m  2n)  8m  
4m  n

16. Anteriormente se definió la variable aleatoria binomial negativa como el número de fallas que
ocurren antes del r – ésimo éxito en una secuencia de ensayos con éxitos y fallos
independientes e idénticos. La función de masa de probabilidad (fmp) de X es

 x  r  1 r
nb( x; r , p)    p (1  p)
x
x  0,1,2,...
 x 
r 1
a. Suponga que r  2. Demuestre que pˆ  es un estimador insesgado de p.
X  r 1
[Sugerencia: Escriba E ( pˆ ) y elimine x + r – 1 dentro de la suma.]
b. Un reportero desea entrevistar a cinco individuos que apoyan a un candidato y comienzan
preguntándoles si (S) o no (F) apoyan al candidato. Si la secuencia de respuestas es
SFFSFFFSSS, estime p = la proporción verdadera que apoya al candidato.
Solución:
a.


 r  1   x  r  1 r 
r 1 ( x  r  1)!
E ( pˆ )      x   p (1  p)  
x
  p r (1  p) x
x 0  x  r  1    x  0 x  r  1 x !( x  r  1  x )!
r 1

( x  r  2)! r 
( x  r  2)! r 1 
 x  r  2
  p (1  p) x  p   p (1  p) x  p    p r 1 (1  p) x
x  0 x !( r  2)! x  0 x !( r  2)! x 0  x 

E ( pˆ )  p  bn( x; r  1, p)  p
x 0
b. Para la secuencia de resultados dada, tenemos que x = 5 y r = 5, estimando el valor de p
5 1 4
pˆ    0.444 pˆ  0.444
5  5 1 9
118

17. Sean X1 , X 2 ..., X n una muestra aleatoria de densidad de probabilidad f(x) que es simétrica
respecto a , de modo que X es un estimador insesgado de . Si n es grande se puede

demostrar que V ( X )  1/ 4n  f (  ) .
2

a. Compara V ( X ) con V ( X ) cuando la distribución subyacente es normal.
b. Cuando la función de densidad de probabilidad subyacente es de Cauchy, V ( X )   , por
lo tanto X es un estimador terrible. ¿Cuál es V ( X ) en este caso cuando n es grande?
Solución:
a. Para una distribución normal, la función de densidad es:
1  ( x   )2 / 2 2 
f ( x;  , )  e así que si x   , tendremos que:
2

1 1 2 2   2
f (  ;  , )  y por tanto sustituyendo   
2 4n  f (  ) 
2
4n 2 n

Ya que  1, V ( X )  V ( X )
2
b. La función de distribución de Cauchy es:
1
f ( x)     x   , esta es una distribución simétrica con respecto
 1  ( x   )2 
a , tiene forma de campana pero con colas mucho más gruesas que la distribución normal,
así
f ( ) 
1

 
y como V ( X )  1/ 4n  f (  ) , entonces V ( X ) 
2 2
4n

INTERVALOS DE CONFIANZA

1. Considere una distribución de población normal con el valor de σ conocido.


a. ¿Cuál es el nivel de confianza para el intervalo x  2.81 / n
b. ¿Cuál es el nivel de confianza para el intervalo x  1.44 / n
c. ¿Cuál valor de zα /2 en la fórmula del intervalo de confianza resulta en un nivel de confianza
de 99.7%?
d. Responda la pregunta del inciso c) para un nivel de 75%
Solución:
a. Para una población con distribución normal un intervalo de confianza para la media con
nivel de confianza 100(1 )% está dado por:

    
 x  z / 2  , x  z / 2   o bien x  z / 2  , entonces tenemos que z / 2  2.81
 n n n
Esto implica que:
z / 2  1  (2.81)  1  0.9975  0.0025 así  = 0.005 y el nivel de confianza es
100(1 0.005) = 95%
b. z / 2  1.44 esto implica que:
z / 2  1  (1.44)  1  0.9251  0.0749 así  = 0.1498 y el nivel de confianza es
100(1 0.1498) = 85.02%  85%

c. Del nival de confianza 100(1 )% = 99.7,  = 1  0.997 = 0.003  / 2  0.0015


Por tanto z / 2  2.96
119

d. Del nival de confianza 100(1 )% = 75,  = 1  0.75 = 0.25  / 2  0.125


Por tanto z / 2  1.15

2. Cada uno de los siguientes es un intervalo de confianza de μ = promedio real (es decir media
poblacional) de la frecuencia de resonancia, en Hz, de todas las raquetas de tenis de cierto
tipo:

(114.4, 115.6) (114.1, 115.9)

a. ¿Cuál es el valor de la frecuencia de resonancia media muestral?


b. Ambos intervalos fueron calculados con los mismos datos de muestra. El nivel de confianza
de uno de estos intervalos es 90% y para el otro 99%, ¿Cuál de ellos tiene el nivel de
confianza de 90% y por qué?
Solución:
a. La media de la muestra está en el centro del intervalo, por tanto:
114.4  115.6
x  115 x  115
2
b. El que tiene nivel de confianza de 90% es (114.4, 115.6) porque tiene un nivel de confianza
menor y esto produce un intervalo menos ancho. Entre mayor sea el nivel de confianza el
ancho del intervalo es mayor.

3. Suponga que se selecciona una muestra aleatoria de 50 botellas de una marca de jarabe para
la tos, en particular, y que se determina el contenido de alcohol de cada frasco. Sea μ el
contenido promedio de alcohol en la población de todos los frascos de la marca que se estudia.
Suponga que el intervalo de confianza de 95% resultante es (7.8, 9.4).
a. Un intervalo de confianza de 90% calculado para la misma muestra, ¿sería más angosto o
más ancho que el anterior? Explique su razonamiento.
b. Examine la siguiente afirmación: hay 95% de probabilidades de que μ esté entre 7.8 y 9.4.
¿Es correcta esta afirmación? ¿Por qué sí o por qué no?
c. Examine la siguiente afirmación: podemos confiar mucho en que 95% de todos los frascos
de esta marca de jarabe para la tos tengan un contenido de alcohol entre 7.8 y 9.4. ¿Es
correcta? ¿Por qué sí o por qué no?
d. Examine la siguiente afirmación: Si el proceso de seleccionar una muestra de tamaño 50 y
después calcular el intervalo de confianza de 95% correspondiente se repite 100 veces, 95
de los intervalos que resulten incluirán a μ. ¿Es correcta esta afirmación? ¿Por qué sí o por
qué no?
Solución:
a. Sería mas angosto ya que el nivel de confianza es menor, además el valor crítico de z para
un nivel de confianza de 90% es 1.645, menor que el valor del nivel de confianza de 95%
que es 1.96, entonces éste produce un intervalo mas ancho.

b. No es correcta esta afirmación. Porque una vez creado el intervalo de una muestra, la media
puede estar contenida o no en él. El 95% de confianza está en el procedimiento general,
para muestreo repetitivo.

c. No es correcta ya que el intervalo es un estimado para la media de la población no para los


valores frontera de la población.

d. No es correcta. En teoría, si el proceso se repite un número infinito de veces, 95% de los


intervalos podrían contener la media de la población.

4. Se desea un intervalo de confianza para el promedio verdadero de la pérdida de carga μ (watts)


para cierto tipo de motor de inducción, cuando la corriente de línea se mantiene a 10 ampers
120

para una velocidad de 1500 rpm. Suponga que la pérdida de carga está normalmente
distribuida con σ = 3.0.
a. Calcule un IC de 95% para μ cuando n = 25 y x = 58.3
b. Calcule un IC de 95% para μ cuando n = 100 y x = 58.3
c. Calcule un IC de 99% para μ cuando n = 100 y x = 58.3
d. Calcule un IC de 82% para μ cuando n = 100 y x = 58.3
e. ¿Qué tan grande debe ser n si la longitud del intervalo de 99% para μ debe ser 1.0?
Solución.

a. x  z / 2 
n
1  = 0.95  = 1 – 0.95 = 0.05 /2 = 0.025 z / 2  1.96
 3.0 
58.3  1.96    58.3  1.176 (57.124, 59.476)
 25 
b. 1  = 0.95  = 1 – 0.95 = 0.05 /2 = 0.025 z / 2  1.96
 3.0 
58.3  1.96    58.3  0.588 (57.712, 58.888)
 100 
c. 1  = 0.99  = 1 – 0.99 = 0.01 /2 = 0.005 z / 2  2.575
 3.0 
58.3  2.575    58.3  0.7725 (57.527, 59.073)
 100 
d. 1  = 0.82  = 1 – 0.82 = 0.18 /2 = 0.09 z / 2  1.34
 3.0 
58.3  1.34    58.3  0.402 (57.9, 58.7)
 100 

2 2
  2(2.575)(3.0) 
e. n   2 z / 2   , n   238.7 n  239
 w  1.0 

5. Suponga que la porosidad al helio (en porcentaje) de muestras de carbón, tomadas de cualquier
veta en particular, está normalmente distribuida con una desviación estándar verdadera de
0.75.
a. Calcule un IC de 95% para el verdadero promedio de la porosidad de cierta veta, si el
promedio de porosidad de 20 especimenes de la veta fue 4.85.
b. Calcule un IC de 98% para el verdadero promedio de la porosidad de otra veta, basado en
16 especímenes con un promedio de porosidad muestral de 4.56.
c. ¿Qué tan grande debe ser el tamaño muestral si la longitud del intervalo de 95% es de 0.40?
Solución:

a. x  z 2 , 1    0.95,   0.05,  2  0.025, z 2  1.96
n
 0.75 
4.85  1.96    4.85  0.329, entonces el intervalo será: (4.521,5.179)
 20 

b. x  z 2 , 1    0.98,   0.02,  2  0.01, z 2  2.33
n
 0.75 
4.56  2.33    4.56  0.4368, entonces el intervalo será: (4.123,4.997)
 16 

2 2
  2(1.96)(0.75) 
c. n   2 z 2  , n     54, entonces n  54
 w  0.40 
121

6. Con base en pruebas detalladas, se sabe que el límite elástico (punto de cedencia) de
determinado tipo de varilla de acero de refuerzo tiene una distribución normal con σ = 100.
Se ha modificado un poco la composición del acero, pero se cree que la modificación no ha
afectado ni la normalidad ni el valor de σ.
a. Suponiendo que así sea, si una muestra de 25 varillas modificadas dio como resultado un
punto de cedencia con promedio muestral de 8439 lb., calcule un intervalo de confianza de
90% para el punto real promedio de cedencia de la varilla modificada.
b. ¿Cómo modificaría el intervalo del inciso a) para obtener un nivel de confianza de 92%?
Solución:

a. x  z 2 , 1    0.90,   0.10,  2  0.05, z 2  1.645
n
 100 
8439  1.645    8439  32.9, entonces el intervalo será: (8406.1,8471.9)
 25 

b. x  z 2 , 1    0.92,   0.08,  2  0.04, z 2  1.75
n
 100 
8439  1.75    8439  35, entonces el intervalo será: (8404,8474)
 25 
Para un nivel de confianza mayor, aumenta la longitud del intervalo

7. ¿Cuánto debe aumentar el tamaño muestral n si la longitud del IC (ec. 7.5) debe reducirse a

   
 x  z / 2  , x  z / 2   (7.5)
 n n
a la mitad? Si el tamaño muestral aumenta en un factor de 25, ¿Qué efecto tendrá esto en la
longitud del intervalo? Justifique sus afirmaciones.
Solución:

Si L = 2 z 2 y se incrementa el tamaño de la muestra por un factor de 4, la longitud es
n
    1  L
L '  2 z 2   2 z 2     , entonces se obtiene la longitud deseada si se
4n  n  2  2
aumenta n cuatro veces.
L
Si n’ = 25n, entonces L '  , por lo que la longitud decreció por un factor de 5
5

8. Sea α1 > 0, α2 > 0, con α1 + α2 = α. Entonces

 X  
P  z1   z 2   1  
 / n 

a. Utilice esta ecuación para obtener una expresión mas general para un IC de 100(1-α)% para
µ, del cual el intervalo (7.5) es un caso especial.
b. Sea α = 0.05 y α1 = α / 4, α2 = 3 α /4. ¿El resultado es un intervalo más corto o más largo
que el intervalo (7.5)?
Solución:
a. Con probabilidad 1  
X 
 z1   z2 , estas desigualdades pueden manipularse para obtener
/ n
122

           
 z1    X    z2  ,   X  z1       X  z2  
 n  n  n  n
             
  X  z1         X  z 2  , X  z 2      X  z1  
  n    n   n  n
Por lo que el intervalo será
      
 X  z2   , X  z1  
  n  n 
  
b. Con  = 0.05, el intervalo es de 95% y tiene longitud 3.92   , mientras este intervalo
 n
tiene longitud

( z1  z2 ) , con   0.05, 1   / 4,  2  3 / 4
n
 
z1  z0.0125  2.24 z 2  z0.0375  1.78 la longitud es: (2.24  1.78)  4.02
n n
Este intervalo es mayor

9. a. Bajo las mismas


condiciones que llevan al intervalo (7.5), resulta que
 
P  X    /  / n  1.645  0.95 . Utilice esto para derivar un intervalo unilateral para µ
 
con longitud infinita y proporcione un límite inferior de confianza más bajo en µ. ¿Cuál es el
intervalo para los datos del ejercicio 5(a).
b. Generalice el resultado del inciso (a) para obtener un límite inferior con nivel de confianza
100(1 – α) %.
c. ¿Cuál es el intervalo análogo al inciso (b) que proporcione un límite superior en µ? Calcule
este intervalo al 99% para los datos del ejercicio 4(a).
Solución:
a. Con probabilidad 0.95 z  z0.05  1.645 , por tanto el intervalo será:
  
 x  1.645 ,   , del problema 5, inciso (a) x  4.85,   0.75, n  20 , así tenemos:
 n 
0.75
4.85  1.645  4.5741,  el intervalo es (4.5741, )
20

  
b.  x  z ,
 n 
  
c.  , x  z  . Del problema 4(a) x  58.3,   3.0, n  25
 n
 3.0 
58.3  2.33    58.3  1.398  59.698 el intervalo es (  , 59.698)
 25 

10. Una muestra aleatoria de n = 15 bombas de calor, de cierto tipo, produjeron las siguientes
observaciones en duración (en años):

2.0 1.3 6.0 1.9 5.1 0.4 1.0 5.3 15.7 0.7 4.8 0.9
12.2 5.3 0.6

a. Suponga que la distribución de duración es exponencial y utilice un argumento similar al


del ejemplo 7.5 para obtener un intervalo de confianza de 95%, para la duración esperada
(promedio verdadero).
123

b. ¿Cómo debe modificarse el intervalo del inciso (a) para alcanzar un nivel de confianza de
99%?
c. ¿Cuál es un intervalo de confianza de 95% para la desviación estándar de la distribución
de la duración? (Sugerencia: ¿Cuál es la desviación estándar de una variable aleatoria
exponencial?).
Solución:
a. Cuando la distribución de probabilidad es exponencial, si hacemos:
h( X1 , X 2 , X 3 ,..., X n ;  )  2  xi , se ha demostrado que está variable aleatoria tiene una
distribución de probabilidad ji cuadrada (2) con 2n grados de libertad, con esto cuando n
= 15 y v = 30 grados de libertad,, entonces el intervalo es:
 
P 2 / 2  2  xi  12 / 2  0.95
Consultando en tablas los valores de ji cuadrada para un nivel de confianza de 95%,
tenemos:
P  46.979  2  xi  16.971  0.95, despejando a 
 46.979 16.971   46.979 16.971 
P    0.95, el intervalo es   
 2 x 2 xi 
 i  2 xi 2 xi 
Con los datos dados
 46.979 16.971 
 xi  63.2, el intervalo queda  2(63.2)    2(62.2)   (0.37167    0.13642)
 
1
Para una distribución exponencial sabemos que   , así el intervalo para la media queda:

1 1
 , (2.69, 7.33)
0.37167 0.13642

b. Para un intervalo de 99%, solo cambian los valores de 2, esto es /2 = 0.005, así:
 0.005
2
 53.672,  0.995
2
 13.787 , por tanto el intervalo queda:
 53.672 13.787 
     (0.42462    0.10907)
 2(63.2) 2(63.2) 
1 1
 , (2.355, 9.168)
0.42462 0.10907

1
c. Para una distribución exponencial V ( X )  , así que la desviación estándar es igual a la
2
media, por tanto el intervalo para  es el mismo que para la media encontrado en el inciso
(a) (2.69, 7.33)

11. Considere los siguientes 1000 intervalos de confianza al 95% para µ que un consultor en
estadística obtendrá para varios clientes. Suponga que los conjuntos de datos sobre los que
están basados los intervalos se seleccionan de manera independiente entre sí. ¿Cuántos de
estos 1000 intervalos espera que capturen el valor correspondiente de µ? ¿Cuál es la
probabilidad de que entre 940 y 960 de estos intervalos contengan el valor correspondiente
de µ? (Sugerencia: sea Y = número entre los 1000 intervalos que contienen µ, ¿qué clase de
variable aleatoria es Y?).
Solución:
Atendiendo a la sugerencia, observamos que Y tiene una distribución binomial, por lo que
con n = 1000 y p = 0.95, tenemos que E(Y )  np  950 este es el valor esperado del número
de intervalos que capturan a  y  Y  npq  1000(0.95)(0.05)  6.892
Usando una aproximación normal para la distribución binomial
124

 939.5  950 960.5  950 


P(940  Y  960)  P  Z   (1.52)  (1.52)
 6.892 6.892 
 0.9357  0.0643  0.8714 P(940  Y  960)  0.8714

Intervalos de confianza con muestras grandes para la media y la proporción de una


población

1. Una muestra aleatoria de 110 relámpagos, en cierta región, tuvieron una duración de eco de
radar promedio muestral de 0.81s (“Lightning Strikes to an Airplane in a Thunderstorm”, J.
of Aircraft, 1984, pp. 607 – 611). Calcule un intervalo de confianza de 99% para el verdadero
promedio de duración de eco µ e interprete el intervalo resultante.
Solución:
Para muestras grandes podemos tomar la desviación estándar muestral, por tanto:
s
x  z 2 , 1    0.99,   0.01,  2  0.005, z 2  2.58, x  0.81, s  0.34
n
 0.34 
0.81  2.58    0.81  0.083, entonces el intervalo será: (0.73,0.89)
 110 

2. El artículo “Extravisual Damage Detection Defining the Estandar Normal Tree”


(PhotogrammetricEngr. And Remote Sensing. 1981, pp. 512 – 522) analiza el uso de
fotografía infrarroja en color para la identificación de árboles normales en bosques de pinos
de Oregon (abeto Douglas). Entre los datos reportados había resúmenes estadísticos para
medidas densitométricas ópticas analíticas de filtro verde en muestras de árboles sanos y
enfermos. Para una muestra de 69 árboles sanos, el promedio muestral de densidad de capa
de tinte fue 1.028 y la desviación estándar muestral 163.
a. Calcule un intervalo de confianza de 95% para el verdadero promedio de densidad de capa
de tinte µ para todos estos árboles.
b. Suponga que los investigadores habían hecho una estimación de 0.16 para el valor de s
antes de reunir los datos. ¿Qué tamaño de muestra sería necesario para obtener un ancho
de intervalo de 0.05 con un nivel de confianza de 95%?
Solución:
a.
x  1.028, s  0.163, n  69
s
x  z 2 , 1    0.95,   0.05,  2  0.025, z 2  1.96
n
 0.163 
1.028  1.96    1.028  0.0383, entonces el intervalo será: (0.99,1.066)
 69 

2 2
  2(1.96)(0.16) 
b. n   2 z 2  , n     157, entonces n  157
 w  0.05 

3. El artículo “Gas Cooking, Kitchen Ventilation, and Exposure to Combustion Products”


(Indoor Air, 2006; 65 – 73) reportó que para una muestra de 50 cocinas con estufas de gas
monitoreadas durante una semana, el nival de CO2 medio muestral fue de 654.16 y la
desviación estándar muestral fue de 164.43.
a. Calcule e interprete un intervalo de confianza de 95% (bilateral) para el nivel de CO 2
promedio verdadero en la población de todas las casas de la cual se seleccionó la muestra.
b. Suponga que el investigador había hecho una suposición preliminar de 175 para el valor de
s antes de recopilar los datos. ¿Qué tamaño de muestra sería necesario para obtener un
ancho de intervalo de 50 ppm para un nivel de confianza de 95%?
Solución:
a.
125

x  654.16, s  164.43, n  50
s
x  z 2 , 1    0.95,   0.05,  2  0.025, z 2  1.96
n
 164.43 
654.16  1.96    654.16  45.5777, entonces el intervalo será: (608.58,699.74)
 50 
2 2
 s  2(1.96)(175) 
b. n   2 z 2  , n     188.23, entonces n  188
 w  50 

4. El artículo “Evaluating Tunnel Kiln Performance”(Amer. Ceramic Soc. Bull., agosto de 1997,
pp. 59 – 63) contiene la siguiente información resumida de resistencia a la fractura, en MPa,
de n = 169 barras de cerámica quemadas en determinado horno: x  89.10 , s = 3.73.
a. Calcule un intervalo de confianza bilateral de la resistencia real promedio a la fractura con
un nivel de confianza del 95%. ¿Parece que se ha estimado con precisión esa resistencia?
b. Suponga que los investigadores creían a priori, que la desviación estándar de la población
era 4 MPa. Con ésta hipótesis, ¿de que tamaño se hubiera requerido una muestra para
estimar µ con 0.5 MPa de precisión y 95% de confianza?
Solución:
a.
x  89.10, s  3.73, n  169
s
x  z 2 , 1    0.95,   0.05,  2  0.025, z 2  1.96
n
 3.73 
89.10  1.96    89.10  0.5624, entonces el intervalo será: (88.5376,89.6624)
 169 
Si, el intervalo es muy estrecho y parece bastante preciso.

b. En este caso para una precisión de 0.5 MPa se requiere que el ancho del intervalo sea de
1.0 MPa.

2 2
  2(1.96)(4) 
n   2 z 2  , n     245.86, entonces n  246
 w  1.0 

5. Determine el nivel de confianza de cada una de las siguientes cotas unilaterales de confianza
para la muestra grande:
c. Cota superior: x  0.84s / n
d. Cota inferior: x  2.05s / n
e. Cota superior: x  0.67 s / n
Solución;
a. El límite de confianza superior de una muestra grande para  es:
s
  x  z  , entonces z  0.84, (0.84)  0.7995  0.80 , así que el nivel de
n
confianza es 80%
b. El límite de confianza inferior de una muestra grande para  es:
s
  x  z  , entonces z  2.05, (2.05)  0.9798  0.98 , así que el nivel de
n
confianza es 98 %
c. Aquí z  0.67, (0.67)  0.7486  0.75 , así que el nivel de confianza es 75 %

6. El tiempo entre carga y vaciado de un horno de hogar abierto, para acero al carbón, se
determinó para cada carga en una muestra de tamaño 46 y el resultado fue el tiempo promedio
126

muestral de 382.1 y desviación estándar muestral de 31.5. Calcule una cota superior de
confianza de 95% para el tiempo real promedio de carga y vaciado.
Solución:
El límite de confianza superior de una muestra grande para  es:
s
  x  z  , entonces para el nivel de confianza es 95 % z  1.645 , sustituyendo
n
s 31.5
x  z   382.1  1.645   382.1  7.64  389.74 , la cota superior es 389.74
n 46

7. En una prueba de dureza Brinell se mide el diámetro de la penetración originada al oprimir


una bola de acero endurecido contra un material, bajo una carga patrón de prueba. Suponga
que se determina la dureza Brinell en cada espécimen de una muestra de tamaño 50, lo cual da
por resultado un promedio muestral de 64.3 y una desviación estándar de 6.0. Calcule una cota
inferior de confianza de 99% para la dureza Brinell real en especímenes de este material.
Solución:
Para n = 50, x  64.3,   6.0
s
x  z , 1    0.99,   0.01, z0.01  2.33
n
 6.0 
64.3  2.33    64.3  1.977  62.323, entonces la cota inferior es: 62.323
 50 

8. El artículo “Ultimate Load Capacities of Expansion Anchor Bolts” (J. of Energy Engr., 1993,
pp. 139 – 158) reporta el resumen de los siguientes datos, sobre resistencia al corte, para una
muestra de pernos de anclaje de 3/8 pulg: n = 78, x  4.25 kip y s = 1.30. Calcule una cota
inferior de confianza utilizando un nivel de 90% de confianza para la resistencia promedio real
al corte.
Solución:
Para n = 78, x  4.25 kip y s = 1.30
s
x  z , 1    0.90,   0.10, z0.10  1.28
n
 1.30 
4.25  1.28    4.25  0.188  4.062, entonces la cota inferior es: 4.062
 78 

9. El artículo “Limited Yield Estimation for Visual Defect Sources”, (IEEE Trans. on
Semiconductor Manuf., 1997, pp. 17 – 23) reporta que en un estudio de determinado proceso
de inspección de obleas, se examinaron con un sensor de inspección 356 troqueles, de los
cuales 201 pasaron la prueba. Suponga que el proceso es estable, calcule un intervalo bilateral
de confianza de 95% para la proporción de las matrices que pasaron la prueba.
Solución:
201
El estimado de la proporción es pˆ   0.5646 y qˆ  0.4354 . Para el nivel de confianza
356
de 95% z / 2  1.96
z2 / 2 ˆ ˆ z2
pq
pˆ   z / 2 
p 2n n 4n 2 sustituyendo los valores dados, se tiene
1   z2 / 2  n
(1.96)2 (0.5646)(0.4354) (1.96)2
0.5646   1.96 
2(356) 356 4(356)2 0.5700  0.0518
p 
(1.96)2 1.01079
1
356
127

El intervalo es (0.513, 0.615)

10. La Associated Press (16 de diciembre de 1991) informó que en una muestra de 507
estadounidenses adultos, sólo 142 describieron de manera correcta la Ley de derechos y las
diez primeras enmiendas de la Constitución de Estados Unidos. Calcule un intervalo bilateral
de confianza, con un nivel de 99 % de confianza para la proporción de todos los adultos
estadounidenses que pueden dar una descripción correcta de la Ley de derechos.
Solución:
142
El estimado de la proporción es pˆ   0.28 y qˆ  0.72 . Para el nivel de confianza de 99
507
% z / 2  2.58
z2 / 2 ˆ ˆ z2
pq
pˆ   z / 2 
p 2n n 4n 2 sustituyendo los valores dados, se tiene
1   z2 / 2  n
(2.58)2 (0.28)(0.72) (2.58)2
0.28   2.58 
2(507) 507 4(507)2 0.2866  0.0519
p 
(2.58)2 1.0131
1
507
El intervalo es (0.2317, 0.3341)

11. Se seleccionó una muestra aleatoria de 539, de cierta ciudad ubicada en el Medio Oeste
estadounidense. Se determinó que 133 de ellos poseían por lo menos un arma de fuego (en
“The Social Determinants of Gun Ownership: Self-Protection in an Urban Environment”,
Criminology, 1997, pp. 629 -640). Con un nivel de confianza de 95%, calcule la cota inferior
para la proporción de propietarios de armas de esa población.
Solución:
133
El estimado de la proporción es pˆ   0.2468 y qˆ  0.7532 . Para el nivel de confianza
539
de 95 % z  z0.05  1.645
z2 ˆ ˆ z2
pq
pˆ   z 
p 2n n 4n 2 sustituyendo valores se tiene:
1   z2  n
(1.645) 2 (0.2468)(0.7532) (1.645) 2
0.2468   1.645 
2(539) 539 4(539) 2 0.2493  0.0307
p   0.218
(1.645) 2 1.005
1
539
Por tanto la cota inferior es 0.218

12. Se seleccionó una muestra aleatoria de 487 mujeres no fumadoras de peso normal (índice de
masa corporal entre 19.8 y 26.0) que dieron a luz en un gran centro médico metropolitano
(“The Effects of Cigarette Smoking and Gestational Weigth Change of Birth Outcomes in
Obese and Normal Weigth Women”, Amer. J. of Public Health, 1997, pp. 591 -596). Se
determinó que en el 7.2% de esos nacimientos resultaron niños de bajo peso al nacer, con
menos de 2500g. Calcule una cota superior de confianza de 99% para la proporción de
nacimientos que dan como resultado niños de bajo peso al nacer.
Solución:
Para la cota superior con: pˆ  0.072, y una condición de frontera superior del 99%
1    0.99,   0.01, z0.01  2.33
128

z2 ˆ ˆ z2
pq
pˆ   z 
p 2n n 4n 2
1   z2  n

(2.33) 2 (0.072)(0.928) (2.33) 2


0.072   2.33 
2(487) 487 4(487) 2 0.0776  0.0279
p   0.1043
(2.33)2 1.0111
1
487

13. El artículo “An Evaluation of Football Helmets Under Impact Conditions” (Amer. J. Sports
Medicine, 1994, pp. 233 -237) reporta que cuando se sometió a cada casco de fútbol, de una
muestral aleatoria de 37 del tipo de suspensión, a cierta prueba de impacto, 24 mostraron
daños. Sea p la proporción de todos los cascos de este tipo que muestran daños al probarse de
la manera descrita.
a. Calcule un intervalo de confianza de 99% para p.
b. ¿Qué tamaño de muestra se requeriría para que el ancho de un intervalo de confianza del
99% fuera 0.10 a lo sumo, independientemente de p̂ ?
Solución:
24
El estimado de la proporción es pˆ   0.6486 y qˆ  0.3514 . Para el nivel de confianza de
37
99 % z / 2  2.58
z2 / 2 ˆ ˆ z2
pq
pˆ   z / 2 
p 2n n 4n 2 sustituyendo los valores dados, se tiene
1   z2 / 2  n
(2.58)2 (0.6486)(0.3514) (2.58)2
0.6486   2.58 
2(37) 37 4(37)2 0.7386  0.2216
p 2

(2.58) 1.1799
1
37
El intervalo es (0.4382, 0.8138)

b. Para una proporción el cálculo del tamaño de la muestra se calcula de la expresión que
resulta de despejar n del intervalo del CI.

ˆ ˆ  z 2 w2  4 z 4 pq
2 z 2 pq ˆ ˆ  w2 )  w 2 z 4
ˆ ˆ ( pq
n
w2
Sin embargo cuando no se conoce p̂ , un método conservador es aprovechar el hecho de
ˆ ˆ  pˆ (1  pˆ ) es un máximo cuando p̂ = 0.5, por consiguiente se usa p̂ = q̂ = 0.5 en
que pq
la expresión anterior, así tenemos:
2(2.58) 2 (0.25)  (2.58) 2 (0.01)  4(2.58) 4 (0.25)(0.25  0.01)  0.01(2.58) 4
n
0.01
3.261636  3.3282
  658.98 n  659
.01

14. Una prueba de 56 muestras de algodón para investigación resultó en un porcentaje de


alargamiento promedio muestral de 8.17 y una desviación estándar muestral de 1.42 (“An
Apparent Relation Between the Spiral Angle , the Percent Elongation E1 , and Dimensions
of the Cotton Fiber”, Textile Research J., 1978, pp. 407 – 410). Calcule un intervalo de
confianza con muestras grandes de 95% para el verdadero promedio del porcentaje de
129

alargamiento . ¿Qué suposiciones se hacen acerca de la distribución del porcentaje de


alargamiento?
Solución:
Con n  56, x  8.17,   1.42 y un nivel de confianza de 95% z / 2  1.96 el intervalo
es:
s
x  z 2 , sustituyendo los valores dados:
n
 1.42 
8.17  1.96    8.17  0.3719 el intervalo es (7.7981, 8.5419)
 56 
No se hicieron suposiciones acerca de la distribución de probabilidad, más que la muestra es
lo suficientemente grande.

15. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer que
proporción del electorado conoce la opinión de ella, respecto al uso de los fondos estatales
para pagar abortos.
a. ¿Qué tamaño de muestra se necesita si el intervalo de confianza de 95% para p debe tener
un ancho máximo de 0.10, independientemente de p?
b. Si la legisladora tiene fuertes motivos para creer que a lo sumo 23 del electorado conoce su
posición, ¿qué tamaño de muestra le recomendaría?
Solución:
a. Para una proporción el cálculo del tamaño de la muestra se calcula de la expresión que
resulta de despejar n del intervalo del CI.
ˆ ˆ  z 2 w2  4 z 4 pq
2 z 2 pq ˆ ˆ  w2 )  w 2 z 4
ˆ ˆ ( pq
n
w2
Sin embargo cuando no se conoce p̂ , un método conservador es aprovechar el hecho de
que pqˆ ˆ  pˆ (1  pˆ ) es un máximo cuando p̂ = 0.5, por consiguiente se usa p̂ = q̂ = 0.5 en
la expresión anterior, así tenemos:
2(1.96) 2 (0.25)  (1.96) 2 (0.01)  4(1.96) 4 (0.25)(0.25  0.01)  0.01(1.96) 4
n
0.01
1.8824  1.9208
  380.32 n  380
.01
b. Ahora se conoce el valor de p̂ , así que usamos la expresión inicial y sustituyendo tenemos:
2(1.96)2 ( 13  32 )  (1.96)2 (0.01)  4(1.96)4 ( 13  32 )( 13  32  0.01)  0.01(1.96)4
n
0.01
1.667  1.71217
  337.9 n  338
.01

16. El superintendente de un gran distrito escolar, que alguna vez cursó Probabilidad y Estadística,
piensa que el número de maestros ausentes en cierto día dado tiene una distribución de Poisson
con parámetro . Utilice los siguientes datos de ausencias para 50 días, a fin de obtener un
intervalo de confianza de muestras grandes para . [Sugerencia: la media y varianza de una
distribución de Poisson son iguales a , de modo que
X 
Z tiene una distribución de probabilidad aproximadamente normal estándar. Ahora,
/n
proceda como en la obtención para p: construya un enunciado de probabilidad (con
probabilidad (1 - ) y despeje una de las desigualdades resultantes.]
Número de
0 1 2 3 4 5 6 7 8 9 10
ausencias
130

Frecuencia 1 4 8 10 8 7 5 3 2 1 1

Solución:

Considerando    , un estimador de este será ˆ  X y  ˆ  por tanto el estimador
n
X
de la desviación estándar es ˆˆ  . Para muestras grandes el IC es entonces
n
x 203
x  z / 2 . Calculando de la tabla  xi  203, x   4.06 y un intervalo para  es:
n 50
4.06
4.06  1.96  4.06  0.56, (3.50, 4.62)
50

17. Considere el intervalo (7.10) para p y centre su atención en un nivel de confianza de 95 %.


Demuestre que los límites de confianza concuerdan bastante bien con los del intervalo
tradicional (7.11) una vez que se agregan a la muestra dos éxitos y dos fracasos [es decir, la
ecuación (7.11), basada en x + 2 éxitos (S) en n + 4 ensayos](Sugerencia: 1.96  2. Nota:
Agresti y Coull demostraron que este ajuste del intervalo tradicional también tiene un nivel
de confianza real cercano al nivel nominal.)
Solución:
z2 / 2 ˆ ˆ z2
pq
pˆ   z / 2 
p 2n n 4n 2 (7.10)
1   z2 / 2  n
ˆˆ
pq
pˆ  z / 2 (7.11)
n

Intervalos basados en una población con distribución normal

1. Determine los valores de las siguientes cantidades:

a. t0.1, 15 b. t.05, 15 c. t.05, 25 d. t.05, 40 e. t.005, 40


Solución:
Consultando en tablas para los valores de  dados y los grados de libertad, se tiene
a. Para  = 0.1 y v = 15, t 0.1, 15 = 1.341
b. Para  = 0.05 y v = 15, t 0.05, 15 = 1.753
c. Para  = 0.05 y v = 25, t 0.05, 25 = 1.708
d. Para  = 0.05 y v = 40, t 0.05, 40 = 1.684
e. Para  = 0.005 y v = 40, t 0.005, 15 = 2.704

2. Determine el valor crítico de t que contenga el área deseada de la curva t en cada uno de los
casos siguientes.
a. Area central = 0.95, gl (grados de libertad) = 10
b. Area central = 0.95, gl = 20
c. Area central = 0.99, gl = 20
d. Area central = 0.99, gl = 50
e. Area de la cola superior = 0.01, gl = 25
f. Area de la cola inferior = 0.025, gl = 5
Solución:
a. Para que el área central sea de 0.95, /2 = 0.025, así t 0.025, 10 = 2.228
b. Para que el área central sea de 0.95, /2 = 0.025, así t 0.025, 20 = 2.086
131

c. Para que el área central sea de 0.99, /2 = 0.005, así t 0.005, 20 = 2.845
d. Para que el área central sea de 0.95, /2 = 0.025, así t 0.005, 50 = 2.678
e. Para que el área de la cola superior sea de 0.01,  = 0.01, así t 0.01, 25 = 2.485
f. Para que el área de la cola inferior sea de 0.025,  = 0.025, así  t 0.025, 5 =  2.571

3. Determine el valor crítico de t para un intervalo bilateral de confianza en cada uno de los
siguientes casos:
a. Nivel de confianza = 95%, gl = 10
b. Nivel de confianza = 95%, gl = 15
c. Nivel de confianza = 99%, gl = 15
d. Nivel de confianza = 99%, n = 5
e. Nivel de confianza = 98%, gl = 24
f. Nivel de confianza = 99%, n = 38
Solución:
a. Para un nivel de confianza de 95% y gl = 10, /2 = 0.025, por tanto t 0.025, 10 = 2.228
b. Para un nivel de confianza de 95% y gl = 15, /2 = 0.025, por tanto t 0.025, 15 = 2.131
c. Para un nivel de confianza de 99% y gl = 15, /2 = 0.005, por tanto t 0.005, 15 = 2.947
d. Para un nivel de confianza de 99% y gl = 4, /2 = 0.005, por tanto t 0.005, 4 = 4.604
e. Para un nivel de confianza de 98% y gl = 24, /2 = 0.01, por tanto t 0.01, 24 = 2.492
f. Para un nivel de confianza de 99% y gl = 37, /2 = 0.005, por tanto t 0.005, 37 = 2.712
4. Determine el valor crítico de t para una cota inferior o superior de confianza, para cada uno de
los casos del ejercicio 3.
Solución:
a. Para un nivel de confianza de 95% y gl = 10,  = 0.05, por tanto t 0.05, 10 = 1.812
b. Para un nivel de confianza de 95% y gl = 15,  = 0.05, por tanto t 0.05, 15 = 1.753
c. Para un nivel de confianza de 99% y gl = 15,  = 0.01, por tanto t 0.01, 15 = 2.602
d. Para un nivel de confianza de 99% y gl = 4,  = 0.01, por tanto t 0.01, 4 = 3.747
e. Para un nivel de confianza de 98% y gl = 24,  = 0.02, por tanto t 0.02, 24  2.064
f. Para un nivel de confianza de 99% y gl = 37,  = 0.01, por tanto t 0.01, 37 = 2.429

5. Una muestra aleatoria de 8 especimenes de prueba, de cierto tipo de fibra de vidrio E,


produjeron un límite elástico al corte interfacial promedio muestral de 30.2 y una desviación
estándar muestral de 3.1 (On Interfacial Failure in Notched Unidireccional Glass/Epoxy
Composites”J. Composite Materials, 1985, pp. 276 – 286). Si se supone que el límite elástico
de corte interfacial está normalmente distribuido, calcule un intervalo de confianza de 95%
para el verdadero promedio de esfuerzo (como lo hicieron los autores de este artículo)
Solución:
Un intervalo de confianza para la media  a partir de una muestra con distribución normal si
no se conoce la desviación estándar está dado por:
s
x  t / 2, v , v  n  1 grados de libertad
n
En este caso par un nivel de confianza de 95%, /2 = 0.025 y t/ 2 , 7 = t0.025, 7 = 2.365
s  3.1 
x  t / 2, v  30.2  2.365    30.2  2.592 (27.608, 32.792)
n  8

6. El artículo “Measuring and Understanding the Aging of Kraft Insulating Paper in Power
Transformers” (IEEE Electrical Insul. Mag., 1996, pp. 28 – 34) contenía las siguientes
informaciones sobre el grado de polimerización de muestras de papel donde la viscosidad
multiplicada por la concentración caía entre determinados límites intermedios.

418 421 421 422 425 427 431 434 437 439 446 447
448 453 454 463 465
132

a. Trace un diagrama de caja de los datos y comente sus propiedades de interés.


b. ¿Es factible que estas observaciones muestrales se hayan seleccionado de una distribución
normal?
c. Calcule un intervalo de confianza bilateral de 95% para el grado de polimerización
promedio real (como lo hicieron los autores de este artículo). ¿Parece indicar ese intervalo
que 440 es un valor factible del grado promedio real de polimerización? ¿Y 450?
Solución:
a.

Se observa que hay cierta simetría


con un ligero sesgo positivo, la
mediana está muy cercana a la media, no hay valores atípicos.
Estadísticas descriptivas: Grado de polimerización

Error
estándar
de la
N Media media Desv.Est. Mínimo Q1 Mediana Q3 Máximo
17 438.29 3.67 15.14 418.00 423.50 437.00 450.50 465.00

b. Basados en una gráfica de probabilidad normal parece razonable suponer que los datos de
la muestra provienen de una población con distribución normal.

c. En este caso par un nivel de confianza de 95%, /2 = 0.025 y t/ 2 , v = t0.025, 16 = 2.120

s  15.14 
x  t / 2, v  438.29  2.120    438.29  7.785 (430.505, 446.075)
n  17 

Es factible que el valor de la media del grado de polimerización sea 440, no así 450 ya que
este valor está fuera del intervalo.
133

7. Con una muestra de 14 especimenes de uniones de cierto tipo, se obtuvo una resistencia
proporcional límite media muestral de 8.48 MPa y desviación estándar muestral de 0.79 MPa
(“Caracterization of Bearing Strength Factors in Pegged Timber Connections”, J. of
Structural Engr., 1997, pp. 326 – 332).

a. Calcule e interprete una cota inferior de 95% de confianza para el esfuerzo límite promedio
proporcional real de todas estas uniones. ¿Qué hipótesis, si es que formuló alguna, necesito
acerca de la distribución del esfuerzo límite proporcional?
b. Calcule e interprete una cota inferior de predicción del esfuerzo proporcional límite de una
sola unión de ese tipo.
Solución:
a. Con n = 14, x = 8.48 y s = 0.79, t0.05,13  1.771
s  0.79 
x  t ,n 1 , 8.48  (1.771)    8.48  0.374  8.11, la cota inferior es 8.11
n  14 

Con un nivel de confianza de 95% el valor de la verdadera media del límite de resistencia
de estas uniones en el intervalo (8.11, ∞), esto significa que cuando este intervalo es
calculado uno tras otro, a la larga el 95% de estos incluyen la verdadera media del límite
proporcional de resistencia de una muestra de este tipo de juntas. Se supuso que la muestra
provenía de una población con distribución normal.

b. La cota inferior de predicción para un nivel de predicción de 95% está dada por:

1 1
x  t ,n 1s 1  , 8.48  1.771(0.79) 1   8.48  1.448  7.032
n 14
la cota inferior es 7.031

Si esta frontera es calculada muestra por muestra a la larga 95% de estas proporcionarán
una cota inferior para valores futuros del esfuerzo proporcional límite de una muestra de
uniones de este tipo.

8. Las siguientes mediciones de viscosidad estabilizada (en cP) de especímenes de determinada


clase de asfalto con 18% de hule se tomaron del artículo “Viscosity Characteristics of Rubber-
Modified Asphalts” (J. of Materials in Civil Engr., 1996, pp. 153- 156):
2791 2900 3013 2856 2888
Una gráfica de probabilidad normal respalda la hipótesis de que la viscosidad se aproxima
por lo menos a tener una distribución normal.
a. Estime la viscosidad promedio real en forma que exprese información acerca de la
precisión y la confiabilidad.
b. Pronostique la viscosidad de un solo espécimen de asfalto en forma que exprese
información sobre la precisión y la confiabilidad. ¿Cómo se compara el pronóstico con el
estimado que calculo en el inciso (a)?
Solución:
a.
134

Con n = 5, x = 2889.6 y s = 80.92, t0.025,4  2.776


s  80.9 
x  t / 2,n 1 , 2889.6  (2.776)    2889.6  100.43, (2789.17, 2990.03)
n  5 

9. Una muestra de 26 trabajadores de cierta plataforma marina tomaron parte en un simulacro


de evacuación (para casos de emergencia) y se obtuvieron los datos adjuntos de tiempo
(segundos) para terminar el desalojo.

389 356 359 363 375 424 325 394 402 373 373 370 364 366 364 325
339 393 392 369 374 359 356 403 334 397

El promedio y la desviación estándar muestrales son 370.69 y 24.36 respectivamente.


a. Calcule una cota superior de confianza para el tiempo promedio poblacional de escape,
con un nivel de confianza de 95%.
b. Calcule una cota superior de predicción para el tiempo de escape de un solo trabajador
más, con un nivel de predicción de 95%. ¿Cómo se compara esta cota con la de confianza
del inciso (a)?
c. Suponga que se escogen dos trabajadores más para participar en el ejercicio simulado de
escape. Represente sus tiempos de escape por X27 y X28, y sea X nuevo el promedio de esos
dos valores. Modifique la fórmula de un intervalo de predicción para un solo valor de x,
para obtener el intervalo de predicción para X nuevo y calcule un intervalo bilateral de 95%
basado en los datos de tiempo de escape.
Solución:
a. Con x =370.69 y s = 24.36, t0.05,25  1.708

s  24.36 
x  t ,n 1
, 370.69  (1.708)    370.69  8.16  378.85, la cota superior es 378.85
n  26 
b. La cota superior de predicción para un nivel de predicción de 95% esta dada por:

1 1
x  t ,n 1s 1  , 370.69  1.708(24.36) 1   370.69  42.45  413.14,
n 26
la cota superior es 413.14
Se observa que está cota es mayor que la cota de confianza, debido a que el error de predicción
es, X  X n1 , una diferencia entre dos variables aleatorias, mientras que el error de
135

estimación es, X   , la diferencia entre una variable aleatoria y un valor fijo. El intervalo
de predicción es más amplio que el intervalo de confianza porque hay más variabilidad en el
error de predicción que en el error de estimación.

c. Puesto que Xn + 1 es independiente de X1, …, Xn , entonces también es independiente de X


así que la varianza del error de predicción es:
2  1
V ( X  X n 1 )  V ( X )  V ( X n 1 )    2   2 1  
n  n
El error de predicción por ser una combinación lineal de variables aleatorias independientes,
distribuidas normalmente, tiene distribución normal estándar, pero al reemplazar  por la
desviación estándar muestral s, tendrá aproximadamente una distribución t con n – 1 grados
de libertad. Siguiendo este procedimiento, necesitamos encontrar la varianza de X  X nuevo ,
entonces:
V ( X  X nuevo )  V ( X )  V ( X nuevo )  V ( X )  V ( 12 ( X 27  X 28 ))
 V ( X )  V ( 12 X 27 )  V ( 12 X 28 )  V ( X )  14 V ( X 27 )  14 V ( X 28 )
21 1 1 1
   2   2  2   
n 4 4 2 n
X  X nuevo 1 1
Entonces llegamos a T  y el intervalo será: x  t 2,n 1  s 
1 1 2 n

s
2 n
Sustituyendo los valores dados, tenemos:
1 1
370.69  1.708(24.36)   370.69  30.53 , el intervalo es (340.16, 401.22)
2 26

9. En un estudio para medir la destreza de las personas para caminar en línea recta (Can We
Really Walk Straight?” Amer. J. of Physical Antro. 1992, pp. 19 – 27) se muestran los datos
siguientes de la cadencia (pasos por segundo) para una muestra de n = 20 hombres saludables
seleccionados al azar.
Una gráfica de probabilidad normal respalda la hipótesis de que la distribución poblacional
de la cadencia es aproximadamente normal.
a. Calcule e interprete un intervalo de confianza de 95% para la cadencia promedio
poblacional.
b. Calcule e interprete un intervalo de predicción de 95% para la cadencia de un solo
individuo, seleccionado al azar entre esa población.
c. Calcule un intervalo que comprenda un mínimo de 99% de las cadencias en la distribución
poblacional usando un nivel de confianza de 95%.

10. Se seleccionó una muestra de 25 piezas de material laminado utilizado en la fabricación de


tarjetas de circuito y se determinó la cantidad de deformación para cada pieza bajo ciertas
condiciones, en pulgadas; se obtuvo una deformación promedio muestral de 0.0635 y una
desviación estándar muestral de 0.0065.
c. Calcule un pronóstico de la cantidad de deformación de una sola pieza de laminado, de
forma que muestre información sobre la precisión y la fiabilidad.
d. Calcule un intervalo con el cual se pueda tener gran confianza de al menos el 95% de todas
las piezas de laminado tengan deformaciones entre los dos límites de intervalo.

11. Una tabulación más extensa de valores críticos t que la presentada, indica que para la
distribución t con 20 grados de libertad, las áreas a la derecha de los valores 0.687, 0.860 y
1.064 son 0.25, 0.20 y 0.15, respectivamente. ¿Cuál es el nivel de confianza para cada uno de
136

los siguientes tres intervalos de confianza, para la media  de una población con distribución
normal? ¿Cuál de los tres intervalos recomendaría y por qué?

a. x  0.687s / 21, x  1.725s / 21 
b.  x  0.860s / 21, x  1.325s / 21 
c.  x  1.064s / 21, x  1.064s / 21 

Intervalos de confianza para la varianza y la desviación estándar de una población normal

1. Determinar los valores de las siguientes cantidades:


a.  0.1,15
2

b.  0.1,25
2

c.  .01,25
2

d.  0.005,25
2

e.  0.99,25
2

f.  0.995,25
2
137

2. Determine lo siguiente:
a. El 95to percentil de la distribución ji-cuadrada con v = 10.
b. El quinto percentil de distribución ji-cuadrada con v = 10.
c. P (10.98  2  36.78) donde 2 es una variable aleatoria ji – cuadrada con v = 22.
d. P (2 < 14.611 o 2 > 37.652) donde 2 es una variable aleatoria ji – cuadrada con v = 25.

3. Se determinó la cantidad de expansión lateral (mils) para una muestra de n = 9 soldaduras de


arco de metal y gas accionado por pulsos, empleados en tanque contenedores de gas licuado
natural en barcos. La desviación estándar muestral resultante fue s = 2.81 mils. Suponiendo
normalidad, determine un intervalo de confianza de 95% para 2 y .

4. Se hicieron las siguientes observaciones de resistencia a la fractura de placas de base 18% de


acero maragizado al níquel [“Fracture Testing of Weldments”, ASTM Special Publ. No. 381,
1965, pp 328 – 356 (en ksi , dadas en orden creciente):

69.5 71.9 72.6 73.1 73.3 73.5 75.5 75.7 75.8 76.1 76.2
76.2 77.0 77.9 78.1 79.6 79.7 79.9 80.1 82.2 83.7 93.7
Calcule un intervalo de confianza de 99% para la desviación estándar de la distribución de la
resistencia a la fractura. ¿Es válido este intervalo, cualquiera que sea la naturaleza de la
distribución? Explique.
Solución:

Estadísticas descriptivas:
Variable N Media Desv.Est. Varianza Mínimo Q1 Mediana Q3
X 22 77.33 5.04 25.37 69.50 73.45 76.20 79.75

Variable Máximo
X 93.70
(n  1) S 2 (n  1) S 2
El intervalo para la varianza es:  2 
2 / 2,n 1 12 / 2, n1

0.005,21
2
 41.399, 0.995,21
2
 8.033, s 2  25.37

21(25.37) 21(25.37)
 2  , 12.869   2  66.322),  (12.869,66.322)
41.399 8.033

Para la desviación estándar (3.587, 8.144)

La validez del intervalo requiere que la resistencia a la fractura este distribuida normalmente
o en último caso aproximadamente.

5. Los resultados de un análisis de turbiedad Wagner de 15 muestras de arena patrón de prueba


Ottawa fueron (en microampers):

26.7 25.8 24.0 24.9 26.4 25.9 24.4 21.7 24.1 25.9
27.3 26.9 27.3 24.8 23.6

a. ¿Es posible que se haya seleccionado esta muestra de una población con distribución
normal?
b. Calcule una cota superior de confianza con nivel de 95% para la desviación estándar
poblacional de turbiedad.
138

6. El tiempo de reacción (TR) para un estímulo es el período que comienza con la presentación
de un estímulo y termina con el primer movimiento discernible de cierto tipo. El artículo
“Relationship of Reaction Time and Movement Time in a Gross Motor Skill” (Perceptual and
Motor Skills, 1973, pp. 453 – 454) reporta que el TR promedio muestral para 16 nadadores
experimentados, al arranque con un disparo, fue de 0.214 s y la desviación estándar muestral
fue 0.036 s.
a. Planteada cualquier suposición necesaria, determine un intervalo de confianza de 90% para
el verdadero promedio de tiempo de reacción de todos los nadadores experimentados.
b. Calcule una cota superior de confianza de 90% para la desviación estándar de la
distribución de tiempos de reacción.
c. Pronostique el tiempo de reacción para otro individuo, en una forma que muestre
información sobre la precisión y fiabilidad.
139

PRINCIPALES DISTRIBUCIONES DE PROBABILIDAD CONTINUAS

DISTRIBUCION NORMAL

1. Sea Z una va normal estándar, calcule las siguientes probabilidades, dibujando figuras
siempre que sea posible.
a. P(0 ≤ Z ≤ 2.17)
b. P(0 ≤ Z ≤ 1)
c. P(-2.50 ≤ Z ≤ 0)
d. P(- 2.50 ≤ Z ≤ 2.50)
e. P(Z ≤ 1.37)
f. P(- 1.75 ≤ Z)
g. P(- 1.50 ≤ Z ≤ 2)
h. P(1.37 ≤ Z ≤ 2.50)
i. P(1.50 ≤ Z)
j. P(Z ≤ 2.50)
Solución:
a. P(0  Z  2.17)  (2.17)  (0)  0.985  0.500  0.485
b. P(0  Z  1)  (1)  (0)  0.8413  0.500  0.3413
c, P(2.50  Z  0)  (0)  (2.50)  0.500  0.0062  0.4938
d. P(2.50  Z  2.50)  (2.50)  (2.50)  0.9938  0.0062  0.9876
e. P(Z  1.37)  (1.37)  0.9147
f. P(1.75  Z )  1  P(Z  1.75)  1  (1.75)  1  0.0401  0.9599
g. P(1.50  Z  2.00)  (2.00)  (1.50)  0.9772  0.0668  0.9104
h. P(1.37  Z  2.50)  (2.50)  (1.37)  0.9938  0.9147  0.0791
i. P(1.50  Z )  1  P(Z  1.50)  1  (1.50)  1  0.9332  0.0668
j. P( Z  2.5)  P(2.5  Z  2.5)  (2.5)  (2.5)  0.9876

(c) (d)
140

(e) (g)

(h) (i)

2. En cada caso determine el valor de la constante c que exprese correctamente el


enunciado de probabilidad.
a. (c) = 0.9838
b. P(0 ≤ Z ≤ c) = 0.291
c. P(c ≤ Z) = 0.121
d. P(- c ≤ Z ≤ c) = 0.668
e. P(c ≤ Z ) = 0.016
Solución:
a. Buscando en las tablas el valor al que corresponde 0.9820, encontramos que c =
2.14
P(0  Z  c)  (c)  (0)  0.291, (c)  0.291  (0)
b.
(c)  0.291  0.500  0.791
Buscando en las tablas el valor al que corresponde 0.791, encontramos que c = 0.8
P(c  Z )  1  P( Z  c)  1  (c)  0.121
c.
(c)  1  0.121  0.879 c  1.17
P(c  Z  c)  (c)  (c)  (c)  1  (c)   2(c)  1  0.668
d. 1  0.668
 (c )   0.834, c  0.97
2
141

e.
P  c  Z   0.016, 1  P  Z  c   0.016, 1   P(c  Z  c)  0.016
1   (c)  (c)   0.016, 1   (c)  (1   (c))   0.016
2  0.016
2  2(c)  0.016, (c)   0.992 c  2.41
2

3. Encuentre los siguientes percentiles para la distribución normal estándar. Interpole


cuando sea apropiado.
a. 91ro
b. 9no
c. 75to
d. 25to
e. 6to
Solución:
a. El 91ro percentil, corresponde a ( z)  0.91,  z  1.34 (el valor más
aproximado)
b. El 9no percentil = - 91ro percentil,  z =  1.34 (debido a la simetría de la
distribución)
c. El 75to percentil, corresponde a ( z)  0.75 , tenemos (0.67) = 0.7486 y (0.68)
= 0.7517, interpolando dentro de estos valores tenemos:
0.0017
0. 7517 – 0. 7486 = 0.0031, 0.7517 – 0.7500 = 0.0017  0.548
0.0031
0.68 – 0.67 = 0.01, 0.548  0.01 = 0.00548
Por tanto z = 0.67 + 0.00548 = 0.67548 z = 0.67548

d. El 25to percentil, corresponde a,  75to percentil por tanto z =  0.67548

e. El 6to percentil corresponde a ( z)  0.06 , tenemos (-1.55) = 0.0606 y (-1.56)


= 0.0594, interpolando dentro de estos valores tenemos:
0.0006
0.0606 – 0.0594 = 0.0012, 0.0606 – 0.0600 = 0.0006  0.5
0.0012
0.5  0.01 = 0.005, por tanto z = - 1.55 + 0.005 = - 1.555 z =  1. 555

4. Determine z para lo siguiente:


a.  = 0.0055
b.  = 0.09
c.  = 0.663
Solución:
a. 100(1- ) = 100(1- 0. 0055) = 99.45to percentil
z  (0.9945)  2.54
b. 100(1- ) = 100(1 – 0.09) = 99 z es 91ro percentil
z  (0.91)  1.34
c. 100(1- ) = 100(1 – 0.663) = 33.7 z es 33.7ro percentil
z  (0.337)  0.42
142

5. Si X es una va normal con media 80 y desviación estándar 10, calcule las siguientes
probabilidades mediante estandarización.
a. P(X ≤ 100)
b. P(X ≤ 80)
c. P(65 ≤ X ≤ 100)
d. P(70 ≤ X)
e. P(85 ≤ X ≤ 95)
f. P(X - 80 ≤ 10)
Solución:
x
Para estandarizar a la variable normal usamos la va Z  . Con  = 80 y 

= 10
 100  80 
a. P( X  100)  P  Z    (2)  0.9772 P( X  100)  0.9772
 10 
 80  80 
b. P( X  80)  P  Z    (0)  0.500 P( X  80)  0.500
 10 
c.
 65  80 100  80 
P(65  X  100)  P  Z   (2)  (1.5)
 10 10 
 0.9772  0.0668  0.9104 P(65  X  100)  0.9104

d.
 70  80 
P(70  X )  1  P( X  70)  1  P  Z    1  (1)
 10 
P(70  X )  1  0.1587  0.8413 P(70  X )  0.8413
e.
 85  80 95  80 
P(85  X  95)  P  Z   (1.5)  (0.5)
 10 10 
 0.9332  0.6915  0.2417 P(65  X  100)  0.9104
f.
P(| X  80 | 10)  P(10  X  80  10)  P(70  X  90)
 70  80 90  80 
 P Z   (1)  (1)
 10 10 
 0.8413  0.1587  0.6826 P(| X  80 | 10)  0.6826

6. Suponga que la fuerza que actúa sobre una columna, que ayuda a sostener un edificio,
está normalmente distribuida con media de 15.0 kips y desviación estándar 1.25 kips.
¿Cuál es la probabilidad de que la fuerza:
a. sea a lo sumo 17 kips?
b. Se encuentre entre 10 y 12 kips?
c. difiera de 15 kips en a lo sumo 2 DE?
Solución:
x
a. Para una distribución normal con  = 15.0 y  = 1.25, la va Z  ,

143

 17  15 
P( X  17)  P  Z    (1.60)  0.9452 P( X  17)  0.9452
 1.25 
 10  15 12  15 
P(10  X  12)  P  Z   (2.4)  (4)
b.  1.25 1.25 
 0.0082  0  0.0082 P(10  X  12)  0.0082
c.
P(| X  15 | 2.5)  P(2.5  X  15  2.5)  P(12.5  X  17.5)
 12.5  15 17.5  15 
 P Z   (2)  (2)
 1.25 1.25 
 0.9772  0.0228  0.9544 P(| X  15 | 2.5)  0.9544

7. El artículo “Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr.,


1995, pp. 785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en
un reactor se distribuye normalmente con  = 0.30 y  = 0.06.
a. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
c. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de
concentración?
Solución:
x
a. Para una distribución normal con  = 0.30 y  = 0.06, la va Z  , y la probabilidad

pedida es:
 0.25  0.30   0.25  0.30 
P( X  0.25)  P  Z   1 P Z    1  (0.833)
 0.06   0.06 
P( X  0.25)  1  0.2033  0.7967 P( X  0.25)  0.7967
 0.10  0.30 
b. P( X  0.10)  P  Z    (3.333)  0.0004 P( X  0.10)  0.0004
 0.06 
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son más
grandes), el 95 percentil de la distribución normal estándar es 1.645, entonces:
 c  0.30  c  0.30
P Z    0.95, (1.645)  0.95   1.645
 0.06  0.06
despejando a c, c  1.645(0.06)  0.30  0.3987 c  0.3987mg/cm3

8. Suponga que el diámetro de los árboles de determinado tipo, se distribuye


normalmente con  = 8.8 y  = 2.8, como se sugiere en el artículo “Simulating
Harvester – Forwarder Softwood Thinning” (Forest Products J., mayo de 1997, pp.
36 - 41).
a. ¿Cuál es la probabilidad de que el diámetro de un árbol, seleccionado al azar, sea a
lo sumo de 10 pulg? y ¿qué sea mayor de 10 pulg?
b. ¿Cuál es la probabilidad de que el diámetro de un árbol seleccionado al azar sea
mayor de 20 pulg?
c. ¿Cuál es la probabilidad de que el diámetro de un árbol seleccionado al azar esté
entre 5 y 10 pulg?
d. ¿Qué valor de c es tal que el intervalo (8.8 – c, 8.8 + c) incluya el 98% de todos los
valores del diámetro?
Solución:
144

a. Para la distribución normal con  = 8.8 y  = 2.8, tenemos:


 10  8.8 
P( X  10)  P  Z    (0.428)  0.6664 P( X  10)  0.6664
 2.8 
P( X  10)  1  P( X  10)  1  0.6664  0.3336 P( X  10)  0.3336
 20  8.8 
b. P( X  20)  1  P( X  20)  1  P  Z    1  (4.35)  1  1  0 P( X  20)  0
 2.8 
 5  8.8 10  8.8 
P(5  X  10)  P  Z    (0.43)  (1.36)
c.  2.8 2.8 
P(5  X  10)  0.6664  0.0869  0.5795 P(5  X  10)  0.5795
 8.8  c  8.8 8.8  c  8.8 
d. P  Z    0.98, esto significa que en los extremos quedará sólo
 2.8 2.8 
el 1%, así encontrando el valor de c en el extremo izquierdo:
 c  c
P Z    0.01, (2.33)  0.01   2.33
 2.8  2.8
c  (2.33)(2.8)  6.524 c  6.524
e. Esta es una distribución binomial con n = 4 y p = 0.3336 y la distribución pedida es:
P( X  1)  1  P( X  1)  1  b(0;4,0.3336)
 4  
P( X  1)  1    (0.3336)0 (0.6664) 4   1  0.1972  0.8028 P( X  1)  0.8028
 0  

9. Hay dos máquinas para cortar corchos destinados a usarse en botellas de vino. La
primera produce corchos con diámetros normalmente distribuidos con media de 3 cm
y desviación estándar de 0.1 cm. La segunda máquina produce corchos con diámetros
que tienen una distribución normal con media de 3.04 cm y desviación estándar de
0.02 cm. Los corchos aceptables tienen diámetros entre 2.9 cm y 3.1 cm. ¿Cuál
máquina tiene más probabilidad de producir un corcho aceptable?
Solución:
Para la primera máquina con  = 3.0 y  = 0.1, tenemos:
 2.9  3.0 3.1  3.0 
P(2.9  X  3.1)  P  Z    (1)  (1)
 0.1 0.1 
P(2.9  X  3.1)  0.8413  0.1587  0.6826 P(2.9  X  3.1)  0.6826

Para la segunda máquina con  = 3.04 y  = 0.02, tenemos:


 2.9  3.04 3.1  3.04 
P(2.9  X  3.1)  P  Z    (3)  (7)
 0.02 0.02 
P(2.9  X  3.1)  0.9987  0  0.9987 P(2.9  X  3.1)  0.9987

Por tanto la segunda máquina tiene más probabilidad de producir corchos aceptables

10. a. Si una distribución normal tiene  = 25 y  = 5, ¿cuál es el 91no percentil de la


distribución?
b. ¿Cuál es el sexto percentil de la distribución del inciso (a)?
c. El ancho de una línea grabada en un chip de circuito integrado está normalmente
distribuido con media de 3.000 m y desviación estándar 0.150. ¿Qué valor separa
al 10% más ancho de todas las líneas del otro 90%?
Solución:
145

a. Para una distribución normal con  = 25 y  = 5, tenemos:


 x  25   x  25 
P( X  x)  0.91, P  Z    0.91, entonces     0.91
 5   5 
x  25
 1.34 despejando x, x  31.7  91no percentil  31.7
5
b. De la misma manera el sexto percentil
 x  25   x  25 
P( X  x)  0.06, P  Z    0.06, entonces     0.06
 5   5 
x  25
 1.555 despejando x, x  17.225  6º percentil  17.225
5
c. Para una distribución normal con  = 3.000 y  = 0.150, ahora necesitamos calcular
el
90no percentil

 x  3.000   x  3.0 
P( X  x)  0.90, P  Z    0.90, entonces     0.90
 0.150   0.15 
x  3.00
 1.28 despejando x, x  3.192  90no percentil  3.192
0.15

11. En el artículo “Monte Carlo Simulation – Tool for Better Understanding of LRFD”(J.
Structural Engr., 1993, pp. 1586 – 1599) se indica que la resistencia a la deformación
permanente (ksi) para acero grado A36 está normalmente distribuida con  = 43 y 
= 4.5.
a. ¿Cuál es la probabilidad de que la resistencia a la deformación permanente sea a lo
sumo 40? y ¿mayor de 60?
b. ¿Cuál valor de resistencia a la deformación permanente separa al 75% más fuerte
de los otros?
Solución:
a. Para una distribución normal con  = 43 y  = 4.5, tenemos:
 40  43 
P( X  40)  P  Z    (0.667)  0.2514 P( X  40)  0.2514
 4.5 
 60  43 
P( X  60)  1  P( X  60)  1  P  Z    1  (5.11)  1  1  0 P( X  60)  0
 4.5 
b. Se requiere encontrar el 25 percentil, entonces, sea c este valor:

 c  43  c  43
P( X  c)  0.75, P  Z    0.25, (0.67)  0.25, entonces  0.67
 4.5  4.5
despejando el valor de c, c  (0.67)(4.5)  43  39.985 c  39.985

12. El dispositivo automático de apertura de un paracaídas militar de carga se ha diseñado


para abrirse cuando se encuentre a 200m de altura. Suponga que la altitud de apertura
en realidad tienen una distribución normal con valor medio de 200 m y desviación
estándar de 30 m. Habrá daño al equipo si el paracaídas se abre a 100m. ¿Cuál es la
probabilidad de que haya daño a la carga en al menos uno de cinco paracaídas
lanzados independientemente?
Solución:
146

Con  = 200 y  = 30, la probabilidad que se desea saber es P (X  100)


 100  200 
P( X  100)  P  Z    (3.333)  0.0004 P( X  100)  0.0004
 30 
Ahora tenemos una distribución binomial; b(x; 5, 0.0004)
 5  
P( X  1)  1  P( X  1)  1    (0.0004)0 (0.9996)5   1  0.998
 0  
P( X  1)  0.002
13. La lectura de temperatura de un termopar puesto en un medio de temperatura
constante está normalmente distribuida con media  la temperatura real del entorno y
la desviación estándar . ¿Cuál tendría que ser el valor de  para asegurar que 95%
de todas las lecturas se encuentren dentro de 0.1º de ?
Solución:
La probabilidad buscada es:

P(  0.1  X    0.1)  0.95


   0.1     0.1   
P Z   0.95
   
Esto implica que:

 0.1 
   0.025, (1.96)  0.025
  
0.1 0.1
 1.96    0.051
 1.96

14. La distribución de resistencia para resistores de cierto tipo es normal, 10% de todos
los resistores tienen una resistencia que excede los 10.256 ohms y 5% una resistencia
menor de 9.671 ohms. ¿Cuáles son los valores de la media y la desviación estándar de
la distribución de resistencia?

Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
 10.256     9.671   
P Z    0.90 y P  Z    0.05,
     
10.256   9.671  
(1.28)  0.90 y (1.645)  0.05, entonces:  1.28,  1.645
 
Obtenemos las ecuaciones: 1.28    10.256 y  1.645    9.671
resolviendo el sistema tenemos:10.256  1.28  9.671  1.645 , 2.925  0.585
  0.2   10

15. Si la longitud de roscado de un perno está normalmente distribuido. ¿Cuál es la


probabilidad de que la longitud de un perno seleccionado al azar esté:
a. dentro de 1.5 DE de su valor medio?
b. a más de 2.5 DE de su valor medio?
c. entre 1 y 2 DE de su valor medio?
Solución:
a.
147

   1.5     1.5   
P Z    (1.5)  (1.5)
   
 0.9332  0.0668)  0.8664
P (dentro de 1.5 DE) = 0.8664
b.

P( X    2.5 o X    2.5 )  1  P(   2.5  X    2.5 )


= 1  P(2.5  Z  2.5)  1  (2.5)  ( 2.5) 
 1  (0.9938  0.0062)  1  0.9876
P( X    2.5 o X    2.5 )  0.0124

c. P(  2  X   1 o   1  X    2 ) = P(ancho de 2 DE) – P(ancho 1


DE)
 P(   2  X    2 )  P(     X     )
 P(2  Z  2)  P(1  Z  1)  (0.9772  0.0228)  (0.8413  0.1587)
 0.2618
16. Una máquina que produce cojinetes se prepara de modo que el diámetro promedio de
los cojinetes sea de 0.500 pulg. Un cojinete es aceptable si su diámetro está dentro
0.004 pulg de su valor objetivo. Sin embargo suponga que hay variación durante el
curso de la producción, de modo que el diámetro de los cojinetes tiene una distribución
normal con valor medio 0.499 pulg y desviación estándar 0.002 pulg. ¿Qué porcentaje
de los cojinetes no es aceptable?
Solución:
Para esta distribución normal con  =0.499 y  = 0.002, entonces tenemos:
P(0.500  0.004  X  0.500  0.004)  P(0.496  X  0.504) , esta probabilidad es
la que corresponde cuando el diámetro es aceptable, por tanto la probabilidad deseada
es:
 0.496  0.499 0.504  0.499 
1  P(0.496  X  0.504)  1  P  Z 
 0.002 0.002 
 1   (2.5)  (2.5)  1  (0.9938  0.0062)  0.0124
El porcentaje de cojinetes que no es aceptable = 1.24%

17. La presión de aire de un neumático seleccionado al azar, instalado en un automóvil


nuevo, está normalmente distribuido con valor medio de 31 lb/pulg2 y desviación
estándar de 0.2 lb/pulg2.
a. ¿Cuál es la probabilidad de que la presión de un neumático, seleccionado al azar,
exceda de 30.5 lb/pulg2?
b. ¿Cuál es la probabilidad de que la presión de un neumático seleccionado al azar, se
encuentre entre 30.5 y 31.5 lb/pulg2? y ¿entre 30 y 32 lb/pulg2?
c. Suponga que un neumático se considera con presión baja si está debajo de 30.4
lb/pulg2. ¿Cuál es la probabilidad de que al menos uno de los cuatro neumáticos se
encuentre bajo? (Sugerencia: si A = {al menos un neumático está bajo}, ¿cuál es el
complemento de A?
Solución:
a. Con  = 31 y  = 0.2, tenemos
148

 30.5  31 
P( X  30.5)  1  P( X  30.5)  1  P  Z    1  (2.5)
 0.2 
P( X  30.5)  1  0.0062  0.9938
 30.5  31 31.5  31 
P(30.5  X  31.5)  P  Z    (2.5)   (2.5)
b.  0.2 0.2 
P(30.5  X  31.5)  0.9938  0.0062  0.9876
c.
 30.4  31 
P( X  30.4)  P  Z    (3)  0.0013
 0.2 
Ahora tenemos una distribución binomial, b (x; 4, 0.0014) y la probabilidad deseada
es:
P( X  1)  1  P( X  1)  1  b(0; 4, 0.0013)
 4  
 1    (0.0013)0 (0.9987)4   1  0.9948  0.0052
 0  
P( X  1)  0.0052

18. La dureza Rockwell de un metal se determina al golpear con un punto acerado la


superficie del metal y después medir la profundidad de penetración del punto.
Suponga que la dureza Rockwell de cierta aleación está normalmente distribuida con
media de 70 y desviación estándar de 3 (la dureza Rockwell se mide en una escala
continua).
a. Si un espécimen es aceptable solo si su dureza está entre 67 y 75, ¿cuál es la
probabilidad de que un espécimen seleccionado al azar tenga una dureza aceptable?
b. Si la escala aceptable de dureza es (70 – c, 70 + c), para que valor de c tendría una
dureza aceptable 95% de todos los especímenes?
c. Si la escala aceptable es como en el inciso (a) y la dureza de cada diez especímenes
seleccionados al azar se determina independientemente, ¿cuál es el número
esperado de especímenes aceptables entre los diez?
d. ¿Cuál es la probabilidad de que a lo sumo ocho de diez especímenes seleccionados
independientemente tengan una dureza menor de 73.84? (Sugerencia: Y = número
entre diez especímenes con dureza menor de 73.84 es una variable binomial; ¿cuál
es p?)
Solución:
a. Con  = 70 y  = 3, tenemos

 67  70 75  70 
P(67  X  75)  P  Z   (1.67)  (1)
 3 3 
P(67  X  75)  0.9525  0.1587  0.7938 P(67  X  75)  0.7938
b.
149

 70  c  70 70  c  70 
P Z   0.95
 3 3 
 c c
P    Z    0.95
 3 3
c  c
         0.95
3  3
 c c
     0.025 o     0.975
 3  3
c c
  1.96 o  1.96
3 3

Por tanto c = 5.88

c. Ahora se tiene una distribución binomial b(x; 10, 0.7938) y para esta distribución
E(X) = np por tanto E(X) = 10(0.7938) = 7.938 o E(X) = 8

d. Primero determinemos la probabilidad de que la dureza sea menor de 73.84


 73.48  70 
P( X  73.48)  P  Z    (1.16)  0.8770
 3 
Ahora tenemos b(x; 10, 0.8770), por tanto
10  10  
P( X  8)  1  P( X  8)  1    (0.877)9 (0.123)    (0.877)10 (0.123) 0 
 9  10  
 1   0.37748  0.26915  1  0.64663 P( X  8)  0.3534

19. La distribución de peso de paquetes enviados en cierto modo, es normal con valor
medio de 10 lb y desviación estándar de 2 lb. El servicio de paquetería desea establecer
un valor de peso c, más allá del cual habrá un cargo extra. ¿Cuál valor de c es tal que
99% de todos los paquetes pesen por lo menos una libra abajo del peso con cargo
extra?
Solución:
Con  = 10 y  = 2 . La condición deseada es que el 99% del área este ubicada a la
izquierda de c – 1 lo que implica que c – 1 es el 99 percentil de la distribución,
entonces:
 c  1  10   c  11 
P  X  c  1  0.99, P  Z    0.99,     0.99
 2   2 
c  11
 2.33,  c  15.66
2

20. Considere a los bebés que nacen en un intervalo “normal” de 37 a 43 semanas de edad
de gestación. Gran cantidad de datos apoyan la suposición de que para esos niños que
nacen en Estados Unidos, el peso de nacimiento tiene una distribución normal con
media igual a 3432 g y desviación estándar de 482 g. [En el artículo “ Are Babies
Normal” (The American Statistician (199): 298 – 302) se analizan datos de un año
150

en particular; para una elección sensible de intervalos de clase, la apariencia del


histograma no era nada normal, aunque más tarde se determinó que esto se debía a
que en algunos hospitales la medición del peso se hacía en gramos y en otros hasta la
onza más próxima y luego se convertía en gramos. Con una elección modificada de
intervalos de clase se tomó en cuenta lo anterior se obtuvo un histograma descrito de
manera adecuada mediante una distribución normal.
a. ¿Cuál es la probabilidad de que el peso de nacimiento de un bebé de este tipo
elegido al azar exceda 4000 g?
b. ¿Cuál es la probabilidad de que el peso de nacimiento de un bebé de este tipo
elegido al azar sea menos de 2000 g o mayor de 5000g?
c. ¿Cuál es la probabilidad de que el peso de nacimiento de un bebé de este tipo
elegido al azar sea mayor que 7 libras?
d. ¿Cómo caracterizaría el 1% más extremo de los pesos de nacimiento?
e. Si X es una variable aleatoria con una distribución normal y a es una constante
numérica (a  0), entonces Y = aX también tiene una distribución normal. Utilice
esto para determinar la distribución del peso de nacimiento expresado en libras
(forma, media y desviación estándar), y luego calcule de nuevo la probabilidad del
inciso (c). ¿De qué manera se compara esto con su respuesta anterior?
Solución:
a. Con  = 3432 y  = 482, tenemos:
 4000  3432 
P( X  4000)  1  P( X  4000)  1  P  Z  
 482 
 1  (1.18)  1  0.881  0.119 P( X  4000)  0.119
b. P(X < 2000 o X > 5000) = P(X < 2000) + P(X > 5000)

 2000  3432 
P( X  2000)  P  Z    (2.97)  0.0015, P( X  2000)  0.0015
 482 

 5000  3432 
P( X  5000)  1  P( X  5000)  1  P  Z  
 482 
 1  (3.25)  1  0.9994  0.0006 P( X  5000)  0.0006

P(X < 2000 o X > 5000) = 0.0021

c. Considerando que 1 lb = 454 g, entonces 7 lb = 3178 g


 3178  3432 
P( X  3178)  1  P( X  3178)  1  P  Z  
 482 
 1  (0.527)  1  0.2981  0.7019 P( X  3178)  0.7019
d. Para los límites extremos inferior y superior del 1% corresponden al 1 percentil y
el 99 percentil, por tanto:
 x  3432   x  3432 
PZ    0.005,     0.005
 482   482 
x  3432
 2.575  x  2191
482
151

 x  3432   x  3432 
PZ    0.995,     0.995
 482   482 
x  3432
 2.575  x  4673
482
e.
21. En respuesta a las preocupaciones acerca del contenido nutrimental de la comida
rápida, McDonald’s anunció que empleará un nuevo aceite de cocina para sus papas
fritas, que disminuirá en forma sustancial la concentración de ácidos grasos, e
incrementará la cantidad de grasas poliinsaturadas más benéficas. La compañía afirma
que 97 de cada 100 personas no detectan una diferencia de sabor entre los aceites
nuevo y antiguo. Suponiendo que esta cifra sea correcta (como proporción a largo
plazo), ¿cuál es la probabilidad aproximadamente de que una muestra de 100
individuos elegidos al azar que compraron papas en McDonald’s,
a. por lo menos 40 noten la diferencia entre los dos aceites?
b. a lo sumo 5% noten la diferencia entre los dos aceites?
Solución:
a. La distribución es binomial con p = 0.97 y n = 100, sin embargo podemos
aproximarla a una distribución normal, con  = np y 2 = npq, entonces  = 97 y
 = 1.7059
La probabilidad de que por lo menos 40 noten la diferencia, corresponde a que menos
de 40 no lo noten y en este caso la va X = persona que no nota la diferencia, por
tanto:
 40  0.5  97 
P( X  40)  P  Z    (33.12)  0 P( X  40)  0
 2.91 

Esto significa que la probabilidad de que mas de 40 personas noten la diferencia es = 0


b. 5% de 100 = 5. Análogamente al inciso anterior, que a lo sumo 5 noten la diferencia
corresponde a que mas de 5 no noten la diferencia, por tanto:
 5  0.5  97 
P( X  5)  1  P  Z    1  (54.22)  1 P( X  5)  1
 2.91 
Esto significa que la probabilidad de que a sumo 5 noten la diferencia es = 1

22. La desigualdad de Chebyshev es válida tanto para las distribuciones continuas como
discretas. La desigualdad establece que para cualquier número k  1,
P(| X   |  k )  1/ k 2 .
Obtenga esta probabilidad en el caso de una distribución normal para k = 1, 2 y 3, y
compare con el límite superior.
Solución:
P(| X   |  k )  1  P(| X   |  k ) ,
Pero, tenemos que | X   |  k ,  k  X    k , k    X  k   ,
así:
P(| X   |  k )  P(k    X  k   )
 k     k     
 P Z   P(  k  Z  k )
   
Para k = 1, P(1  Z  1)  (1)  (1)  0.8413  0.1587  0.6826
 P(| X   |   )  1  0.6826  0.3174  1
152

Para k = 2, P(2  Z  2)  (2)  (2)  0.9772  0.0228  0.9544


1
 P(| X   |  2 )  1  0.9544  0.0456   0.25
22

Para k = 3, P(3  Z  3)  (3)  (3)  0.9987  0.0013  0.9974


1
 P(| X   |  3 )  1  0.9974  0.0026  2  0.111
3

23. Sea X (una variable de valores enteros) la cantidad de defectos de un rollo de 100m
de cinta magnética. Suponga que X tiene una distribución aproximadamente normal
con  = 25 y  = 5. Use la corrección de continuidad para calcular la probabilidad de
que la cantidad de defectos sea:
a. entre 20 y 30 inclusive.
b. A lo sumo 30, menos de 30.
Solución:
 x  0.5  np 
a. P(X  x) = B(x; n, p) =   
 npq 

Esta aproximación es adecuada para np  10 y nq  10. En este caso  = 25 y  =
5
 20  0.5  25 30  0.5  25 
P(20  X  30)  P  Z   (1.1)  (1.1)
 5 5 
P(20  X  30)  0.8643  0.1357  0.7286 P(20  X  30)  0.7286
 30  0.5  25 
b. P( X  30)  P  Z    (1.1)  0.8643 P( X  30)  0.8643
 5 
 29.5  25 
P( X  30  0.5)  P  Z    (0.9)  0.8159
 5 

24. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una
de las siguientes probabilidades usando la aproximación normal (con la corrección de
continuidad) para los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades
exactas calculadas de la tabla correspondiente.
a. P(15 ≤ X ≤ 20)
b. P(X ≤ 15)
c. P(20 ≤ X)
Solución:
a. n  25, p  0.5,   np  12.5,   npq  2.5
 15  0.5  12.5 20  0.5  12.5 
P(15  X  20)  P  Z   (3.2)  (0.8)
 2.5 2.5 
P(15  X  20)  0.9993  0.7881  0.2112 P(15  X  20)  0.7286

Para n  25, p  0.6,   np  15,   npq  2.45


 15  0.5  15 20  0.5  15 
P(15  X  20)  P  Z   (2.245)  (0.2041)
 2.45 2.45 
P(15  X  20)  0.9875  0.4207  0.5668 P(15  X  20)  0.5668
153

Para n  25, p  0.8,   np  20,   npq  2


 15  0.5  20 20  0.5  20 
P(15  X  20)  P  Z   (0.25)  (2.75)
 2 2 
P(15  X  20)  0.5987  0.0030  0.5957 P(15  X  20)  0.5957

 15  0.5  12.5 
b. Para p = 0.5 P( X  15)  P  Z    (1.2)  0.8840
 2.5 
 15  0.5  15 
Para p = 0.6 P( X  15)  P  Z    (0.2040)  0.5793
 2.45 
 15  0.5  20 
Para p = 0.8 P( X  15)  P  Z    (2.25)  0.0122
 2 
c.
 19.5  12.5 
Para p  0.5 P( X  20)  1  P( X  19.5)  1  P  Z    1  (2.8)
 2.5 
P( X  20)  1  0.9974  0.0026
 19.5  15 
Para p  0.6 P( X  20)  1  P( X  19.5)  1  P  Z    1  (1.837)
 2.45 
P( X  20)  1  0.9671  0.0329
 19.5  20 
Para p  0.8 P( X  20)  1  P( X  19.5)  1  P  Z    1  (0.25)
 2 
P( X  20)  1  0.4013  0.5987
Comparando con las probabilidades exactas:
Para p  0.5 n  25
P(15  X  20)  B(20; 25, 0.5)  B(14; 25, 0.5)  1.000  0.778  0.212
Para p  0.6 n  25
P(15  X  20)  B(20; 25, 0.6)  B(14; 25, 0.6)  0.991  0.414  0.577
Para p  0.8 n  25
P(15  X  20)  B(20; 25, 0.8)  B(14; 25, 0.8)  0.579  0.006  0.573
Para p  0.5 n  25 Para p  0.6 n  25
P( X  15)  B(15; 25, 0.5)  0.885 P( X  15)  B(15; 25, 0.6)  0.575
Para p  0.8 n  25
P( X  15)  B(15; 25, 0.8)  0.017

Para p  0.5 n  25
P( X  20)  1  B(19; 25, 0.5)  1  0.998  0.002
Para p  0.6 n  25
P( X  20)  1  B(19; 25, 0.6)  1  0.971  0.029
Para p  0.8 n  25
P( X  20)  1  B(19; 25, 0.8)  1  0.383  0.617
Haciendo un cuadro comparativo
154

Aproximación Normal Binomial

0.5 0.6 0.8 0.5 0.6 0.8


P(15  X  20) 0.2112 0.5668 0.5957 0.212 0.577 0.573
P(X  15) 0.8840 0.5793 0.0122 0.885 0.575 0.017
P(X  20) 0.0026 0.0329 0. 5987 0.002 0.029 0.617

Se observa que para los valores de p y n menores los resultados de la aproximación


normal y las probabilidades binomiales son muy similares y Lara los valores de p y
n mayores la diferencia es mayor.

25. Suponga que 10% de todos los ejes de acero producidos por cierto proceso están fuera
de las especificaciones, pero que se pueden volver a trabajar (en lugar de tener que
enviarlos a la chatarra). Considere una muestra aleatoria de 200 ejes y exprese con X
el número de los que estén fuera de las especificaciones y se puedan volver a trabajar.
¿Cuál es la probabilidad (aproximada) de que X sea:
a. a lo sumo 30?
b. Menos de 30?
c. entre 15 y 25 inclusive?

Solución:
a. La distribución es binomial, pero podemos calcular estas probabilidades con una
aproximación normal, con  = np = 20 y  2 = npq= 18 entonces:
 30  0.5  20 
P( X  30)  P  Z    (2.47)  0.9932 P( X  30)  0.9932
 18 
 29  0.5  20 
b. P( X  30)  P  Z    (2.24)  0.9875 P( X  30)  0.9875
 18 
c.
 14  0.5  20 25  0.5  20 
P(15  X  25)  P  Z   (1.30)  (1.30)
 18 18 
P(15  X  25)  0.9032  0.0968  0.8064 P(15  X  25)  0.8064

26. Suponga que solo 40% de todos los automovilistas de cierta ciudad usan con
regularidad el cinturón de seguridad. Se selecciona al azar una muestra de 500
automovilistas. ¿Cuál es la probabilidad de que:
a. entre 180 y 230 de los automovilistas de la muestra usen su cinturón con
regularidad?
b. Menos de 175 de los de la muestra utilicen su cinturón con regularidad? y ¿menos
de 150?
Solución:
a. Usando la aproximación de binomial a normal, tenemos: p = 0.4, n = 500,  = np
= 200
2 = npq = 120, entonces:
155

 180  0.5  200 230  0.5  200 


P(180  X  230)  P  z 
 120 120 
 (2.784)   (1.871)  0.9973  0.0307  0.9666
P(180  X  230)  0.9666

 174.5  200 
b. P( X  175)      (2.328)  0.0099 P( X  175)  0.0099
 120 
 149.5  200 
P( X  150)      (4.61)  0.00 P( X  150)  0.00
 120 

27. a. Demuestre que si X tiene una distribución normal con parámetros  y , entonces
Y = aX + b (una función lineal de X) también tiene distribución normal. ¿Cuáles son
los parámetros de la distribución Y [es decir E(X) y V(X)]? [Sugerencia… escriba la
fda de Y, P(Y = y), como una integral donde aparece la fdp de X y fuego derive respecto
a y para obtener la fdp de Y]
b. Si cuando se mide en ºC, la temperatura tiene una distribución normalcon media
115 y desviación estándar 2, ¿qué se puede decir acerca de la distribución de
temperatura medida en ºF?

Solución:
 y b 
F ( y )  P(Y  y )  P(aX  b  y )  P  X  
 a 
1
f ( x;  ,  )  e ( x   ) / 2
2 2

2
Entonces la fda es:
2
 yb 
y y 1     / 2 2
P(Y  y )   f ( x;  ,  )dy   e a 
dy
 
2 
1
y 1   y  b  a 2

 e 2a 
2 2
dy

2 
1
1   y  ( a  b )  2

f ( y )  F '( y )  e 2a 
2 2

2 
Se observa que Y es normal con media = a + b y varianza = a2  2.
9
b. º F  º C  32 es una función lineal, por tanto la temperatura en ºF también está
5
normalmente distribuido con:
2
9 9
  (115)  32  239 y  2    (2)2  12.96
5 5
28. El voltaje de ruptura de un diodo de cierto tipo seleccionado al azar, está normalmente
distribuido con valor medio de 40 V y desviación estándar de 1.5V.
a. ¿Cuál es la probabilidad de que el voltaje de un solo diodo esté entre 39 y 42V?
b. ¿Cuál valor es tal que sólo 15% de todos los diodos tenga voltajes que rebasen ese
valor?
156

c. Si se seleccionan independientemente 4 diodos, ¿Cuál es la probabilidad de que por


lo menos uno tenga un voltaje que exceda de 42V?
Solución:
a. Para  = 40 y  = 1.5 la probabilidad deseada es:

 39  40 42  40 
P(39  X  42)  P  Z    (1.333)  (0.667)
 1.5 1.5 
 0.9082  0.2546  0.6536 P(39  X  42)  0.6536
b. Se necesita hallar el 85 percentil, es decir:
 x  40 
P( X  x)  0.85, PZ    0.85
 1.5 
 x  40  x  40
   0.85   1.04, despejando a x
 1.5  1.5
x  1.5(1.04)  40  41.56 x  41.56
c. Calculamos primero P(X  42)
 42  40 
P( X  42)  1  P( X  42)  1  P  Z    1  (1.33)
 1.5 
P( X  42)  1  0.9082  0.0918
Ahora tenemos una distribución binomial con n = 4 y p = 0.0918
 4  
P( X  1)  1  P( X  1)  1    (0.0918)0 (0.9082) 4   1  0.68034
 0  
P( X  1)  0.3196

29. El artículo “Computer Assisted Net Weight Control” (Quality Progress, 1983, pp. 22
-25) sugiere una distribución normal, con media de 137.2 onzas y desviación estándar
de 1.6 onzas, para el contenido real de frascos de cierto tipo. El contenido establecido
era de 135 onzas.
a. ¿Cuál es la probabilidad de que un solo frasco contenga más que el contenido
establecido?
b. Entre 10 frascos seleccionados al azar, ¿cuál es la probabilidad de que por lo menos
8 contengan más del contenido establecido?
c. Si se supone que la media permanece en 137.2, ¿a qué valor tendría que haberse
cambiado la desviación estándar para que 95% de todos los frascos contengan más
de lo establecido?
Solución:
a. Con  = 137.2 oz y  = 1.6 oz

 135  137.2 
P( X  135)  1  P( X  135)  1   Z    1  (1.38)  1  0.0838  0.9162
 1.6 
P( X  135)  0.9162
b. Con Y = Número entre 10 frascos que contienen más de lo establecido, Y tiene una
distribución binomial b(y; 10, 0.9162), por tanto la probabilidad pedida es:
P(Y  8)  1  P(Y  8)  1  B(7;10,0.9162)  1  0.04512  0.95488 P(Y  8)  0.95488
c.
157

 135  137.2  135  137.2


P Z    0.05, (1.65)  0.05, entonces,  1.65
   
135  137.2
despejando  ,    1.333   1.333
1.65

30. Cuando se prueban tarjetas de circuito que se usan en la fabricación de reproductores


de discos compactos, el porcentaje de defectuosos a largo plazo es 5%. Suponga que
recibe un lote de 250 tarjetas y que la condición de cualquier tarjeta es independiente
de las demás.
a. ¿Cuál es la probabilidad aproximada de que al menos 10% de las tarjetas del lote
esten defectuosas?
b. ¿Cuál es la probabilidad aproximada de que haya exactamente 10 defectuosas en el
lote?

Solución:
a. La distribución es binomial, pero podemos calcular esta probabilidad con una aproximación
normal con  = np = 12.5 y  2 = npq= 11.875 entonces el 10% de 250 = 25 y la
probabilidad pedida es:

 24  0.5  12.5 
P( X  25)  1  B(24;250,0.05)  1  P  Z  
 11.875 
 1  (3.482)  1  0.9997  0.0003 P( X  25)  0.003
 250 
b. P( X  10)    (0.05) (0.95)  0.0963
10 240
P( X  10)  0.0963
 10 

31. El artículo “Characterization of Room Temperature Damming in Aluminum-Indium


Alloys” (Metallurgical Trans., 1993, pp. 1611 – 1619) sugiere que el tamaño (m) de
granos de la matriz de Al en una aleación que contiene 2% de Indio se puede modelar
con una distribución normal con un valor promedio de 96 y una desviación estándar
de 14.
a. ¿Cuál es la probabilidad de que el tamaño del grano sea mayor que 100?
b. ¿Cuál es la probabilidad de que el tamaño de grano esté entre 50 y 75?
c. ¿Cuál intervalo (a, b) incluye el 90% central de todos lo tamaños de grano (de tal
manera que 5% sean menores que a y 5% mayores que b)
Solución:
a. Con  = 96 y  =14
 100  96 
P( X  100)  1  P( X  100)  1  P  Z    1  (0.2857)
 14 
P( X  100)  1  0.6103  0.3897 P( X  100)  0.3897
b.

 50  96 75  96 
P(50  X  75)  P  Z   (1.5)  (3.2857)
 14 14 
P(50  X  75)  0.0668  0.0005  0.0663 P(50  X  75)  0.0663
c. Se requiere encontrar el 5 percentil y el 95 percentil, es decir:
158

 a  96   a  96 
P( X  a)  0.05, P  Z    0.05,     0.05
 14   14 
a  96
 1.645, despejando a, tenemos: a  72.97
14

 b  96   b  96 
P( X  b)  0.95, P  Z    0.95,     0.95
 14   14 
b  96
 1.645, despejando b, tenemos: b  119.03
14
Entonces el intervalo (a, b) = (72.97, 119.03)

32. La vida de un láser de semiconductores con una alimentación de energía constante


tiene una distribución normal con una vida media de 7000 horas y una desviación
estándar de 600 horas.
a. ¿Cuál es la probabilidad de que un láser falle antes de 5800 horas?
b. ¿Cuál es la vida media en horas que excede 90% de los láseres?
c. ¿Qué valor deberá tener la vida media para que 99% de los láseres excedan 10000
horas antes de fallar?
d. Un producto contiene tres láseres y el producto falla si cualquiera de ellos falla.
Suponga que fallan de manera independiente. ¿Qué valor deberá tener la vida media
para que 99% de los productos excedan 10000 horas antes de fallar?
Solución:
a. Con  = 7000 horas y  = 600, la probabilidad pedida es:
 5800  7000 
P( X  5800)  P  Z    (2.0)  0.0228 P( X  5800)  0.0228
 600 
b. Se requiere encontrar el 10 percentil, para tener el 90% de los que exceden ese valor.
 x  7000  x  7000
P Z    0.10, (1.28)  0.10,   1.28, despejando a x
 600  600
x  (1.28)600  7000  6232 x  6232 horas

c. Encontrando ahora el 1 percentil y suponiendo la misma desviación estándar, tenemos:


159

 10000    10000  
P Z    0.01, (2.33)  0.01,   2.33
 600  600
despejando a  ,   (2.33)600  10000  11398   11398 horas

d.

33. El espesor de un recubrimiento laminado para superficies de madera, tiene una


distribución normal con una media de 5 mm y una desviación estándar de 0.2 mm.
a. ¿Cuál es la probabilidad de que el espesor de un recubrimiento sea mayor de 5.5
mm?
b. Si las especificaciones requieren que el espesor esté entre 4.5 y 5.5 mm, ¿qué
proporción de los recubrimientos no cumplen con las especificaciones?
c. ¿Debajo de qué valor está el espesor del recubrimiento para 90% de las muestras?

Solución:
a. Para  = 5mm y  = 0.2mm
 5.5  5 
P( X  5.5)  1  P( X  5.5)  1  P  Z    1  (2.5)
 0.2 
P( X  5.5)  1  0.9938  0.0062 P( X  5.5)  0.0062
b.
 4.5  5 5.5  5 
P(4.5  X  5.5)  P  Z   (2.5)  (2.5)
 0.2 0.2 
P(4.5  X  5.5)  0.9938  0.0062  0.9876 P(4.5  X  5.5)  0.9876
c. En este caso se requiere encontrar el 90 percentil, es decir
 x 5  x 5
P( X  x)  0.90, P  Z    0.90,    0.90
 0.2   0.2 
x 5
 1.28, entonces x  5.256
0.2
160

DISTRIBUCION GAMMA

1. Evalúe lo siguiente:
a.  (6)
b.  (5/2)
c. F(4;5) (función gamma incompleta)
d. F(5,4)
e. F (0,4)
Solución:
a. De la propiedad de la función gamma (n)  (n  1)! , tenemos:
(6)  (6  1)!  5!  120 (6)  120
b. De las propiedades de la función gamma
1
(n)  (n  1)! ,      y ( )  (  1)(  1) , tenemos
2
 5  5   3 3 3   1 3 5 3 
      1        1        
 2  2   2 2 2   2 4 2 4
c. De la tabla para la función Gamma incompleta:
F(4, 5) = 0.371
d. F(5, 4) = 0.375
e. F(0, 4) = P(X  0; 4) = 0

2. Considere que X tiene una distribución gamma estándar con  = 7. Evalúe lo siguiente:
a. P(X ≤ 5)
b. P(X < 5)
c. P(X > 8)
d. P(3 ≤X ≤ 8)
e. P(3 <X < 8)
f. P(X < 4 o X > 6)
Solución:
x 
a. Para la función gamma estándar  = 1 y la fda. F  ,   F ( x, )
 
P( X  5)  F (5,7)  0.238 P( X  5)  0.238
161

b. P( X  5)  F (5,7)  0.238 P( X  5)  0.238


c. P( X  8)  1  F (8,7)  1  0.687 P( X  8)  0.313
d.
P(3  X  8)  F (8,7)  F (3,7)  0.687  0.034  0.653 P(3  X  8)  0.653
e.
P(3  X  8)  F (8,7)  F (3,7)  0.687  0.034  0.653 P(3  X  8)  0.653
f. P(X < 4 o X > 6) =
1  P(4  X  6)  1   F (6,7)  F (4,7)  1   0.394  0.111  0.717
P(X < 4 o X > 6) = 0.717

3. Suponga que el tiempo en horas tomado por el propietario de una casa para podar el
césped de su jardín es una va X, que tiene una distribución gamma con parámetros 
= 2 y  = ½. ¿Cuál es la probabilidad de que tarde:
a. a lo sumo una hora para podar su césped?
b. Por lo menos 2 horas?
c. entre 0.5 y 1.5 horas?
Solución:
x 
a. Con  = 2 y  = ½, la distribución gamma acumulada es: F  ,  y consultando en
 
tablas:
 1 
P( X  1)  F  , 2   F (2, 2)  0.594  P( X  1)  0.594
1 
 2 
b.
 2 
P( X  2)  1  P( X  2)  1  F  , 2   1  F (4, 2)  1  0.908  0.092 P( X  2)  0.092
1 
 2 

3   1 
P(0.5  X  1.5)  F  2 , 2   F  2 , 2   F (3, 2)  F (1, 2)  0.801  0.264
c. 1   1 
 2   2 
P(0.5  X  1.5)  0.537

4. Suponga que el tiempo empleado por un estudiante seleccionado al azar, que utiliza
una terminal conectada a un centro local de cómputo de tiempo compartido, tiene una
distribución gamma con media de 20 min. Y varianza de 80 min2.
a. ¿Cuáles son los valores de  y ?
b. ¿Cuál es la probabilidad de que un estudiante utilice la terminal a lo sumo 24 min?
c. ¿Cuál es la probabilidad de que un estudiante utilice entre 20 y 40 minutos la
terminal?
Solución:
a. Para una distribución gamma E( X )     , V ( X )   2   2 , entonces:

20
  20,  2  80, despejando  ,   , sustituyendo en la otra ecuación

2
 20  400 20
   80,  80 y   5,   4
   5
162

b. P( X  24)  F (6,5)  0.715 P( X  24)  0.715


c. P(20  X  40)  F (10,5)  F (5,5)  0.971  0.560  0.411 P(20  X  40)  0.411

5. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de
vida útil, la duración X (en semanas) tiene una distribución gamma con media de 24
semanas y desviación estándar de 12 semanas.
a. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
b. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas?
c. ¿Cuál es el 99avo percentil de la distribución de duración?
d. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es
tal que solo la mitad del 1% de todos lo transistores estarán funcionando al terminar
la prueba?
Solución:
a. Para una distribución gamma E( X )     , V ( X )   2   2 , entonces:
24
  24,  2  144, despejando  ,   , sustituyendo en la otra ecuación

2
 24  576 24
    144,  144 y   4,   6
   4
Teniendo los valores de  = 4 y  = 6, calculamos las probabilidades pedidas
 24   12 
P(12  X  24)  F  , 4   F  , 4   F (4, 4)  F (2, 4)  0.567  0.143
 6  6 
P(0.5  X  1.5)  0.424
b. P( X  24)  F (4,4)  0.567 P( X  24)  0.567
Del resultado obtenido se deduce que P( X   )  0.5    24 . Esto se debe al sesgo
positivo de la distribución gamma.
x  x
c. P( X  x)  0.99, F  ,4   0.99, F (10,4)  0.99,   10, x  60
6  6
El 99 percentil = 60
d. Para 1% = 0.01, la mitad es 0.005, entonces:
t  t
P( X  t )  0.995, F  ,4   0.995, F (11,4)  0.995,   11, t  66
6  6

6. Las llamadas partículas (o rayos)  son en realidad electrones ordinarios expulsados


de manera excepcional del núcleo de algunos átomos de ciertos elementos radiactivos.
Dichas partículas jamás existen como tales dentro del núcleo, pero a veces llegan a
crearse durante las transformaciones nucleares, pudiendo escapar a grandes
velocidades para ser detectadas en una placa fotográfica. Si una pequeña porción de
un elemento radiactivo expulsa en promedio 4 partículas  por segundo, calcule la
probabilidad de que transcurran:
a. Más de dos segundos para que se emitan dos partículas ;
b. Menos de tres segundos para que se emitan 10 partículas .
[Sugerencia: suponga que el tiempo de emisión de de dichas partículas sigue una
distribución gamma.

7. En una cierta ciudad el consumo de agua diario (en millones de litros) sigue
aproximadamente una distribución gamma con  = 2 y  = 3. Si la capacidad diaria
de dicha ciudad es 9 millones de litros de agua:
163

a. ¿cuál es la probabilidad de que en cualquier día dado el suministro sea insuficiente?


b. Encuentre la media y la varianza del consumo diario de agua.
c. De acuerdo con el teorema de Chebyshev, ¿hay una probabilidad de al menos ¾ de
que el consumo de agua en cualquier día dado caiga dentro de un intervalo? ¿De
cuál?

8. Suponga que el tiempo en horas, que toma reparar una bomba de calor es una variable
aleatoria X que tiene una distribución gamma con parámetros  = 2 y  = ½ . ¿Cuál
es la probabilidad de que la siguiente llamada de servicio requiera
a. a lo mas una hora para reparar la bomba de calor?
b. Al menos dos horas para reparar la bomba de calor?

9. En cierta ciudad el consumo de energía eléctrica diario, en millones de kilowatts-hora,


es una variable aleatoria X que tiene una distribución gamma con media  = 6 y
varianza 2 = 12.
a. Encuentre los valores de  y .
b. Encuentre la probabilidad de que en cualquier día dado el consumo de energía diario
exceda los 12 millones de kilowatts-hora.

DISTRIBUCION EXPONENCIAL

10. Sea X = tiempo entre dos llegadas sucesivas en la ventanilla de atención de un banco
local. Si X tiene una distribución exponencial con  = 1, calcule lo siguiente:
d. El tiempo esperado entre dos llegadas sucesivas.
e. La desviación estándar entre dos llegadas sucesivas.
f. P(X ≤ 4)
g. P(2 ≤ X ≤ 5)

11. Sea X la distancia en metros que un animal se mueve desde su lugar de nacimiento
hasta el primer territorio vacante que encuentra. Suponga que para las ratas canguro,
X tiene una distribución exponencial con parámetro  = 0.01386 (como sugiere el
artículo “Competition and Dispersal from Multiple Nests”, Ecology, 1997, pp. 873 –
883).
a. ¿Cual es la probabilidad de que la distancia sea a lo sumo 100 m?¿Cuando mucho
200 m? ¿Entre 100 y 200 m?
b. ¿Cuál es la probabilidad de que la distancia sea mayor que la distancia promedio en
más de dos desviaciones estándar?
c. ¿Cuál es el valor de la distancia mediana?

12. Una amplia experiencia en ventiladores de cierto tipo, empleados en motores diesel,
ha sugerido que la distribución exponencial es un buen modelo para el tiempo hasta
que se presente una falla. Suponga que el tiempo medio hasta una falla es de 25000 h.
¿Cuál es la probabilidad de que:
a. un ventilador seleccionado al azar dure por lo menos 20000 h? ¿A lo sumo 30000?
Y ¿entre 20000 y 30000 h?
b. ¿cuál es la probabilidad de que un ventilador exceda el valor medio en más de 2
desviaciones estándar? Y ¿en mas de 3 DE?
164

13. Un sistema consta de cinco componentes idénticos conectados en serie como se


muestra:

1 2 3 4 5

Al momento que falla un componente, se interrumpirá el sistema. Suponga que cada


componente tiene una vida útil y una distribución exponencial con  = 0.01 y que los
componentes fallan sin depender entre sí. Defina los eventos Ai = {el i – ésimo
componente dura por lo menos t horas}, i = 1, 2,…,5 de modo que las Aison eventos
independientes. Sea X = tiempo en que falla el sistema; es decir, la vida útil más corta
(mínima) entre los cinco componentes.
a. ¿A qué evento donde intervienen A1, …, A5 es equivalente el evento {X  t}?
b. Por medio de la independencia de las Ai, calcule P(X  t). Después obtenga F(t) =
P(X  t) y la fda de X. ¿Qué tipo de distribución tiene X?
c. Suponga que hay n componentes, cada uno con tiempo de vida útil exponencial
con parámetro . ¿Qué tipo de distribución tiene X?

14. Si X tiene una distribución exponencial con parámetro , deduzca una expresión
general para el percentil (100p) de la distribución. Después, especifique como obtener
la mediana.

15. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo
Method” (Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución
exponencial, con parámetro  = 0.93, como modelo para la distribución de la longitud
(m) de la trayectoria libre de un fotón bajo ciertas circunstancias. Suponga que el
modelo es correcto.
a. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la
longitud de la trayectoria?
b. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es
la probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
c. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro  =0.93
1 1 1 1
E ( X )    , V ( X )   2  2 , así:    1.075,    1.075  =  = 1.075
  0.93 
 0 x  0
b. Usando la fda F ( x;  )    x
1  e x0

P( X  3)  1  P( X  3)  F (3)  1  1  e 3(0.93)   e 3(0.93)  0.0614 P( X  3)  0.0614


P(1  X  3)  F (3)  F (1)  1  e3(0.93)   1  e0.93   0.333 P(1  X  3)  0.333

c. Se requiere encontrar el 90 percentil, esto es:


P( X  x)  0.90, F ( x)  0.90, 1  e 0.93 x  0.90
ln 0.10
e0.93 x  0.10,  0.93x  ln 0.10, x   2.476 x  2.476
0.93

16. Un componente tiene duración X exponencialmente distribuida con parámetro .


165

a. Si el costo de operación por unidad de tiempo es c, ¿cuál es el costo esperado de


operar este componente en su vida útil?
b. En lugar de un valor constante de costo c, como en el inciso (a), suponga que el
costo es c (1- 0.5eax) con a > 0, de modo que el costo por unidad de tiempo es menor
que c cuando el componente es nuevo y más costoso a medida que el componente
envejece. Ahora calcule el costo esperado de operación durante la vida útil del
componente.
Solución:
1
a. Aplicando la propiedad E(cX) = cE(X), ya que para una distribución logarítmica E ( X ) 

c
, tenemos: E (cX ) 

b.

  

E c(1  0.5e ax )  
 0
c(1  0.5e ax ) e   x dx   c 
  0
e   x dx  0.5
 0
e  (   a ) x dx 

 1 0.5  (   a ) x  

 1 0.5 
  c  e x  e    c   (0  1)  (0  1) 
  0  a 0
    a 
0.5c c  ca  0.5c c(0.5  a)
c  
 a  a  a
c (0.5   a )
E c(1  0.5e ax )  
 a

17. Un motor y el tren de transmisión de un automóvil nuevo están garantizados por un


año. Las vidas medias de estos componentes se estiman en tres años y el tiempo
transcurrido hasta la falla tiene una distribución exponencial. La ganancia en un auto
nuevo es de $1000.
a. Incluyendo los costos de refacciones y de mano de obra, la agencia debe pagar $250
para reparar cada falla. ¿Cuál es la utilidad esperada por automóvil?
b. ¿Qué porcentaje de automóviles tendrán fallas en el motor y el tren de transmisión
durante los primeros seis meses de uso?

18. Se estima que el tiempo transcurrido hasta la falla de un cinescopio de televisión se


distribuye exponencialmente con media de tres años. Una compañía ofrece garantía
por el primer año de uso. ¿Qué porcentaje de las pólizas tendrán que pagar una
reclamación?

19. Un mecanismo de aire acondicionado funciona con base en cinco componentes


independientes, y la vida útil de cada uno sigue una distribución exponencial con
parámetro   15 (en años). Para que el mecanismo de aire acondicionado funcione se
requiere que por lo menos dos de sus cinco componentes aún sirvan. Calcule la
probabilidad de que el mecanismo de aire acondicionado continúe funcionando
después de 8 años.

Solución:
166

1
Para una distribución exponencial con parámetro   , la función de distribución acumulada
5
 0 x0
está dada por: F ( x;  )    x
, entonces:
1  e x0

P( X  8)  1  P( X  8)  1  F 8; 15   1  1  e 5   e8 5  0.2019 , con esta probabilidad,


8
 
se tiene ahora una distribución binomial b(x; 5, 0.2019)y la probabilidad requerida es:
P( X  2)  1  P( X  2)  1  B(1;5,0.2019)  1  0.73338  0.2666
Por tanto la probabilidad de que siga funcionando después de 8 años es = 0.2666

20. Según un reporte del periódico Uno Más Uno (octubre de 1998), muchos funcionarios
y servidores públicos del gobierno mexicano ocupan la mayoría de sus horas de
trabajo haciendo llamadas telefónicas personales. Suponga que la duración de las
conferencias telefónicas personales de una funcionaria de la Secretaria de
Gobernación es una variable aleatoria X que sigue una distribución exponencial, con
parámetro  = 0.012 (en minutos). Calcule:
a. La duración promedio de una conversación telefónica de esta funcionaria.
b. La desviación estándar de la duración de una llamada.
c. La probabilidad de que una conversación telefónica dura más de 50 minutos.
d. La probabilidad de que dure a lo sumo 30 minutos.
Solución:
1 1
a. Para una distribución exponencial E ( X )    , V (X )   2  y la fda. es:
 2
 0 x0 1
F ( x;  )    x
, entonces: E ( X )   83.33 E ( X )  83.33 minutos
1  e x0 0.012
1
b. V ( X )   6944.444,  X  V ( X )  6944.444  83.33  X  83.33
(0.012)2
c. P( X  50)  1  P( X  50)  1  1  e(0.012)50   0.5488 P( X  50)  0.5488
 (0.012)30
d. P( X  30)  F (30;0.012)  1  e  1  0.6977  0.3023 P( X  30)  0.3023

21. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que
presentaran un examen de termodinámica, de manera individual. Para cualquiera de
ellos se estima que el tiempo promedio de solución del examen es de 1h 20 min y
además la distribución del tiempo se asume que es exponencial. Si el examen inició a
las 9:00 a.m., calcule la probabilidad de que:
a. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
b. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso
comprendido entre las 9:50 y 10:00 a.m.
c. Determine el número más probable de estudiantes que terminaran el examen antes
de las 10:10 a.m.
d. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado
para el tiempo de solución de un examen?
Solución:
1 1
a. Como  = 1h 20 min = 80 min y E ( X )    , entonces   0.0125 y la probabilidad
 80
deseada será:
167

P( X  40)  1  e(0.0125)40  1  0.6065  0.39347 P( X  40)  0.39347 , con esta


probabilidad se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la
probabilidad pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:

P(Y  1)  1  P(Y  1)  1  B(0;5,0.39347)  1  0.08208  0.9179 P(Y  1)  0.9171

b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:

P(50  X  60)  F (60;0.0125)  F (50;0.0125)  1  e(0.0125)60   1  e (0.0125)50   0.062895


Con esta probabilidad calculamos la probabilidad binomial correspondiente:
P(2  Y  4)  B(4;5,0.062895)  B(1;5,0.062895)
 0.99999  0.96518  0.03481 P(2  Y  4)  0.03481
c. Calculamos primero la probabilidad de que uno termine antes de 70 min.
P( X  70)  1  e(0.0125)70  0.58314 . Para la distribución binomial E(Y) =np
E(Y) = 5(0.58314) = 2.91 3, entonces lo más probable es que terminen 3 antes de 10: 10

DISTRIBUCION LOGNORMAL

1. Se sugiere que un modelo de probabilidad razonable para el tiempo de vida útil de un


cierto taladro es lognormal con  = 4.5 y  = 0.8.
a. ¿Cuáles son el valor medio y la desviación estándar del tiempo de vida media?
b. ¿Cuál es la probabilidad de que el tiempo de vida sea por lo menos 200? ¿Mayor
que 200?
c. ¿cuál es la probabilidad de que el tiempo de vida sea a lo sumo 100?

2. Sea X = la mediana de la potencia horaria (en decibelios) de señales de radio que se


transmiten y reciben entre dos ciudades. Los autores del artículo “Families of
Distributions for Hourly Median Power and Instantaneous Power of Received Radio
Signals” (J. Research Natinal Bereau of Standars, vol. 67D, 1963, pp. 753 – 762)
argumentan que la distribución lognormal es un modelo de probabilidad razonable
para X. Si los valores de los parámetros son  = 3.5 y  = 1.2, calcule lo siguiente:
a. El valor medio y la desviación estándar de la potencia recibida.
b. La probabilidad de que la potencia recibida esté entre 50 y 250 dB.
c. La probabilidad de que X sea menor que su valor medio. ¿Por qué esa probabilidad
no es 0.5?
Solución:

a. Para una distribución lognormal E ( X )  e


 ,
  2
2

V ( X )  e2   (e  1) y con  = 3.5


2 2

y  = 1.2

E( X )  e

3.5 1.2
2
2   e4.22  68.0335 E ( X )  68.0335
V (X )  e 7 1.44
(e 1.44
 1)  14907.167,  X  V ( X ),  X  14907.167  122.095
 ln 50  3.5 ln 250  3.5 
P(50  X  250)  P  Z    (1.684)  (0.343)
b.  1.2 1.2 
 0.9535  0.6331  0.3204 P(50  X  250)  0.3204
 ln 68.0335  3.5 
c. P( X  68.0335)  P  Z    (0.60)  0.757 P( X  68.0335)  0.757
 1.2 
Esta probabilidad no es 0.5 porque la distribución lognormal no es simétrica
168

3. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de


fundamento a la suposición de que la resistencia a la ductilidad X de un material tiene
una distribución lognormal. Suponga que los parámetros son  = 5 y  = 0.1
a. Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana a la ductilidad?
e. Si diez muestras diferentes de una aleación de acero de ese tipo se someten a una
prueba de resistencia, ¿cuántas debería esperarse que tuvieran resistencia de por lo
menos 120?
f. Si fueran 5% de los valores más pequeños de resistencia inaceptables, ¿cuál sería
la resistencia mínima aceptable?
Solución:

a. Para una distribución lognormal E ( X )  e


 ,
  2
2

V ( X )  e2   (e  1) y con  = 5 y
2 2

 = 0.1

E( X )  e

5 0.1
2
2   e5.005  149.157 E ( X )  149.157
10  0.001
V (X )  e (e 0.001
 1)  223.594, V ( X )  223.594

 ln120  5 
P( X  120)  1  P( X  120)  1  P  Z  
b.  0.1 
 1  (2.125)  1  0.0168  0.9832 P( X  120)  0.9832

 ln110  5 ln130  5 
P(110  X  130)  P  Z    (1.324)  (2.995)
c.  0.1 0.1 
 0.0934  0.0014  0.092 P(110  X  300)  0.092

d.   e ,   e5  148.41  =148.41

e. P(X > 120) = 0.9832. Para n = 10 y p = 0.9832, E(X) = np E(X) = 9.832

f. Se requiere el 5 percentil de la distribución, por tanto:

 ln x  5  ln x  5
P Z    0.05, (1.645)  0.05,   1.645, despejando a x,
 0.1  0.1
ln x  (1.645)(0.1)  5, ln x  4.8355, x  e4.8355  125.9 x  125.9

4. El artículo “The Statistics of Phytotoxic Air Pollutants” (J. Royal Stat. Soc., 1989, pp.
183 – 198) sugiere la distribución lognormal como un modelo para la concentración
de SO2, sobre cierto bosque. Suponga que los parámetros son  = 1.9 y  = 0.9.
a. ¿Cuáles son el valor medio y la desviación estándar de la concentración?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo 10? ¿Entre 5 y 10?
Solución:
c. Para una distribución lognormal E ( X )  e
 ,
  2
2

V ( X )  e2   (e  1) y con  = 1.9


2 2

y  = 0.9
169

2
1.9  (0.9)
E( X )  e 2
 10.024 E ( X )  10.024
V (X )  e 3.9  (0.9)2
(e (0.9)2
 1)  125.395,  X  125.395  11.2  X  11.2

 ln10  1.9 
P( X  10)  P  Z    (0.45)  0.6736 P( X  10)  0.6736
 0.9 
 ln 5  1.9 ln10  1.9 
d. P(5  X  10)  P  Z    (0.45)  (0.32)
 0.9 0.9 
 0.6736  0.3745  0.2991 P(5  X  10)  0.2991

5. Se sabe que la tasa promedio de uso de agua (miles de litros por hora) en cierta
comunidad implica una distribución logarítmica normal con parámetros  = 5 y  =
2.5 Es importante para propósitos de planeación obtener una apreciación de los
períodos de alta utilización.
a. ¿Cuál es la probabilidad de que para cualquier hora dada, se usen a lo sumo 50 000
litros de agua?
b. ¿Cuál es la probabilidad de que se usen entre 30 000 y 50 000?
c. ¿Cuál es el valor esperado de galones de agua que se usan en cualquier hora dada?
d. En un período de 15 horas, ¿Durante cuantas horas se esperaría que se usaran a lo
sumo 10 000?

Solución:
 ln 50000  5 
a. P( X  50000)  P  Z    (2.3279)  0.9901 P( X  50000)  0.9901
 2.5 

 ln 30000  5 ln 50000  5 
P(30000  X  50000)  P  Z    (2.3279)  (2.1236)
b.  2.5 2.5 
 0.9901  0.983  0.0071 P(30000  X  50000)  0.0071

 ln10000  5 
c. P( X  10000)  P  Z    (1.684)  0.954 .Con n = 15 y p = 0.954, el valor
 2.5 
esperado E(X) = np, por tanto E(X) = 15(0.954) = 14.3 E(X) = 14.3 horas

DISTRIBUCION WEIBULL

1. La vida útil X (en cientos de horas) de cierto tipo de tubos al vacío tiene una
distribución de Weibull con parámetros  = 2 y  = 3. Calcule lo siguiente:
a. E(X) y V(X)
b. P(X  6)
c. P(1.5  X  6)

(Esta distribución de Weibull se sugiere como modelo para el tiempo de servicio en


“On the Assessment of Equipment Reliability: Trading Data Collection Costs for
Precision”. J. Engr. Manuf., 1992: 105 – 109)

Solución:
170

a. Para una distribución Weibull las funciones de densidad de probabilidad y la función de


distribución acumulada son:
   1  x  

 x e x0
f ( x; ,  )    
 x0
 0
 0 x0

F ( x; ,  )  
1  e    x  0

 x

 1   2   1   
2

     1   ,  2   2   1       1    
           

 1 3 1 1 3


E ( X )    3 1    3    3         2.659 E ( X )  2.659
 2  2  2  2 2
   3  
2
 1  
2

V ( X )    3 (2)        9 1  
2 2
    9(1  0.7854)  1.93 V ( X )  1.93
   2      2  
 3   1  e4  0.9817
2
 6
b. P( X  6)  F (6;2,3)  1  e P( X  6)  0.9817
 1.5  
2

P(1.5  X  6)  F (6;2,3)  F (1.5;2,3)  0.9817  1  e 3 


c.  
 0.9817  0.2212  0.7605 P(1.5  X  6)  0.7605

2. Los autores del artículo “A Probabilistic Insulation Life Model for Combined
Thermal-Electrical Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522)
expresan que la distribución de Weibull se utiliza ampliamente en problemas de
estadística relacionados con la obsolescencia de materiales aislantes sólidos sujetos a
envejecimiento y esfuerzo. Proponen el uso de la distribución como modelo para el
tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos a un voltaje
de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
 = 2.5 y  = 200 (los datos de este artículo indican estos valores).
a. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200?
¿Menos de 200? ¿Mas de 300?
b. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
c. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que
exceden ese valor?
Solución:
a.
 

 
2.5
 x  x
F ( x; ,  )  1  e  , en este caso: F ( x;2.5, 200)  1  e 200

   1  e 1  0.632
2.5
 200
P( X  200)  1  e 200
P( X  200)  0.632
P( X  200)  0.632, ya que es una distribución de probabilidad continua
P( X  300)  1  P( X  300)  1  F (300;2.5, 200)
  300
 200  
2.5
2.7556
 1  1  e e  0.06357 P( X  300)  0.06357
 
171

P(100  X  200)  F (200;2.5, 200)  F (100;2.5, 200)


 100  
2.5
b.
 0.632  1  e 200   0.632  (1  0.8379)  0.470 P(100  X  200)  0.470
 
c. En este caso se requiere el valor de la mediana, esto es: F ( )  0.50
   0.5, 0.5  e x 200 , ln(0.5)    x 
2.5 2.5 2.5
 x
1 e 200
 
200  
2.5
x 2
ln(0.5)   , x 2.5  392103.2574, x  (392103.2574) 5
 172.3 x  172.3
2002.5

3. Suponga que la vida de servicio, en años, de la batería de un aparato para sordos es


una variable aleatoria que tiene una distribución de Weibull con  = 2 y  = 2.
a. ¿Cuánto se puede esperar que dure la batería?
b. ¿Cuál es la probabilidad de que tal batería esté en operación después de 2 años?
Solución:
 x 

 1
a. Para  = 2 y  = 2,     1   , F ( x; ,  )  1  e  , entonces:
 
 1  1 1 1
E ( X )      1   , E ( X )  2 1    2        E ( X )  1.77
   2  2  2
b.
  2  
2

P( X  2)  1  P( X  2)  1  F (2;2,2)  1  1  e 2   e1  0.3679 P( X  2)  0.3679


 

4. Sea X la resistencia a la tensión (ksi) a – 200ºC de un espécimen de acero de acero de


cierto tipo que exhibe “fragilidad en frío” a bajas temperaturas. Suponga que X tiene
una distribución de Weibull con  = 20 y  = 100.
a. ¿Cuál es la probabilidad de que X sea a lo sumo 105 ksi?
b. ¿Cuál es la probabilidad de que la resistencia se encuentre entre 100 y 105 ksi?
c. ¿Cuál es la mediana de la distribución de resistencia?
Solución:
   1  0.70418  0.929
20
 105
a. P( X  105)  F (105;20,100)  1  e 100
P( X  105)  0.929
   
20
 100
P(100  X  105)  F (105;20,100)  F (100;20,100)  0.929  1  e 100 
b.  
1
 0.929  (1  e )  0.297 P(100  X  105)  0.297

          
20 20 20

0.5  1  e 100  , 0.5  e 100 , ln(0.5)     ,  100  ln(0.5)    


20 20

c.    100 
1
   (100)20 ln(0.5)  20
 98.18   98.18

5. En el artículo “Response of SiCf /Si3N4 Composites Under Static and Cyclic Loading
– An Experimental and Statistical Analysis” (J. Engr. Materials and Technology,
1997: 186 – 193) se sugiere que la resistencia a la tensión en MPa de materiales
compuestos bajo las condiciones especificadas se puede modelar mediante una
distribución de Weibull con  = 9 y  = 180.
172

a. ¿Cuál es la probabilidad de que la resistencia de un espécimen seleccionado al azar


sea mayor de 175? ¿De que esté entre 150 y 175?
b. Si se escogen al azar dos especímenes y sus resistencias son independientes entre
sí, ¿cuál es la probabilidad de que al menos uno tenga resistencia entre 150 y 175?
c. ¿Qué valor de resistencia separa al 10% más débil de especímenes del 90%
restante?
Solución:
 x 

 1
a. Para  = 9 y  = 180,     1   , F ( x; ,  )  1  e  , entonces:
 

 175  
9

P( X  175)  1  P( X  175)  1  F (175;9,180)  1  1  e 180 


b.  
0.776
e  0.4602 P( X  175)  0.4602
 175    150  
9 9

P(150  X  175)  F (175;9,180)  F (150;9,180)  1  e 180   1  e 180 


   
0.1938 0.776
e e  0.3636 P(150  X  175)  0.3636

b. Sea Y = {uno de las especímenes tiene resistencia a la tensión entre 150 y 175}
P(Y  1) = 1 P(Y < 1) = 1- P(Y = 0), P(Y  1) = 1 (1- 0.3636)2 = 0.5950
P(Y  1) = 0.5950
c. Se requiere hallar el 10 percentil, esto es:
 x 
9
 x 
9

F ( x;9,180)  0.10, 1  e 180  0.10, ln(0.90)    


 180 
x9    180  ln(0.90)   2.0899  1019 ,  x  140.178
9
 

PROBLEMAS RESUELTOS

PROBABILIDAD CONDICIONAL
173

1. Cierto automóvil deportivo está equipado con transmisión automática o con


transmisión manual y se puede adquirir en uno de cuatro colores. Las probabilidades
relevantes de las diversas combinaciones de tipo de transmisión y color son las
siguientes:

color
Blanco Azul Negro Rojo

Tipo de A 0.15 0.10 0.10 0.10


transmisión M 0.15 0.05 0.15 0.20

A = {transmisión automática}, B = {negro} y C = {blanco}.


a. Calcule P(A), P (B) y P (A ∩ B).
b. Calcule P(A / B) y P (B / A) y explique que representa cada una de esas
probabilidades.
c. Calcule e interprete P(A / C) y P ( A / C’).

Solución:
a. P(A) = 0.15 + 0.10 + 0.10 + 0.10 = 0.45
P (B) = 0.10 + 0.25 = 0.25
P(A  B) =0.10

P( A  B) 0.10
b. P( A / B)    0.40
P( B) 0.25
Probabilidad de que el automóvil tenga transmisión automática si se adquirió en
color negro.

P( A  B) 0.10
P( B / A)    0.22
P( A) 0.45
Probabilidad de que el automóvil sea negro si se adquirió con transmisión
automática.

P( A  C ) 0.15
c. P( A / C )    0.5
P(C ) 0.30

P( A  C ' )
P( A / C ' )  P(C ' )  0.70 P( A' )  0.55
P(C ' )

(A’  C)’ = A  C’
P (A  C’) = P(A) – P(A C) = 0.45 – 0.15 = 0.30
P( A  C ' ) 0.30
P( A / C ' )    0.429
P(C ' ) 0.70

2. Suponga que se selecciona al azar un individuo de la población de todos los adultos


hombres que viven en Estados Unidos. A será el evento cuando el individuo tenga una
174

estatura de más de 6 pies, y B cuando el individuo seleccionado sea un jugador


profesional de baloncesto. ¿Cuál considera que es mayor, P(A/B) o P(B/A), y por qué?

Solución:

P(A/ B); es la probabilidad de que el individuo tenga una estatura de más de 6 pies
si es jugador de baloncesto.
P (B/A); es la probabilidad de que el individuo sea un jugador de baloncesto si tiene
una estatura de más de 6 pies.

P( A  B) P( A  B)
P( A / B)  P( B / A) 
P( B) P( A)

La P(A) > P (B) pues hay más individuos que tienen estatura mayor de 6 pies que
individuos jugadores profesionales de baloncesto, por tanto:

P(A/B) > P (B/A)

3. En el problema de las tarjetas de crédito, donde A = {Visa}, B = {Master Card}, P(A)


= 0.5, P (B) = 0.4 y P(A ∩B) = 0.25. Calcule e interprete cada una de las siguientes
probabilidades. Un diagrama de Venn podría ayudar.
a. P(B/A)
b. P(B’/A)
c. P(A/B)
d. P(A’/B)
175

e. Debido a que el individuo seleccionado tiene al menos una tarjeta, ¿cuál es la


probabilidad de que sea Visa?

Solución

P( A  B) 0.25
a. P( B / A)    0.5
P( A) 0.5
La probabilidad de que el individuo seleccionado tenga una tarjeta Master Card dado
que tiene una Visa

P( A  B' ) 0.25
b. P( B' / A)    0.5
P( A) 0.50
La probabilidad de que el individuo seleccionado no tenga tarjeta Master Card si tiene
una Visa

P( A  B) 0.25
c. P( A / B)    0.625
P( B) 0.40
La probabilidad de que el individuo seleccionado tenga una tarjeta Visa, dado que tiene
Una Master Card

P( A'B) 0.15
d. P( A' / B)    0.375
P( B) 0.40
La probabilidad de que individuo seleccionado no tenga una tarjeta Visa si tiene una
Master Card

PA  ( A  B) 0.50


e. P( A / A  B)    0.7692
P( A  B) 0.65

A  B’ A’  B

4. Un sistema puede tener tres tipos de defectos: Ai ( i = 1,2,3) es cuando este sistema puede
tener un defecto del tipo i. Suponga que
P(A1) = 0.12 P(A2) = 0.07 P(A3) = =.05 P(A1  A2) = 0.13 P(A1  A3) = 0.14
P(A2  A3) = 0.10 P(A1  A2  A3) = 0.01
176

a. Si el sistema tiene defecto tipo 1, ¿cuál es la probabilidad de que tenga un defecto tipo
2?
b. Si el sistema tiene un defecto tipo 1, ¿cuál es la probabilidad de que tenga los tres tipos
de defectos?
c. Si el sistema tiene al menos un tipo de defecto, ¿cuál es la probabilidad de que tenga
exactamente un tipo de defecto?
d. Si el sistema tiene los dos primeros tipos de defectos a la vez, ¿cuál es la probabilidad
de que no tenga el tercer tipo de defecto?

Solución

P( A1  A2 )  P( A1 )  P( A2 )  P( A1  A2 )
 0.12  0.07  0.13  0.06
P( A2  A3 )  P( A2 )  P( A3 )  P( A2  A3 )
 0.07  0.05  0.10  0.02
P( A1  A3 )  P( A1 )  P( A3 )  P( A1  A3 )
 0.12  0.05  0.14  0.03

a.

P( A1  A2 0.06
P( A2 / A1 )    0.05
P( A1 ) 0.12

P( A1  A2  A3 ) 0.01
b. P( A1  A2  A3 / A1 )    .0833
P( A1 ) 0.12

d. Sea B ={El sistema tiene al menos un tipo de defecto}


C = {El sistema tiene un solo tipo de defecto}
D = {El sistema tiene dos tipos de defectos}
E = {El sistema tiene tres tipos de defectos}

P(B) = P(C) + P(D) + P(E)


P(C) = 0.04 + 0.01 = 0.05
P(D) = 0.05 + 0.02 + 0.01 = 0.08
177

P(E) = 0.01
P(B) = 0.05 + 0.08 + 0.01 = 0.14

P(C  B) P(C  B)  P(C )  P( B)  P(C  B)


P(C / B) 
P( B)  0.05  0.14  0.14  0.05

0.05
P(C / B)   0.357
0.14

e. Sea F = {El sistema tiene los dos primeros tipos de defectos}


P(F) = P(A1  A2) = 0.06
A3’ = El sistema no tiene el tercer tipo de defecto, P(A3’) = 0.95

P( A3'  F ) P( A3'  A1  A2 ) 0.05


P( A3' / F )     0.833
P( F ) P( F ) 0.06

5. Si se seleccionan dos focos al azar de una caja que contiene 4 focos de 40 W, 5 de 60 W


y 6 de 75W y se ve que, al menos uno de ellos es de 75W, ¿cuál es la probabilidad de que
los dos sean de 75W? Si al menos uno de los dos seleccionados no es de 75 W, ¿cuál es
la probabilidad de que los dos focos tengan la misma potencia?

Solución

 P (Ambos focos sean de 75W/ al menos uno es de 75W)


P (al menos uno es de 75W) = 1 – P (ninguno sea de 75W)
 9  6 
  
= 1      1 
2 0 36 23

15  105 35
 
2

P [(ambos sean de 75W)  (al menos uno sea de 75) = P( ambos sean de 75W)
 6  9 
  
=    
2 0 15 5

15  105 35
 
2
Por tanto
5
5
P (ambos focos sean de 75W / al menos uno es de 75W) = 35 23
  0.2174
35 23
 P ( ambos sean de la misma potencia / al menos uno no es de 75W)

P (al menos uno no es de 75W) = 1 – P (ambos sean de 75W)


178

5 30
= 1 
35 35
Ahora
P [(ambos sean iguales)  (al menos uno no es de 75W) =
 4 11  5 10 
     
P (ambos sean de 40W o ambos de 60W) =        
2 0 2 0 16
15  15  105
   
2 2
Por tanto

16
8
P (ambos sean iguales / al menos uno no es de 75W) = 105
30
  0.1778
35 45

6. Una gran tienda de departamentos vende camisas deportivas en tres tallas (pequeña,
mediana y grande), en tres modelos (a cuadros, estampadas y de franjas) y con dos largos
de manga (corta y larga). Las siguientes tablas presentan las proporciones de camisas
vendidas que caben en varias combinaciones de categorías.

Manga corta
Modelo
Talla cuadros estampada franjas
pequeña 0.04 0.02 0.05
mediana 0.08 0.07 0.12
grande 0.03 0.07 0.08

Manga larga
Modelo
Talla cuadros estampada franjas
pequeña 0.03 0.02 0.03
mediana 0.10 0.05 0.07
grande 0.04 0.02 0.08

a. ¿Cuál es la probabilidad de que la siguiente camisa vendida sea mediana, de manga


larga y estampada?
b. ¿Cuál es la probabilidad de que la siguiente camisa vendida sea mediana y estampada?
c. ¿Cuál es la probabilidad de que la siguiente camisa vendida sea de manga corta? y ¿de
manga larga?
d. ¿Cuál es la probabilidad de que la talla de siguiente camisa vendida sea mediana? y ¿de
qué el modelo de la siguiente camisa vendida sea estampada?
e. Dado que la camisa que se acaba de vender era de cuadros y de manga corta, ¿cuál es
la probabilidad de su talla fuera mediana?
f. Dado que la camisa que se acaba de vender era de cuadros y mediana, ¿cuál es la
probabilidad de que fuera de manga corta? y ¿de manga larga?
179

Solución

a. Sea A = {la camisa sea mediana, de manga larga y estampada}


P (A) = 0.05

b. Sea B = {camisa de manga corta y estampada}


P (B) = 0.07 + 0.05 = 0.12

c. Sea C = {camisa de manga corta} y D = {camisa de manga larga}


P(C) = 0.04 + 0.08 + 0.03 + 0.02 + 0.07 + 0.07 + 0.05 + 0.12 + 0.08 = 0.56
P (D) = 0.03 + 0.10 + 0.04 + 0.02 + 0.05 + 0.02 + 0.03 + 0.07 + 0.08 = 0.44

d. Sea E = {talla sea mediana} y F = {camisa sea estampada}


P (E) = 0.08 + 0.07 + 0.12 + 0.10 + 0.05 + 0.07 = 0.49
P (F) = 0.02 + 0.07 + 0.07 + 0.02 + 0.05 + 0.02 = 0.25

e. Sea G = {camisa sea de cuadros y manga corta}


P (G) = 0.04 + 0.08 + 0.03 = 0.15
P( E  G) 0.08
P (E / G) =   0.533
P(G) 0.15

f. Sea H = {camisa de cuadros y mediana}


P (H) = 0.08 + 0.10 = 0.18
P(C  H ) 0.08
P(C / H )    0.444
P( H ) 0.18

P( D  H ) 0.10
P( D / H )    0.555
P( H ) 0.18

7. Una caja contiene seis bolas rojas y cuatro verdes, y una segunda caja contiene siete bolas
rojas y tres verdes. Se escoge al azar una bola de la primera caja y se pone en la segunda
caja. Después, se selecciona una bola de la segunda caja y se pone en la primera caja.
a. ¿Cuál es la probabilidad de que se seleccione una bola roja de la primera caja y una
bola roja de la segunda?
b. En la conclusión del proceso de selección, ¿cuál es la probabilidad de que los números
de las bolas rojas y verdes de la primera caja sean idénticos a los números del
comienzo?
Solución

a. Primera caja 6 rojas 4 verdes


Segunda caja 7 rojas 3 verdes

P (roja de la 1ª  roja de la 2ª) = P (roja de la 2ª / roja de la 1ª)  P (roja de la 1ª)


180

P (roja de la 1ª) = 6/10 P (roja de la 2ª / roja de la 1ª) = 8/11

6 8 48
P (roja de la 1ª  roja de la 2ª) =    0.436
10 11 110

b. P (mismo número) = P(las bolas seleccionadas en ambas cajas sean del mismo color)
= P (ambas sean rojas) + P (ambas sean verdes)
4 4
= 0.436 +   0.436  0.145  0.581
10 11

8. Un sistema de bombeo consta de dos bombas idénticas, 1 y 2. Si falla una bomba, el


sistema seguirá funcionando, pero debido al esfuerzo, ahora es más probable que la otra
bomba falle que en la situación original. Es decir, r = P (2 falla / 1 falla) > P (2 falla) = q.
Si al menos una bomba falla 7% en todos los sistemas al término de vida útil del diseño
de la bomba y ambas bombas fallan durante ese período sólo 1%, ¿cuál es la probabilidad
de que la bomba 1 falle durante la vida útil de diseño de la bomba?

Solución

Sea A1 = {falla la bomba 1} y A2 = {falla la bomba 2}


Suponiendo que P (A1) = P (A2) = q y P (A1/A2) = P (A2 /A1) = r, entonces

P (A1  A2) = P (A2 /A1)  P (A1) = rq = 0.01 . . . . . . . . . . . . . . . . . . . . (1)


P (A1  A2) = P (A1  A2) + P (A1’  A2) + P (A1  A2’)
= rq + 2(1 – r)q = 0.07 . . . . . . . . . . . . . . . . . . . . . . . . . . . (2)

Resolviendo el sistema de ecuaciones (1) y (2), se tiene:


0.01
De la ecuación (1) r y sustituyendo en la ecuación (2)
q

 0.01 
0.01  21  q  0.07
 q 
0.01 + 2(q – 0.01) = 0.07
2q = 0.07 – 0.01 + 0.02 = 0.08
q = 0.04
0.01
r  0.25
0.04

9. Cierto taller repara componentes de audio y video. Señalemos con A el evento donde el
siguiente componente en reparación sea un componente de audio y como B el evento
donde el siguiente componente sea un reproductor de discos compactos (por lo mismo, el
evento B está contenido en A). Suponga que P(A) = 0.6 y P (B) = 0.05. ¿Cuál es la
probabilidad de P (B/A)?

Solución
181

P( A  B)
P( A / B) 
P( A)

A = {componente a reparar es de audio}


B = {componente es reproductor de discos compactos}

0.05
Como B  A, A  B = A, por tanto P( A / B)   0.0833
0.6

10. Una empresa de consultoría de computadoras ha licitado en tres proyectos. Supongamos


que Ai = {proyecto i otorgado}, para i = 1, 2, 3, y P (A1) = 0.22, P (A2) = 0.25, P (A3) =
0.28, P (A1 ∩ A2) = 0.11, P (A1 ∩ A3) = 0.05, P (A2 ∩ A3) = 0.07, P (A1 ∩ A2 ∩ A3) =
0.01. Calcule las siguientes probabilidades.
a. P(A1/A2)
b. P(A2 ∩ A3/A1)
c. P(A2 ⋃ A3 /A1)
d. P (A1 ∩ A2 ∩ A3 / A1 ⋃ A2 ⋃ A3). Exprese verbalmente el evento de esta probabilidad.
Solución
P( A1  A2 ) 0.11
a. P( A2 / A1 )    0.5
P( A1 ) 0.22

P( A1  A2  A3 ) 0.01
b. P( A2  A3 / A1 )    0.0455
P( A1 ) 0.22

PA1  ( A2  A3 ) P( A1  A2 )  ( A1  A3 )
P( A2  A3 / A1 )  
P( A1 ) P( A1 )
P( A1  A2 )  P( A1  P( A3 )  P( A1  A2  A3 )
c. 
P( A1 )
0.11  0.05  0.01 0.15
  0.6818
0.22 0.22

d.
P( A1  A2  A3 )  ( A1  A2  A3 )
P( A1  A2  A3 / A1  A2  A3 ) 
P( A1  A2  A3 )
P( A1  A2  A3 )

P( A1 )  P( A2 )  P( A3 )  P( A1  A2 )  P( A1  A3 )  P( A2  A3 )  P( A1  A2  A3 )
0.01 0.01
   .0189
0.22  0.25  0.28  0.11  0.05  0.07  0.01 0.53
La probabilidad de este evento corresponde a la probabilidad de que se otorguen los tres
proyectos dado que se ha otorgado el proyecto 1 o el 2 o el 3.
182

11. Si P (B /A) > P (B), demuestre que P (B’ /A) < P (B’)

Solución

Si P (B /A) > P (B)  P (B’ /A) < P (B’)


Supongamos que P (B’ /A)  P (B’)
Entonces 1- P (B / A)  1- P (B)
- P (B / A)  - P (B)
P (B / A)  P (B)
Esto contradice la condición inicial, entonces P (B’ /A) < P (B’)

12. Para cualquier evento A y B con P (B) > 0, demuestre que P (A /B) + P (A’/B) = 1

Solución

P( A  B) P( A'B) P( A  B)  P( A'B) P( B)
P( A / B)  P( A' / B)     1
P( B) P( B) P( B) P( B)

+ =B

A’  B AB

13. Demuestre que para cualquiera de los tres eventos A, B y C con P (C) > 0, P (A  B / C)
= P (A / C) + P (B / C) – P(A  B / C)

Solución

P( A  B)  C  P( A  C )  ( B  C )
P( A  B / C )  
P(C ) P(C )
P( A  C )  P( B  C )  P( A  B  C )

P(C )
P( A  C ) P( B  C ) P( A  B  C )
  
P(C ) P(C ) P(C )
 P( A / C )  P( B / C )  P( A  B / C )

14. En cierta gasolinería, 40% de los clientes utilizan gasolina regular sin plomo (A1), 35%
gasolina extra sin plomo (A2) y 25% gasolina Premium sin plomo (A3). De los clientes que
consumen gasolina regular, sólo 30% llenan sus tanques (evento B). De los que consumen
183

gasolina extra, 60% llenan sus tanques, mientras que de los que usan Premium, 50% llenan
sus tanques.
a. ¿Cuál es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y
llene su tanque (A2 ∩ B)?
b. ¿Cuál es la probabilidad de que el siguiente cliente llene su tanque?
c. Si el siguiente cliente llena su tanque, ¿cuál es la probabilidad de que pida gasolina
regular?, ¿extra? Y ¿Premium?

Solución

P (A1) = 0.40 P (A2) = 0.35 P (A3) = 0.25


P (B /A1) = 0.30 P (B /A2) = 0.60 P (B /A3) = 0.50

a. P (A2  B) = P (B /A2) P (A2) = (0.60)(0.35) = 0.21

b. P (B) = P (A1  B) + P (A2  B) + P (A3  B)


= P (B /A1) P (A1) + P (B /A2) P (A2) + P (B /A3) P (A3)
= (0.30)(0.40) + (0.60)(0.35) + (0.50)(0.25) = 0.455

P( A1  B) 0.12
c. P( A1 / B)    0.264
P( B) 0.455

P( A2  B) 0.21
P( A2 / B)    0.462
P( B) 0.455

P( A3  B) 0.125
P( A3 / B)    0.274
P( B) 0.455

15. Sesenta por ciento de los aviones que desaparecen en vuelo, en cierto país, son
descubiertos posteriormente. De las naves descubiertas, 60% tienen localizador de
emergencia, mientras que 90% de los no descubiertos no tienen ese localizador. Suponga
que desaparece un avión ligero.
a. Si tiene localizador de emergencia, ¿cuál es la probabilidad de que no sea localizado?
b. Si no tiene localizador de emergencia, ¿cuál es la probabilidad de que sea localizado?
184

Solución 0.36
0.6
Loc.

0.4
0 .6
No tienen 0.24
desc. Loc.

0.10 0.04
0.4
Loc.
No desc.
0.9
No tienen
a. P (No sea loc. / tiene Loc. 0.36 localizador) =

P( No sea loc.  tiene localizado r)


P(tiene localizado r)

0.04 0.04
   0.10
0.04  0.36 0.40

P(Sea loc.  No tiene localizado r)


b. P ( Sea loc./ No tiene localizador) =
P( No tiene localizado r)

0.24 0.24
=   0.40
0.24  0.36 0.60
185

PROBLEMARIO DE PROBABILIDAD Y ESTADISTICA


PRIMER EXAMEN PARCIAL
PROFRA. ROSA MARIA AGUILAR RIVERA

Estadística Descriptiva

37. Las investigaciones sobre resistencia de materiales representan un área rica en


aplicaciones de métodos estadísticos. El artículo “Efects of Aggregates and Microfillers
on the Flexural Properties of Concrete” (Magazine of Concrete Research, 1997, pp. 81-
89) reseñan un estudio de las propiedades de resistencia del concreto de alta resistencia
obtenido usando superplastificantes y ciertos aglutinantes. La resistencia a la compresión
de este concreto se había investigado con anterioridad, pero no se conocía mucho acerca
de la resistencia a la fricción (medida de la capacidad de resistencia a la falla por flexión).
Los datos siguientes sobre resistencia a la presión están en megapascales (MPa) (donde
1 Pa = 1.45  10-4 psi) y aparecieron en el artículo citado:

5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0
8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7

e. Trace un diagrama de tallo y hojas de los datos. ¿Cuál parece ser un valor representativo
de la resistencia? Las observaciones, ¿parecen estar muy concentradas cerca del valor
representativo, o solo están dispersas?
f. El diagrama, ¿parece ser razonablemente simétrico respecto a su valor representativo,
o describiría su forma de otra manera?
g. ¿Parece haber algún valor extraño o atípico?
h. ¿Qué proporción de las observaciones de resistencia fueron mayores de 10 MPa en esta
muestra?

Solución

a. Tallo y hoja de C1 N = 27
Unidad de hoja = 0.10

1 5 9
6 6 33588
(11) 7 00234677889
10 8 127
7 9 077
4 10 7
3 11 368

El valor representativo es el 7. Si, tiene dispersión


b. Tiene poca simetría, con cierto sesgo.
c. No presenta valores atípicos.
d. Hay 4 valores mayores que 10, por tanto la proporción p = 4 / 27 = 0.148, p = 14.8%

38. El artículo citado en el problema anterior también presenta las siguientes observaciones
de resistencia en cilindros:
186

6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
a. Trace un diagrama comparativo de tallo y hojas, de los datos para vigas y cilindros y a
continuación conteste las preguntas de los incisos (b), (c), y (d) del problema anterior
para las observaciones con cilindros.
b. ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias entre
las observaciones para vigas y para cilindros?
c. Construya una gráfica de puntos de los datos del cilindro.

Solución
a. concreto cilindros
9 5 8 Tallo: unidades
88553 6 16 Hojas: décimos
98877643200 7 012488
721 8 13359
770 9 278
7 10
863 11 2
12 6
13
14 1

El valor representativo es el 7 y 8, pero presenta mayor dispersión


No presenta simetría, la mayoría de los valores están concentrados alrededor del 7 y 8
El valor 14.1 parece ser un valor atípico y la proporción de valores mayores que 10 es
p = 3/20 = 0.15, p = 15%
b. La mayoría de los datos están entre 5 y 9, tanto para el concreto como para los cilindros
con el valor representativo en ambos de 7 MPa. Las observaciones para los cilindros
tienen mayor variación o dispersión y los cilindros presentan un valor atípico.

c.

39. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un
artículo de Technometrics (vol. 19 p. 425), revista dedicada a las aplicaciones estadísticas
en ciencias físicas e ingeniería.

88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 95.6 93.3 94.7 91.1
91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.2
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1 89.2 88.3 85.3 87.9
88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
187

89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7 91.8 91.6 90.4 91.1
92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7

a. Trace un diagrama de tallo y hojas para estos datos. ¿Por qué es relativamente fácil
identificar un valor de octanaje? ¿Revela el diagrama algunas propiedades importantes
de los datos?
b. Elabore una distribución de frecuencias y un histograma.
c. Calcule la media, la varianza y la desviación estándar de la muestra.
d. Determine la mediana de la muestra.

Solución
a.
Tallo y hoja de C1 N = 79
Unidad de hoja = 0.10

1 83 4 Tallo: unidades y decenas


2 84 3 Hojas: décimos
3 85 3
5 86 77
11 87 456789
21 88 2333556679
31 89 0233678899
(13) 90 0113344456789
35 91 0001112256688
22 92 22236777
14 93 023347
8 94 2247
4 95 6
3 96 1
2 97
2 98 8
1 99
1 100 3

Porque las hojas están alrededor del valor de 90 y 91 y están cercanamente simétricas a
estos valores, además la dispersión de los datos es pequeña con respecto al valor
representativo. Presenta dos huecos.

b. Distribución de frecuencias
Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa
83  x < 85 2 0.02531 93  x < 95 10 0.12658

85  x < 87 3 0.03797 95  x < 97 2 0.02531

87  x < 89 16 0.20253 97  x < 99 1 0.01266

89  x < 91 23 0.29114 99  x < 101 1 0.01266


Totales de las
91  x < 93 21 0.26582 79 0.99999
Frecuencias
188

c. y d.
Error
Variable N N* Media estándar Desv.Est. Mínimo Q1 Mediana Q3
79 0 90.671 0.316 2.806 83.400 88.700 90.500
92.200

Variable Máximo
100.300

40. Los siguientes valores de densidad relativa para diversos tipos de madera usados en la
construcción aparecieron en el artículo “Bolted Connection Design Values Based on
European Yield Model” (J. of Structural Engr.,1993: 2169 – 2186):

.31 .35 .36 .37 .38 .40 .40 .40 .41 .41 .42 .42 .42 .42 .42
.43 .44 .45 .46 .46 .47 .48 .48 .48 .51 .54 .54 .55 .58 .62
.66 .66 .67 .68 .75

Trace un diagrama de tallo y hojas que use tallos repetidos y haga comentarios sobre
las características interesantes que aprecie.

Solución
Tallo y hoja de C2 N = 31
Unidad de hoja = 0.010

1 3 1 Tallo: décimos
5 3 5678 Hojas: centésimos
15 4 0001122234
(7) 4 5667888
9 5 144
6 5 5
5 6
5 6 6678
189

1 7
1 7 5

El valor representativo está en 4 a menor de 4.5, no tiene simetría, presenta dispersión,


Presenta huecos y un posible valor atípico es el 0.75.

41. El artículo “Determination of Most Representative Subdivisión” (J. of Energy Eng., 1993,
pp. 43-55) presentó datos con diversas características de subdivisiones que podrían usarse
para decidir si suministrar energía eléctrica con líneas aéreas o con líneas subterráneas.
A continuación vemos los valores de la variable x = longitud total de las calles dentro de
una subdivisión:

1280 5320 4390 2100 1240 3060 4770 1050 360 3330
3380 340 1000 960 1320 530 3350 540 3870 1250
2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770
3150 1890 510 240 396 1419 2109

a. Trace un diagrama de tallo y hojas con la cifra de los miles como tallo y la cifra de los
cientos como hoja, y comente las diversas propiedades del diagrama.
b. Trace un histograma usando los límites de clase 0, 1000, 2000, 3000, 4000, 5000 y
6000. ¿Qué proporción de las subdivisiones tienen una longitud total menor que 2000?
¿Entre 2000 y 4000? ¿Cómo describiría la forma del histograma?

Solución
a.
Tallo y hoja de N = 47
Unidad de hoja = 100

12 0 123334555599 Tallo: millares


23 1 00122234688 Hojas: Centenas
(10) 2 1112344477
14 3 0113338
7 4 37
5 5 23778

El valor representativo esta en 0, no tiene simetría, poca dispersión y no presenta


valores
atípicos.
b.
Distribución de Frecuencias

Intervalo Frecuencia Frecuencia relativa

0  x < 1000 12 0.2553


1000  x < 2000 11 0.2340
2000  x < 3000 10 0.2128
190

3000  x < 4000 7 0.1489


4000  x < 5000 2 0.0426
5000  x < 6000 5 0.1064
Totales 47 1.0000

El histograma muestra la misma forma que el diagrama de tallo y hojas, con un sesgo
Positivo y con la frecuencia mayor en el primer intervalo, no tiene simetría.

42. El conjunto de datos adjuntos está formado por observaciones sobre resistencia al corte
(en libras) de soldadura de punto ultrasónico hecho en un cierto tipo de lámina de
duraluminio. Construya una distribución de frecuencias relativa y un histograma con base
en 10 intervalos de clase, con el primer intervalo que tenga un límite inferior de 4000 y
límite superior de 4200. Comente las características del histograma.

5434 4948 4521 4570 4990 5702 5241 5112 5015 4659 4806
4637 5670 4381 4280 5043 4886 4599 5288 5299 4848 5378
5260 5055 5828 5218 4859 4780 5027 5008 4609 4772 5133
5095 4618 4848 5089 5518 5333 5164 5342 5069 4755 4925
5001 4803 4951 5679 5256 5207 5621 4918 5138 4786 4500
5461 5049 4974 4592 4173 5296 4965 5170 4740 5173 4568
5653 5078 4900 4968 5248 5245 4723 5275 5419 5205 4452
5227 5555 5388 5498 4681 5076 4774 4931 4493 5309 5582
4308 4823 4417 5364 5640 5069 5188 5764 5273 5042 5189
4986

Solución

Distribución de Frecuencias

Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa


191

4000  x < 4200 1 0.01 5000  x < 5200 22 0.22


4200  x < 4400 3 0.03 5200  x < 5400 20 0.20
4400  x < 4600 9 0.09 5400  x < 5600 7 0.07
4600  x < 4800 12 0.12 5600  x < 5800 7 0.07
4800  x < 5000 18 0.18 5800  x < 6000 1 0.01
Totales 100 1.00

43. Un diagrama de Pareto es una variación de un histograma con datos categóricos que
resultan de un estudio de control de calidad. Cada categoría representa un tipo diferente
de producto que incumple las especificaciones o problema de producción. Las categorías
están ordenadas de modo que las que tienen la frecuencia más grande aparezcan en el
extremo izquierdo, luego la categoría con la segunda frecuencia mas grande y así
sucesivamente. Suponga que se obtiene la siguiente información sobre discordancia en
paquetes de circuitos componentes con fallas, 126; componente incorrecto, 210;
soldadura insuficiente, 67; exceso de soldadura, 54; componente faltante, 131. Construya
un diagrama de Pareto.

Solución

Componente con fallas 126


Componente incorrecto 210
Soldadura insuficiente 67
Exceso de soldadura 54
Componente faltante 131
192

44. La concentración de sólidos en agua de río es una característica ambiental importante. Un


artículo científico reportó sobre la concentración (en partes por millón, o ppm) en varios
ríos diferentes. Supongamos que se obtuvieron las siguientes 50 observaciones para un
río en particular:

55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3

a. Construya un diagrama de tallo y hoja


b. ¿Porqué una distribución de frecuencias no puede basarse en los intervalos de clase 0
– 10, 10 – 20, 20- 30,…, 90 – 100?
c. Construya una distribución de frecuencias con intervalos de clase 20 - <30, 30 - <40,…,
90 - < 100.
d. ¿Qué proporción de las observaciones de concentración fue menor de 50?, y ¿por lo
menos 60?
e. Calcule la mediana muestral,
f. La media recortada al 25% y al 10%
g. La media muestral, para los datos de concentración dados y compare estas mediciones.

Solución:

a.
193

2 7 Tallo: decenas
3 01356799 Hojas: unidades y décimos
4 02457789
5 256689
6 0001112455568999
7 1145678
8 37
9 14

e. Porque serían muchos intervalos para el número de datos y además no se puede tomar
el mismo número en dos intervalos distintos.
f. Distribución de frecuencias

Intervalo Frecuencia Intervalo Frecuencia


20 x < 30 1 60 x < 70 16
30 x < 40 8 70 x < 80 7
40 x < 50 8 80 x < 90 2
50 x < 60 6 90 x < 100 2
Totales 23 Totales 27

g. La proporción de concentración menor que 50 es:

p = 17/50 = 0.34 o p = 34%


La proporción de por lo menos 60 es el número de datos mayores o iguales a 60
p = 27/50 = 0.54 o p = 54%

e. Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
50 58.54 2.33 16.46 27.10 45.57 60.80 69.42

Máximo
94.60
60.7  60.9
x  60.8
2

Error
f. N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
26 59.18 1.39 7.11 45.90 55.00 60.80 65.05

Máximo
69.30

Media del
Error
N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
40 58.35 1.86 11.76 36.70 47.47 60.80 67.73

Máximo
77.10
194

xrec 25%  59.18


xrec10%  58.35

g. La media recortada a mayor porcentaje se acerca más al valor de la mediana

45. Se obtuvieron quince muestras de aire de determinada región y se determinó la


concentración de monóxido de carbono en cada una. Los resultados, en ppm fueron los
siguientes:

9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1 9.8

a. Construya un diagrama de tallo y hojas con los datos


b. Comente sus observaciones sobre los dados (simetría, dispersión, valores
representativos y atípicos, etc.)
c. Trace un histograma con la frecuencia relativa en el eje vertical
d. ¿Cómo describiría la forma del histograma?
e. Halle el intervalo de la muestra
f. La varianza muestral s2 de la definición (es decir calcular primeramente las
desviaciones con respecto a la media y luego elevarlas al cuadrado, etc.)
g. La desviación estándar muestral
h. s2 usando el método breve

Solución
a.
8 58 Tallo: Unidades
9 02368 Hojas: Décimos
10 57
11 0
12 12
13 27
14
15 6

b. El valor representativo es el 9, no tiene simetría, presenta cierta dispersión y no presenta


valores atípicos.
c.
Intervalo Frecuencia Frecuencia relativa
8  x < 10 7 0.467
10  x < 12 3 0.200
12  x < 14 4 0.267
14  x < 16 1 0.067
195

Histograma de contaminación del aire en cierta región


50

40

Porcentaje
30

20

10

0
8 10 12 14 16
Concentración de monóxido de carbono en ppm

d. El histograma presenta cierto sesgo positivo y no tiene simetría.


e. El intervalo de la muestra xmax  xmin  15.6  8.5  7.1
 x  x
2

f. s 2 
i
x  10.88 s2 
 ( x  10.88)
i
2

 4.3345
n 1 14

g. s  s 2 s  4.3345  2.08196

 x 
2
(163.2)2
x  1836.3 
2 i
i
h. s 2  n s2  15  4.3345
n 1 14

46. Calcule la media, la varianza y la desviación estándar de la muestra a partir de la siguiente


distribución de frecuencias.

Intervalos de
Frecuencia Intervalos de clase frecuencia
clase
10 ≤ x < 20 121 60 ≤ x < 70 120
20 ≤ x < 30 165 70 ≤ x 80 118
30 ≤ x < 40 184 80 ≤ x < 90 110
40 ≤ x <50 173 90 ≤ x <100 90
50 ≤ x < 60 142

Solución:
196

Para datos agrupados

2
 p 
p p   fi xi 
fx  fi xi2   
i 1
i i
n
x i 1
s 2  i 1 xi = marcas de clase
n n 1
fi = frecuencia del intervalo

Para este conjunto de datos: n   fi  1223 x  51.1243, s  24.2199 s 2  586.60356

47. En “Applied Life Data Analysis” se presenta el tiempo de falla de un fluido aislante entre
electrodos a 34 kV. Los tiempos en minutos son:

0.19 0.78 0.96 1.31 2.78 3.16 4.15 4.67 4.85 6.50 7.35 8.01 8.27 12.06
31.75 32.52 33.91 36.71 72.89

d. Elabore una distribución de frecuencias para estos datos:


e. Calcule la media, la mediana, la varianza y la desviación estándar de la muestra.
f. A partir de la distribución y los intervalos de clase, repita los cálculos para encontrar
la media, la varianza y la desviación estándar y compare los resultados con los del
inciso (b).

Solución:
a.
Distribución de frecuencias
Intervalos Frecuencias Marcas de clase
0  x < 15 14 7.5
15  x < 30 0 22.5
30  x < 45 4 37.5
45  x < 60 0 52.5
60  x < 75 1 67.5

b. x  14.359 s  18.88 s 2  356.4716

c. x  16.9737 s  17.472 s 2  305.263


Se observa que la diferencia entre los valores calculados con los datos agrupados y
los no agrupados es poca, si se considera que la variabilidad de los datos es muy
grande.

48. Examinar los datos adjuntos de mediciones de resistencia al corte, en MPa.


197

22.5 40.4 16.4 73.3 36.6 109.9 30.0 4.4 33.1 66.7 81.5

a. ¿Cuáles son los valores de los cuartos, y cuál es el valor de fs?


b. Trace un diagrama de caja basado en el resumen de cinco números y comente sus
características?
c. ¿Cuánto debe valer una observación para considerarse como inusual? ¿Cómo valor
extremo?
d. ¿Cuánto podría disminuir la observación más grande sin que afecte a fs?

Solución:

c. Ordenando los valores


4.4 16.4 22.5 30.0 33.1 36.6 40.4 66.7 73.3 81.5 109.9

Q1 = 26.25 Q3 = 70 fs = Q3 – Q1 = 70 – 26.25 fs = 43.75

b. xmin  4.4 xmax  109.9 x  36.6

Hay un ligero sesgo positivo, hay dispersión en los datos, es decir mucha variabilidad
No hay valores atípicos.

g. Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por tanto
sería:
26.25 – (1.5)(43.75) = - 39.375 o 70 + (1.5)(43.75) = 135.62
En este caso no hay valores menores que – 39.375 ni mayores que 135.62

Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor que
Q3 + 3.0 fs, por tanto sería:
26.25 – (3.0)(43.75) = - 105 o 70 + (3.0)(43.75) = 201.25

h. El valor de 109.9 podría disminuirse hasta no menos de 73.3, esto es no menor de


(109.9 – 73.3) = 36.6 unidades.
198

Gráfica de caja de resistencia al corte

0 10 20 30 40 50 60 70 80 90 100 110 120


Resistencia en MPa

49. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico,


con una muestra de 26 especímenes y se obtuvieron los siguientes datos (“The Lognormal
Distribution for Modeling Quality Data when the Means Is Near Zero”, J. of Quality
Technology, 1990, pp. 105 – 110):

30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511

Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.

Solución:
Hay un sesgo positivo en los datos, hay un valor extremo (x = 511), presenta una ligera
dispersión, los valores con los que fue construida la caja son:
xmin  30, xmax  511, x  119, Q1  87, Q3  182, f s  95 , 1.5fs = 142.5, 3.0fs = 285
Q3  3.0 f s  182  285  467 , de ahí que 511 > 467 es un valor extremo

Cantidad de aluminio contaminante

0 50 100 150 200 250 300 350 400 450 500


ppm
199

50. Se seleccionó una muestra de 20 botellas de vidrio de cierto tipo y se midió la resistencia
de cada una a la presión interna. Examine la siguiente información parcial de la muestra:

Mediana = 202.2 cuarto inferior = 196.0 cuarto superior = 216.8

Tres observaciones mas pequeñas 125.8 188.1 193.7


Tres observaciones más grandes 221.3 230.5 250.2

d. ¿Hay algunos valores atípicos en la muestra? ¿Algunos valores atípicos extremos?


e. Trace un diagrama de caja que muestre los valores atípicos y comente las características
interesantes que encuentre.

Solución:
a. f s  216.8  196  20.8, 1.5 f s  31.2, 3.0 f s  62.4 ,

Q1  1.5 f s  196  31.2  164.6, Q1  3 f s  196  62.4  133.6


Q3  1,5 f s  216.8  31.2  248, Q3  3 f s  216.8  62.4  279.2
Los valores entre 133.6 < x < 164.6 son atípicos, en este caso no hay.
Los valores menores que 133.6 son atípicos extremos, en este caso x = 125.8 es un
valor
Atípico extremo en la izquierda.
Los valores entre 248 < x < 279.2 son atípicos, en este caso x = 250.2 es un valor atípico
Los valores mayores que 279.2 son extremos, en la derecha no hay valores extremos.
b.

O

120 160 200 240

51. El artículo “A Thin – film Oxygen Uptake Test for the Evaluation of Automotive
Carnkcase Lubricants” (Lubric. Engr., 1984, pp. 153-159) publicó los siguientes datos
del tiempo de oxidación – inducción (en minutos) de varios aceites comerciales:

87 103 130 160 180 195 132 145 211 105 145 153 138 87
99 93 119 129 152

e. Calcule la varianza muestral y la desviación estándar


f. Si las observaciones se volvieran a expresar en horas, ¿cuáles serían los valores
resultantes de la varianza muestral y desviación estándar muestral? Conteste sin
reescribir la expresión.
g. Construya un diagrama de caja y comente las características interesantes
h. Mencione si hay valores atípicos o inusuales.
200

Solución:
error
a. Variable N Media estándar Desv.Est. Mínimo Q1 Mediana Q3
Tiempo 19 134.89 8.16 35.56 87.00 103.00 132.00 153.00

Variable Máximo Varianza


Tiempo 211.00 1264.52

35.65 1264.52
c. 1 h = 60 min, por tanto sh   0.593 y sh2   0.3513
60 3600
d.
Gráfica de caja del tiempo de oxidación de ciertos aceites lubricantes

100 125 150 175 200 225


Tiempo en minutos

El conjunto de datos para la construcción de la caja son los siguientes:


xmin  87, xmax  211, x  152, Q1  103, Q3  153, f s  50
Los brazos llegan a xmin y xmax
Hay cierta simetría, los datos presentan una gran variabilidad y cierta dispersión.

e. No hay valores atípicos ni extremos.

52. Se seleccionaron muestras de tres tipos distintos de cable de acero y se determinó el límite
de fatiga, en MPa, para cada muestra con los resultados siguientes:

Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391 391 392

Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383 388 392

Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380 380 392

d. Trace un diagrama de caja comparativo y comente acerca de semejanzas y diferencias.


201

e. Trace un diagrama de puntos comparativo (un diagrama de puntos para cada muestra
con una escala común). Comente acerca de semejanzas y diferencias.
f. ¿El diagrama de caja comparativo del inciso (a) proporciona una información
evaluativa de las semejanzas y diferencias? Explique por qué.

Solución:
c. Los resúmenes de 5 números: x , los dos cuartiles y las observaciones menor y mayor,
son idénticos en los tres tipos y no hay valores atípicos, por tanto los tres diagramas
de caja individuales, resultan idénticos.
d.

Límite de fatiga de tres tipos diferentes de cable de acero

T1

T2

T3

350 360 370 380 390


MPa

b.
Límite de fatiga para tres tipos diferentes de cables de acero

Variable
T1
T1 T2
T2 T3

T3
354 360 366 372 378 384 390
MPa
202

Se observa un el diagrama de puntos que existe diferente variabilidad en cada tipo, la


naturaleza de los huecos y la existencia de grupos diferentes para las tres muestras.

e. El diagrama de caja del inciso (a) no es capaz de detectar las diferencias entre los tres
conjuntos de datos, la razón principal es que los diagramas de caja dan solo algunos
detalles porque se usa un resumen de sólo 5 datos para comparar el conjunto de datos.

Probabilidad

10. Suponga que los vehículos que toman una determinada salida de la autopista pueden dar
vuelta a la derecha (R), a la izquierda (L) o seguir derecho (S). Imagine que observa la
dirección de tres vehículos sucesivos.

a. Haga una lista de todos los resultados en el evento A, donde tres vehículos toman la
misma dirección.
b. Haga una lista de todos los resultados en el evento B donde tres vehículos toman
direcciones distintas
c. Haga una lista de todos los resultados en el evento C donde sólo dos de los tres
vehículos dan vuelta a la derecha.
d. Haga una lista de todos los resultados en el evento D donde sólo dos vehículos van en
la misma dirección.
e. Haga una lista de los resultados en D’, C  D y C  D .

Solución
El espacio muestral es el siguiente:

 RRR RRS LRL SSR SSL RLS SRL 


 RRL LRS SLR
 RSR LLR LLL LSS
S  
 RLR SRR RSS LLS SLS LSR SLL 
 LRR RLL SRS LSL SSS RSL 

f. A = {RRR, LLL, SSS}


g. B = {RLS, RSL, LRS, LSR, SRL, SLR}
h. C = {RRL, RRS, LRR, SRR, RLR, RSR}
i. D = { RRL, RRS, LRR, SRR, RLR, RSR, RLL, LLR, LRL, SLL, LLS, LSL, SSR,
SSL, RSS, SRS, SLS, LSS}
j. D’ = {RLS, RSL, LRS, LSR, SRL, SLR, RRR, LLL, SSS}
Puesto que C  D, entonces C  D = D y C  D = C
C  D = {RRL, RRS, LRR, SRR, RLR, RSR, RLL, LLR, LRL, SLL, LLS, LSL, SSR,
SSL, RSS, SRS, SLS, LSS}
C  D = {RRL, RRS, LRR, SRR, RLR, RSR}

11. Una biblioteca en una universidad tiene cinco ejemplares de un cierto texto en reserva.
Dos ejemplares (1,2) son primeras impresiones y los otros tres (3, 4,5) son segundas
203

impresiones. Un estudiante examina estos libros en orden aleatorio, deteniéndose solo


cuando selecciona una segunda impresión. Dos posibles resultados son (5), (2, 1,3).
a. Haga una lista de los resultados en S.
b. Si A simboliza el evento cuando exactamente un libro es examinado, ¿cuáles
resultados están es A?
c. Si B es el evento cuando el libro 5 es seleccionado, ¿cuáles resultados están en B?
d. Si C es el evento cuando el libro 1 no se examina, ¿cuáles resultados están en C?

Solución

(1,2,3) (2,1,3) (1,3) (2,3) (3) 


 
a. S  (1,2,4) (2,1,4) (1,4) (2,4) (4)
(1,2,5) (2,1,5) (1,5) (2,5) (5) 
 
a. A = {(3), (4), (5)}
b. B = {(1, 2, 5), (2, 1, 5), (1, 5), (2, 5), (5)}
c. C = {(2, 3), (2, 4), (2, 5), (3), (4), (5)}

12. Una compañía de ingenieros constructores está actualmente trabajando en plantas


eléctricas en tres lugares diferentes. Señalemos como A, el evento en que la planta del
lugar i se termina para la fecha del contrato. Utilice las operaciones de unión, intersección
y complemento para describir cada uno de los siguientes eventos, en términos de A1, A2
y A3, dibuje un diagrama de Venn e ilumine la región correspondiente a cada uno.

a.Por lo menos una planta se termina para la fecha del contrato.


b.Todas las plantas se terminan para la fecha del contrato.
c.Solo se termina la planta del lugar 1 para la fecha del contrato.
d.Exactamente una planta se termina para la fecha del contrato.
e.La planta del lugar 1, o cualquiera de las otras dos plantas, se terminan para la fecha
del contrato.
Solución

a. Ai = {la planta del lugar i se termina para la fecha de contrato}


B = {Por lo menos una planta se termina para la fecha de contrato}
B = A1  A2  A3

A1  A2  A3 A1  A2  A3
204

b. C = {Todas las plantas se terminan para la fecha de contrato}


C = A1  A2  A3
c. D = {Sólo se termina la planta del lugar 1}
D = (A2  A3)’  A1

(A2  A3)’  A1 ( A1  A2 ' A3 ' )  ( A1 ' A2 ' A3 )  ( A1 ' A3 ' A2 )

f. E = {Exactamente una planta se termina}


E  ( A2  A3 )' A1   ( A1  A2 )' A3   ( A1  A3 )' A2 
 ( A1  A2 ' A3 ' )  ( A1 ' A2 ' A3 )  ( A1 ' A3 ' A2 )

g. F = {La planta del lugar 1 o cualquiera de las otras dos}


F = A1  (A2  A3)

A1  (A2  A3)

13. Una empresa de consultoría de computadoras ha licitado en tres proyectos. Supongamos


que Ai = {proyecto i otorgado}, para i = 1, 2, 3, y P(A1) = 0.22, P(A2) = 0.25, P(A3) =
0.28, P(A1 ∩ A2) = 0.11, P(A1 ∩ A3) = 0.05, P(A2 ∩ A3) = 0.07, P(A1 ∩ A2 ∩ A3) = 0.01.
Exprese con palabras cada uno de los siguientes eventos y calcule la probabilidad.
g. A1 ⋃ A2
h. A1’∩ A2’
i. A1 ⋃ A2 ⋃ A3
j. A’1 ∩ A’2 ∩ A’3
k. A’1 ∩ A’2 ∩ A3
l. (A’1 ∩ A’2) ⋃ A3

Solución
205

a. A1 ⋃ A2 Se otorga el proyecto 1 0 el 2
P(A1 ⋃ A2) = P(A1) + P(A2) - P(A1 ∩ A2) = 0.22 + 0.25 – 0.11 = 0.36
b. A1’∩ A2’ = (A1 ⋃ A2)’ No se otorgue el proyecto 1 ni el 2
P(A1 ⋃ A2)’ = 1 – P(A1 ⋃ A2) = 1 – 0.36 = 0.64
c. A1 ⋃ A2 ⋃ A3 Se otorga el proyecto 1 o el 2 o el 3
P(A1 ⋃ A2 ⋃ A3) = P(A1) + P(A2) + P(A3) - P(A1 ∩ A2) - P(A1 ∩ A3) - P(A2 ∩ A3)
+ P(A1 ∩ A2 ∩ A3) = 0.22 + 0.25 + 0.28 – 0.05 – 0.07 – 0.11 + 0.01 = 0.53

d. A’1 ∩ A’2 ∩ A’3 No se otorga ningún proyecto


A’1 ∩ A’2 ∩ A’3 = (A1 ⋃ A2 ⋃ A3)’ = 1 – P(A1 ⋃ A2 ⋃ A3) = 1- 0.53 = 0.47

e. A’1 ∩ A’2 ∩ A3 Sólo se otorga el proyecto 3


A’1 ∩ A’2 ∩ A3 = (A1 ⋃ A2)’ ∩ A3
P(A’1 ∩ A’2 ∩ A3) = P(A3) - P(A1 ∩ A3) - P(A2 ∩ A3) + P(A1 ∩ A2 ∩ A3)
f. (A’1 ∩ A’2) ⋃ A3 = (A1 ⋃ A2)’ ⋃ A3
No se otorgue el proyecto 1 y 2 o se otorgue el 3
P[(A’1 ∩ A’2) ⋃ A3] = P(A1 ⋃ A2)’ + P(A3) - P[(A1 ⋃ A2)’ ∩ A3]
P[(A1 ⋃ A2)’ ⋃ A3] = 0.64 + 0.28 – 0.17

P[(A1 ⋃ A2)’ ⋃ A3] = 0.75

A1 A2
A1 A2
.08
.08 .07 .10
.07 .10
.01
.01 .06
.06 .04
.04
.17
.17 A3
A3

14. Una biblioteca tiene cinco ejemplares de cierto texto, de los cuales 1 y 2 son primeras
impresiones y 3, 4 y 5 son segundas impresiones. Serán seleccionados al azar dos
ejemplares para ser puestos en reserva de 2 horas (lo que indica 10 resultados igualmente
probables).
a. ¿Cuál es la probabilidad de que ambos ejemplares seleccionados sean primeras
impresiones?
b. ¿Cuál es la probabilidad de que ambos ejemplares seleccionados sean segundas
impresiones?
c. ¿Cuál es la probabilidad de que, al menos uno de los ejemplares seleccionados sea una
primera impresión?
d. ¿Cuál es la probabilidad de que los ejemplares seleccionados sean de diferentes
impresiones?
206

Solución
(1, 2) (1,3) (1, 4) (1,5) (2,3) 
S  
(2, 4) (2,5) (3, 4) (3,5) (4,5) 
n( A)
i. P( A)  P(A) es la probabilidad del evento A, n(A) son los resultados favorables
n
1
y N el número total de resultados, por tanto n(A) = 1, N = 10  P( A)   0.1
10
3
ii. n(B) = 3  P( B)   0.3
10
7
iii. n(C) = 7  P(C )   0.7 Al menos uno significa uno o ambos ejemplares sean
10
primeras impresiones.
6
iv. n(D) = 6  P( D)   0.6
10

15. Un sistema puede tener tres tipos de defectos: Ai ( i = 1,2,3) es cuando este sistema puede
tener un defecto del tipo i. Suponga que
P(A1) = 0.12 P(A2) = 0.07 P(A3) = 0.05 P(A1  A2) = 0.13 P(A1  A3) = 0.14
P(A2  A3) = 0.10 P(A1  A2  A3) = 0.01
a. ¿Cuál es la probabilidad de que el sistema no tenga el defecto tipo 1?
b. ¿Cuál es la probabilidad de que el sistema tenga defectos tipo 1 y 2 al mismo tiempo?
c. ¿Cuál es la probabilidad de que el sistema tenga defectos tipo 1 y tipo 2 al mismo
tiempo pero no tenga defectos tipo 3?
d. ¿Cuál es la probabilidad de que el sistema tenga a lo sumo dos de esos defectos?

Solución

A1 A2
0.0
.04 .05
.01
.01
.02
.01
A3

a. P(A1’) = 1 – P(A) = 1- 0.12 = 0.88 P(A1’) = 0.88

b. P(A1  A2) = P(A1) + P(A2) - P(A1  A2) P(A1  A2) = 0.12 + 0.07 – 0.13 = 0.06

e. P(A1  A2  A3’) = P(A1  A2) - P(A1  A2  A3) = 0.06 – 0.01 = 0.05


P(A1  A2  A3’) = 0.05

f. P(a lo sumo tenga dos defectos) = 1 – P(tenga los tres defectos) = 1 – 0.01 = 0.99
207

P(a lo sumo tenga dos defectos) = 0.99

16. Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta
compañía, presentan grietas en la parte inferior del bastidor principal; suponga que una
ciudad tiene 20 de estos autobuses y que han aparecido grietas en 8 de ellos.
a. ¿Cuántas formas hay de seleccionar una muestra de 5 autobuses de los 20 para una
inspección completa?
b. ¿En cuántas formas puede una muestra de cinco autobuses contener exactamente 4 con
grietas visibles?
c. Si se escoge al azar una muestra de 5 autobuses, ¿cuál es la probabilidad de que
exactamente 4 de los 5 tengan grietas visibles?
d. Si se seleccionan los autobuses como en el inciso (c), ¿cuál es la probabilidad de que
al menos 4 de los seleccionados tengan grietas visibles?

Solución
 20 
a. Número de formas =    15504
5
 8 12 
b. Número de formas =     840
 4  1 
 8 12 
  
c. P( X  4)     
4 1 840
 0.0542
 20  15504
 
5

P( X  4)  P( X  4)  P( X  5)
 8 12   8 12 
d.      
P( X  4)          0.0542  0.0036  0.0578
4 1 5 0
 20   20 
   
5 5

17. Una planta de producción emplea 20 trabajadores de turno de día y 15 en el segundo turno
y 10 en el de la noche, Un consultor de control de calidad selecciona 6 de estos
trabajadores para hacerles una entrevista. Supongamos que la selección se hace en tal
forma que cualquier grupo de 6 trabajadores tiene la misma probabilidad de ser
seleccionado, del mismo modo que cualquier otro grupo (seleccionar 6 sin sustitución de
entre 45).
a. ¿De cuántas maneras se pueden seleccionar 6 trabajadores que provengan del turno de
día? ¿Cuál es la probabilidad de que los 6 trabajadores seleccionados sean del turno de
día?
b. ¿Cuál es la probabilidad de que los 6 trabajadores seleccionados sean del mismo turno?
c. ¿Cuál es la probabilidad de que, al menos dos turnos diferentes sean representados
entre los trabajadores seleccionados?
208

d. ¿Cuál es la probabilidad de que al menos, uno de los turnos no esté representado en la


muestra de trabajadores?
Solución:
 20 
a. El número de formas de seleccionar 6 trabajadores del turno diurno =    38760
6
 20  25 
  
P(todos los trabajadores sean del turno diurno) =     0.0048
6 0
 45 
 
6
 20  45  15  30  10  35 
        
a. P(todos sean del mismo turno) =             0.0054
6 0 6 0 6 0
 45   45   45 
     
6 6 6
b. P(por lo menos dos turnos sean representados) = 1 – P(solo un turno este representado)
= 1 – 0.0054 = 0.9946
c. Sea D = {al menos uno de los turnos no esta representado}, es decir que uno o dos
turnos no está representado.
Sea A1 = El turno de día no está representado, A2 = El segundo turno no está
representado y A3 = El turno nocturno no está representado, entonces lo que se pide es:
P(D) = P(A1 A2  A3) = P(A1) + P(A2) + P(A3) – P(A1  A2) – P(A1  A2) 
P(A2  A3) + P(A1  A2  A3)

 25   30   35 
     
P( A1 )   6
, P( A2 )   6
, P( A3 )   
6
P(A1  A2) = P( todos del turno
 45   46   46 
     
6 6 6
nocturno)

10  15   20 
     
P( A1  A2 )    , P( A1  A3 )    , P( A2  A3 )    , P(A1  A2  A3) = 0
6 6 6
 45   45   45 
     
6 6 6

 25   30   35  10  15   20 
      
P( D)               0.2885
6 6 6 6 6 6
 45 
 
6

18. Un investigador estudia los efectos de la temperatura y el tipo de catalizador de cierta


reacción química. Considera tres diferentes temperaturas, cuatro diferentes presiones y
cinco diferentes catalizadores.
209

a. Si en cualquier corrida experimental interviene el uso de una sola temperatura, presión


y catalizador, ¿cuántas corridas experimentales son posibles?
b. ¿en cuantas corridas experimentales interviene el uso de la temperatura y las dos
presiones más bajas?

Solución:
i. Sea T = 3, P = 4 y C = 5, entonces n1 = 3, n2 = 4, n3 = 5
Entonces N = (3)(4)(5) = 60

ii. Para sólo dos presiones y una temperatura N = (1)(2)(5) = 10

19. En el problema anterior suponga que se hacen cinco corridas experimentales diferentes
el primer día de experimentación. Si las cinco se seleccionan al azar de entre todas las
posibilidades, de tal modo que cualquier grupo de cinco tiene la misma probabilidad de
selección, ¿Cuál es la probabilidad de que se utilice un catalizador diferente en cada
corrida?

Solución
 60 
Sea A ={uso de un catalizador diferente en cada corrida}, hay   formas de seleccionar
5
las cinco corridas y además ya que 60/5 = 12, en doce corridas diferentes se usa el mismo
catalizador, así que el número de forma de seleccionar una corrida de de cada uno de
estos grupo es 125, entonces la probabilidad de A es:

125
P( A)   0.0456
 60 
 
5

Probabilidad Condicional

20. Cierto automóvil deportivo está equipado con transmisión automática o con transmisión
manual y se puede adquirir en uno de cuatro colores. Las probabilidades relevantes de las
diversas combinaciones de tipo de transmisión y color son las siguientes:

color
Blanco Azul Negro Rojo

Tipo de A 0.15 0.10 0.10 0.10


transmisión M 0.15 0.05 0.15 0.20

A = {transmisión automática}, B = {negro} y C = {blanco}.


d. Calcule P(A), P (B) y P (A ∩ B).
e. Calcule P(A / B) y P (B / A) y explique que representa cada una de esas probabilidades.
f. Calcule e interprete P(A / C) y P ( A / C’).
210

Solución:
f. P(A) = 0.15 + 0.10 + 0.10 + 0.10 = 0.45
P (B) = 0.10 + 0.25 = 0.25
P(A  B) =0.10

P( A  B) 0.10
g. P( A / B)    0.40
P( B) 0.25
Probabilidad de que el automóvil tenga transmisión automática si se adquirió en
color negro.

P( A  B) 0.10
P( B / A)    0.22
P( A) 0.45
Probabilidad de que el automóvil sea negro si se adquirió con transmisión automática.

P( A  C ) 0.15
h. P( A / C )    0.5
P(C ) 0.30

P( A  C ' )
P( A / C ' )  P(C ' )  0.70 P( A' )  0.55
P(C ' )

(A’  C)’ = A  C’
P (A  C’) = P(A) – P(A C) = 0.45 – 0.15 = 0.30
P( A  C ' ) 0.30
P( A / C ' )    0.429
P(C ' ) 0.70

21. Un sistema puede tener tres tipos de defectos: Ai (i = 1, 2, 3) es cuando este sistema
puede tener un defecto del tipo i. Suponga que:
P (A1) = 0.12, P (A2) = 0.07, P (A3) = 0.05, P (A1⋃ A2) = 0.13, P (A1 ⋃ A3) = 0.14
P (A2 ⋃ A3) = 0.10, P (A1 ∩ A2 ∩ A3) = 0.01
e. Si el sistema tiene defecto tipo 1, ¿cuál es la probabilidad de que tenga un defecto tipo
2?
f. Si el sistema tiene un defecto tipo 1, ¿cuál es la probabilidad de que tenga los tres tipos
de defectos?
g. Si el sistema tiene al menos un tipo de defecto, ¿cuál es la probabilidad de que tenga al
menos un tipo de defecto?
h. Si el sistema tiene los dos primeros tipos de defectos a la vez, ¿cuál es la probabilidad
de que no tenga el tercer tipo de defecto?

Solución
211

P( A1  A2 )  P( A1 )  P( A2 )  P( A1  A2 )
 0.12  0.07  0.13  0.06
P( A2  A3 )  P( A2 )  P( A3 )  P( A2  A3 )
 0.07  0.05  0.10  0.02
P( A1  A3 )  P( A1 )  P( A3 )  P( A1  A3 )
 0.12  0.05  0.14  0.03

P( A1  A2 ) 0.06
a. P( A2 / A1 )    0.5
P( A1 ) 0.12

P( A1  A2  A3 ) 0.01
b. P( A1  A2  A3 / A1 )    .0833
P( A1 ) 0.12

c. Sea B ={El sistema tiene al menos un tipo de defecto}


C = {El sistema tiene un solo tipo de defecto}
D = {El sistema tiene dos tipos de defectos}
E = {El sistema tiene tres tipos de defectos}

P(B) = P(C) + P(D) + P(E)

P(C) = 0.04 + 0.01 = 0.05


P(D) = 0.05 + 0.02 + 0.01 = 0.08
P(E) = 0.01
P(B) = 0.05 + 0.08 + 0.01 = 0.14

P(C  B) P(C  B)  P(C )  P( B)  P(C  B)


P(C / B) 
P( B)  0.05  0.14  0.14  0.05

0.05
P(C / B)   0.357
0.14

d. Sea F = {El sistema tiene los dos primeros tipos de defectos}


P(F) = P(A1  A2) = 0.06
A3’ = El sistema no tiene el tercer tipo de defecto, P(A3’) = 0.95

P( A3'  F ) P( A3'  A1  A2 ) 0.05


P( A / F ) 
'
3    0.833
P( F ) P( F ) 0.06

22. Para clientes que compran un juego completo de neumáticos en cierta distribuidora,
considere los eventos:
212

A = {los neumáticos son fabricados en Estados Unidos}


B = {el comprador balancea de inmediato los neumáticos}
C = {el comprador pide alineación de neumáticos delanteros}
Junto con A’, B’ y C’ suponga las siguientes probabilidades incondicionales y
condicionales:
P (A) = .75 P(B / A) = .9 P(B / A’) = .8 P( C / A ∩ B) = .8 P(C / A ∩ B’) = .6 P( C
/ A’ ∩ B) = .7 P(C / A’ ∩ B’) = .3
a. Construya un diagrama de árbol formado de ramas de primera, segunda y tercera
generaciones y ponga una marca de evento y la probabilidad adecuada junto a la rama.
b. Calcule P(A ∩ B ∩C)
c. Calcule P(B ∩ C)
d. Calcule P(C )
e. Calcule P(A / B ∩ C), como la probabilidad de una compra de neumáticos fabricados
en Estados Unidos, dado que se pidió alineación y balanceo.

Solución 0.80
a. P( A  B  C)  0.75  0.9  0.8  0.54 C

0.90
B C’
P( B  C )  P( A  B  C )  P( A ' B  C )
b. 0.10 0.60
 0.54  (0.25  0.8  0.7)  0.68
0.75 B’ C
c, A
P(C )  P( A  B  C )  P( A ' B  C )  C’

P( A ' B ' C )  P( A  B ' C ) 0.70


0.25
 0.54  (0.75  0.1 0.7)  (.25  0.7  0.8) 0.80
C

 (0.25  0.2  0.3)  0.54  0.045  0.14  0.15 A’


B C’
 0.74 0.20 0.30
B’
C
P( A  B  C ) 0.54
d. P( A / B  C )    0.794 C’
P( B  C ) 0.68

23. En cierta gasolinería, 40% de los clientes utilizan gasolina regular sin plomo (A1), 35%
gasolina extra sin plomo (A2) y 25% gasolina Premium sin plomo (A3). De los clientes
que consumen gasolina regular, sólo 30% llenan sus tanques (evento B). De los que
consumen gasolina extra, 60% llenan sus tanques, mientras que de los que usan Premium,
50% llenan sus tanques.
d. ¿Cuál es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y
llene su tanque (A2 ∩ B)?
e. ¿Cuál es la probabilidad de que el siguiente cliente llene su tanque?
f. Si el siguiente cliente llena su tanque, ¿cuál es la probabilidad de que pida gasolina
regular?, ¿extra? Y ¿Premium?

Solución
213

P(A1  B) = 0.4  0.3 = 0.12


0.30
B

0.40
A1 P(A 2  B) = 0.35  0.6 = 0.210
0.60
B
0.35
A2

0.25
A3
0.50
P(A3  B) = 0.25  0.5 = 0.125

a. P( A1  B)  0.21

b. P(B)  P( A1  B)  P( A2  B)  P( A3  B)  0.12  0.21  0.125  0.455

P( A1  B) 0.12
c. P( A1 / B)    0.264
P( B) 0.455

P( A2  B) 0.21
P( A2 / B)    0.462
P( B) 0.455

P( A3  B) 0.125
P( A3 / B)    0.274
P( B) 0.455

Independencia

1. La probabilidad de que un calificador cometa un error de marcación en una pregunta de


opción múltiple, es 0.1. Si hay diez preguntas marcadas independientemente, ¿cuál es la
probabilidad de que no cometa errores? y ¿de que cometa al menos un error? Si hay n
preguntas y la probabilidad de cometer un error es p sugiera expresiones para estas
probabilidades.

Solución

P (no cometer un error en cualquiera de las preguntas) = 0.9


P (no cometer errores en las 10 preguntas) = (0.9)10 = 0.3487
P (cometa al menos un error) = 1 – (0.9)10 = 1 – 0.3487 = 0.6513
214

Si p es la probabilidad de cometer un error y n el número de preguntas, entonces


P (no cometer errores) = (p)n
P (cometer al menos un error) = 1 – (p)n

2. Una compañía de prospección petrolera tiene dos proyectos activos, uno en Asia y otro en
Europa. Sea A, el evento donde el proyecto asiático tiene éxito y B el evento donde el
proyecto europeo sea exitoso. Suponga que A y B son independientes con P(A) = 0.4 y
P (B) = 0.7.
a. Si fracasa el proyecto asiático, ¿cuál es la probabilidad de que también fracase el
proyecto europeo? Explique su razonamiento.
b. ¿Cuál es la probabilidad de que por lo menos uno de los proyectos tenga éxito?
c. Dado que por lo menos uno de los dos proyectos es exitoso, ¿cuál es la probabilidad
de que sólo el proyecto asiático tenga éxito?

Solución

a. P (fracase el proyecto asiático) = P(A’) = 0.6


P (fracase el proyecto europeo) = P (B’) = 0.3

P( A ' B ') P( A  B)' 0.18


P( B '/ A ')     0.30
P( A ') P( A ') 0.6

b. P (por lo menos un proyecto tenga éxito) = P (C)


P(C )  P( A)  P( B)  P( A  B)
 0.4  0.7  (0.4)(0.7)  1.1  0.28  0.82

P( A  ( A  B)) 0.12
c. P( A / A  B)    0.146
P( A  B) 0.82

3. Una costura hecha en un avión necesita 25 remaches. La costura tendrá que volver a
realizarse si cualquiera de los remaches está defectuoso. Suponga que los remaches están
defectuosos independientemente unos de otros, cada uno con la misma probabilidad.
a. Si 14% de todas las costuras necesitan volver a efectuarse, ¿Cuál es la probabilidad de
que un remache esté defectuoso?
b. ¿Qué tan pequeña debe ser la probabilidad de un remache defectuoso para asegurar
que solo 10% de todas las costuras necesiten volver a ejecutarse?
Solución:

a. P(volver a efectuarse la costura) = 0.14 = 1 – P(no necesita volver a realizarse)


0.14  1  P(1º no este defec.  2º no este defec.  ...  25º no este defec.)
0.14 = 1 – (1 – q)25

0.86 = (1 – q)25 1  q  (0.86)  0.993985 q = 1 – 0.993985 = 0.006015


1
25
215

q = 0.006015

b. Análogamente al inciso anterior:

0.10  1  (1  q)25 (1  q) 25  0.90 1  q  (0.90)  0.99579


1
25

q  1  0.99579  0.00421

q = 0.00421

4. Un calentador tiene cinco válvulas de liberación idénticas. La probabilidad de que una


válvula en particular se abra cuando se requiere es de 0.95. Si la operación de las válvulas
es independiente, calcule P(al menos una válvula se abre) y P(al menos una válvula no se
abre).

Solución:

P(al menos una válvula se abre) = 1 – P (ninguna se abre) = 1 – (0.05)5 = 0.99999969


P(al menos una no se abre) 1 – P (todas se abren) = 1 – (0.95)5 = 0.2262

5. Dos bombas conectadas en paralelo fallan independientemente una de otra en un día dado.
La probabilidad de que la bomba más vieja falle es 0.10 y la probabilidad de que solo la
bomba más nueva falle es 0.05. ¿Cuál es la probabilidad de que el sistema de bombeo falle
en cualquier día dado (lo que sucederá si ambas bombas fallan)?

Solución:
Sea B1 la bomba mas vieja falla
11
Sea B2 la bomba nueva falla
La probabilidad de que el sistema falle P (B1  B2)
Sea P (B1  B2) = x, entonces P (B1) = 0.10 + x y
2
P (B2) = 0.05 + x

P( B1  B2 )  P( B1 ) P( B2 )  (0.10  x)(0.05  x)
(0.10  x)(0.05  x)  x
0.005  0.15 x  x 2  x x 2  0.85 x  0.005  0
0.85  0.7225  9.020 0.85  0.838
x 
2 2
x1  0.844 x2  0.0059

De estas dos soluciones la probabilidad razonable es la menor, entonces


P (sistema falle) = 0.0059

6. Considere el sistema de componentes conectados de la figura siguiente. Los componentes


funcionan de manera independiente uno de otro y P (el componente1, 2, y 3 funcionen) =
0.9, P (el componente 4 funcione es 0.95), calcule P (el sistema funciona).
216

1 2
4
3

Solución:
Sea P(Ai), la probabilidad de que el componente i = 1, 2, 3, 4 funcionen y
P(A1) = P(A2) = P(A3) = 0.90 y P(A4) = 0.95, entonces

P(sist. funcione)  P  ( A1  A2 )  A3   A4   P  ( A1  A2 )  A3  P( A4 )


 [ P( A1  A2 )  P( A3 )  P(( A1  A2 )  A3 )] P( A4 )
 [ P( A1 )  P( A2 )  P( A1 ) P( A2 )  P( A3 )  [ P( A1 )  P( A2 )  P( A1 ) P( A2 )]P( A3 )]P( A4 )
 [ P( A1 )  P( A2 )  P( A1 ) P( A2 )  P( A3 )  P( A1 ) P( A3 )  P( A2 ) P( A3 ) 
P( A1 ) P( A2 ) P( A3 )]P( A4 )
 [(0.9)  (0.9)  (0.9) 2  (0.9)  (0.9) 2  (0.9) 2  (0.9)3 ](0.95)  0.949

7. Considere el sistema de componentes conectados, de la figura siguiente. Los componentes


1 y 2 están conectados en paralelo, de modo que el subsistema funciona si y solo si 1 o 2
funcionan; puesto que 3 y 4 están conectados en serie, ese subsistema trabaja si y sólo si
trabajan 3 y 4. Si los componentes funcionan de manera independiente uno de otro y P(el
componente funciona) = 0.9, calcule P (de que el sistema funciona)

3 4

Solución:

Sea Ai (i = 1, 2, 3, 4) el evento donde el iésimo componente funciona con P(Ai) = 0.90


217

P(sist. funcione)   P  A1  A2     P( A3  A4 ) 
 P  A1  A2   P  A3  A4   P ( A1  A2 )  ( A3  A4 ) 
=P( A1 )  P( A2 )  ( A1  A2 )  P( A3 ) P( A4 ) 
P ( A1  A3  A4 )   A2  A3  A4 
  P( A1 )  P( A2 )  P( A1 ) P( A2 )   P( A3 ) P( A4 )   P( A1 ) P( A3 ) P( A4 ) 
P( A2 ) P( A3 ) P( A4 )  P( A1 ) P( A2 ) P( A3 ) P( A4 )
  0.9  0.9  0.92   0.92  0.93  0.93  0.9 4
 1.8  1.458  0.6561  0.9981
P (sist. funcione) = 0.9981

8. En la siguiente configuración, ¿Cuál debe ser la probabilidad P(Ai) para que el coeficiente
de confiabilidad del tiempo de vida media del sistema sea 0.99? (Sugerencia: sea P(Ai) =
p, exprese la confiabilidad del sistema en términos de p y luego sea x = p2.)

1 2

3 4

Solución:

9. En el proceso de producción de válvulas de motor, éstas se someten a un primer


rectificado. Las válvulas cuyos espesores están dentro de la especificación se encuentran
listas para la instalación. Las válvulas cuyos espesores están arriba de la especificación se
rectifican, mientras que aquellas que están por debajo se desechan. Suponga que después
del primer rectificado, 70% de las válvulas satisfacen la especificación, 20% es
nuevamente rectificado y 10% se desecha. Además, suponga que de las válvulas que son
nuevamente rectificas, 90% satisface la especificación y 10% se desecha.
a. Determine la probabilidad de que una válvula se rectifique una sola vez.
b. Dado que una válvula se hace una sola vez, ¿Cuál es la probabilidad de que se deseche?
c. Determine la probabilidad de que se deseche una válvula.
d. Dado que la válvula se desecha, ¿cuál es la probabilidad de que se rectifique dos
veces?
e. Determine la probabilidad de que la válvula satisfaga la especificación (después de la
primera o segunda rectificación).

Teorema de Bayes
218

1. Una compañía telefónica regional opera tres estaciones relevadoras idénticas en diferentes
sitios. Durante un período de un año, el número de desperfectos reportados por cada
estación y las causas se muestran abajo.

Estaciones A B C
Problemas con el suministro de
2 1 1
electricidad
Desperfecto de la computadora 4 3 2

Fallas del equipo eléctrico 5 4 2


Fallas ocasionadas por errores
7 7 5
humanos

Suponga que se reporta una falla y se encuentra que fue ocasionada por errores humanos.
¿Cuál es la probabilidad de que provenga de la estación C?

2. Tres imprentas realizan trabajos para una oficina de publicaciones de un Tecnológico. La


oficina de publicaciones no negocia una multa contractual por trabajos atrasados y los
datos siguientes reflejan una gran experiencia con estas imprentas.
Fracción de contratos con la Fracción de tiempo de entrega
Imprenta
imprenta con mas de un mes de retraso
1 0.2 0.2
2 0.3 0.5
3 0.5 0.3

Un departamento observa que su folleto de reclutamiento tiene más de un mes de retraso


¿Cuál es la probabilidad de que el contrato se halla otorgado a la imprenta 3?

3. Una compañía fabrica empaques de hule para tuberías en tres sitios distintos de una
ciudad, llamémosles S1, S2 y S3, los cuales producen respectivamente 45, 30 y 25% del
total. Se estima que 8% de los empaques de S1 son defectuosos, mientras que para S2 y
S3 las cifras correspondientes son 6% y 3%. Los fabricados en los tres sitios se concentran
luego en bodega. Si un inspector de control de calidad toma un empaque al azar y lo
encuentra defectuoso, ¿qué probabilidad hay de que provenga de S1?

4. Sesenta por ciento de los aviones que desaparecen en vuelo, en cierto país, son
descubiertos posteriormente. De las naves descubiertas, 60% tienen localizador de
emergencia, mientras que 90% de los no descubiertos no tienen ese localizador. Suponga
que desaparece un avión ligero.
a. Si tiene localizador de emergencia, ¿cuál es la probabilidad de que no sea localizado?
b. Si no tiene localizador de emergencia, ¿cuál es la probabilidad de que sea localizado?

5. Se envían componentes de cierto tipo a un proveedor en lotes de 10. Suponga que 50% de
estos lotes no tienen componentes defectuosos, 30% un componente defectuoso y 20%
219

dos componentes defectuosos. Dos componentes de un lote se seleccionan al azar y se


prueban. ¿Cuáles son las probabilidades asociadas de que haya 0,1 y 2 componentes
defectuosos en el lote, bajo cada una de las siguientes condiciones?
a. Ningún componente probado está defectuoso.
b. Uno de los componentes probados está defectuoso. (Sugerencia: dibuje un diagrama
de árbol de tres ramas de primera generación para los tres tipos diferentes de lotes).

6. En una fábrica los obreros trabajan tres turnos distintos. En el último año ocurrieron 200
accidentes. Algunos de estos pueden atribuir por lo menos en parte a las condiciones
inseguras de trabajo, en tanto que otros se relacionan con las condiciones de trabajo. En
la tabla siguiente se proporciona el porcentaje de accidentes que caen en cada tipo de
categoría accidente - turno.

Condiciones Condiciones no
inseguras relacionadas
Diurno 10% 35%
Turno Vespertino 8% 20%
Nocturno 5% 22%

Suponga que se elige al azar uno de los 200 informes de accidentes de un archivo y
redetermina el turno y tipo de accidente.
1. ¿Cuáles son los eventos simples?
2. ¿Cuál es la probabilidad de que el evento seleccionado se atribuya a condiciones
inseguras?
3. ¿Cuál es la probabilidad de que no ocurra en el turno diurno?

7. Los datos recopilados por el departamento de justicia, acerca del número de personas
arrestadas por diversos crímenes en 1998, revelaron que 89% eran hombres y 11%
mujeres. De ellos, 30% contaban con menos de 18 años, mientras que 27% de ellas tenían
menos de 18 años.
a. ¿Cuál es la probabilidad de que el arrestado por un crimen tuviera menos de 18 años?
b. Si una persona arrestada por un crimen tenía menos de 18 años, ¿cuál es la probabilidad
de que sea una mujer?

8. Una compañía de seguros ha recopilado los siguientes datos relativos a la edad de los
conductores y la tasa de accidentes dentro de cada grupo.

% de conductores Tasa de
Grupo de edad
asegurados accidentes
Menos de 25 0.16 0.055
25- 44 0.40 0.025
45 - 64 0.30 0.02
65 o más 0.14 0.40
220

a. ¿Cuál es la probabilidad de que un conductor asegurado esté involucrado en un


accidente?
b. ¿Cuál es la probabilidad de que un conductor asegurado que esté involucrado en un
accidente tenga menos de 25 años?
221

PROBLEMARIO DE PROBABILIDAD Y ESTADISTICA


TERCER EXAMEN PARCIAL
PROFRA. ROSA MARIA AGUILAR RIVERA

DISTRIBUCIONES DE PROBABILIDAD CONJUNTA

1. Cuando un automóvil es detenido por una patrulla, se revisa el desgaste de cada neumático y cada
faro delantero, para ver si está correctamente alineado. Representemos con X el número de faros
delanteros que necesitan ajuste y con Y el número de neumáticos defectuosos.
a. Si X y Y son independientes con px(0) = 0.5, px(1) = 0.3, px(2) = 0.2 y py(0) = 0.6, py(1) = 0.1,
py(2) = py(3) = 0.05 py(4) = 0.2, presente la fpm conjunta de (X, Y) en una tabla de probabilidad
conjunta.
b. Calcule P(X ≤ 1 y Y ≤ 1) de la tabla de probabilidad conjunta y verifique que sea igual al
producto de P(X ≤ 1) · P(Y ≤ 1).
c. ¿Cuál es P(X + Y = 0) (la probabilidad de no violaciones)?
d. Calcule P(X + Y ≤ 1).
Solución:
a.
x 0 1 2 y 0 1 2 3 4
p(x) 0.5 0.3 0.2 p(y) 0.6 0.1 0.05 0.05 0.2

Puesto que las variables X y Y son independientes:


P( X  x y Y  y)  P( X  x)P(Y  y)

y
p(x, y) 0 1 2 3 4
0 0.30 0.05 0.025 0.025 0.10
x 1 0.18 0.03 0.015 0.015 0.06
2 0.12 0.02 0.010 0.010 0.04

b. P(X  1 y Y  1) = 0.30 + 0.05 + 0.18 + 0.03 = 0.56


P(X  1)  P(Y  1) = (0.8)(0.7) = 0.56

c. P( X  Y  0)  p(0,0)  0.30

d. P( X  Y  1)  p(0,0)  p(0,1)  p(1,0)  0.30  0.05  0.18  0.53 P( X  Y  1)  0.53

2. Sea la distribución de probabilidad conjunta dada en la siguiente tabla, donde X = la edad de un


niño y Y = su estatura en m.

x
y 8 9 10 11
1.20 0.1 0.04 0 0
1.25 0.05 0.11 0.2 0
1.30 0 0.1 0.15 0.1
222

1.35 0 a 0.05 0.1

a. Calcule P(X = 9, Y = 1.35) = a


b. Halle el coeficiente de correlación XY .
Solución:
a. Puesto que la suma de todas las probabilidades debe ser igual a 1, entonces

P(X = 9, Y = 1.35) = 0, esto es a = 0

Cov( X , Y )
b.  XY  , Cov( X , Y )  E ( XY )  E ( X ) E (Y ) , E  h( X , Y )   h( x, y) p( x, y)
 XY x y

E(XY) = (1.20)(8)(0.1) + (1.20)(9)(0.04) + 0 + 0 + (1.25)(8)(0.05) + (1.25)(9)(0.11) +


(1.25)(10)(0.2) + 0 + 0 + (1.30)(9)(0.1) + (1.30)(10)(0.15) + (1.30)(11)(0.1) + 0 + 0 +
(1.35)(10)(0.05) + (1.35)(11)(0.1) = 12.3395 E(XY) = 12. 3395

Las distribuciones de probabilidad marginales son:

x 8 9 10 11 y 1.20 1.25 1.30 1.35


PX (x) 0.15 0.25 0.40 0.20 PY (y) 0.14 0.36 0.35 0.15

A partir de estas distribuciones obtenemos E(X) = 9.65 y E(Y) = 1.2755, entonces la covarianza
es, Cov.(X, Y) = 12.3395 – (9.65)(1.2755) = 0.030925
V ( X )  E( X 2 )   E( X ) , V (Y )  E(Y 2 )   E(Y ) ,  X  V ( X ),  Y  V (Y )
2 2

E ( X 2 )  82 (0.15)  92 (0.25)  102 (0.40)  112 (0.20)  94.05


E (Y 2 )  (1.20) 2 (0.14)  (1.25) 2 (0.36)  (1.30) 2 (0.35)  (1.35)2 (0.15)  1.62897
V ( X )  94.05  (9.65) 2  0.9275,  X  0.9275  0.963
V (Y )  1.62897  (1.2755) 2  0.0020697,  Y  0.0020697  0.0455

0.030925
  0.70587   0.70587
(0.963)(0.0455)

3. Sea X el número de veces que falla cierta máquina de control numérico: 1, 2 o 3 veces en un día
dado. Sea Y el número de veces que se llama a un técnico para una emergencia. Su distribución
de probabilidad conjunta está dada como:

p(x, y) x 1 2 3
1 0.05 0.05 0.10
y 2 0.05 0.10 0.35
3 0 0.20 0.10

a. Evalúe la distribución marginal de X.


b. Evalúe la distribución marginal de Y.
c. Encuentre P(Y = 3 / X = 2).
Solución:
223

a. b.
x 1 2 3 y 1 2 3

px (x) 0.10 0.35 0.55 py (y) 0.20 0.50 0.30

c. P(Y = 3 /X =2)

p ( x, y ) p(2, y )
P Y X   , P Y X  2  
px ( x) px (2)
p(2,1) 0.05 p(2, 2) 0.10 p(2,3) 0.20
  0.1428,   0.2857,   0.5715
px (2) 0.35 px (2) 0.35 px (2) 0.35

y 1 2 3

p (y/x=2) 0.1428 0.2857 0.5715

P(Y = 3 /X = 2) = 0.5715

4. Sea la siguiente función de probabilidad conjunta de X y Y :


a. Encuentre las distribuciones marginales de X y Y.
b. Encuentre la distribución de probabilidad condicional para Y/ X = 4
c. Calcule P(Y ≤ 3 / X = 4)

x
y 2 3 3.5 4 5
3 2 1
2 35 35 35 0 0
1 10 2 1
3 35 35 35 35 0
1 5 1 1
3.5 0 35 35 35 35
3 2
4 0 0 0 35 35
1 1
5 0 0 0 35 35

Solución:
a.
x 2 3 3.5 4 5
4 13 8 6 4
px (x) 35 35 35 35 35
224

y 2 3 3.5 4 5
6 14 8 5 2
Py (y) 35 35 35 35 35

p(4, y ) p(4, 2) 0 p(4,3) 1 35 1


P Y / X  4   ,   0,   ,
px (4) px (4) 6 35 px (4) 6 35 6
b.
p(4,3.5) 1 35 1 p(4, 4) 3 35 3 p(4,5) 1 35 1
  ,   ,  
px (4) 6 35 6 px (4) 6 35 6 px (4) 6 35 6

y 2 3 3.5 4 5
1 1 3 1
p( y / x  4) 0
6 6 6 6

1 1 1
c. P(Y  3/ X  4)  0   P(Y  3/ X  4) 
6 6 6

5. Sea la función de probabilidad conjunta de las variables aleatorias X y Y, dada en la siguiente


tabla:

x
y 2 5 8
0.4 0.15 0.12 0.03
0.8 0.05 0.30 0.35

a. Calcule P(Y = 0.8 / X = 5)


b. Calcule E (Y / X = 8)
c. Calcule la covarianza y el coeficiente de correlación.

Solución:
a.
x 2 5 8 y 0.4 0.8
px ( x) 0.20 0.42 0.38 py ( y) 0.30 0.70

p(5, y) p(5,0.4) 0.12 p(5,0.8) 0.30


P(Y / X  5)  ,   0.2857,   0.7143
px (5) 0.42 0.42 0.42 0.42

P(Y = 0.8 / X = 5) = 0.7143 y 0.4 0.8


p( y / x  5) 0.2857 0.7143
225

p(8, y) p(8,0.4) 0.03 p(8,0.8) 0.35


b. P(Y / X  8)  ,   0.0789,   0.9211
px (8) 0.38 0.38 0.38 0.38

y 0.4 0.8
p( y / x  8) 0.0789 0.9211

 E(Y / X  8)  (0.4)(0.0789)  (0.8)(0.9211)  0.7684 E(Y / X  8)  0.7684

Cov( X , Y )
c.  XY  , Cov( X , Y )  E ( XY )  E ( X ) E (Y )
 XY
V ( X )  E( X 2 )   E( X ) , V (Y )  E(Y 2 )   E(Y ) ,  X  V ( X ),  Y  V (Y )
2 2

E ( XY )  2(0.4)(0.15)  2(0.8)(0.05)  5(0.4)(0.12)  5(0.8)(0.30)  8(0.4)(0.03)


 8(0.8)(0.35)  3.976
E( X )  2(0.20)  5(0.42)  8(0.38)  5.54, E(Y )  0.4(0.30)  0.8(0.70)  0.68

Cov.(X, Y) = (3.976) – (5.54)(0.68) = 0.2088 Cov.(X, Y) = 0.2088

E ( X 2 )  4(0.20)  25(0.42)  64(0.38)  35.62, E ( X )  5.54,


V ( X )  35.62  (5.54)  4.9284 2

E (Y 2 )  (0.4) 2 (0.30)  (0.8) 2 (0.70)  0.496, E (Y )  0.68


V (Y )  0.496  (0.68)  0.0336,  X  4.9284  2.22,  Y  0.1833
2

0.2088
  0.5131   0.5131
(2.22)(0.1833)

6. Sean X y Y la duración de la vida en años de dos componentes en un sistema electrónico. Si la


función de densidad conjunta de estas variables es:

e  ( x  y ) x  0, y0
f ( x, y )  
 0 de otro modo

a. Demuestre que f(x, y) es una fdp conjunta legítima.


b. Encuentre P(X < 1, Y < 2)
c. Encuentre P(0 < X < 1 / Y = 2)

Solución:
 
a. Para que una fdp sea legítima, (i) f(x, y) > 0 y (ii)    
f ( x, y)dxdy  1 , en este caso por la
forma en que esta definida la función f(x, y) > 0 , cumpliéndose la primera condición.
e ( x  y ) dxdy   e y  e x  dy   e y ((0  1))dy   e y dy
     
 
0 0 0 0 0 0
 
y 
 e
0
 (0  1)  1   
0 0
e ( x  y ) dxdy 1
226

Se cumple la segunda condición por tanto f(x, y) es una distribución de probabilidad legítima
e ( x  y ) dxdy   e  y  e  x  dy   e  y ((e 1  1))dy
2 1 2 1 2
P( X  1, Y  2)   
0 0 0 0 0
b.
 (1  e1 )  e y   (1  e1 )(1  e2 )  0.5466
2
P( X  1, Y  2)  0.5466
0

f ( x, y )  
f ( x / y)  , f y ( y )   e  ( x  y ) dx  e  y (e  x )  e  y (0  1)  e  y
f y ( y) 0 0

c.
f ( x, 2) e ( x  2)
f ( x / y  2)   2  e  x , las variables son independientes, por tanto
f y (2) e

1
P(0  X  1/ Y  2)   e x dx   e x
1
 (e1  1)  0.6321 P(0  X  1/ Y  2)  0.6321
0 0

7. Sea X el tiempo de reacción, en segundos, a cierto estimulante y Y la temperatura ( ºF ) a la que


cierta reacción comienza a suceder. Suponga que las dos variables aleatorias X y Y tienen la
siguiente fdp conjunta:

4 xy , 0  x  1. 0  y  1
f ( x, y)  
0 en cualquier otro caso

a. Encuentre P(0  X  12 y 14  Y  12 )
b. P(X < Y)
c. Determine si las va X y Y son independientes.
Solución:
0.5 0.5 0.5 0.5
P(0  X  12 , 14  Y  12 )    4 xydxdy   dy  12 
0.5
2 y x2 ydy
0.25 0 0.25 0 0.25
0.5
a.  14 y 2  14 ( 14  161 )  643  0.04687
0.25

P(0  X  12 , 14  Y  12 )  0.04687
1 y 1 1 1
b. P( X  Y )    4 xydxdy   2 y x 2 dy  2 y 3dy  12 y 4
y 1

0 0 0 0 0 0 2

1
P( X  Y ) 
2

1
f x ( x)   4 xydy  2 x y 2
1
 2 x,
0 0
1
f y ( y )   4 xydx  2 y x 2
1
c.  2y
0 0

Puesto que f x ( x) f y ( y )  2 xy  f ( x, y )
 Son independientes

8. Sea X el diámetro de un cable eléctrico blindado y Y el diámetro del molde cerámico que tiene el
cable. X y Y tienen una escala tal que están entre 0 y 1. Suponga que X y Y tienen una fdp conjunta:
227

1
 , 0  x  y 1
f ( x, y )   y
0
 de cualquier otra forma

a. Encuentre P(X + Y > ½ ).


b. Calcule la covarianza y el coeficiente de correlación.

Solución:
a.

1
1 y 1 y 1
P( X  Y  12 )   1 dxdy   1 
2

1y
dxdy
4 y 2 2
0 y

2 1
1 11
  1 x 1  y dy   1 x 0
y y

4 y 2 2 y

1
1 1  11
 1  y   y  dy   12 ( y )dy
2

4 y 2  y
2 1 
1 1
 1 2   dy   1 dy
4
 2y  2

1 1 1 1 1 2  1 1
 2 y 12  ln y 12  y 1  2( 12  14 )  ln   (1  12 )   0.3466   0.6534
1

4 2 4 2 2 1 4  2 2
P( X  Y  12 )  0.6534
Cov( X , Y )
b.  XY  , Cov( X , Y )  E ( XY )  E ( X ) E (Y )
 XY

V ( X )  E( X 2 )   E( X ) , V (Y )  E(Y 2 )   E(Y ) ,  X  V ( X ),  Y  V (Y )
2 2

1 y 1 11 1 1 1 1
E ( XY )    xy   dxdy   x 2 dy   y 2 dy  y 3
y 1

0 0
 y 0 2 0 2 0 6 0 6
1 y 1 1 1 1 1 1 1
E( X )    x   dxdy   x 2 dy   ydy  y 2
y 1

0 0
 y 0 2y 0 2 0 4 0 4
1 1 y 1 1 1 1
E (Y )   
y   dxdy   x 0 dy   ydy  y 2
1

y
0
 y 0 0 0 2 0 2
1  1  1  1 1
Cov.( X , Y )       Cov.( X , Y ) 
6  4  2  24 24
228

1 y 1 1 1 1 1 1 1
E( X 2 )    x 2   dxdy   x 3 dy   y 2 dy  y 3
y 1

0 0
 
y 0 3y 0 3 0 9 0 9
1 y 1 1 1 1 1
E (Y 2 )    y 2   dxdy   y x 0 dy   y 2 dy  y 3
1

y
0 0
 y 0 0 3 0 3
2 2
1 1 7 1 1 1
V (X )    , V (Y )      ,  X  0.22048,  Y  0.28867
9  4  144 3  2  12
1 24
  0.6546   0.6546
(0.22048)(0.28867)

9. La cantidad de queroseno, en miles de litros, en un tanque al principio de cualquier día es una


cantidad aleatoria Y, de la que una cantidad aleatoria X se vende durante el día. Suponga que el
tanque no se reabastece durante el día por lo que x ≤ y, y suponga que la fdp conjunta de estas
variables es

2, 0  x  y, 0  y  1
f ( x, y )  
0 de otra manera

a. Determine si X y Y son independientes.


b. Encuentre P(¼< X < ½ / Y = ¾ ).
Solución:
1 y
f x ( x)   2dy  2 y x  2(1  x), f y ( y)   2dx  2 x 0  2 y
1 y

a. x 0

f x ( x) f y ( y )  4 y (1  x)  f ( x, y )  No son independientes

f ( x, y ) f ( x, 34 ) 2 4
f ( x / y)  , f ( x / y  34 )  3
 3 
f y ( y) f y ( 4 ) 2( 4 ) 3
b.
4 0 x 3
f ( x / y  34 )   3 4

0 de otra manera
1
4 4 1 41 1 1 1
P( 14  X  12 / Y  43 )   1 dx  x 12      P( 14  X  12 / Y  34 ) 
2

4 3 3 4 3 2 4 3 3

10. La función de densidad conjunta de las variables aleatorias X y Y es:

6 x, 0  x  1, 0  y  1  x
f ( x, y)  
0 en cualquier otro caso

a. Muestre que X y Y no son independientes.


b. Encuentre P(X > 0.3 / Y = 0.5)
229

Solución:
a.
1 x 1 x
f x ( x)   6 xdy  6 x y 0
 6 x(1  x)
0
1 y 1 y
f y ( y)   6 xdx  3 x 2  3(1  y ) 2
0 0

f x ( x) f y ( y )  18(1  x)(1  y ) 2  f ( x, y )
 No son independientes

b.
f ( x, y ) f ( x,0.5) 6x
f ( x / y)  , f ( x / y  0.5)    8x
f y ( y) f y (0.5) 3 1  12 2
8 x 0  x  0.5
f ( x / y  0.5)  
0 de otra manera
0.5
P( x  0.3/ y  0.5)   8 xdx  4 x 2
0.5
 4(0.25  0.09)  0.64 P( x  0.3/ y  0.5)  0.64
0.3 0.3

11. Considere la siguiente fdp conjunta de las variables aleatorias X y Y:

 3x  y
 , 1  x  3, 1  y  2
f ( x, y )   9

 0 en cualquier otro caso

a. Encuentre las distribuciones marginales de X y Y.


b. ¿Son independientes X y Y?
c. Encuentre P(X > 2).
Solución:
2
3x  y 1 1  1  1  1  3
dy   3xy  y 2    6 x  2    3x      3x  
2
f x ( x)  
1 9 9 2 1 9  2  9  2
3
3x  y 1  3x 2  1  27 3  1
 xy     3 y    y    12  2 y 
3
a. f y ( y)   dx  
1 9 9 2 1 9 2 2  9
1  3 2
  3x   0 x3  6  y  0 y2
f x ( x)   9  2 f y ( y)   9
  0 en otro caso
 0 en otro caso

1 32
b. f x ( x) f y ( y)   3x    6  y   f ( x. y),  No son independientes
9 29
3
1 3 3 1  3x 2 3x  1  16 6  5 5
c. P( X  2)    3x   dx         P( X  2)   0.555
9 2 2 9 2 2  2 9 2 2 9 9
230

12. Se miden la tensión superficial y la acidez de un producto químico. Estas variables se codifican
de modo tal que la tensión superficial se mide en una escala 0 ≤ X1 ≤ 2, y la acidez se mide en una
escala 2 ≤ X2 ≤ 4. La función de densidad de probabilidad de X1 y X2 está dada por

k (6  x1  x2 ) 0  x1  2, 2  x2  4
f ( x1 , x2 )  
 0 en otro caso

a. Encuentre el valor de k.
b. Calcule P(X1 < 1, X2 < 3)
c. Calcule P(X1 + X2 ≤ 4)
d. Encuentre P(X1 < 1.5)
e. Encuentre las densidades marginales de X1 y X2.
Solución:
a.
2
4 2  x2
4  4
k   (6  x1  x2 )dx1dx2  k   6 x1  1  x2 x1  dx2  k  (10  2 x2 )dx2
2 0 2
 2 0 2

 k 10 x2  x22   k  40  16   (20  4)   8k  1


4 1
k 
2 8
b.
1
3 1 1 3 x2 
P( X 1  1, X 2  3)  k   (6  x1  x2 )dx1dx2    6 x1  1  x2 x1  dx2
2 0 8 2 2 0
3
1 3  11  1  11 1  1 3
    x2  dx2   x2  x22   12  9  
8 2 2  8 2 2 2 8 8
3
P( X 1  1, X 2  3) 
8
c.
1 2 4  x1
8 0 2
P( X 1  X 2  4)  (6  x1  x2 )dx2 dx1
4  x1
1 2 x2 
   6 x2  x1 x2  2  dx1
8 0 2 2

1 2  4  x1  
2

   6  4  x1   x1 (4  x1 )   (10  2 x1 ) dx1
8 0  2 
2
1 2 x2  1 x3  2
   6  4 x1  1  dx1   6 x1  2 x12  1  
8 
0 2 8 6 0 3
2
P( X 1  X 2  4) 
3
d. y e. Se obtendrán primero las distribuciones marginales.
231

4
 x2  1 1
f x1 ( x1 )   (6  x1  x2 )dx2   6 x2  x1 x2  2   16  4 x1   10  2 x1   (3  x1 )
4

2
 2 2 8 4
2
 x2  1 1
f x 2 ( x2 )   (6  x1  x2 )dx1   6 x1  x1 x2  1   10  2 x2    (5  x2 )
2

0
 2 0 8 4

1 1
 (3  x1 ) 0  x1  2  (5  x2 ) 2  x1  4
f x1 ( x1 )   4 f x2 ( x2 )   4
 0 de otra manera  0 de otra manera

1.5
1 1.5 1 x2  1
P( X 1  1.5)   (3  x1 )dx1   3x1  1   (4.5  1.125)  0.84375
4 0 4 2 0 4
P( X 1  1.5)  0.84375

13. Un instructor ha aplicado un breve cuestionario que consta de dos partes. Para un estudiante
seleccionado al azar, sea X = número de aciertos en la primera parte, Y = número de aciertos en
la segunda parte y suponga que la fpm conjunta de X y Y está dada en la tabla siguiente

y
p(x,y) 0 5 10 15
0 0.02 0.06 0.02 0.10
x 5 0.04 0.15 0.20 0.10
10 0.01 0.15 0.14 0.01

a. Si la calificación registrada en el libro de calificaciones es el número total de aciertos


obtenidos en las dos partes, ¿cuál es la calificación registrada esperada E(X + Y)?
b. Calcule la covarianza para X y Y
c. Calcule el coeficiente de correlación .
Solución:

a. E(X + Y) = 0(0.02) + 5(0.06) + 10(0.02) + 15(0.10) + 5(0.04) + 10(0.15) + 15(0.20) +


20(0.10) + 10(0.01) + 15(0.15) + 20(0.14) + 25(0.01) = 14.1 E(X + Y) = 14.1
b. E(XY) = 25(0.15) + 50(0.20) + 75(0.10) + 50(0.15) + 100(0.14) + 150(0.01) = 44.25

x 0 5 10 y 0 5 10 15
px ( x) 0.20 0.49 0.31 py ( y) 0.07 0.36 0.36 0.21
E(X) = 5.55, E(Y) = 8.55, E(X 2) = 43.25, E(Y 2) = 92.25
Cov.(X, Y) = E(XY) – E(X)E(Y)
Cov.(X, Y) = 44.25 – (5.55)(8.55) = -3.2025 Cov.(X, Y) =  3.2025

c. V(X) = 43.25 – (5.55)2 = 12.4475 V(Y) = 92.25 – (8.55)2 = 19.1475


Cov.( X , Y ) 3.2025
 X  3.5281,  Y  4.375,   ,   0.20744
 XY (3.5281)(4.375)
 =  0.20744
232

LAS ESTADISTICAS Y SUS DISTRIBUCIONES

1. Hay dos semáforos en mi camino hacia el trabajo. Suponga que X1 es el número de semáforos en
los debo detenerme y que la distribución de X1 es como sigue:

x1 0 1 2

p(x1) 0.2 0.5 0.3

 = 1.1 2 = 0.49

Sea X2 el número de semáforos en los que debo detenerme al regresar a casa; X2 tiene la misma
distribución que X1, de modo que X1, X2 es una muestra aleatoria de tamaño n = 2.
a. Sea To = X1 + X2 y determine la distribución de probabilidad de To.
b. Calcule To. ¿Cómo se relaciona con , la media poblacional?
c. Calcule 2To. ¿Cómo se relaciona con 2, la varianza poblacional?
Solución:
a.
2. Una compañía mantiene tres oficinas en cierta región, cada una manejada por dos empleados. La
información de salarios anuales (miles de dólares) es la siguiente:

Oficina 1 1 2 2 3 3
Empleado 1 2 3 4 5 6
Salario 19.7 23.6 20.2 23.6 15.8 19.7

a. Suponga que dos empleados se seleccionan al azar de entre los seis (sin reemplazo). Determine
la distribución muestral del salario medio muestral X .
b. Suponga que una de las tres oficinas se selecciona al azar y denote por X1 y X2 los salarios de
los dos empleados. Determine la distribución muestral de X .
c. ¿Cómo se compara E( X ) de los incisos (a) y (b) con el salario medio poblacional ?
233

PROBLEMARIO DE PROBABILIDAD Y ESTADISTICA


SEGUNDO EXAMEN PARCIAL
PROFRA. ROSA MARIA AGUILAR RIVERA

Variables Aleatorias

Discretas

d. Tres automotores se seleccionan al azar y cada uno se clasifica como equipado con motor diesel
(S) o no diesel (F) (por lo cual los resultados son SSS, SSF, etc.). Si X = número de automóviles
entre los tres motores diesel, enumere cada resultado de S y su valor X asociado.

Solución:

X(SSS) = 3 X(SSF) = 2 X(SFS) = 2 X(FSS) = 2 X(SFF) = 1 X(FSF) = 1 X(FFS) = 1


X(FFF) = 0

e. Dé tres ejemplos de variable aleatoria de Bernoulli (que no sean los mencionados en clase).
Solución;

 X = 1 si se selecciona al azar un libro de Probabilidad y Estadística y X = 0 si se elige cualquier


otro.
 X = 1 si se selecciona al azar una profesora (mujer) y X = 0 si se selecciona un profesor
(hombre).
 X = 1 si se selecciona un problema de un tema tratado en clase y X = 0 si el problema es de
un tema no tratado en clase.

f. Para cada variable aleatoria definida a continuación describa el conjunto de valores posibles de la
variable e indique si es discreta o continua.
a. X = número de huevos que no están quebrados, en una caja de cartón estándar seleccionada al
azar.
b. Y = número de estudiantes ausentes el primer día de clases, de la lista de su grupo.
c. U = número de veces que un novato intenta golpear una pelota de golf, antes de lograrlo.
d. X = longitud de una serpiente de cascabel seleccionada al azar.
e. Z = pH de una muestra de suelo seleccionada al azar.
f. X = tensión a la que una raqueta de tenis seleccionada al azar ha sido encordada.
g. X = número total de veces que haya necesidad de lanzar una moneda al aire para que tres
personas obtengan una partida (AAA o SSS).
Solución:

a. x = 0, 1, 2, 3, …, 12 para una caja de 12 Discreta


b. y = 0, 1, 2, 3, …, n para n estudiantes en lista Discreta
c. u = 0, 1, 2, 3, …. Discreta
d. x = (a, b) donde a es la long. mínima y b la máxima que puede tener Continua
e. z = (0, 14) ya que son los valores posibles para el PH Continua
f. x = (m, M) donde m es la mínima tensión posible y M la máxima Continua
g. x = 3, 6, 9, 12, 15, … Discreta

g. A veces las aerolíneas registran más pasajeros del cupo normal de los vuelos. Supóngase que para
un avión con 50 asientos, 55 pasajeros tienen boleto. Defina la variable aleatoria Y como el
234

número de pasajeros con boleto que en realidad se presentan para el vuelo. En la tabla siguiente
se ilustra la función masa de probabilidad de Y.

y 45 46 47 48 49 50 51 52 53 54 55
p(y) 0.050 0.10 0.12 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01

a. ¿Cuál es la probabilidad de que se pueda acomodar a todos los pasajeros con boleto que se
presentan para realizar el vuelo?
b. ¿Cuál es la probabilidad de que no todos los pasajeros con boleto que se presentan para realizar
el vuelo puedan ser acomodados?
c. Si el lector es la primera persona en lista de espera (lo que significa que será el primero en
abordar el avión si hay asientos disponibles después que han sido acomodados todos los
pasajeros con boleto), ¿cuál es la probabilidad de que pueda realizar el vuelo? ¿Cuál es la
probabilidad si es la tercera persona en lista de espera?

Solución:

a. P(Y  50) = 0.050 + 0.10 + 0.12 + 0.14 + 0.25 + 0.17 = 0.83 P(Y  50) = 0.83
b. P(Y > 50) = 1 - P(Y  50) = 1 – 0.83 = 0.17 P(Y > 50) = 0.17
c. P(Y  49) = 0.050 + 0.10 + 0.12 + 0.14 + 0.25 = 0.66 P(Y  49) = 0.66
P(Y  47) = 0.050 + 0.10 + 0.12 = 0.27 P(Y  47) = 0.27

h. Un contratista es requerido por un departamento de planeación de un municipio para que remita


una, dos, tres, cuatro o cinco formas (dependiendo de la naturaleza del proyecto) para solicitar
permiso de construcción. Sea Y = número de formas requeridas del siguiente solicitante. La
probabilidad de que y formas se requieren es proporcional a y, esto es p (y) = ky para y = 1, 2, 3,
4, 5.
e. ¿Cuál es el valor de k?
f. ¿Cuál es la probabilidad de que por lo menos se necesiten 3 formas?
g. ¿Cuál es la probabilidad de que se necesiten entre dos y cuatro formas?
h. ¿Podría ser p (y) = y2/ 50 para y = 1, 2, 3, 4, 5 la fpm de Y?

Solución:

 p( y)  k (1)  k (2)  k (3)  k (4)  k (5)  15k  1


y 1
c.
1
 k
15
d.
y 1 2 3 4 5
1 2 3 4 5
p(y) 15 15 15 15 15

P(Y  3)  153  154  155  12


15  0.8

e. P(2  Y  4)  152  153  154  159  0.6


235

y2
p( y ) 
50
f. 5 5


y 1
p( y )  y
y 1
2
/ 50  1
50  504  509  16
50  50 
25 55
50 1

Por tanto no puede ser una fpm

i. Muchos fabricantes tienen programas de control de calidad que incluyen la inspección de


materiales recibidos para verificar que no tengan defectos. Supongamos que un fabricante de
computadoras recibe tarjetas de computadoras en lotes de cinco y se seleccionan dos tarjetas de
cada lote para inspeccionarlas. Podemos representar los posibles resultados del proceso de
selección por pares. Por ejemplo, el par (1,2) representa la selección de la tarjeta 1 y 2 para
inspeccionarlas.

d. Haga una lista de diez posibles resultados diferentes.


e. Supongamos que las tarjetas 1 y 2 son las únicas defectuosas de un lote de cinco y se van a
escoger dos lotes al azar. Defina X como el número de tarjetas defectuosas observado entre las
inspeccionadas. Encuentre la distribución de probabilidad de X.
f. Señale con F(x) la dpa de X. Primero defina F(0) = P(X ≤ 0), F(1) y F(2) y después obtenga
F(x) para cualquier x.

Solución:

c. (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5)
d.
p(0)  P(3,4), (3,5), (4,5)  103  0.3
p(1)  P(1,3), (1,4), (1,5), (2,3), (2,4), (2,5)  106  0.6
p(2)  P(1,2)  101  0.1

 La distribución de probabilidad de masa es:

x 0 1 2
p(x) 0.3 0.6 0.1

d. F (0) = P (X  0) = 0.3
F (1) = P (X  1) = 0.9
F (2) = P (X  2) = 1.0, entonces la función de distribución acumulada es:

0 x0
0.3 0  x 1

F ( x)  
0.9 1 x  2
1.0 x2
236

j. Algunas regiones de California son particularmente propensas a temblores. Supongamos que en


una parte de la región 30% de todos los propietarios de casa están asegurados contra daños por
temblores. Cuatro propietarios son seleccionados al azar; sea X el número de propietarios, entre
los cuatro, con seguro contra temblores.

e. Encuentre la distribución de probabilidad de X. (Sugerencia: denotemos por S a un propietario


de casa asegurado y con F a uno sin seguro. Entonces un posible resultado es SFSS, con
probabilidad (0.3)(0.7)(0.3)(0.3) y valor 3 asociado a X. Hay otros 15 resultados.).
f. Dibuje el histograma de probabilidad correspondiente.
g. ¿Cuál es el valor más probable para X?
h. ¿Cuál es la probabilidad de que al menos dos de los cuatro seleccionados tenga un seguro contra
temblores?
Solución:

e.
Resultados X P(X) Resultados x P(X)
SSSS 4 (.3)4 = 0.0081 SSFF 2 (.7)2(.3)2 = 0.0441
FSSS 3 (.7)(.3)3 = 0.0189 SFFS 2 (.7)2(.3)2 = 0.0441
SFSS 3 (.7)(.3)3 = 0.0189 FFFS 1 (.7)3(.3) = 0.1029
SSFS 3 (.7)(.3)3 = 0.0189 FFSF 1 (.7)3(.3) = 0.1029
SSSF 3 (.7)(.3)3 = 0.0189 FSFF 1 (.7)3(.3) = 0.1029
FFSS 2 (.7)2(.3)2 = 0.0441 SFFF 1 (.7)3(.3) = 0.1029
FSSF 2 (.7)2(.3)2 = 0.0441 FSFS 2 (.7)2(.3)2 = 0.0441
SFSF 2 (.7)2(.3)2 = 0.0441 FFFF 0 (.7)4 = 0.2401

Por tanto la distribución de probabilidad es:

x 0 1 2 3 4
p(x) 0.2401 0.4116 0.2646 0.0756 0.0081

f.
g. El valor mas probable de X es x = 1
h. P (X  2) = 0.2646 + 0.0756 + 0.0081 = 0.3483

k. El voltaje de una batería nueva puede se aceptable (A) o no aceptable (I). Cierta linterna
de mano necesita dos baterías, las cuales necesitarán seleccionarse y probarse
independientemente hasta encontrar dos aceptables. Supongamos que el 90 % de todas
las baterías tienen voltaje aceptable. Señale con Y el número de baterías que tienen que
ser probadas.
e. ¿Cuál es p (2), es decir, P (Y = 2)?
237

f. ¿Cuál es p(3)? (Sugerencia: Hay dos resultados diferentes que confluyen en Y = 3)


g. Para tener Y = 5, ¿qué debe ser cierto en la quinta batería seleccionada? Haga una lista
de cuatro resultados para los que Y = 5 y luego determine p (5).
h. Utilice el modelo de sus respuestas en los incisos a y c para obtener una fórmula general
de p (y).

Solución
d. Sea P (A) = 0.9, entonces P (AA) = p (2) = (0.9)(0.9) = 0.81

e. p (3) = P (AIA) + P (IAA) = (0.9)(0.1)(0.9) + (0.1)(0.9)(0.9) = 0.162

f. Para tener Y = 5, la quinta batería debe ser aceptable


{(AIIIA), (IAIIA), (IIAIA), (IIIAA)}
p (5) = 4 (0.9)2 (0.1)3 = 0.00324

e. p (2) = (0.9)2
p (3) = 2 (0.9)2 (0.1)
p (4) = 3 (0.9)2 (0.1)2
p (5) = 4 (0.9)2 (0.1)3
Generalizando estos resultados, tenemos:
p (y) = (y – 1) (0.9)2(0.1) y – 2

l. Un negocio de computadoras que atiende pedidos por correo tiene seis líneas telefónicas.
Simbolicemos con X el número de líneas en uso en un momento específico. Supongamos que la
fpm de X está dada en la tabla siguiente.

x 0 1 2 3 4 5 6
p(x) .10 .15 .20 .25 .20 .06 .04

Calcule y grafique la fda F(x), después utilícela para calcular la probabilidad de cada uno de los
siguientes eventos.
e. {A lo sumo tres líneas estén en uso}
f. {Menos de tres líneas estén en uso}
g. {Por lo menos tres líneas estén en uso}
h. {Entre 2 y 5 líneas estén en uso}

Solución

0 x0
0.10 0  x 1

0.25 1 x  2

0.45 2 x3
F ( x)  
0.70 3 x 4
0.90 4 x5

0.96 5 x6
1 x6

238

e. P (X  3) = F (3) = 0.70
f. P (X < 3) = F (2) = 0.45
g. P (X  3) = 1 – P(X < 3) = 1 – 0.45 = 0.55
h. P (2  X  5) = F (5) – F(1) = 0.96 – 0.25 = 0.71

m. Una compañía de seguros ofrece a sus tenedores de pólizas varias opciones diferentes para el pago
de primas. Para un tenedor seleccionado al azar, sea X = número de meses entre pagos sucesivos.
La fpa de X es como sigue:

0 x 1
.30 1 x  3

.40 3 x 4
F ( x)  
.45 4 x6
.60 6  x  12

1 12  x

c. ¿Cuál es la fpm de X?
d. Sólo con el uso de fpa, calcule P (3 ≤ X ≤ 6) y P (4 ≤ X).
Solución
c.
x 1 3 4 6 12
p (x) 0.30 0.10 0.05 0.15 0.40

d. P (3 ≤ X ≤ 6) = F (6) – F(1) = 0.60 – 0.30 = 0.30 y


P (4 ≤ X) = 1 – P (X < 4) = 1 – F (3) = 1 – 0.40 = 0.60

VALORES ESPERADOS DE VARIABLES ALEATORIAS DISCRETAS

1. Un distribuidor de aparatos electrodomésticos vende tres modelos diferentes de congeladores


verticales con capacidad de 13.5, 15.9 y 19.1 pies cúbicos de espacio de almacenaje. Sea X =
cantidad de espacio de almacenaje de un congelador comprado por el siguiente cliente.
Supongamos que X tiene la siguiente función de probabilidad de masa:

x 13.5 15.9 19.1


p(x) 0.2 0.5 0.3

a. Calcule E(X), E(X 2) y V(X).


b. Si el precio de un congelador de capacidad X pies cúbicos es de 25 X – 8.5, ¿cuál es el precio
esperado por el cliente que va a comprar un congelador?
c. ¿Cuál es la varianza del precio 25 X – 8.5 pagado por el cliente?
d. Suponga que mientras la capacidad nominal de un congelador es X, la capacidad real es h (X)
= X – 0.01X 2. ¿Cuál es la capacidad real esperada del congelador comprado por el cliente?
239

Solución:

a. E(X) = (13.5)(0.2) + (15.9)(0.5) + (19.1)(0.3) = 16.38 E(X) = 16.38


E(X 2) = (13.5)2(0.2) + (15.9)2(0.5) + (19.1)2(0.3) = 272.3 E(X2) = 272.3
V(X) = E(X2) – [E(X)]2 = 272.3 – (16.38)2 = 3.99 V(X) = 3.99

b. Sea Y = 25X – 8.5

y 329 389 469


p(y) 0.2 0.5 0.3

E(Y) = (329)(0.2) + (389)(0.5) + (469)(0.3) = 401 E(Y) = 401

c, V(Y) = E(Y 2) – [E(Y)]2


E(Y 2) = (329)2(0.2) + (389)2(0.5) + (469)2(0.3) = 163 297
V(Y) = 163 297 – (401)2 = 2496 V(Y) = 2496

d. h(X) = X – 0.01X 2

h(X) 11.6775 13.3719 15.4519

p[h(x)] 0.2 0.5 0.3

E [h(X)] = (11.6775)(0.2) + (13.3719)(0.5) + (15.4519)(0.3) = 13. 657 E [h(X)] = 13.657

a. Con los datos del problema 4 de la sección anterior, calcule:


a. V(Y) y Y.
b. Determine la probabilidad de que Y se encuentre dentro de una desviación estándar de su valor
medio.

Solución:
a.

y 45 46 47 48 49 50 51 52 53 54 55
p(y) 0.050 0.10 0.12 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01

V(Y) = E(Y 2) – [E(Y)]2


E(Y) = 45(0.050) + 46(0.10) + 47(0.12) + 48(0.14) + 49(0.25) + 50(0.17) + 51(0.06) +
52(0.05) + 53(0.03) + 54(0.02) + 55(0.01) = 48.84
E(Y 2) = 452(0.050) + 462(0.10) + 472(0.12) + 482(0.14) + 492(0.25) + 502(0.17) + 512(0.06) +
522(0.05) + 532(0.03) + 542(0.02) + 552(0.01) = 2389.84
V(Y) = 2389.84 – (48.84)2 = 4.4944 V(Y) = 4-4944
 Y  V (Y ),  Y  4.4944  2.12 Y = 2.12

b. P  E (Y )  1DE   Y   E (Y )  1DE )   P(48.84  2.12  Y  48.84  2.12)


240

P(46.72  Y  50.96)  0.12  0.14  0.25  0.17  0.68 P(46.72  Y  50.96) = 0.68

3. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la siguiente tabla:

x -2 0 x3 12
1 1 1
p(x) 2 4 p3 16

5
Si se sabe que E(X) = 4
, calcule x3 y p3.
Solución:

1 1 1 13 3 3
Se tiene que  p( x )  1,
xi
i entonces   p3   1,
2 4 16
p3  1  
16 16
p3 
16
1 1 3 1 5
Se tiene que E ( X )   xi p( xi ), entonces E ( X )  (2)    0    x3    12   
 2 4  16   16  4
3 3 3 1 5 3 1 3/ 2
E ( X )  1  x3   x3   x3  x3  8 x3=8
16 4 16 4 4 16 4 3/16

4. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la siguiente tabla:
x 1 x2 5 10 20

p(x) 0.5 0.25 0.1 0.1 p5

a. Calcule x2 y p5 si se sabe que E(X 2) = 37


b. Calcule la media la varianza y la desviación estándar para la variable X.

Solución:
a. Se tiene que  p( x )  1,
xi
i entonces 0.5  0.25  0.1  0.1  p5  1, 0.95  p5  1

p5 = 0.05
E ( X )  1 (0.5)  x (0.25)  5 (0.1)  10 (0.1)  20 (0.05)  37
2 2 2
2
2 2 2

33  0.25 x22  37 0.25 x22  4 x22  16 x2  4


b. Se tiene que:
E ( X )   xi p( xi ), entonces E( X )  1(0.5)  4(0.25)  5(0.1)  10(0.1)  20(0.05)  4
E(X) = 4
V(X) = E(X2) – [E(X)]2 = 37 – (4)2 = 21 V(X) = 21
 X  V ( X ),  X  21  4.5826 X = 4.5826
5. Sea X una va de Bernoulli con fpm

1  p x0

f ( x)   p x 1
0 x  0,1

a. Calcule E(X 2).


241

b. Demuestre que V(X) = p (1- p).


c. Calcule E(X 19).

Solución:

a. E( X 2 )  02 (1  p)  12 ( p)  p E(X2) = p
b. Usando la definición:
V ( X )   ( x   ) 2 p( x)
V ( X )  (0  p) 2 (1  p)  (1  p) 2 p
 p 2 (1  p)  (1  2 p  p 2 ) p
 p 2  p3  p  2 p 2  p3  p  p 2
V ( X )  p(1  p)

c. E( X 19 )  019 (1  p)  119 p  p E ( X 19 )  p

6. Un contratista ofrece realizar un proyecto, y los días X requeridos para la terminación siguen la
distribución de probabilidad dada como:

x 10 11 12 13 14
p(x) 0.1 0.3 0.4 0.1 0.1

La utilidad del contratista es Y = 2000(12 – X).


a. Encuentre la distribución de probabilidad de Y.
b. Determine E(X), V(X), E(Y), V(Y).

Solución:

a. Y = 2000(12 – X)

y 4000 2000 0 - 2000 - 4000


p(y) 0.1 0.3 0.4 0.1 0.1

b. E ( X )   xi p( xi ), entonces E( X )  10(0.1)  11(0.3)  12(0.4)  13(0.1)  14(0.1)  11.8


V(X) = E(X2) – [E(X)]2
E ( X 2 )   xi 2 p( xi ), E( X 2 )  102 (0.1)  112 (0.3)  122 (0.4)  132 (0.1)  142 (0.1)  140.4
V(X) = 140.4 – (11.8)2 = 1.16 E(X) = 11.8 V(X) = 1.16
E(Y )  4000(0.1)  2000(0.3)  0(0.4)  (2000)(0.1)  (4000)(0.1)  400
E(Y 2 )  40002 (0.1)  20002 (0.3)  02 (0.4)  (2000) 2 (0.1)  (4000)2 (0.1)  4800000
V(Y) = 4 800 000 – (400)2 = 4 640 000 E(Y) = 400 V(Y) = 4 640 000

Binomiales
242

9. Una compañía que produce cristal fino sabe por experiencia que 10% de sus copas tienen
imperfecciones y deben clasificarse como de “segunda”.

a. Entre seis copas seleccionadas al azar, ¿qué tan probable es que sólo una sea de “segunda”?
b. Entre seis copas seleccionadas al azar, ¿cuál es la probabilidad de que por lo menos dos sean
de “segunda”?
c. Si las copas se examinan una por una, ¿cuál es la probabilidad de que por lo menos sean
seleccionadas cinco para encontrar cuatro que no sean de segunda?

Solución:
Para n = 6, p = 0.1 X  Bin (x ; 6, 0.1)
n
p( x)    p x (1  p) n  x
 x
6
a. P( X  1)    (0.1)(0.9)5  0.3542 P(X = 1) = 0.3542
1
b. P(X  2) = 1 - P(X < 2)
 6   6 
= 1 -   (0.1)0 (0.9)6    (0.1)1 (0.9)5   1  0.8857  0.1142
 0  1 
P(X  2) = 0.1142

c. P (no sea de segunda) = 0.9


 4
P( X  0)    (0.1)0 (0.9)4  0.6561
 0
Sea el evento A = {Seleccionar 4 copas, una de las cuales tiene un defecto} y la quinta es
buena, entonces
 4  
P( A)    (0.1)(0.9)3   (0.9)  0.2624
 1  
P (deseada) = 0.6561 + 0.2624 = 0.9185

10. Se selecciona al azar un individuo que tenga un seguro automotriz de cierta empresa. Sea Y la
cantidad de multas que ha recibido durante los últimos 3 años, la fpm de Y es:

y 0 1 2 3
p( y) .60 .25 .10 .05

¿Cuál es la probabilidad de que entre 15 individuos seleccionados al azar:


d. cuando menos 10 no tengan multas?
e. mas de la mitad tenga al menos una multa?
f. la cantidad de quienes tengan al menos una multa sea entre 5 y 10 inclusive?

Solución:

d. P (X  10), para n = 15 y p = 0.6 es una distribución binomial


P (X  10) = 1 – P (X <10) = 1 – B (9; 15, 0.6) = 1 – 0.597 = 0.403 P (X  10) = 0.403
243

e. P (X  8), para n = 15 y p = 0.40


P (X  8) = 1 – P (X < 8) = 1 – B (7; 15, 0.4) = 1 – 0.787 = 0.213 P (X  8) = 0.213

f. P (5  X  10) = B (10; 15, 0.4) – B (4; 15, 0.4) = 0.991 – 0.217 = 0.774

11. Según el fabricante de un líquido limpiador de manchas, este tiene un grado de efectividad de 0.8,
es decir, elimina en promedio 8 de cada 10 manchas. Para comprobar que lo que afirma es cierto,
se usará el producto en 15 manchas elegidas al azar, bajo el entendido de que si desaparecen por
lo menos 11 de ellas y solo en ese caso se dará por válida la afirmación del fabricante.
a. Calcule la probabilidad de que la aseveración del fabricante sea rechazada cuando en realidad
es cierta.
b. Determine la probabilidad de que por error se acepte lo que sostiene el fabricante, cuando la
efectividad de su producto es en realidad de 0.6.

Solución:
a. Para que la aseveración sea rechazada la probabilidad buscada es P(X  10)
Con n = 15 y p = 0.8 P(X  10) = B (10; 15, 0.8) = 0.164 P (sea rechazada) = 0.164

b. La probabilidad de que sea aceptada erróneamente es que X  11 con p = 0.6


P (X  11) = 1 – P(X < 11) = 1 – B (10; 15, 0.6) = 1 – 0.783 = 0.217
P (sea aceptada erróneamente) = 0.217

12. Un lote muy grande de componentes ha llegado a un distribuidor. El lote se puede clasificar como
aceptable sólo si la proporción de componentes defectuosos es a lo sumo 0.10. El distribuidor
decide seleccionar al azar 10 componentes y aceptar el lote sólo si el número de componentes
defectuosos en la muestra es a lo sumo 2.
a. ¿Cuál es la probabilidad de que el lote sea aceptado cuando la proporción real de piezas
defectuosas es 0.01?, ¿0.05?, ¿0.10?, ¿0.20? y ¿0.25?
b. Sea p la proporción real de piezas defectuosas del lote. Una gráfica de P(lote aceptado) como
función de p con p en el eje horizontal y P(lote aceptado) en el vertical, se llama curva
característica de operación para el plan de muestreo de aceptación del lote. Utilice los
resultados del inciso (a) para construir esta curva en 0 ≤ p ≤ 1.
c. Repita los incisos (a) y (b) con “1” sustituyendo a “2” en el plan de muestreo de aceptación del
lote.
d. Repita los incisos (a) y (b) con “15” sustituyendo a “10” en el plan de muestreo de aceptación
del lote.
e. ¿Cuál de los tres planes de muestreo, de los incisos (a), (c) o (d) parece más satisfactorio y por
qué?

Solución:

a. P(lote sea aceptable) = P(X  2) = B(2;10, p) con P = 0.01, 0.05, 0.10, 0.20 y 0.25
B(2; 10, 0.01) = 1, B(2; 10, 0.05) = 0.988, B(2; 10, 0.10) = 0.930, B(2; 10, 0.20) = 0.618, B(2;
10, 0.25) = 0.526

p 0.01 0.05 0.10 0.20 0.25


P(aceptable) 1 0.988 0.930 0.618 0.526

b. Falta gráfica
244

c. Para n = 10, P(lote sea aceptado) = P(X  1) = B(1; 10, p)


B(1;10, 0.01) = 0.996, B(1; 10, 0.05) = 0.914, B(1; 10, 0.10) = 0.736,
B(1; 10, 0.20) = 0.376, B(1: 10, 0.25) = 0.244

p 0.01 0.05 0.10 0.20 0.25


P(aceptable) 0.996 0.914 0.736 0.376 0.244

c. Para n = 15, P(lote sea aceptado) = P(X  2) = B(2; 15, p)


B(1;15, 0.01) = 1, B(1; 15, 0.05) = 0.964, B(1; 15, 0.10) = 0.816, B(1; 15, 0.20) = 0.398,
B(1: 15, 0.25) = 0.236

p 0.01 0.05 0.10 0.20 0.25


P(aceptable) 1 0.964 0.816 0.398 0.236

d. Puesto que queremos un plan para el cual P(aceptar) sea baja para p > 0.1 y altas para
p  0.1, entonces, el plan del inciso d parece el más satisfactorio con las
consideraciones anteriores.

13. Un estudio realizado por periodistas del diario Crónica (octubre del 2000) mostró que en las
oficinas de los servidores públicos (burócratas) de las distintas dependencias gubernamentales de
México, aproximadamente 30% de las llamadas telefónicas que entran en horario de trabajo no
son contestadas porque las personas no se encuentran en su lugar. Determine la probabilidad de
que en las siguientes 20 llamadas que entran a una de tales oficinas en horario de trabajo:
a. mas de 7 no sean contestadas.
b. Entre 5 y 10 inclusive, no sean contestadas.
c. Por lo menos 10 no sean contestadas.

Solución:
a. Con n = 20 y p = 0.3 P(X > 7) = 1 – P(X  7) = 1 – B(7; 20, 0.3) = 0.228
P(X  7) = 0.228
b. P(5  X  10) = B(10; 20, 0.3) – B(4; 20, 0.3) = 0.983 – 0.238 = 0.745
P(5  X  10) = 0.745
c. P(X  10) = 1 – P(X < 10) = 1 – B(9; 20, 0.3) = 1 – 0.925 = 0.048
P(X  10 = 0.048

6. Un fabricante de productos electrónicos de consumo espera que 2% de las unidades fallen durante
el período de garantía. Se hace un seguimiento del cumplimiento de la garantía de una muestra
de 500 unidades independientes.
a. ¿Cuál es la probabilidad de que ninguna falle?
b. ¿Cuál es el número esperado de fallas durante el período de garantía?
c. ¿Cuál es la probabilidad de que más de dos unidades fallen durante el período de garantía?

Solución:
a. Con n = 500 y p = 0.02
 500  5
P( X  0)  b(0;500,0.02)    (0.02) (0.98)  4.1024  10
0 500
P(X =0) = 0.0000412
 0 
b. E(X) = np para una distribución binomial, entonces: E(X) = 500(0.02) E(X) = 10
245

P( X  2)  1  P( X  2)
c.  500   500   500  498 
 1    (0.02) (0.98)  
0 500
 (0.02) (0.98)  
1 499
 (0.02) (0.98)   1  0.00259
2

 0   1   2  
P(X > 2) = 0.997

Hipergeométrica y Binomial negativa

2. Cierto tipo de cámara digital viene en una versión de tres megapixeles y una de cuatro
megapixeles. Una tienda de cámaras recibió un envío de 15 de estas cámaras, de las cuales seis
tienen una resolución de tres megapixeles. Suponga que se eligen al azar cinco de estas cámaras
para colocarlas en el mostrador; las otras 10 se colocan en el almacén. Sea X = número de cámaras
de tres megapixeles, entre las cinco elegidas para colocarlas en el mostrador.
a. ¿Qué clase de distribución tiene X (nombre y valores de los parámetros)?
b. Calcule P(X = 2), P(X  2) y P(X  2).
c. Calcule el valor medio y la desviación estándar de X.

Solución:
a. Es una distribución Hipergeométrica h(x; n, M, N) con n = 5, M = 6 y N = 15, n = número de
elementos en la muestra, M = número de éxitos en la población y N = número de elementos en
la población.
 M  n  M 
  
nx 
P( X  x)  h( x; n, M , N )   
x
N
 
n
 6 15  6   6  9 
     
2 5  2   2  3 
P( x  2)      0.4195 P( X  2)  0.4195
b. 15  15 
   
5 2
 6  9   6  9   6  9   6  9 
             
2
 x  n  x   0  5   1  4   2  3 
P( X  2)     0.71328 P( X  2)  0.71328
x 0 N 15 
   
n 5
P( X  2)  1  P( X  2)  1  0.2937  0.7063 P( X  2)  0.7063

M  N n M  M
E( X )  n  V (X )     n   1  
N  N  1  N  N
6  15  5   6 6
c. E ( X )  5    2 V (X )    (2) 1     0.857
 15   14   15  7
 X  V ( X )  0.857  0.925 E( X )  2  X  0.925

3. Un profesor que el último período escolar dio dos secciones de estadística en ingeniería, el primero
con 20 alumnos y el segundo con 30, decidió asignar un proyecto para los cursos. Después de
246

recibidos todos los proyectos, los apilo en orden aleatorio antes de calificarlos. Considere los 15
primeros proyectos que se califican.
a. ¿Cuál es la probabilidad de que exactamente 10 de ellos provengan de la segunda sección?
b. ¿Cuál es la probabilidad de que al menos 10 de ellos provengan de la segunda sección?
c. ¿Cuál es la probabilidad de que al menos 10 de ellos provengan de la misma sección?
d. ¿Cuáles son el valor medio y la desviación estándar de la cantidad entre los 15, que provengan
de la segunda sección?
e. ¿Cuáles son el valor medio y la desviación estándar, del número de proyectos que estén entre
los primeros 15 y que provengan de la primera sección?

Solución:

a. La distribución es hipergeométrica h(x; n, M, N) con n = 15 , M = 30 y N = 50

 M  n  M 
  
 x  n  x 
P( X  x)  h( x; n, M , N ) 
N
 
n
 30  50  30   30  20 
     
10 15  10   10  5 
h(10;15,30,50)      0.207
 50   50 
   
 15   15 
P( X  10)  0.207
b. P(X  10) = h(10;15, 30, 50) + h(11;15, 30, 50) + h(12;15, 30, 50) + h(13;15, 30, 50) + h(14;15,
30, 50) + h(15;15, 30, 50)
P(X  10) = 0.207 + 0.1176 +0.0438 + 0.0101 + 0.0013 + 0.000067 = 0.3798
P(X  10) = 0.3798

c. Sea Y = Número de proyectos de la primera sección con h(y; 15, 20, 50), entonces la
probabilidad pedida es: P(X  10) + P(Y  10)
P(Y  10) = h(10;15, 20, 50) + h(11;15, 20, 50) + h(12;15, 20, 50) + h(13;15, 20, 50) +
h(14;15, 20, 50) + h(15;15, 20, 50)
P(Y  10) = 0.0116974 + 0.002045 + 0.0002272 + 0.0000150 + 0.0000005 + 0 = 0.01398
P(Y  10) = 0.01398
P(X  10 o Y  10) = 0.3798 + 0.01398 = 0.3938

M  N n M  M
E( X )  n  V (X )     n   1  
N  N 1  N  N
 30   50  15   30  126
d. E ( X )  15    9 V (X )    (9) 1     2.5714
 
50  49   50  49
 X  V ( X )  2.5714  1.6036 E ( X )  9  X  1.6036
20  50  15   20 
E (Y )  15  6 V (Y )     6  1    2.57
e. 50  49   50 
 Y  V (Y )  2.57  1.6036 E (Y )  6  Y  1.6036
247

4. Un geólogo ha recolectado 10 especímenes de roca basáltica y 10 de granito. Si instruye a un


asistente de laboratorio para que seleccione al azar 15 de los especímenes para analizarlos,
a. ¿cuál es la fpm del número de especímenes de basalto seleccionados para analizarlos?
b. ¿cuál es la probabilidad de que todos los especímenes de uno de los dos tipos de roca sean
seleccionados para el análisis?
c. ¿cuál es la probabilidad de que la cantidad de especímenes de granito seleccionados para su
análisis esté a menos de 1 DE de su valor promedio?

Solución:
a. Es una distribución hipergeométrica con n =15, M = 10 y N = 20, por tanto la función de
probabilidad de masa es h(x; 15, 10, 20)
b. P(X = 10) = h(10; 15, 10, 20)
10 10 
  
P( X  10)      0.0163 Puesto que los especímenes de cada tipo es el mismo:
10 5
 20 
 
 15 
P(X = 10 o Y = 10) = 0.0163 + 0.0163 = 0.0326
M  N n M  M
E( X )  n  V (X )     n   1  
N  N 1  N  N
 10   20  15   10  75
c. E ( X )  15    7.5 V (X )    (7.5) 1     0.98684
 20   19   20  76
 X  V ( X )  0.98684  0.9934 E ( X )  7.5  X  0.9934
 X   X  7.5  0.9934  (6.5,8.5)
Entonces la probabilidad pedida es P( X = 8 o X =7)
P(X = 8 o X =7) = h(8) + h(7) = 0.3483 + 0.3483 =0.6966 P( X = 8 o X =7) = 0.6966

5. Un director personal que entrevista a 12 ingenieros para cuatro vacantes ha programado 7


entrevistas para el primer día y 5 para el segundo día de entrevistas. Suponga que los candidatos
son entrevistados al azar.
a. ¿Cuál es la probabilidad de que x de los mejores cuatro candidatos sean entrevistados el primer
día?
b. ¿Cuántos de los mejores cuatro candidatos pueden esperar ser entrevistados el primer día?

Solución:
a. La distribución es hipergeométrica h(x; 7, 4 12) con n = 7, M = 4 y N = 12.
M 4 7
b. E ( X )  n  E( X )  7    E ( X )  2.33
N  12  3
6. Un lote de 75 arandelas contiene cinco en las que la variabilidad del espesor alrededor de la
circunferencia de la arandela es inaceptable. Se selecciona al azar una muestra de 10 arandelas.
a. ¿Cuál es la probabilidad de que ninguna de las arandelas inaceptables esté en la muestra?
b. ¿Cuál es la probabilidad de que al menos una de las arandelas inaceptables esté en la muestra?
c. ¿Cuál es la probabilidad de que exactamente una de las arandelas inaceptables esté un la
muestra?
d. ¿Cuál es el número promedio de arandelas inaceptables en la muestra?

Solución:
a. La distribución es hipergeométrica
248

 M  N  M 
  
nx 
h( x; n, M , N )   
x
con n  10, M  5, N  75 por tanto
N
 
n
 5  70   5  70 
     
 x 10  x 
h(0;10,5,75)      0.4785
0 10
h( x;10,5,75)  , P( X  0)  0.4785
 75   75 
   
 10   10 
b. P( X  1)  1  P( X  1)  1  P( X  0)  1  0.4785  0.5215 P( X  1)  0.5215
 5  70 
  
c. P( X  1)  h(1;10,5,75)      0.3923
1 9
P( X  1)  0.3923
 75 
 
 10 
M   5
d. E ( X )  n   E ( X )  10    0.667 E ( X )  0.667
N  75 

7. Suponga que p = P (de que nazca un varón) = 0.5. Una pareja desea tener exactamente dos niñas
en su familia. Tendrán hijos hasta que se satisfaga la condición.
f. ¿Cuál es la probabilidad de que la familia tenga x hijos varones?
g. ¿Cuál es la probabilidad de que la familia tenga cuatro hijos?
h. ¿Cuál es la probabilidad de que la familia tenga a lo sumo cuatro hijos?
i. ¿Cuántos varones se esperaría que tenga esa familia? ¿cuántos hijos se esperaría que tenga esa
familia?
Solución:
a. Sea X = Nº de varones antes que se tengan 2 niñas, entonces la distribución es binomial
 x  r  1 r
negativa con P(X = x) = bn(x; r, p) P( X  x)    p (1  p)
x

 r 1 
b. P(X = 2) ya que serán dos varones y dos niñas, entonces P(X = 2) = bn(2; 2, 0.5)
 3
P( X  2)    (0.5)2 (1  0.5) 2  0.1875 P( X  2)  0.1875
1
c. A lo sumo 4 hijos corresponde a P(X  2)
2
 1  2  3
P( X  2)   nb( x;2,0.5)    (0.5) 2 (0.5)0    (0.5) 2 (0.5)    (0.5) 2 (0.5)2  0.6875
x 0  1 1  1
P(X  2) = 0.6875
r (1  p) 2(0.5)
d. E ( X )  E( X )  2
p 0.5
Número esperado de varones = 2, Número esperado de hijos = 4

8. La probabilidad de que un experimento tenga un resultado exitoso es 0.89. El experimento se


repetirá hasta que ocurran cinco resultados exitosos.
a. ¿Cuál es el número esperado de repeticiones necesarias?
b. ¿Cuál es la varianza?
249

Solución:
a. La distribución es binomial negativa con X + r el número de ensayos para obtener r éxitos, en
este caso, tenemos:
r 5
E( X )  , E( X )   5.618 E ( X )  5.618
p 0.89

b. Para la varianza, tenemos:


r (1  p) 5(1  0.89)
V (X )  2
V (X )   0.694 V ( X )  0.694
p (0.89)2

9. La probabilidad de que un submarino hunda un barco enemigo con un disparo de sus torpedos es
0.8. Si los disparos son independientes, determine la probabilidad de un hundimiento dentro de
los primeros dos disparos, y dentro de los primeros tres.

Solución:
Esta es una distribución geométrica donde X = Número de ensayos para alcanzar el primer éxito,
por tanto:
q x 1 p x  1, 2,3...
p ( x)  
 0 en otro caso La probabilidad pedida es :

2
P( X  2)   q x 1 p P( X  2)  (0.2)0 (0.8)  (0.2)(0.8)  0.96
x 1

P( X  1 o X  2)  0.96

P( X  3)  (0.8)(0.20  0.2  0.22 )  0.992 P( X  3)  0.992

10. De acuerdo con la revista Chess Life, 40% de los grandes maestros de ajedrez del mundo
consideran que Garry Kaspárov es el mejor ajedrecista de todos los tiempos. Si se les pregunta a
varios grandes maestros su opinión a este respecto, encuentre la probabilidad de que le octavo a
quien se le planteó la pregunta sea el cuarto que considera a Kaspárov el mejor ajedrecista de todos
los tiempos.

Solución:
La distribución es binomial negativa con X = Número de fracasos antes de obtener r éxitos, por
tanto, tenemos que:

 x  r  1 r x
nb( x; r , p)   p q
 r 1 
La probabilidad pedida es:
 4  4  1
P( X  4)    (0.40) (0.60)  0.1161
4 4
P( X  4)  0.1161
 4  1 

Distribución de Poisson
250

1. Suponga que la cantidad de conductores que viajan entre cierto origen y destino, durante
determinado período, tiene una distribución de Poisson con parámetro  = 20 (sugerido en el
artículo “Dynamic Ride Sharing: Theory and Practice”, J. ofTransport Engr., 1997, pp. 308 - 312).
¿Cuál es la probabilidad de que la cantidad de conductores:
b. sea máximo 10?
c. Sea mayor que 20?
d. esté entre 10 y 20 inclusive? ¿Esté estrictamente entre 10 y 20?
e. sea mayor que la cantidad media en más de dos desviaciones estándar?

Solución:
e  x
Para una distribución de Poisson p( x;  )  x  0,1, 2,...
x!
a. Aquí  = 20 y usando tablas de distribución acumulada P(X  10) = F (10; 20) = 0.011
P(X  10) = 0.011
b. P(X > 20) = 1 – P(X  20) = 1 – F (20; 20) = 1 – 0.559 = 0.441 P(X > 20) = 0.441
c. P(10  X  20) = F(20; 20) – F(9; 20) = 0.559 – 0.005 = 0.554 P(10  X  20) = 0.554
d. E(X) =  = 20,  X    20  4.472
P(X >  + 2) = P(X > 20 + 8.944) = P(X > 29) = 1 – P(X  29) = 1 – F(29; 20) = 0.022
P(X >  + 2) = 0.022

2. Considere escribir en un disco de computadora y luego enviar el número de pulsos faltantes.


Suponga que este número X tiene una distribución de Poisson con parámetro  = 0.2 (sugerido
en “Average Simple Number for Semi – Curtailed Samplig”).
a. ¿Cuál es la probabilidad de que un disco tenga exactamente un pulso faltante?
b. ¿Cuál es la probabilidad de que un disco tenga menos de dos pulsos faltantes?
c. Si dos discos se seleccionan de manera independiente, ¿Cuál es la probabilidad de que ninguno
tenga un pulso faltante?
Solución:
a. P( X  1)  F (1;0.2)  F (0;0.2)  0.982  0.819  0.163 P(X = 1) = 0.163
b. P(X < 2) = F(1; 0.2) = 0.982 P(X < 2) = 0.982
c. P(X = 0) = F(0;0.2) = 0.819
P(1º no le falte  2º no le falte) = P(1º no le falte)P(2º no le falte)
 (0.819)(0.819)  0.671
3. Suponga que aviones pequeños llegan a cierto aeropuerto, según un proceso de Poisson, con tasa
 = 8 aviones por hora, de modo que el número de llegadas por un período de t horas es una va
de Poisson con parámetro  = 8t.
a. ¿Cuál es la probabilidad de que exactamente 5 aviones pequeños lleguen durante un período
de una hora? ¿Por lo menos 5? ¿Por lo menos 10?
b. ¿Cuáles son el valor esperado y la desviación estándar del número de aviones pequeños que
lleguen durante un período de 90 minutos?
c. ¿Cuál es la probabilidad de que por lo menos 20 aviones pequeños lleguen durante un período
de 2.5 horas? ¿De que a lo sumo 10 lleguen durante ese período?

Solución:
a. Para un período t = 1h,  = 8. Usando tablas de distribución acumulada, tenemos:
P(X = 5) = F(5; 8) – F(4; 8) = 0.191 – 0.100 = 0.091 P(X =5) = 0.091
P(X  5) = 1 – P(X < 5) = 1 – F(4; 8) = 1 – 0.100 = 0.900 P(X  5) = 0.900
P(X  10) = 1- P(X < 10) = 1 – F(9; 8) = 1 – 0.717 = 0.283 P(X  10) = 0.283
251

b. Para un período t = 90 min = 1.5h,  = 12, entonces:


E(X) =  E(X) = 12 y  X    12  3.464 E ( X )  12,  X  3.464
c. Para t = 2.5h,  = 20, en este caso
P(X  20) = 1 – P(X < 20) = 1 – F(19; 20) = 1 – 0.47 = 0.53 P(X  20) = 0.53
P(X  10) = F(10; 20) = 0.011 P(X  10) = 0.011

4. Suponga que hay árboles distribuidos en un bosque según un proceso de Poisson de dos
dimensiones, con parámetro  y que el número esperado de árboles por acre es igual a 80.
a. ¿Cuál es la probabilidad de que en cierto lote de un cuarto de acre haya a lo sumo 16 árboles?
b. Si el bosque cubre 85, 000 acres, ¿Cuál es el número esperado de árboles en el bosque?
c. Suponga que se selecciona un punto del bosque y se construye un círculo de 0.1 milla de radio.
Sea X el número de árboles dentro de esa región circular, ¿Cuál es la fdm de X? ( 1 milla
cuadrada = 640 acres)

Solución:
a. Para un cuarto de acre, el parámetro  = 0.25 (80) = 20, entonces:
P(X  16) = F(16; 20) = 0.221 P(X  16) = 0.221
b. E(X) = , entonces E(X) = 80(85000) = 6 800 000 árboles E(X) = 6 800 000
c. El área de ese círculo es A = r , A =  (0.1 milla) (640acres/milla ) = 20.1062 acres, entonces
2 2 2

X tiene una distribución de Poisson con parámetro  = 20.1062, es decir:


p(x) = p(x; 20.1062).

5. En una prueba de tarjetas de circuitos, la probabilidad de que un diodo en particular falle es de


0.01. Suponga que una tarjeta contiene 200 diodos.
a. ¿Cuántos diodos se espera que fallen y cuál es la desviación estándar del número que se espera
que falle.
b. ¿Cuál es la probabilidad (aproximada) de que por lo menos cuatro diodos fallen en una tarjeta
seleccionada al azar?
c. Si se embarcan cinco tarjetas a un cliente en particular, ¿cuál es la probabilidad de que por lo
menos cuatro de ellas funcionen bien? (Una tarjeta funciona bien sólo si todos los diodos
funcionan).
Solución:
a. Si X = Número de diodos de una tarjeta que fallan, entonces E(X) = np (distribución binomial),
E(X) = 200(0.01) = 2 y V(X) = npq, V(X) = 200(0.01)(0.99) = 1.98, la desviación estándar X
= 1.407 E(X) = 2, X = 1.407
b. Si utilizamos una aproximación a la distribución de Poisson, ya que  = np = 2  20, tenemos
P(X  4) = 1 – P(X < 4) = 1 – F(3; 2) = 1 – 0.857 = 0.143 P(X  4) = 0.143
c. Una tarjeta funciona bien si P(X = 0) = F(0; 2) = 0.135, entonces ahora se tiene una distribución
binomial con parámetros n = 5 y p = 0.135y la probabilidad pedida es P(X  4), por tanto:
P(Y  4)  P(Y  4)  P(Y  5)
 5  5
P(Y  4)    (0.135) 4 (0.865)    (0.135)5 (0.865) 0  0.00144  0.00004  0.00148
 4  5
P(X  4) = 0.00148

6. Suponga que sólo 0.10% de las computadoras de cierto tipo experimentan falla del CPU durante
el período de garantía. Considere una muestra de 10 000 computadoras.
a. ¿Cuál es el valor esperado y la desviación estándar del número de computadoras de la muestra
que tienen el defecto?
252

b. ¿Cuál es la probabilidad (aproximada) de que más de diez computadoras muestreadas tengan


el defecto?
c. ¿cuál es la probabilidad (aproximada) de que ninguna de las computadoras muestreadas tengan
el defecto?
Solución:
a. La distribución es normal, por lo que E(X) = 10000(0.001) = 10 y V(X) = npq, V(X) =
10000(0.001)(0.999) = 9.99, la desviación estándar X = 3.16 E(X) = 10, X = 3.16
b. Si utilizamos una aproximación a la distribución de Poisson, ya que  = np = 10  20, tenemos
P(X > 10) = 1 – P(X  10) = 1 – F(10; 10) = 1 – 0.583 = 0.417
P(X  10) = 0.143

c. P(X = 0) = F(0; 10) = 0.000045 P(X = 0) = 0.000045

7. Se supone que el número de imperfecciones en los rollos de tela de una fábrica textil tiene una
distribución de Poisson con una media de 0.1 imperfecciones por metro cuadrado.
a. ¿Cuál es la probabilidad de que haya 2 imperfecciones en un metro cuadrado de tela?
b. ¿Cuál es la probabilidad de que haya una imperfección en 10 metros cuadrados de tela?
c. ¿Cuál es la probabilidad de que no haya imperfecciones en 20 metros cuadrados de tela?
d. ¿Cuál es la probabilidad de que haya al menos una imperfección en 10 metros cuadrados de
tela?
Solución:
a. Si E(X) =  = 0.1 Para 1 m2, entonces La fpm es p(x; 0.1)
P(X = 2) = F(2; 0.1) – F(1; 0.1) = 1 – 0.995 = 0.005 P(X = 2) = 0.005
b. Para 10 m ,  = 0.1(10) = 1, p(x; 1), entonces P(X = 1) = F(1; 1) – F(0; 1)
2

P(X = 1) = 0.736 – 0.368 = 0.368 P(X = 1) = 0.368


c. Para 20 m2,  = 0.1(20) = 2, p(x; 2), entonces P(X = 0) = F(0; 2) = 0.135
P(X = 0) = 0.135
d. Para p(x; 1), entonces P(X  1) = 1 P(X < 1) = 1  F(0; 1) = 1 – 0.368 = 0.634
P(X  1) = 0.634
Variables aleatorias continuas

11. Un maestro universitario nunca termina su clase antes de que suene la campana y siempre termina
su clase a menos de 2 min después de que suena la campana. Sea X = el tiempo que transcurre
entre la campana y el término de clase y suponga que la fdp de X es:

kx2 0 x2
f ( x)  
0 de otra manera
a. Encuentre el valor de k
b. ¿Cuál es la probabilidad de que la clase termine a menos de 1 minuto después de que suene la
campana?
c. ¿Cuál es la probabilidad de que la clase continúe entre 60 y 90 s después de que suene la
campana?
d. ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 s después de que suene la
campana?

Solución

Se sabe que
 f ( x)dx  1 y por tanto

253

2
2  x3  8 3
0     k   1 k 
2
a. kx dx k
 3 0  3 8

1
1 3  x3  3  1  1
b. P( X  1)  k  x 2 dx         0.125 P(X < 1) = 0.125
0 8  3 0 8  3  8

1.5
3  x3 
c. P(1  X  1.5)             0.2969
3 27 1 3 19 19
P(1  X  1.5)  0.2969
8  3 1 8  24 3  8  24  64

1.5
3  x3 
d. P( X  1.5)  1  P( X  1.5)  1     1     1    0.5781
3 27 27 37
8  3 0 8  24  64 64

12. Suponga que el error al hacer cierta medición es una va continua X con fdp

0.09375(4  x 2 ) 2 x2


f ( x)  
 0 de otra manera
a. Trace la gráfica de f (x).
b. Calcule P (X > 0).
c. Calcule P(-1 < X < 1)
d. Calcule P (X < - 0.5 o X > 0.5)

Solución 0.4
a.

f ( x) 0.2

2 0 2
x

2
 x3 
c. P( X  0)  0.09375 (4  x )dx  0.09375  4 x    0.09375  8    0.5
2
2 8
0
 30  3
1
1  x3 
P(1  X  1)  0.9375 (4  x )dx  0.09375  4 x  
2
1
 3 1
c.
 1  1   22 
 0.09375  4     4     0.09375    0.6875
 3  3   3 
0.5
 x3   1   1 
d. P(0.5  X  0.5)  0.9375  4 x    0.09375  2     2     0.3672
 3  0.5  24   24  
254

P( X  0.5 o X  0.5)  1  P(0.5  X  0.5)  1  0.3672  0.6328

13. El peso real de apoyo de una pastilla de estéreo, que actualmente está puesta a 3g en un tocadiscos,
puede considerarse una va X continua con fdp


k 1  ( x  3) 
2
2 x4
f ( x)   

 0 de otra manera
a. Dibuje la gráfica de f (x).
b. Encuentre el valor de k
c. ¿Cuál es la probabilidad de que el peso real de apoyo sea mayor que el peso especificado?
d. ¿Cuál es la probabilidad de que el peso real sea menor de 0.25g del peso especificado?
e. ¿Cuál es la probabilidad de que le peso real difiera del peso especificado más de 0.5g?

Solución
a.
1

0.75

f ( x) 0.5

0.25

0 1 2 3 4 5
x

4
b. k  2 1  ( x  3)2  dx  1
4
 ( x  3)3   1  1  4 3
k x    k  4     2     k    k
 3 2  3  3  3 4
4
4 3   ( x  3)3   3  1 
P( X  3)  k  1  ( x  3) 2  dx   x       4    (3  0) 
3 4   3   3 4  3 
d.
3 2 1
     0.5 P( X  3)  0.5
4 3 2
2.75
2.75 3 ( x  3)3 
P( X  2.75)  k  1  ( x  3) 2  dx   x  
2 4 3 2
3  1  3
e.  (2.75  5.208  103 )   2     (0.4218)  0.316
4  3  4
P( X  2.75)  0,316
255

P  x  3  0.5   1  P  x  3  0.5   1  P(2.5  X  3.5)


3.5
3 3.5 3 ( x  3)3 
 1   1  ( x  3) 2  dx  1   x  
4 2.5 4 3  2.5
f.
3
1 (3.4583)  (2.5416)   1  0.6875  0.3125
4
P  x  3  0.5   0.3125

14. El tiempo X (minutos) para que un asistente de laboratorio prepare el equipo para un experimento
tiene una distribución uniforme con A = 25 y B = 35.
a. Escriba la fdp de X y trace su gráfica.
b. ¿Cuál es la probabilidad de que el tiempo de preparación exceda de 33 min?
c. ¿Cuál es la probabilidad de que el tiempo de preparación se encuentre a 2 minutos del tiempo
medio?
d. Para cualquier a tal que 25 < a < a + 2 < 35, ¿cuál es la probabilidad de que el tiempo de
preparación esté entre a y a + 2 minutos?

Solución
a. Para una distribución uniforme la función de distribución de probabilidad es:

 1
 B X  A
f ( x)   B  A
 0 de otra manera
En este caso tenemos:

1
 25  X  35
f ( x)  10
 0 de otra manera

35
b. P( X  33)   33 101 dx  101 x 33  101 (35  33)  102  0.2 P( X  33)  0.2
35

35
35 1  x2 
c. E ( X )     101 xdx     30
25 10  2 25

30  2 es de 28 a 32
32
P(28  X  32)  101  dx  101 x 28  101 (32  28)  0.4
32
P(28  X  32) = 0.4
28

a2
e. P(a  X  a  2)  101 x a  0.1(a  2  a)  0.2 P(a  X  a  2) = 0.2

15. La fda para X (= error de medición) es


256

 0 x  2

1 3  x 
3
F ( x)     4 x    2  x  2
 2 32  3
 2 x
 1
a. Calcule P(X < 0)
b. Calcule P(-1 < X < 1)
c. Calcule P(0.5 < X)
d. Encuentre la función de densidad f(x).

Solución

d. P( X  0)  F (0)  12  323 (0)  12  0.5 P(X < 0) = 0.5

P(1  X  1)  F (1)  F (1)   12  323 (4  13 )    12  323 (4  13 ) 


e. P(-1 < X < 1) = 0.6875
 32
27
 325  32
22
 0.6875

f. P( X  0.5)  1  P( X  0.5)  1  F (0.5)  1   12  323 (2  241 )   1  175


256
 256
81
 0.3164
P(X > 0.5) = 0.3164
d. f ( x)  F '( x)  323 (4  x 2 ) por tanto


 323 (4  x )
2
2 x2
f ( x)  

 0 de otra manera

16. Simbolice con X el tiempo que dura un libro prestado con fdp

0.5 x 0 x2
f ( x)  
0 de otra manera

a. Calcule E(X).
b. Calcule V(X) y .
c. Si a la persona que solicita el libro se le cobra una cantidad h(X) = X 2 cuando la duración del
préstamo es X, calcule el cobro esperado E [h(X)].

Solución
2
2  x3  8 4
c. E ( X )  0.5 0 x  xdx  0.5     E(X) = 4/3
 3 0 6 3

2
2  x4 
d. E ( X )  0.5
2
x  xdx  0.5    2
2
0
 4 0
4 2
Puesto que V ( X )  E ( X 2 )   E ( X )  2  
2
V(X) = 2/3
3 3
257

2
  x4 
d. E  h( X )   E  h( X )  2
2
h( x)  f ( x)dx   x (0.5 x)dx  0.5    2
2
 0
 4 0

17. “Avance del Tiempo” en flujo de tránsito es el tiempo transcurrido entre el tiempo en que un
automóvil termina de pasar un punto fijo y el instante en que el siguiente automóvil comienza a
pasar por ese punto. Sea X = avance entre dos automóviles consecutivos elegidos al azar. Suponga
que en un cierto ambiente de tráfico, la distribución del tiempo de avance tiene la forma
k
 x 1
f ( x)   x 4

0 x 1

a. Determine el valor de k para el cual f(x) es una fdp legítima.


b. Obtenga la función de distribución acumulada.
c. Utilice la fda del inciso (b) para determinar la probabilidad de que el avance exceda 2 s y la
probabilidad de que el avance esté entre 2 y 3 s.
d. Obtenga el valor medio y la desviación estándar del avance.
e. ¿Cuál es la probabilidad de que el avance esté dentro de una desviación estándar del valor
medio?

Solución:

a. Para que f(x) sea legítima 



f ( x)dx  1 , en este caso tenemos que:

 k  1   1

1 x4
dx  1 k  3  1
 3x  1
 k 0   1
 3
k  3

x
x k  1   1 1 1
b. Integrando la fdp tenemos: 1 x 4
dx  k  3   3  3    1  3 , entonces
 3x  1  3x 3  x

 0 x 1

F ( x)   1
1  x3 x 1

 1 1
P( X  2)  1  P( X  2)  1  F (2); P( X  2)  1  1  3   P( X  2)  0.125
 2  8
c.
 1  1 1 1
P(2  X  3)  F (3)  F (2)  1  3   1  3     0.0879 P(2  X  3)  0.088
 3   2  8 27

   1   1   1   1
d. E ( X )   xf ( x)dx, E ( X )  3 x  4  dx  3  3  dx  3   2   3  0  
 1
x  1
x   2x  1  2
E(X) = 1.5
258


   1   1 
E( X )  2 2
x f ( x)dx; E ( X )  3
2
x  4  dx  3  2   3(0  1)  3
2
 1
x  x 1
V ( X )  E  X 2    E ( X ) V ( X )  3  1.5   0.75
2 2

 X  V ( X )  0.75  0.866  X  0.866

Entonces la probabilidad pedida es:


 1 
P( X     X )  P( X  2.366)  F (2.366)  1    0.9245
  2.366 3 
 
P( X     X )  0.9245

18. Exprese con X el tiempo para la falla (en años) de cierto componente hidráulico. Suponga que la
fdp de X es f(x) = 32/(x + 4)3 para x ≥ 0.
a. Verifique que f(x) sea una fdp legítima.
b. Determine la fda.
c. Utilice el resultado del inciso (b) para calcular la probabilidad de que el tiempo para la falla
sea entre 2 y 5 años.
d. ¿Cuál es el tiempo esperado para la falla?
e. Si el componente tiene un valor de rescate igual a 100/(4 + x) cuando su tiempo para fallar sea
x, ¿cuál es el valor esperado de rescate?
Solución:

a. Para que f(x) sea legítima



 f ( x)dx  1 , en este caso tenemos que:



   1 

32 1
dx  1 32  2 
 32  0   1
0  x  4  2( x  4)  0
3
 2(4)2 
Por tanto f(x) es una distribución legítima
b. Integrando la fdp tenemos:
x
 1 1

x
32 32 1 16
dx    16    1 , entonces
0 ( x  4) 3
2 ( x  4)2 0  ( x  4) 16 
2
( x  4)2
 0 x0

F ( x)   16
1  ( x  4)2 x0

 16   16  20
c. P(2  X  5)  F (5)  F (2)  1  2 
 1  2 
 P(2  X  5) =0.247
 (5  4)   (2  4)  81
259

  32 x  x

 dx 
E( X )   xf ( x)dx, E( X )   dx  32   
 0 ( x  4) 3
 2( x  4)
2
0
0 2( x  4) 2 
d.
 1

   1 
E ( X )  32 0    32    0     4 E( X )  4
 2( x  4) 0 
   8 


100
e. Sea Y el valor de rescate, Y  , entonces E (Y )  Y ( x) f ( x)dx
x4 


 
 
 
100 32 dx 1
E (Y )  dx  3200  3200   3 
0 x  4 ( x  4)3 0 ( x  4) 4
 3( x  4)  0
 1  3200
 3200  (0    16.67 E (Y )  16.67
 3(64)  192

9. Considere la fdp para el tiempo total de espera Y de dos autobuses

 25
1
y 0 y5
2 1
f ( y )   5  25 y 5  y  10
 0
 de otra manera
a. Calcule y grafique la fda de Y. (Sugerencia: considere de forma separada 0 ≤ y < 5 y 5 ≤ y ≤
10 al calcular F(y). Una gráfica de la fdp podría ser útil.)
b. Obtenga una expresión para el (100p)mo percentil. (Sugerencia: considere en forma separada
0 < p < .5 y .5 < p < 1.
c. Calcule E(Y) y V(Y). ¿Cómo se comparan con el tiempo esperado y la varianza de un solo
autobús cuando el tiempo es uniformemente distribuido en 0,5 ?
Solución:
a. Integrando la función f(y) para obtener la fda, tenemos:
y y
ydy y 2 y2 2 y  2 y2  y2 3
 
y y
2
     dy   y    y  
0 25 50 0
50 5  5 25  5 50  5 5 50 2
Para la segunda integral hay que aumentar ½ (observar la figura) por tanto:

 0 y0
 2
 y 0 y5
 50
F ( y)   2
 2 y  y  1 5  y  10
5 50

 1 y  10

Gráfica de f (y)
260

Gráfica de F (y)

b. De la función de distribución acumulada, resolvemos las ecuaciones resultantes en los dos


Intervalos
y 2p
Para 0 < p  0.5, p  despejando y p , y p  50 p
50
Para 0.5 < p  1
2 y 2p
p  yp   1 despejando a y p , se resuelve la ecuación y 2p  20 y p  50( p  1)  0
5 50

20  202  4(50)( p  1) 20  200  200 p


yp    10  5 2(1  p)
2 2
Tomamos el signo negativo ya que y  10, entonces: y p  10  5 2(1  p)

 5  y  10  2 y 
E (Y )   yf ( y )dy, entonces E (Y )   y   dy   y    dy
 0
 25  5
 5 25 
c. 5 10
y3  y 2 y3  125  1000   125  
E (Y )        20    5   5 E (Y )  5
75 0  5 75  5 75  75   75  
Este valor se puede obtener también de la gráfica por su simetría
5  y  10 2 y 
E (Y 2 )   y 2   dy   y 2    dy
0
 25  5
 5 25 
5 10
y4  2 y3 y 4  625  2000   250 625   175
E (Y 2 )         100      
100 0  15 100  5 100  15   15 100   6
175 25
V (Y )  E (Y 2 )   E (Y )  ,
2
V (Y )   (5) 2   4.167 V (Y )  4.167
6 6
25
Para una distribución uniforme en el intervalo (0, 5), E(X) = 2.5 y V(X) = , se observa que
12
estos valores son la mitad de los de f (y)

10. El diámetro (en centímetros) de unos balines metálicos para uso industrial, es una va aleatoria
continua X cuya función de densidad de probabilidad está dada por:
261

2cx  cx 2  0.99c para 0.9  x  1.1


f ( x)  
 0 en cualquier otro caso

a. Obtenga el valor de la constante c.


b. Halle la media, la desviación estándar y la mediana.
c. Dibuje la gráfica de f(x)
Solución:

a. Usando la definición de distribución de probabilidad f ( x) 
 
f ( x)dx  1 , tenemos
1.1
 cx3 

1.1
(2cx  cx  0.99c)dx   cx 2 
2
 0.99cx   (0.322667  ( 0.324))c
0.9  3  0.9
1
=0.001333c  1, por tanto c   750 c  750
0.001333
b.
1.1
 2cx3 cx 4 0.99cx 2 

1.1
E( X )  x(2cx  cx  0.99c)dx  
2
    (0.077641666  (0.078975))c
0.9  3 4 2  0.9
 1.333333  103 c, entonces E ( X )  1.333333 10 3 (750)  0.9999  1 E( X )  1

1.1
 cx 4 cx5 0.99cx3 

1.1
E( X )  2
x (2cx  cx  0.99c)dx  
2 2
  
0.9  2 5 3  0.9

  0.029282    0.030618   c  1.336 10 3 c, E ( X 2 )  1.002


V ( X )  E ( X 2 )   E ( X )  , V ( X )  1.002  (12 )  0.002,
2
V ( X )  0.002
 x  V ( X ),  x  0.002  0.0447  X  0.0447

x
 cx3   cx3 

x
(2cx  cx  0.99c)dx   cx 2 
2
 0.99cx   cx 2   0.99cx  (0.324c) 
0.9  3  0.9  3 
 2 x3 
 x   0.99 x  0.324  c  0.5, 750 x  250 x  742.5 x  242.5  0
2 3

 3 
Resolviendo la ecuación el valor de x adecuado corresponde a la mediana
Por la simetría de la función se observa que x = 1, por tanto  1
c.
262

Gráfica de f(x)

Distribución Normal

22. El artículo “ Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr., 1995, pp.
785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en un reactor se distribuye
normalmente con  = 0.30 y  = 0.06.
a. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
c. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de concentración?
Solución:
x
a. Para una distribución normal con  = 0.30 y  = 0.06, la va Z  , y la probabilidad pedida

es:
 0.25  0.30   0.25  0.30 
P( X  0.25)  P  Z   1 P Z    1  (0.833)
 0.06   0.06 
P( X  0.25)  1  0.2033  0.7967 P( X  0.25)  0.7967
 0.10  0.30 
b. P( X  0.10)  P  Z    (3.333)  0.0004 P( X  0.10)  0.0004
 0.06 
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son mas grandes),
el 95 percentil de la distribución normal estándar es 1.645, entonces:
 c  0.30  c  0.30
P Z    0.95, (1.645)  0.95   1.645
 0.06  0.06
despejando a c, c  1.645(0.06)  0.30  0.3987 c  0.3987mg/cm3

23. Suponga que el diámetro de los árboles de determinado tipo, se distribuye normalmente con  =
8.8 y  = 2.8, como se sugiere en el artículo “Simulating Harvester – Forwarder Softwood
Thinning” (Forest Products J., mayo de 1997, pp. 36 - 41).
a. ¿Cuál es la probabilidad de que el diámetro de un árbol, seleccionado al azar, sea a lo sumo de
10 pulg? y ¿qué sea mayor de 10 pulg?
b. ¿Cuál es la probabilidad de que el diámetro de un árbol seleccionado al azar sea mayor de 20
pulg?
c. ¿Cuál es la probabilidad de que el diámetro de un árbol seleccionado al azar esté entre 5 y 10
pulg?
d. ¿Qué valor de c es tal que el intervalo (8.8 – c, 8.8 + c) incluya el 98% de todos los valores del
diámetro?
e. Si se eligen cuatro árboles de forma independiente, ¿cuál es la probabilidad de que por lo menos
uno tenga un diámetro mayor que 10 pulgadas?
Solución:
a. Para la distribución normal con  = 8.8 y  = 2.8, tenemos:
 10  8.8 
P( X  10)  P  Z    (0.428)  0.6664 P( X  10)  0.6664
 2.8 
P( X  10)  1  P( X  10)  1  0.6664  0.3336 P( X  10)  0.3336
263

 20  8.8 
b. P( X  20)  1  P( X  20)  1  P  Z    1  (4.35)  1  1  0 P( X  20)  0
 2.8 
 5  8.8 10  8.8 
P(5  X  10)  P  Z    (0.43)  (1.36)
c.  2.8 2.8 
P(5  X  10)  0.6664  0.0869  0.5795 P(5  X  10)  0.5795
 8.8  c  8.8 8.8  c  8.8 
d. P  Z    0.98, esto significa que en los extremos quedará sólo el
 2.8 2.8 
1%, así encontrando el valor de c en el extremo izquierdo:
 c  c
P Z    0.01, (2.33)  0.01   2.33
 2.8  2.8
c  (2.33)(2.8)  6.524 c  6.524
e. Esta es una distribución binomial con n = 4 y p = 0.3336 y la distribución pedida es:
P( X  1)  1  P( X  1)  1  b(0;4,0.3336)
 4  
P( X  1)  1    (0.3336)0 (0.6664) 4   1  0.1972  0.8028 P( X  1)  0.8028
 0  

24. El artículo “Monte Carlo Simulation – Tool for Better Understanding of LRFD”(J. Structural
Engr., 1993, pp. 1586 – 1599) sugiere que la resistencia a la ruptura (ksi) para acero grado A36
está normalmente distribuida con  = 43 y  = 4.5.
c. ¿Cuál es la probabilidad de que la resistencia a la ruptura sea a lo sumo 40? y ¿mayor de 60?
d. ¿Cuál valor de resistencia a la ruptura separa de los otros al 75% más fuerte?
Solución:
a. Para una distribución normal con  = 43 y  = 4.5, tenemos:
 40  43 
P( X  40)  P  Z    (0.667)  0.2514 P( X  40)  0.2514
 4.5 
 60  43 
P( X  60)  1  P( X  60)  1  P  Z    1  (5.11)  1  1  0 P( X  60)  0
 4.5 
b. Se requiere encontrar el 25 percentil, entonces, sea c este valor:
 c  43  c  43
P( X  c)  0.75, P  Z    0.25, (0.67)  0.25, entonces  0.67
 4.5  4.5
despejando el valor de c, c  (0.67)(4.5)  43  39.985 c  39.985

25. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una de las
siguientes probabilidades usando la aproximación normal (con la corrección de continuidad) para
los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades exactas calculadas de la tabla
correspondiente.
d. P(15 ≤ X ≤ 20)
e. P(X ≤ 15)
f. P(20 ≤ X)
Solución:
a. La aproximación normal para una binomial está dada por:
 x  0.5  np 
P( X  x)  B( x; n, p)     , cuando np  10 y np  10 , para p = 0.5, 0.6 y 0.8
 npq 

tenemos:  = np y   npq
264

p 0.5 0.6 0.8


 12.5 15.0 20.0
 2.5 2.45 2.0
 15  0.5  12.5 20  0.5  12.5 
P(15  X  20)  P  Z    (3.2)  (0.8)  0.2112
 2.5 2.5 
 15  0.5  15 20  0.5  15 
P(15  X  20)  P  Z    (2.24)  ( 0.204)  0.5668
 2.45 2.45 
 15  0.5  20 20  0.5  20 
P(15  X  20)  P  Z    (0.25)  (2.75)  0.5957
 2.0 2.0 
Usando tablas de distribución binomial, tenemos:

P(15  X  20)  B(20;25,0.5)  B(14;25,0.5)  0.99954  0.78782  0.21172


P(15  X  20)  B(20;25,0.6)  B(14;25,0.6)  0.99053  0.41422  0.57631
P(15  X  20)  B(20;25,0.8)  B(14;25,0.8)  0.57932  0.00555  0.57377
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.21172 0.2112
0.6 0.57631 0.5668
0.8


P( X  15)  P  Z 
0.57377

15  0.5  12.5 
texto
0.5957

   (1.2)  0.8849
 2.5 
 15  0.5  15 
b. P( X  15)  P  Z     (0.204)  0.5808
 2.45 
 15  0.5  20 
P( X  15)  P  Z     (2.25)  0.01222
 2.0 
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X  15)  B(15;25,0.5)  0.8852
P( X  15)  B(15;25,0.6)  0.5754
P( X  15)  B(15;25,0.8)  0.0173
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.8852 0.8849
0.6 0.5754 0.5808
0.8 0.0173 0.0122
265

 19.5  12.5 
P( X  20)  1  P( X  20)  1  P  Z    1  (2.8)  1  0.99744  0.00256
 2.5 
 19.5  15 
c. P( X  20)  1  P( X  20)  1  P  Z    1  (1.837)  1  0.9669  0.0331
 2.45 
 19.5  20 
P( X  20)  1  P( X  20)  1  P  Z    1  ( 0.25)  1  0.40129  0.5987
 2.0 
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X  20)  1  P( X  20)  1  B(19;25,0.5)  1  0.99790  0.0021
P( X  20)  1  P( X  20)  1  B(19;25,0.6)  1  0.97064  0.0293
P( X  20)  1  P( X  20)  1  B(19;25,0.8)  1  0.38331  0.6167
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.0021 0.00256
0.6 0.0293 0.0331
0.8 0.6167 0.5987

26. Suponga que 10% de todos los ejes de acero producidos por cierto proceso están fuera de las
especificaciones, pero que se pueden volver a trabajar (en lugar de tener que enviarlos a la
chatarra). Considere una muestra aleatoria de 200 ejes y exprese con X el número de los que estén
fuera de las especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada)
de que X sea:
d. a lo sumo 30?
e. Menos de 30?
f. entre 15 y 25 inclusive?
Solución:
a. La distribución es binomial, pero podemos calcular estas probabilidades con una aproximación
normal, con  = np = 20 y  2 = npq= 18 entonces:
 30  0.5  20 
P( X  30)  P  Z    (2.47)  0.9932 P( X  30)  0.9932
 18 
 29  0.5  20 
b. P( X  30)  P  Z    (2.24)  0.9875 P( X  30)  0.9875
 18 
 14  0.5  20 25  0.5  20 
P(15  X  25)  P  Z   (1.30)  (1.30)
c.  18 18 
P(15  X  25)  0.9032  0.0968  0.8064 P(15  X  25)  0.8064

27. Cuando se prueban tarjetas de circuito que se usan en la fabricación de reproductores de discos
compactos, el porcentaje de defectuosos a largo plazo es 5%. Suponga que recibe un lote de 250
tarjetas y que la condición de cualquier tarjeta es independiente de las demás.
c. ¿Cuál es la probabilidad aproximada de que al menos 10% de las tarjetas del lote estén
defectuosas?
d. ¿Cuál es la probabilidad aproximada de que haya exactamente 10 defectuosas en el lote?
Solución:
266

a. La distribución es binomial, pero podemos calcular esta probabilidad con una aproximación
normal con  = np = 12.5 y  2 = npq= 11.875 entonces el 10% de 250 = 25y la probabilidad
pedida es:
 24  0.5  12.5 
P( X  25)  1  B(24;250,0.05)  1  P  Z  
 11.875 
 1  (3.482)  1  0.9997  0.0003 P( X  25)  0.003
 250 
b. P( X  10)    (0.05) (0.95)  0.0963
10 240
P( X  10)  0.0963
 10 

28. El artículo “Computer Assisted Net Weight Control” (Quality Progress, 1983, pp. 22 -25) sugiere
una distribución normal, con media de 137.2 onzas y desviación estándar de 1.6 onzas, para el
contenido real de frascos de cierto tipo. El contenido establecido era de 135 onzas.
d. ¿Cuál es la probabilidad de que un solo frasco contenga más que el contenido establecido?
e. Entre 10 frascos seleccionados al azar, ¿cuál es la probabilidad de que por lo menos 8
contengan más del contenido establecido?
f. Si se supone que la media permanece en 137.2, ¿a qué valor tendría que haberse cambiado la
desviación estándar para que 95% de todos los frascos contengan más de lo establecido?
Solución:
a. Con  = 137.2 oz y  = 1.6 oz
 135  137.2 
P( X  135)  1  P( X  135)  1   Z    1  (1.38)  1  0.0838  0.9162
 1.6 
P( X  135)  0.9162
b. Con Y = Número entre 10 frascos que contienen más de lo establecido, Y tiene una distribución
binomial b(y; 10, 0.9162), por tanto la probabilidad pedida es:
P(Y  8)  1  P(Y  8)  1  B(7;10,0.9162)  1  0.04512  0.95488 P(Y  8)  0.95488
 135  137.2  136  137.2
P Z    0.05, (1.65)  0.05, entonces,  1.65
   
c.
135  137.2
despejando  ,    1.333   1.333
1.65
29. a. Si una distribución normal tiene  = 25 y  = 5, ¿cuál es el 91 percentil de la distribución?
b. ¿Cuál es el sexto percentil de la distribución del inciso (a)?
d. El ancho de una línea grabada en un chip de circuito integrado está normalmente distribuido
con media de 3.000 m y desviación estándar 0.150. ¿Qué valor separa al 10% más ancho de
todas las líneas del otro 90%?
Solución:
a. Con  = 25 y  = 5, el 91 percentil será:
 x  25  x  25
P Z    0.91, (1.34)  0.91, entonces,  1.34
 5  5
despejando x, x  (1.34)5  25  31.7 91 percentil = 31.7
b. De la misma forma:

 x  25  x  25
P Z    0.06, (1.555)  0.06, entonces,  1.555
 5  5
despejando x, x  (1.555)5  25  17.225 6 percentil = 17.225
c. Con  = 3.000 y  = 0.150, se requiere encontrar el 90 percentil que será:
267

 x 3 x 3
P Z    0.90, (1.28)  0.90, entonces,  1.28
 0.15  0.15
despejando x, x  (1.28)0.15  3  3.192 90 percentil = 3.192

30. La distribución de resistencia para resistores de cierto tipo es normal, 10% de los resistores tienen
una resistencia que excede los 10.256 ohms y 5% una resistencia menor de 9.671 ohms. ¿Cuáles
son los valores de la media y la desviación estándar de la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
 10.256     9.671   
P Z    0.90 y P  Z    0.05,
     
10.256   9.671  
(1.28)  0.90 y (1.645)  0.05, entonces:  1.28,  1.645
 
Obtenemos las ecuaciones: 1.28    10.256 y  1.645    9.671
resolviendo el sistema tenemos:10.256  1.28  9.671  1.645 , 2.925  0.585
  0.2   10

31. La vida de un láser de semiconductores con una alimentación de energía constante tiene una
distribución normal con una vida media de 7000 horas y una desviación estándar de 600 horas.
a. ¿Cuál es la probabilidad de que un láser falle antes de 5800 horas?
b. ¿Cuál es la vida en horas que excede 90% de los láseres?
c. ¿Qué valor deberá tener la vida media para que 99% de los láseres excedan 10000 horas antes
de fallar?
d. Un producto contiene tres láseres y el producto falla si cualquiera de ellos falla. Suponga que
fallan de manera independiente. ¿Qué valor deberá tener la vida media para que 99% de los
productos excedan 10000 horas antes de fallar?
Solución:
a. Con  = 7000 horas y  = 600, la probabilidad pedida es:
 5800  7000 
P( X  5800)  P  Z    (2.0)  0.0228 P( X  5800)  0.0228
 600 
b. Se requiere encontrar el 10 percentil, para tener el 90% de los que exceden ese valor.
 x  7000  x  7000
P Z    0.10, (1.28)  0.10,   1.28, despejando a x
 600  600
x  (1.28)600  7000  6232 x  6232 horas

c. Encontrando ahora el 1 percentil y suponiendo la misma desviación estándar, tenemos:


 10000    10000  
P Z    0.01, (2.33)  0.01,   2.33
 600  600
despejando a  ,   (2.33)600  10000  11398   11398 horas

d.

Distribución Gamma y exponencial


268

22. Suponga que el tiempo en horas tomado por el propietario de una casa para podar el césped de su
jardín es una va X, que tiene una distribución gamma con parámetros  = 2 y  = ½. ¿Cuál es la
probabilidad de que tarde:
a. a lo sumo una hora para podar su césped?
b. Por lo menos 2 horas?
c. entre 0.5 y 1.5 horas?
Solución:
x 
a. Con  = 2 y  = ½, la distribución gamma acumulada es: F  ,  y consultando en tablas:
 
 1 
P( X  1)  F  , 2   F (2, 2)  0.594 P( X  1)  0.594
1 
 2 
 2 
b. P( X  2)  1  P( X  2)  1  F  , 2   1  F (4, 2)  1  0.908  0.092 P( X  2)  0.092
1 
 2 
3  1 
P(0.5  X  1.5)  F  2 , 2   F  2 , 2   F (3, 2)  F (1, 2)  0.801  0.264
c. 1  1 
 2   2 
P(0.5  X  1.5)  0.537
23. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de vida útil, la
duración X (en semanas) tiene una distribución gamma con media de 24 semanas y desviación
estándar de 12 semanas.
a. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
b. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas? ¿Es la mediana de la
distribución de duración menor de 24 semanas? ¿Por qué sí o porqué no?
c. ¿Cuál es el 99avo percentil de la distribución de duración?
d. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es tal que solo
la mitad del 1% de todos lo transistores estarán funcionando al terminar la prueba?
Solución:
a. Para una distribución gamma E( X )     , V ( X )   2   2 , entonces:
24
  24,  2  144, despejando  ,   , sustituyendo en la otra ecuación

2
 24  576 24
   144,  144 y   4,   6

   4
Teniendo los valores de  = 4 y  = 6, calculamos las probabilidades pedidas
 24   12 
P(12  X  24)  F  , 4   F  , 4   F (4, 4)  F (2, 4)  0.567  0.143
 6  6 
P(0.5  X  1.5)  0.424
b. P( X  24)  F (4,4)  0.567 P( X  24)  0.567
Del resultado obtenido se deduce que P( X   )  0.5    24 . Esto se debe al sesgo
positivo de la distribución gamma.
x  x
c. P( X  x)  0.99, F  ,4   0.99, F (10,4)  0.99,   10, x  60
6  6
El 99 percentil = 60
d. Para 1% = 0.01, la mitad es 0.005, entonces:
269

t  t
P( X  t )  0.995, F  ,4   0.995, F (11,4)  0.995,   11, t  66
6  6
24. Las llamadas partículas (o rayos)  son en realidad electrones ordinarios expulsados de manera
excepcional del núcleo de algunos átomos de ciertos elementos radiactivos. Dichas partículas
jamás existen como tales dentro del núcleo, pero a veces llegan a crearse durante las
transformaciones nucleares, pudiendo escapar a grandes velocidades para ser detectadas en una
placa fotográfica. Si una pequeña porción de un elemento radiactivo expulsa en promedio 4
partículas  por segundo, calcule la probabilidad de que transcurran:
a. Más de dos segundos para que se emitan dos partículas ;
b. Menos de tres segundos para que se emitan 10 partículas .
[Sugerencia: suponga que el tiempo de emisión de de dichas partículas sigue una distribución
gamma.
Solución:
a.
25. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo Method”
(Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución exponencial, con
parámetro  = 0.93, como modelo para la distribución de la longitud (m) de la trayectoria libre
de un fotón bajo ciertas circunstancias. Suponga que el modelo es correcto.
a. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la longitud
de la trayectoria?
b. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es la
probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
c. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro  =0.93
1 1 1 1
E ( X )    , V ( X )   2  2 , así:    1.075,    1.075  =  = 1.075
  0.93 
 0 x0
b. Usando la fda F ( x;  )    x
1  e x0

P( X  3)  1  P( X  3)  F (3)  1  1  e 3(0.93)   e 3(0.93)  0.0614 P( X  3)  0.0614


P(1  X  3)  F (3)  F (1)  1  e3(0.93)   1  e0.93   0.333 P(1  X  3)  0.333
c. Se requiere encontrar el 90 percentil, esto es:
P( X  x)  0.90, F ( x)  0.90, 1  e 0.93 x  0.90
ln 0.10
e0.93 x  0.10,  0.93x  ln 0.10, x   2.476 x  2.476
0.93

26. Un componente tiene duración X exponencialmente distribuida con parámetro .


a. Si el costo de operación por unidad de tiempo es c, ¿cuál es el costo esperado de operar este
componente en su vida útil?
b. En lugar de un valor constante de costo c, como en el inciso (a), suponga que el costo es c (1-
0.5eax) con a > 0, de modo que el costo por unidad de tiempo es menor que c cuando el
componente es nuevo y más costoso a medida que el componente envejece. Ahora calcule el
costo esperado de operación durante la vida útil del componente.
Solución:
270

1
a. Aplicando la propiedad E(cX) = cE(X), ya que para una distribución logarítmica E ( X )  ,

c
tenemos: E (cX ) 


  

E c(1  0.5e ax )  
 0
c(1  0.5e ax ) e   x dx   c 
  0
e   x dx  0.5
 0
e  (   a ) x dx 

 1 
0.5  (   a ) x    1 0.5 
  c  e x  e    c   (0  1)  (0  1) 
b.   0  a 0
    a 
0.5c c  ca  0.5c c(0.5  a)
c  
 a  a  a
c (0.5   a )
E c(1  0.5e ax )  
 a
27. Un mecanismo de aire acondicionado funciona con base en cinco componentes independientes, y
la vida útil de cada uno sigue una distribución exponencial con parámetro   15 (en años). Para
que el mecanismo de aire acondicionado funcione se requiere que por lo menos dos de sus cinco
componentes aún sirvan. Calcule la probabilidad de que el mecanismo de aire acondicionado
continúe funcionando después de 8 años.
Solución:
1
Para una distribución exponencial con parámetro   , la función de distribución acumulada está
5
 0 x0
dada por: F ( x;  )    x
, entonces:
1  e x0

P( X  8)  1  P( X  8)  1  F 8; 15   1  1  e 5   e8 5  0.2019 , con esta probabilidad,


8
 
se tiene ahora una distribución binomial b(x; 5, 0.2019)y la probabilidad requerida es:
P( X  2)  1  P( X  2)  1  B(1;5,0.2019)  1  0.73338  0.2666
Por tanto la probabilidad de que siga funcionando después de 8 años es = 0.2666

28. Según un reporte del periódico Uno Más Uno (octubre de 1998), muchos funcionarios y servidores
públicos del gobierno mexicano ocupan la mayoría de sus horas de trabajo haciendo llamadas
telefónicas personales. Suponga que la duración de las conferencias telefónicas personales de una
funcionaria de la Secretaria de Gobernación es una variable aleatoria X que sigue una distribución
exponencial, con parámetro  = 0.012 (en minutos). Calcule:
a. La duración promedio de una conversación telefónica de esta funcionaria.
b. La desviación estándar de la duración de una llamada.
c. La probabilidad de que una conversación telefónica dura más de 50 minutos.
d. La probabilidad de que dure a lo sumo 30 minutos.

Solución:
1 1
a. Para una distribución exponencial E ( X )    , V (X )   2  y la fda. Es:
 2
 0 x0 1
F ( x;  )    x
, entonces: E ( X )   83.33 E ( X )  83.33 minutos
1  e x0 0.012
271

1
b. V ( X )   6944.444,  X  V ( X )  6944.444  83.33  X  83.33
(0.012)2
c. P( X  50)  1  P( X  50)  1  1  e(0.012)50   0.5488 P( X  50)  0.5488
 (0.012)30
d. P( X  30)  F (30;0.012)  1  e  1  0.6977  0.3023 P( X  30)  0.3023

29. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que presentaran un
examen de termodinámica, de manera individual. Para cualquiera de ellos se estima que el tiempo
promedio de solución del examen es de 1h 20 min y además la distribución del tiempo se asume
que es exponencial. Si el examen inició a las 9:00 a.m., calcule la probabilidad de que:
a. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
b. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso comprendido entre las
9:50 y 10:00 a.m.
c. Determine el número más probable de estudiantes que terminaran el examen antes de las 10:10
a.m.
d. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado para el
tiempo de solución de un examen?
Solución:
1 1
a. Como  = 1h 20 min = 80 min y E ( X )    , entonces   0.0125 y la probabilidad
 80
deseada será:
P( X  40)  1  e(0.0125)40  1  0.6065  0.39347 P( X  40)  0.39347 , con esta probabilidad
se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la probabilidad
pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:
P(Y  1)  1  P(Y  1)  1  B(0;5,0.39347)  1  0.08208  0.9179 P(Y  1)  0.9171
b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:

P(50  X  60)  F (60;0.0125)  F (50;0.0125)  1  e(0.0125)60   1  e (0.0125)50   0.062895


Con esta probabilidad calculamos la probabilidad binomial correspondiente:
P(2  Y  4)  B(4;5,0.062895)  B(1;5,0.062895)
 0.99999  0.96518  0.03481 P(2  Y  4)  0.03481
c. Calculamos primero la probabilidad de que uno termine antes de 70 min.
P( X  70)  1  e(0.0125)70  0.58314 . Para la distribución binomial E(Y) =np
E(Y) = 5(0.58314) = 2.91 3, entonces lo más probable es que terminen 3 antes de 10: 10

d. La hipótesis exponencial sería un modelo adecuado sólo si se trata de un examen demasiado


fácil o para alumnos que estudiaron. En términos generales, para un examen fácil el modelo
apropiado es una distribución con sesgo positivo como la gamma o ji- cuadrada y para un
examen difícil o con límite máximo de entrega, los modelos mas apropiados son los de
distribuciones con sesgo negativo como la distribución beta.

Distribución Lognormal

2. Sea X = la mediana de la potencia horaria (en decibelios) de señales de radio que se transmiten y
reciben entre dos ciudades. Los autores del artículo “Families of Distributions for Hourly Median
Power and Instantaneous Power of Received Radio Signals” (J. Research Natinal Bereau of
Standars, vol. 67D, 1963, pp. 753 – 762) argumentan que la distribución lognormal es un modelo
272

de probabilidad razonable para X. Si los valores de los parámetros son  = 3.5 y  = 1.2, calcule
lo siguiente:
a. El valor medio y la desviación estándar de la potencia recibida.
b. La probabilidad de que la potencia recibida esté entre 50 y 250 dB.
c. La probabilidad de que X sea menor que su valor medio. ¿Por qué esa probabilidad no es 0.5?
Solución:

d. Para una distribución lognormal E ( X )  e


 ,
  2
2

V ( X )  e2   (e  1) y con  = 3.5 y 


2 2

= 1.2

E( X )  e

3.5 1.2
2
2   e4.22  68.0335 E ( X )  68.0335
V (X )  e 7 1.44
(e 1.44
 1)  14907.167,  X  V ( X ),  X  14907.167  122.095
 ln 50  3.5 ln 250  3.5 
P(50  X  250)  P  Z    (1.684)  (0.343)
e.  1.2 1.2 
 0.9535  0.6331  0.3204 P(50  X  250)  0.3204
 ln 68.0335  3.5 
f. P( X  68.0335)  P  Z    (0.60)  0.757 P( X  68.0335)  0.757
 1.2 
Esta probabilidad no es 0.5 porque la distribución lognormal no es simétrica

3. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de fundamento
a la suposición de que la resistencia a la ductilidad X de un material tiene una distribución
lognormal. Suponga que los parámetros son  = 5 y  = 0.1
a.Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana de la ductilidad?
e. Si diez muestras diferentes de una aleación de acero de ese tipo se someten a una prueba de
resistencia, ¿cuántas debería esperarse que tuvieran resistencia de por lo menos 120?
f. Si fueran 5% de los valores más pequeños de resistencia inaceptables, ¿cuál sería la resistencia
mínima aceptable?
Solución:
a. Para una distribución lognormal E ( X )  e
 ,
  2
2

V ( X )  e2   (e  1) y con  = 5 y  =
2 2

0.1

E( X )  e

5 0.1
2
2   e5.005  149.157 E ( X )  149.157
10  0.001
V (X )  e (e 0.001
 1)  223.594, V ( X )  223.594
 ln120  5 
P( X  120)  1  P( X  120)  1  P  Z  
b.  0.1 
 1  (2.125)  1  0.0168  0.9832 P( X  120)  0.9832

 ln110  5 ln130  5 
P(110  X  130)  P  Z    (1.324)  (2.995)
c.  0.1 0.1 
 0.0934  0.0014  0.092 P(110  X  300)  0.092

d.   e ,   e5  148.41  =148.41
273

e. P(X > 120) =0.9832. Para n = 10 y p = 0.9832, E(X) = np E(X) = 9.832

f. Se requiere el 5 percentil de la distribución, por tanto:

 ln x  5  ln x  5
P Z    0.05, (1.645)  0.05,   1.645, despejando a x,
 0.1  0.1
ln x  (1.645)(0.1)  5, ln x  4.8355, x  e4.8355  125.9 x  125.9

4. El artículo “The Statistics of Phytotoxic Air Pollutants” (J. Royal Stat. Soc., 1989, pp. 183 – 198)
sugiere la distribución lognormal como un modelo para la concentración de SO2, sobre cierto
bosque. Suponga que los parámetros son  = 1.9 y  = 0.9.
a. ¿Cuáles son el valor medio y la desviación estándar de la concentración?
b. ¿Cuál es la probabilidad de que la concentración sea a lo sumo 10? ¿Entre 5 y 10?
Solución:
a. Para una distribución lognormal E ( X )  e
 ,
  2
2

V ( X )  e2   (e  1) y con  = 1.9 y


2 2

 = 0.9
2
1.9  (0.9)
E( X )  e 2
 10.024 E ( X )  10.024
V ( X )  e3.9 (0.9) (e(0.9)  1)  125.395,  X  125.395  11.2  X  11.2
2 2

 ln10  1.9 
P( X  10)  P  Z    (0.45)  0.6736 P( X  10)  0.6736
 0.9 
 ln 5  1.9 ln10  1.9 
b. P(5  X  10)  P  Z    (0.45)  (0.32)
 0.9 0.9 
 0.6736  0.3745  0.2991 P(5  X  10)  0.2991

5. Se sabe que la tasa promedio de uso de agua (miles de litros por hora) en cierta comunidad implica
una distribución logarítmica normal con parámetros  = 5 y  = 2.5 Es importante para propósitos
de planeación obtener una apreciación de los períodos de alta utilización.
a. ¿Cuál es la probabilidad de que para cualquier hora dada, se usen a lo sumo 50 000 litros de
agua?
b. ¿Cuál es la probabilidad de que se usen entre 30 000 y 50 000?
c. ¿Cuál es el valor esperado de litros de agua que se usan en cualquier hora dada?
d. En un período de 15 horas, ¿Durante cuantas horas se esperaría que se usaran a lo sumo 10
000?
Solución:
 ln 50000  5 
a. P( X  50000)  P  Z    (2.3279)  0.9901 P( X  50000)  0.9901
 2.5 

 ln 30000  5 ln 50000  5 
P(30000  X  50000)  P  Z    (2.3279)  (2.1236)
b.  2.5 2.5 
 0.9901  0.983  0.0071 P(30000  X  50000)  0.0071
274

 ln10000  5 
c. P( X  10000)  P  Z    (1.684)  0.954 .Con n = 15 y p = 0.954, el valor
 2.5 
esperado E(X) = np, por tanto E(X) = 15(0.954) = 14.3 E(X) = 14.3 horas

Distribución Weibull

1. La vida útil X (en cientos de horas) de cierto tipo de tubos al vacío tiene una distribución de
Weibull con parámetros  = 2 y  = 3. Calcule lo siguiente:
a. E(X) y V(X)
b. P(X  6)
c. P(5  X  6)
(Esta distribución Weibull está sugerida como modelo para el tiempo de servicio en “On the
Assessment of Equipment Reliability: Trading Data Collection Costs for Precision”, J. Engr,
.Manuf., 1991,pp. 105 – 109)

Solución:
a. Para una distribución Weibull las funciones de densidad de probabilidad y la función de
distribución acumulada son:
   1  x  

 x e x0
f ( x; ,  )    
 x0
 0
 0 x0

F ( x; ,  )  
1  e    x  0

 x

 1 
2  2   1   
2

    1   2
  
       
    
, 1 1
          
 1 3 1 1 3
E ( X )    3 1    3    3         2.659 E ( X )  2.659
 2  2  2  2 2
   3  
2
 1  
2

V ( X )    3 (2)        9 1  
2 2
    9(1  0.7854)  1.93 V ( X )  1.93
   2      2  
 
2
 6
b. P( X  6)  F (6;2,3)  1  e 3  1  e4  0.9817 P( X  6)  0.9817
 1.5  
2

P(1.5  X  6)  F (6;2,3)  F (1.5;2,3)  0.9817  1  e 3 


c.  
 0.9817  0.2212  0.7605 P(1.5  X  6)  0.7605

2. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical
Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522) expresan que la distribución de
Weibull se utiliza ampliamente en problemas de estadística relacionados con la obsolescencia de
materiales aislantes sólidos sujetos a envejecimiento y esfuerzo. Proponen el uso de la distribución
como modelo para el tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos a
un voltaje de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga 
= 2.5 y  = 200 (los datos de este artículo indican estos valores).
a. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200? ¿Menos de
200? ¿Mas de 300?
275

b. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
c. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que exceden ese
valor?
Solución:
 

 
2.5
 x  x
F ( x; ,  )  1  e  , en este caso: F ( x;2.5, 200)  1  e 200

   1  e 1  0.632
2.5
 200
P( X  200)  1  e 200
P( X  200)  0.632
a. P( X  200)  0.632, ya que es una distribución de probabilidad continua
P( X  300)  1  P( X  300)  1  F (300;2.5, 200)
  300
 200  
2.5
2.7556
 1  1  e e  0.06357 P( X  300)  0.06357
 

P(100  X  200)  F (200;2.5, 200)  F (100;2.5, 200)


 100  
2.5
b.
 0.632  1  e 200   0.632  (1  0.8379)  0.470 P(100  X  200)  0.470
 
c. En este caso se requiere el valor de la mediana, esto es: F ( )  0.50
   0.5, 0.5  e x 200 , ln(0.5)    x 
2.5 2.5 2.5
 x
1 e 200
 
200  
2.5
x 2
ln(0.5)   , x 2.5  392103.2574, x  (392103.2574) 5
 172.3 x  172.3
2002.5

2. Suponga que la vida de servicio, en años, de la batería de un aparato para sordos es una variable
aleatoria que tiene una distribución de Weibull con  = 2 y  = 2.
a. ¿Cuánto se puede esperar que dure la batería?
b. ¿Cuál es la probabilidad de que tal batería esté en operación después de 2 años?

Solución:
 x 

 1
a. Para  = 2 y  = 2,     1   , F ( x; ,  )  1  e  , entonces:
 
 1  1 1 1
E ( X )      1   , E ( X )  2 1    2        E ( X )  1.77
    2   2  2
  2  
2

b. P( X  2)  1  P( X  2)  1  F (2;2,2)  1  1  e 2   e1  0.3679 P( X  2)  0.3679


 

3. Sea X la resistencia a la tensión (ksi) a – 200ºC de un espécimen de acero de acero de cierto tipo
que exhibe “fragilidad en frío” a bajas temperaturas. Suponga que X tiene una distribución de
Weibull con  = 20 y  = 100.

a. ¿Cuál es la probabilidad de que X sea a lo sumo 105 ksi?


b. ¿Cuál es la probabilidad de que la resistencia se encuentre entre 100 y 105 ksi?
c. ¿Cuál es la mediana de la distribución de resistencia?

Solución:
   1  0.70418  0.929
20
 105
a. P( X  105)  F (105;20,100)  1  e 100
P( X  105)  0.929
276

 100  
20

P(100  X  105)  F (105;20,100)  F (100;20,100)  0.929  1  e 100 


b.  
1
 0.929  (1  e )  0.297 P(100  X  105)  0.297

    
100 
    
20
20 20

0.5  1  e 100  , 0.5  e , ln(0.5)     ,  100  ln(0.5)    


20 20

c.    100 
1
   (100)20 ln(0.5)  20
 98.18   98.18

4. En el artículo “Response of SiCf /Si3N4 Composites Under Static and Cyclic Loading – An
Experimental and Statistical Analysis” (J. Engr. Materials and Technology, 1997: 186 – 193) se
sugiere que la resistencia a la tensión en MPa de materiales compuestos bajo las condiciones
especificadas se puede modelar mediante una distribución de Weibull con  = 9 y  = 180.
a. Trace la gráfica de función de distribución acumulada.
b. ¿Cuál es la probabilidad de que la resistencia de un espécimen seleccionado al azar sea mayor
de 175? ¿De que esté entre 150 y 175?
c. Si se escogen al azar dos especímenes y sus resistencias son independientes entre sí, ¿cuál es
la probabilidad de que al menos uno tenga resistencia entre 150 y 175?
d. ¿Qué valor de resistencia separa al 10% más débil de especímenes del 90% restante?

Solución:
 x 

 1
a. Para  = 9 y  = 180,     1   , F ( x; ,  )  1  e

, entonces:
 

 175  
9

P( X  175)  1  P( X  175)  1  F (175;9,180)  1  1  e 180 


b.  
0.776
e  0.4602 P( X  175)  0.4602
 175    150  
9 9

P(150  X  175)  F (175;9,180)  F (150;9,180)  1  e 180   1  e 180 


   
0.1938 0.776
e e  0.3636 P(150  X  175)  0.3636

d. Sea Y = {uno de las especímenes tiene resistencia a la tensión entre 150 y 175}
P(Y  1) = 1 P(Y < 1) = 1- P(Y = 0), P(Y  1) = 1 (1- 0.3636)2 = 0.5950
P(Y  1) = 0.5950
e. Se requiere hallar el 10 percentil, esto es:
277

   0.10, ln(0.90)    x 
9 9
 x
F ( x;9,180)  0.10, 1  e 180
 
 180 
x    180  ln(0.90)   2.0899  10 ,  x  140.178
9 9 19
 
278

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS


CONTINUAS

32. El artículo “ Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr., 1995, pp.
785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en un reactor se distribuye
normalmente con  = 0.30 y  = 0.06.
d. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
e. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
f. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de concentración?
Solución:
x
a. Para una distribución normal con  = 0.30 y  = 0.06, la va Z  , y la probabilidad pedida

es:
 0.25  0.30   0.25  0.30 
P( X  0.25)  P  Z   1 P Z    1  (0.833)
 0.06   0.06 
P( X  0.25)  1  0.2033  0.7967 P( X  0.25)  0.7967
 0.10  0.30 
b. P( X  0.10)  P  Z    (3.333)  0.0004 P( X  0.10)  0.0004
 0.06 
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son mas grandes),
el 95 percentil de la distribución normal estándar es 1.645, entonces:
 c  0.30  c  0.30
P Z    0.95, (1.645)  0.95   1.645
 0.06  0.06
despejando a c, c  1.645(0.06)  0.30  0.3987 c  0.3987mg/cm3

33. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una de las
siguientes probabilidades usando la aproximación normal (con la corrección de continuidad) para
los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades exactas calculadas de la tabla
correspondiente.
g. P(15 ≤ X ≤ 20)
h. P(X ≤ 15)
i. P(20 ≤ X)
Solución:
a. La aproximación normal para una binomial está dada por:
 x  0.5  np 
P( X  x)  B( x; n, p)     , cuando np  10 y np  10 , para p = 0.5, 0.6 y 0.8
 npq 

tenemos:  = np y   npq
p 0.5 0.6 0.8
 12.5 15.0 20.0
 2.5 2.45 2.0
 15  0.5  12.5 20  0.5  12.5 
P(15  X  20)  P  Z    (3.2)  (0.8)  0.2112
 2.5 2.5 
 15  0.5  15 20  0.5  15 
P(15  X  20)  P  Z    (2.24)  ( 0.204)  0.5668
 2.45 2.45 
 15  0.5  20 20  0.5  20 
P(15  X  20)  P  Z    (0.25)  (2.75)  0.5957
 2.0 2.0 
279

Usando tablas de distribución binomial, tenemos:

P(15  X  20)  B(20;25,0.5)  B(14;25,0.5)  0.99954  0.78782  0.21172


P(15  X  20)  B(20;25,0.6)  B(14;25,0.6)  0.99053  0.41422  0.57631
P(15  X  20)  B(20;25,0.8)  B(14;25,0.8)  0.57932  0.00555  0.57377
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.21172 0.2112
0.6 0.57631 0.5668
0.8 0.57377 0.5957

 15  0.5  12.5 
P( X  15)  P  Z     (1.2)  0.8849
 2.5 
 15  0.5  15 
b. P( X  15)  P  Z     (0.204)  0.5808
 2.45 
 15  0.5  20 
P( X  15)  P  Z     (2.25)  0.01222
 2.0 
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X  15)  B(15;25,0.5)  0.8852
P( X  15)  B(15;25,0.6)  0.5754
P( X  15)  B(15;25,0.8)  0.0173
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.8852 0.8849
0.6 0.5754 0.5808
0.8 0.0173 0.0122

 19.5  12.5 
P( X  20)  1  P( X  20)  1  P  Z    1  (2.8)  1  0.99744  0.00256
 2.5 
 19.5  15 
c. P( X  20)  1  P( X  20)  1  P  Z    1  (1.837)  1  0.9669  0.0331
 2.45 
 19.5  20 
P( X  20)  1  P( X  20)  1  P  Z    1  ( 0.25)  1  0.40129  0.5987
 2.0 
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X  20)  1  P( X  20)  1  B(19;25,0.5)  1  0.99790  0.0021
P( X  20)  1  P( X  20)  1  B(19;25,0.6)  1  0.97064  0.0293
P( X  20)  1  P( X  20)  1  B(19;25,0.8)  1  0.38331  0.6167
Haciendo la comparación:
280

Probabilidades Distr. binomial Aprox. normal


0.5 0.0021 0.00256
0.6 0.0293 0.0331
0.8 0.6167 0.5987

34. La distribución de resistencia para resistores de cierto tipo es normal, 10% de los resistores tienen
una resistencia que excede los 10.256 ohms y 5% una resistencia menor de 9.671 ohms. ¿Cuáles
son los valores de la media y la desviación estándar de la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
 10.256     9.671   
P Z    0.90 y P  Z    0.05,
     
10.256   9.671  
(1.28)  0.90 y (1.645)  0.05, entonces:  1.28,  1.645
 
Obtenemos las ecuaciones: 1.28    10.256 y  1.645    9.671
resolviendo el sistema tenemos:10.256  1.28  9.671  1.645 , 2.925  0.585
  0.2   10
4. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de vida útil, la
duración X (en semanas) tiene una distribución gamma con media de 24 semanas y desviación
estándar de 12 semanas.
e. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
f. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas? ¿Es la mediana de la
distribución de duración menor de 24 semanas? ¿Por qué sí o porqué no?
g. ¿Cuál es el 99avo percentil de la distribución de duración?
h. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es tal que solo
la mitad del 1% de todos lo transistores estarán funcionando al terminar la prueba?
Solución:
e. Para una distribución gamma E( X )     , V ( X )   2   2 , entonces:
24
  24,  2  144, despejando  ,   , sustituyendo en la otra ecuación

2
 24  576 24
   144,  144 y   4,   6
   4
Teniendo los valores de  = 4 y  = 6, calculamos las probabilidades pedidas
 24   12 
P(12  X  24)  F  , 4   F  , 4   F (4, 4)  F (2, 4)  0.567  0.143
 6  6 
P(0.5  X  1.5)  0.424
f. P( X  24)  F (4,4)  0.567 P( X  24)  0.567
Del resultado obtenido se deduce que P( X   )  0.5    24 . Esto se debe al sesgo
positivo de la distribución gamma.
x  x
g. P( X  x)  0.99, F  ,4   0.99, F (10,4)  0.99,   10, x  60
6  6
El 99 percentil = 60
h. Para 1% = 0.01, la mitad es 0.005, entonces:
281

t  t
P( X  t )  0.995, F  ,4   0.995, F (11,4)  0.995,   11, t  66
6  6

5. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo Method”
(Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución exponencial, con
parámetro  = 0.93, como modelo para la distribución de la longitud (m) de la trayectoria libre
de un fotón bajo ciertas circunstancias. Suponga que el modelo es correcto.
d. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la longitud
de la trayectoria?
e. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es la
probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
f. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro  =0.93
1 1 1 1
E ( X )    , V ( X )   2  2 , así:    1.075,    1.075  =  = 1.075
  0.93 
 0 x0
b. Usando la fda F ( x;  )    x
1  e x0

P( X  3)  1  P( X  3)  F (3)  1  1  e 3(0.93)   e 3(0.93)  0.0614 P( X  3)  0.0614


P(1  X  3)  F (3)  F (1)  1  e3(0.93)   1  e0.93   0.333 P(1  X  3)  0.333
c. Se requiere encontrar el 90 percentil, esto es:
P( X  x)  0.90, F ( x)  0.90, 1  e 0.93 x  0.90
ln 0.10
e0.93 x  0.10,  0.93x  ln 0.10, x   2.476 x  2.476
0.93

6. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que presentaran un
examen de termodinámica, de manera individual. Para cualquiera de ellos se estima que el tiempo
promedio de solución del examen es de 1h 20 min y además la distribución del tiempo se asume
que es exponencial. Si el examen inició a las 9:00 a.m., calcule la probabilidad de que:
e. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
f. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso comprendido entre las
9:50 y 10:00 a.m.
g. Determine el número más probable de estudiantes que terminaran el examen antes de las 10:10
a.m.
h. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado para el
tiempo de solución de un examen?
Solución:
1 1
a. Como  = 1h 20 min = 80 min y E ( X )    , entonces   0.0125 y la probabilidad
 80
deseada será:
P( X  40)  1  e(0.0125)40  1  0.6065  0.39347 P( X  40)  0.39347 , con esta probabilidad
se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la probabilidad
pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:
P(Y  1)  1  P(Y  1)  1  B(0;5,0.39347)  1  0.08208  0.9179 P(Y  1)  0.9171
b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:
282

P(50  X  60)  F (60;0.0125)  F (50;0.0125)  1  e(0.0125)60   1  e (0.0125)50   0.062895


Con esta probabilidad calculamos la probabilidad binomial correspondiente:
P(2  Y  4)  B(4;5,0.062895)  B(1;5,0.062895)
 0.99999  0.96518  0.03481 P(2  Y  4)  0.03481
c. Calculamos primero la probabilidad de que uno termine antes de 70 min.
P( X  70)  1  e(0.0125)70  0.58314 . Para la distribución binomial E(Y) =np
E(Y) = 5(0.58314) = 2.91 3, entonces lo más probable es que terminen 3 antes de 10: 10
d. La hipótesis exponencial sería un modelo adecuado sólo si se trata de un examen demasiado fácil
o para alumnos que estudiaron. En términos generales, para un examen fácil el modelo apropiado
es una distribución con sesgo positivo como la gamma o ji- cuadrada y para un examen difícil o
con límite máximo de entrega, los modelos mas apropiados son los de distribuciones con sesgo
negativo como la distribución beta.

7. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de fundamento
a la suposición de que la resistencia a la ductilidad X de un material tiene una distribución
lognormal. Suponga que los parámetros son  = 5 y  = 0.1
a. Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana de la ductilidad?
 ln120  5 
P( X  120)  1  P( X  120)  1  P  Z  
g.  0.1 
 1  (2.125)  1  0.0168  0.9832 P( X  120)  0.9832

 ln110  5 ln130  5 
P(110  X  130)  P  Z    (1.324)  (2.995)
h.  0.1 0.1 
 0.0934  0.0014  0.092 P(110  X  300)  0.092

i.   e ,   e5  148.41  =148.41

j. P(X > 120) =0.9832. Para n = 10 y p = 0.9832, E(X) = np E(X) = 9.832

k. Se requiere el 5 percentil de la distribución, por tanto:

 ln x  5  ln x  5
P Z    0.05, (1.645)  0.05,   1.645, despejando a x,
 0.1  0.1
ln x  (1.645)(0.1)  5, ln x  4.8355, x  e4.8355  125.9 x  125.9

8. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical
Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522) expresan que la distribución de
Weibull se utiliza ampliamente en problemas de estadística relacionados con la obsolescencia de
materiales aislantes sólidos sujetos a envejecimiento y esfuerzo. Proponen el uso de la distribución
como modelo para el tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos
a un voltaje de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
 = 2.5 y  = 200 (los datos de este artículo indican estos valores).
283

d. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200? ¿Menos de
200? ¿Mas de 300?
e. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
f. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que exceden ese
valor?
Solución:
 

 
2.5
 x  x
F ( x; ,  )  1  e , en este caso: F ( x;2.5, 200)  1  e 200

   1  e 1  0.632
2.5
 200
P( X  200)  1  e 200
P( X  200)  0.632
a. P( X  200)  0.632, ya que es una distribución de probabilidad continua
P( X  300)  1  P( X  300)  1  F (300;2.5, 200)
  300
 200  
2.5
2.7556
 1  1  e e  0.06357 P( X  300)  0.06357
 

P(100  X  200)  F (200;2.5, 200)  F (100;2.5, 200)


 100  
2.5
b.
 0.632  1  e 200   0.632  (1  0.8379)  0.470 P(100  X  200)  0.470
 
c. En este caso se requiere el valor de la mediana, esto es: F ( )  0.50
   0.5, 0.5  e x 200 , ln(0.5)    x 
2.5 2.5 2.5
 x
1 e 200
 
200  
2.5
x 2
ln(0.5)   , x 2.5  392103.2574, x  (392103.2574) 5
 172.3 x  172.3
2002.5
284

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS


CONTINUAS

35. El artículo “ Reliability of Domestic – Waste Biofilms Reactors” (J. of Envir. Engr., 1995, pp.
785 -790) sugiere que la concentración de sustrato, en mg/cm3, de fluido en un reactor se distribuye
normalmente con  = 0.30 y  = 0.06.
g. ¿Cuál es la probabilidad de que la concentración sea mayor de 0.25?
h. ¿Cuál es la probabilidad de que la concentración sea a lo sumo de 0.10?
i. ¿Cómo caracterizaría usted al 5% más grande de todos los valores de concentración?
Solución:
x
a. Para una distribución normal con  = 0.30 y  = 0.06, la va Z  , y la probabilidad pedida

es:
 0.25  0.30   0.25  0.30 
P( X  0.25)  P  Z   1 P Z    1  (0.833)
 0.06   0.06 
P( X  0.25)  1  0.2033  0.7967 P( X  0.25)  0.7967
 0.10  0.30 
b. P( X  0.10)  P  Z    (3.333)  0.0004 P( X  0.10)  0.0004
 0.06 
c. Queremos el valor c de la distribución que es el 95 percentil (5% de los valores son mas grandes),
el 95 percentil de la distribución normal estándar es 1.645, entonces:
 c  0.30  c  0.30
P Z    0.95, (1.645)  0.95   1.645
 0.06  0.06
despejando a c, c  1.645(0.06)  0.30  0.3987 c  0.3987mg/cm3

36. Suponga que X tiene una distribución binomial con parámetro n = 25 y p. Calcule una de las
siguientes probabilidades usando la aproximación normal (con la corrección de continuidad) para
los casos p = 0.5, 0.6 y 0.8 y compárelas con las probabilidades exactas calculadas de la tabla
correspondiente.
j. P(15 ≤ X ≤ 20)
k. P(X ≤ 15)
l. P(20 ≤ X)
Solución:
a. La aproximación normal para una binomial está dada por:
 x  0.5  np 
P( X  x)  B( x; n, p)     , cuando np  10 y np  10 , para p = 0.5, 0.6 y 0.8
 npq 

tenemos:  = np y   npq
p 0.5 0.6 0.8
 12.5 15.0 20.0
 2.5 2.45 2.0
 15  0.5  12.5 20  0.5  12.5 
P(15  X  20)  P  Z    (3.2)  (0.8)  0.2112
 2.5 2.5 
 15  0.5  15 20  0.5  15 
P(15  X  20)  P  Z    (2.24)  ( 0.204)  0.5668
 2.45 2.45 
 15  0.5  20 20  0.5  20 
P(15  X  20)  P  Z    (0.25)  (2.75)  0.5957
 2.0 2.0 
285

Usando tablas de distribución binomial, tenemos:

P(15  X  20)  B(20;25,0.5)  B(14;25,0.5)  0.99954  0.78782  0.21172


P(15  X  20)  B(20;25,0.6)  B(14;25,0.6)  0.99053  0.41422  0.57631
P(15  X  20)  B(20;25,0.8)  B(14;25,0.8)  0.57932  0.00555  0.57377
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.21172 0.2112
0.6 0.57631 0.5668
0.8 0.57377 0.5957

 15  0.5  12.5 
P( X  15)  P  Z     (1.2)  0.8849
 2.5 
 15  0.5  15 
b. P( X  15)  P  Z     (0.204)  0.5808
 2.45 
 15  0.5  20 
P( X  15)  P  Z     (2.25)  0.01222
 2.0 
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X  15)  B(15;25,0.5)  0.8852
P( X  15)  B(15;25,0.6)  0.5754
P( X  15)  B(15;25,0.8)  0.0173
Haciendo la comparación:

Probabilidades Distr. binomial Aprox. normal


0.5 0.8852 0.8849
0.6 0.5754 0.5808
0.8 0.0173 0.0122

 19.5  12.5 
P( X  20)  1  P( X  20)  1  P  Z    1  (2.8)  1  0.99744  0.00256
 2.5 
 19.5  15 
c. P( X  20)  1  P( X  20)  1  P  Z    1  (1.837)  1  0.9669  0.0331
 2.45 
 19.5  20 
P( X  20)  1  P( X  20)  1  P  Z    1  ( 0.25)  1  0.40129  0.5987
 2.0 
Los valores para las probabilidades, usando tablas de distribución binomial son:
P( X  20)  1  P( X  20)  1  B(19;25,0.5)  1  0.99790  0.0021
P( X  20)  1  P( X  20)  1  B(19;25,0.6)  1  0.97064  0.0293
P( X  20)  1  P( X  20)  1  B(19;25,0.8)  1  0.38331  0.6167
Haciendo la comparación:
286

Probabilidades Distr. binomial Aprox. normal


0.5 0.0021 0.00256
0.6 0.0293 0.0331
0.8 0.6167 0.5987

37. La distribución de resistencia para resistores de cierto tipo es normal, 10% de los resistores tienen
una resistencia que excede los 10.256 ohms y 5% una resistencia menor de 9.671 ohms. ¿Cuáles
son los valores de la media y la desviación estándar de la distribución de resistencia?
Solución:
Hallando el 90 percentil y el 5 percentil, se tendrán dos ecuaciones, esto es:
 10.256     9.671   
P Z    0.90 y P  Z    0.05,
     
10.256   9.671  
(1.28)  0.90 y (1.645)  0.05, entonces:  1.28,  1.645
 
Obtenemos las ecuaciones: 1.28    10.256 y  1.645    9.671
resolviendo el sistema tenemos:10.256  1.28  9.671  1.645 , 2.925  0.585
  0.2   10
6. Suponga que cuando un transistor de cierto tipo se somete a una prueba acelerada de vida útil, la
duración X (en semanas) tiene una distribución gamma con media de 24 semanas y desviación
estándar de 12 semanas.
i. ¿Cuál es la probabilidad de que un transistor dure entre 12 y 24 semanas?
j. ¿Cuál es la probabilidad de que un transistor dure a lo sumo 24 semanas? ¿Es la mediana de la
distribución de duración menor de 24 semanas? ¿Por qué sí o porqué no?
k. ¿Cuál es el 99avo percentil de la distribución de duración?
l. Suponga que la prueba en realidad termina después t semanas ¿qué valor de t es tal que solo
la mitad del 1% de todos lo transistores estarán funcionando al terminar la prueba?
Solución:
i. Para una distribución gamma E( X )     , V ( X )   2   2 , entonces:
24
  24,  2  144, despejando  ,   , sustituyendo en la otra ecuación

2
 24  576 24
   144,  144 y   4,   6
   4
Teniendo los valores de  = 4 y  = 6, calculamos las probabilidades pedidas
 24   12 
P(12  X  24)  F  , 4   F  , 4   F (4, 4)  F (2, 4)  0.567  0.143
 6  6 
P(0.5  X  1.5)  0.424
j. P( X  24)  F (4,4)  0.567 P( X  24)  0.567
Del resultado obtenido se deduce que P( X   )  0.5    24 . Esto se debe al sesgo
positivo de la distribución gamma.
x  x
k. P( X  x)  0.99, F  ,4   0.99, F (10,4)  0.99,   10, x  60
6  6
El 99 percentil = 60
l. Para 1% = 0.01, la mitad es 0.005, entonces:
287

t  t
P( X  t )  0.995, F  ,4   0.995, F (11,4)  0.995,   11, t  66
6  6

7. El artículo “Determination of the MFP of Positive Photoresists Using the Monte Carlo Method”
(Photographic Sci. and Engr., 1983, pp. 254 – 260) propone la distribución exponencial, con
parámetro  = 0.93, como modelo para la distribución de la longitud (m) de la trayectoria libre
de un fotón bajo ciertas circunstancias. Suponga que el modelo es correcto.
g. ¿Cuál es la longitud esperada de la trayectoria y cuál es la desviación estándar de la longitud
de la trayectoria?
h. ¿Cuál es la probabilidad de que la longitud de la trayectoria exceda 3.0? ¿Cuál es la
probabilidad de que la longitud de la trayectoria se encuentre entre 1.0 y 3.0?
i. ¿Cuál valor se rebasa por solo 10% en todas las longitudes de la trayectoria?
Solución:
a. Para una distribución exponencial con parámetro  =0.93
1 1 1 1
E ( X )    , V ( X )   2  2 , así:    1.075,    1.075  =  = 1.075
  0.93 
 0 x0
b. Usando la fda F ( x;  )    x
1  e x0

P( X  3)  1  P( X  3)  F (3)  1  1  e 3(0.93)   e 3(0.93)  0.0614 P( X  3)  0.0614


P(1  X  3)  F (3)  F (1)  1  e3(0.93)   1  e0.93   0.333 P(1  X  3)  0.333
c. Se requiere encontrar el 90 percentil, esto es:
P( X  x)  0.90, F ( x)  0.90, 1  e 0.93 x  0.90
ln 0.10
e0.93 x  0.10,  0.93x  ln 0.10, x   2.476 x  2.476
0.93

7. En una universidad hay un grupo de cinco estudiantes de ingeniería petrolera que presentaran un
examen de termodinámica, de manera individual. Para cualquiera de ellos se estima que el tiempo
promedio de solución del examen es de 1h 20 min y además la distribución del tiempo se asume
que es exponencial. Si el examen inició a las 9:00 a.m., calcule la probabilidad de que:
i. Por lo menos un estudiante logre terminar el examen antes de las 9:40 a.m.
j. Entre dos y cuatro estudiantes, inclusive terminen el examen en el lapso comprendido entre las
9:50 y 10:00 a.m.
k. Determine el número más probable de estudiantes que terminaran el examen antes de las 10:10
a.m.
l. ¿Considera que la hipótesis de la distribución exponencial es un modelo adecuado para el
tiempo de solución de un examen?
Solución:
1 1
a. Como  = 1h 20 min = 80 min y E ( X )    , entonces    0.0125 y la probabilidad
 80
deseada será:
P( X  40)  1  e(0.0125)40  1  0.6065  0.39347 P( X  40)  0.39347 , con esta probabilidad
se tiene ahora una distribución binomial con n = 5 y p = 0.39347, por tanto la probabilidad
pedida si Y = Nº de alumnos que terminan antes de 40 min, corresponde a:
P(Y  1)  1  P(Y  1)  1  B(0;5,0.39347)  1  0.08208  0.9179 P(Y  1)  0.9171
b. Calculamos primero la probabilidad que uno termine entre 50 y 60 minutos:
288

P(50  X  60)  F (60;0.0125)  F (50;0.0125)  1  e(0.0125)60   1  e (0.0125)50   0.062895


Con esta probabilidad calculamos la probabilidad binomial correspondiente:
P(2  Y  4)  B(4;5,0.062895)  B(1;5,0.062895)
 0.99999  0.96518  0.03481 P(2  Y  4)  0.03481
c. Calculamos primero la probabilidad de que uno termine antes de 70 min.
P( X  70)  1  e(0.0125)70  0.58314 . Para la distribución binomial E(Y) = np
E(Y) = 5(0.58314) = 2.91 3, entonces lo más probable es que terminen 3 antes de 10: 10
d. La hipótesis exponencial sería un modelo adecuado sólo si se trata de un examen demasiado fácil
o para alumnos que estudiaron. En términos generales, para un examen fácil el modelo apropiado
es una distribución con sesgo positivo como la gamma o ji- cuadrada y para un examen difícil o
con límite máximo de entrega, los modelos mas apropiados son los de distribuciones con sesgo
negativo como la distribución beta.

9. Una justificación teórica, basada en el mecanismo de falla de cierto material, sirve de fundamento
a la suposición de que la resistencia a la ductilidad X de un material tiene una distribución
lognormal. Suponga que los parámetros son  = 5 y  = 0.1
a. Calcule E(X) y V(X).
b. Calcule P(X > 120).
c. Calcule P(110 ≤ X ≤ 130).
d. ¿Cuál es el valor de la resistencia mediana de la ductilidad?
e. Si diez muestras diferentes de una aleación de acero de ese tipo se someten a una prueba de
resistencia, ¿cuántas debería esperarse que tuvieran resistencia de por lo menos 120?
f. Si fueran 5% de los valores más pequeños de resistencia inaceptables, ¿cuál sería la resistencia
mínima aceptable?
Solución:

l. Para una distribución lognormal E ( X )  e


 ,
  2
2

V ( X )  e2   (e  1) y con  = 5 y  =
2 2

0.1

E( X )  e

5 0.1
2
2   e5.005  149.157 E ( X )  149.157
10  0.001
V (X )  e (e 0.001
 1)  223.594, V ( X )  223.594

 ln120  5 
P( X  120)  1  P( X  120)  1  P  Z  
m.  0.1 
 1  (2.125)  1  0.0168  0.9832 P( X  120)  0.9832

 ln110  5 ln130  5 
P(110  X  130)  P  Z    (1.324)  (2.995)
n.  0.1 0.1 
 0.0934  0.0014  0.092 P(110  X  300)  0.092

o.   e ,   e5  148.41  =148.41

p. P(X > 120) = 0.9832. Para n = 10 y p = 0.9832, E(X) = np E(X) = 9.832

q. Se requiere el 5 percentil de la distribución, por tanto:


289

 ln x  5  ln x  5
P Z    0.05, (1.645)  0.05,   1.645, despejando a x,
 0.1  0.1
ln x  (1.645)(0.1)  5, ln x  4.8355, x  e4.8355  125.9 x  125.9

10. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical
Stresses” (IEEE Trans. On Elect. Insulation, 1985: 519 – 522) expresan que la distribución de
Weibull se utiliza ampliamente en problemas de estadística relacionados con la obsolescencia de
materiales aislantes sólidos sujetos a envejecimiento y esfuerzo. Proponen el uso de la distribución
como modelo para el tiempo (en horas) hasta que fallan especímenes aislantes sólidos sometidos
a un voltaje de CA. Los valores de los parámetros dependen del voltaje y la temperatura; suponga
 = 2.5 y  = 200 (los datos de este artículo indican estos valores).
g. ¿Cuál es la probabilidad de que la vida útil de un espécimen sea a lo sumo 200? ¿Menos de
200? ¿Mas de 300?
h. ¿Cuál es la probabilidad de que la vida útil de un espécimen esté entre 100 y 200?
i. ¿Qué valor es tal que exactamente 50% de los especímenes tienen vidas útiles que exceden ese
valor?
Solución:
a.
 

 
2.5
 x  x
F ( x; ,  )  1  e  , en este caso: F ( x;2.5, 200)  1  e 200

   1  e 1  0.632
2.5
 200
P( X  200)  1  e 200
P( X  200)  0.632
P( X  200)  0.632, ya que es una distribución de probabilidad continua
P( X  300)  1  P( X  300)  1  F (300;2.5, 200)
  300
 200  
2.5
2.7556
 1  1  e e  0.06357 P( X  300)  0.06357
 

P(100  X  200)  F (200;2.5, 200)  F (100;2.5, 200)


 100  
2.5
b.
 0.632  1  e 200   0.632  (1  0.8379)  0.470 P(100  X  200)  0.470
 
c. En este caso se requiere el valor de la mediana, esto es: F ( )  0.50
   0.5, 0.5  e x 200 , ln(0.5)    x 
2.5 2.5 2.5
 x
1 e 200
 
200  
2.5
x 2
ln(0.5)   , x 2.5  392103.2574, x  (392103.2574) 5
 172.3 x  172.3
2002.5

5. En el artículo “Response of SiCf /Si3N4 Composites Under Static and Cyclic Loading – An
Experimental and Statistical Analysis” (J. Engr. Materials and Technology, 1997: 186 – 193) se
sugiere que la resistencia a la tensión en MPa de materiales compuestos bajo las condiciones
especificadas se puede modelar mediante una distribución de Weibull con  = 9 y  = 180.
a. Trace la gráfica de función de distribución acumulada.
b. ¿Cuál es la probabilidad de que la resistencia de un espécimen seleccionado al azar sea mayor
de 175? ¿De que esté entre 150 y 175?
c. Si se escogen al azar dos especímenes y sus resistencias son independientes entre sí, ¿cuál es
la probabilidad de que al menos uno tenga resistencia entre 150 y 175?
d. ¿Qué valor de resistencia separa al 10% más débil de especímenes del 90% restante?
290

Solución:
 x 

 1
a. Para  = 9 y  = 180,     1   , F ( x; ,  )  1  e  , entonces:
 

 175  
9

P( X  175)  1  P( X  175)  1  F (175;9,180)  1  1  e 180 


b.  
0.776
e  0.4602 P( X  175)  0.4602
 175    150  
9 9

P(150  X  175)  F (175;9,180)  F (150;9,180)  1  e 180   1  e 180 


   
0.1938 0.776
e e  0.3636 P(150  X  175)  0.3636

f. Sea Y = {uno de las especímenes tiene resistencia a la tensión entre 150 y 175}
P(Y  1) = 1 P(Y < 1) = 1- P(Y = 0), P(Y  1) = 1 (1- 0.3636)2 = 0.5950
P(Y  1) = 0.5950
g. Se requiere hallar el 10 percentil, esto es:
 x
180 
9
 x 
9

F ( x;9,180)  0.10, 1  e  0.10, ln(0.90)    


 180 
x9    180  ln(0.90)   2.0899  1019 ,  x  140.178
9
 
291

REGRESION LINEAL SIMPLE Y CORRELACION


MODELO DE REGRESION LINEAL SIMPLE

1. La relación de eficiencia para un espécimen de acero sumergido en un tanque de fosfatizado es el


peso del recubrimiento de fosfato dividido entre la pérdida de metal (ambos en mg/pie 2). El
artículo “Statistical Process Control of a Phosphate Coating Line” (Wire J. Intl., mayo 1997, pp.
78 – 81) contenía los siguientes datos sobre temperatura del tanque (x) y la relación de eficiencia
(y).

Temperatura
170 172 173 174 174 175 176 177 180 180 180 180

Relación 0.84 1.31 1.42 1.03 1.07 1.08 1.04 1.42 1.45 1.60 1.61 2.13

Temperatura 180 181 181 182 182 182 182 184 184 185 186 188

Relación 2.15 0.84 1.43 0.90 1.81 1.94 2.68 1.49 2.52 3.00 1.87 3.08
a. Trace un diagrama de tallo y hojas de la temperatura y la relación de eficiencia y comente
sobre las propiedades interesantes.
b. ¿El valor de la relación de eficiencia está determinado en forma total y única por la
temperatura del tanque? Explique su razonamiento.
c. Trace un diagrama de dispersión de los datos. ¿Al parecer la relación de eficiencia se puede
predecir bien por el valor de la temperatura? Explique su razonamiento.
Solución:
a.

tallo y hoja: Temperatura tallo y hoja: Relación de eficiencia

Tallo y hoja de Temperatura Tallo y hoja de Relación N = 24


Unidad de hoja = 1.0 Unidad de hoja = 0.10

17 0 0 889
17 23 1 0000
17 445 1 3
17 67 1 44444
17 1 66
18 0000011 1 889
18 2222 2 11
18 445 2
18 6 2 5
18 8 2 6
2
3 00

Para la temperatura, el valor representativo es el 180. La distribución es razonablemente simétrica


y presenta poca dispersión, la variación en los datos es pequeña ya que 188 – 170 = 18 es pequeña
comparada con el valor representativo de 180.
Para la relación el valor representativo está alrededor de 1.4, presenta un sesgo positivo. La
variación de los datos es grande ya que 3.08 – 0.84 = 2.24 comparada con el valor representativo
de 1.4, los dos valores mayores podrían ser inusuales o atípicos.
b. La relación de eficiencia no está determinada únicamente por la temperatura ya que en
algunos casos hay datos de igual temperatura que tienen asociados valores diferentes de
relación de eficiencia. Se observa que para la temperatura de 180 hay valores de relación de
eficiencia diferentes en cada uno.
292

c. En la gráfica de dispersión los puntos presentan bastante variabilidad y no todos están muy
cercanos a una
Gráfica de dispersión de Temperatura vs.relación
línea recta o una
curva simple.
3.0

2.5
Relación de eficiencia

2.0

1.5

1.0

170 175 180 185 190


Temperatura

2. El artículo “Exhaust Emissions from Tour – Stroke Lawn Mower Engines” (J. of the Air and Water
Mgmnt. Assoc., 1997, pp. 945 – 952) presenta datos de un estudio donde se usaron una mezcla
base de gasolina y una gasolina reformulada. Examine las siguientes observaciones sobre edad
(años) y emisiones de NOx, en g/kW-h

Motor 1 2 3 4 5 6 7 8 9 10
Edad 0 0 2 11 7 16 9 0 12 4

Base 1.72 4.38 4.06 1.26 5.31 0.57 3.37 3.44 0.74 1.24

Reformulada 1.88 5.93 5.54 2.67 6.53 0.74 4.94 4.89 0.69 1.42

Trace diagramas de dispersión de las emisiones de NOx contra la edad. ¿Cuál parece ser la
naturaleza de la relación entre estas dos variables? (Nota: los autores del artículo comentaron la
relación).
293

Solución:
294

AXIOMAS, INTERPRETACIONES Y PROPIEDADES

4. Una compañía de fondo mutualista ofrece a sus clientes varios fondos diferentes: uno de
mercado de dinero, tres fondos diferentes de bonos(a corto, mediano y largo plaza), dos
de acciones (riesgo moderado y alto) y uno balanceado. Entre los clientes que poseen
acciones en uno solo de los fondos, los porcentajes de clientes en los diferentes fondos
son los siguientes:

Mercado de dinero 20% Acciones de alto riesgo 18%


Bono a corto plazo 15% Acciones de riesgo moderado 25%
Bono a mediano plazo 10% Fondo balanceado 7%
Bono a largo plazo 5%

Se selecciona al azar un cliente que tenga acciones en sólo uno de los fondos.
d. ¿Cuál es la probabilidad de que el cliente tenga acciones en el fondo balanceado?
e. ¿Cuál es la probabilidad de que el cliente tenga acciones en un fondo de bonos?
f. ¿Cuál es la probabilidad de que el cliente no tenga acciones en un fondo de acciones?

Solución

Sean los siguientes eventos:


A = {Tenga acciones en Mercado de dinero} P (A) = 0.20
B = {tenga fondo de bono a corto plazo} P (B) = 0.15
C = {tenga fondo de bono a medio plazo} P (C) = 0.10
D = {Bono a largo plazo} P (D) = 0.05
E = {Acciones de alto riesgo} P (E) = 0.18
F = {Acciones de riesgo moderado} P (F) = 0.25
G = {Fondo balanceado} P (G) = 0.07

d. P (Fondo balanceado) = P (G) = 0.07


e. P (Fondo de bonos) = P (B) + P (C) + P (D) = 0.15 + 0.10 + 0.05 = 0.30
f. P (No tenga acciones en fondo de acciones) = 1 – P (E) – P (F)
= 1 - 0.18 – 0.25 = 0.57

5. Se selecciona al azar un alumno de cierta universidad y señalamos como A el evento en


el que el individuo seleccionado tiene una tarjeta de crédito Visa y como B el evento
análogo para una MasterCard. Supongamos que P(A) = 0.5, P (B) = 0.4 y P(A  B) =
0.25.
g. Calcule la probabilidad de que el individuo seleccionado tenga al menos una de las dos
tarjetas, esto es la probabilidad del evento A  B.
h. ¿Cuál es la probabilidad de que el individuo seleccionado no tenga ninguna de esas
tarjetas?
i. Describa en términos de A y B, el evento en que el alumno seleccionado tenga una
tarjeta Visa, pero no una MasterCard, y a continuación calcule la probabilidad de este
evento.
295

Solución

d. P (A  B) = P (A) + P (B) – P (A  B)
= 0.5 + 0.4 – 0.25 = 0.65
e. Sea C = {No tenga ninguna de esas tarjetas}
P (C) = P (A  B)’ = 1- P (A  B) = 1 – 0.65 = 0.35

f. Sea D = {Se tenga una tarjeta Visa pero no una MasterCard}


D = A  B’, por tanto P (D) = P (A  B’) = P (A  B) – P (B)
= 0.65 – 0.40 = 0.25

A  B’

6. Una empresa de consultoría de computadoras ha licitado en tres proyectos. Supongamos


que Ai = {proyecto i otorgado}, para i = 1, 2, 3, y P(A1) = 0.22, P(A2) = 0.25, P(A3) =
0.28, P(A1 ∩ A2) = 0.11, P(A1 ∩ A3) = 0.05, P(A2 ∩ A3) = 0.07, P(A1 ∩ A2 ∩ A3) = 0.01.
Exprese con palabras cada uno de los siguientes eventos y calcule la probabilidad.
m. A1 ⋃ A2
n. A1’∩ A2’
o. A1 ⋃ A2 ⋃ A3
p. A’1 ∩ A’2 ∩ A’3
q. A’1 ∩ A’2 ∩ A3
r. (A’1 ∩ A’2) ⋃ A3

Solución

g. A1  A2 Se otorgue el proyecto 1 o el 2 (o ambos)


P (A1  A2) = P (A1) + P (A2) – P (A1  A2) = 0.22 + 0.25 – 0.11 = 0.36

h. A1’  A2’ = (A1  A2)’ No se otorgue el proyecto 1 ni el 2


P (A1  A2)’ = 1 - P (A1  A2) = 1 – 0.36 = 0.64

i. A1  A2  A3 Se otorgue el proyecto 1, el 2 o el 3
P (A1  A2  A3) = P (A1) + P (A2) + P (A3) – P (A1  A2) – P (A1  A3)
- P (A2  A3) + P (A1  A2  A3)
296

= 0.22 + 0.25 + 0.28 – 0.11 – 0.05 – 0.07 + 0.01 = 0.53

j. A1’  A2’  A3’ = (A1  A2)’  A3’ = (A1  A2  A3)’ No se otorgue ningún proyecto
P (A1  A2  A3)’ = 1- P (A1  A2  A3) = 1- 0.53 = 0.47

k. A1’  A2’  A3 = (A1  A2)’  A3 Solo se otorgue el proyecto 3


P (A1  A2)’= 0.64 P [(A1  A2)’  A3 = 0.17

l. (A1’  A2’)  A3 = (A1  A2)’  A3 No se otorgue el proyecto 1 o el 2, o se otorgue el


3
P [(A1  A2)’  A3 = P [(A1  A2)’ +P (A3) – P [(A1  A2)’  A3
= 0.64 + 0.28 – 0.17 = 0.75

También podría gustarte