Está en la página 1de 49

Instituto Universitario Aeronáutico

Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 1 ‡ – Estadı́stica Descriptiva
Problema 1: [1.11] Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados
de un artı́culo en Technometrics (Vol. 19, p. 425), revista dedicada a las aplicaciones estadı́sticas en
ciencias fı́sicas e ingenierı́a.

88,5 87,5 83,4 86,7 87,5 91,5 88,6 100,3 95,6 93,3 94,7 91,1 91,0 94,2 87,8 89,9
88,3 87,6 84,3 86,7 88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,3 93,4 88,5 90,1
89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8 92,3 90,4 90,1 93,0 88,7 89,9
89,8 89,6 87,4 88,9 91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6 91,1
90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2 91,2 91,0 92,2 90,0 90,7

Trace un diagrama de tallo y hojas para estos datos. ¿Por qué es relativamente fácil identificar un
valor de octanaje? ¿Revela el diagrama algunas propiedades importantes de los datos?

Problema 2: [1.12*] El conjunto de datos adjunto está formado con observaciones del gasto de agua
en regaderas (l/min) para una muestra de n = 129 casas en Perth, Australia (“An Application of
Bayes Methodology to the Analysis of Dairy Records in a Water Use Study”, J. Amer. Stat. Assoc.,
1987, pp. 705-711):

4,6 12,3 7,1 7,0 4,0 9,2 6,7 6,9 11,5 5,1
11,2 10,5 14,3 8,0 8,8 6,4 5,1 5,6 9,6 7,5
7,5 6,2 5,8 2,3 3,4 10,4 9,8 6,6 3,7 6,4
8,3 6,5 7,6 9,3 9,2 7,3 5,0 6,3 13,8 6,2
5,4 4,8 7,5 6,0 6,9 10,8 7,5 6,6 5,0 3,3
7,6 3,9 11,9 2,2 15,0 7,2 6,1 15,3 18,9 7,2
5,4 5,5 4,3 9,0 12,7 11,3 7,4 5,0 3,5 8,2
8,4 7,3 10,3 11,9 6,0 5,6 9,5 9,3 10,4 9,7
5,1 6,7 10,2 6,2 8,4 7,0 4,8 5,6 10,5 14,6
10,8 15,5 7,5 6,4 3,4 5,5 6,6 5,9 15,0 9,6
7,8 7,0 6,9 4,1 3,6 11,9 3,7 5,7 6,8 11,3
9,3 9,6 10,4 9,3 6,9 9,8 9,1 10,6 4,5 6,2
8,3 3,2 4,9 5,0 6,0 8,2 6,3 3,8 6,0

a) Construya un diagrama de tallo y hojas con los datos.


b) ¿Cuál serı́a el valor de un gasto de agua común representativo?
c) ¿Le parece que la gráfica está muy concentrada, o extendida?
d) ¿Parece que la distribución de valores es razonablemente simétrica? Si no es ası́, ¿cómo describirı́a
a la desviación a partir de la simetrı́a observada?

c
Compilado por Pedro Pury – IUA 2012

1
e) ¿Encuentra alguna observación alejada del resto de los datos (un punto inusual)?

Problema 3: [1.14] La siguiente tabla de valores corresponde a la resistencia a esfuerzos de flexión


de barras de concreto (en megapascales).

6,1 5,8 7,8 7,1 7,2 9,2 6,6 8,3 7,0 8,3
7,8 8,1 7,4 8,5 8,9 9,8 9,7 14,1 12,6 11,2

a) Construir un histograma de frecuencias absolutas, utilizando cinco intervalos de igual longitud.


Especifique como considera los extremos de los intervalos (abiertos o cerrados).

b) Calcular la mediana y los cuartiles correspondientes a estos datos muestrales

c) Construir a partir de estos datos un diagrama de caja (“box plot”). Determinar si existen valores
anómalos o atı́picos y justifique.

Problema 4: [1.17] Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50


unidades. Se seleccionó una muestra de 60 lotes y se determinó la cantidad de transductores en cada
lote que no se apegaban a las especificaciones de diseño. Se obtuvieron los siguientes datos:

2 1 2 4 0 1 3 2 0 5 3 3 1 3 2
4 7 0 2 3 0 4 2 1 3 1 1 3 4 1
2 3 2 2 8 4 5 1 3 1 5 0 2 3 2
1 0 6 4 2 1 6 0 3 3 3 6 1 2 3

a) Determine las frecuencias y frecuencias relativas para los valores observados de x = cantidad de
transductores defectuosos en un lote.
b) ¿Qué proporción de los lotes en la muestra tienen a lo más cinco transductores defectuosos?
¿Qué proporción tienen menos de cinco? ¿Qué proporción tienen al menos cinco unidades defectuosas?
c) Trace un histograma de los datos con la frecuencia relativa en el eje vertical y comente sus propie-
dades.

Problema 5: [1.23*] En un estudio de ruptura de urdiembre durante el tejido de telas (Technometrics,


1982, p. 63) se probaron 100 madejas. El número de ciclos de esfuerzo hasta la ruptura se registró para
cada muestra de madeja. La información resultante es la siguiente:

86 146 251 653 98 249 400 292 131 169


175 176 76 264 15 364 195 262 88 264
157 220 42 321 180 198 38 20 61 121
282 224 149 180 325 250 196 90 229 166
38 337 65 151 341 40 40 135 597 246
211 180 93 315 353 571 124 279 81 186
497 182 423 185 229 400 338 290 398 71
246 185 188 568 55 55 61 244 20 284
393 396 203 829 239 236 286 194 277 143
198 264 105 203 124 137 135 350 193 188

a) Trace un histograma de frecuencia relativa basado en los intervalos de clase [0, 100), [100, 200), . . .
y comente las caracterı́sticas del histograma.

2
b) Trace un histograma basado en los siguientes intervalos de clase:
[0, 50), [50, 100), [100, 150), [150, 200), [200, 300), [300, 400), [400, 500), [500, 600) y [600, 900).
Comente las propiedades del histograma.
c) Si las especificaciones de cada tejido requieren una resistencia a la ruptura de por lo menos 100
ciclos, ¿qué proporción de muestras de madeja debe considerarse satisfactoria?

Problema 6: [1.27*] La concentración de sólidos suspendidos en agua de rı́o es una caracterı́stica


ambiental importante. El artı́culo cientı́fico “Water Quality in Agricultural Watershed: Impact of
Riparian Vegetation During Base Flow” (Water Resources Bull., 1981, pp. 233-239) reportó sobre la
concentración (en partes por millón, o ppm) en varios rı́os diferentes. Supongamos que se obtuvieron
las siguientes 50 observaciones para un rı́o en particular:

55,8 60,9 37,0 91,3 65,8 42,3 33,8 60,6 76,0 69,0
45,9 39,1 35,5 56,0 44,6 71,7 61,2 61,5 47,2 74,5
83,2 40,0 31,7 36,7 62,3 47,3 94,6 56,3 30,0 68,2
75,3 71,4 65,2 52,6 58,2 48,0 61,8 78,8 39,8 65,0
60,7 77,1 59,1 49,5 69,3 69,8 64,9 27,1 87,1 66,3

a) Construya un diagrama de tallo y hoja.


b) ¿Por qué un histograma no puede basarse en los intervalos de clase
[0, 10], [10, 20], [20, 30], [30, 40], . . . , [90, 100]?
c) Construya la distribución de frecuencias relativas correspondiente a los intervalos de clase:
[20, 30), [30, 40), . . . , [90, 100).
d) ¿Qué proporción de las observaciones de concentración fue de menos de 50?, y ¿por lo menos 60?

Problema 7: [1.33] El artı́culo cientı́fico “The Pedaling Technique of Elite Endurance Cyclists” (Int.
J. Sport Biomechanics, 1991, pp. 29-53) reportó los siguientes datos sobre fuerza en una sola pierna
para carga pesada de trabajo:
244 191 160 187 180 176 174 205 211 183 211 180 194 200

a) Calcule el promedio y mediana muestrales.


b) Suponga que la primera observación fue 204 en vez de 244. ¿Cómo cambiarı́an el promedio y la
mediana?
c) Calcule un promedio recortado eliminando las observaciones mı́nima y máxima de la muestra. ¿Cuál
es el porcentaje correspondiente de recorte?
d) También, el artı́culo presenta valores de la potencia de una sola pierna para el ejercicio liviano.
El promedio muestral para n = 13 observaciones fue x̄ = 119,8 (en realidad, 119,7692), y la décimo
cuarta observación, algo apartada, fue 159. ¿Cuál es el valor de x̄ para toda la muestra?

Problema 8: [1.36*] Una muestra de 26 trabajadores de cierta plataforma marina tomaron parte en
un simulacro de evacuación (para casos de emergencia), y se obtuvieron los datos adjuntos de tiempo
(segundos) para terminar el desalojo (“Oxygen Consumption and Ventilation During Escape from a
Offshore Platform”, Ergonomics, 1997, pp. 281-292):

389 356 359 363 375 424 325 394 402


373 373 370 364 366 364 325 339 393
392 369 374 359 356 403 334 397

3
a) Trace un diagrama de tallo y hojas con los datos.
P
b) Calcule y compare los valores del promedio y la mediana muestrales. Ayuda: xi = 9638.
c) ¿Cuánto se puede aumentar el tiempo máximo, que es 424, sin que afecte el valor de la mediana
muestral? ¿Cuánto se puede disminuir ese tiempo sin que afecte dicho valor?
d) ¿Cuáles son los valores de x̄ y x̃ cuando se expresan las observaciones en minutos?

Problema 9: [1.38*] Los valores de presión sanguı́nea se reportan a veces redondeados a los 5 mm
Hg más cercanos (100, 105, 110, etc.). Suponga que los valores reales de presión sanguı́nea para nueve
individuos seleccionados al azar son: 118,8, 127,4, 138,4, 130,0, 113,7, 122,0, 108,3, 131,5, 133,2
a) ¿Cuál es la mediana de valores reportados de presión sanguı́nea?
b) Suponga que la presión del segundo individuo es 127,6 en vez de 127,4 (un pequeño cambio en
un solo valor). ¿Cómo afecta esto a la mediana de los valores reportados? ¿Qué dice ésto sobre la
sensibilidad de la mediana para redondear o agrupar los datos?

Problema 10: [1.41] Se seleccionó una muestra de N = 10 automóviles, y cada uno se sometió a
una prueba de choque a una velocidad de 5 millas por hora. Si se denota a una automóvil sin daños
visibles con S (éxito), y uno con daños por F, los resultados fueron los siguientes: S S F S S S F F
S S.
a) Si n es el número de éxitos obtenidos en la muestra, ¿cuál es el valor de la proporción muestral de
éxitos n/N ?
b) Sustituya cada S con un 1 y cada F con un 0. Luego, calcule x̄ para esta muestra numéricamente
codificada. ¿Cómo se compara x̄ con n/N ?
c) Suponga que se decide incluir 15 automóviles más en el experimento. ¿Cuántos de éstos deberı́an
ser S para obtener n/N = 0,80 en la muestra de 25 automóviles?

Problema 11: [1.45] Se determinó el valor del módulo de elasticidad, en GPa, de placas coladas,
formadas por varios sustratos intermetálicos, y se obtuvieron las siguientes observaciones muestra-
les (“Strenght and Modulus of a Molybdenum-Coated Ti25 Al10 Nb3 U1 Mo Intermetallic” Journal of
Material Engeenering and Performance, 1997, pp. 46-50): 116,4, 115,9, 114,6, 115,2, 115,8
P
a) Calcule x̄ y las desviaciones respecto al promedio: xi − x̄. Verificar que ni=1 (xi − x̄) = 0
b) Use las desviaciones que calculó en el inciso a) para obtener la varianza y la desviación estándar
muestrales.
c) Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora calcule
la varianza muestral de esos valores transformados y compárela con s2 para los datos originales.

Problema 12: [1.51*] El artı́culo “A Thin-Film Oxygen Uptake Test for the Evaluation of Automotive
Crankcase Lubricants” (Lubric. Engr., 1984, pp. 75-83) publicó los siguientes datos del tiempo de
oxidación-inducción (en minutos) de varios aceites comerciales:

87 103 130 160 180 195 132 145 211 105


145 153 152 138 87 99 93 119 129

a) Calcule a varianza muestral y la desviación estándar.


b) Si las observaciones se volvieran a expresar en horas, ¿Cuáles serı́an los valores resultantes de la
varianza muestral y la desviación estándar muestral? Conteste sin reescribir la expresión.

4
Problema 13: [1.55]

A continuación vemos un diagrama de tallo y hojas de los datos 32 55


del tiempo de evacuación mostrados en el Problema 8. 33 49
a) Determine el valor de la cuarta dispersión o rango intercuartil. 34
b) ¿Hay algunos valores atı́picos en la muestra? ¿Y algunos puntos 35 6699
36 34469
atı́picos extremos?
37 03345
c) Trace un diagrama de caja y comente sus particularidades.
38 9
d) ¿Cuánto se podrı́a disminuir la observación más grande, que por 39 2347
el momento es 424, sin que afectara el valor de la cuarta dispersión 40 23
(rango intercuartil)? 41
42 4

Problema 14: [1.57*] Se seleccionó una muestra de 20 botellas de vidrio de determinado tipo, y se
midió la resistencia de cada una a la presión interna. Examine la siguiente información parcial de la
muestra:

mediana: 202,2
Tres observaciones más pequeñas 125,8 188,1 193,7
cuarto inferior: 196,0
Tres observaciones más grandes 221,3 230,5 250,2
cuarto superior: 216,8

a) ¿Hay algunos valores atı́picos en la muestra? ¿Algunos valores atı́picos extremos?


b) Trace un diagrama de caja que muestre los valores atı́picos y comente las caracterı́sticas interesantes
que encuentre.

Problema 15: [1.61*]

6
Coeficiente de vapor de gasolina
El diagrama de caja sobre los coeficien-
70
tes de vapor de gasolina para vehı́culos de d

Detroit apareció en el artı́culo “Receptor 60


Modeling Approach to VOC Emission In-
ventory Validation” (J. of Envir. Engr., 50
1995, pp. 483–490). Describa sus propie-
dades interesantes. 40
d
30 t

20 t

10

-
6 AM 8 AM 12 AM 2 PM 10 PM tiempo

5
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 2 ‡ – Elementos de probabilidad
Problema 1: [2.3] Tres componentes se conectan para formar un sistema, como se indica en el
diagrama.

Dado que los componentes en el subsistema 2–3 están


2
conectados en paralelo, ese subsistema funcionará si,  B
 B
por lo menos, uno de los dos componentes funciona.  B
1
Pero para que funcione todo el sistema, deberá funcio- B 
B 
nar el componente 1 y simultaneamente el subsistema B 3 
2–3.
El experimento consiste en escribir una terna con la condición de cada componente, usando S (éxito)
para un componente que funciona y F (falla) para uno que no funciona.
a) ¿Cuáles resultados están contenidos en el evento A, donde funcionan exactamente dos de las tres
componentes?
b) ¿Qué resultados están contenidos en el evento B, donde al menos dos componentes funcionan?
c) ¿Qué resultados están contenidos en el evento C, donde funciona el sistema?
d) Haga una lista de los resultados en C ′ , A ∪ C, A ∩ C, B ∪ C y B ∩ C.

Problema 2: [2.9*] Utilice un diagrama de Venn para verificar las siguientes dos relaciones para
cualquiera de los eventos A y B (estas son las llamadas leyes de De Morgan).
a) (A ∪ B)′ = A′ ∩ B ′ b) (A ∩ B)′ = A′ ∪ B ′

Problema 3: [2.12] Se selecciona al azar un alumno de una universidad y señalamos como A el evento
en el que el individuo seleccionado tiene una tarjeta de crédito Visa y como B el evento análogo para
una MasterCard. Supongamos que P (A) = 0,5, P (B) = 0,4 y P (A ∩ B) = 0,25.
a) Calcule la probabilidad de que el individuo seleccionado tenga al menos una de las dos tarjetas;
esto es la probabilidad del evento A ∪ B.
b) ¿Cuál es la probabilidad de que el individuo seleccionado no tenga ninguna de esas tarjetas?
c) Describa, en términos de A y B, el evento en que el alumno seleccionado tenga una tarjeta Visa
pero no una MasterCard, y a continuación calcule la probabilidad de este evento.

Problema 4: [2.13] Una empresa de consultorı́a de computadoras ha licitado en tres proyectos.


Supongamos Ai ={proyecto i otorgado}, para i = 1, 2, 3, y P (A1 ) = 0,22, P (A2 ) = 0,25, P (A3 ) = 0,28,
P (A1 ∩A2 ) = 0,11, P (A1 ∩A3 ) = 0,05, P (A2 ∩A3 ) = 0,07 y P (A1 ∩A2 ∩A3 ) = 0,01. Exprese verbalmente
los siguientes eventos y calcule su probabilidad:


c
Compilado por Pedro Pury – IUA 2012

1
a) A1 ∪ A2
b) A′1 ∩ A′2 (Sugerencia: (A1 ∪ A2 )′ = A′1 ∩ A′2 )
c) A1 ∪ A2 ∪ A3
d) A′1 ∩ A′2 ∩ A′3
e) A′1 ∩ A′2 ∩ A3
f ) (A′1 ∩ A′2 ) ∪ A3

Problema 5: [2.23*] Una biblioteca tiene cinco ejemplares de cierto texto, dos de los cuales 1 y 2
son primeras impresiones y los otros tres 3, 4 y 5 son segundas impresiones. Serán seleccionados al
azar dos ejemplares para ser puestos en reserva de dos horas (lo cual implica 10 resultados igualmente
probables).
a) ¿Cuál es la probabilidad de que ambos ejemplares seleccionados sean primeras impresiones?
b) ¿Cuál es la probabilidad de que ambos ejemplares seleccionados sean segundas impresiones?
c) ¿Cuál es la probabilidad de que, al menos, uno de los ejemplares sea una primera impresión?
d) ¿Cuál es la probabilidad de que los ejemplares seleccionados sean de diferentes impresiones?

Problema 6: [2.29] Se quiere crear el consejo de estudiantes de ingenierı́a del IUA con un represen-
tante de cada una de las cinco carreras de ingenierı́a (mecánica, electrónica, informática, telecomuni-
caciones y sistemas). ¿En cuantas formas se puede:
a) seleccionar presidente y vicepresidente del consejo?
b) seleccionar un presidente, vicepresidente y secretario?
c) seleccionar dos los miembros vocales adicionales para el consejo?

Problema 7: [2.31*]
a) Beethoven escribió 9 sinfonı́as y Mozart 27 conciertos para piano. Si el anunciador de una radio-
difusora universitaria desea reproducir primero una sinfonı́a de Beethoven y después un concierto de
Mozart, ¿En cuántas formas se puede hacer eso?
b) El gerente de la radiodifusora determina que en cada noche sucesiva (7 dı́as por semana), se
transmitirá una sinfonı́a de Beethoven seguida de un concierto para piano de Mozart y luego un
cuarteto para cuerdas de Schubert (de los cuales hay 15). ¿Durante cuantos años podrá continuar este
sistema, antes de que tenga que repetirse el mismo programa?

Problema 8: [2.33] Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por
cierta compañı́a presenta grietas en la parte inferior del bastidor principal; suponga que una ciudad
tiene 20 de estos autobuses y que han aparecido grietas en 8 de ellos.
a) ¿Cuántas formas hay de seleccionar una muestra de 5 autobuses de los 20 para una inspección
completa?
b) ¿En cuántas formas puede una muestra de 5 autobuses contener exactamente 4 con grietas visibles?
c) Si se escoge al azar una muestra de 5 autobuses, ¿cuál es la probabilidad de que exactamente 4 de
los 5 tengan grietas visibles?
d) Si se seleccionan los autobuces como en el inciso (c), ¿cuál es la probabilidad de que, al menos, 4
de los seleccionados tengan grietas visibles?

Problema 9: [2.39] Se acaban de recibir 15 teléfonos en un centro de servicio autorizado. Cinco son
celulares, cinco inalámbricos y los otros cinco son convencionales. Suponga que a esos teléfonos se les
asignan al azar los números 1, 2, . . . , 15, para indicar el orden en que se van a reparar.

2
a) ¿Cuál es la probabilidad de que todos los teléfonos inalámbricos estén entre los diez primeros que
se van a reparar?
b) ¿Cuál es la probabilidad de que, después de reparar diez de los teléfonos, queden pendientes sólo
teléfonos de dos de los tipos?
c) ¿Cuál es la probabilidad de que haya dos teléfonos de cada tipo entre los primeros seis que se van
a reparar?

Problema 10: [2.43*] En el póquer de cinco cartas, una “escalera” está formada por cinco cartas
con denominaciones adyacentes (por ejemplo, 9 de bastos, 10 de corazones, sota de corazones, reina
de espadas y rey de bastos). Si se supone que los ases pueden ser bajos o altos y nos dan una “mano”
de cinco cartas, ¿Cuál es la probabilidad de que sea una “escalera” con una carta alta de diez? ¿Cuál
es la probabilidad de que sea una “escalera”? ¿Cuál es la probabilidad de que sea una “escalera de
color” (todas las cartas del mismo “palo”)?

Problema 11: [2.45*] Cierto automóvil deportivo está equipado con transmisión automática o con
transmisión manual, y se puede adquirir en uno de cuatro colores. Las probabilidades relevantes de
las diversas combinaciones de tipo de transmisión y color son las siguientes:

Color
Blanco Azul Negro Rojo
Tipo de A 0,15 0,10 0,10 0,10
transmisión M 0,15 0,05 0,15 0,20

a) Calcule P (A), P (B) y P (A ∩ B).


b) Calcule P (A|B) y P (B|A) y explique qué representa cada una de esas probabilidades.
c) Calcule e interprete P (A|C) y P (A|C ′ ).
Donde: A={transmisión automática}, B={negro} y C={blanco}.

Problema 12: [2.47] Regrese al caso de las tarjetas de crédito del Problema 3, donde A={Visa},
B={MaterCard}. Calcule e interprete cada una de las siguientes probabilidades. Un diagrama de Venn
la podrı́a ayudar.
a) P (B|A) b) P (B ′ |A) c) P (A|B) d) P (A′ |B)
e) Debido a que el individuo seleccionado tiene al menos una tarjeta, ¿cuál es la probabilidad de que
esa tarjeta sea Visa?

Problema 13: [2.59] En cierta gasolinera, 40 % de los clientes utilizan gasolina regular sin plomo
(A1 ), 35 % gasolina extra sin plomo (A2 ) y 25 % gasolina premium sin plomo (A3 ). De los clientes que
consumen gasolina regular, sólo 30 % llenan sus tanques (evento B). De los que consumen gasolina
extra, 60 % llenan sus tanques, mientras que, de los que usan premium, 50 % llenan sus tanques.
a) ¿Cuál es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y llene su tanque
(A2 ∩ B)?
b) ¿Cuál es la probabilidad de que el siguiente cliente llene el tanque?
c) Si el siguiente cliente llena el tanque, ¿cuál es la probabilidad de que pida gasolina regular?, ¿extra?
y ¿premium?

3
Problema 14: [2.60*] Según las estadı́sticas de determinado paı́s, el 70 % de los aviones ligeros que
desaparecen en vuelo son encontrados posteriormente. De las naves descubiertas, el 60 % tiene locali-
zador satelital de emergencia; mientras que el 90 % de los no descubiertos no posee dicho localizador.
a) Teniendo en cuenta que el espacio muestral del problema son todos los aviones ligeros desaparecidos,
y utilizando la siguiente notación para los eventos: D: aviones ligeros descubiertos, L: aviones ligeros
con localizador, N D = Dc , y N L = Lc ; interprete los porcentajes del enunciado como probabilidades
condicionales de los eventos definidos.
b) Probar que: P (L|N D) + P (N L|N D) = 1.
Suponga ahora que ha desaparecido un avión ligero. Calcular las siguientes probabilidades condicio-
nales:
c) Si el avión posee localizador, ¿cuál es la probabilidad de que no sea encontrado?
d) Si no tiene localizador, ¿cuál es la probabilidad de que sea encontrado?

Problema 15: [2.63*] Para clientes que compran un juego completo de neumáticos en cierta distri-
buidora, considere los eventos:
A ={los neumáticos son fabricados en Estados Unidos}
B ={el comprador balancea de inmediato los neumáticos}
C ={el comprador pide alineación de neumáticos delanteros}
junto con A′ , B ′ y C ′ . Suponga las siguientes probabilidades incondicionales y condicionales:
P (A) = 0,75 P (B|A) = 0,9 P (B|A′ ) = 0,8
P (C|A ∩ B) = 0,8 P (C|A ∩ B ′ ) = 0,6
P (C|A′ ∩ B) = 0,7 P (C|A′ ∩ B ′ ) = 0,3
a) Construya un diagrama de árbol formado de ramas de primer, segunda y tercera generaciones y
ponga una marca de evento y la probabilidad adecuada junto a cada rama.
b) Calcule P (A ∩ B ∩ C).
c) Calcule P (B ∩ C).
d) Calcule P (C)
e) Calcule P (A|B ∩ C), como la probabilidad de una compra de neumáticos fabricados en Estados
Unidos, dado que se pidió alineación y balanceado.

Problema 16: [2.65] En una universidad, en los últimos tres años, se probaron tres textos de diferentes
autores (T1 , T2 y T3 ), adecuados para los cursos iniciales de Fı́sica. En el primer año se utiliza el primer
texto (T1 ), siendo 500 el número de inscriptos en el curso de Fı́sica. Al finalizar el curso, de una encuesta
resulta que 200 de esos 500 alumnos están satisfechos con el libro seleccionado. Al año siguiente se
probó T2 , con los 300 matriculados, de los cuales quedaron satisfechos 150 de ellos. Y en el tercer año
se utilizó T3 con los 200 inscriptos, siendo positiva la evaluación en 160 de las encuestas.
a) Si se toma un alumno al azar de la población de alumnos que cursaron Fı́sica en estos últimos tres
años, ¿cuál es la probabilidad de que haya utilizado el texto Ti (i = 1, 2, 3)? Es decir, calcular P (Ti )
b) ¿Cuales son las probabilidades de que un alumno esté satisfecho con su libro de Fı́sica dado
que utilizó el texto Ti ? Es decir, calcular P (S|Ti ) para i = 1, 2, 3. (S corresponde al evento alumno
satisfecho).
c) Calcular la probabilidad de que un alumno tomado al azar, en los últimos tres años, este satisfecho
con su texto de Fı́sica. Es decir, calcular P (S).

Problema 17: [2.100,101*] Una empresa utiliza para sus envı́os postales el 40 % de las veces a la

4
empresa E1 , el 50 % de las veces a la empresa E2 , y para el resto de los envı́os a la empresa E3 . De los
paquetes enviados por E1 , el 2 % llega tarde y de los enviados por E2 , sólo el 1 % llega tarde. Mientras
que el 5 % de los envı́os por E3 llegan demorados.
a) ¿Cuál es la probabilidad de que un envı́o se haga por E1 y llegue tarde?
b) ¿Cuál es la probabilidad total de que un envı́o llegue tarde?
c) Si un paquete llega a tiempo a destino, ¿cuál es la probabilidad de que no haya sido enviado por
E1 ? (Ayuda: (A ∪ B)c = Ac ∩ B c ).

Problema 18: [2.68] Regrese al caso de las tarjetas de crédito del Problema 3 y demuestre que A y
B son dependientes, primero a partir de la definición de independencia y después comprobando que
no se cumple la propiedad multiplicativa.

Problema 19: [2.75] Una costura en un avión necesita de N remaches. La costura tendrá que volver
a realizarse si cualquiera de los remaches está defectuoso. Suponga que los remaches están defectuosos
independientemente uno de los otros, cada uno con la misma probabilidad p.
a) Si P es la probabilidad de que la costura sea defectuosa, calcular la función P (p).
b) Si las costuras tienen N = 25 remaches, ¿Qué tan pequeña debe ser la probabilidad p, de que
un remache sea defectuoso, para asegurar que sólo el 10 % de todas las costuras necesiten volver a
ejecutarse?

Problema 20: [2.77*] Dos bombas conectadas en paralelos fallan independientemente una de la otra
en un dı́a dado. La probabilidad de que la bomba más vieja falle es 0,10 y la probabilidad de que
sólo la bomba más nueva falle es 0,05. ¿Cuál es la probabilidad de que el sistema de bombeo falle en
cualquier dı́a dado (lo que sucederá si ambas bombas fallan)?

Problema 21: [2.78] Considere el sistema de componentes independientes conectados, de la figura


siguiente. Los componentes 1 y 2 están conectados en paralelo, de modo que el subsistema superior
funciona si 1 ó 2 funcionan; y los componentes 3 y 4 en serie, i.e., el subsistema inferior funciona sólo
si 3 y 4 funcionan. Si p = P (el componente funciona) = 0,9, calcular P = P (el sistema funciona).
1
 AA
 AA  B
 2 B
B 
B 3 4 

Problema 22: [2.83*] Consulte las suposiciones indicadas en el ejercicio anterior y responda la misma
pregunta formulada para el sistema de la siguiente figura.

1 3 4
 AA @
@ 7
AA  @
@
2 5 6

5
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 3 ‡ – Variables Aleatorias Discretas
Problema 1: [3.11] Un taller de servicios para automóviles sabe que el 45 % de las afinaciones se
efectúan en automóviles de cuatro cilindros, el 40 % en automóviles de seis cilindros y el 15 % en
automóviles de ocho cilindros. Sea X = número de cilindros del siguiente automóvil que se afinará.
a) ¿Cuál es la distribución de probabilidad de X?
b) Dibuje una gráfica lineal y un histograma de probabilidad a partir de la distribución de probabilidad
del inciso (a).

Problema 2: [3.13] Un negocio de computadoras que atiende pedidos por correo tiene seis lı́neas
telefónicas. Simbolicemos con X el número de lı́neas en uso en un momento especı́fico. Supongamos
que la distribución de probabilidad de X está dada en la siguiente tabla:

x 0 1 2 3 4 5 6
p(x) 0,10 0,15 0,20 0,25 0,20 0,06 0,04

Calcule la probabilidad de cada uno de los siguientes eventos:


a) {A lo sumo 3 lı́neas están en uso}
b) {Menos de 3 lı́neas están en uso}
c) {Por lo menos 3 lı́neas están en uso}
d) {Entre 2 y 5 lı́neas están en uso}
e) {Entre 2 y 4 lı́neas no están en uso}
f ) {Por lo menos 4 lı́neas no están en uso}

Problema 3: [3.17*] El voltaje de una baterı́a nueva puede ser aceptable (A) o no aceptable (I). Cierta
linterna de mano necesita dos baterı́as, las cuales deberán seleccionarse y probarse independientemente
hasta encontrar dos aceptables. Supongamos que el 90 % de todas las baterı́as tienen voltaje aceptable.
Señale con Y el número de baterı́as que deben ser probadas.
a) ¿Cuál es p(2), es decir, P (Y = 2)?
b) ¿Cuál es p(3)? (Sugerencia: Hay dos resultados posibles que confluyen en Y = 3)
c) Para tener Y = 5, ¿Qué debe ser cierto de la quinta baterı́a seleccionada? Haga una lista de 4
resultados para los que Y = 5 y luego determine p(5).
d) Utilice el modelo de sus respuestas en los incisos (a) a (c) para obtener una fórmula general para
p(y).


c
Compilado por Pedro Pury – IUA 2012

1
Problema 4: [3.19*] Considere un grupo de cuatro dadores de sangre (A, B, C y D) de los cuales
sólo uno tiene sangre 0+. Cuatro muestras de sangre, una de cada individuo, se analizarán en orden
aleatorio hasta que sea identificado el individuo con sangre O+. Sea la variable aleatoria: Y = número
de análisis necesarios para identificar al individuo O+. Calcule la distribución de probabilidad de Y .

Problema 5: [3.23] Una compañı́a de seguros ofrece a sus tenedores de pólizas varias opciones
diferentes para el pago de primas. Para un tenedor seleccionado al azar, sea X = número de meses
entre pagos sucesivos. La distribución de probabilidad acumulada de X es como sigue:


 0 x<1





 0,30 1 ≤ x < 3


 0,40 3 ≤ x < 4
F (x) =

 0,45 4 ≤ x < 6





 0,60 6 ≤ x < 12



1 12 ≤ x

a) ¿Cuál es la distribución de probabilidad de X?


b) Sólo con el uso de la distribución de probabilidad acumulada, calcule P (3 ≤ X ≤ 6) y P (4 ≤ X).

Problema 6: [3.31] Un distribuidor de aparatos electrodomésticos vende tres modelos diferentes


de congeladores verticales con capacidad de 13,5, 15,9 y 19,1 pies cúbicos de espacio de almacenaje.
Sea X = cantidad de espacio de almacenaje de un congelador comprado por el siguiente cliente.
Supongamos que X tiene distribución de probabilidad dada por:
x 13,5 15,9 19,1
p(x) 0,2 0,5 0,3

a) Calcule E(X), E(X 2 ) y V (X).


b) Si el precio C de un congelador de capacidad X pies cúbicos es C = 25X − 8,5, ¿cuál es el precio
esperado que se obtiene de la venta de un congelador?
c) ¿Cuál es la varianza del precio C = 25X − 8,5 pagado por el cliente?
d) Suponga que mientras la capacidad nominal de un congelador es X, la capacidad real es h(X) =
X − 0,01X 2 . ¿Cuál es la capacidad real esperada de los congeladores comprados?

Problema 7: [3.32] Sea X una variable aleatoria de Bernoulli con distribución de probabilidad



 qx=0
p(x) = p x=1 p + q = 1.


 0 x 6= 0, 1

a) Calcule E(X 2 ).
b) Demuestre que V (X) = p(1 − p).
c) Calcule E(X 79 ).

Problema 8: [3.33*] Suponga que el número de plantas de un tipo particular, que se encuentra en
una región rectangular (llamada cuadrante por los ecologistas) de cierta área geográfica, es un variable
aleatoria X con distribución de probabilidad:
(
c/x3 x = 1, 2, 3, . . .
p(x) =
0 de otra manera

2
¿Es E(X) finita? Justifique su respuesta (ésta es una distribución a la cual los expertos en estadı́stica
llamarı́an de cola larga).

Problema 9: [3.37*] Sea X = el resultado cuando un dado no cargado se hace rodar una vez. Si
antes de hacer rodar el dado se ofrece a los tiradores (1/3,5) dólares o h(X) = 1/X dólares, ¿aceptarı́a
la cantidad garantizada o jugarı́a? (Nota: En general no es cierto que 1/E(X) = E(1/X).)

Problema 10: [3.41] Suponga que E(X) = 5 y E [X(X − 1)] = 27,5. ¿Cuál es el valor de
 
a) E(X 2 )? Sugerencia: E [X(X − 1)] = E X 2 − X = E(X 2 ) − E(X).
b) V (X)?
c) y cuál es la relación general entre las cantidades E(X), E [X(X − 1)] y V (X)?

Problema 11: [3.43] Un resultado llamado desigualdad de Chebychev establece que para cual-
quier distribución de probabilidad de una variable aleatoria X y cualquier número k que sea por lo
menos 1, P (|X −µ| ≥ kσ) ≤ 1/k 2 . En otras palabras, la probabilidad de que el valor de X se encuentre
a por lo menos k desviaciones estándar de su media no accede 1/k 2 .
a) ¿Cuál es el valor de la cota superior para k = 2?, ¿k = 3?, ¿k = 4?, ¿k = 5?, ¿k = 10?
b) Calcule µ y σ para la distribución de probabilidad del Problema 2. Después, evalúe P (|X −µ| ≥ kσ)
para los valores de k dados en el inciso a). ¿Qué sugiere esto acerca de la cota superior en relación con
la probabilidad correspondiente?
1 8 1
c) Si X tiene tres valores posibles, -1, 0 y 1, con probabilidades 18 , 9 y 18 respectivamente, ¿Cuál es
P (|X − µ| ≥ 3σ), y cómo se compara con la cota correspondiente?
d) Dé una distribución en la cual P (|X − µ| ≥ 5σ) = 0,04.

Problema 12: [3.45] Utilice una tabla de probabilidades binomiales acumuladas para obtener las
siguientes probabilidades:
a) B(4; 10, 0,3)
b) b(4; 10, 0,3)
c) b(6; 10, 0,7)
d) P (2 ≤ X ≤ 4), cuando X ∼ Bin(10, 0,3)
e) P (2 ≤ X), cuando X ∼ Bin(10, 0,3)
f ) P (X ≤ 1), cuando X ∼ Bin(10, 0,7)
e) P (2 < X < 6), cuando X ∼ Bin(10, 0,3)

Problema 13: [3.46*] Se conoce que la proporción de lasers, empleados en la fabricación de repro-
ductores de discos compactos, que resultan defectuosos en la lı́nea de montaje es del 5 %. Sea X el
número de lasers encontrados defectuosos en una muestra seleccionadas al azar de tamaño n = 25.
a) ¿Cuál es la distribución de probabilidad de la variable aleatoria X?. Especificar todos los parámetros
que la caracterizan.
b) ¿Cuál es la probabilidad de encontrar a lo sumo 2 lasers defectuosos?
c) ¿Cuál es la probabilidad de encontrar al menos 4 lasers defectuosos?
d) ¿Cuál es la probabilidad de no encontrar ningún láser defectuoso entre los 25 seleccionados?
e) Calcular el promedio (o valor esperado) y la desviación estándar de X.

Problema 14: [3.47*] Una compañı́a que produce cristal fino sabe por experiencia que 10 % de sus
copas tienen imperfecciones y deben clasificarse como “de segunda”.

3
a) Entre seis copas seleccionadas al azar, ¿qué tan probable es que sólo una sea de segunda?
b) Entre seis copas seleccionadas al azar, ¿cuál es la probabilidad de que por lo menos dos sean de
segunda?
c) Si las copas se examinan una por una, ¿cuál es la probabilidad de que por lo menos sean seleccionadas
cinco para encontrar cuatro que no sean de segunda?

Problema 15: [3.51] Veinte por ciento de todos los teléfonos de cierto tipo se remiten para repararse
cuando todavı́a está vigente su garantı́a. De éstos, 60 % pueden ser reparados y el otro 40 % debe
sustituirse por aparatos nuevos. Si una compañı́a compra 10 de estos teléfonos, ¿cuál es la probabilidad
de que exactamente se cambien 2 dentro del perı́odo de garantı́a.

Problema 16: [3.53*] Un reglamento, que requiere la instalación de un detector de humo en todas las
casas prefabricadas, ha estado en vigor en una ciudad durante un año. El departamento de bomberos
está preocupado porque muchas casas siguen sin detectores. Sea p = la verdadera proporción de casas
que tienen detectores y supongamos que se inspeccione al azar una muestra de 25 casas. Si la muestra
indica que menos del 80 % tiene detector, el departamento de bomberos hará una campaña para que
el programa de instalaciones sea obligatorio. Pero, debido a lo costoso del programa, el departamento
no pedirá tales inspecciones a menos que la evidencia muestral apoye con argumentos sólidos esta
necesidad. Sea X el número de casas con detectores entre las 25 de la muestra. Considere rechazar la
afirmación de que p ≥ 0,8 si x ≤ 15, donde x es el valor observado de X.
a) ¿Cuál es la probabilidad de que la petición sea rechazada cuando el valor real de p es 0,8?
b) ¿Cuál es la probabilidad de no rechazar la petición cuando p = 0,7? ¿Cuándo p = 0,6?
c) ¿Cómo cambian las “probabilidades de error” de los incisos (a) y (b) si el valor de 15 de la regla
de decisión se sustituye por 14?

Problema 17: [3.59*] Los clientes de una gasolinera pagan con tarjeta de débito (A), tarjeta de
crédito (B) o en efectivo (C). Suponga que clientes sucesivos eligen su forma de pago de manera
independiente, con P (A) = 0,5, P (B) = 0,2 y P (C) = 0,3.
a) Entre los siguientes 100 clientes, ¿cuáles son la media y la varianza del número de quienes pagan
con tarjeta de crédito (B)? Explique su razonamiento.
b) Conteste ahora el inciso (a) para el número de clientes, entre los 100 siguientes, que no pagan en
efectivo (C c ).

Problema 18: [3.73] Sea X la cantidad de grietas en la superficie de una caldera de cierto tipo,
seleccionada al azar, con una distribución de Poisson con parámetros λ = 5 y utilice la una tabla para
calcular las siguientes probabilidades:
a) P (X ≤ 8), b) P (X = 8), c) P (9 ≤ X), d) P (5 ≤ X ≤ 8), e) P (5 < X < 8).

Problema 19: [3.75*] Suponga que la cantidad de conductores que viajan entre cierto origen y des-
tino, durante determinado perı́odo, tiene una distribución de Poisson con parámetro λ = 20 (sugerido
en el artı́culo “Dynamic Ride Sharing: Theory and Practice”, J. of Transp. Engr., 1997, pp. 308-312).
¿Cuál es la probabilidad de que la cantidad de conductores:
a) sea máximo 10?
b) sea mayor que 20?
c) esté entre 10 y 20 inclusive? ¿Esté estrictamente entre 10 y 20?
d) sea mayor que la cantidad media en más de dos desviaciones estándar?

4
Problema 20: [3.76] En la escritura de un archivo en un disco de computadora el número de “bits”
erróneos es una variable aleatoria con distribución de Poisson de parámetro λ = 0,2.
a) ¿Cuál es el número medio y la desviación estándar de “bits” erróneos por archivo?
b) ¿Cuál es la probabilidad de que el archivo tenga exactamente un sólo “bit” erróneo?
c) ¿Cuál es la probabilidad de que el archivo tenga al menos dos “bits” erróneos?
d) Si dos archivos se escriben de manera independiente, ¿cuál es la probabilidad de que al menos uno
no contenga “bits” erróneos?

Problema 21: [3.105*] En un puesto de periódicos, al comienzo de un dı́a quedan cinco ejemplares de
una determinada revista de fotografı́a. Sea X el número de clientes que entran al puesto ese dı́a para
comprar esa revista. Sea Y el número de ejemplares de la revista en cuestión que serán efectivamente
vendidos ese dı́a en particular. Si X tiene una distribución de Poisson con parámetro λ = 4,
a) ¿qué representa λ en este ejemplo?,
b) ¿cuál es la distribución de probabilidad de Y ?
c) ¿cuál es el número esperado de ejemplares que se venderán ese dı́a?

5
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 4 ‡ – Variables Aleatorias Continuas
Problema 1: [4.1] Simbolice con X la cantidad de tiempo de préstamo para un libro, disponible
sólo durante dos horas en la biblioteca de una universidad, solicitado por un estudiante seleccionado
al azar, y suponga que X tiene función de densidad de probabilidad:
(
αx 0 ≤ x ≤ 2
f (x) =
0 de otra manera
a) Calcule el valor de α y trace la gráfica de la densidad de probabilidad.
b) Calcule las siguientes probabilidades:
i) P (X ≤ 1), ii) P (0,5 ≤ X ≤ 1,5), iii) P (1,5 ≤ X)

Problema 2: [4.5*] Un docente universitario nunca termina su clase antes de que suene la campana
y siempre termina su clase a menos de dos minutos después de que suene la campana. Sea X = tiempo
que transcurre entre la campana y el término de la clase, y suponga que que la densidad de probabilidad
de X es (
k x2 0 ≤ x ≤ 2
f (x) =
0 de otra manera
a) Encuentre el valor de k.
b) ¿Cuál es la probabilidad de que la clase termine a menos de un minuto después de que suene la
campana?
c) ¿Cuál es la probabilidad de que la clase se extienda entre 60 y 90 s después de que suene a campana?
d) ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 s después de que suene la campana?

Problema 3: [4.7] El tiempo X (en minutos) para que un asistente de laboratorio prepare el equipo
para un experimento tiene una distribución uniforme en el intervalo [25, 35] minutos.
a) Escriba la densidad de probabilidad de X y trace su gráfica.
b) ¿Cuál es la probabilidad de que el tiempo de preparación exceda los 33 minutos?
c) ¿Cuál es la probabilidad de que el tiempo de preparación se encuentre a una distancia de 2 min del
tiempo medio? (Sugerencia: identifique µ en la gráfica de f (x)).
d) Para cualquier a tal que 25 < a < a + 2 < 35, ¿Cuál es la probabilidad de que el tiempo de
preparación esté entre a y a + 2? Realice el cálculo gráficamente.

Problema 4: [4.11] La densidad de probabilidad acumulada de la duración X de tiempo de préstamo


de un libro, como se describió en el Problema 1 es:



 0 x<0
F (x) = x2 /4 0≤x<2


 1 2≤x

c
Compilado por Pedro Pury – IUA 2012

1
Utilı́cela para calcular lo siguiente:
a) P (X ≤ 1), b) P (0,5 ≤ X ≤ 1), c) P (X > 0,5),
d) La mediana de la duración del tiempo de préstamo de libros µ̃. (Ayuda: Resuelva F (µ̃) = 0,5).
e) La función de densidad f (x). (Ayuda: Calcule F ′ (x)).

Problema 5: [4.13] Simbolice con X el tiempo que dura un libro prestado con densidad de probabi-
lidad dada en el Problema 1.
a) Calcule E(X).
b) Calcule V (X) y σX .
c) Si a la persona que solicita un libro se le cobra una cantidad h(X) = X 2 cuando la duración del
préstamo es X, calcule el cobro esperado E[h(X)].

Problema 6: [4.19*] Sea X una va aleatoria con densidad de probabilidad acumulada dada por:


 0 x≤0

 x  
4
F (x) = 1 + ln 0<x≤4

 4 x


1 x>4
Calcular: a) P (X ≤ 1), b) P (1 ≤ X ≤ 3), c) la densidad de probabilidad de X.

Problema 7: [4.23] Si la temperatura a la que un cierto compuesto se funde es una variable aleatoria
con valor medio µ = 120◦ C y σ = 2◦ C, ¿cuál es la temperatura media y la desviación estándar en ◦ F ?
(Sugerencia: Si X es la temperatura en ◦ C e Y la temperatura en ◦ F , se cumple: Y = 1,8 X + 32.

Problema 8: [4.25*] Sea X la temperatura en ◦ C en la cual tiene lugar cierta reacción quı́mica, y
sea Y la temperatura en ◦ F , esto es, Y = 1,8 X + 32.
a) Si la mediana de la distribución de X es µ̃, demuestre que 1,8µ̃ + 32 es la mediana de la distribución
de Y .
b) ¿Cómo está relacionado el 90mo percentil de la distribución de Y con el 90mo percentil de la
distribución de X? Explique se respuesta.
c) En general, si Y = aX + b, ¿cómo se relaciona cualquier percentil particular de la distribución de
Y con el correspondiente percentil de la distribución de X?

Problema 9: [4.26] Sea Z una variable normal estándar, calcule las siguientes probabilidades,
dibujando las correspondientes gráficas siempre que sea posible:
a) P (0 ≤ Z ≤ 2,17) b) P (0 ≤ Z ≤ 1) c) P (−2,5 ≤ Z ≤ 0) d) P (−2,5 ≤ Z ≤ 2,5)
e) P (Z ≤ 1,37) f ) P (−1,75 ≤ Z) g) P (−1,5 ≤ Z ≤ 2) h) P (1,37 ≤ Z ≤ 2,5)
i) P (1,5 ≤ Z) j) P (|Z| ≤ 2,5)

Problema 10: [4.27] En cada uno de los siguientes casos, determinar el valor de la constante c de
forma tal que los siguientes enunciados de probabilidad sean correctos:
a) Φ(c) = 0,9838 b) P (0 ≤ Z ≤ c) = 0,291 c) P (c ≤ Z) = 0,121
d) P (−c ≤ Z ≤ c) = 0,668 e) P (c ≤ |Z|) = 0,016

Problema 11: [4.28] Encuentre los siguientes percentiles para la distribución normal estándar. In-
terpole cuando sea apropiado.
a) 91vo, b) 9no, c) 75vo, d) 25vo, e) 6to.

Problema 12: [4.29*] Dado P (Z > zα ) = α, determinar zα en los siguientes casos:

2
a) α = 0,0055, b) α = 0,09, c) α = 0,663.

Problema 13: [4.30] Si X es una va normal con media 80 y desviación estándar 10, calcule las
siguientes probabilidades mediante la estandarización Z = (X − µ)/σ:
a) P (X ≤ 100), b) P (X ≤ 80), c) P (65 ≤ X ≤ 100),
d) P (70 ≤ X), e) P (85 ≤ X ≤ 95), f ) P (|X − 80| ≤ 10).

Problema 14: [4.33] Suponga que el diámetro de los árboles de determinado tipo, a altura del pecho,
se distribuye normalmente con µ = 8,8 pulg y σ = 2,8 pulg.
a) ¿Cuál es la probabilidad de que el diámetro de un árbol, seleccionado al azar, sea a lo sumo 10 pulg?
y ¿que sea mayor de 10 pulg?
b) ¿Cuál es la probabilidad de que el diámetro de un árbol, seleccionado al azar, sea mayor que
20 pulg?
c) ¿Cuál es la probabilidad de que el diámetro de un árbol, seleccionado al azar, sea entre 5 y 10 pulg?
d) ¿Qué valor de c es tal que el intervalo (µ−c; µ+c) incluye el 98 % de todos los valores de diámetro?

Problema 15: [4.35*]


a) Si una distribución normal tiene µ = 25 y σ = 5, ¿Cuál es el 91vo percentil de la distribución?
b) ¿Cuál es el 6to percentil de la distribución del inciso a)?
c) El ancho de una lı́nea grabada en un circuito integrado está normalmente distribuido con media
3000µm y desviación estándar de 150µm. ¿Qué valor separa al 10 % más ancho de todas las lı́neas del
restante 90 %?

Problema 16: [4.37*] El dispositivo automático de apertura de un paracaı́das militar de carga se ha


diseñado para abrirse cuando se encuentre a 200 m de altura. Suponga que la altitud de apertura en
realidad tiene una distribución normal con media 200 m y desviación estándar de 30 m.
a) Se considera que la carga resulta dañada si el paracaı́das se abre a menos de 100 m. Calcular la
probabilidad de que en un salto tomado al azar la carga resulte dañana.
b) Si ahora se consideran cinco lanzamientos, ¿cuál es la probabilidad de que haya daños en la carga
en al menos uno de los cinco paracaı́das lanzados independientemente?

Problema 17: [4.41] La presión de aire de un neumático seleccionado al azar, instalado en un


automóvil nuevo, está distribuida normalmente con valor medio de 31 lb/pulg2 y desviación estándar
0,2 lb/pulg2 .
a) ¿Cuál es la probabilidad de que la presión de un neumático, seleccionado al azar, exceda de
30,5 lb/pulg2 ?
b) ¿Cuál es la probabilidad de que la presión de un neumático, seleccionado al azar, se encuentre entre
30,5 y 31,5 lb/pulg2 ?
c) Suponga que un neumático se considera con presión baja si se encuentra a menos de 30,4 lb/pulg2 .
¿Cuál es la probabilidad de que al menos uno de los cuatro neumáticos de un automóvil se encuentre
bajo? (Sugerencia: Si A = {al menos un neumático está bajo}, ¿cuál es el complemento de A?)

Problema 18: [4.47] Suponiendo que X tiene distribución binomial con parámetros n = 25 y p,
calcular cada una de las siguientes probabilidades usando la aproximación normal a la binomial (con
la corrección de continuidad) para los casos p = 0,5, 0,6 y 0,8, y compararla con las probabilidades
calculadas según la tabla:

3
a) P (15 ≤ X ≤ 20), b) P (X ≤ 15), c) P (20 ≤ X).

Problema 19: [4.49*] Suponga que solo 40 % de todos los automovilistas de cierto estado, usan con
regularidad su cinturón de seguridad. Se selecciona al azar una muestra de 500 automovilistas. ¿Cuál
es la probabilidad de que:
a) entre 180 y 230 (inclusive) de los automovilistas de la muestra use su cinturón con regularidad?
b) menos de 175 de los de la muestra usen su cinturón con regularidad?, ¿y menos de 150?

Problema 20: [4.58] Sea X = tiempo entre dos llegadas sucesivas a la ventanilla de atención de un
banco local. Si X tiene una distribución exponencial con λ = 4 h−1 , calcule lo siguiente:
a) El tiempo esperado entre dos llegadas sucesivas.
b) La desviación estándar del tiempo entre llegadas sucesivas.
c) P (X ≤ 4).
d) P (2 ≤ X ≤ 5).

Problema 21: [4.60*] Una amplia experiencia en ventiladores de cierto tipo, utilizados en motores
Diesel, ha sugerido que la distribución exponencial es un buen modelo para el tiempo hasta que se
presente una falla. Suponga que el tiempo medio hasta una falla es 25000 h. ¿Cuál es la probabilidad
de que:
a) Un ventilador seleccionado al azar dure por lo menos 20000 h? ¿A lo sumo 30000 h? y ¿entre 20000
y 30000 h?
b) la duración de un ventilador exceda el valor medio en más de 2 desviaciones estándar? y ¿en más
de 3 desviaciones estándar?

Problema 22: [4.63*] Si X tiene una distribución exponencial con parámetro λ, deduzca una ex-
presión general para el (100p)mo percentil de la distribución. Después especifique como obtener la
mediana.

Problema 23: [4.81] La primer columna de la tabla corresponde a las observaciones ordenadas, xi ,
de espesores de una pintura de baja viscosidad en mm×10−1 .
a) Calcular la media muestral (x̄), la desviación estándar muestral (σn−1 ) y la mediana (x̃) de estos
datos.
b) Con los datos observados, construir los valores normalizados yi = (xi − x̄)/σn−1 y completar la
segunda columna de la tabla.
c) En la tercer columna de la tabla, escribir a qué percentil muestral:

pmi = 100(i − 0,5)/n

corresponde cada valor de la muestra.


d) En la cuarta columna de la tabla, determinar el valor z del correspondiente percentil de una
distribución normal estándar.
e) Utilizando los pares de valores (zi , yi ) de la tabla construir una gráfica de probabilidad. ¿Le pa-
rece adecuado afirmar que la muestra corresponde a una población con distribución normal? ¿Porqué?

4
xi yi pmi zi

0,88

0,88

1,04

1,09

1,12

1,29

1,31

1,48

1,49

1,59

1,62

1,65

1,71

1,76

Problema 24: [4.83*] Construya una gráfica de probabilidad normal para los siguientes datos
de propagación de grietas por fatiga en diversas partes de aeronaves. ¿Es factible que la duración de
propagación tenga una distribución normal? Explique.
0,736 0,863 0,865 0,913 0,915 0,937 0,983 1,007
1,011 1,064 1,109 1,132 1,140 1,153 1,253 1,394

5
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 5 ‡ – Distribuciones de Probabilidad Conjunta
Problema 1: [5.1] En una gasolinera hay “islas” de autoservicio y de servicio completo. En cada
isla hay una sola bomba de gasolina sin plomo, con dos mangueras. Representemos con X el número
de mangueras utilizadas en la isla de autoservicio en una hora en particular y con Y el número de de
mangueras en uso, en ese momento, en la isla de servicio completo. La distribución de probabilidad
conjunta de X e Y aparece en la siguiente tabla:
y
p(x, y) 0 1 2
0 0,10 0,04 0,02
x 1 0,08 0,20 0,06
2 0,06 0,14 0,30

a) ¿Cuál es P (X = 1 y Y = 1)?
b) Calcule P (X ≤ 1 y Y ≤ 1)
c) Describa con palabras el evento {X 6= 0 y Y 6= 0} y calcule su probabilidad.
d) Calcule la distribución de probabilidad marginal de X y de Y . Por medio de pX (x), ¿cuál es
P (X ≤ 1)?
e) ¿Son X e Y variables aleatorias independientes? Explique su respuesta.

Problema 2: [5.3*] Cierto supermercado tiene una caja de salida común y una caja rápida. Represente
por X1 el número de clientes que están esperando en la caja común, en un momento particular del
dı́a, y con X2 , el número de clientes en la caja rápida, al mismo tiempo. Suponga que la distribución
de probabilidad conjunta de X1 y X2 es como se indica en la tabla siguiente:
x2
p(x1 , x2 ) 0 1 2 3
0 0,08 0,07 0,04 0,00
1 0,06 0,15 0,05 0,04
x1 2 0,05 0,04 0,10 0,06
3 0,00 0,03 0,04 0,07
4 0,00 0,01 0,05 0,06

a) ¿Cuál es P (X1 = 1, X2 = 1), esto es la probabilidad de que haya exactamente un cliente en cada
fila de espera?
b) ¿Cuál es P (X1 = X2 ), esto es, la probabilidad de que los números de clientes de las dos filas de
espera sean iguales?

c
Compilado por Pedro Pury – IUA 2012

1
c) Represente con A el evento en que haya por lo menos dos clientes más en una fila de espera que en
la otra. Exprese A en términos de X1 y X2 y calcule su probabilidad?
d) ¿Cuál es la probabilidad de que el número total de clientes de las dos filas de espera sea exactamente
cuatro? ¿Por lo menos cuatro?

Problema 3: [5.7] La distribución de probabilidad conjunta del número X de automóviles y el


número Y de autobuses, por ciclo de señal de semáforo en un carril de giro a la izquierda, aparece en
la tabla siguiente de probabilidad conjunta:
y
p(x, y) 0 1 2
0 0,025 0,015 0,010
1 0,050 0,030 0,020
2 0,125 0,075 0,050
x 3 0,150 0,090 0,060
4 0,100 0,060 0,040
5 0,050 0,030 0,020

a) ¿Cuál es la probabilidad de que haya exactamente un automóvil y un autobús durante un ciclo?


b) ¿Cuál es la probabilidad de que haya a lo sumo un automóvil y un autobús durante un ciclo?
c) ¿Cuál es la probabilidad de que haya exactamente un automóvil durante un ciclo? ¿Exactamente
un autobús?
d) Suponga que el carril de giro a la izquierda tiene capacidad para que transiten cinco automóviles,
y un autobús equivale a tres automóviles. ¿Cuál es la probabilidad de que haya sobrecarga durante
un ciclo?
e) ¿Son X e Y variables aleatorias independientes? Explique.

Problema 4: [5.75]
Un restaurante sirve tres menús fijos que cuestan 7, 9 y 10 pesos.
p(x, y) y
Para una pareja seleccionada la azar, sea X la variable aleatoria
7 9 10
que representa el precio del menú elegido por el hombre e Y la
7 0,05 0,05 a
variable aleatoria: precio del menú elegido por la mujer. La distri-
x 9 0,05 0,10 0,35
bución de probabilidad conjunta de X e Y está dada en la tabla
10 0 0,20 0,10
adjunta.

a) Calcular el valor de a.
b) Calcular las distribuciones de probabilidad marginal de X e Y .
c) ¿Son X e Y independientes? Justifique la respuesta.
d) ¿Cuál es la probabilidad que ambos en la pareja consuman menús de igual precio?
e) ¿Cual es el costo esperado que paga una pareja que acude a este restaurante?
f ) Si al finalizar la comida se le ofrece a las parejas una bonificación que consiste en devolver la
diferencia pagada entre el menú consumido mas caro y el mas barato, ¿cuál el el monto esperado que
el restaurante devuelve por pareja? Ayuda: Evaluar E[|X − Y |].

Problema 5: [5.9] Los neumáticos delanteros de un tipo particular de automóvil deben inflarse a una
presión de 26 lb/pulg2 . Suponga que la presión de aire de cada neumático es una variable aleatoria, X
para el neumático derecho e Y para el izquierdo, con distribución de probabilidad conjunta:

2
(
K(x2 + y 2 ) 20 ≤ x ≤ 30 , 20 ≤ y ≤ 30
f (x, y) =
0 de otra manera

a) ¿Cuál es el valor de K?
b) ¿Cuál es la probabilidad de que ambos neumáticos tengan menor presión que la requerida?
c) ¿Cuál es la probabilidad de que la diferencia de presión entre los neumáticos sea a lo sumo de
2 lb/pulg2 ?
d) Determine la distribución marginal de presión de aire del neumático derecho.
e) ¿Son X e Y variables aleatorias independientes?

Problema 6: [5.11*] Dos maestros entregan sus exámenes finales para que sean mecanografiados. Sea
X = número de errores de mecanografı́a en el examen del primer maestro e Y el número de errores en
el del segundo. Suponga que X tiene una distribución de Poisson con parámetro λ, Y una distribución
de Poisson con parámetro θ, y X e Y son independientes.
a) ¿Cuál es la distribución de probabilidad conjunta de X e Y ?
b) ¿Cuál es la probabilidad de que sólo se comenta un error en ambos exámenes combinados?
c) Obtenga una expresión general para la probabilidad de que el número total de errores de los dos
exámenes sea m (donde m es un entero no negativo).
Sugerencia: A = {(x, y) : x + y = m} = {(m, 0), (m − 1, 1), . . . , (1, m − 1), (0, m)}. Ahora, sume la
distribución de probabilidad conjunta sobre (x, y) ∈ A y utilice el teorema del binomio de Newton que
dice que cualquiera sean las constantes a y b,
!
X
m
m k m−k
a b = (a + b)m .
k=0
k

Problema 7: [5.17*] Un ecologista desea seleccionar un punto dentro de una región circular de
muestreo, según una distribución uniforme (en la práctica, esto podrı́a hacerse al seleccionar primero
una dirección y después una distancia desde el centro en esa dirección). Sea X = coordenada x del
punto seleccionado e Y = coordenada y del punto seleccionado. Si el cı́rculo está centrado en (0, 0) y
tiene radio R, entonces la distribución de probabilidad conjunta de X e Y es

 1
x2 + y 2 ≤ R 2
f (x, y) = πR2

0 de otra forma

a) ¿Cuál es la probabilidad de que el punto seleccionado se encuentre dentro de una distancia R/2
del centro de la región circular? [Sugerencia: Dibuje una figura de la región de densidad positiva D.
Debido a que f (x, y) es constante en D, calcular una probabilidad se reduce a calcular un área.]
b) ¿Cuál es la probabilidad de que tanto X como Y difieran de 0 a la sumo R/2?

c) Conteste el inciso b) para R 2 sustituyendo a R/2.
d) ¿Cuál es la distribución de probabilidad marginal de X? ¿De Y ? ¿Son X e Y independientes?

Problema 8: [5.19] La distribución de probabilidad conjunta de presiones para los neumáticos


delanteros está dada en el Problema 5.
a) Determine la distribución de probabilidad condicional de Y , dado que X = x, y la distribución de
probabilidad condicional de X, dado que Y = y.

3
b) Si la presión del neumático derecho es 22 lb/pulg2 , ¿cuál es la probabilidad de que el neumático
izquierdo tenga una presión de por lo menos 25 lb/pulg2 ? Comparar con P (Y ≥ 25).
c) Si la presión del neumático derecho es 22 lb/pulg2 , ¿cuál es la presión esperada del izquierdo? y
¿cuál es la desviación estándar de presión de este neumático?

Problema 9: [5.21 ] ¿Cuál condición sobre fY |X (y|x) es equivalente a la independencia de X e Y ?

Problema 10: [5.23*] La diferencia entre el número de clientes en la fila de espera común y el de la
caja rápida del Problema 2) es X1 − X2 . Calcule la diferencia esperada.

Problema 11: [5.27*] Ana y Andrés han acordado reunirse para tomar un refrigerio entre el mediodı́a
(0:00 p.m.) y la 1:00 p.m. Represente la hora de llegada de Ana con X, la de Andrés con Y y suponga
que X e Y son independientes con distribución de probabilidad:
( (
3x2 0 ≤ x ≤ 1 2y 0 ≤ x ≤ 1
fX (x) = , fY (y) =
0 de otra manera 0 de otra manera

¿Cuál es la cantidad de tiempo esperada que debe transcurrir entre quien llegó primero y la otra
persona? [Sugerencia: h(x, y) = |X − Y |.]

Problema 12: [5.28] Demuestre que si X e Y son variables aleatorias independientes, entonces
E(XY ) = E(X)E(Y ).

Problema 13: [5.33] Utilice el resultado del Problema 12 para demostrar que cuando X e Y son
independientes, Cov(X, Y ) = Corr(X, Y ) = 0.

Problema 14: [5.31]


a) Calcule la covarianza entre X e Y en el Problema 5.
b) Calcule el coeficiente de correlación ρ para X e Y .

Problema 15: [5.35*]


a) Utilice las reglas del valor esperado para demostrar que Cov(aX + b, cY + d) = ac Cov(X, Y )
b) Utilice el item anterior y las reglas de la varianza y desviación estándar para demostrar que
Corr(aX + b, cY + d) = Corr(X, Y ), cuando a y c tienen el mismo signo.
c) ¿Qué sucede cuando a y c tienen signos opuestos?

Problema 16: [5.36*] Demuestre que si Y = aX + b (a 6= 0), entonces Corr(X, Y ) = ±1. ¿Bajo
qué condiciones será ρ = +1?

4
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 6 ‡ – Los Estadı́sticos y sus Distribuciones
Problema 1: [5.37] Un jabón de lavavajillas de cierta marca se vende en tres tamaños: de 25, 40 y
65 onzas. El 20 % de los compradores seleccionan la caja de 25 onzas, el 50 % la de 40 onzas y el 30 %
la de 65 onzas. Sean X1 y X2 los tamaños seleccionados por dos compradores independientes.
a) Determine la distribución de muestreo de X̄ = (X1 + X2 )/2, calcule E(X̄) y compárela con µ.
b) Determine la distribución de muestreo de la varianza muestra S 2 , calcule E(S 2 ) y compárela con
σ2.

Problema 2: [5.39] Se sabe que el 80 % de todas las unidades de disco rı́gido, de cierta marca,
trabajan de manera satisfactoria durante el perı́odo de garantı́a (son “éxitos”). Suponga que n = 10
unidades de disco se seleccionan al azar y sea X = número de éxitos en la muestra. El estadı́stico
X/n es la proporción muestral (fracción) de éxitos. Obtenga la distribución de probabilidad de este
estadı́stico (tener en cuenta qué clase de variable aleatoria es X). [Sugerencia: Un posible valor de
X/n es 0,3 y corresponde a X = 3. ¿Cuál es la probabilidad de este valor?]

Problema 3: [5.41] Sea X el número de paquetes que envı́a por correo un cliente seleccionado al
azar, en cierta oficina de correo. Suponga que la distribución de X es como sigue:

x 1 2 3 4
p(x) 0,4 0,3 0,2 0,1

a) Considere una muestra aleatoria de tamaño n = 2 (dos clientes) y sea X̄ la media muestral de
paquetes enviados. Obtenga la distribución de probabilidad de X̄.
b) Usando la distribución del inciso a) calcule P (X̄ ≤ 2,5).
c) Otra vez considere una muestra aleatoria de tamaño n = 2, pero ahora concéntrese en la estadı́stica
R = rango muestral (diferencia entre los valores máximo y mı́nimo de la muestra). Obtenga la distri-
bución de R. [Sugerencia: Calcule el valor de R para cada resultado y utilice las probabilidades del
inciso a).]
d) Si se selecciona una muestra aleatoria de tamaño n = 4, ¿cuál es la P (X̄ ≤ 1,5)? [Sugerencia: no
necesita obtener una lista de todos los posibles resultados, sino sólo aquellos para los cuales x̄ ≤ 1,5.]

Problema 4: [5.51*] El tiempo utilizado por un solicitante seleccionado al azar, para llenar cierta
forma de hipoteca, tiene una distribución normal con valor medio de 10 minutos y desviación estándar
de 2 min. Si cinco individuos llenan la forma en un dı́a y seis en otro, ¿cuál es la probabilidad de que
la cantidad de tiempo promedio de la muestra diaria sea a lo sumo 11 minutos?

c
Compilado por Pedro Pury – IUA 2012

1
Problema 5: [5.52] La duración de cierto tipo de baterı́a está normalmente distribuida con valor
medio de 8 horas y desviación estándar de 1 hora. Hay cuatro baterı́as en un paquete, y la duración
del paquete es igual a la suma de las duraciones de las baterı́as individuales que lo componen. ¿Cuál es
el valor del tiempo que debe esperarse para que sólo el 5 % de todos los paquetes exceda en duración
ese valor?

Problema 6: [5.53] Se sabe que la dureza Rockwell de pernos, de cierto tipo, tiene un valor medio
de 50 y desviación estándar de 1,2.
a) Si la distribución es normal, ¿cuál es la probabilidad de que la dureza muestral media para una
muestra de 9 pernos sea por lo menos 51?
b) ¿Cuál es la probabilidad (aproximada) de que la dureza muestral media para una muestra aleatoria
de 40 pernos se al menos de 51?

Problema 7: [5.54*] Suponga que la densidad del sedimento (g/cm) de un espécimen seleccionado
al azar, de cierta región, está normalmente distribuida con media 2,65 y desviación estándar 0,85.
a) Si se selecciona una muestra aleatoria de 25 especı́menes, ¿cuál es la probabilidad de que la densidad
promedio de sedimento muestral sea a lo sumo 3? y ¿entre 2,65 y 3?
b) ¿Qué tan grande debiera ser el tamaño muestral para asegurar que la primera probabilidad del
inciso a) sea por lo menos 0,99?

Problema 8: [5.55] La primer tarea en un curso introductorio de programación por computadora


implica correr un breve programa. Si la experiencia indica que 40 % de todos los estudiantes prin-
cipiantes no cometerán errores de programación, calcule la probabilidad (aproximada) de que en un
grupo de 50 estudiantes:
a) por lo menos 25 no cometan errores. [Sugerencia: usar la aproximación normal a la binomial.]
b) entre 15 y 25 (inclusive) no cometan errores.

Problema 9: [5.61] Considere un pequeño transbordador con capacidad para automóviles y auto-
buses. La cuota para automóviles es $3 y para autobuses $10. Simbolice con X e Y la cantidad de
automóviles y autobuses, respectivamente, transportados en un solo viaje y suponga que la distribu-
ción conjunta de X e Y es la presentada en el Problema 3 de la Guı́a 5. Se verifica fácilmente que X
e Y son independientes.
a) Calcule el valor esperado, varianza y desviación estándar del número total de vehı́culos (X + Y )
en un solo viaje.
b) Calcule el valor esperado, varianza y desviación estándar del monto total obtenido en un solo viaje.

Problema 10: [5.63*] En relación al Problema 2 de la Guı́a 5:


a) Calcule la covarianza entre X1 y X2 .
b) Calcule V (X1 + X2 ). ¿Cómo se compara esto con V (X1 ) + V (X2 )?

Problema 11: [5.65] Suponga que cuando el pH de cierto compuesto quı́mico es 5,00, el pH medido
por un estudiante de quı́mica seleccionado al azar, es una variable aleatoria con media 5,00 y desviación
estándar 0,2. Un lote grande del compuesto se subdivide y se da una muestra a cada estudiante de un
laboratorio matutino y de uno vespertino. Sea X̄ = pH promedio como lo determinaron los estudiantes
matutinos, e Ȳ = pH promedio como lo determinaron los estudiantes vespertinos.

2
a) Si el pH es una variable normal y hay 25 estudiantes en cada laboratorio, calcule P (−0,1 ≤ X̄ − Ȳ ≤
0,1). [Sugerencia: X̄ − Ȳ es una combinación lineal de variables normales, por lo que está normalmente
distribuida.] Calcule µX̄−Ȳ y σX̄−Ȳ .
b) Si hay 36 estudiantes en cada laboratorio, pero las determinaciones del pH no se suponen normales,
calcule (aproximadamente) P (−0,1 ≤ X̄ − Ȳ ≤ 0,1).

Problema 12: [5.67*] Una pieza de tubo de PVC debe insertarse dentro de otra pieza. La longitud
de la primera está normalmente distribuida con valor medio de 20 cm y desviación estándar de 0,5 cm.
La longitud de la segunda en una variable aleatoria normal con media y desviación estándar 15 cm
y 4 cm, respectivamente. La cantidad de traslape está normalmente distribuida con valor medio de
1 cm y desviación estándar de 0,1 cm. Si se supone que las longitudes y la cantidad de traslape son
independientes una de otra, ¿Cuál es la probabilidad de que la longitud total, después de la inserción,
sea entre 34,5 y 35 cm?

Problema 13: [5.69] Tres diferentes caminos convergen a la entrada de una autopista. Suponga que
durante un tiempo fijo, el número de automóviles que entran de cada camino a la autopista es una
variable aleatoria, con valor esperado y desviación estándar como aparecen en la siguiente tabla:

Camino 1 Camino 2 Camino 3


Valor esperado 800 1000 600
Desviación estándar 16 25 18

a) ¿Cuál es el número total esperado de automóviles que entran a la autopista?


X
3
[Sugerencia: Sea Xi = número de automóviles que ingresan por el camino i. X = Xi es el número
i=1
total de autos entrante a la autopista.]
b) ¿Cuál es la varianza del número total de automóviles entrantes? ¿Qué suposiciones acerca de la
relación entre el número de automóviles en los diferentes caminos ha supuesto para poder dar un
resultado?
c) Suponiendo que Cov(X1 , X2 ) = 80, Cov(X1 , X3 ) = 90 y Cov(X2 , X3 ) = 100 (de modo que las tres
corrientes de tráfico no son independientes). Calcule el número total esperado (E[X]) de automóviles
que entran y la desviación estándar del total (σX ) en este caso.

3
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 7 ‡ – Intervalos de Confianza
Problema 1: [7.1] Considere una muestra aleatoria correspondiente a una distribución poblacional
normal con el valor de σ conocido.

a) ¿Cuál es el nivel de confianza para el intervalo x̄ ± 2,81 σ/ n?

b) ¿Cuál es el nivel de confianza para el intervalo x̄ ± 1,44 σ/ n?
c) ¿Cuál es el valor de zα/2 para que un intervalo tenga un nivel de confianza de 99,7 %?
d) ¿Cuál es el valor de zα/2 para que un intervalo tenga un nivel de confianza de 75 %?

Problema 2: [7.3*] Se selecciona una muestra aleatoria de 50 botellas de jarabe para la tos, y se
determina el contenido de alcohol de cada frasco. Sea µ el contenido promedio de alcohol correspon-
diente a la población de todos los frascos de la marca que se estudia. Suponga que el intervalo de
confianza de 95 % construido a partir de la muestra es (7,8; 9,4).
a) Explique si el intervalo con un nivel de confianza del 90 % para esta muestra es más o menos angosto
que el anterior.
b) Es correcta la afirmación: “Hay un 95 % de probabilidad de que 7,8 ≤ µ ≤ 9,4”. Explique.
c) Es correcta la afirmación: “El 95 % de los frascos de esta marca de jarabe tienen su contenido de
alcohol en el intervalo (7,8; 9,4). Explique.
d) Es correcta la afirmación: “Si se repite 100 veces el procedimiento: Selección de una muestra de 50
botellas y construcción del intervalo de confianza al 95 %; 95 de los intervalos construı́dos incluirán a
µ”. Explique.

Problema 3: [7.5] En una veta de carbón se mide la porosidad que presenta al Helio (fracción de
volumen ocupada por el gas). Se conoce que la distribución de porosidad es normal y la desviación
estándar poblacional igual a 0,75.
a) Si el promedio de porosidad medido en una muestra de 20 especı́menes de la veta resulta 4,85 y
la desviación estándar muestral es 0,79, construir un intervalo con el 95 % de confianza para la media
poblacional para la porosidad.
b) Si se desea construir un intervalo con el mismo valor de confianza del item anterior, pero cuyo
ancho total sea a lo sumo igual a 0,4, ¿cuántos especı́menes debe contener, al menos, la muestra?
c) Construir ahora un intervado de confianza al 98 % para la media de porosidades, a partir de una
muestra de 16 especı́menes para los cuales el promedio de porosidad resulta igual a 4,56.
d) Si con la muestra del item c) se fabrica un intervalo de confianza cuyo ancho total resulta 0,22,
determinar el nivel de confianza asociado con dicho intervalo.


c
Compilado por Pedro Pury – IUA 2012

1
Problema 4: [7.7]
a) ¿Cuánto debe incrementarse el tamaño de la muestra (n) para que la longitud de un intervalo de
confianza (igual a 7,5) se reduzca a la mitad? ¿Cambia su nievel de confianza?
b) Si el tamaño de la muestra se aumenta en un factor 25, ¿qué efecto se obtiene en el intervalo de
confianza?

Problema 5: [7.13] Un artı́culo analiza el uso de la fotografı́a infrarroja en color para la identificación
de árboles en bosques de pinos de Oregon (abeto Douglas). Entre los datos reportados hay resúmenes
estadı́sticos para las medidas densitométricas ópticas de filtro verde en muestras de árboles sanos y
enfermos. Para una muestra de 69 árboles sanos, el promedio muestral de densidad de capa de tinta
es 1,028 y la desviación estándar muestral 0,163.
a) Construir el intervalo de confianza de 95 % para el promedio de densidad µ de la población de
árboles.
b) Suponiendo una estimación de 0,16 para el valor muestral s, antes de fabricar la muestra, ¿qué ta-
maño de muestra serı́a necesario para obtener un intervalo de ancho 0,05 con un nivel de confianza de
95 %?

Problema 6: [7.17*] En la prueba de dureza Brinell se mide el diámetro de la penetración originada al


oprimir una bola de acero endurecido contra el material a prueba, bajo una carga patrón. Suponer que
se determina la dureza Brinell en una muestra de tamaño 50, y que se obtiene un promedio muestral
de 64,3 con una desviación muestral de 6,0. Construir un intervalo de confianza de 99 % para la dureza
poblacional.

Problema 7: [7.19*] En un artı́culo sobre estimación de fuentes de defectos visuales, se reporta que
se estudiaron con un sensor de inspección 356 matrices de silicio, de las cuales 201 pasaron la prueba.
Construir el intervalo bilateral de confianza de 95 % para la proporción poblacional de matrices que
pasa la prueba.

Problema 8: [7.23] En un artı́culo sobre evaluación bajo impacto de cascos de football americano,
se reporta que en una muestra de 37 cascos del tipo de suspensión sometidos a determinado impacto,
24 mostraron daños. Sea p la proporción poblacional de cascos que se dañan en la prueba de impacto.
a) Coanstruir el intervalo de confianza de 95 % para p.
b) ¿Qué tamaño de muestra serı́a necesario para que el ancho de un intervalo de confianza de 99 %
sea a lo sumo 0,10, independientemente de p̂?
Ayuda: Utilice el valor de p̂ que maximiza la varianza del estimador.

Problema 9: [7.28*] Determine los valores de las siguientes cantidades:


a) t0,10;15 ; b) t0,05;15 ; c) t0,05;25 ; d) t0,05;40 y e) t0,005;40 .

Problema 10: [7.29] Determine el valor crı́tico de t que contiene el área descripta en cada uno de
los siguientes casos:
a) área central = 0,95, gl = 10;
b) área central = 0,95, gl = 20;
c) área central = 0,99, gl = 20;
d) área central = 0,99, gl = 50;
e) área de la cola superior = 0,01, gl = 25;

2
f ) área de la cola inferior = 0,025, gl = 5.

Problema 11: [7.30] Determine el valor crı́tico de t para un intervalo bilateral de confianza en cada
uno de los siguientes casos:
a) 95 %, gl = 10; b) 95 %, gl = 15; c) 99 %, gl = 15;
d) 99 %, gl = 5; e) 98 %, gl = 24; f ) 99 %, gl = 38.

Problema 12: [7.33] Un artı́culo sobre envejecimiento del papel aislante en transformadores de
potencia, contiene la siguiente tabla sobre el grado de polimerización en muestra de papel para los
cuales la viscosidad multiplicada por la concentración se ubica en valores intermedios:
418 421 421 422 425 427 431 434 437
439 446 447 448 453 454 463 465
a) Trace un diagrama de caja de los datos y comente las caracterı́sticas de interés.
b) ¿Es factible que estas observaciones muestrales se correspondan con una distribución poblacional
normal?
c) Construir un intervalo bilateral de confianza de 95 % para el grado de polimerización medio a partir
de los datos de la tabla. A partir del intervalo construido. ¿es factible el valor 440 para la polimerización
poblacional promedio?, ¿y 450?

Problema 13: [7.12*] Se conoce que la distribución de duraciones del eco de radar que produce un
relámpago es normal. Si se dispone de una muestra de n = 11 tiempos de ecos de radar generados
por relámpagos, con promedio 0,81 s y desviación estándar muestral 0,34 s, construir un intervalo de
confianza de 99 % para la media poblacional,
a) si se desconoce la varianza poblacional;
b) si la varianza poblacional es σ 2 = 0,09 s2 .

Problema 14: [7.40] Determine los valores de las siguientes cantidades:


a) χ20,1;15 ; b) χ20,1;25 ; c) χ20,01;25 ; d) χ20,005;25 ; e) χ20,99;25 y f ) χ20,995;25

Problema 15: [7.41*] Determine para una distribución χ2 :


a) El 95to percentil con ν = 10.
b) El quinto percentil con ν = 10.
c) P (10,98 ≤ χ2 ≤ 36,78) con ν = 22.
d) P (χ2 < 14,611 ó χ2 > 37,652) con ν = 25.

Problema 16: [7.43] Se efectuaron las siguientes observaciones de resistencia a la fractura de placas
base de 18 % de acero maragizado al nı́quel:
69.5 71.9 72.6 73.1 73.3 73.5 75.5 75.7 75.8 76.1 76.2
76.2 77.0 77.9 78.1 79.6 79.7 79.9 80.1 82.2 83.7 93.7
Construir un intervalo de confianza de 99 % para la desviación estándar poblacional de la distribución
de resistencia a la fractura. ¿Bajo qué condiciones es válido el cálculo realizado?

Problema 17: [7.44*] Los resultados de una análisis de turbiedad Wagner de 15 muestras patrón de
prueba Ottawa resultan (en microamperes)
26.7 25.8 24.0 24.9 26.4 25.9 24.4 21.7
24.1 25.9 27.3 26.9 27.3 24.8 23.6

3
a) Calcular los cuartiles inferior (Q1 ), superior (Q3 ), la mediana (x̃ = Q2 ), el promedio (x̄) y desvı́o
estándar muestral (Sn−1 ), para este conjunto de datos.
b) Construir un intervalo de confianza con nivel de 95 % para la varianza poblacional (σ 2 ) y otro para
la desviación estándar poblacional (σ) de la turbiedad.
c) ¿Bajo qué condiciones son válidos estos intervalos?

Problema 18: [1.36*] Una muestra de 26 trabajadores de cierta plataforma marina tomaron parte
en un simulacro de evacuación (para casos de emergencia), y se obtuvieron los siguientes tiempos (en
segundos) para completar el desalojo (“Oxygen Consumption and Ventilation During Escape from a
Offshore Platform”, Ergonomics, 1997, pp. 281-292):

389 356 359 363 375 424 325 394 402


373 373 370 364 366 364 325 339 393
392 369 374 359 356 403 334 397

a) Calcular la media y la desviación estándar muestral.


b) Construir un intervalo de confianza con nivel de 95 % para la varianza poblacional (σ 2 ) y otro para
la desviación estándar poblacional (σ) de la resistencia.
c) ¿Bajo qué condiciones son válidos estos intervalos?

Problema 19: [1.71, 7.37] En un experimento para estudiar el caminar de las personas, se le pidió a
20 hombres sanos que caminaran en lı́nea recta a paso normal hacia una blanco situado a 60 m al
frente. Las cadencias (número de pasos por segundo) reportadas (Am. J. of Physical Anthropology,
1992, pp. 19–27) son:

.95 .85 .92 .95 .93 .86 1.00 .92 .85 .81
.78 .93 .93 1.05 .93 1.06 1.06 .96 .81 .96

Una gráfica de probabilidad respalda la hipótesis de que la distribución poblacional de cadencia es


aproximadamente normal.
a) Calcular el promedio y la desviación estándar muestral.
b) Contruir un intervalo de confianza de 95 % para la media poblacional de la cadencia.
c) Calcular la mediana y los cuartiles correspondientes a estos datos nuestrales.
d) Construir un intervalo de confianza con nivel de 95 % para la varianza poblacional (σ 2 ) y otro para
la desviación estándar poblacional (σ) de la cadencia.

Ayuda: Si en los últimos cuatro problemas se asume que las variables Xi son normales, entonces la
(n − 1) S 2
variable aleatoria tiene una distribución ji-cuadrada con (n − 1) grados de libertad.
σ2

4
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 8 ‡ – Pruebas de Hipótesis
Problema 1: [8.2] En los siguientes pares de afirmaciones, indique cuál no cumple con las reglas esta-
blecidas para formular hipótesis y por qué (los subı́ndices 1 y 2 distinguen cantidades correspondientes
a poblaciones o muestras independientes).
a) H0 : µ = 100, Ha : µ > 100
b) H0 : σ = 20, Ha : σ ≤ 20
c) H0 : p 6= 0,25, Ha : p = 0,25
d) H0 : µ1 − µ2 = 25, Ha : µ1 − µ2 > 100
e) H0 : S12 = S22 , Ha : S12 6= S22
f ) H0 : µ = 120, Ha : µ = 150
g) H0 : σ1 /σ2 = 1, Ha : σ1 /σ2 6= 1
h) H0 : p1 − p2 = −1, Ha : p1 − p2 < −0,1

Problema 2: [8.5*] Antes de convenir en la compra de un pedido grande de hojas de polietileno,


para un tipo de cables eléctricos de alta presión, llenos de aceite para submarino, una compañı́a desea
ver evidencia concluyente de que la verdadera desviación estándar de grosor del forro es menor de
0,05 mm. ¿Cuáles hipótesis deben probarse y por qué? En este contexto, ¿cuáles son los errores tipo I
y tipo II?

Problema 3: [8.9] Dos empresas distintas desean establecerse en cierta región y brindar servicios de
televisión por cable. Denote por p la proporción de subscriptores potenciales registrados que prefieren
la primera empresa sobre la segunda. Considere probar H0 : p = 0,5 contra Ha : p 6= 0,5, con base en
una muestra aleatoria de 25 individuos. Represente con X el número de subscriptores en la muestra
que está a favor de la primera empresa, y con x el valor observado de X.
a) ¿Cuál de las siguientes regiones de rechazo es la más adecuada y por qué?
R1 = {x : x ≤ 7 ó x ≥ 18},
R2 = {x : x ≤ 8},
R3 = {x : x ≥ 17}
b) En el contexto de la situación de este problema, describa cuáles son los errores tipo I y de tipo II.
c) ¿Cuál es la distribución de probabilidad del estadı́stico de prueba X cuando H0 es verdadera?
Utilı́cela para calcular la probabilidad de un error tipo I.
d) Calcule la probabilidad de un error tipo II para la región seleccionada cuando p = 0,3 y nuevamente
cuando p = 0,4, p = 0,6 y p = 0,7.
e) Mediante el uso de la región seleccionada, ¿Qué concluye si 6 de los 25 individuos favoreció a la
primera empresa?

c
Compilado por Pedro Pury – IUA 2012

1
Problema 4: [8.11*] La calibración de una báscula se somete a revisión según el resultado de
pesar 25 veces un espécimen de prueba de 10 kg. Suponga que los resultados de diferentes pesos son
independientes entre sı́ y que el peso en cada intento está normalmente distribuido con σ = 0,200 kg.
Represente con µ el verdadero promedio de lectura de peso de la báscula.
a) ¿Cuáles hipótesis deben probarse?
b) Suponga que la báscula debe ser revisada si |x̄ − 10| ≥ 0,1032, es decir, x̄ ≥ 10,1032 o x̄ ≤ 9,8968.
¿Cuál es la probabilidad de que la revisión se realice cuando no sea necesaria? (calcular α).
c) ¿Cuál es la probabilidad de que la revisión se considere innecesaria cuando µ = 10,1? ¿Cuándo
µ = 9,8? (calcular β).

d) Sea z = (x̄ − 10)/(σ/ n). ¿Para cuál valor de c es la región de rechazo de la parte (b) equivalente
a la región de “dos colas” si z ≥ c o z ≤ −c?
e) Si el tamaño muestral fuera sólo 10 en vez de 25, ¿cómo se alterarı́a el procedimiento de la parte
(d) para que α = 0,05?
f ) Mediante el uso de la parte (e), ¿qué concluye de los siguientes datos muestrales?:

9,981 10,006 9,857 10,107 9,888


9,728 10,439 10,214 10,190 9,793

g) Vuelva a expresar el procedimiento de prueba de la parte (b), en términos del estadı́stico de prueba

estandarizado Z = (X̄ − 10)/(σ/ n).

Problema 5: [8.15*] Considere que el estadı́stico de prueba Z tiene distribución normal estándar
cuando H0 es verdadera. Proporcione el nivel de significancia para cada una de las siguientes situa-
ciones:
a) Ha : µ > µ0 , región de rechazo z ≥ 1,88
b) Ha : µ < µ0 , región de rechazo z ≤ −2,75
c) Ha : µ 6= µ0 , región de rechazo z ≥ 2,88 o z ≤ −2,88

Problema 6: [8.18] Se sabe que el tiempo de secado de cierto tipo de pintura, bajo condiciones
especı́ficas de prueba está normalmente distribuido con σ = 9. Las hipótesis H0 : µ = 75 contra
Ha : µ < 75 deben probarse usando una muestra de n = 25 observaciones.
a) ¿A qué distancia por debajo del valor nulo está x̄ = 72,3? Medir la distancia en número de
desviaciones estándar del estimador X̄.
b) Si x̄ = 72,3, ¿cuál es la conclusión al usar α = 0,01?
c) ¿Cuál es α para el procedimiento de prueba que rechaza H0 cuando z ≤ −2,88?
d) Si se utiliza una prueba de nivel 0,01 con n = 100, ¿cuál es la probabilidad de cometer un error
tipo II (β) cuando µ = µ′ = 76?

Problema 7: [8.19*] Se ha determinado el punto de fusión de cada una de las 16 muestras de cierta
marca de aceite vegetal hidrogenado, con resultado x = 94,32 o F. Suponga que la distribución del
punto de fusión es normal con σ = 1,20 o F (conocido) y considere la prueba de hipótesis:

H0 : µ = 95 Ha : µ 6= 95

a) Escriba cuál es el estadı́stico normalizado adecuado para este problema y determine cuál es su
distribución de probabilidad.

2
b) Si se está dispuesto a aceptar una probabilidad de error de tipo I igual a 0,01, determinar la
correspondiente región de rechazo.
c) ¿Se rechaza o no H0 , si se considera la muestra del enunciado? Mantenga el nivel α = 0,01.
d) ¿Cuál es el P –valor de esta prueba?

Problema 8: [8.21] Se supone que el diámetro promedio poblacional de unas bolas de de cierto tipo
rodamientos es 0,5 pulgadas. Se efectúa una prueba t para someter a prueba la afirmación anterior.
¿A qué conclusión se llega en cada uno de los siguientes casos?
a) n = 13, t0 = 1,6, α = 0,05
b) n = 13, t0 = −1,6, α = 0,05
c) n = 25, t0 = −2,6, α = 0,01
d) n = 25, t0 = −3,9

Problema 9: [8.25] El porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso es 5,5. Para
probar si el verdadero promedio de porcentaje es 5,5, en una planta de producción en particular, se
analizaron 16 muestras obtenidas de manera independiente. Suponga que el porcentaje de SiO2 en
una muestra está normalmente distribuido con σ = 0,3 y que x̄ = 5,25.
a) Escribir las hipótesis nula y alternativa apropiadas para esta prueba, determine cuál es el estadı́stico
de prueba que debe usarse y calcule el valor que toma en la muestra.
b) Determinar si se rechaza la hipótesis nula con un nivel de significancia α = 0,01. Escribir la región
de rechazo utilizada para X.
c) Determinar el mı́nimo nivel de significancia alcanzado de la prueba (P –valor).

Problema 10: [8.29*] Se determinó la cantidad de desgaste de un eje, después de un recorrido fijo
de kilómetros para cada uno de n = 8 motores de combustión interna, que llevan cobre y plomo como
material antifricción, resultando en x̄ = 3,72 y s = 1,25, estando los resultados en 10− 2mm.
Si se supone que la distribución de desgaste del eje es normal con media µ, utilice una prueba t con
nivel significancia 0,05 para probar H0 : µ = 3,50 contra Ha : µ > 3,50.

Problema 11: [8.31] En un experimento diseñado para medir el tiempo necesario durante el cual
la vista de un inspector se acostumbra a una cantidad reducida de luz para inspección penetrante, el
tiempo promedio muestral para n = 9 inspectores fue 6,32 s y la desviación muestral 1,65 s. Previamen-
te se ha supuesto que el tiempo promedio de adaptación fue a lo sumo 7 s. Si se supone que los tiempos
de adaptación están normalmente distribuidos, ¿contradice la información la creencia anterior? Utilice
una prueba t con α = 0,1.

Problema 12: [8.35] De los registros nacionales de la Inspección Técnica Vehicular (ITV) se desprende
que el 70 % de los vehı́culos que se presentan a lo largo de un año superan el test de emisión de gases
contaminantes. En una determinada ciudad se encuentra que, luego de una campaña de concientización,
en una muestra al azar de 200 automotores superan la prueba exitosamente 156 de ellos.
a) Elabore una prueba de hipótesis para estudiar la evidencia estadı́stica de la afirmación de que la
campaña logro disminuir los contaminantes (es decir, mejoró la proporción de vehı́culos que superar
el test de emisión de gases). Indique cual es la hipótesis nula, la alternativa y destaque cuál es el
estadı́stico apropiado para esta prueba.
b) Especificar cuál es la región de rechazo que resulta si se asume que la probabilidad de error de tipo
I (α) es del 5 %. Indique para este caso si en base a la muestra considerada, se acepta o rechaza la

3
hipótesis nula.
c) Si se piensa que la proporción poblacional correcta es del 75 %, cuál es la probabilidad de error de
tipo II (β) que resulta para la prueba (con α = 0,05)?
d) ¿Cuál es el P –valor o mı́nimo nivel de significancia alcanzado en la prueba especificada? En base
a este valor, ¿se rechaza la hipótesis nula para α = 0,01?

Problema 13: [8.37*] Una muestra aleatoria de 150 donaciones recientes en un banco de sangre
revela que 92 eran sangre tipo A. ¿Sugiere esto que el porcentaje real de donadores tipo A difiere del
40 %, el porcentaje de la población con sangre tipo A? Haga una prueba con las hipótesis adecuadas
y con un nivel de significancia de 0,01. ¿Serı́a distinto el resultado si se usara un nivel de significancia
de 0,05?

Problema 14: [8.38*] En una biblioteca universitaria se realiza de forma anual un inventario completo
de libros en estantes. Dado que la implementación del inventario es costoso y mantiene cerrada la
biblioteca por una semana, el director de la biblioteca quiere investigar la posibilidad de posponer el
inventario del corriente año. Con ese fin, el bibliotecario selecciona al azar del catálogo 1000 libros y
luego de una búsqueda resulta que 15 de ellos están extraviados o mal colocados.
a) Construir un intervalo con una confianza del 97 % para la proporción poblacional de libros extra-
viados o mal colocados.
El bibliotecario esta dispuesto a posponer el inventario, si la proporción poblacional de libros extra-
viados o mal acomodados es menor a 0,02.
b) Formular las hipótesis nula y alternativa de cola inferior que ayude al bibliotecario en su decisión.
Escribir el estadı́stico de prueba y determinar cuál es su distribución de probabilidad.
c) Según la tradición de la biblioteca, se trabaja con un nivel de significancia α = 0,05. ¿Cuál es la
correspondiente región de rechazo? Expresarla en términos de p̂?
d) ¿Debe el bibliotecario posponer o no el inventario? Responder la pregunta en base a rechazar o no
la hipótesis nula formulada en (b).
e) Si la proporción de todos libros perdidos o mal colocados es en realidad 0,01, ¿cuál es la probabilidad
de que el inventario se realice (innecesariamente)? Responder calculando el correspondiente valor β.

Problema 15: [8.39*] El artı́culo “Statistical Evidence of Discrimination” (J. Amer. Stat. Assoc.,
1982, pp. 773-783) analiza el caso judicial Swain vs. Alabama (1965), en el cual se dijo que habı́a
discriminación contra negros en la selección del gran jurado. Los datos de un censo sugirieron que
25 % de los elegibles para prestar servicio como gran jurado eran negros, pero una muestra aleatoria
de 1050 llamados para presentarse para un posible servicio dio por resultado sólo 177 negros. Mediante
el uso de una prueba de nivel 0,01, ¿se concluye con estos datos que hay discriminación?

Problema 16: [8.41] Se proporcionan dos raquetas a cada jugador de tenis de un grupo de inter-
medios; una tiene cuerdas de nylon y la otra de tripa sintética. Después de varias semanas de jugar
con las dos raquetas, a cada jugador se le pide dar su preferencia por una de las dos. Represente con
p la proporción de los jugadores que prefieren la tripa en lugar del nylon, y sea X la cantidad de
jugadores en la muestra que prefieren la tripa. Como las cuerdas de tripa son mas costosas, examine
la afirmación de que a lo sumo el 50 % de los jugadores prefiere la tripa. Esto se formaliza tomando:
H0 : p = 0,5 y Ha : p > 0,5.
a) ¿Cuál de las regiones de rechazo {15, 16, 17, 18, 19, 20}, {0, 1, 2, 3, 4, 5} o {0, 1, 2, 3, 17, 18, 19, 20} es

4
la más apropiada y por qué las otras dos no son apropiadas?
b) ¿Cuál es la probabilidad de un error tipo I para la región seleccionada en la parte (a)? ¿Determinar
la región correspondiente para una prueba de nivel 0,05?
c) Si 60 % de todos los tenistas prefieren cuerdas de tripa, calcule la probabilidad de un error tipo II
usando la región apropiada de la parte (a). Repetir para el caso en que el 80 % de todos los tenistas
prefieren las de tripa.
d) Si de 20 jugadores, 13 prefieren cuerdas de tripa, ¿deberı́a rechazarse H0 si se utiliza un nivel de
significancia de 0,1?

Problema 17: [8.43*] Algunos cientı́ficos piensan que los robots jugarán un papel esencial en las
fábricas en los próximos 20 años. En un experimento para ver si es factible el uso de robots para
trenzar cables de de aviación, se empleó un robot para ensamblar 500 cables. Se examinaron los cables
y encontraron defectuosos 14 de ellos. Por otro lado, se sabe que los trenzadores de cables humanos
tienen una proporción de defectos de 0,03 (3 %).
a) Construir un intervalo de confianza de 97 % para la proporción poblacional de defectos en los cables
trenzados por robots.
b) Elaborar una prueba de hipótesis para someter a consideración la afirmación de que la proporción de
cables con defectos es menor para los robots que para los humanos. Determinar el valor del estadı́stico
de prueba (normalizado) resultante de la muestra.
c) Para un nivel de significancia α = 0,05, construir la región de rechazo y decidir si los datos
contradicen la afirmación.
d) Calcular el P -valor alcanzado en la muestra. Usando el valor P , decidir si se rechaza o no la
afirmación con α = 0,1.
e) Si se supone ahora que la proporción poblacional es p = 0,033, determinar la confianza del intervalo
construido en el ı́tem (a).

Problema 18: [8.45] Se proporcionan pares de valores P -valores y niveles de significancia α. Para
cada par exprese si el valor observado P llevarı́a al rechazo de H0 al nivel de significancia dado.
a) P -valor = 0,084, α = 0,05
b) P -valor = 0,003, α = 0,001
c) P -valor = 0,498, α = 0,05
d) P -valor = 0,084, α = 0,10
e) P -valor = 0,039, α = 0,01
f ) P -valor = 0,218, α = 0,10

Problema 19: [8.47] Se supone que los neumáticos para automóvil de cierto tipo recién comprados
deben llenarse a una presión de 30 lb/plg2 . Representemos con µ el verdadero promedio de presión.
Encuentre el P -valor asociado con cada valor del estadı́stico Z, calculado en la muestra, para probar
H0 : µ = 30 contra Ha : µ 6= 30.
a) z0 = 2,10, b) z0 = −1,75, c) z0 = −0,55, d) z0 = 1,41, e) z0 = −5,30

Problema 20: [8.49] La pintura para trazar rayas en las carreteras debe reflejar al luz para ser
claramente visible por la noche. Representemos con µ el promedio real de reflexión para un nuevo
tipo de pintura que se está examinando. La prueba H0 : µ = 20 contra Ha : µ > 20 se basará en una
muestra aleatoria de tamaño n, tomada de una población con distribución normal. ¿Qué conclusión

5
es adecuada en cada uno de los siguientes casos?
a) n = 15, t0 = 3,2, α = 0,05.
b) n = 9, t0 = 1,8, α = 0,01.
c) n = 24, t0 = −0,2, α razonable.

Problema 21: [8.51*] Un fabricante de aspirinas llena los frascos por peso en lugar de contar el
número de las tabletas. Cada frasco debe contener según la etiqueta 100 tabletas. El fabricante llena
los frascos asumiendo que el peso promedio de las tabletas es 1 gramos. Un estudio de la autoridad en
medicamentos encontró, utilizando un lote de 27 tabletas, que el peso promedio muestral por tableta
es 0,97 gramos y la desviación estándar muestral es 0,05 gramos.
a) Elaborar una prueba de hipótesis de cola inferior para someter a consideración la suposición del
fabricante sobre el peso de una tableta. Dar la hipótesis nula y la alternativa. Escribir el estadı́stico de
prueba (normalizado) adecuado, dar su distribución de probabilidad y determinar su valor observado
en la muestra.
b) Para un nivel de significancia α = 0,05, construir la región de rechazo y decidir si hay suficiente
evidencia estadı́stica para rechazar la hipótesis nula.
c) Acotar el P -valor alcanzado en la muestra. Dado que la tabla provista es incompleta, proporcionar al
menos un intervalo que contenga al P -valor. Usando el P -valor, decidir si se rechaza o no la afirmación
del fabricante con α = 0,01.

Problema 22: [8.53*] Los tiempos de activación (en segundos) para una muestra al azar de rociadores
de un sistema para prevención de incendios que utiliza una espuma acuosa, se resumen según:
Tamaño de la muestra: n = 13, media muestral: x̄ = 27,92 y desviación estándar muestral s = 5,62.
Se asume que la población de tiempos de activación es normal.
a) Según el fabricante, la media de tiempos de activación del sistema es menor a 25 s. Elaborar una
prueba de hipótesis de cola superior para someter a consideración la afirmación del fabricante. Escri-
bir el estadı́stico de prueba (normalizado) adecuado, dar su distribución de probabilidad y determinar
su valor observado en la muestra.
b) Para un nivel de significancia α = 0,05, construir la región de rechazo y decidir si los datos
muestrales contradicen la afirmación del fabricante.
c) Calcular el P -valor alcanzado en la muestra. Dado que la tabla provista es incompleta, proporcionar
al menos un intervalo que contenga al P -valor. Usando el valor P , decidir si se rechaza o no la afirmación
del fabricante con α = 0,01.
d) Si se conoce ahora que la desviación estándar poblacional es σ = 5,1, ¿cuál es la probabilidad de
cometer error tipo II si el verdadero valor poblacional es µ′ = 26?. Considerar la región dada en el
ı́tem (b).

6
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 9 ‡ – Inferencias Basadas en Dos Muestras
Problema 1: [9.1*] Un artı́culo en la revista Consumer Reports, de noviembre de 1983, comparó varios
tipos de baterı́as. Los valores medios de duración de baterı́as AA alcalinas marca Duracell y Eveready
Energizer fueron 4,1 y 4,5 horas, respectivamente. Suponga que éstos valores son las medias de duración
poblacionales.
a) Sea X̄ la duración promedio muestral de 100 baterı́as Duracell y Ȳ la duración promedio muestral de
100 baterı́as Eveready. ¿Cuál es el valor medio de X̄ − Ȳ (es decir, dónde está centrada la distribución
de X̄ − Ȳ )? ¿De qué manera influyen los tamaños muestrales especificados en su respuesta?
b) Suponga que las desviaciones estándar poblacionales de duración son 1,8 horas para baterı́as Du-
racell y 2,0 horas para baterı́as Eveready. Con los tamaños muestrales dados en el inciso (a), ¿cuál es
la varianza del estadı́stico X̄ − Ȳ , y cuál es su desviación estándar?
c) Para los tamaños muestrales dados en el inciso (a), trace una figura de la curva aproximada de la
distribución de X̄ − Ȳ (incluya una escala de medida en el eje horizontal). ¿La forma de la curva serı́a
necesariamente la misma para tamaños muestrales de 10 baterı́as de cada tipo? Explique.

Problema 2: [9.3] Se denota con µ1 al valor medio poblacional de duración de la superficie de rodado
para una marca de neumáticos radiales de primera calidad, de medida P205/65R15, y se representa
con µ2 al valor medio poblacional de duración para una marca de calidad económica de la misma
medida. Probar H0 : µ1 − µ2 = 5000 contra Ha : µ1 − µ2 > 5000 con nivel de significancia α = 0,01,
usando los siguientes datos: n1 = 45, x̄1 = 42500, s1 = 2200 y n2 = 45, x̄2 = 36800, s2 = 1500.

Problema 3: [9.7] ¿Los estudiantes universitarios hombres se aburren más fácilmente que sus com-
pañeras mujeres? Esta pregunta se examinó en el artı́culo “Boredom in Young Adults – Gender and
Cultural Comparisons” (J. of Cross-Cultural Psych., 1991, pp. 209-223). Los autores aplicaron la escala
de propensión al aburrimiento a 97 estudiantes hombres y a 148 mujeres en universidades de Estados
Unidos. ¿La siguiente información apoya la hipótesis de investigación de que la tasa de aburrimiento
es más alta para hombres que para mujeres?

Género Tamaño muestral Promedio muestral Desviación estándar muestral


Hombres 97 10.40 4.83
Mujeres 148 9.26 4.68

a) Escribir las hipótesis nula y alternativa apropiadas para esta investigación. Señalar cuál es el
estadı́stico normalizado adecuado para esta prueba, cuál es su distribución de probabilidad y qué valor
resulta, dada las muestras tomadas.

c
Compilado por Pedro Pury – IUA 2012

1
b) Determine si con un nivel de significancia α = 0,05 se rechaza la hipótesis nula.
c) Construir un intervalo de confianza de 95 % para la diferencia de las medias poblacionales µ1 − µ2 .

Problema 4: [9.17] Determinar los grados de libertad para la prueba t o el intervalo de confianza
con dos muestras, correspondientes a dos poblaciones con σ1 6= σ2 , en cada uno de los siguientes casos:
a) m = 10, n = 10, s1 = 5,0, s2 = 6,0
b) m = 10, n = 15, s1 = 5,0, s2 = 6,0
c) m = 10, n = 15, s1 = 2,0, s2 = 6,0
d) m = 12, n = 24, s1 = 5,0, s2 = 6,0
Nota: Los grados de libertad se estiman según:
!2
s21 s22
+
m n
ν=
(s21 /m)2 (s22 /n)2
+
m−1 n−1

Problema 5: [9.34] Procedimiento t con agrupamiento.


Suponer que las distribuciones poblacionales a las cuales corresponden las muestras que se comparan
no sólo son normales, sino que además tienen varianzas iguales. Sea σ 2 la varianza común; i. e.,
σ 2 = σ12 = σ22 . Esta varianza puede estimarse a partir de la la varianza muestral de agrupamiento:
   
m−1 n−1
s2p = s2 + s2 ,
m+n−2 1 m+n−2 2
donde m + n − 2 es la suma de los grados de libertad de las muestras. Se puede demostrar que la
variable normalizada:
(X̄ − Ȳ ) − (µ1 − µ2 )
t= r
1 1
Sp +
m n
tiene distribución t con m + n − 2 grados de libertad.
a) Escribir la expresión para el intervalo de confianza de µ1 − µ2 para la prueba t con agrupamiento.
b) Según el artı́culo: “Multiple Comparisons of Means Using Simultaneous Confidence Intervals”,
J. of Quality Technology, 232–241 (1989), una muestra de humidificadores ultrasónicos de determi-
nada marca tuvo producciones máxima de humedad (en onzas), en una cámara controlada, igua-
les a 14,0, 14,3, 12,2 y 15,1. Una muestra de una segunda marca, por su lado arrojó los valores:
13,6, 11,9, 11,2. Construir un intervalo para la diferencia de medias poblacionales entre las dos marcas,
usando el método de agrupamiento con una confianza del 95 %.
c) Construir ahora el correspondiente intervalo para la diferencia de medias poblacionales entre las
dos marcas, sin utilizar la hipótesis de agrupamiento.

Problema 6: [9.19] Se comparan dos sistemas de freno para automóviles midiendo las distancias de
frenado (en decı́metros) sobre pavimento mojado, a partir de una velocidad de 50 Km/h. Se desea
implementar la prueba de hipótesis formulada según:

H0 : µ1 − µ2 = −10
Ha : µ1 − µ2 < −10

2
Se toman dos muestras correspondientes a los dos sistemas de frenos de seis automóviles cada una y
se observa: x̄ = 115,7, s1 = 5,03 para la primera y ȳ = 129,3, s2 = 5,38 a partir de la segunda. Asumir
que las varianzas poblacionales son iguales para ambos sistemas de freno, lo cual permite implementar
un procedimiento con agrupamiento.
Ayuda: Recordar que en este caso la varianza muestral apropiada es el promedio ponderado:
m−1 n−1
s2p = s21 + s2
m+n−2 m+n−2 2
a) Señalar cuál es el estadı́stico adecuado para esta prueba y qué valor asume dada las muestras
tomadas.
b) Determine si con un nivel de significancia α = 0,01 se rechaza la hipótesis nula.
c) Construir un intervalo de confianza de 95 % para la diferencia de medias poblacionales µ1 − µ2 .

Problema 7: [9.25] El dolor de la parte baja de la espalda (LBP) es un problema grave de salud en
muchos entornos industriales. El artı́culo “Isodynamic Evaluation of Trunk Muscles and Low–Back
Pain Among Workers in a Steel Factory” (Ergonomics, 1995, pp. 2107-2117) informa el siguiente
resumen de datos sobre el alcance lateral de movimiento, en grados, para una muestra de trabajadores
sin historial de LBP y otra muestra con historial de esta afección.

Condición Tamaño muestral Promedio muestral DE muestral


Sin LBP 28 91.5 5.5
Con LBP 31 88.3 7.8

Calcular un intervalo de confianza de 90 % para la diferencia entre el alcance medio poblacional


del movimiento lateral en las dos condiciones. ¿El intervalo sugiere que el movimiento medio lateral
poblacional es distinto para las dos condiciones?, ¿la conclusión es distinta si se usa un nivel de
confianza de 95 %?

Problema 8: [9.26*] En un artı́culo sobre el estudio de la corrosión en contactos eléctricos se dan los
valores de caı́da de tensión (en Voltios) medidas en una muestra de conectores cableados con aleación
de aluminio y en otra cableados con aluminio EC:

cableado n promedio s
1. Aleación Al 20 17,5 0,55
2. Al EC 20 16,9 0,49

a) Construir un intervalo de confianza del 95 % para las diferencias poblacionales entre las caı́das de
tensión sobre cada tipo de conectores.
b) Mediante una prueba de hipótesis establecer si hay evidencia estadı́stica suficiente para soportar la
afirmación del artı́culo, que las caı́das de tensión en los conectores tipo 1 es mayor que en los conectores
tipo 2. Trabajar con un nivel de significancia α = 0,01.

Problema 9: [9.27] La tabla adjunta reseña los resultados de la fuerza (N) sobre la mano del tenista
en el momento del impacto, para muestras de jugadores expertos e intermedios. Las distribuciones de
fuerzas se pueden suponer normales en ambos casos. Se quiere decidir si la fuerza media realizada por
los jugadores expertos es mayor que la de los intermedios.

3
Jugador n promedio S
1. Experto 6 40,3 11,3
2. Intermedio 8 21,4 8,3
a) Describa la prueba de hipótesis adecuada para el problema, e indique a que tipo corresponde.
Señale cual es el estimador normalizado adecuado y cuál es su distribución de probabilidad.

b) Para un nivel de significación del 0,01 explique porque rechazarı́a o no la hipótesis nula.

Problema 10: [9.28] Retomar al ejercicio anterior y hacer una prueba de hipótesis de nivel 0,01 para
decidir si la fuerza media real ejercida después del impacto es mayor para los jugadores expertos que
para los intermedios, usando el método del P −valor.

Problema 11: [9.29*] La tabla adjunta recoge los valores muestrales de presión interna (en lb) de
latas de aluminio de 12 onzas llenas con bebidas gaseosas de zarzamora y cola respectivamente. Las
distribuciones de presión pueden asumirse normales para ambas poblaciones de latas. Se quiere decidir
si, según lo indica la muestra, la presión de las latas con zarzamora es menor a las de bebida cola.
Bebida n promedio S
1. Zarzamora 15 540 21
2. Cola 15 554 15
a) Describa la prueba de hipótesis adecuada para el problema, e indique a que tipo de cola corresponde.
b) Señale cuál es el estadı́stico de prueba apropiado y cuál es su distribución de probabilidad. ¿Qué va-
lor toma este estimador normalizado para estas muestras?
c) Para un nivel de significación del 1 % explicar porqué se rechazarı́a o no la hipótesis nula planteada
en (a). ¿Cuál serı́a su conclusión al 5 %?

Ayuda: En los cinco problemas anteriores, las distribuciones de las dos poblaciones se suponen norma-
les con distintas varianzas. Por lo tanto, el estimador normalizado se corresponde con una distribución
t con ν grados de libertad, estimados con el entero piso que resulta de la fórmula:
!2
s21 s2
+ 2
n1 n2
ν=
(s21 /n1 )2 (s22 /n2 )2
+
n1 − 1 n2 − 1

Problema 12: [9.47*] Se realiza un estudio para determinar si la fidelidad de los clientes que cambian
de marca inducidos por una campaña de marketing es menor que la de aquellos que optan por la
marca por propia convicción. Sean p1 y p2 las proporciones poblacionales de los clientes que cambian
de marca con y sin inducción de la publicidad y luego vuelven a comprar el mismo artı́culo. Probar
H0 : p1 − p2 = 0 contra Ha : p1 − p2 < 0 usando α = 0,01 y los datos muestrales: n1 = 200, X1 = 30 y
n2 = 600, X2 = 180, donde X es el número de éxitos en las muestras.

Problema 13: [9.51] Una muestra aleatoria de 5726 números telefónicos en uso de cierta región,
tomada en marzo de 1992, dio por resultado que 1105 no estaban en el directorio, y un año después,
una muestra de 5384 señaló que 980 números no estaban en el directorio.
Pruebar con un nivel de significancia de 0,10 si hay una diferencia entre las proporciones reales de
números que no aparecen en el directorio en esos dos años.

4
Instituto Universitario Aeronáutico
Facultad de Ingenierı́a

Probabilidad y Estadı́stica
Práctico No 10 ‡ – Regresión Lineal Simple
Problema 1: [12.15] Se determinaron los valores del módulo de elasticidad (MoE, la relación del
esfuerzo, es decir, fuerza por unidad de área, a la deformación unitaria, es decir, la deformación por
unidad de longitud, en GPa) y la resistencia a la flexión (medida de la capacidad de resistir falla
por flexión, en MPa) para una muestra de vigas de concreto de cierto tipo, resultando los siguientes
datos (obtenidos de una gráfica del artı́culo “Effects of Aggregates and Microfillers on the Flexural
Properties of Concrete”, Magazine of Concrete Research, 1997, pp.81-98).

MoE 29,8 33,2 33,7 35,3 35,5 36,1 36,2


Resistencia 5,9 7,2 7,3 6,3 8,1 6,8 7,0
MoE 36,3 37,5 37,7 38,7 38,8 39,6 41,0
Resistencia 7,6 6,8 6,5 7,0 6,3 7,9 9,0
MoE 42,8 42,8 43,5 45,6 46,0 46,9 48,0
Resistencia 8,2 8,7 7,8 9,7 7,4 7,7 9,7
MoE 49,3 51,7 62,6 69,8 79,5 8,0
Resistencia 7,8 77,7 11,6 11,3 11,8 10,7

a) Trazar un diagrama de tallo y hojas con los valores del módulo de elasticidad y comente las
propiedades interesantes.
b) ¿El valor de resistencia está determinado total y únicamente por el valor del módulo de elasticidad?
c) Utilice los siguientes resultados, obtenidos con MINITAB, para obtener la ecuación de la recta
de mı́nimos cuadrados y calcular la resistencia al conocer el módulo de elasticidad, luego determine
la resistencia de una viga cuyo módulo de elasticidad sea 40. ¿Confiarı́a en el uso de la recta de
mı́nimos cuadrados para calcular la resistencia cuando el módulo de elasticidad fuera 100? Explique
su respuesta.

Predictor Coef Stdev t-ratio p


Constant 3,29250 0,60080 5,48 0,000
mod elas 0,10748 0,01280 8,40 0,000
s= 0,8657 R-sq= 73,8 % R-sq(adj)= 72,8 %

Analysis of Variance
SOURCE DF SS MS F p
Regression 1 52,870 52,870 70,55 0,000
Error 25 18,736 0,749
Total 26 71,605

c
Compilado por Pedro Pury – IUA 2012

1
d) ¿Cuáles son los valores de SSE, SST y del coeficiente de determinación? ¿Esos valores sugieren que
el modelo de regresión lineal simple describe de manera eficiente la relación entre las dos variables?
Explique.

Problema 2: [12.17] En el artı́culo “Use of Fly Ash or Silica Fume to Increase the Resistance of
Concrete to Feed Acids” (Magazine of Concrete Research, 1997, pp. 337-344) se presenta una regresión
de y = contenido de calcio (g/l) sobre x = material disuelto (mg/cm2 ). La ecuación de la recta de
regresión estimada es y = 3,678 + 0,144 x, con r2 = 0,860, basada en n = 23.
a) Interpretar la pendiente estimada 0,144 y el coeficiente de determinación 0,860.
b) Calcular una estimación puntual del contenido promedio real de calcio cuando el material disuelto
es 50 mg/cm2 .
c) El valor de la suma total de cuadrados es SST= 320,398. Calcular una estimación de la desviación
estándar del error σ en el modelo de regresión lineal simple.

Problema 3: [12.19*] La siguiente información es representativa de lo reportado en el artı́culo “An


Experimental Correlation of Oxides of Nitrogen Emissions from Power Boilers Based on Field Data”
(J. Eng. for Power, julio de 1973, pp. 165-170), con x = calor liberado por hora y por unidad de área
de un quemador (MBtu/h-pie2 ) e y rapidez de emisión de NOx (ppm):

x 100 125 125 150 150 200 200


y 150 140 180 210 190 320 280

x 250 250 300 300 350 400 400


y 400 430 440 390 600 610 670

a) Suponer que el modelo de regresión lineal simple es válido y obtener la estimación de mı́nimos
cuadrados de la recta de regresión.
b) ¿Cuál es la estimación de la rapidez de emisión de NOx cuando la rapidez de liberación por unidad
de área del quemador es igual a 225?
c) Estime la cantidad por la cual se espera que la rapidez de emisión de NOx cambie cuando la rapidez
de liberación por unidad de área del quemador disminuya en 50.
d) ¿Utilizarı́a la recta de regresión estimada para pronosticar la rapidez de emisión para una rapidez
de liberación de 500? ¿Por qué sı́ o por qué no?

Problema 4: [12.33] Observar el resultado de MINITAB del ejercicio 1).


a) Utilizar el resultado para calcular un intervalo de confianza a nivel de confianza de 95 %, para la
pendiente β1 de la recta de regresión, e interpretar el intervalo resultante.
b) Anteriormente se creı́a que cuando el módulo de elasticidad aumentaba en 1 GPa, el cambio real
promedio asociado de resistencia a la flexión serı́a a lo sumo 0,1 MPa. ¿Los datos muestrales contradicen
esta hipótesis? Formule y pruebe las hipótesis relevantes.

Problema 5: [12.35] El artı́culo “Root Dentine Transparency: Age Determination of Human Teeth
Using Computarized Densitometric Analysis” reporta sobre una investigación de métodos para de-
terminar la edad con base en caracterı́sticas de los dientes. Con x = porcentaje de raı́z con dentina
transparente e y = edad (en años), considere la siguiente información representativa:

x 15 19 31 39 41 44 47 48 55 64
y 23 52 65 55 32 60 78 59 61 60

2
a) Construir un intervalo de confianza de 95 % para el cambio esperado en edad, asociado con 1 % de
aumento en el contenido de dentina transparente. ¿Qué sugiere el intervalo acerca de la utilidad del
modelo?
b) Realizar una prueba sobre utilidad del modelo basado en el P −valor. ¿Utilizarı́a la recta de mı́nimos
cuadrados para pronosticar la edad a partir del contenido de dentina transparente? Explique.

Problema 6: [12.37*] El artı́culo “Hydrogen, Oxygen, and Nitrogen in Cobalt Metal”(Metallurgia,


1969, pp. 121-127) contiene una gráfica de los siguientes pares de datos, donde x = presión de gas
extraı́do (micrones) e y = tiempo de extracción (minutos):

x 40 130 155 160 260 275 325 370 420 480


y 2,5 3,0 3,1 3,3 3,7 4,1 4,3 4,8 5,0 5,4

a) Estimar σ y la desviación estándar de βˆ1 .


b) Suponer que, antes del experimento, los investigadores creı́an que podrı́a haber un incremento
de 0,0060 min. en el tiempo promedio de extracción, asociado con un incremento de 1 micrón en la
presión. Usar el método del P −valor y dar la conclusión con el nivel de significancia 0,10. ¿Contradice
esta información la suposición previa?

Problema 7: [12.57] El artı́culo “Behavioral Effects of Mobile Telephone Use During Simulated
Driving” informa que para una muestra de 20 personas, el coeficiente de correlación muestral entre
x = edad e y = tiempo de haber obtenido la licencia de manejo (años) fue 0,97. ¿Por qué el valor de
r es tan cercano a 1? (Los autores presentaron una explicación en su artı́culo).

Problema 8: [12.59*] La resistencia y lo fibroso del espárrago son los principales determinantes de su
calidad. Éste fue el enfoque de un estudio reportado en “Post-Harvest Glyphosphate Application Re-
duces Toughening, Fiber Content, and Lignification of Stored Asparagus Spears”. El artı́culo contenı́a
los siguientes datos (determinados en una gráfica) sobre x = esfuerzo de corte (Kg) e y = porcentaje
de peso seco de fibra.

x 46 48 55 57 60 72 81 85 94
y 2,18 2,10 2,13 2,28 2,34 2,53 2,28 2,62 2,63

x 109 121 132 137 148 149 184 185 187


y 2,50 2,60 2,79 2,80 3,01 2,98 3,34 3,49 3,26
P P 2
n = 18 xi = 1950 xi = 251970
P P 2 P
yi = 47,92 yi = 130,6074 xi yi = 5530,92

a) Calcule el valor del coeficiente de correlación muestral. Con base en este valor, ¿cómo describirı́a
la naturaleza de la relación entre las dos variables?
b) Si un primer espécimen presenta un valor de esfuerzo de corte mayor que un segundo espécimen,
¿qué se puede decir acerca de la comparación de los pesos en seco de fibra para los dos especı́menes?
c) Si la fuerza de corte se expresa en libras, ¿qué sucede con el valor de r? ¿Por qué?
d) Si el modelo de regresión lineal simple se ajustará a estos datos, ¿qué proporción de la variación
observada de porcentaje de peso seco de fibra se podrı́a explicar con la relación del modelo?
e) Realice una prueba con nivel de significancia de 0,01 para decidir si hay una relación lineal positiva
entre las dos variables.

3
Pequeño Resumen de Fórmulas de la Regresión lineal simple:
• Modelo lineal: Yi = β0 + β1 xi + ǫ,
donde: ǫ es una variable aleatoria normal con: E[ǫ] = 0 y Var[ǫ] = σ 2 .
• Estimadores de los parámetros:

Sxy
βˆ1 = , βˆ0 = y − βˆ1 x
Sxx
donde:
!2
X
n
2
X
n
1 Xn
Sxx = (xi − x) = x2i − xi ,
i=1 i=1
n i=1
! !
X
n X
n
1 Xn X
n
Sxy = (xi − x) (yi − y) = x i yi − xi yi
i=1 i=1
n i=1 i=1

• Estimador de σ 2 :
A partir de los valores estimados de y: ŷi = βˆ0 + βˆ1 xi se calculan los residuos: ǫi = yi − ŷi y se
construye la suma de los cuadrados de los errores:

X
n X
n X
n X
n
SSE = (yi − ŷi ) =2
yi2 − βˆ0 yi − βˆ1 x i yi
i=1 i=1 i=1 i=1

SSE
σˆ2 = S 2 =
n−2
• Coeficiente de Determinación (r2 ):
SSE es una medida de la variación en la variable Y no explicada por el modelo lineal. La variación
total viene dada por suma total de cuadrados:
!2
X
n
2
X
n
1 Xn
SST = Syy = (yi − y) = yi2 − yi
i=1 i=1
n i=1

SSE
r2 = 1 −
SST
• Inferencias sobre β1 : Pn
i=1 (xi − x)
Dado que puede escribirse: βˆ1 = Yi
Sxx
resulta que βˆ1 es un estimador con distribución normal, insesgado y con varianza: Var[β1 ] = σ 2 /Sxx .
βˆ1 − β1
Entonces, el estadı́stico: T = tiene distribución t con (n − 2) g.l.
S

Sxx
• Coeficiente de Correlación Muestral (r):

Sxy
r=√ p
Sxx Syy

Problemas extraı́dos de Probabilidad y Estadı́stica para Ingenierı́a y Ciencias, Jay L. Devore,


Thomson Learning, 5ta edición (2001) y compilados por Pedro Pury. Typeset in LATEX 2012.c

4
Distribuciones Discretas
nombre soporte pX (k) (q = 1 − p) FX (k) E[X] V[X]
 

 

p, si k = 0 p, si 0 ≤ k < 1
Bernoulli k = 0, 1  
q pq
 q, si k = 1  1, si k ≥ 1

Geométrica k = 1, 2, . . . p q k−1 1 − qk 1/p q/p2


 
n
  pk q n−k
Binomial k = 1, 2, . . . , n Bin(k; n, p) np npq
k
−λ λk −λ
k
X λj
Poisson k = 0, 1, . . . e e λ λ
k! j=1 j!

Distribuciones Continuas
nombre soporte fX (k) FX (x) E[X] V[X]
Uniforme a<x<b 1/(b − a) (x − a)/(b − a) (a + b)/2 (b − a)2 /12

Exponencial x>0 λ exp(−λ x) 1 − exp(−λ x) 1/λ 1/λ2


 
1 (x − µ)2 
Normal −∞ < x < ∞ √ 
exp − Φ((x − µ)/σ) µ σ2
2 πσ 2 σ2

También podría gustarte