Está en la página 1de 27

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE INGENÍERIA

ESCUELA ACADÉMICA PROFESIONAL DE INGENIERÍA CIVIL

ESTADÍSTICA Y PROBABILIDADES

SOLUCIONARIO:

Del Capítulo 1 Del Libro “Estadística Para Ingenieros


Y Científicos” De William Nadivi
REALIZADO POR:

Cerquín Huamán, Vicky Janeth.

Delgado Flores, Luis

Malca Hidalgo, Marycielo

Ponce Abanto, Ricardo Sebastián

II Ciclo – Grupo A

DOCENTE:

Macetas

CAJAMARCA – PERÚ

Octubre 2019

EJERCICIOS PARA LA SECCIÓN 1.1


“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

1. Cada uno de los siguientes procesos implica el muestreo de una población. Defina
la población y diga si es tangible o conceptual.

a) Se recibe una remesa de pernos de un distribuidor. Para verificar si la remesa


es aceptable respecto de la fuerza de corte, un ingeniero selecciona diez pernos,
uno tras otro, del recipiente para probarlos.

 Respuesta: tangible

b) La resistencia de cierto resistor se mide cinco veces con el mismo óhmetro.

 Respuesta: conceptual

c) Un estudiante de posgrado que se especializa en ciencia ambiental forma parte


de un equipo de estudio que está evaluando el riesgo para la salud humana de
cierto contaminante presente en el agua de la llave en su pueblo. Una parte del
proceso de evaluación implica calcular la cantidad de tiempo que las personas
que viven en ese pueblo están en contacto con el agua de la llave. El estudiante
convence a los residentes del pueblo para que lleven una agenda mensual,
detallando la cantidad de tiempo que están en contacto con el agua de la llave
día con día.

 Respuesta: tangible

d) Se hacen ocho soldaduras con el mismo proceso y se mide la fuerza en cada


una.
 Respuesta: conceptual
e) Un ingeniero responsable del control de calidad tiene que calcular el porcentaje
de piezas fabricadas defectuosas en determinado día. A las 2:30 de la tarde
muestrea las últimas 100 piezas fabricadas.

 Respuesta: tangible

2. Si usted quisiera calcular la altura media de todos los estudiantes en una


universidad, ¿cuál de las siguientes estrategias de muestreo sería la mejor? ¿Por
qué? Observe que ninguno de los métodos son realmente muestras aleatorias
simples.

i. Medir la estatura de 50 estudiantes que se encuentran en el gimnasio durante el


juego de basquetbol en la escuela.

ii. Medir la estatura de todos los especialistas en ingeniería.

2
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

iii. Medir la estatura de los estudiantes, eligiendo el primer nombre de cada página
de la guía telefónica del campus universitario.

 Respuesta: Elegiría el 3, porque de esta forma seleccionaría a personas que no


tengan una tendencia sobre sus aficiones o su especialidad, sería más probable
encontrar un número de personas distintas que me represente a la población.

3. Verdadero o falso:

a) Una muestra aleatoria simple garantiza que refleja exactamente a la población


de la que se extrajo.

 Respuesta: falso

b) Una muestra aleatoria simple está libre de cualquier tendencia sistémica en


diferir de la población de la que se extrajo.

 Respuesta: verdadero

4. Una ingeniera de control de calidad extrae una muestra aleatoria simple de 50


anillos-O de un lote de varios miles. Mide el espesor de cada uno y descubre que 45
de ellos, 90%, cumple con cierta especificación. ¿Cuál de los siguientes enunciados
es correcto?

a) La proporción de anillos-O en el lote completo que cumple con la especificación


probablemente es igual a 90 por ciento.

b) La proporción de anillos-O en el lote completo que cumple con la especificación


probablemente está cerca de representar 90%, pero probablemente no es igual
al total.

 Respuesta:

5. Se ha usado durante mucho tiempo un proceso para la fabricación de botellas de


plástico y se sabe que 10% de éstas se encuentra defectuoso. Se está probando un
nuevo proceso que, se supone, reduce la proporción de defectos. En una muestra
aleatoria simple de 100 botellas producidas con el nuevo proceso, diez estaban
defectuosas.

a) Uno de los ingenieros sugiere que la prueba demuestra que el nuevo proceso no
es mejor que el proceso anterior, ya que la proporción de defectos es la misma.
¿Es ésta una conclusión justificada? Explique.

3
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

 Respuesta:

b) Suponga que hubieran sido solamente nueve las botellas defectuosas de la


muestra de 100. ¿Esto habría probado que el nuevo proceso es mejor?
Explique.

 Respuesta:

c) ¿Qué resultado presenta pruebas más evidentes de que el nuevo proceso es


mejor: encontrar nueve botellas defectuosas en la muestra o encontrar dos
botellas defectuosas en la muestra?

 Respuesta:

6. Con referencia al ejercicio 5. Verdadero o falso:

a) Si la proporción de defectos en la muestra es menor a 10%, es confiable


concluir que el nuevo proceso es mejor.

b) Si la proporción de defectos en la muestra es sólo ligeramente menor a 10%, la


diferencia bien podría ser completamente atribuible a la variación del
muestreo y no es confiable concluir que el nuevo proceso es mejor.

c) Si la proporción de defectos en la muestra es mucho menor a 10%, es muy poco


probable que la diferencia sea atribuible completamente a la variación del
muestreo, por lo que es confiable llegar a la conclusión de que el nuevo proceso
es mejor.

d) No importa qué tan pocos defectos aparezcan en la muestra, el resultado bien


podría ser completamente atribuible a la variación del muestreo, por lo que no
es confiable concluir que el nuevo proceso es mejor.

 Respuesta:

7. Para determinar si una muestra se debe tratar como una muestra aleatoria simple,
¿qué es más importante: un buen conocimiento de la estadística o un buen
conocimiento del proceso que produce los datos?

4
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

 Respuesta: para poder determinar si una muestra se debe tratar como muestra
aleatoria simple es mas importante un buen conocimiento del proceso que produce
los datos.

EJERCICIOS PARA LA SECCIÓN 1.2


1. Verdadero o falso: para cualquier lista de números, la mitad de ellos estará debajo
de la media.

 Respuesta:

2. ¿Es la media de la muestra siempre el valor que ocurre con más frecuencia? Si es
así, explique por qué. Si no, dé un ejemplo.

 Respuesta:

3. ¿Es la media de la muestra siempre igual a uno de los valores que está en la
muestra? Si es así, explique por qué. Si no, dé un ejemplo.

 Respuesta:

4. ¿La mediana de la muestra siempre es igual a uno de los valores de la muestra? Si es


así, explique por qué. Si no, dé un ejemplo.

 Respuesta:

5. Encuentre un tamaño de la muestra para el cual la mediana siempre sea igual a uno
de los valores en la muestra.

 Respuesta: el tamaño de la muestra tiene que ser un número impar para así poder
tomar el dato del centro el cual vendría a ser la mediana.

6. En cierta compañía, cada trabajador recibió un aumento de $50 por semana.


¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos?

 Respuesta:

7. En otra compañía, cada trabajador recibió un aumento de 5%. ¿Cómo afecta esto la
media de los sueldos? ¿Y la desviación estándar de los sueldos?

 Respuesta:

8. El puntaje de Apgar se usa para evaluar reflejos y respuestas de recién nacidos. A


cada bebé un profesional de la medicina le asigna un puntaje y los valores posibles

5
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

son enteros entre cero y diez. Se toma una muestra de mil bebés nacidos en cierto
condado y el número con cada puntaje es el siguiente:

a) Encuentre la media de la muestra de los puntajes de Apgar.

b) Encuentre la desviación estándar de la muestra de los puntajes de Apgar.

c) Encuentre la mediana muestral de los puntajes de Apgar.

d) ¿Cuál es el primer cuartil de los puntajes?

e) ¿Qué proporción de puntajes es más grande que la media?

f) ¿Qué proporción de puntaje es mayor en una desviación estándar que la media?

g) ¿Qué proporción de puntaje está dentro de una desviación estándar de la media?

9. Una clase de estadística con 40 estudiantes realizó una prueba. El puntaje posible
más alto era de cuatro puntos. Diez estudiantes obtuvieron cuatro puntos, 12
lograron tres puntos, ocho alcanzaron dos puntos, seis se beneficiaron con un punto
y cuatro obtuvieron cero puntos. Calcule la media, la mediana y la desviación
estándar de los puntajes.

10. Otra clase de estadística de 60 estudiantes realizó la misma prueba. En esta clase,
15 estudiantes obtuvieron cuatro puntos, 18 alcanzaron tres puntos, 12 lograron dos
puntos, nueve obtuvieron un punto y seis resultaron con cero puntos. Calcule la
media, la mediana y la desviación estándar de los puntajes.

 Solución:

Puntaje 0 1 2 3 4
alumnos 6 9 12 18 15

Media: x = [(6x0) +(1x9) +(2x12) +(3x18) +(4x15)]÷ 60 = 2.45

Mediana:
Como n=60 …es par entonces la mediana será el promedio de los datos que
ocupen el lugar 30 y 31.
 Dato del lugar 30=3
 Dato del lugar 31=3
6
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

Me= (3+3) ÷ 2=3


Desviación estándar:

Puntajes fi x i- x ( x i- x )^2 [( x i- x )^2]* f i


0 6 -2.45 6.0025 36.015
1 9 -1.45 2.1025 18.9225
2 12 -0.45 0.2025 2.43
3 18 0.55 0.3025 5.445
4 15 1.55 2.4025 36.0375
Sumatori 98.85
a=
1
2
s=
n−1 ∑ 2
[( xi ¿−x ) ]¿ f i ¿ 2
s =1/ (60-1) x98.85

2
s =1.6754
S =1.2943
 Respuesta: la media es 2.45, la mediana es 3 y la desviación estándar es 1.2943

11. En otra clase de estadística, el número total de estudiantes no se conoce. En esta


clase, 25% obtuvo cuatro puntos, 30% alcanzó tres puntos, 20% se benefició con dos
puntos,15% logró un punto y 10% resultó con cero puntos.

a) ¿Es posible calcular la media de los puntajes para esta clase? Si es así,
calcúlela. Si no, explique por qué.

b) ¿Es posible calcular la mediana de los puntajes para esta clase? Si es así,
calcúlela. Si no, explique por qué.

c) ¿Es posible calcular la desviación estándar de la muestra de los puntajes para


esta clase? Si es así, calcúlela. Si no, explique por qué.

12. Cada uno de los 16 estudiantes mide la circunferencia de una pelota de tenis por
cuatro métodos diferentes, éstos fueron:
Método A: Estimar la circunferencia a simple vista.
Método B: Medir el diámetro con una regla y después calcular la circunferencia.
Método C: Medir la circunferencia con una regla y cuerda.
Método D: Medir la circunferencia haciendo rodar la pelota a lo largo de una
regla.

7
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

Los resultados (en cm) son los siguientes, en orden creciente para cada método:

 Método A: 18.0, 18.0, 18.0, 20.0, 22.0, 22.0, 22.5, 23.0, 24.0, 24.0, 25.0, 25.0, 25.0,
25.0, 26.0, 26.4.
 Método B: 18.8, 18.9, 18.9, 19.6, 20.1, 20.4, 20.4, 20.4, 20.4, 20.5, 21.2, 22.0, 22.0,
22.0, 22.0, 23.6.
 Método C: 20.2, 20.5, 20.5, 20.7, 20.8, 20.9, 21.0, 21.0, 21.0, 21.0, 21.0, 21.5, 21.5,
21.5, 21.5, 21.6.
 Método D: 20.0, 20.0, 20.0, 20.0, 20.2, 20.5, 20.5, 20.7, 20.7, 20.7, 21.0, 21.1, 21.5,
21.6, 22.1, 22.3.

a) Calcule la media de las mediciones para cada método.

b) Calcule la mediana de las mediciones para cada método.

c) Calcule la media recortada a 20% de las mediciones para cada método.

d) Calcule el primero y el tercer cuartil para cada método.

e) Calcule la desviación estándar de las mediciones para cada método.

f) ¿En qué método es la desviación estándar más grande? ¿Por qué se esperaría
que este método tenga la desviación estándar más grande?

g) Sin que nada cambie ¿es preferible un método de medición que tenga una
desviación estándar más pequeña o uno con una desviación estándar más
grande? ¿O no importa? Explique.

13. Con referencia al ejercicio 12.

a) Si las mediciones para uno de los métodos se convirtieran a pulgadas (1


pulgada = 2.54 cm), ¿cómo afectaría esto la media? ¿Y la mediana? ¿Y los
cuartiles? ¿Y la desviación estándar?

b) Si los estudiantes midieran nuevamente la pelota, usando una regla marcada en


pulgadas, ¿los efectos sobre la media, la mediana, los cuartiles y la desviación
estándar serían los mismos que los del inciso a)? Explique.

14. Una lista de diez números tiene una media de 20, una mediana de 18 y una
desviación estándar de 5. El número más grande en la lista es 39.27.
Accidentalmente, este número se cambia a 392.7.

a) ¿Cuál es el valor de la media después del cambio?

8
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

b) ¿Cuál es el valor de la mediana después del cambio?

c) ¿Cuál es el valor de la desviación estándar después del cambio?

15. ¿Por qué nadie habla del cuarto cuartil? ¿O lo hacen?

 Respuesta: El cuartil 4, indica que el valor obtenido tiene bajo sí el 100% de la


distribución de datos. Por lo general no se calcula, debido a que es un hecho que el
último valor de la distribución lo representa

16. En cada uno de los siguientes conjuntos de datos, diga si el dato atípico parece ser
atribuible a un error, o si se podría suponer que es correcto.

a) Una roca se pesa cinco veces. Las lecturas en gramos son 48.5, 47.2, 4.91, 49.5,
46.3.

b) Un sociólogo muestrea cinco familias en cierto pueblo y registra sus ingresos


anuales. Los ingresos son $34 000, $57 000, $13 000, $12 00 000, $62 000.

EJERCICIOS PARA LA SECCIÓN 1.3


1. Parte de un estudio de control de calidad tuvo como objetivo mejorar una línea de
producción, se midieron los pesos (en onzas) de 50 barras de jabón. Los resultados
son los siguientes, ordenados del más pequeño al más grande

a)

b) Construya un histograma para estos datos.

c) Construya un diagrama de puntos para estos datos.

d) Construya un diagrama de caja para estos datos. ¿El diagrama de caja indica
datos atípicos?

9
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

2. Siguiendo una lista del número de sitios de residuos peligrosos en cada uno de los
50 estados federales de los Estados Unidos en abril de 1995. Los datos se tomaron de
The World Almanac and Book of Facts 1996 (World Almanac Books, Mahwah, NJ,
1996). La lista se ha ordenado numéricamente.

a) Construya un diagrama de tallos y hojas para estos datos.

b) Construya un histograma para estos datos.

c) Construya un diagrama de puntos para estos datos.

d) Construya un diagrama de caja para estos datos. ¿El diagrama de caja muestra
algún dato atípico?

3. Con referencia a la tabla 1.2 (p. 20). Construya un diagrama de tallos y hojas con
uno de los dígitos como tallo (para valores iguales o superiores a 10, el tallo tendrá
dos dígitos) y el dígito de las decenas como hoja. ¿Cuántos tallos hay (asegúrese de
incluir tallos deshojados)? ¿Cuáles son algunas de las ventajas y desventajas de
este diagrama, comparado con el de la figura 1?6 (p. 26)?

4. Se estudiaron dos métodos de recuperación de proteína. Se hicieron trece corridas


usando cada método y se registró la parte de proteína recuperada para cada
corrida. Los resultados son los siguientes:

a) Construya un histograma para los resultados de cada método.

10
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

Recuperacion de Proteinas
1.2
1
0.8
0.6
0.4
0.2
0
1

Series1 Series2

b) Construya diagramas de caja para comparar los dos métodos.

c) Usando los diagramas de caja, ¿qué diferencias se observan entre los resultados
de los dos métodos?

 Respuesta: Es más probable recuperar más proteínas por cada corrida con el
método 2 ya que su rango es menor que el del método 1.

5. Cada uno de los 32 estudiantes, que forman dos secciones de laboratorio con 16
estudiantes cada una, calculó la circunferencia
de una pelota de tenis a simple vista. Aquí se
muestran los resultados, en centímetros. (Los
resultados para el primer grupo de
estudiantes también se muestran en el ejercicio
12 de la sección 1.2.)

11
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

a) Construya un histograma para cada grupo.

b) Construya diagramas de caja comparativos para los dos grupos.

c) Usando diagramas de caja, ¿qué diferencias se pueden ver entre los resultados
del primero y del segundo grupo?

6. Dibuje un histograma para el cual:

a) La media es más grande que la mediana.

b) La media es menor que la mediana.

c) La media es aproximadamente igual a la mediana.

7. El siguiente histograma presenta la distribución de la presión sanguínea sistólica


para una muestra de mujeres. Use éste para responder las siguientes preguntas:
a) ¿Es el porcentaje de mujeres con presión sanguínea superior a 130 mm cercano
a 25, 50 o 75%?

b) ¿En qué intervalo hay más mujeres: 130-135 o 140-150 mm?

c) En el intervalo 125-130 mm, la altura del histograma es de 0.024. ¿Qué


porcentaje de mujeres tenía presión sanguínea en este intervalo?

12
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

8. El siguiente histograma presenta las cantidades de plata [en partes por millón
(ppm)] encontradas en una muestra de rocas. Falta un rectángulo del histograma.
¿Cuál es su altura?

9. Una muestra de 100 hombres tiene una estatura promedio de 70 pulgadas y una
desviación estándar de 2.5 pulgadas. Una muestra de 100 mujeres tiene una estatura
promedio de 64 pulgadas y desviación estándar de 2.5 pulgadas. Si se combinan
ambas muestras, la desviación estándar de la estatura de las 200 personas será

i. menor que 2.5 pulgadas

13
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

ii. mayor que 2.5 pulgadas

iii. igual a 2.5 pulgadas

iv. no se puede decir a partir de la información dada

(Sugerencia: No realice ningún cálculo. Sólo trate de dibujar histogramas para cada
muestra por separado, y después para la muestra combinada.)

 Respuesta: la desviación estándar de las 200 personas vendría a ser mayor que 2.5
pulgadas ya que al unir las dos muestras aumento el promedio.

10. Los siguientes son diagramas de caja que comparan la carga [en coulomb entre
mol (C/mol) × 10^-25] a pH 4.0 y a pH 4.5 para un conjunto de proteínas (del artículo
“Optimal Synthesis of Protein Purification Processes”, E. Vásquez Álvarez, M.
Leinqueo y J. Pinto, en Biotechnology Progress 2001:685-695). Verdadero o falso:

a) La mediana de la carga para el pH 4.0 es mayor que el 75avo. percentil de la carga


para el pH 4.5.

b) Aproximadamente 25% de las cargas para el pH 4.5 son menores que la carga más
pequeña en el pH 4.0.

c) Cerca de la mitad de los valores de la muestra para el pH 4.0 están entre 2 y 4.

d) Hay una proporción mayor de valores fuera de la caja para el pH 4.0 que para el
pH 4.5.

e) Ambas muestras están sesgadas a la derecha.

f) Ambas muestras contienen datos atípicos

14
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

11. Los siguientes son resúmenes estadísticos para dos conjuntos de datos, A y B.

a) Calcule los rangos intercuartiles tanto para A como para B.

b) ¿Los resúmenes estadísticos para A proporcionan suficiente información para


construir un diagrama de caja? Si es así, construya el diagrama de caja. Si no,
explique por qué.

c) ¿Los resúmenes estadísticos para B proporcionan la suficiente información para


construir un diagrama de caja? Si es así, construya el diagrama de caja. Si no,
explique por qué.

12. Relacione cada histograma con el diagrama de caja que representa el mismo
conjunto de datos

15
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

13. Refiérase a los datos de asfalto en el ejemplo 1.12 (p. 17).

a) Construya un diagrama de caja para los datos de asfalto.

b) ¿Qué valores, si los hay, son atípicos?

c) Construya una gráfica de puntos para los datos de asfalto.

d) Con el fin de construir diagramas de caja, se define un dato atípico como un


punto cuya distancia al cuartil más cercano es mayor a 1.5 IQR. Una definición
más general y menos precisa es que

e) un dato atípico es cualquier punto que está separado de la mayor parte de los
datos. ¿Hay puntos en el conjunto de datos del asfalto que son datos atípicos
bajo esta definición más general, pero no bajo la definición del diagrama de
caja? ¿Si es así, cuáles son?

14. Relacione cada diagrama de dispersión con el enunciado que lo describa mejor.

16
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

i. La relación entre x y y es casi lineal.

ii. La relación entre x y y no es lineal.

iii. No hay mucho que relacione a x con y.

iv. La relación entre x y y es casi lineal, menos un dato atípico.

 Respuesta: (i b), (ii d), (iii a), (iv c)

15. Para los siguientes datos:

a) Realice una gráfica de dispersión de y contra x. ¿Es la relación entre x y y casi


lineal o no lo es?

b) Calcule el logaritmo natural de cada valor de y. Esto se conoce como hacer una
transformación de log de y. Realice una gráfica de dispersión de ln y contra x. ¿La
relación entre x y ln y es casi lineal, o no lo es?

c) En general, es más fácil trabajar con cantidades que tienen una relación lineal
aproximada que con cantidades que no tienen una relación lineal. ¿Para estos
datos, pensaría que es más fácil trabajar con x y y o con x y ln y? Explique.

EJERCICIOS ADICIONALES PARA EL CAPÍTULO 1

1. Una vendedora convierte los pesos de los paquetes que vende de libra a kilogramos
(1 kg ≈ 2.2 lb).

a) ¿Cómo afecta esto la media del peso de los paquetes?

b) ¿Cómo afecta esto la desviación estándar de los pesos?

2. Con referencia al ejercicio 1. La vendedora empieza a usar un empaquetado más


pesado, lo que aumenta el peso de cada paquete en 50 gramos.

a) ¿Cómo afecta esto a la media del peso de los paquetes?

b) ¿Cómo afecta esto a la desviación estándar de los pesos?

17
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

3. Los circuitos integrados constan de canales eléctricos que están grabados en placas
de silicio. Cierta proporción de circuitos está defectuosa debido al “corte sesgado”, lo
que sucede cuando se graba demasiado material lejos de los canales, ello da como
resultado partes no grabadas en las placas, que son demasiado angostas. Se está
investigando un proceso rediseñado que implica presión más baja en la cámara de
grabado. El objetivo es reducir la tasa de corte sesgado a menos de 5%. De los
primeros 100 circuitos fabricados por el nuevo proceso, solamente cuatro indican
evidencias de corte sesgado. Verdadero o falso:

a) Debido a que solamente 4% de los 100 circuitos tenían corte sesgado, se puede
concluir que se ha alcanzado el objetivo.

b) Aunque los porcentajes de la muestra están debajo de 5%, esto podría


representar la variación del muestreo, así que es posible que el objetivo aún no
se ha alcanzado.

c) No hay caso en evaluar el nuevo proceso, porque no importa cuál es el


resultado, podía sólo atribuirse a la variación del muestreo.

d) Si muestreamos un número lo suficientemente grande de circuitos y si los


porcentajes de circuitos defectuosos están suficientemente por abajo de 5%,
entonces es razonable concluir que se ha alcanzado el objetivo.

4. Se lanza una moneda dos veces y cae “cara” ambas veces. Alguien dice: “Hay algo
deshonesto en esta moneda. Se supone que una moneda cae cara sólo la mitad de las
veces y no siempre.”

a) ¿Es razonable concluir que la moneda es deshonesta? Explique.

 Respuesta: existe una posibilidad del 25% de que al tirar dos veces una moneda
esta salga cara ambas veces por lo tanto la moneda no es deshonesta.

b) Si al lanzar la moneda caen 100 “caras” consecutivas, ¿es razonable concluir


que la moneda es deshonesta? Explique.

 Respuesta: ya que en esta ocasión la cantidad de veces de lanzar la moneda es


mucho mayor la probabilidad de que las 100 veces salgan cara disminuye vendría a
se 1 entre dos elevado a la 100; en conclusión, la moneda es deshonesta.

5. El número más pequeño en una lista se cambia de 12.9 a 1.29.

a) ¿Es posible determinar cuánto cambia la media? Si es así, ¿en cuánto cambia.

18
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

b) ¿Es posible determinar cuánto cambia la mediana? Si es así, ¿en cuánto


cambia? ¿Qué pasa si la lista consta de solamente dos números?

c) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así,


¿cuánto cambia?
6. Hay 15 números en una lista y el número más pequeño se cambia de 12.9 a 1.29.

a) ¿Es posible determinar cuánto cambia la media? Si es así, ¿cuánto cambia?

b) ¿Es posible determinar el valor de la media después del cambio? Si es así, ¿cuál
es el valor?

c) ¿Es posible determinar cuánto cambia la mediana? Si es así, ¿cuánto cambia?

d) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así,


¿cuánto cambia?

7. Hay 15 números en una lista y la media es 25. El número más pequeño en la lista se
cambia de 12.9 a 1.29.

a) ¿Es posible determinar cuánto cambia la media? Si es así, ¿cuánto cambia?

b) ¿Es posible determinar el valor de la media después del cambio? Si es así, ¿cuál
es el valor?

c) ¿Es posible determinar cuánto cambia la mediana? Si es así, ¿cuánto cambia?

d) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así,


¿cuánto cambia?

8. El artículo “The Selection of Yeast Strains for the Production of Premium Quality
South African Brandy Base Products” (C. Steger y M. Lambrechts, Journal of
Industrial Microbiology and Biotechnology, 2000:431-440) presenta información
detallada acerca de la composición compuesta volátil de la base de vinos hechos para
cada una de las 16 clases de levadura seleccionadas. Las siguientes son las
concentraciones de ésteres totales (en mg/L) en cada uno de los vinos.

a) Calcule la media de la concentración.

19
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

b) Calcule la mediana de la concentración.

c) Calcule el primer cuartil de las concentraciones.

d) Calcule el tercer cuartil de las concentraciones.

e) Construya un diagrama de caja para las concentraciones. ¿Qué características


revela?

9. Con respecto a los datos que se representan en el siguiente diagrama de caja, ¿cuál
de los enunciados siguientes es verdadero?

i. La media es más grande que la mediana.

ii. La media es menor que la mediana.

iii. La media es aproximadamente igual a la mediana.

 Respuesta: solo la (i) es verdadera.

10. Verdadero o falso: en cualquier diagrama de caja,

a) La longitud de los “bigotes” es igual a 1.5 IQR, donde el IQR es el rango


intercuartil.

b) La longitud de los “bigotes” podría ser más grande que 1.5 IQR, donde el IQR
es el rango intercuartil.

c) La longitud de los “bigotes” podría ser menor que 1.5 IQR, donde el IQR es el
rango intercuartil.

20
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

d) Los valores en los extremos de los “bigotes” son siempre valores del conjunto
de datos que se usan para construir el diagrama de caja.

11. Para cada uno de los histogramas siguientes, determine si el eje vertical ha sido
etiquetado correctamente.

12. En el artículo “Occurrence and Distribution of Ammoniumin Iowa Groundwater”


(K. Schilling, Water Environment Research, 2002:177-186), se midieron
concentraciones de amonio (en mg/L) en un total de 349 pozos aluviales en el estado
de Iowa. La media de la concentración fue de 0.27, la mediana fue de 0.10 y la
desviación estándar fue de 0.40. Si se dibujara un histograma con estas 349
mediciones,

i. estaría sesgado a la derecha.

ii. estaría sesgado a la izquierda.

21
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

iii. sería aproximadamente simétrico.

iv. su forma no se podría determinar sin conocer las frecuencias relativas

13. En el artículo “Vehicle-Arrival Characteristics at Urban Uncontrolled


Intersections” (V. Rengaraju y V. Rao, Journal of Transportation Engineering,
1995:317-323) se presentan los datos sobre las características de tráfico en diez
cruceros en Madras, India. Una de las características medidas fueron las velocidades
de los vehículos que se desplazaban por los cruceros. La tabla siguiente da 15avo.,
50avo. y 85avo. percentiles de la velocidad (en km/h) para dos cruceros.

a) Si se hubiera dibujado un histograma para las velocidades de vehículos que pasan


a través de la intersección A, ¿pensaría que está sesgado a la izquierda, sesgado a
la derecha, o casi simétrico? Explique.

b) Si se hubiera dibujado un histograma para las velocidades de vehículos que pasan


a través de la intersección B, ¿pensaría que está sesgado a la izquierda, sesgado a
la derecha, o casi simétrico? Explique.

14. La frecuencia acumulada y la frecuencia relativa acumulada para un intervalo de


clase dado son las sumas de las frecuencias y las frecuencias relativas,
respectivamente, sobre todas las clases, incluyendo la clase dada. Por ejemplo, si hay
cinco clases, con frecuencias 11, 7, 3, 14 y 5, las frecuencias acumulativas serían 11,
18, 21, 35 y 40, y las frecuencias relativas acumulativas serían 0.275, 0.450, 0.525,
0.875 y 1.000. Construya una tabla para presentar las frecuencias, las frecuencias
relativas y las frecuencias relativas acumuladas, para los datos del ejercicio 1 de la
sección 1.3, usando los intervalos de clase 11 -< 12, 12 -< 13, . . , 20 -< 21.

22
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

15. El artículo “Computing and Using Rural versus Urban Measures in Statistical
Applications” (C. Goodall, K. Kafadar y J. Tukey, The American Statistician,
1998:101-111) analiza los métodos para medir el grado a los cuales los condados de
los Estados Unidos son urbanos más que rurales. La siguiente tabla de frecuencias
presenta las frecuencias de población de los condados de los Estados Unidos. Las
poblaciones están en la escala log2; por consiguiente, el primer intervalo contiene
condados cuyas poblaciones son al menos de 2^6 = 64, pero menores que 2^12.4 =5
404 y así sucesivamente.

a) Construya un histograma a partir de la tabla de frecuencias.

b) Calcule la proporción de condados cuyas poblaciones son mayores a cien mil.

c) ¿Está el histograma sesgado a la izquierda, a la derecha, o casi simétrico?

d) Construya un histograma usando las poblaciones reales en vez de su logaritmo.


¿Por qué piensa usted que el artículo transformó las poblaciones a la escala
logarítmica?

16. El artículo “Hydrogeochemical Characteristics of Groundwater in a Mid-Western


Coasta1 Aquifer System” (S. Jeen, J. Kim y colaboradores, Geosciences Journal,
2001:339-348) presenta las mediciones de las propiedades de algunas aguas
subterráneas poco profundas en cierto sistema de acuífero de Corea. Las siguientes
son las mediciones de la conductividad eléctrica (en microsiemens por centímetro)
para 23 muestras de agua.

23
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

a) Encuentre la media.
b) Encuentre la desviación estándar

c) Encuentre la mediana.

d) Construya una gráfica de puntos.

e) Encuentre la media recortada a 10%.

f) Encuentre el primer cuartil.

g) Encuentre el tercer cuartil.

h) Encuentre el rango intercuartil.

i) Construya un diagrama de caja.

j) ¿Cuáles puntos, si los hay, son atípicos?

k) Si se hubiera construido un histograma, ¿estaría sesgado a la izquierda, sesgado a


la derecha, o casi simétrico?

17. La falta de agua ha sido tradicionalmente una preocupación muy importante en


las Islas Canarias. Los derechos sobre el agua se dividen en acciones, que son posesión
privada. El artículo “The Social Construction of Scarcity. The Case of Water in
Tenerife (Canary Islands)” (F. Aguilera-Klink, E. Pérez-Moriana, y J. Sánchez-
García, Ecological Economics, 2000:233-245) analiza que la extensión de muchas de
las acciones está concentrada entre pocos propietarios. La tabla siguiente presenta el
número de propietarios que poseen diferentes números de acciones. (Había 15
propietarios que poseían 50 acciones o más; que se han omitido.) Observe que es
posible poseer un número no entero de acciones; por ejemplo, el intervalo 2-< 3
contiene 112 personas que poseían al menos dos, pero menos de tres acciones.

24
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

a) Construya un histograma para estos datos.


b) Aproxime la mediana del número de acciones poseídas encontrando el punto para
el cual las áreas de cualquier lado son iguales.

c) Aproxime el primer cuartil del número de acciones poseídas encontrando el punto


para el cual 25% del área está a la izquierda.

d) Aproxime el tercer cuartil del número de acciones poseídas encontrando el punto


para el cual 75% del área está a la izquierda.

e) Aproxime la media del número de acciones poseídas calculando el centro de masa


del histograma.

f) Aproxime la varianza del número de acciones poseídas calculando el momento de


inercia con respecto a la media, bajo el supuesto de que toda la masa de un
rectángulo está concentrada en su punto medio.

18. El informe del editor, en noviembre de 2003, de la edición de Technometrics


proporciona la siguiente información respecto de la cantidad de tiempo que le toma
revisar artículos que fueron presentados para su publicación durante 2002. Para
propósitos computacionales, interprete la última categoría (> 9) como 9 -< 15

a) Construya un histograma para

b) Aproxime la mediana del tiempo de revisión encontrando el punto para el cual


las áreas en cualquier lado son iguales.

25
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

c) Aproxime el primer cuartil de los tiempos de revisión, encontrando el punto


para el cual 25% del área está a la izquierda.

d) Aproxime el tercer cuartil del tiempo de revisión encontrando el punto para el


que 75% del área está a la izquierda.
e) Aproxime la media del tiempo de revisión calculando el centro de masa del
histograma.

f) Aproxime la varianza del tiempo de revisión, calculando el momento de inercia


con respecto a la media, suponiendo que toda la masa de un rectángulo está
concentrada en su punto medio.

19. En el artículo “The Ball-on-Three-Ball Test for Tensile Strength: Refined


Methodology and Results for Three Hohokam Ceramic Types” (M. Beck, American
Antiquity, 2002:558-569) se analiza la resistencia de la cerámica antigua. Se
evaluaron algunas muestras de cada uno de tres tipos de cerámica. Las cargas (en kg)
requeridas para romper las muestras son las que aparecen en la tabla de la siguiente
columna.

a) Construya diagramas de caja comparativos para las tres muestras.

b) ¿Cuántos datos atípicos contiene cada muestra?

 Respuesta: Un dato es considerado atípico cuando z (z= (xi-media) /desviación estándar)


es menor que -3 o mayor que 3
En el caso de la cerámica Sacaton los datos atípicos encontrados fueron 11
En el caso de la cerámica Planicie del Río Gila los datos atípicos totales fueron 1

26
“UNIVERSIDAD NACIONAL DE CAJAMARCA”
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Civil

En el caso de la cerámica Sacaton los datos atípicos encontrados fueron 1

c) Comente acerca de las características de las tres muestras

 Respuesta: solo fue en el caso de la primera resistencia de la cerámica Sacaton que


tiene más datos atípicos lo que quiere decir es que esa resistencia se alea más de los
común respecto al promedio.

27

También podría gustarte