Está en la página 1de 8

Prácticas de modelos con R

Elaborado por PhD Willin Álvarez

Práctica de Contrastes de hipótesis, Diseño completo al azar y Regresión


Lineal Simple

Estimado estudiante te presento la guía para la práctica 2, cada uno de los ejercicios que
se presentan deben ser resueltos por R y guardar los resultados para que puedan ser
utilizados como material de apoyo para responder a las preguntas que estarán escritas en
un cuestionario como PRÁCTICA 2.

I.- Contrastes de Hipótesis

1.- Doce inspectores midieron el diámetro de un cojinete de bolas, utilizando cada uno dos tipos
diferentes de calibradores. Los resultados fueron

Inspector 1 2 3 4 5 6 7 8 9 10 11 12

Calibrador 1 0.265 0.265 0.266 0.267 0.267 0.265 0.267 0.267 0.265 0.268 0.268 0.265

Calibrador 2 0.264 0.265 0.264 0.266 0.267 0.268 0.264 0,265 0.265 0.267 0.268 0.269

a) ¿Existe una diferencia significativa entre las medias de la población de mediciones de las que se
seleccionaron las dos muestras? Utilizar 𝛼 = 0.05.
h) Encontrar el valor P para la prueba del inciso a.
c) Construir un intervalo de confianza de 95 % para la diferencia en las mediciones de los
diámetros promedio para los dos tipos de calibradores.

2.- El tiempo para reparar un instrumento electrónico es una variable aleatoria medida en horas
que sigue una distribución normal. El tiempo de reparación de 16 de estos instrumentos elegidos
al azar es el siguiente:
Horas
159 280 101 212
224 379 179 264
222 362 168 250
149 260 485 170

a) Quiere saberse si el tiempo de reparación promedio excede 225 horas. Establecer las hipótesis
apropiadas para investigar esta cuestión.
b) Probar las hipótesis que se formularon en el inciso a. ¿A qué conclusiones se llega? 𝛼 = 0.05
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 95% para el tiempo de reparación promedio.
Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

3 .- Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0 onzas.
Puede suponerse que el proceso de llenado es normal, con desviaciones estándar de 𝜎1 = 0.015 y
𝜎2 = 0.018. El departamento de ingeniería de calidad sospecha que ambas máquinas llenan el
mismo volumen neto, sin importar si este volumen es 16,0 onzas o no. Se realiza un experimento
tomando una muestra aleatoria de la producción de cada máquina.

Máquina 1 Máquina 2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00

a) Enunciar las hipótesis que deberán probarse en este experimento,


b) Probar estas hipótesis utilizando 𝛼 = 0.05, ¿A qué conclusiones se llega?
c) Encontrar el valor P para esta prueba.
d) Encontrar un intervalo de confianza de 95 % para la diferencia en el volumen de llenado
promedio de las dos máquinas.

4.- En un artículo de Journal of Strain Anafysis (vol. 18, no. 2) se comparan varios procedimientos
para predecir la resistencia al corte de vigas de placas de acero. Los datos para nueve vigas en la
forma del cociente de la carga predicha y la observada para dos de estos procedimientos, los
métodos Karlsruhe y Lehigh, son los siguientes:

Viga Método Método


Karlsruhe Lehigh
Sl/1 1.186 1.061
S2/1 1.151 0.992
S3/1 1.322 1.063
S4/1 1.339 1.062
S5/1 1.200 1.065
S2/1 1.402 1.178
S2/2 1.365 1.037
S2/3 1.537 1.086
S2/4 1.559 1.052

a) ¿Existe alguna evidencia que apoye la afirmación de que hay una diferencia en el desempeño
promedio entre los dos métodos? Utilizar a = 0.05.
b) ¿Cuál es el valor P para la prueba del inciso a?
c) Construir un intervalo de confianza de 95 % para la diferencia en la carga promedio predicha y la
observada.
d) Investigar el supuesto de normalidad en ambas muestras.
e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos métodos.
f) Comentar el papel del supuesto de normalidad en la prueba t pareada.
Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

II.- Diseño Completo al azar

1.- Se estudia la resistencia a la tensión del cemento portland. Pueden usarse económicamente
cuatro diferentes técnicas de mezclado. Se han colectado los siguientes datos:

Técnica Resistencia a la tensión


de (Ib/pulg2)
mezclado
1 3129 3000 2865 2890
2 3200 3300 2975 3150
3 2800 2900 2985 3050
4 2600 2700 2600 2765

a) Probar la hipótesis de que las técnicas de mezclado afectan la resistencia del cemento.
Utilizar 𝛼 = 0.05.
b) Construir una representación gráfica boxplot para comparar las resistencias a la tensión
promedio de las cuatro técnicas de mezclado. ¿A qué conclusiones se llega?
c) Usar el método LSD de Fisher con 𝛼 = 0.05 para hacer comparaciones entre pares de
medias.
d) Construir una gráfica de probabilidad normal de los residuales. ¿Qué conclusiones se
sacarían acerca de la validez del supuesto de normalidad?
e) Hacer un diagrama de dispersión de los resultados como ayuda para la interpretación de
los resultados de este experimento.
2.- Se llevó a cabo un experimento a fin de determinar si cuatro temperaturas de cocción
específicas afectan la densidad de cierto tipo de ladrillo. El experimento produjo los siguientes
datos:

Temperatura Densidad
100 21.8 21.9 21.7 21.6 21.7
125 21.7 21.4 21.5 21.4
150 21.9 21.8 21.8 21.6 21.5
175 21.9 21.7 21.8 21.4

a) ¿La temperatura de cocción afecta la densidad de los ladrillos? Utilizar 𝛼 = 0.05.


b) ¿Es apropiado comparar las medias utilizando la prueba del rango múltiple de Duncan (por
ejemplo) en este experimento?
c) Analizar los residuales de este experimento. ¿Se satisfacen los supuestos del análisis de
varianza?
d) Construir una representación gráfica de los tratamientos como en el ejercicio anterior. ¿Esta
gráfica resume adecuadamente los resultados del análisis de varianza del inciso a?
Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

3.- Un fabricante de televisores está interesado en el efecto de cuatro tipos diferentes de


recubrimientos para cinescopios de color sobre la conductividad de un cinescopio. Se obtienen los
siguientes datos de la conductividad:

Tipo de
Conductividad
recubrimiento

1 143 141 150 146


2 152 149 137 143
3 134 136 132 127
4 129 127 132 129

a) ¿Hay alguna diferencia en la conductividad debida al tipo de recubrimiento? Utilizar 𝛼 = 0.05.


b) Estimar la media global y los efectos de los tratamientos.
c) Calcular la estimación de un intervalo de confianza de 95% para la media del tipo de
recubrimiento 4.
Calcular la estimación de un intervalo de confianza de 99% para la diferencia media entre los tipos
de recubrimiento 1 y 4.
d) Probar todos los pares de medias utilizando el método LSD de Fisher con 𝛼 = 0.05.
e) Usar el método gráfico boxplot para comparar las medias. ¿Cuál es el tipo de recubrimiento
que produce la conductividad más alta?
f) Suponiendo que el recubrimiento tipo 4 es el que se está usando actualmente, ¿qué se
recomendaría al fabricante? Quiere minimizarse la conductividad.
Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

III.- Regresión Lineal Simple.

1.- Los datos de la tabla siguiente representan el rendimiento en carretera en millas por galón de
gasolina (MPG) y el desplazamiento del motor, para una muestra de 20 automóviles. (ejer.7)

Automóvil Fabricante Modelo Millas por Galón Desplazamiento del motor


1 Acura Legend 30 97
2 BMW 735i 19 209
3 Buick Regal 29 173
4 Chevrolet Cavalier 32 121
5 Chevrolet Celebrity 30 151
6 Chrysler Conquest 24 156
7 Dodge Aries 30 135
8 Dodge Dynasty 28 181
9 Ford Escort 31 114
10 Ford Mustang 25 302
11 Ford Taurus 27 153
12 Ford Tempo 33 90
13 Honda Accord 30 119
14 Mazda RX-7 23 80
15 Mercedes 260E 24 159
16 Mercury Tracer 29 97
17 Nissan Maxima 26 181
18 Oldsmobile Cutlass 29 173
19 Plymouth Laser 37 122
20 Pontiac Grand Prix 29 173

a) Ajuste el modelo lineal simple que relacione el rendimiento en carretera MPG (y) con el
desplazamiento del motor (x) utilizando mínimos cuadrados.

b) Encuentre una estimación del rendimiento por galón para un automóvil que tiene un motor con
un desplazamiento de 150 in3.

c) Obtenga el valor ajustado de y y el residuo correspondiente para un automóvil Ford Escort, con
un desplazamiento de motor de 114 in3.

d) Encuentre un intervalo de confianza del 95% para la pendiente.

e) Encuentre un intervalo de confianza del 95% para la ordenada en el origen.


Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

f) Encuentre un intervalo de confianza del 95% para el millaje en carretera por galón promedio
cuando el desplazamiento del motor es x=150 in3

g) Encuentre un intervalo de confianza del 95% para el millaje en carretera por galón cuando el
desplazamiento del motor es x=150 in3

h) ¿Qué proporción de variabilidad total en el rendimiento está explicada por el desplazamiento


del motor?

i) Haga una gráfica de los residuos contra 𝑦̂ y x y coméntelas.

j) Prepare una gráfica de probabilidad normal de los residuos. ¿Parece que se satisface la hipótesis
de la normalidad?

2.- Un artículo publicado en el Tappi Journal (marzo, 1986) presenta lo datos sobre la
concentración de licor verde Na2S y la producción de papel de una máquina. Los datos (obtenidos
de una gráfica) aparecen en la tabla siguiente. (ejer.8)

Licor Verde
40 42 49 46 44 48 46 43 53 52 54 57 58
(Na2S)
Producción 825 830 890 895 890 910 915 960 990 1010 1012 1030 1050

a) Ajuste un modelo de regresión lineal simple con la concentración de licor verde Na2S como y y la
producción como x. Dibuje un diagrama de dispersión de los datos y del modelo de mínimos
cuadrados ajustado a dichos datos.

b) Encuentre el valor ajustado de y que corresponde a x = 190 así como el residuo


correspondiente.

c) Encuentre la concentración promedio de licor verde Na2S cuando la tasa de producción es de


950 toneladas por día.

d) Pruebe la significación de la regresión con 𝛼 = 0.05. Encuentre el valor P de esta prueba.

e) Estime 𝜎 2 y los errores estándar de la pendiente y la ordenada en el origen.

f) Pruebe 𝐻0 : 𝛽0 = 0 contra 𝐻1 : 𝛽0 ≠ 0 con 𝛼 = 0.05 ¿Cuál es el valor P de esta prueba?

g) Encuentre un intervalo de confianza de 99% para 𝛽1

h) Encuentre un intervalo de confianza de 99% para 𝛽0

i) Encuentre un intervalo de confianza de 99% para la concentración promedio de Na2S cuando la


producción es 910 ton/día.
Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

j) Suponga que se añade una muestra más a los datos originales, donde y14 = 59 y x14 = 855
Prepare un diagrama de dispersión de y contra x. Ajuste el modelo de regresión lineal simple a las
14 observaciones

j.1.- Pruebe la significancia de la regresión con 𝛼 = 0.05

j.2.- Para este modelo Estime 𝜎 2

j.3.- Compare la estimación de 𝜎 2 obtenida en el inciso (j.2) con la obtenida en el inciso (e). ¿por
qué?

k) Calcule los residuos de este modelo. ¿El valor de e14 parece poco usual?

l) Prepare e interprete la gráfica de probabilidad normal de los residuos

m) Haga una gráfica de los residuos contra 𝑦̂ y x y coméntelas.

3.- Un artículo publicado en el Journal of Environmental Engineering (vol. 115, núm 3, 1989, págs.
608-619) informa los resultados de un estudio sobre la aparición de sodio y cloro en los arroyos
de la parte central de Rhode Island. Los datos siguientes muestran la concentración de cloro y (en
mg/l) y el área que rodea la cuenca x en porcentaje. (ejer.11)

y 4.4 6.6 9.7 10.6 10.8 10.9 11.8 12.1 14.3 14.7 15 17.3 19.2 23.1 27.4 27.7 31.8 39.5
x 0.19 0.15 0.57 0.7 0.67 0.63 0.47 0.7 0.6 0.78 0.81 0.78 0.69 1.3 1.05 1.06 1.74 1.62

a) Construya una gráfica de dispersión de los datos. ¿Parece plausible el uso de un modelo de
regresión lineal simple?

b) Ajuste un modelo de regresión lineal simple utilizando la técnica de mínimos cuadrados.

c) Estime la concentración promedio de cloro para una cuenca que tiene un área que sea 1% de la
superficie circunvecina.

d) Encuentre el valor ajustado que corresponde a 0.47 así como el residuo correspondiente.

e) Pruebe 𝐻0 : 𝛽1 = 0 contra 𝐻1 : 𝛽1 ≠ 0 con 𝛼 = 0.01.Utilizando el procedimiento de análisis de


la varianza

f) Encuentre el valor p

g) Estime 𝜎 2 y los errores estándar de 𝛽̂0 𝑦 𝛽̂1


Prácticas de modelos con R
Elaborado por PhD Willin Álvarez

h) Pruebe 𝐻0 : 𝛽0 = 0 contra 𝐻1 : 𝛽0 ≠ 0 con 𝛼 = 0.01 ¿Qué conclusiones pueden obtenerse?


¿Parece que el modelo ajustaría mejor los datos si se eliminase la ordenada en el origen?

i) Encuentre un intervalo de confianza del 99% para 𝛽1

j) Encuentre un intervalo de confianza del 99% para 𝛽0

k) Encuentre un intervalo de confianza del 95% para la concentración promedio de cloro cuando el
área es x=1%

l) ¿Qué proporción d variabilidad total en la concentración de cloro está explicada por el modelo
de regresión?

m) Prepare e interprete la gráfica de probabilidad normal de los residuos

n) Haga una gráfica de los residuos contra 𝑦̂ y x y coméntelas.

Referencias bibliográficas
Montgomery y Runger (2013). Probabilidad y Estadística aplicada a la ingeniería. Limusa
Wiley. 2da edición

Douglas C. Montgomery (2004)DISEÑQ Y ANÁLISIS DE EXPERIMENTOS. Limusa Wiley.

También podría gustarte