Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TALLER # 4
DISEÑO DE EXPERIMENTOS
UNIVERSIDAD AGRARIA DE COLOMBIA
BOGOTA 2019-2
PAULA ANDREA GUTIERREZ PIÑEROS ID 10892
ERIKA LIZETH GONZALEZ CALDERON ID 21935
JAVIER ALFREDO VARGAS CLAVIJO ID 5210
1. En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual, que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo
de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación.
a) ¿En este problema cuál variable se puede ver como independiente y cuál como dependiente?
La variable independiente son las horas de uso por que no dependen del diametro y la varibla dependiente es el diametro ya que en cada hora de uso este va cambiando.
b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales?
33
31 y = 0,0463x + 24,873
29
27 R² = 0,9764
25
0 50 100 150 200 250 300 350
Horas de uso
Debido a la manera que toma el grafico de dispersion de cada uno de los datos se puede obcervas que hay una relacion lineal positiva entre las horas de uso y el diametro y que las variables son proporcionales , es
decir que a medida que aumentan las horas de uso aumenta el diametro.
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
Haciendo la regresion leneal se obtiene la ecuacion de la linea recta de tendencia entre los puntos , la ecuacion es la siguiente:
y = 0,0463x + 24,873
H0= Las dos varibles de estudio son independientes
Esta hipotesis se rechaza debido a que en el grafico de dispersion se puede evidenciar que las variables si tienen una relacion lineal.
H1= Las dos variables estan relacionadas
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,988134765
Coeficiente de determinación R^2 0,976410313
R^2 ajustado 0,975099775
Error típico 0,700184664
Observaciones 20
Promedio de los
Grados de libertad Suma de cuadrados F Valor crítico de F
cuadrados
Al analizar los datos obtenidos del analisis de varianza y el valor de P , el cual es
Regresión 1 365,26 365,26 745,05 3,67 menor al nivel de confianza de 0.5, se puede decir que con un nivel de confianza
95 % se rechaza la hipotesis nula.
Residuos 18 8,825 0,490
Total 19 374,0895
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
El coeficiente de correlacion r es de 0,975099 =97,5099% que indica que el odelo tiene una calidad de ajuste satisfactoria , ya que explica el 97,50% de la variabilidad en diametro.
e) Si el diámetro máximo tolerado es de 45, ¿cuántas horas de uso estima que tiene esa herramienta?
El valor seria de 433,89 horas
f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos.
El valor de la pendiente es 0,0463 que indica la razon de cambio en el diametro (y) con respecto al cambio en las horas de uso (x), es decir cuanto va a variar el diametro cuando se varien las horas de uso.
g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad del ajuste
El error estandar es de 0,700 , indicando que la calidad de ajuste es buena , ya que si el error estandar de estimacion es menor la cantidad del ajuste sera mayor.
2. En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la página siguiente.
Tiempo (min) X Redimiento(%) Y
10 64 MEDIA X 14,67
15 81,7 MEDIA Y 75,47
20 76 n 12
8 68,5
12 66,6
13 77,9
15 82,2
12 74,2
14 70
20 76
19 83,2
18 85,3
a) ¿En este problema cuál variable se puede ver como independiente y cuál como dependiente?
La variable independiente (x) es el tiempo de extracción y la variable dependiente (y) es el rendimiento , debido a que el rendimiento siempre va a variar dependiento del tiempo,
b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales?
85
Rendimiento (%)
80
75
70
65 y = 1,1887x + 58,033
60
R² = 0,4488
10 12 14 16 18 20 22
Tempo (min)
Debido a la manera que toma el grafico de dispersion de cada uno de los datos se puede obcervar que hay una relacion lineal positiva entre el timepo de extraccion y el rendimiento y que las variables son
proporcionales , es decir que a medida que aumenta el tiempo de extraccion aumenta el rendimiento.
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
Haciendo la regresion leneal se obtiene la ecuacion de la linea recta de tendencia entre los puntos , la ecuacion es la siguiente:
y = 1,1887x + 58,033
H0= Las dos varibles de estudio son independientes
Esta hipotesis se rechaza debido a que en el grafico de dispersion se puede evidenciar que las variables si tienen una relacion lineal.
H1= Las dos variables estan relacionadas
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,600675941
Coeficiente de determinación R^2 0,360811586
R^2 ajustado 0,289790651
Error típico 3,230111604
Observaciones 11
ANÁLISIS DE VARIANZA
Suma de Promedio de los
Grados de libertad F Valor crítico de F Al analizar los datos obtenidos del analisis de varianza y
cuadrados cuadrados
el valor de P , el cual es menor al nivel de confianza de
Regresión 1 53,00650214 53,00650214 5,08035535 0,050673957
0.5, se puede decir que con un nivel de confianza 95 % se
Residuos 9 93,90258877 10,43362097
rechaza la hipotesis nula.
Total 10 146,9090909
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -12,97645734 12,4904719 -1,038908493 0,325952025 -41,23186781 15,27895313 -41,23186781 15,27895313
64 0,366850084 0,162757713 2,253964363 0,050673957 -0,001333441 0,735033609 -0,001333441 0,735033609
5
Análisis de los residuales
0
Observación Pronóstico 10 Residuos Residuos estándares 0 10 20 30 40 50 60 70 80 90
1 16,99519453 -1,995194527 -0,651098151 -5
64
2 14,90414905 5,095850952 1,662945186
3 12,15277342 -4,152773418 -1,355187706
4 11,45575826 0,544241742 0,177604132
5 15,60116421 -2,601164208 -0,848846157 Curva de regresión ajustada
6 17,17861957 -2,178619569 -0,710955826 25
7 14,2438189 -2,243818897 -0,73223253
20
8 12,70304854 1,296951456 0,423238278
9 14,90414905 5,095850952 1,662945186 15
10
y = 1,1887 (25) + 58,033 El intervalo de confianza esta definido entre 77,57 y 98,004 para un tiempo
1 25−14,66 ^2
de extraccion de 25 minutos
87,75 ± 2281 29,38( + )
12 170,66
TABLA 1 TABLA 2
Semana H Extras Defectos Semana H Extras Defectos
1 340 5 1 340 5
2 95 3 2 95 3
3 210 6 3 210 6
4 809 15 4 809 15
5 80 4 5 80 4
6 438 10 6 438 10
7 107 4 7 107 4
8 180 6 8 180 6
9 100 3 9 100 3
10 550 13 10 550 13
11 220 7 11 220 7
12 50 3 12 50 3
13 193 193 14 290 8
14 290 8 15 340 2
15 340 2 16 115 4
16 115 4 17 362 10
17 362 10 18 300 9
18 300 9 19 75 2
19 75 2 20 93 2
20 93 2 21 320 10
21 320 10 22 154 7
22 154 7
TABLA 1 TABLA 2
600 600
500 500
400 400
300 300
y = 43,103x - 24,032
200 200
y = 0,0609x + 245,51 R² = 0,738
100 100
0
R² = 0,0002 0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
PORCENTAJE DE DEFECTOS PORCENTAJE DE DEFECTOS
Fue necesario proponer un segundo diagrama de disperson en el que se omitieron las valores correspondientes alos datos # 13 , ya que este punto se encontraba muy lejano a los demas y hacia que la linea de
tendencia presentara una pendiente muy pequeña muy cercana a cero quedando casi horizontal . una vez omitido este punto la grafica de dispersion arroja una linea de tendencia aplicable a los parametros de
estudio . La diferencia significativa entre los valores de este dato y el de el resto puede ser el resultado de un error producido en la fase de recoleccion de informacion.
c) Haga un análisis de regresión (ajuste línea recta, pruebas de hipótesis, análisis de residuos).
H0= Las dos varibles de estudio son independientes
Esta hipotesis se rechaza debido a que en el grafico de dispersion se puede evidenciar que las variables si tienen una relacion lineal.
H1= Las dos variables estan relacionadas
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,954697747
Coeficiente de determinación R^2 0,911447788
R^2 ajustado 0,858816209
Error típico 93,79108371
Observaciones 20
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
F Valor crítico de F
libertad cuadrados cuadrados
Regresión 1 1720319,42 1720319,42 195,5626817 4,14134E-11
Residuos 19 167138,5803 8796,767384
Total 20 1887458
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
5 39,61861314 2,833063291 13,98437277 1,87668E-11 33,68894352 45,54828276 33,68894352 45,54828276
Análisis de los residuales
Al realizar el analisis estadistico y observar la graficas y valores de los residuos podemos concluir que la diferencia entre los valores de la variable dependiente observados y los valores que predecimos a partir de
nuestra recta de regresión no estan distantes , esto tambien se evidencia en el diagrama de curva de regresion ajustada .
d) ¿La calidad del ajuste es satisfactoria?
El coeficiente de correlacion r es de 0,85 =85% este valor es cercano a 1 lo que indica que el modelo tiene una calidad de ajuste satisfactoria
e) El que dos variables estén relacionadas no necesariamente implica que haya una relación causa-efecto. Sin embargo, a pesar de esto, ¿puede concluir con seguridad que cuando se trabaja tiempo extra se
Si se podria asegurar , ya que el tiempo extra trabajado es una sobre carga laboral y en ocasiones no resulta ser muy buena en comparacion con el trabajo ejecutado en el horario normal.
4.En una fábrica de pintura se quiere reducir el tiempo de secado del barniz. Los siguientes datos corresponden al tiempo de secado del barniz (en horas) ya la cantidad de aditivo con el que se intenta lograr tal
reducción
Cant Aditivo x T secado y
0 14
1 11
2 10
3 8
4 7,5
5 9
6 10
7 11
8 13
9 12
10 15
a) Mediante un diagrama de dispersión investigue la relación entre el tiempo de secado y la cantidad de aditivo.
12
10
8
6
4
y = 0,2409x + 9,75
2
R² = 0,1116
0
0 2 4 6 8 10 12
Cantidad de aditivo
En el diagrama de dispersion se puede observar que la cantidad de aditivo y el tiempo de secado tienen una relacion lineal positiva baja , son directamente proporcionales , es decir , a mayor cantidad de aditivo se
necesita mayor tiempo de secado.
b) Con base en la relación, ¿qué cantidad de aditivo recomendaría para reducir el tiempo de secado?
Revisando los datos recomendaria el cuarto aditivo que tiene el menor tiempo de secado correspondiente a 7,5 horas , para que la ejecucion del trabajo sea la mas rapida.
c) Obtenga el coeficiente de correlación entre ambas variables e interprételo.
Coeficiente de correlación lineal 0,334001184
Este coeficiente estima la relacion lineal que existe entre las variables de estudio , tomando como 1 el mayor valor de correlacion y 0 como el menor valor de correlacion.Para este caso el valor es de 0,33 un valor muy
lejano a 1 , que significa que la relacion entre las variables es positiva pero baja .
d) Al parecer el coeficiente de correlación lineal es muy bajo, ¿quiere decir entonces que el tiempo de secado no está relacionado con la cantidad de aditivo?
Si existe una relacion por que el valor de coeficiente de correlacion es diferente a 0 , pero es muy baja.
e) ¿Usted cree que ajustar una línea recta sea correcto?
No , el grafico de dispersion deja ver que los puntos se encuentran muy dispersos y que la linea no acoge muy bien la tendencia de todos los puntos.
f) Proponga el modelo que crea adecuado, ajústelo y haga un análisis de regresión completo para tal modelo
RELACION DE ADITIVO VS. TIEMPO DE La regresión que mas se ajusta a los datos suministrados es la polinómica ,
SECADO ya que al trazar la curva en el diagrama de dispersión se puede notar que es
18 la que representa la mayor tendencia entre los puntos . Tambien el
16 coeficiente de relación tiene un mayor valor respecto al obtenido mediante
Tiempo de secado
14 regresion lineal
12
10
8
6
4 y = 0,2197x2 - 1,9561x + 13,045
2 R² = 0,8352
0
0 2 4 6 8 10 12
Cantidad de aditivo
5. Se realiza un estudio sobre la cantidad de azúcar transformada en cierto proceso a varias temperaturas. Los datos se recolectan y se registran como.
Temp , x Azucar, y
1 8,1
1,1 7,8
1,2 8,5
1,3 9
1,4 9,5
1,5 8,9
1,6 8,6
1,7 10,2
1,8 9,3
1,9 9,2
2 10,5
a) Estime la línea de regresión lineal más adecuada
10
9,5
8,5
y = 1,9545x + 6,1227
R² = 0,6265
8
1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
TEMPERATURA
b) Estime la cantidad media de azúcar transformada que se produce cuando la temperatura vale 1.75
y = 1,9545x + 6,1227
y = 1,9545( 1,75) + 6,1227
y = 9,54
LA CANTIDAD MEDIA DE AZUCAR TRASFORMADA QUE SE PRODUCE CUANDO LA TEMPERATURA ES 1,75 SE OBTIENE DE COLOCAR ESTE VALOR REEMPLAZANDO LA X EN LA ECUACION OBTENIDA DE LA REGRESION LINEAL , PARQ ESTE CASO EL RESULTADO ES ES 9,54.
c) Calcule el error
Error tipico 0,5276
d) Calcule la varianza
Temp , x 0,11
Azucar, y 0,67
e) Moda
Temp , x NO APLICA
Azucar, y NO APLICA
f) La media
Temp , x 1,500
Azucar, y 9,055
g) Desviación estándar
Temp , x 0,332
Azucar, y 0,819
h) Correlación
Coeficiente de correlación lineal 0,7915
6.Un estudio de la cantidad de precipitación pluvial y la cantidad de contaminación eliminada del aire produce los siguientes datos:
Precipit diaria, x (0.01
Partic elimin, y (mcg/m3)
cm)
4,3 126
4,5 121
5,9 116
5,6 118
6,1 114
5,2 118
3,8 132
2,1 141
7,5 108
a) Encuentre la ecuación de la línea de regresión para predecir las partículas que se eliminan a partir de la cantidad de precipitación pluvial diaria.
150
140
130
120
y = -6,324x + 153,18
110
R² = 0,9578
100
0 1 2 3 4 5 6 7 8
Cantidad de lluvia diaria
b) Estime la cantidad de partículas eliminadas cuando la precipitación pluvial diaria x=4.8 unidades
y = -6,324x + 153,18
y = -6,324x + 153,18
y = 122,82
c) Calcule la media y la varianza Desviacion estandar y correlación
Media x 5,0
Media y 121,6
Varianza x 2,41
Varianza y 100,53
Niveles de
Datos tensión de Deflexión y x*y x^2 y^2
humedad X
1 54 14,473 781,542 2916 209,47
2 54 18,693 1009,422 2916 349,43
3 61 14,305 872,605 3721 204,63
4 61 15,121 922,381 3721 228,64
5 68 13,505 918,34 4624 182,39
6 68 11,64 791,52 4624 135,49
7 75 11,168 837,6 5625 124,72
8 75 12,534 940,05 5625 157,10
9 75 11,224 841,8 5625 125,98
sumatoria 591 122,663 7915,26 39397 1717,85
Media x 65,67
media y 13,63
VARIANZA
(a) Calcule las estimaciones de mínimos cuadrados de la pendiente y la intersección. ¿Cuál es la estimación de σ2? Graficar el modelo de regresión y los datos.
con formulas
Título del gráfico MINIMOS CUADRADOS
20 b -0,24
19 y = -0,2374x + 29,221 a 29,22
18 R² = 0,7198
r 0,79
17
16 r2
15
14
Excel
13
12 b -0,23743254 29,22062566 a
11 0,055988562 3,704329686 Error ordenada de origen
Error pendiente
10
54 59 64 69 74 79 r2 0,719818624 1,357650468 r
17,98381618 7
33,14803601 12,90250355
Y= A+BX Y=29,22+-0,24X
8. En un artículo publicado en IEEE Transactions on Instrumentation and Measurement (2001, Vol. 50, pp. 986–990), los investigadores informaron sobre un estudio de los efectos de reducir el consumo de corriente
en un núcleo magnético por medios electrónicos. Midieron la corriente en un devanado magnético con y sin la electrónica en un experimento emparejado. Los datos para el caso sin electrónica se proporcionan en la
tabla.
Suministro de CORRIENTE
voltaje X ELECTRONICA (Y)
0,66 7,32
1,32 12,22
1,98 16,34
2,64 23,66
3,3 28,06
3,96 33,39
4,62 34,12
3,28 39,21
5,94 44,21
6,6 47,48
(a) Grafique los datos y ajuste una línea de regresión para predecir la corriente sin electrónica para suministrar voltaje. ¿Hay una regresión significativa en α = 0.05? ¿Cuál es el valor P?
50
SUMINISTRO DE VOLTAJE
40
30
20
y = 6,7342x + 5,5027
10
R² = 0,8986
0
0 1 2 3 4 5 6 7
CORRIENTE ELECTRICA
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 1493,668824 1493,668824 70,8782258 3,01868E-05
Residuos 8 168,589866 21,07373325
Total 9 1662,25869
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 5,502740383 3,103995036 1,772792907 0,114198868 -1,655085005 12,66056577 -1,655085005 12,66056577
Suministro de voltaje X 6,734186477 0,799887149 8,418920703 3,01868E-05 4,889643404 8,57872955 4,889643404 8,57872955
9. Una empresa de servicios eléctricos está interesada en desarrollar un modelo que relacione la demanda de horas pico (y en kilovatios) con el uso total de energía mensual durante el mes (x, en kilovatios hora). Los
datos de 50 clientes residenciales se muestran en la tabla
Uso total de
Dato Demanda de horas (x)
energia (y)
1 679 0,79
2 292 0,44
3 1012 0,56
4 493 0,79
5 582 2,7
6 1156 3,64
7 997 4,73
8 2189 9,5
9 1097 5,34
10 1434 0,31
11 837 4,2
12 1748 4,88
13 1381 3,48
14 1428 7,58
15 1255 2,63
16 1777 4,99
17 370 0,59
18 2316 8,19
7
6
5
4
3
2 y = 0,0037x - 0,7235
1 R² = 0,5959
0
0 500 1000 1500 2000 2500
DEMANDA DE HORAS
(d) Grafique los residuos versus yi y comente los supuestos de regresión subyacentes. Específicamente, ¿parece que se cumple el supuesto de igualdad de varianza?
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,771918148
Coeficiente de determinación R^2 0,595857627
R^2 ajustado 0,570598729
Error típico 1,857568983
Observaciones 18
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -0,723533934 0,997568148 -0,725297752 0,478744103 -2,838283937 1,391216068 -2,838283937 1,391216068
Demanda de horas (x) 0,003723975 0,00076673 4,856954662 0,000174834 0,002098579 0,005349371 0,002098579 0,005349371
X Y
1,1 0,734
1,2 0,886
1,3 1,04
1,4 1,19
1,5 1,35
1,6 1,5
1,7 1,66
1,8 1,81
1,9 1,97
2 2,12
(a) Dibuje un diagrama de dispersión de estos datos. ¿Una relación en línea recta parece plausible?
Al realizar el diagrama de dispersion de los datos se evidencia que presentan una linealidad muy exacta , esto se corrobora al obtener el coeficiente de correlacion lineal igual a 1 , lo que podria poner en duda la
veracidad y confiabilidad de los datos , ya que su relacion seria muy exacta.
(b) Ajuste un modelo de regresión lineal simple a estos datos. y = 1,5438x - 0,9668
1,5
0,5
y = 1,5438x - 0,9668
0 R² = 1
0 0,5 1 1,5 2 2,5
11. Se está estudiando la resistencia a la compresión de un cierre de aleación utilizado en la construcción de aviones. Se seleccionaron diez cargas en el rango de 2500 a 4300 psi, y se probaron varios sujetadores en
esas cargas. Se registraron los números de sujetadores que fallaban en cada carga. Los datos completos de la prueba se muestran en la Tabla.
(a) Ajuste un modelo de regresión logística a los datos. Utilice un modelo de regresión lineal simple como estructura para el predictor lineal.
El modelo de regresion utilizado fue el de regresion lineal multiple , tomando como variable independiente la carga y como variables dependientes los sujetadores y el numero de fallas .
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,976601879
Coeficiente de determinación R^2 0,953751229
R^2 ajustado 0,938334973
Error típico 136,0128973
Observaciones 9
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
F Valor crítico de F
libertad cuadrados cuadrados
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 3426,578641 183,3415573 18,68959058 1,51455E-06 2977,958012 3875,199271 2977,958012 3875,199271
50 -17,82202341 2,796257668 -6,373526879 0,000700968 -24,66421943 -10,97982738 -24,66421943 -10,97982738
10 36,90179574 3,341556332 11,04329602 3,2804E-05 28,72530195 45,07828953 28,72530195 45,07828953