Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Taller - Regresión (Pauta) PDF
Taller - Regresión (Pauta) PDF
1.
Existe una relación directa entre el % de carbono y la resistencia (kg/mm2), esto es, a mayor contenido de
carbono en las barra, mayor resistencia poseen éstas.
La asociación lineal es fuerte, debido a que r 0,9071 0,7
7 134
1.254,9 12
Usando fórmula: r
S xy
3 3
0,9071
S xx S yy
12 1 12 1
2 98
33 33
Si el lugar de usar sólo calculadora, utilizamos fórmulas, las estimaciones de mínimos cuadrados para 0 y 1 son:
7 134
1.254,9 12
i1 xi yi 12 X Y
12
ˆ1
S xy
3 3
6,35
S xx
12
x 12 X
2
i 1 i
2
7
66 12
2
3
134 7
ˆ0 Y ˆ1 X 6,35 29,85
3 3
Interpretación de ˆ0 : Cuando no hay carbono en las barras (x=0), se estima en promedio una resistencia a la tracción
de 29,85 (kg/mm2).
Interpretación de ˆ1 : Cada vez que se incrementa el % de carbono en un 1%, se estima un incremento promedio en la
resistencia a la tracción en 6,35 (kg/mm2).
SY | x ˆ S
c) En este caso, el intervalo de confianza para la pendiente ( 1 ) es ˆ1 t1 2;n2 , 1 t1 2;n2 Y |x
S XX S XX
Cálculos previos:
12 1 98 2
S xx 12 1
98 2 2 2
SY2 S X2 SY |x 6,35 0,7605918748
2
33 33 33 3 12 2 33 33
0,7605918748
ˆ1 6,35 0,05 t0,975;10 2,2281 . Finalmente: 6,35 2,2281
0,7605918748
,6,35 2,2281 4,2745 ; 8,4255
23 23
El intervalo de confianza anterior no contiene al cero (0), por lo tanto, con un nivel de confianza del 95%, podemos
decir que la variable carbono (%, X) es significativa en el modelo de regresión estimado.
d) El intervalo de predicción para y0 con nivel de confianza (1-α), dado x0, está dado por:
2
yˆ 0 t1 2;n2 SY |x 1 1 x0 x
n S xx
Cálculos previos:
12 1 98 2
x0 2,5 yˆ 0 29,85 6,35 2,5 45,725 t0,975;10 2,2281 SY |x 6,35 0,7605918748
2
12 2 33 33
S xx 12 1
2 2 7
x . Reemplazando:
33 3 3
7
2
2,5
45,725 2,2281 0,7605918748 1 1 3
43,9275 ; 47,5225
12 2 3
2
yˆ 0 t1 2;n2 SY |x 1 x0 x
n S xx
Cálculos previos:
12 1 98 2
x0 2,5 yˆ 0 29,85 6,35 2,5 45,725 t0,975;10 2,2281 SY |x 6,35 0,7605918748
2
12 2 33 33
S xx 12 1
2 2 7
x . Reemplazando:
33 3 3
7
2
2,5
45,725 2,2281 0,7605918748 1 3
45,1258 ; 46,3242
12 2 3
f) El porcentaje de variación de la resistencia a la tracción, explicada por la presencia del contenido de carbono en las
barras está dado por el coeficiente de determinación ( 100 r 2 )%:
Diagrama de dispersión
47 R² = 0,8229
46
45
44
43
42
41
1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
% de carbono
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,907142857
Coeficiente de determinación R^2 0,822908163
R^2 ajustado 0,80519898
Error típico 0,760591875
Observaciones 12
Coeficientes
Intercepción 29,85
Carbono (%) 6,35
a) Esta pregunta se responde a través de una dócima para la pendiente ( 1 ), o bien, para la correlación ( ). Si se
sospecha una relación directa entre las variables (aumento de una, asociado al aumento de la otra), es una sospecha de
que 1 0 , lo que equivale a que 0 .
H0 : 0
r n2
H1 : 0 Estadístico de prueba: T ~ t n-2
1 r2
0,05
0,8625324581 12 2
Para los datos de la pregunta 2), r 0,8625324581, luego, bajo H0: Tobs 5,3904
1 0,86253245812
En este caso, la región crítica (o de rechazo de H0) es R.C. T / T t0,95;10 1,8125
Como Tobs 5,3904 1,8125 :
Decisión: Se rechaza H0
Conclusión: Con un nivel de significancia 0,05 , podemos concluir que existe relación directa entre el n° de horas
extra, y el número de unidades elaboradas.
H 0 : 1 0 ˆ1 1
Estadístico de prueba: T ~ t n-2
H1 : 1 0 SY |x S xx
En este caso, la región crítica (o de rechazo de H0) es R.C. T / T t0,95;10 1,8125
S xx 12 1
155 155
SY | x 1,991595243
12 2 12 310 33 33 3
463 0
Bajo H0: Tobs 310 5,3904 R.C.
1,991595243 155 3
Decisión: Se rechaza H0
Conclusión: Existe relación directa entre el n° de horas extra, y el número de unidades elaboradas.
IMPORTANTE: La dócima para la pendiente en el modelo de regresión es equivalente a la dócima para la correlación
(SÓLO cuando 1 0, 1 0, o 1 0 , pues en estos casos, 0, 0, o 0 , respectivamente).
b) Al utilizar calculadora científica para calcular los estimadores de 0 y 1 , se tiene que:
Interpretación de ˆ0 : Cuando no se trabajan horas extra en el mes (x=0), se estima en promedio una producción
mensual de 9,39 unidades, aproximadamente.
Interpretación de ˆ1 : Por cada hora extra trabajada, se estima un incremento promedio en el número de unidades
producidas en 1,49 unidades, aproximadamente.
c) El intervalo de confianza para la cantidad media de unidades elaboradas, para x0=12 es:
2
yˆ 0 t1 2;n2 SY |x 1 x0 x
n S xx
S xx 12 1
155 155 59
0,05 1 0,05 2 0,975 t0,975;10 2,2281 x
33 3 6
SY | x 1,991595243
12 2 12 310 33
1 12 59 6
2
27,31935484 2,2281 1,991595243 25,4673 ; 29,1714
12 155 3
Salida en Excel de la regresión lineal para los datos del ejercicio 2
Diagrama de dispersión
30
R² = 0,744
25
20
15
10
0
0 2 4 6 8 10 12 14
número de horas extra mensuales
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,862532458
Coeficiente de determinación R^2 0,743962241
R^2 ajustado 0,718358465
Error típico 1,991595243
Observaciones 12
Coeficientes
Intercepción 9,3968
N° de horas extras 1,4935
a) Al igual que en la pregunta 2a), procedemos a realizar la dócima para (note que en este ejemplo, no se pregunta
sobre asociación directa ( 0) o inversa ( 0) , sino que simplemente asociación lineal. Por ende, las hipótesis
quedan como:
H0 : 0
r n2
H1 : 0 Estadístico de prueba: T ~ t n-2
1 r2
0,05
En este caso, la región crítica es R.C. T / T t0,975;8 2,3060
Mediante el uso de calculadora científica, se tiene que r 0,9496082435 , y el estadístico T observado bajo H0 es:
0,9496082435 10 2
Tobs 8,5691 R.C.
1 0,94960824352
Conclusión: Con un nivel de significancia 0,05 , podemos decir que existe asociación lineal entre la concentración
(H) de un componente, y la resistencia a la fractura (Nwt).
Interpretación de la pendiente ( ˆ1 ): Cada vez que aumenta el % de la concentración (H) en un 1%, se estima un
aumento promedio en la resistencia en 1,91 (Nwt).
Cuando x=7,2, se tiene que yˆ 2,411005796 1,911638224 7,2 11,35278942 , es decir, cuando la concentración
(H) del componente es del 7,2%, se estima una resistencia a la fractura de 11,35 (Nwt), aproximadamente.
c) El intervalo de confianza para la resistencia media tiene la forma yˆ 0 t1 2;n2 SY |x
1
x0 x2
n S xx
S xx 10 1
30881
30,881 t0,975;8 2,3060 . Finalmente, el intervalo pedido queda:
9000
1 5,7 5,07
2
8,485332081 2,3060 1,239696396 7,5250 ; 9,4457
10 30,881
Salida en Excel para los datos del ejercicio 3
Diagrama de dispersión
y = 1,9116x - 2,411
12
R² = 0,9018
10
Resistencia (en Nwt)
0
0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0
Concentración (H, en %)
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,949608244
Coeficiente de determinación R^2 0,901755816
R^2 ajustado 0,889475293
Error típico 1,239696395
Observaciones 10
Coeficientes
Intercepción (β0) -2,411005796
H (%) (β1) 1,911638224
Interpretación del intercepto ( ˆ0 ): Cuando la muestra de acero no sufre deformación (x = 0 mm), se observa en
promedio una dureza Brinell de 73,99 (kg/mm2), aproximadamente.
Interpretación de la pendiente ( ˆ1 ): Por cada mm de aumento en la deformación de la muestra de acero, la dureza
Brinell promedio del mismo, disminuye en aproximadamente 1,3113 (kg/mm2)
H 0 : 1 0
ˆ1 1
H 1 : 1 0 Estadístico de prueba: T ~ t n-2
SY |x S xx
0,10
En este caso, la región crítica (o de rechazo de H0) es R.C. T / T t0,95;8 1,8595
10 1 5032 2 4841
1,311299318 S xx 10 1
4841
SY |x 4,663517893 484,1
10 2 45 90 90
1,311299318 0
Bajo H0: Tobs 6,1867 R.C.
4,663517893 484,1
Decisión: Se rechaza H0
Conclusión: Con un nivel de significancia 0,10 , podemos suponer que la pendiente del modelo no es nula, lo que
implica que X (deformación, en mm) es una variable significativa para estimar la media de Y (dureza Brinell, en kg/mm 2).
En resumen, el modelo yi 0 1 xi i es significativo.
c) En este caso, realizamos una dócima para el intercepto 0 (ver pres.12): (A lo más = menor o igual = H0):
H 0 : 0 45
ˆ0 0
H1 : 0 45 Estadístico de prueba: T ~ t n-2 . Aquí, R.C. T / T t0,90;8 1,3968
2
0,10 SY | x
1 x
n S xx
73,9873993 45
x 15,7 Tobs 7,9639 R.C.
1 15,7 2
4,663517893
10 484,1
Decisión y conclusión: Se rechaza H0. Con una significancia de 0,10 , podemos decir que el intercepto del modelo de
regresión lineal supera los 45 (kg/mm2).
d) El intervalo de predicción para y0 con nivel de confianza (1-α), dado x0, está dado por:
2
yˆ 0 t1 2;n2 SY |x 1 1 x0 x
n S xx
Cálculos previos:
S xx 10 1
4841
x0 26 x 15,7 484,1 yˆ 0 73,9873993 1,311299318 26 39,89361703
90
10 1 5032 2 4841
0,10 SY |x 1,311299318 4,663517893 t0,95;8 1,8595
10 2 45 90
1 26 15,7
2
39,89361703 1,8595 4,663517893 1 29,9337 ; 49,8536
10 484,1
e) r 2 0,8271 1 r 2 0,1729
Interpretación de 1 r 2 : Aproximadamente, el 17,29% de la variabilidad de la dureza Brinell no logra ser explicada por
la presencia de la deformación, en el modelo de regresión lineal.
Salida en Excel para los datos del ejercicio 4
Diagrama de dispersión
60
50
40
30
20
10
0
0 5 10 15 20 25 30
Deformación (en mm)
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,909460963
Coeficiente de determinación R^2 0,827119244
R^2 ajustado 0,80550915
Error típico 4,663517888
Observaciones 10
Coeficientes
Intercepción (β0) 73,9873992976658
Deformación (β1) -1,3112993183227