Está en la página 1de 11

Solución Taller 10 – Regresión Lineal y Correlación (Profesor: Francisco Valenzuela Rojas)

1.

a) Mediante el uso de calculadora científica, r  0,9071 . Esto significa que:

 Existe una relación directa entre el % de carbono y la resistencia (kg/mm2), esto es, a mayor contenido de
carbono en las barra, mayor resistencia poseen éstas.
 La asociación lineal es fuerte, debido a que r  0,9071  0,7

 7  134 
1.254,9  12    
Usando fórmula: r
S xy
  3  3 
 0,9071
S xx  S yy
12  1   12  1 
2 98
33 33

(Recuerde que S xx  n  1  S x2 , S yy  n  1  S y2 , S xy  i1 xi yi  n X Y


n

b) El modelo estimado de regresión lineal es yˆ i  29,85  6,35xi (usando calculadora).

Si el lugar de usar sólo calculadora, utilizamos fórmulas, las estimaciones de mínimos cuadrados para  0 y 1 son:

 7  134 
1.254,9  12    
i1 xi yi  12  X Y
12

ˆ1 
S xy
   3  3 
 6,35
S xx 
12
x  12  X
2
i 1 i
 2
7
66  12   
2

3

134 7
ˆ0  Y  ˆ1 X   6,35   29,85
3 3

Interpretación de ˆ0 : Cuando no hay carbono en las barras (x=0), se estima en promedio una resistencia a la tracción
de 29,85 (kg/mm2).

Interpretación de ˆ1 : Cada vez que se incrementa el % de carbono en un 1%, se estima un incremento promedio en la
resistencia a la tracción en 6,35 (kg/mm2).
 SY | x ˆ S 
c) En este caso, el intervalo de confianza para la pendiente ( 1 ) es  ˆ1  t1 2;n2  , 1  t1 2;n2  Y |x 
 S XX S XX 
Cálculos previos:

12  1  98 2
S xx  12  1 
98 2 2 2
SY2  S X2   SY |x    6,35    0,7605918748
2

33 33 33 3 12  2  33 33 

 0,7605918748 
ˆ1  6,35   0,05 t0,975;10  2,2281 . Finalmente: 6,35  2,2281 
0,7605918748
,6,35  2,2281    4,2745 ; 8,4255
 23 23 

El intervalo de confianza anterior no contiene al cero (0), por lo tanto, con un nivel de confianza del 95%, podemos
decir que la variable carbono (%, X) es significativa en el modelo de regresión estimado.
d) El intervalo de predicción para y0 con nivel de confianza (1-α), dado x0, está dado por:

  2 
 yˆ 0  t1 2;n2  SY |x  1  1  x0  x  
 n S xx 
 

Cálculos previos:

12  1  98 2
x0  2,5 yˆ 0  29,85  6,35  2,5  45,725 t0,975;10  2,2281 SY |x    6,35    0,7605918748
2

12  2  33 33 

S xx  12  1 
2 2 7
 x . Reemplazando:
33 3 3

  7 
2
  2,5   
45,725  2,2281  0,7605918748  1  1   3 
 43,9275 ; 47,5225
 12 2 3 
 
 

e) El intervalo de confianza para Y |x x0 está dado por:

  
2 
 yˆ 0  t1 2;n2  SY |x  1  x0  x 
 n S xx 
 

Cálculos previos:

12  1  98 2
x0  2,5 yˆ 0  29,85  6,35  2,5  45,725 t0,975;10  2,2281 SY |x    6,35    0,7605918748
2

12  2  33 33 

S xx  12  1 
2 2 7
 x . Reemplazando:
33 3 3

  7 
2
  2,5   
45,725  2,2281  0,7605918748  1   3 
 45,1258 ; 46,3242
 12 2 3 
 
 

f) El porcentaje de variación de la resistencia a la tracción, explicada por la presencia del contenido de carbono en las
barras está dado por el coeficiente de determinación ( 100  r 2 )%:

100  r %  100  0,9071 %  82,28%


2 2
Salida en Excel de la regresión lineal para los datos del ejercicio 1

Diagrama de dispersión

Relación entre Porcentaje de Carbono y


Resistencia a la tracción, de 12 barras de acero
49
48 y = 6,35x + 29,85
Resistencia (kg/mm2)

47 R² = 0,8229
46
45
44
43
42
41
1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
% de carbono

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,907142857
Coeficiente de determinación R^2 0,822908163
R^2 ajustado 0,80519898
Error típico 0,760591875
Observaciones 12

Coeficientes
Intercepción 29,85
Carbono (%) 6,35

Inferior 95% Superior 95%


Intercepción (β0) 24,98233247 34,71766753
Carbono (%, β1) 4,274419592 8,425580408
2.

a) Esta pregunta se responde a través de una dócima para la pendiente ( 1 ), o bien, para la correlación (  ). Si se
sospecha una relación directa entre las variables (aumento de una, asociado al aumento de la otra), es una sospecha de
que 1  0 , lo que equivale a que   0 .

Planteando las hipótesis:

H0 :   0
r n2
H1 :   0  Estadístico de prueba: T  ~ t n-2
1 r2
  0,05

0,8625324581 12  2
Para los datos de la pregunta 2), r  0,8625324581, luego, bajo H0: Tobs   5,3904
1  0,86253245812


En este caso, la región crítica (o de rechazo de H0) es R.C.  T / T  t0,95;10  1,8125 
Como Tobs  5,3904  1,8125 :

Decisión: Se rechaza H0

Conclusión: Con un nivel de significancia   0,05 , podemos concluir que existe relación directa entre el n° de horas
extra, y el número de unidades elaboradas.

Otra alternativa, habría sido contrastar las hipótesis:

H 0 : 1  0 ˆ1  1
 Estadístico de prueba: T  ~ t n-2
H1 : 1  0 SY |x S xx


En este caso, la región crítica (o de rechazo de H0) es R.C.  T / T  t0,95;10  1,8125 

12  1  169  463  155 


2

S xx  12  1 
155 155
SY | x      1,991595243 
12  2  12  310  33  33 3

463 0
Bajo H0: Tobs  310  5,3904  R.C.
1,991595243 155 3

Decisión: Se rechaza H0

Conclusión: Existe relación directa entre el n° de horas extra, y el número de unidades elaboradas.

IMPORTANTE: La dócima para la pendiente en el modelo de regresión es equivalente a la dócima para la correlación
(SÓLO cuando 1  0, 1  0, o 1  0 , pues en estos casos,   0,   0, o   0 , respectivamente).
b) Al utilizar calculadora científica para calcular los estimadores de  0 y 1 , se tiene que:

ˆ0  A  9,396774194 ˆ1  B  1,493548387 , en consecuencia, el modelo estimado es:

yˆi  9,396774194  1,493548387 xi

Interpretación de ˆ0 : Cuando no se trabajan horas extra en el mes (x=0), se estima en promedio una producción
mensual de 9,39 unidades, aproximadamente.

Interpretación de ˆ1 : Por cada hora extra trabajada, se estima un incremento promedio en el número de unidades
producidas en 1,49 unidades, aproximadamente.

c) El intervalo de confianza para la cantidad media de unidades elaboradas, para x0=12 es:

  2 
 yˆ 0  t1 2;n2  SY |x  1  x0  x 
 n S xx 
 

Realizando los cálculos respectivos:

yˆ 0  9,396774194  1,493548387 12  27,31935484

S xx  12  1 
155 155 59
  0,05  1  0,05 2  0,975  t0,975;10  2,2281  x
33 3 6

12  1  169  463  155 


2

SY | x      1,991595243
12  2  12  310  33 

Finalmente, el intervalo pedido es:

 1 12  59 6 
2
27,31935484  2,2281 1,991595243     25,4673 ; 29,1714
 12 155 3 

Salida en Excel de la regresión lineal para los datos del ejercicio 2

Diagrama de dispersión

Relación entre el número de horas extra y el


número de unidades elaboradas
35
y = 1,4935x + 9,3968
cantidad de unidades elaboradas

30
R² = 0,744
25

20

15

10

0
0 2 4 6 8 10 12 14
número de horas extra mensuales

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,862532458
Coeficiente de determinación R^2 0,743962241
R^2 ajustado 0,718358465
Error típico 1,991595243
Observaciones 12

Coeficientes
Intercepción 9,3968
N° de horas extras 1,4935

Inferior 95% Superior 95%


Intercepción (β0) 3,19238836822459 15,6011600188722
N° de horas extras (β1) 0,876188923235887 2,11090785095766
3)

a) Al igual que en la pregunta 2a), procedemos a realizar la dócima para  (note que en este ejemplo, no se pregunta
sobre asociación directa (   0) o inversa (   0) , sino que simplemente asociación lineal. Por ende, las hipótesis
quedan como:

H0 :   0
r n2
H1 :   0  Estadístico de prueba: T  ~ t n-2
1 r2
  0,05


En este caso, la región crítica es R.C.  T / T  t0,975;8  2,3060 
Mediante el uso de calculadora científica, se tiene que r  0,9496082435 , y el estadístico T observado bajo H0 es:

0,9496082435  10  2
Tobs   8,5691 R.C.
1  0,94960824352

Decisión: Se rechaza H0.

Conclusión: Con un nivel de significancia   0,05 , podemos decir que existe asociación lineal entre la concentración
(H) de un componente, y la resistencia a la fractura (Nwt).

b) Al realizar el ajuste mediante mínimos cuadrados, se tiene que el modelo estimado es

yˆi  2,411005796  1,911638224  xi

Interpretación de la pendiente ( ˆ1 ): Cada vez que aumenta el % de la concentración (H) en un 1%, se estima un
aumento promedio en la resistencia en 1,91 (Nwt).

Cuando x=7,2, se tiene que yˆ  2,411005796  1,911638224  7,2  11,35278942 , es decir, cuando la concentración
(H) del componente es del 7,2%, se estima una resistencia a la fractura de 11,35 (Nwt), aproximadamente.


c) El intervalo de confianza para la resistencia media tiene la forma  yˆ 0  t1 2;n2  SY |x 
1

x0  x2 

 n S xx 
 

Cálculos previos: x0  5,7 yˆ 0  2,411005796  1,911638224  5,7  8,485332081   0,05 x  5,07


30881 1390501 10  1  1390501 2 30881 
S x2  S y2  SY |x    1,911638224   1,239696396
9000 100000 10  2  100000 9000 

S xx  10  1 
30881
 30,881 t0,975;8  2,3060 . Finalmente, el intervalo pedido queda:
9000

 1 5,7  5,07  
2
8,485332081  2,3060 1,239696396     7,5250 ; 9,4457
 10 30,881 

Salida en Excel para los datos del ejercicio 3

Diagrama de dispersión

Relación entre la concentración porcentual de


un componente y la resistencia a la fractura
14

y = 1,9116x - 2,411
12
R² = 0,9018
10
Resistencia (en Nwt)

0
0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0
Concentración (H, en %)

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,949608244
Coeficiente de determinación R^2 0,901755816
R^2 ajustado 0,889475293
Error típico 1,239696395
Observaciones 10

Coeficientes
Intercepción (β0) -2,411005796
H (%) (β1) 1,911638224

Inferior 95% Superior 95%


Intercepción (β0) -5,171413312 0,349401719
H (%, β1) 1,397204132 2,426072317
4)

a) Para los datos de la pregunta 4, el modelo de regresión estimado es:

yˆi  73,9873993  1,311299318  xi

Interpretación del intercepto ( ˆ0 ): Cuando la muestra de acero no sufre deformación (x = 0 mm), se observa en
promedio una dureza Brinell de 73,99 (kg/mm2), aproximadamente.

Interpretación de la pendiente ( ˆ1 ): Por cada mm de aumento en la deformación de la muestra de acero, la dureza
Brinell promedio del mismo, disminuye en aproximadamente 1,3113 (kg/mm2)

b) Para docimar si el modelo yi  0  1 xi   i es significativo, realizamos un test de hipótesis para la pendiente 1 :

H 0 : 1  0
ˆ1  1
H 1 : 1  0  Estadístico de prueba: T  ~ t n-2
SY |x S xx
  0,10


En este caso, la región crítica (o de rechazo de H0) es R.C.  T / T  t0,95;8  1,8595 
10  1  5032 2 4841 
  1,311299318  S xx  10  1 
4841
SY |x     4,663517893  484,1
10  2  45 90  90

 1,311299318  0
Bajo H0: Tobs   6,1867  R.C.
4,663517893 484,1

Decisión: Se rechaza H0

Conclusión: Con un nivel de significancia   0,10 , podemos suponer que la pendiente del modelo no es nula, lo que
implica que X (deformación, en mm) es una variable significativa para estimar la media de Y (dureza Brinell, en kg/mm 2).
En resumen, el modelo yi   0  1 xi   i es significativo.

c) En este caso, realizamos una dócima para el intercepto  0 (ver pres.12): (A lo más = menor o igual = H0):

H 0 :  0  45
ˆ0   0
H1 :  0  45  Estadístico de prueba: T  ~ t n-2 . Aquí, R.C.  T / T  t0,90;8  1,3968
2
  0,10 SY | x 
1 x

n S xx

73,9873993  45
x  15,7 Tobs   7,9639  R.C.
1 15,7 2
4,663517893  
10 484,1

Decisión y conclusión: Se rechaza H0. Con una significancia de   0,10 , podemos decir que el intercepto del modelo de
regresión lineal supera los 45 (kg/mm2).
d) El intervalo de predicción para y0 con nivel de confianza (1-α), dado x0, está dado por:

  2 
 yˆ 0  t1 2;n2  SY |x  1  1  x0  x 
 n S xx 
 

Cálculos previos:

S xx  10  1 
4841
x0  26 x  15,7  484,1 yˆ 0  73,9873993  1,311299318  26  39,89361703
90

10  1  5032 2 4841 
  0,10 SY |x     1,311299318    4,663517893 t0,95;8  1,8595
10  2  45 90 

Luego, el intervalo de predicción pedido queda:

 1 26  15,7  
2
39,89361703  1,8595  4,663517893  1     29,9337 ; 49,8536
 10 484,1 

e) r 2  0,8271  1  r 2  0,1729

 
Interpretación de 1  r 2 : Aproximadamente, el 17,29% de la variabilidad de la dureza Brinell no logra ser explicada por
la presencia de la deformación, en el modelo de regresión lineal.
Salida en Excel para los datos del ejercicio 4

Diagrama de dispersión

Relación entre la deformación del acero y la


dureza Brinell
80
y = -1,3113x + 73,987
70
R² = 0,8271
Dureza Brinell (en kg/mm2)

60

50

40

30

20

10

0
0 5 10 15 20 25 30
Deformación (en mm)

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,909460963
Coeficiente de determinación R^2 0,827119244
R^2 ajustado 0,80550915
Error típico 4,663517888
Observaciones 10

Coeficientes
Intercepción (β0) 73,9873992976658
Deformación (β1) -1,3112993183227

Inferior 90% Superior 90%


Intercepción (β0) 67,2189232897441 80,7558753055874
Deformación (mm, β1) -1,70544203667996 -0,9171565999653

También podría gustarte