Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística II
Regresión Lineal
Elaborado Por:
Eddys A. Herradora Romero
Docente:
Msc. Ramón Vallejo
Carrera:
Ingeniería Industrial.
Turno: Grupo:
Nocturno 3N1-IND
1- Para la siguiente Base de Datos correspondiente determine:
y x1 x2 x3 x4 x5 x6 x7 x8 x9
25.9 4.9146 1 3.472 0.998 1 7 4 42 0
29.5 5.0208 1 3.531 1.5 2 7 4 62 0
y: Precio de venta de la casa/100
27.5 4.5429 1 2.275 1.175 1 6 3 40 0
x1: Impuesto (Locales, escuelas,
25.9 4.5573 1 4.05 1.232 1 6 3 54 0
municipal)/100
29.9 5.0597 1 4.455 1.121 1 6 3 42 0
x2: Cantidad de Baños
29.9 3.898 1 4.455 0.988 1 6 3 56 0
x3: Tamaño del terreno (pies cuadrados x 100)
30.9 5.898 1 5.85 1.24 1 7 3 51 1
x4: Superficie Construida
28.9 5.6039 1 9.52 1.501 0 6 3 32 0
x5: Cantidad de Cajones en
35.9 5.8282 1 6.435 1.225 2 6 3 32 0
cochera
31.5 5.3003 1 4.9883 1.552 1 6 3 30 0
x6: Cantidad de Habitaciones
31 6.2712 1 5.52 0.975 1 5 2 30 0
x7: Cantidad de Recámaras
30.9 5.9592 1 6.666 1.121 2 6 3 32 0
x8: Edad de la casa (año)
30 5.05 1 5 1.02 1.5 5 2 46 1
x9: Cantidad de Chimeneas
36.9 8.2464 1.5 5.15 1.664 1 8 4 50 0
41.9 6.6969 1.5 6.902 1.488 1.5 7 3 22 1
40.5 7.7841 1.5 7.102 1.376 1 6 3 17 0
43.9 9.0384 1 7.8 1.5 1.5 7 3 23 0
37.5 5.9894 1 5.52 1.256 2 6 3 40 1
37.9 7.5422 1.5 5 1.69 1 6 3 22 0
44.5 8.7951 1.5 9.89 1.82 2 8 4 50 1
37.9 6.0831 1.5 6.7265 1.652 1 6 3 44 0
38.9 8.3607 1.5 9.15 1.777 2 8 4 48 1
36.9 8.14 1 8 1.504 2 7 3 3 0
45.8 9.1416 1.5 7.3262 1.831 1.5 8 4 31 0
a- Un modelo lineal simple para cada una de las variables.
30 1 1 1 (830.3)(28)
36.9 1.5 2.25 3.375 = 43 −
24
41.9 1.5 2.25 3.375
40.5 1.5 2.25 3.375
43.9 1 1 1 𝑺𝒙𝒚 = −925.6833
37.5 1 1 1
37.9 1.5 2.25 3.375
44.5 1.5 2.25 3.375 Calculando los parámetros:
37.9 1.5 2.25 3.375 4
38.9 1.5 2.25 3.375 𝑺𝒙𝒙 3
𝜷𝟏 = = = −𝟎. 𝟎𝟎𝟏𝟒𝟒𝟎
36.9 1 1 1 𝑺𝒙𝒚 −925.6833
45.8 1.5 2.25 3.375
∑ 830.3 28 34 43
P 34.59583333 1.16666667 1.41666667 1.79166667 𝜷𝟎 = 34.5958 − 0.001440(1.1666)
= 34.5941
𝒏
y x6 x6^2 (xi)(yi) (∑ 𝒙𝒊 )𝟐
25.9 7 49 343 𝑺𝒙𝒙 = ∑ 𝒙𝟔 𝟐 −
𝒏
𝒊=𝟏
29.5 7 49 343
27.5 6 36 216
25.9 6 36 216
𝑺𝒙𝒙 = 370.50
29.9 6 36 216
29.9 6 36 216
30.9 7 49 343 𝒏
28.9 6 36 216 (∑ 𝒚𝒊 )(∑ 𝒙𝒊 )
𝑺𝒙𝒚 = ∑ 𝒚𝒊 𝒙𝒊 −
35.9 6 36 216 𝒏
𝒊=𝟏
31.5 6 36 216
31 5 25 125
30.9 6 36 216 𝑺𝒙𝒚 = 𝟏𝟓𝟓𝟏. 𝟎𝟓
30 5 25 125
36.9 8 64 512
41.9 7 49 343 Calculando los parámetros:
40.5 6 36 216
43.9 7 49 343
37.5 6 36 216 𝑺𝒙𝒙
𝜷𝟏 = = 𝟎. 𝟐𝟑𝟖𝟖
37.9 6 36 216 𝑺𝒙𝒚
44.5 8 64 512
𝜷𝟎 = 34.5958 − 0.2388(6.5) = 33.0436
37.9 6 36 216
38.9 8 64 512
36.9 7 49 343
45.8 8 64 512
830.3 156 1032 6948
34.5958333 6.5 43 289.5
𝛽0
𝛽1
𝛽2 10.5614
𝛽3 1.7266
𝛽4 8.2397
= 0.1922
𝛽5
𝛽6 2.4912
𝛽7 2.5093
𝛽8 0.4268
[𝛽9 ] -1.9472
-0.0338
Por tanto, el modelo de regresión será 0.2727
Análisis de la Varianza
Calculando
𝑛
∑𝑛𝑖 𝑦𝑖 2
′
(∑𝑛𝑖 𝑦𝑖 )2
𝑆𝑆𝑇 = 𝑦 𝑦 − = ∑ 𝑦𝑖 2 −
𝑛 𝑛
𝑖
De donde
29559.49 689398.09
𝑆𝑆𝑇 = −
24 24
𝑆𝑆𝑇 = 834.5695833
Encontrando la Regresión de los Residuos
(∑𝑛𝑖 𝑦𝑖 )2
𝑆𝑆𝑅 = 𝛽̂ ′ 𝑋 ′ 𝑦 −
𝑛
689398.09
𝑆𝑆𝑅 = 29442.88122 −
24
𝑆𝑆𝑅 = 717.960808
Como
𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝑟𝑒𝑔
𝑆𝑆𝑟𝑒𝑔 = 834.5695 − 717.6908
𝑆𝑆𝑟𝑒𝑔 = 116.8787
ANOVA
F.V SC GL MS Fo
SSR 717.960808 9 79.7734 9.5554
SSRos 116.8787 14 8.34847
SST 834.5695833 23
𝑆𝑆𝑅 717.960808
𝑀𝑆𝑅 = = = 79.7734
𝑘 9
𝑆𝑆𝑅𝑜𝑠 116.8787
𝑀𝑆𝑅𝑜 = = = 8.34847
𝑛−𝑘−1 14
𝑀𝑅𝑆 79.7734
= = 9.5554
𝑀𝑆𝑅𝑜 8.34847
Probando hipótesis
Sea
𝐻0 : 𝛽1 = ⋯ = 𝛽9 = 0
𝐻1 : 𝛽1 = ⋯ = 𝛽9 ≠ 0
Conclusión: Al menos uno de los regresores está aportando información. Además, el modelo que se
obtuvo es adecuado.
𝑆𝑆𝑟𝑒𝑠
𝑛−𝑝 𝑀𝑆𝑟𝑒𝑠
𝑅 2 𝑎𝑑𝑗 = =1−
𝑆𝑆𝑇 𝑀𝑆𝑇
𝑛−1
8.34847
𝑅 2 𝑎𝑑𝑗 = 1 − = 0.8953
79.7734
Por lo tanto, la variabilidad de la variable respuesta queda explicada por los regresores en un 89.53%. Es
decir que el modelo no es el mejor, pero, si es bueno.
Intervalos de confianza
Para 𝛽1 tenemos,
1.7266 − 2.306√(8.34847)(1042.139134) ≤ 𝛽1
≤ 1.7266 − 2.306√(8.34847)(1042.139134)
−213.3651 ≤ 𝛽1 ≤ 216.8183
Por lo tanto, una confianza del 95%, del parámetro se encuentra en dijo intervalo. Para los restantes
parámetros sus intervalos de confianza corresponden a:
−30.6614 ≤ 𝛽2 ≤ 47.0902
−206.4864 ≤ 𝛽3 ≤ 206.8707
−43.2555 ≤ 𝛽4 ≤ 48.5077
−44.1307 ≤ 𝛽5 ≤ 49.1499
−213.6160 ≤ 𝛽6 ≤ 214.4696
−106.8740 ≤ 𝛽7 ≤ 102.9796
−1302.4319 ≤ 𝛽8 ≤ 1302.3643
−16.0479 ≤ 𝛽9 ≤ 16.5933
Por lo tanto, una confianza del 95%, del parámetro se encuentra en dijo intervalo
𝒙𝟏 = 1.7266
𝐶𝑖𝑗 = 0.1300
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
1.7266
𝑡𝑐 = = 1.6573
√(8.34847)(0.13)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝑥2 = 8.239678806
𝐶𝑖𝑗 = 2.3191
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
8.239678806
𝑡𝑐 = = 1.8725
√(8.34847)(2.3191)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝑥3 = 0.192219
𝐶𝑖𝑗 = 0.0277
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
0.01922
𝑡𝑐 = = 0.399
√(8.34847)(0.0277)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝒙𝟒 = 𝟐. 𝟒𝟗𝟏𝟐
𝐶𝑖𝑗 = 2.1765
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
2.4912
𝑡𝑐 = = 0.5844
√(8.34847)(2.1765)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝒙𝟓 = 𝟐. 𝟓𝟎𝟗𝟐
𝐶𝑖𝑗 = 0.2630
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
2.5092
𝑡𝑐 = = 1.6933
√(8.34847)(0.2630)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝒙𝟔 = 0.4267
𝐶𝑖𝑗 = 0.6944
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
0.4267
𝑡𝑐 = = 0.1772
√(8.34847)(0.6944)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝒙𝟕 = −1.9471
𝐶𝑖𝑗 = 1.3866
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
−1.9471
𝑡𝑐 = = −0.5722
√(8.34847)(1.3866)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
Decisión: Como 𝑡𝑐 > 𝑡𝑡 , se rechaza Ho.
𝒙𝟖 = −𝟎. 𝟎𝟑𝟑𝟕
𝐶𝑖𝑗 = 0.0005
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
−0.0337
𝑡𝑐 = = −0.5216
√(8.34847)(0.0005)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
𝒙𝟗 = 0.2726
𝐶𝑖𝑗 = 0.5520
β̂𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =
√𝜎̂ 2 𝐶𝑖𝑗
𝑡(0.025,23) = −2.06865761
0.02726
𝑡𝑐 = = 0.0126
√(8.34847)(0.5520)
Hipótesis:
𝐻𝑜: 𝛽1 = 0.
𝐻1: 𝛽1 ≠ 0.
Análisis de los regresores: Como todos los regresores aportan información, se concluye que el modelo
es el mismo Modelo de regresión Múltiple determinado en los pasos anteriores.
Análisis y Diseño experimental
El Análisis De Varianza
13.27. Supóngase que se mide cada tratamiento dos veces en cada bloque en un diseño de bloques
aleatorizados, con 𝑏 bloques y 𝑘 tratamientos . Indique como realizaría los cálculos para un análisis de
varianza.
ANOVA
Hipótesis
𝐻0 ∶ µ1 = µ2 = µ3
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑠𝑒𝑎 𝑑𝑖𝑠𝑡𝑖𝑛𝑡𝑎 𝑎 𝑙𝑎 𝑜𝑡𝑟𝑎
Análisis: Por tanto, si 𝐹0 > 𝐹(0.05,3,9) rechazamos la hipótesis nula. En este caso tenemos que 𝐹0 es menor
que 𝐹 .
Decisión: No se Rechaza 𝐻0
𝐺. 𝐿 = 16 − 4 = 12
𝑇(0.025,12) = 2.179
𝑀𝑆𝐸 = 1.95
2(1.95)
𝐿𝑆𝐷 = (2.179)√ = 2.15
4
Media Poblacional 𝑌̅
𝑌̅1 =8/4=2
𝑌̅2 =12/4=3
𝑌̅3 =13/4=3.25
𝑌̅4 =16/4=4
Calculando las respectivas diferencias entre ellas tendremos que ,
|𝑌̅1 − 𝑌̅2 | = 1
|𝑌̅1 − 𝑌̅3 | = 1.25
|𝑌̅1 − 𝑌̅4 | = 2
|𝑌2 − 𝑌̅3 | = 1.25
̅
|𝑌̅2 − 𝑌̅4 | = 1
|𝑌3 − 𝑌̅4 | = 0.75
̅
Analizando, |𝑌̅𝑖 − 𝑌̅𝑗 | > 𝐿𝑆𝐷.
µ1 = µ2
µ1 = µ3
µ1 = µ4
µ2 = µ3
µ2 = µ4
µ3 = µ4
Conclusión: Como los datos expresados en el siguiente ejercicio, la variabilidad entre las ambas µ no
varía, y se mantienen casi constante de la una respecto a la otra. La variabilidad es muy mínima
exceptuando en el método 4 que sobrestima menos de uno a 0.75
Solución:
Tendremos que en el siguiente ejercicio nos pide realizar dicho inciso con el diseño experimental bloque
aleatorizado por tanto tendremos que
Lingote Níquel Hierro Cobre 𝒀..
1 67.0 71.9 72.2 211.1
2 67.5 68.8 66.4 202.7
3 76.0 82.6 74.5 233.1
4 72.7 78.1 67.3 218.1
5 73.1 74.2 73.2 220.5
6 65.8 70.8 68.7 205.3
7 75.6 84.9 69.0 229.3
𝒀.𝒋 497.7 531.3 491.3 1520.3
Realizando cálculos,
2 2
(1520.3)2
𝑆𝑆𝑇 = (67.0) +, , , , , , +(69.0) − = 524.6495
21
ANOVA
Hipótesis
Análisis: Por tanto, si 𝐹0 > 𝐹(0.05,3,9) rechazamos la hipótesis nula. En este caso tenemos que 𝐹0 es menor
que 𝐹 .
𝐺. 𝐿 = 21 − 3 = 18
𝑇(0.025,18) = 2.101
𝑀𝑆𝐸 = 10.37
2(10.37)
𝐿𝑆𝐷 = (2.101)√ = 5.5242
3
Media Poblacional 𝑌̅
497.7
𝑌̅1 = = 71.1
7
531.3
𝑌̅2 = = 75.9
7
491.3
𝑌̅3 = = 70.18
7
Calculando las respectivas diferencias entre ellas tendremos que,
|𝑌̅1 − 𝑌̅2 | = 4.8
Conclusión: Como los datos recopilados expresados, rechazamos la hipótesis nula, debido a que 𝐹0 >
𝐹(0.05,3,9) , y es por ello al calcular la media población denotamos que al menos una es distinta a la otra,
por lo que el material de hierro es un agente soldante que actúa con mas fuerza ala hora de soldar en dicho
material.
ANOVA
Calcularon del F,
𝐹(𝛼,𝑉1) = 𝐹(0.05,8) = 4.46
Hipótesis
𝐻0 ∶ µ1 = µ2 = µ3
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑠𝑒𝑎 𝑑𝑖𝑠𝑡𝑖𝑛𝑡𝑎
Análisis: Por tanto, si 𝐹0 > 𝐹(0.05,8) rechazamos la hipótesis nula. En este caso tenemos que 𝐹0 es menor
que 𝐹 .
Decisión: No se Rechaza 𝐻0
𝐺. 𝐿 = 15 − 3 = 12
𝑇(0.025,12) = 2.179
𝑀𝑆𝐸 = 0.0528
2(0.0528)
𝐿𝑆𝐷 = (2.179)√ = 0.4088
3
Media Poblacional 𝑌̅
73.3
𝑌̅1 = = 24.4333
3
81.3
𝑌̅2 = = 27.1667
3
81.4
𝑌̅3 = = 27.133
3
Calculando las respectivas diferencias entre ellas tendremos que ,
|𝑌̅1 − 𝑌̅2 | = 2.7433
|𝑌̅1 − 𝑌̅3 | = 2.7
|𝑌̅1 − 𝑌̅4 | = 0.0334
̅ ̅
Analizando, |𝑌𝑖 − 𝑌𝑗 | > 𝐿𝑆𝐷.
µ1 ≠ µ2
µ1 ≠ µ3
µ2 = µ4
Conclusión: Con la información que se obtuvo por el análisis de los datos recopilados, de determinó, que
al menos uno o más son distinto entre ellos. Por ende una de las empresas tiene el envío más rápido en
relación a la otra
Cálculos realizados en Excel
Matriz X
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
4.9146 5.0208 4.5429 4.5573 5.0597 3.898 5.898 5.6039 5.8282 5.3003 6.2712 5.9592 5.05 8.2464 6.6969 7.7841 9.0384 5.9894 7.5422 8.7951 6.0831 8.3607 8.14 9.1416
1 1 1 1 1 1 1 1 1 1 1 1 1 1.5 1.5 1.5 1 1 1.5 1.5 1.5 1.5 1 1.5
3.472 3.531 2.275 4.05 4.455 4.455 5.85 9.52 6.435 4.9883 5.52 6.666 5 5.15 6.902 7.102 7.8 5.52 5 9.89 6.7265 9.15 8 7.3262
X'= 0.998 1.5 1.175 1.232 1.121 0.988 1.24 1.501 1.225 1.552 0.975 1.121 1.02 1.664 1.488 1.376 1.5 1.256 1.69 1.82 1.652 1.777 1.504 1.831
1 2 1 1 1 1 1 0 2 1 1 2 1.5 1 1.5 1 1.5 2 1 2 1 2 2 1.5
7 7 6 6 6 6 7 6 6 6 5 6 5 8 7 6 7 6 6 8 6 8 7 8
4 4 3 3 3 3 3 3 3 3 2 3 2 4 3 3 3 3 3 4 3 4 3 4
42 62 40 54 42 56 51 32 32 30 30 32 46 50 22 17 23 40 22 50 44 48 3 31
0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 1 0 1 0 1 0 0
Calculando X’X
25.9
29.5 - - -
27.5 4.5561 0.2856 -1.3912 -0.0911 0.1091 0.3824 1.2227 1.4225 0.0158 0.8926
25.9 830.3 - - -
5510.23992 0.2856 0.1300 -0.2664 -0.0227 0.0884 0.0729 0.1874 0.2023 0.0028 0.0941
29.9
992.45 - - - -
29.9
5186.59026 -1.3912 -0.2664 2.3191 0.0638 0.9026 0.2849 0.4489 0.5981 0.0009 0.4646
30.9 - - -
28.9 X'y= 1175.9642
-0.0911 -0.0227 0.0638 0.0277 0.0717 0.0142 0.0162 0.0121 0.0005 0.0454
35.9 1136.3
(XX')^{- - - -
y= 31.5 5462
1}= 0.1091 -0.0884 -0.9026 -0.0717 2.1765 0.0354 0.0458 0.2596 0.0006 0.1083
31 2651.4 - -
30.9 30328 -0.3824 -0.0729 0.2849 0.0142 0.0354 0.2630 0.1084 0.2100 0.0010 0.1876
30 223.7 - - -
36.9 -1.2227 -0.1874 0.4489 0.0162 0.0458 0.1084 0.6944 0.8562 0.0000 0.3274
41.9 - - - -
40.5 1.4225 0.2023 -0.5981 -0.0121 0.2596 0.2100 0.8562 1.3866 0.0070 0.5183
- - -
43.9
-0.0158 0.0028 -0.0009 0.0005 0.0006 0.0010 0.0000 0.0070 0.0005 0.0062
37.5 - - -
37.9 0.8926 0.0941 -0.4646 -0.0454 0.1083 0.1876 0.3274 0.5183 0.0062 0.5520
44.5
37.9
38.9
36.9
45.8
𝛽0
̂
Por lo tanto, calculando 𝛽 = [ ⋮ ] = (𝑿′𝑿)−1 𝑿′𝒚, se obtiene
𝛽9 10.5614
1.7266
𝛽0 8.2397
̂
𝛽 = [ ⋮ ] = (𝑿′𝑿)−1 𝑿′𝒚 0.1922
𝛽9 2.4912
2.5093
0.4268
-1.9472
-0.0338
0.2727