Está en la página 1de 9

Reporte practica regresión lineal múltiple

CASO 01: En un artículo publicado por Kwan, Kowalski y Skogenboe en Journal of


Agricultural and Food Chemistry, Vol. 27, 1979 se ofrecen datos de 38 marcas de
vino de variedad Pinot Noir. A través del juicio de varios expertos se ha medido la
“Calidad” de cada vino y se dispone de valores de 5 variables (Aroma, Cuerpo,
Sabor, Oakiness, Claridad) que pueden explicar dichos valores de calidad.
Aroma x1 Cuerpox2 Flavor x3 Oakiness x4 Claridad x5 Quality y
x1 x2 x3 x4 x5 Y
1 3.3 2.8 3.1 4.1 1 9.8
2 4.4 4.9 3.5 3.9 1 12.6
3 3.9 5.3 4.8 4.7 1 11.9
4 3.9 2.6 3.1 3.6 1 11.1
5 5.6 5.1 5.5 5.1 1 13.3
6 4.6 4.7 5 4.1 1 12.8
7 4.8 4.8 4.8 3.3 1 12.8
8 5.3 4.5 4.3 5.2 1 12
9 4.3 4.3 3.9 2.9 1 13.6
10 4.3 3.9 4.7 3.9 1 13.9
11 5.1 4.3 4.5 3.6 1 14.4
12 3.3 5.4 4.3 2.6 0.5 12.3
13 5.9 5.7 7 4.1 0.8 16.1
14 7.7 6.6 6.7 3.7 0.7 16.1
15 7.1 4.4 5.8 4.1 1 15.5
16 5.5 5.6 5.6 4.4 0.9 15.5
17 6.3 5.4 4.8 4.6 1 13.8
18 5 5.5 5.5 4.1 1 13.8
19 4.6 4.1 4.3 3.1 1 11.3
20 3.4 5 3.4 3.4 0.9 7.9
21 6.4 5.4 6.6 4.8 0.9 15.1
22 5.5 5.3 5.3 3.8 1 13.5
23 4.7 4.1 5 3.7 0.7 10.8
24 4.1 4 4.1 4 0.7 9.5
25 6 5.4 5.7 4.7 1 12.7
26 4.3 4.6 4.7 4.9 1 11.6
27 3.9 4 5.1 5.1 1 11.7
28 5.1 4.9 5 5.1 1 11.9
29 3.9 4.4 5 4.4 1 10.8
30 4.5 3.7 2.9 3.9 1 8.5
31 5.2 4.3 5 6 1 10.7
32 4.2 3.8 3 4.7 0.8 9.1
33 3.3 3.5 4.3 4.5 1 12.1
34 6.8 5 6 5.2 1 14.9
35 5 5.7 5.5 4.8 0.8 13.5
36 3.5 4.7 4.2 3.3 0.8 12.2
37 4.3 5.5 3.5 5.8 0.8 10.3
38 5.2 4.8 5.7 3.5 0.8 13.2
PRACTICA DE METODOS ESTADISTICOS Página 1
1. Plantear las hipótesis
Ho: Los datos se ajustan al modelo de regresión adoptado es decir.
𝑦 = 𝛽0+ 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘
Ha: Los datos no se ajustan bien al modelo de regresión adoptado
2. Determinar el nivel de significancia
𝛼 =0.05
1. 𝐺𝑟𝑎𝑓𝑖𝑞𝑢𝑒 𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜𝑠 𝑑𝑒 𝑝𝑢𝑛𝑡𝑜𝑠( 𝐸𝑆 𝐷𝐼𝐹𝐼𝐶𝐼𝐿)

3. Coloque 𝛽1 + 𝛽2 + 𝛽3 y la ecuación de pronostico y=𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘

En Excel
Coeficientes
Β0 3.57566061
Β1 0.516277198
Β2 0.25912734
Β3 1.171017811
Β4 -0.737872559
Β5 2.902839411

La ecuación por lo tanto seria:


𝑌 = 3.57 + 0.51𝑥1 + 0.25𝑥2 + 1.17 𝑥3 − 0.73𝑥4 + 2.90𝑥5
En SPSS:

Coeficientesa

Coeficientes
Coeficientes no estandarizados estandarizados

Modelo B Error estándar Beta t Sig.

1 (Constante) 3,576 2,146 1,666 ,105


Aroma ,516 ,267 ,273 1,931 ,062

cuerpo ,259 ,325 ,104 ,798 ,431

sabor 1,171 ,298 ,589 3,930 ,000

textura -,738 ,260 -,281 -2,838 ,008

claridad 2,903 1,741 ,176 1,668 ,105

a. Variable dependiente: calidad vino

4. Calcule r y R2
En Excel:

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.855818144
Coeficiente de determinación R^2 0.732424695

En SPSS:

PRACTICA DE METODOS ESTADISTICOS Página 2


Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación

1 ,856a ,732 ,691 1,1377

a. Predictores: (Constante), claridad, Aroma, textura, cuerpo, sabor

5. Obtener el ANVA correspondiente


En Excel:

ANÁLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor crítico de
libertad cuadrados cuadrados F F
17.518500
Regresión 5 113.370862 22.6741724 2 2.4078E-08
Residuos 32 41.417559 1.29429872
Total 37 154.788421

En SPSS:
ANOVAa

Suma de Media
Modelo cuadrados gl cuadrática F Sig.

1 Regresión 113,371 5 22,674 17,519 ,000b

Residuo 41,418 32 1,294

Total 154,788 37

a. Variable dependiente: CALIDAD


b. Predictores: (Constante), CLARIDAD, AROMA, TEXTURA, CUERPO, SABOR

6. Decision: Si p-valor <<alfa ==> se rechaza la Ho


0.000000024078<<0.05 Por tanto la hipótesis nula se rechaza

7. Conclusión:
Como se puede apreciar, el valor p de falta de ajuste indica 0.000000024078 esto significa que un 95%de
confianza se rechaza la idea de que datos se ajustan a un modelo lineal múltiple….. puede ser otro
modelo de pronostico que involucre elementos cuadráticos””

¿Por qué?
Porque con este ajuste la ecuación de pronostico solo representa solo representa a un 73% de los datos.

PRACTICA DE METODOS ESTADISTICOS Página 3


Caso a.
a. Estime el modelo de regresión de la calidad del vino en base al aroma, sabor y
textura.
Resumen

Estadísticas de la regresión
Coeficiente de0.84195609
correlación múltiple
Coeficiente de0.70889006
determinación R^2
R^2 ajustado 0.68320389
Error típico 1.15121991
Observaciones 38

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 3 109.727974 36.5759912 27.5981215 3.1348E-09
Residuos 34 45.0604474 1.32530728
Total 37 154.788421

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción 6.39202456 1.26713896 5.04445428 1.5043E-05 3.81688836 8.96716076 3.81688836 8.96716076
Aroma x1 0.61687193 0.26169542 2.35721332 0.02431029 0.08504285 1.14870101 0.08504285 1.14870101
Flavor x3 1.17909119 0.2722156 4.33146071 0.00012404 0.62588252 1.73229985 0.62588252 1.73229985
Oakiness x4 -0.60719394 0.25041836 -2.42471815 0.0207846 -1.11610527 -0.09828261 -1.11610527 -0.09828261

b. Estime el modelo de regresión de calidad del vino en base a claridad, aroma, sabor y
textura.

PRACTICA DE METODOS ESTADISTICOS Página 4


Resumen

Estadísticas de la regresión
Coeficiente de0.85269948
correlación múltiple
Coeficiente de determinación
0.7270964 R^2
R^2 ajustado 0.69401718
Error típico 1.13140188
Observaciones 38

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 4 112.546104 28.136526 21.9804553 6.4269E-09
Residuos 33 42.2423169 1.28007021
Total 37 154.788421

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción 4.54259156 1.76195165 2.57815904 0.01458408 0.95787398 8.12730914 0.95787398 8.12730914
Claridad x5 2.37894837 1.60332426 1.48375998 0.14736186 -0.88303937 5.64093611 -0.88303937 5.64093611
Aroma x1 0.56097935 0.25993439 2.15815748 0.03828858 0.03213886 1.08981985 0.03213886 1.08981985
saborx3 1.26274418 0.27340558 4.61857498 5.6501E-05 0.70649634 1.81899202 0.70649634 1.81899202
textura x4 -0.71973373 0.2575301 -2.79475573 0.00858658 -1.24368266 -0.1957848 -1.24368266 -0.1957848

Compara ambos modelos de regresión lineal múltiple. ¿Cuál tiene el mejor ajuste?
c.
Modelo1
R^2
ajustado 0.68320389

Modelo2
R^2
ajustado 0.69401718
 El mejor ajuste lo tiene el modelo2 porque está más próximo al 1y tiene un valor de
R^21= 0.68320389 a comparación con el modelo 2

d.Concluye. ¿Cuál de los dos modelos representa mejor la calidad del vino?
La mejor calidad de vino es el modelo1 debido a que tiene un valor de ajuste menor que el
modelo2 con un valor de R^21= 0.68320389.

PRACTICA DE METODOS ESTADISTICOS Página 5


Caso 02.
Un ingeniero químico se encuentra investigando el rendimiento de un proceso, del
cual le interesan tres variables: temperatura, presión y concentración porcentual.
Cada variable puede estudiarse a dos niveles, bajo y alto, y el ingeniero decide correr
un diseño 2k con estas tres variables. El experimento y los rendimientos
resultantes se muestran en la siguiente tabla:

X1 X2 X3
Corrida (TEMP) (PRESION) (CONC.) RENDIMIENTO
1 -1 -1 -1 32
2 -1 -1 1 36
3 -1 1 -1 57
4 1 -1 -1 46
5 1 1 -1 65
6 -1 1 1 57
7 1 -1 1 48
8 1 1 1 68

5. CÁLCULOS Y REPORTE

8. Plantear las hipótesis


Ho: Los datos se ajustan al modelo de regresión adoptado es decir.
𝑦 = 𝛽0+ 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘
Ha: Los datos no se ajustan bien al modelo de regresión adoptado
9. Determinar el nivel de significancia
𝛼 =0.05
1. 𝐺𝑟𝑎𝑓𝑖𝑞𝑢𝑒 𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜𝑠 𝑑𝑒 𝑝𝑢𝑛𝑡𝑜𝑠( 𝐸𝑆 𝐷𝐼𝐹𝐼𝐶𝐼𝐿)

10. Coloque 𝛽1 + 𝛽2 + 𝛽3 y la ecuación de pronostico y=𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘

En Excel:

Coeficientes
Intercepción 51.125
(TEMP) 5.625
(PRESION) 10.625
(CONC.) 1.125

La ecuación por lo tanto seria:

𝑌 = 51.125 + 5.625𝑥1 + 10625𝑥2 + 1.125

SPPS:

Coeficientesa

PRACTICA DE METODOS ESTADISTICOS Página 6


Coeficientes
Coeficientes no estandarizados estandarizados

Modelo B Error estándar Beta T Sig.

1 (Constante) 51,125 ,573 89,251 ,000

temperatura 5,625 ,573 ,464 9,820 ,001

presion 10,625 ,573 ,876 18,549 ,000

concentracion 1,125 ,573 ,093 1,964 ,121

a. Variable dependiente: rendimiento

11. Calcule r y R2
En Excel:

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.995529039
Coeficiente de determinación R^2 0.991078067

SPPS:

Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación

1 ,996a ,991 ,984 1,62019

a. Predictores: (Constante), concentracion, presion, temperatura

12. Obtener el ANVA correspondiente


En Excel:

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadradosPromedio de los cuadrados F Valor crítico de F
Regresión 3 1166.375 388.7916667 148.111111 0.000148807
Residuos 4 10.5 2.625
Total 7 1176.875

SPSS:

ANOVAa

Suma de Media
Modelo cuadrados gl cuadrática F Sig.

1 Regresión 1166,375 3 388,792 148,111 ,000b

Residuo 10,500 4 2,625


Total 1176,875 7

a. Variable dependiente: rendimiento

PRACTICA DE METODOS ESTADISTICOS Página 7


b. Predictores: (Constante), concentracion, presion, temperatura

13. Decision: Si p-valor <<alfa ==> se rechaza la Ho


0.000148807<<0.05 Por tanto la hipótesis nula se rechaza

14. Conclusión:
Como se puede apreciar, el valor p de falta de ajuste indica 0.000148807 esto significa que un 95%de
confianza se rechaza la idea de que datos se ajustan a un modelo lineal múltiple.

¿Por qué?
Porque con este ajuste la ecuación de pronostico solo representa a un 98% de los datos.

PRACTICA DE METODOS ESTADISTICOS Página 8


e.Caso b.
Estime el modelo de regresión del rendimiento del proceso.
 R^2 ajustado = 0.984

Resumen

Estadísticas de la regresión
Coeficiente de0.99552904
correlación múltiple
Coeficiente de0.99107807
determinación R^2
R^2 ajustado 0.98438662
Error típico 1.62018517
Observaciones 8

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 3 1166.375 388.791667 148.111111 0.00014881
Residuos 4 10.5 2.625
Total 7 1176.875

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción 51.125 0.57282196 89.2511171 9.4479E-08 49.5345913 52.7154087 49.5345913 52.7154087
(TEMP) 5.625 0.57282196 9.81980506 0.00060297 4.03459127 7.21540873 4.03459127 7.21540873
(PRESION) 10.625 0.57282196 18.5485207 4.9722E-05 9.03459127 12.2154087 9.03459127 12.2154087
(CONC.) 1.125 0.57282196 1.96396101 0.12100392 -0.46540873 2.71540873 -0.46540873 2.71540873

PRACTICA DE METODOS ESTADISTICOS Página 9

También podría gustarte