Está en la página 1de 24

ESTADSTICA APLICADA 2 MA145

Solucin - Laboratorio RLS - RNL


Logro de la Sesin: Al trmino de la sesin, el estudiante utiliza la regresin lineal y la
regresin no lineal, para pronsticos en el campo de su especialidad, con el apoyo del
software Minitab.
1. El concreto sin finos, preparado con un agregado grueso clasificado
uniformemente y una combinacin de cemento y agua, es bueno en zonas de
lluvia excesiva por sus excelentes propiedades de drenado. Se desea estudiar la
porosidad (en %) en funcin del peso unitario (lb/pie 3) en muestras de
concreto. A continuacin se muestran los datos respectivos:
Porosidad 28.8
Peso

99

27.9

27

25.2

22.8

20.9

19.6

17.1

18.9

16

16.7

13

13.6

21.5

101.1 102.7 103 105.4 108.7 110.8 112.1 112.4 113.6 113.8 115.1 115.4 107.5

a) Construya un diagrama de dispersin que muestre la relacin entre las dos


variables estudiadas, Podra ajustarse un modelo de regresin lineal simple?
Paso 1
Ordenar los datos en forma vertical para llevarlo a Minitab definiendo las variables
independiente y dependiente respectivamente en Excel.
Peso (x) Porosidad (y)
99
28.8
101.1
27.9
102.7
27
103
25.2
105.4
22.8
108.7
20.9
110.8
19.6
112.1
17.1
112.4
18.9
113.6
16
113.8
16.7
115.1
13
115.4
13.6
107.5
21.5

Paso 2
Hacer el diagrama de dispersin siguiendo la siguiente secuencia:

Paso 3 Seleccionamos Simple y luego OK

Paso 4
Hacer el diagrama de dispersin siguiendo la siguiente secuencia:

Paso 5
Ingresar los valores haciendo un clic en la variable segn lo solicite.

Paso 6
Presionar Ok , entonces Minitab mostr el siguiente Grfico:

b) Ajuste el modelo de regresin lineal simple, presente la ecuacin estimada e


interprete los coeficientes estimados.

c) Verifique los supuestos del modelo.

Los errores se distribuyen normalmente. (Se usa Kolmogorov)

Seleccionamos storage para almacenar los residuos:

Hacemos un check en Residuals:

En la columna C3 quedar almacenada los Residuos o Errores:

Prueba de Normalidad de errores

Ho: Los errores se distribuyen normalmente


H1: Los errores No se distribuyen normalmente
Seleccionamos Prueba de Normalidad

Seleccionamos en variable a RESIDUOS

Como p-valor=0.150 >0.05=alfa


Decisin: No se rechaza Ho
Conclusin:
Al 5% de significacin los errores se distribuye normalmente.
Prueba del supuesto de existencia de auto correlacin

Ho: No existe autocorrelacin entre los residuos


H1: Si existe autocorrelacin entre los residuos

En la ventana de Regresin, activar Results y luego seleccionar


Durbin-Watson statistic para mostrar el valor que debe estar entre 1 y 3:

Finalmente Minitab dar el siguiente reporte:


Regression Equation
Porosidad (y) = 120.55 - 0.9198 Peso (x)
Durbin-Watson Statistic
Durbin-Watson Statistic =

2.12072

Por tanto cumple el supuesto pues 2.12 pertenece al intervalo de 1 a 3.


d) Valide el modelo de regresin lineal simple, al 5% de significacin.

Ho: 1 = 0 (El modelo de regresin No es significativo


H1: 1 0 (El modelo de regresin Si es significativo)
Analysis of Variance
Source
Regression
Peso (x)
Error
Total

DF
1
1
12
13

Adj SS
336.84
336.84
10.80
347.63

Adj MS
336.838
336.838
0.900

F-Value
374.38
374.38

P-Value
0.000
0.000

Como p-valor=0 < 0.05=alfa entonces Rho


CONCLUSION:
Al nivel de significacin del 5%, podemos concluir que el modelo de regresin
estimado es significativo.
e) Interprete el coeficiente de determinacin.
Model Summary
S
0.948540

R-sq
96.89%

R-sq(adj)
96.64%

R-sq(pred)
95.71%

El 96.89% de la variabilidad total del porcentaje de porosidad es explicada por la


ecuacin de regresin ajustada.
f)

Al nivel de significacin del 5%, se puede afirmar que, cuando el peso unitario
promedio aumenta en 1 lb/pie3, el porcentaje de porosidad disminuye en ms de
0.95?

Ho : 1 0.95
H1 : 1 0.95

= 0.05
Estadstico de prueba:

t calculado

tcalculado

1 1
Se
S xx

~ t( n 2)

0.9198 (0.95)
0.6358 t crtico (0.05,12) 1.782
0.0475

T calc =
0.6358

10

Decisin: No se rechaza Ho
Conclusin: No existe evidencia suficiente para afirmar que cuando el peso unitario
promedio aumenta en 1 lb/pie3, el porcentaje de porosidad disminuye en ms de
0.95
g) Se puede afirmar que el porcentaje de porosidad est relacionado con el peso
unitario en la muestra de concreto? Utilice nivel de significacin del 5%.
Ho: 0 = 0 (No existe asociacin lineal entre las variables)
H1: 0 0 (Si existe asociacin lineal entre las variables)

OBS: r ser negativo, porque el valor de la pendiente es negativo, las variables tienen
una relacin inversa.
tcal

0.984327 14 2
19.3353
1 0.9689

t crtico (0.025;12) 2.179

Distribution Plot
T, df=12
0.4

Density

0.3

0.2

tcal=-19.335
3

RHo

0.1

0.025
0.0

0.025
-2.179

2.179

Decisin estadstica : Se rechaza Ho

Conclusin: Con un nivel de significancia del 5% se puede afirmar que


existe asociacin lineal entre el porcentaje de porosidad y el peso.

11

h) Se puede afirmar que entre el peso unitario de concreto y el porcentaje de


porosidad la correlacin es menor a 0.965? Utilice un nivel de significacin del
5%.

Grfica de distribucin
Normal, Media=0, Desv.Est.=1
0.4

Densidad

0.3

0.2

0.1

0.05
0.0

-1.645

Decisin estadstica : No se rechaza Ho


Conclusin:

Con un nivel de significacin del 5%, no se puede afirmar que el peso


unitario del concreto y el porcentaje de porosidad tienen una
correlacin menor a -0.965

12

i)

Estime mediante un intervalo de confianza del 96% el porcentaje de porosidad


promedio que podra tener un ejemplar de concreto cuando el peso es de 110
lb/pie3.

Prediction for Porosidad


Regression Equation
Porosidad) = 120.55 - 0.9198 Peso
Variable Setting
Ajuste
EE de ajuste
IC de 96%
IP de 96%
19.3682
0.261928
(18.7651, 19.9714) (17.1022, 21.6342)
C o nclusi n: Con un nivel de significancia del 96%, podemos estimar el
porcentaje de porosidad medio que podra tener un ejemplar de concreto
cuando el peso es de 110 lb/pie3, se encontrar entre 18.7651 y
19.9714.
j)

Estime mediante un intervalo de confianza del 98% el porcentaje de porosidad que


podra tener un ejemplar de concreto cuando el peso es de 110 lb/pie3.

Recuerde :

Pronsticos
Valor individual

1 ( x 0 x )2
y 0 t ( n 2, / 2)s 1
n
Sxx
Prediction for Porosidad
Regression Equation
Porosidad) = 120.55 - 0.9198 Peso
Variable
Peso

Setting
110

Fit
19.3682

SE Fit
0.261928

98% CI
(18.6660, 20.0704)

98% PI
(16.7300, 22.0064)

C onclusin: Con un nivel de significancia del 98%, podemos estimar que


el porcentaje de porosidad que podra tener un ejemplar de concreto
cuando el peso es de 110 lb/pie3, est entre 16.7300 y 22.0704

13

2. Los datos en la siguiente tabla proporcionan los kilmetros por galn que recorre
un automvil de prueba que utiliza gasolina de diferente octanaje. Se desea
estudiar el recorrido de un automvil en funcin del octanaje de la gasolina
utilizada:
Octanaje
Recorrido

89
93
87
90
89
95 100 98
20.9 21.2 20.9 21.9 21.4 22.2 24.8 22.8

a) Realice un diagrama de dispersin entre estas dos variables.


Copiar los datos a EXCEL.
X = Octanaje
Y = Recorrido
Para realizar el grafico de dispersin seguir los siguientes pasos
Insertar Dispersin)
Hacer Clic en uno de los puntos del Grfico con el botn
derecho haga click en agregar lnea de Tendencia Elegir
Lineal Click en las opciones: Presentar ecuacin en el grfico
y presentar el valor
R cuadrado en el grfico. Repetir el proceso para tendencia Potencial, exponencial y polinmica.

14

30
25
20
15

y = 0.2452x - 0.7036
R = 0.7746
y = 8.0447e0.0109x
R = 0.7836

10
5

y = 0.0276x 2 - 4.9091x + 239.79


R = 0.8861
y = 0.2302x 1.0069
R = 0.7734

0
86

88

90

92

94

96

98

100

102

b) Determine el mejor modelo de regresin no lineal a un nivel de


significacin del 2,5%.
Modelo
Cuadrtico
Exponencial
0.7836
Lineal
0.7746
Potencia
0.7734

R2
0.8861

Validando con el modelo cuadrtico:


MEN CALCULAR

15

ESTADISTICA REGRESION AJUSTAR MODELO DE REGRESION LINEAL

RESULT ADO OBTENIDO

Anlisis de Varianza
Fuente
Regresin
XOctanaje
X2
Error
Falta de ajuste
Error puro
Total
Coeficientes
Trmino
Constante
XOctanaje
X2

GL
2
1
1
5
4
1
7

Coef
240
-4.91
0.0276

SC Ajust.
10.5875
1.2083
1.3324
1.3613
1.2363
0.1250
11.9488

MC Ajust.
5.2937
1.2083
1.3324
0.2723
0.3091
0.1250

EE del

coef.
109
2.33
0.0125

Valor T
2.20
-2.11
2.21

Valor F
19.44
4.44
4.89

Valor p
0.004
0.089
0.078

2.47

0.441

Valor p
0.079
0.089
0.078

VIF
3069.08
3069.08

Ho: 2 = 0 (El modelo cuadrtico no es vlido)


H1: 2 0 (El modelo cuadrtico es vlido)
Alfa = 0.05
P-valor = 0.078 > 0.05
Decisin: No se rechaza
Conclusin: Al 5% de significacin, el modelo cuadrtico no es significativo.
Validando con el modelo exponencial
Linealizar el modelo exponencial: Ln Recorrido = Ln 0 + 1X

16

ESTADISTICA REGRESION REGRESION AJUSTAR MODELO DE


REGRESION LINEAL

17

Anlisis de regresin: LNRECORRIDO vs. XOctanaje

Anlisis de Varianza
Fuente
p
Regresin
0.003
XOctanaje
0.003
Error
Falta de ajuste
0.390
Error puro
Total

GL

SC Ajust.

MC Ajust.

Valor F

0.018120

0.018120

21.73

0.018120

0.018120

21.73

6
5

0.005003
0.004724

0.000834
0.000945

3.38

1
7

0.000279
0.023123

0.000279

Valor

Coeficientes
Trmino
Constante
XOctanaje

Coef
2.085
0.01085

EE del

coef.
0.216
0.00233

Valor T
9.66
4.66

Valor p
0.000
0.003

VIF
1.00

Ho: 1 = 0 (El modelo exponencial no es vlido)


H1: 1 0 (El modelo exponencial es vlido)
Alfa = 0.05
Pvalor = 0.003 < 0.05
Decisin: Se rechaza Ho
Conclusin: Al 5% de significacin, el modelo exponencial es significativo o
vlido.

Coeficientes
Trmino
Constante
XOctanaje

Coef
2.085
0.01085

EE del

coef.
0.216
0.00233

Valor T
9.66
4.66

Valor p
0.000
0.003

Por lo tanto el modelo estimado lineal es:


Y 2.085 + 0.01085 XOctanaje

Finalmente el modelo exponencial estimado es : Y

8.0447 e0.01085X

18

c)

Estime el recorrido de un automvil que utiliza gasolina de 95 octanos. Utilice un


intervalo de prediccin del 95%.
ESTADISTICA REGRESION REGRESION PREDECIR

Valor de
Variable configuracin

Octanaje
Ajuste
3.11591

95

EE de ajuste
0.0116103

IC de 95%
(3.08750, 3.14432)

IP de 95%
(3.03975, 3.19206)

Aplicar la funcin exponencial a cada lmite: exp( 3.03975) ; exp( 3.19206)


El IC( IP=valor individual ) = 20.90 ; 24.3385

19

3. Los siguientes datos corresponden al ndice de abastecimiento de agua y la


produccin de papa en unidades agropecuarias Alto Andinas. Se desea estudiar la
produccin de papa en funcin del ndice de abastecimiento de agua. La
produccin se mide en toneladas.
ndice de
abastecimiento 2.1
2.3
2.5
2.9
de agua
Produccin de
papa
1100 1370 1420 1465
(Toneladas)

3.1

3.2

3.3

3.9

1495 1500 1510 1550

4.3

1600 1625

a) Realice un diagrama de dispersin entre estas dos variables.


Copiar los datos a EXCEL.
X = Octanaje
Y = Recorrido
Para realizar el grafico de dispersin seguir los siguientes pasos

Insertar Dispersin)

Hacer Clic en uno de los puntos del Grfico con el botn


derecho haga click en agregar lnea de Tendencia Elegir
Lineal Click en las opciones: Presentar ecuacin en el grfico
y presentar el valor
R cuadrado en el grfico. Repetir el proceso para tendencia Potencial, exponencial
y polinmica.

1800
1600

y = 174.53x + 911.97
R = 0.7551

1400
1200
1000

y = -100.33x 2 + 815.73x - 62.731


R = 0.8571

800

y = 979.61e0.1254x y = 925.11x 0.4031


R = 0.7638
R = 0.7017

600
400

200
0
0

20

b) Determine, valide, escriba e interprete el mejor modelo de regresin y


analice los datos considerando un nivel de significacin del 5%.
R2
0.8571
0.7638
0.7551
0.7017

Modelo
Cuadrtico
Potencia
Lineal
Exponencial

Validando con el modelo cuadrtico:


Anlisis de Varianza
Fuente
GL
Regresin
2
XIagua
1
XIagua2
1
Error
7
Total
9

SC Ajust.
170958
32614
20352
28494
199452

MC Ajust.
85479
32614
20352
4071

Valor F
21.00
8.01
5.00

Valor p
0.001
0.025
0.060

Coeficientes
Trmino
Constante
XIagua
XIagua2

Coef
-63
816
-100.3

EE del

coef.
446
288
44.9

Valor T
-0.14
2.83
-2.24

Valor p
0.892
0.025
0.060

VIF
100.87
100.87

Ho: 2 = 0 (El modelo cuadrtico no es vlido)


H1: 2 0 (El modelo cuadrtico es vlido)
Alfa = 0.05
P-valor = 0.060 > 0.05
Decisin: No se rechaza
Conclusin: Al 5% de significacin, el modelo cuadrtico no es significativo.

Validando con el modelo Potencia:

21

Anlisis de Varianza
Fuente
GL
Regresin
1
LNAGUA
1
Error
8
Total
9

SC Ajust.
0.08460
0.08460
0.02616
0.11076

MC Ajust.
0.084603
0.084603
0.003270

Valor F
25.87
25.87

Valor p
0.001
0.001

Resumen del modelo


S
0.0571864

R-cuad.
76.38%

R-cuad. R-cuad.

(ajustado)
73.43%

(pred)
47.54%

Coeficientes
Trmino
Constante
LNAGUA

Coef
6.8299
0.4031

EE del

coef.
0.0910
0.0792

Valor T
75.08
5.09

Valor p
0.000
0.001

VIF
1.00

Ecuacin de regresin
LNPAPA = 6.8299 + 0.4031 LNAGUA

22

Ho: 1 = 0 (El modelo potencia no es vlido)


H1: 1 0 (El modelo potencia es vlido)
Alfa = 0.05
P-valor = 0.001 < 0.05
Decisin: Se rechaza
Conclusin: Al 5% de significacin, el modelo potencia es vlido.
El modelo es:

Y 925.1e0.4031X

c) Estime la produccin de papas si el ndice de abastecimiento de agua es de 4. Utilice un


intervalo de prediccin del 99%.

EST ADIST ICA REGRESION REGRESION PREDECIR

Ajuste EE de ajuste
IC de 99%
IP de 99%
7.38868 0.0274907 (7.29644, 7.48092) (7.17578, 7.60158)

Aplicar la funcin exponencial a cada lmite: exp(7.17578) ; exp( 7.60158)


El IC( IP=valor individual ) = 1307.379 ; 2001.356

23

PROPUESTOS

1. Se piensa que el nmero de libras de vapor (miles de lb) consumidas mensualmente


por una planta qumica se relaciona con la temperatura ambiente promedio (en F) de
ese mes. En la tabla siguiente se muestran la temperatura y el consumo mensual.
Mes
Temperatura
Consumo

Ene

Feb

Mar

Abr

May

Jun

Jul

Ago

Sep

Oct

Nov

Dic

21

24

32

47

50

59

68

74

62

50

41

30

115.79 214.47 288.03 314.84 354.58 419.03 321.55 475.03 462.03 382.03 269.95 273.98

En todos los casos use un =0,05.


a) Construya un diagrama de dispersin que muestre la relacin entre las dos
variables estudiadas, Podra ajustarse un modelo de regresin lineal simple?
b) Verifique los supuestos del modelo.
c) Ajuste el modelo de regresin lineal simple, presente la ecuacin estimada e
interprete los coeficientes estimados.
d) Evale la significancia (validacin) del modelo de regresin lineal simple.
e) Interprete el coeficiente de determinacin.
f) Al nivel de significacin del 5%, se puede afirmar que, cuando la temperatura
mensual promedio aumente en 1 F, el consumo de vapor aumenta en ms de
5000 libras?
g) Se puede afirmar que la temperatura mensual promedio est relacionado con
el consumo de libras de vapor de la planta qumica?
h) Se puede afirmar que la correlacin entre ambas variables es superior a 0,8?
i) Estime mediante un intervalo de confianza del 96% el consumo que podra
tener la planta qumica cuando en un mes determinado la temperatura
ascienda a 60F.
j) Estime mediante un intervalo de confianza del 96% el consumo promedio que
podra tener la planta qumica cuando en un mes determinado la temperatura
ascienda a 60F.
2. La factura mensual del gasto telefnico de una pequea empresa se ha incrementado
notablemente en los ltimos meses. Los estudios realizados por el administrador de la
empresa argumentan que el mayor uso de Internet dentro de la misma es la principal
causa del mayor gasto en telfono, lo que ha hecho que se estudie la posibilidad de
acogerse a alguno de los mltiples bonos o tarifas especiales que ofrecen las
compaas, lo que hasta la fecha todava no se ha llevado a cabo. Los datos recogidos
son:
Gasto
55 100 118 120 142 70
Minutos de internet 200 500 700 800 1000 220

125
795

98
440

125
950

65
170

a. Determine, valide, escriba e interprete el mejor modelo de regresin y analice


los datos considerando un nivel de significacin del 5%.
b. Estime el gasto mensual de un mes si el tiempo de conexin del internet es de
1100 minutos. Utilice un intervalo de prediccin del 97%.
c. Estime el gasto mensual promedio si el tiempo de conexin del internet es de

1200 minutos. Utilice un intervalo de prediccin del 94%.

24

También podría gustarte