Está en la página 1de 8

Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Taller 2. Repaso Regresión Lineal Simple

En la siguiente tabla se presentan los datos sobre la captura de una variedad de pez
conocida como “boquerón peruano” en millones de toneladas métricas, y los precios de
harina de pescado en dólares por tonelada para los años de 1965 – 1978.

Tomando en consideración las salidas de R presentadas, realice lo siguiente:

1. Analice qué tipo de asociación presenta el precio de harina de pescado vs. la


captura de boquerón, durante los años considerados. ¿Qué modelo de regresión
lineal sería más adecuado?

2. Se decidió ajustar 3 modelos: Un modelo simple, otro con transformación


logarítmica para Y y otro modelo polinómico de grado 2. Suponiendo válidos los
supuestos para cada modelo realice las pruebas de significancia sobre la
pendiente de la recta ajustada. ¿Qué porcentaje de la variabilidad total en el precio
de la harina, durante los años considerados, es explicada por cada modelo?, ¿En
cuánto podemos estimar el coeficiente de correlación lineal entre las variables
precio de harina de pescado y volumen de captura del boquerón peruano, para los
años considerados?

3. De acuerdo a los gráficos de residuales vs. predichos, vs. X, vs. Y y vs. el tiempo
para cada modelo. ¿Qué se puede concluir a partir de estos?

4. Haga prueba de normalidad, de incorrelación y de varianza constante sobre los


errores para los tres modelos. ¿Qué se concluye a un nivel de significancia del
5%?

5. Estudie la posible existencia de observaciones influenciales y estudie la


conveniencia o no de eliminarlas.

6. Calcule y grafique intervalos de confianza y de predicción para la respuesta media


del precio de la harina de pescado al 95%. ¿Es conveniente predecir una
respuesta futura del precio de harina de pescado, para el nivel de captura de
500.000 toneladas métricas?

1
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

7. Determine qué modelo es mejor para explicar la variabilidad del precio de la harina
de pescado considerando como predictora la variable captura del boquerón.

Salidas R:

Salida 1 Salida 2
Diagrama de Dispersión
> cor(matriz)
[,1] [,2]
500

[1,] 1.0000000 -0.8575691


[2,] -0.8575691 1.0000000
400

> cov(matriz)
Precio

[,1] [,2]
300

[1,] 15.25295 -448.4646


[2,] -448.46462 17929.3462
200

2 4 6 8 10 12

Captura

SALIDAS MODELO 1
Salida 3

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 452.119 36.824 12.278 3.75e-08
x -29.402 5.091 -5.775 8.81e-05

Residual standard error: 71.69 on 12 degrees of freedom


Multiple R-squared: 0.7354, Adjusted R-squared: 0.7134
F-statistic: 33.36 on 1 and 12 DF, p-value: 8.805e-05

Salida 4

Analysis of Variance Table

Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x 1 171414 171414 33.356 8.805e-05
Residuals 12 61668 5139
Salida 5 Salida 6

Residuales vs. predichos Residuales vs. x (Captura)


150
150

100
100

50
50

Residuales
Residuales

0
0

-50
-50

-100
-100

2 4 6 8 10 12
100 150 200 250 300 350 400 450
^ Captura
y

2
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Salida 7 Salida 8
Residuales vs. y (Precio) Residuales vs. tiempo
150

150
100

100
50

50
Residuales

r
0

0
-50

-50
-100

-100
200 300 400 500 2 4 6 8 10 12 14

Captura t

Salida 9 Salida 10
Normal Q-Q Plot

Shapiro-Wilk normality test


2

data: residuals(modelo)
Residuales estandarizados

W = 0.9635, p-value = 0.7803

Jarque-Bera Normality Test


0

data: residuals(modelo)
-1

JB = 0.6595, p-value = 0.7191


-1 0 1

Theoretical Quantiles

Salida 11 Salida 12

Box-Ljung test studentized Breusch-Pagan test


data: r
X-squared = 16.6702, df = 13, p-value = data: y ~ x
0.2148 BP = 0.7181, df = 1, p-value = 0.3968

Salida 13

ACF modelo PACF Modelo


1.0

0.4
0.2
0.5

Partial ACF
ACF

0.0
0.0

-0.2
-0.4
-0.5

0 2 4 6 8 10 2 4 6 8 10

Lag Lag

3
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Salida 14 Salida 15
dfb.1 dfb.x dffit cov.r cook.d
1 -0.05512 -0.0548 -0.2034 1.181 0.02159
2 0.00226 -0.1040 -0.1962 1.241 0.02035
3 0.03761 -0.1188 -0.1709 1.337 0.01566
4 0.03700 -0.0988 -0.1344 1.384 0.00977
5 0.00746 -0.0496 -0.0835 1.324 0.00378
6 -0.50446 0.9471 1.1133 0.917 0.51099
7 -0.02985 0.0792 0.1075 1.395 0.00627
8 -0.31267 0.1573 -0.3771 1.008 0.06825
9 1.19181 -0.9173 1.2074 0.525 0.48134
10 0.15196 -0.0867 0.1731 1.250 0.01593
11 -0.58924 0.3840 -0.6322 0.813 0.16970
12 0.19091 -0.1006 0.2255 1.192 0.02648
13 0.20297 -0.1666 0.2034 1.480 0.02226
14 -0.23292 0.1943 -0.2331 1.505 0.02916

SALIDAS MODELO 2
Salida 16

Est.Power Std.Err. Wald Lower Bound Wald Upper Bound


y -0.4815 0.7 -1.8535 0.8906

Likelihood ratio tests about transformation parameters


LRT df pval
LR test, lambda = (0) 0.4752218 1 0.49059465
LR test, lambda = (1) 4.4730263 1 0.03443395

Salida 17
Diagrama de Dispersión Diagrama de Dispersión
6.2
500

6.0
400

5.8
log Precio
Precio

5.6
300

5.4
5.2
200

5.0

2 4 6 8 10 12 2 4 6 8 10 12

Captura Captura

Salida 18
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.15760 0.12142 50.711 2.27e-15
x -0.10780 0.01679 -6.421 3.30e-05

Residual standard error: 0.2364 on 12 degrees of freedom


Multiple R-squared: 0.7746, Adjusted R-squared: 0.7558
F-statistic: 41.23 on 1 and 12 DF, p-value: 3.296e-05
Salida 19
Analysis of Variance Table

Response: ly
Df Sum Sq Mean Sq F value Pr(>F)
x 1 2.30409 2.30409 41.234 3.296e-05
Residuals 12 0.67053 0.05588

4
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Salida 20 Salida 21
Residuales vs. predichos Residuales vs. x (Captura)

0.4
0.4

0.2
0.2

Residuales
Residuales

0.0
0.0

-0.2
-0.2

2 4 6 8 10 12
4.8 5.0 5.2 5.4 5.6 5.8 6.0
^ Captura
y

Salida 22 Salida 23
Residuales vs. log y (log Precio) Residuales vs. tiempo

0.4
0.4

0.2
0.2
Residuales

r2

0.0
0.0

-0.2
-0.2

5.0 5.2 5.4 5.6 5.8 6.0 6.2 2 4 6 8 10 12 14

Captura t

Salida 24 Salida 25
Normal Q-Q Plot
2.0

Shapiro-Wilk normality test


1.5
Residuales estandarizados

data: residuals(modelo2)
1.0

W = 0.9278, p-value = 0.2843


0.5
0.0

Jarque-Bera Normality Test


-0.5

data: residuals(modelo2)
-1.0

JB = 1.2277, p-value = 0.5413


-1 0 1

Theoretical Quantiles

Salida 26 Salida 27

Box-Ljung test studentized Breusch-Pagan test

data: r2 data: ly ~ x
X-squared = 10.27, df = 10, p-value =0.4169 BP = 0.6177, df = 1, p-value = 0.4319

5
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Salida 28
ACF modelo 2 PACF Modelo 2

1.0

0.4
0.2
0.5

Partial ACF
ACF

0.0
0.0

-0.2
-0.4
-0.5

0 2 4 6 8 10 2 4 6 8 10

Lag Lag

Salida 29 Salida 30

dfb.1_ dfb.x dffit cov.r cook.d


1 -0.04392 -0.0437 -0.1621 1.219 0.01393
2 0.00273 -0.1252 -0.2362 1.208 0.02909
3 0.08030 -0.2537 -0.3648 1.194 0.06751
4 0.10327 -0.2758 -0.3751 1.232 0.07178
5 0.00600 -0.0399 -0.0671 1.329 0.00245
6 -0.73117 1.3728 1.6136 0.570 0.84612
7 -0.03626 0.0963 0.1306 1.387 0.00923
8 -0.22534 0.1134 -0.2718 1.136 0.03763
9 0.72620 -0.5589 0.7357 0.928 0.23769
10 0.24108 -0.1375 0.2746 1.160 0.03861
11 -0.46747 0.3046 -0.5016 0.965 0.11637
12 0.27777 -0.1464 0.3280 1.080 0.05336
13 0.11271 -0.0925 0.1129 1.508 0.00693
14 -0.22543 0.1880 -0.2256 1.508 0.02735
SALIDAS MODELO 3
Salida 31

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 516.425 50.157 10.296 5.52e-07
x -63.179 19.916 -3.172 0.00888
I(x^2) 2.759 1.581 1.745 0.10874

Residual standard error: 66.26 on 11 degrees of freedom


Multiple R-squared: 0.7928, Adjusted R-squared: 0.7551
F-statistic: 21.05 on 2 and 11 DF, p-value: 0.0001738

Salida 32

Analysis of Variance Table

Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x 1 171414 171414 39.0445 6.273e-05
I(x^2) 1 13375 13375 3.0466 0.1087
Residuals 11 48292 4390

6
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Salida 33 Salida 34
Residuales vs. predichos Residuales vs. x (Captura)
100

100
50

50
Residuales

Residuales
0

0
-50

-50
-100

-100
150 200 250 300 350 400 450 2 4 6 8 10 12
^
y Captura

Salida 35 Salida 36
Residuales vs. y (log Precio) Residuales vs. tiempo
100

100
50

50
Residuales

r3
0

0
-50

-50
-100

-100
200 300 400 500 2 4 6 8 10 12 14

Captura t

Salida 37 Salida 38
Normal Q-Q Plot
Shapiro-Wilk normality test
2

data: residuals(modelo3)
W = 0.9588, p-value = 0.7036
Residuales estandarizados

Jarque-Bera Normality Test


0

data: residuals(modelo3)
-1

JB = 0.7668, p-value = 0.6815


-1 0 1

Theoretical Quantiles

Salida 39 Salida 40

studentized Breusch-Pagan test Box-Ljung test

data: modelo3 data: r3


BP = 4.7677, df = 2, p-value = 0.09219 X-squared = 12.7506, df = 10,p-value = 0.238

7
Tema: Regresión Lineal Simple Profesor: Romario Conto Semestre: 2019-1

Salida 41 Salida 42

dfb.1_ dfb.x dfb.I.2 dffit cov.r


cook.d
1 0.042400 -0.076647 0.074492 -0.10018
1.585 3.66e-03
2 0.045634 -0.071454 0.061099 -0.11421
1.509 4.74e-03
3 0.030327 -0.034269 0.005521 -0.17599
1.459 1.11e-02
4 0.011200 0.000039 -0.036226 -0.20562
1.485 1.52e-02
5 -0.000379 0.000561 -0.000434 0.00108
1.533 4.28e-07
6 0.369220 -0.638331 0.807641 1.08768
2.448 3.99e-
7 -0.002887 -0.000525 0.010902 0.05885
1.580 1.27e-03
8 0.030487 -0.211489 0.244535 -0.36065
1.300 4.46e-02
9 1.069264 -0.545576 0.334308 1.27435
0.313 3.44e-01
10 0.016696 0.214267 -0.263472 0.44037
1.139 6.40e-02
11 -0.180741 -0.165953 0.257086 -0.63842
0.768 1.19e-01
12 -0.027533 0.327964 -0.385851 0.58924
0.942 1.07e-01
13 -0.166002 0.123195 -0.099440 -0.16950
1.956 1.05e-02
14 -1.297452 1.022843 0.851883 -1.30653
1.153 5.01e-01
Salida 41

Ajuste por los 3 modelos


500
400
Precio

300
200

Modelo RLS
Modelo log(y )
Modelo Pol.orden 2

2 4 6 8 10 12

Captura

También podría gustarte