Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pronosticos - Regresion Lineal Multiple
Pronosticos - Regresion Lineal Multiple
1
Modelo no lineal Hipótesis básicas
> summary(RegModel.gaseosas)
Ejemplo (cont.) Call:
lm(formula = tiempo ~ cajas + distancia, data = gaseosas)
Residuals:
Min 1Q Median 3Q Max
-3.8665 -1.5003 -0.3565 1.1632 5.8292
Y = β 0 + β 1 x1 + β 2 x 2 + ε Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.309200 1.059482 2.180 0.040277 *
cajas 2.740369 0.093472 29.317 < 2e-16 ***
distancia 0.012440 0.002797 4.448 0.000202 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
2
Resultados con R gaseosas Resultados con R
Residuals vs Fitted Normal Q-Q
70
3
Standardized residuals
6
15 15
17
17
2
4
Residuals
60
2
1
Autocorrelación
0
0
-4 -2
50
-1
9
9
-2
tiempo
Durbin-Watson test
40
10 20 30 40 50 60 -2 -1 0 1 2
30
DW = 2.1312, p-value = 0.5928
Scale-Location Residuals vs Leverage alternative hypothesis: true
20
3
Standardized residuals
15
Standardized residuals
1.5
9
17 15
17
1 autocorrelation is greater than 0
2
0.5
1.0
10
1
0
0.5
5 10 15 20 25
-1
Cook's 9distance
-2
0.5
0.0
gaseosas$obs
10 20 30 40 50 60 0.00 0.10 0.20 0.30 No hay evidencia de autocorrelación
Fitted values Leverage
ε n
22 54.12
β k
22 1 16 510 22 54,12 16 510
y n 1 x n1 L x nk 23 56.23
24 22.13
23 1 17 590
24 1 6 100
23
24
56,23
22,13
17
6
590
100
25 21.15 25 1 5 400 25 21,15 5 400
3
Valores ajustados y residuales Propiedades de los estimadores de β
valores ajustados
> RegModel.gaseosas$fitted
1 2 3 4 5 6 7 8
Se demuestra que E (βˆ) = β
8.411918 25.600510 33.946014 36.554664 27.901832 15.758594 12.454782 8.436798
cov( βˆ) = σ 2C
25
20.986880 C = ( X ′X )−1
residuales > RegModel.gaseosas$res
1 2 3 4 5 6
> inv(t(Xgas)%*%Xgas)
1.538081654 -1.150509771 -2.196013856 -1.554664427 -2.881832327 1.101405600
V1 V2 V3
7 8 9 10 11 12 V1 0.2146526166 -7.490914e-03 -3.403891e-04
1.925217705 1.163202492 -3.866483381 -0.464030234 -1.315785653 -0.429096643 V2 -0.0074909142 1.670763e-03 -1.891781e-05
e =y −y
ˆ V3 -0.0003403891 -1.891781e-05 1.495876e-06
V (βˆj ) = σ 2C jj ,
13 14 15 16 17 18
0.536575795 -0.608188574 5.829207693 -0.356510677 4.419662267 -2.026724961 j = 0,1,2
19 20 21 22 23 24
σ ε2
-1.500268613 0.065362869 -2.142220386 1.620702286 -0.004833648 2.134624890 V (b) = cov(βˆi , βˆj ) = σ 2C ij , i ≠ j
25 S XX
0.163119899
n
n n H1) ∃β i ≠ 0 Call:
SC e = ∑
i =1
( y i − yˆ i ) 2 = ∑i =1
e i2 lm(formula = tiempo ~ cajas + distancia, data = gaseosas)
SC R / k Residuals:
y´y − βˆ´X´y
S = 2 Residual standard error: 2.287 on 22 degrees of freedom
H1) β i ≠ 0 Multiple R-Squared: 0.9811, Adjusted R-squared: 0.9794
n − k −1
e
F-statistic: 570.7 on 2 and 22 DF, p-value: < 2.2e-16
Residual standard error: 3.259 on 22 degrees of freedom
Multicolinealidad Multicolinealidad
.
Es la violación del supuesto cov( βˆ) = σ 2C V (βˆj ) = σ 2C jj , j = 0,1,2
∑(
i =1
v x ij −v x j )2 con factor unidad
4
Multicolinealidad Resultados con R
x ij −viejo x j
nuevo xij = viejo
n
∑( v x ij −v x j )2
Se detecta con: i =1
Factores de inflación de varianza (variance
Factores de inflación de varianza (diagonal inflation factors)
principal de (X´X)-1): si alguno supera 5 ó 10 > vif(RegModel.gaseosas)
cajas distancia
Determinante de X´X: valor próximo a 0 1.167128 1.167128
Valores propios (λ) de X´X: próximos a 0. Un
valor propio 0 indica presencia de una variable
combinación lineal de otras. λmax/λmin>100
x ij −viejo x j
Incongruencia entre la F y las t´s, al probar la nuevo x ij = viejo
n
> summary(RegModel.gaseosas)
SC R
R2 =
SCT Call:
lm(formula = tiempo ~ cajas + distancia, data = gaseosas)
SC e
R2 = 1 − Residuals:
SCT Min 1Q Median 3Q Max
-3.8665 -1.5003 -0.3565 1.1632 5.8292
SC e /(n − k − 1) Coefficients:
2
Rajustado =1− Estimate Std. Error t value Pr(>|t|)
SCT /(n − 1) (Intercept) 2.309200 1.059482 2.180 0.040277 *
cajas 2.740369 0.093472 29.317 < 2e-16 ***
SC e n − 1 distancia 0.012440 0.002797 4.448 0.000202 ***
2
Rajustado =1− ---
SCT n − k − 1 Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
5
Intervalo de confianza para Resultados con R
E(Y) = µY/x1…xk
una variable explicativa Venta de alimentos para mascotas Construir un intervalo de confianza para el tiempo
3,5
1 ( xi − x )2 3,0
promedio de suministro a una máquina que requiere 8
ICα + βx ;1 −α = a + bx i ± t n −2;1 −α Se + cajas y está a 275 metros
Cientos de $
2,5
n SXX 2,0
y = 0,074x + 1,45
1,5 > x0 > beta > esperanza<-t(x0)%*%beta
1,0 var1 V1 > esperanza
k variables explicativas 0 5 10 15 20 25
Espacio (dm) 1 1 V1 2.30920043 V1 > t(x0)%*%inv(t(Xgas)%*%Xgas)%*%x0
2 8 V2 2.74036942 var1
[ ]
var1 27.65304
3 275 V3 0.01243958 var1 0.04440008
IC µY / x0 ;1−α = µ
[ ]
−1
ˆY / x0 ± t n − k −1;1−α Se x0´( X´X ) x0
ICµY / x0 ;0.95 = 27.65304 ± t22;0.952.287 0.04440008
[
ˆ0 ± t n − k −1;1−α Se 1 + x0´( X´X )−1 x0
IPy0 ;1−α = y ] m
> x0
600
var1
1 1
500
2 8
3 275
400
distancia
IPy0;0.95 = [22.81;32.50]
300
200
100
5 10 15 20
cajas
ˆ = Xβ̂
y e=y −y
ˆ hii = x i´( X´X )−1 x i
Di =
(βˆ(i ) − βˆ)X´X (βˆ(i ) − βˆ)
pσˆ2
6
Variables Indicadoras Variables Indicadoras
24500
24000
23500
Kilometraje
7
Variables indicadoras color
Variables indicadoras
> summary(RegModel.artificial, cor=FALSE)
blanco
otros
plata Call:
lm(formula = Precio ~ blanco + Kilometraje + plata, data = autos)
Residuals:
25500
Coefficients:
Estimate Std. Error t value Pr(>|t|)
Precio
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
23500
3
Standardized residuals
Call: 72 13 13
500
2
lm(formula = Precio ~ Kilometraje + plata, data = autos)
Residuals
1
ˆi = 26740 − 0.037 x1 + 248.9 x2
0
0
Residuals:
-2 -1
-500
78
1.5
Standardized residuals
13 98
19
---
2
1
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
1.0
-3 -2 -1 0
0.5
78
Bibliografía