Está en la página 1de 4

UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN

FACULTAD DE CIENCIAS
ESTADÍSTICA II- SEMESTRE 2021-I
TALLER # 6
Intervalo de confianza de la respuesta media. Predicción de nuevas observaciones. Validación de supuestos. Métodos para escalar residuales.
Observaciones atípicas. Balanceo. Medidas de Influencia.

1. Determine cual o cuales de las siguientes expresiones no son correctas, corríjalas e indique a que corresponden.
e ̂𝑗
a. 𝒅𝒊 = i c. 𝒕 =
𝛽
√MSE 𝟎,𝒋
𝑑𝑖 √𝐶𝑗𝑗
b. 𝒓𝒊 = 𝑦̂𝑖 −𝑦̂(𝑖)
√(1−ℎ𝑖𝑖 ) d. 𝑫𝑭𝑭𝑰𝑻𝑺𝒊 =
√𝑐𝑖𝑖 𝑀𝑆𝐸(𝑖)

2. Asocie cada una de las siguientes definiciones con su respectiva gráfica y concepto:

i. Valor desacostumbrado de X, que puede controlar ciertas propiedades del modelo___.


ii. Valor inusual tanto en Y como en X. Jala el modelo en su dirección___.
iii. Valor inusual en Y, que en algún aspecto está separada del resto de los datos___.

a. Punto de b. Observación c. Observación


balanceo. atípica. influyente.

Gráfica 1 Gráfica 2 Gráfica 3


Para resolver las preguntas 6 a 9 encontrará la información de los datos en las tablas y gráficos de las siguientes
páginas.
3. Se realizaron 19 pruebas a la resistencia a la ruptura de un fusible (Y), en función de: La altura del dado (X1), ancho
del poste (X2), altura del rizo (X3), longitud del alambre (X4), ancho de la unión con el dado (X5) y ancho de la
unión con el poste (X6).

a. Plantee el modelo de RLM, junto con sus supuestos.


b. Realice la prueba de significancia de la regresión y concluya.
c. ¿Es 𝛽̂0 interpretable? En caso afirmativo, interprételo.
d. Según el investigador, entre más largo sea el alambre de un fusible, se tendrá menos resistencia a la ruptura
¿Es esto cierto?
e. Se desea probar la siguiente hipótesis 𝐻0 : 3𝛽2 = 2𝛽3 , 𝛽1 = 0. Plantee la expresión del estadístico de prueba.
f. Calcule el 𝑅 2, el 𝑅 2 𝑎𝑑𝑗 y concluya.
g. Determine si en el modelo que contiene las variables altura del rizo (X3) y la longitud del alambre (X4) es
significativo
4. Analice los residuales del modelo, identificando observaciones atípicas, puntos de balanceo e influénciales.

5. Si le piden establecer intervalos de confianza del 95% para la respuesta media cuando se tienen las siguientes
condiciones iniciales: X0 = [1 X01 X02 X03 X04 X05 X06] = [1 5.4 19.9 30.6 86.4 2.0 1.7] y X0* = [1 6.9 15.9
33.8 97.6 2.1 1.4], dichos intervalos son, respectivamente:
a. Con X0 el intervalo es (7.8945< ; 10.4535) y con X0* el intervalo es (6.0173 ; 13.0772).
b. Con X0 no se puede hallar porque hay extrapolación y con X0* el intervalo es (6.0173 ; 13.0772).
c. Con X0 el intervalo es (7.8945 ; 10.4535) y con X0* no se puede hallar porque hay extrapolación.
d. Tanto para X0 como X0* no se puede hallar su respectivo intervalo de confianza porque ambos son una
extrapolación.
6. Utilizando 𝛼 = 0.01 y con las condiciones iniciales dadas en el punto anterior, realice los intervalos de predicción
para un valor futuro.
Análisis de varianza Parámetros estimados
Tabla ANOVA Modelo de Regresión Coefficients:
Estimate Std. Error t value Pr(>|t|)
SumSq Df MeanSq F0 P.value (Intercept) 2.78065 8.40213 0.331 0.74639
Modelo 23.637696 6 3.9396159 4.933 9.16e-03 AlturaDado 0.64516 0.58860 1.096 0.29455
Error 9.583357 12 0.7986131 AnchoPoste 0.03028 0.26699 0.113 0.91158
--- AlturaRizo 0.50551 0.14219 3.555 0.00396
Residual standard error: 0.8937 on 12 degrees of freedom LongitudAlambre -0.12239 0.05565 -2.199 0.04820
Multiple R-squared: 0.7115, Adjusted R-squared: 0.5673 AnchoUnionDado -2.59797 2.58380 -1.005 0.33451
F-statistic: 4.933 on 6 and 12 DF, p-value: 0.009163 AnchoUnionPoste 1.53478 1.52954 1.003 0.33546
Tabla 1. Análisis de varianza Tabla 2. Parámetros estimados

Todas las regresiones posibles


NoOfVars R2 adjR2 SSE Cp Variables.in.model
1 1 0.4772 0.4465 17.36650 6.7458 X3
2 1 0.3107 0.2702 22.89810 13.6723 X4
3 1 0.1121 0.0598 29.49784 21.9363 X5
4 1 0.1044 0.0517 29.75383 22.2569 X1
5 1 0.0926 0.0392 30.14544 22.7472 X2
6 1 0.0615 0.0063 31.17634 24.0381 X6
7 2 0.6476 0.6035 11.70775 1.6601 X3 X4
8 2 0.5716 0.5180 14.23353 4.8228 X3 X5
9 2 0.5232 0.4636 15.84011 6.8345 X2 X3
10 2 0.5045 0.4426 16.45980 7.6105 X1 X3
11 2 0.4876 0.4236 17.02237 8.3149 X3 X6
12 2 0.3921 0.3162 20.19386 12.2862 X1 X4
13 2 0.3255 0.2412 22.40716 15.0576 X4 X5
14 2 0.3159 0.2304 22.72498 15.4556 X2 X4
15 2 0.3121 0.2261 22.85344 15.6164 X4 X6
16 2 0.1848 0.0830 27.08019 20.9090 X1 X2
17 2 0.1776 0.0748 27.32158 21.2113 X1 X5
18 2 0.1436 0.0366 28.44931 22.6234 X2 X5
19 2 0.1351 0.0269 28.73444 22.9804 X2 X6
20 2 0.1254 0.0161 29.05436 23.3810 X5 X6
21 2 0.1220 0.0122 29.16842 23.5238 X1 X6
22 3 0.6726 0.6071 10.87606 2.6187 X1 X3 X4
23 3 0.6713 0.6056 10.91906 2.6725 X3 X4 X5
24 3 0.6499 0.5799 11.63073 3.5637 X2 X3 X4
25 3 0.6498 0.5797 11.63450 3.5684 X3 X4 X6
26 3 0.5818 0.4982 13.89240 6.3957 X1 X3 X5
27 3 0.5799 0.4959 13.95474 6.4737 X2 X3 X5
28 3 0.5727 0.4872 14.19528 6.7749 X3 X5 X6
29 3 0.5480 0.4577 15.01427 7.8004 X1 X2 X3
30 3 0.5290 0.4349 15.64563 8.5910 X2 X3 X6
31 3 0.5066 0.4080 16.39006 9.5232 X1 X3 X6
32 3 0.3989 0.2787 19.96798 14.0033 X1 X4 X6
33 3 0.3961 0.2754 20.06110 14.1199 X1 X4 X5
34 3 0.3958 0.2750 20.07093 14.1322 X1 X2 X4
35 3 0.3268 0.1922 22.36382 17.0033 X2 X4 X5
36 3 0.3255 0.1906 22.40684 17.0572 X4 X5 X6
37 3 0.3174 0.1809 22.67607 17.3943 X2 X4 X6
38 3 0.2122 0.0546 26.17173 21.7715 X1 X2 X5
39 3 0.1942 0.0330 26.76999 22.5206 X1 X2 X6
40 3 0.1786 0.0143 27.28850 23.1699 X1 X5 X6
41 3 0.1591 -0.0091 27.93651 23.9813 X2 X5 X6
42 4 0.6873 0.5980 10.38835 4.0080 X1 X3 X4 X5
43 4 0.6858 0.5960 10.43894 4.0713 X1 X3 X4 X6
44 4 0.6824 0.5916 10.55190 4.2128 X3 X4 X5 X6
45 4 0.6745 0.5815 10.81407 4.5411 X1 X2 X3 X4
46 4 0.6713 0.5774 10.91905 4.6725 X2 X3 X4 X5
47 4 0.6520 0.5525 11.56182 5.4774 X2 X3 X4 X6
48 4 0.5915 0.4748 13.57115 7.9934 X1 X2 X3 X5
49 4 0.5864 0.4682 13.74152 8.2067 X1 X3 X5 X6
50 4 0.5807 0.4608 13.93089 8.4439 X2 X3 X5 X6
51 4 0.5485 0.4195 14.99836 9.7805 X1 X2 X3 X6
52 4 0.4068 0.2373 19.70589 15.6751 X1 X4 X5 X6
53 4 0.4022 0.2314 19.85868 15.8665 X1 X2 X4 X6
54 4 0.3980 0.2260 19.99865 16.0417 X1 X2 X4 X5
55 4 0.3268 0.1345 22.36370 19.0032 X2 X4 X5 X6
56 4 0.2137 -0.0109 26.12131 23.7083 X1 X2 X5 X6
57 5 0.7112 0.6001 9.59363 5.0129 X1 X3 X4 X5 X6
58 5 0.6873 0.5671 10.38745 6.0069 X1 X2 X3 X4 X5
59 5 0.6872 0.5669 10.39075 6.0110 X1 X2 X3 X4 X6
60 5 0.6826 0.5606 10.54283 6.2014 X2 X3 X4 X5 X6
61 5 0.5953 0.4396 13.44606 9.8368 X1 X2 X3 X5 X6
62 5 0.4077 0.1799 19.67731 17.6394 X1 X2 X4 X5 X6
63 6 0.7115 0.5673 9.58336 7.0000 X1 X2 X3 X4 X5 X6
Tabla 3. Todas las regresiones posibles

Estadísticos de salida
Obs. Resist yhat se.yhat residuals res.estud Cooks.D hii.value Dffits
1 8.0 8.1511 0.606612 -0.1511 -0.2210 0.0065 0.4608 -0.2043
2 8.3 9.4417 0.539829 -1.1417 -1.7314 0.2109 0.3649 -1.3124
3 8.5 8.8862 0.536061 -0.3862 -0.5235 0.0234 0.3598 -0.3925
4 8.8 9.6823 0.607088 -0.8823 -1.3978 0.2216 0.8515 -1.2940
5 9.0 8.5532 0.615333 0.4468 0.6735 0.0612 0.4741 0.6395
6 9.3 9.5984 0.505421 -0.2984 -0.3903 0.0110 0.3199 -0.2677
7 9.3 9.7218 0.409376 -0.4218 -0.5144 0.0107 0.2098 -0.2651
8 9.5 10.6778 0.297936 -1.1778 -1.4628 0.0349 0.1111 -0.5173
9 9.8 8.8344 0.571807 0.9656 1.4730 0.1958 0.4094 1.2264
10 10.0 9.9814 0.356523 0.0186 0.0218 0.0000 0.1592 0.0095
11 10.3 10.5336 0.623150 -0.2336 -0.3510 0.0180 0.4862 -0.3415
12 10.5 10.5319 0.503674 -0.0319 -0.0413 0.0001 0.3177 -0.0282
13 10.8 10.7674 0.694819 0.0326 0.0556 0.0007 0.8245 0.0687
14 11.0 9.6650 0.429445 1.3350 1.8731 0.1245 0.2309 1.0264
15 11.3 10.8539 0.520472 0.4461 0.5975 0.0277 0.3392 0.4281
16 11.5 11.0306 0.686897 0.4694 0.8092 0.1391 0.7508 0.9724
17 11.8 12.4196 0.562274 -0.6196 -0.8838 0.0745 0.3959 -0.7155
18 12.3 10.9500 0.409431 1.3500 1.8673 0.1096 0.2099 0.9625
19 12.5 12.2199 0.628305 0.2801 0.4254 0.0271 0.4943 0.4206
Tabla 4. Estadísticos de salida
Estadísticos para puntos de predicción
h00.value y0hat se.y0hat Prueba de normalidad S-W
x01 0.4317666 9.174057 0.5872091 data: restud
x02 3.2867583 9.547264 1.6201383 W = 0.963 p-value = 0.6327
Tabla 5. Estadísticos para puntos de predicción Tabla 6. Prueba de normalidad

Gráfico 4 residuales vs predichos Gráfico 5 de probabilidad normal


PROGRAMA R
#LECTURA DE DATOS
Pto4 = t3<-round(cooks.distance(Modelo),4)
read.table(file.choose(),header=T, t4<-round(hatvalues(Modelo),4)
dec=".") t5<-round(dffits(Modelo),4)
Pto4 restud<-round(rstudent(Modelo),4)
Resistencia AlturaDado AnchoPoste AlturaRizo data.frame(Resistencia,yhat=round(t1$fit
LongitudAlambre AnchoUnionDado AnchoUnionPoste ,4),se.yhat=round(t1$se.fit,6),residuals
1 8.0 5.2 19.6 29.6 94.9 2.1 2.3 =t2,res.estud=restud,Cooks.D=t3,hii.valu
2 8.3 5.2 19.8 32.4 89.7 2.1 1.8 e=t4,Dffits=t5)
3 8.5 5.8 19.6 31.0 96.2 2.0 2.0 #CALCULO DE ESTADISTICOS PARA PUNTOS DE
4 8.8 6.4 19.4 32.4 95.6 2.2 2.1 PREDICCION
5 9.0 5.8 19.6 28.6 86.5 2.0 1.8 x01<-c(1,5.4,19.9,30.6,86.4,2.0,1.7)
6 9.3 5.2 18.8 30.6 84.5 2.1 2.1 x02<-c(1,6.9,15.9,33.8,97.6,2.1,1.4)
7 9.3 5.6 20.4 32.4 88.8 2.2 1.9 xpred<-rbind(x01,x02)
8 9.5 6.0 19.0 32.6 85.7 2.1 1.9 colnames(xpred)<-
colnames(model.matrix(Modelo))
9 9.8 5.2 20.8 32.2 93.6 2.3 2.1
A<-model.matrix(Modelo)
10 10.0 5.8 19.9 31.8 86.0 2.1 1.8
hvalues<-
11 10.3 6.4 18.0 32.6 87.1 2.0 1.6
diag(xpred%*%solve(t(A)%*%A)%*%t(xpred))
12 10.5 6.0 20.6 33.4 93.1 2.1 2.1 prednew<-
13 10.8 6.2 20.2 31.8 83.4 2.2 2.1 predict(Modelo,newdata=data.frame(xpred[
14 11.0 6.2 20.2 32.4 94.5 2.1 1.9 ,-1]),se.fit=T)
15 11.3 6.2 19.2 31.4 83.4 1.9 1.8 data.frame(h00.value=hvalues,y0hat=predn
16 11.5 5.6 17.0 33.2 85.2 2.1 2.1 ew$fit,se.y0hat=prednew$se.fit)
17 11.8 6.0 19.8 35.4 84.1 2.0 1.8
18 12.3 5.8 18.8 34.0 86.9 2.1 1.8 #GRÁFICO DE RESIDUALES VS. VALORES
19 12.5 5.6 18.6 34.2 83.0 1.9 2.0 PREDICHOS
attach(Pto4) restud=round(rstudent(Modelo),4)
Modelo=lm(Resistencia~AlturaDado+
AnchoPoste+ AlturaRizo+ LongitudAlambre+ #CALCULO DE RESIDUALES ESTUDENTIZADOS
AnchoUnionDado+AnchoUnionPoste) win.graph()
plot(fitted(Modelo),restud,xlab="Valores
#Tabla DE PARAMETROS ESTIMADOS Ajustados",ylab="Residuales
summary(Modelo) Estudentizados",
#TABLA ANOVA DEL MODELO DE RLM main="Residuales Estudentizados vs.
miAnova<-function(modeloreg){ Valores Ajustados",cex=2)
SSq<-unlist(anova(modeloreg)["Sum Sq"]) abline(h=0,lty=2,col=2)
k<-length(SSq)-1
SSR<-sum(SSq[1:k]) #PRUEBA DE NORMALIDAD DE SHAPIRO-WILK
SSE<-SSq[(k+1)] test=shapiro.test(restud)
MSR<-SSR/k test
df.error<-
unlist(anova(modeloreg)["Df"])[k+1] #GRÁFICO DE CUANTILES NORMALES
MSE<-SSE/df.error win.graph()
F0<-MSR/MSE qqnorm(restud,cex=1.5)
VP<-pf(F0,k,df.error,lower.tail=F) qqline(restud,lty=2,lwd=2,col=2
result<-
data.frame(SumSq=c(SSR,SSE),Df=c(k,df.er
ror),MeanSq=c(MSR,MSE),F0=c(round(F0,dig
its=3) ,' '),
P.value=c(format(VP,scientific =
TRUE,digits=3),' '),row.names
=c("Modelo","Error"))
cat("Tabla ANOVA Modelo de
Regresión","\n")
result
}
miAnova(Modelo)
#TABLA DE TODAS LAS REGRESIONES POSIBLES
library (leaps)
allregtable<-
function(modeloreg,respuesta){
t1<-
summary(regsubsets(model.matrix(modelore
g)[,-
1],respuesta,nbest=20),all.best=TRUE)
t2<-as.vector(apply(t1$which[,-
1],1,sum))
t3<-apply(t1$which[,-1],1,function(x)
as.character(paste(colnames(model.matrix
(modeloreg)[,-1])[x],collapse=" ")))
results<-
data.frame(NoOfVars=t2,R2=round(t1$rsq,4
),adjR2=round(t1$adjr2,4),SSE=round(t1$r
ss,5),Cp=round(t1$cp,4),Variables.in.mod
el=t3)#,MSE=round(t1$rss/(nrow(model.mat
rix(modeloreg)[,-1])-(NoOfVars+1)),5)
results
}
allregtable(Modelo, Resistencia)
#TABLA DIAGNOSTICO DE DATOS ATIPICOS, DE
BALANCEO E INFLUENCIALES
t1<-predict(Modelo,se.fit=T)
t2<-round(residuals(Modelo),4)

También podría gustarte