Está en la página 1de 4

UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN

FACULTAD DE CIENCIAS
ESTADÍSTICA II- SEMESTRE 2020-I
TALLER #2
Análisis de varianza (prueba de significancia de la regresión). Coeficiente de determinación R2. Estimación e intervalos de confianza para la
respuesta media. Predicción de nuevas observaciones.

1. De las siguientes afirmaciones determine cuáles son verdaderas y cuáles son falsas con su
respectiva justificación:

a. El coeficiente R2 da la proporción de la variabilidad de la variable respuesta que es explicada


por la recta de regresión.
b. Para obtener un R2 mayor a 0.5 es necesario que la variabilidad de las observaciones aportada
por el error sea menor a la aportada por la regresión.
c. La suma de cuadrados totales (SST) mide la variabilidad en las observaciones que es aportada
por la regresión.
d. Para verificar la significancia de la recta de regresión se puede hacer una prueba F o una
prueba de significancia para cada parámetro, si por lo menos uno de los parámetros 𝛽0 𝑜 𝛽1 es
significativo, entonces la recta de regresión también lo es.
e. Para probar la significancia del parámetro β1, se puede usar tanto una prueba F como una
prueba t; llegando cada una a conclusiones diferentes, con el mismo nivel de significancia.

2. La escuela de medicina Wright State University desea establecer si las notas que obtendrán los
estudiantes de medicina en el examen de la junta médica (Examen JM), que deben presentar para
graduarse, se pueden predecir con el promedio de sus notas del primer año (Promedio).

Promedio Examen JM Promedio Examen JM Promedio Examen JM Promedio Examen JM


95,73 257 86,86 187 83,93 202 80,77 194
94,03 256 86,85 204 83,92 176 80,72 196
91,51 242 86,84 219 83,73 204 80,69 171
91,49 223 86,3 228 83,47 208 80,58 201
91,13 241 86,13 210 83,27 211 80,57 177
90,88 234 86,1 216 83,13 196 80,1 192
90,83 226 85,92 212 83,05 203 79,38 187
90,6 236 85,91 208 83,02 188 78,75 161
90,3 250 85,81 210 82,82 169 78,32 172
90,29 226 85,35 212 82,78 205 78,17 163
89,93 233 85,3 225 82,57 183 77,39 166
89,83 241 85,27 203 82,56 181 76,3 170
89,65 234 85,05 214 82,45 173 75,85 159
89,47 231 84,58 176 82,24 185 75,6 154
88,87 228 84,51 196 82,01 196 75,16 169
88,8 229 84,51 207 81,86 179 74,85 159
88,66 235 84,42 207 81,7 207 74,66 167
88,55 216 84,34 211 81,65 202 74,58 154
88,43 207 84,34 202 81,51 230 74,16 148
88,34 224 84,13 229 81,07 200 70,34 159
87,95 237 84,13 202 80,95 200
87,79 213 84,09 184 80,92 160
87,01 215 83,98 206 80,84 205
Tabla 1. Promedio de los estudiantes de medicina con su resultado en la junta médica.
a. Analice el gráfico de dispersión que relaciona el promedio de las notas de primer año de
estudiantes de medicina, con su resultado en el examen de la junta médica(Figura 1).

260
240
220
ExamenJM

200
180
160

70 75 80 85 90 95

Promedio

Figura 1. Gráfico de dispersión para el promedio de notas y el resultado del examen de la junta médica

b. Escriba la ecuación del modelo de regresión junto con sus supuestos.


c. Ajuste el respectivo modelo de regresión lineal simple utilizando la Tabla 2 de parámetros
estimados.

Call:
lm(formula = ExamenJM ~ Promedio)

Residuals:
Min 1Q Median 3Q Max
-28.931 -8.150 2.397 7.193 39.441

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -191.0296 22.9342 -8.329 1.06e-12 ***
Promedio 4.6815 0.2727 17.169 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 12.49 on 87 degrees of freedom


Multiple R-squared: 0.7721, Adjusted R-squared: 0.7695
F-statistic: 294.8 on 1 and 87 DF, p-value: < 2.2e-16
Tabla 2. Parámetros estimados.

d. Pruebe la significancia de β0 y β1 con un nivel de significancia de 0.05, con su respectiva


interpretación
e. Calcule un intervalo de confianza del 95% para β1 e interprete.
f. Complete la tabla ANOVA (Tabla 3).
Fuente de Suma de Grados de Cuadrado Valor F Valor P
variación cuadrados libertad medio
Regresión 45998 2.2 ∗ 10−16

Residuales

Total 59574 88

Tabla 3. Análisis de varianza (ANOVA)

g. Determine la significancia de la regresión con una prueba F.


h. Calcule el coeficiente de determinación R2 e interprételo.
i. Encuentre un intervalo de confianza del 95% para el resultado del examen de la junta médica
para dos estudiantes, uno cuyo promedio en el primer año fue de X 1 = 82,7 y otro con
X2 = 63,4. Utilice la Tabla 4.
j. Encuentre intervalos de predicción del 95% para los resultados del examen con los mismos
promedios del punto anterior.

$fit $se.fit

1 2 1 2
196.1298 105.7770 1.368548 5.762619

Tabla 4. Valores predichos para X1 y X2.

k. Analice la siguiente gráfica que hace una comparación entre los intervalos de la respuesta
media y los intervalos de predicción.

Figura 2. Intervalos de confianza y predicción al 95%


PROGRAMA R

PUNTO 2
#LECTURA DE DATOS DESDE ARCHIVO
Regresion<-read.table(file.choose(),header=T,sep=",")
#Gráfico de dispersión
Promedio<-Regresion$AVG
ExamenJM<-Regresion$BOARD
win.graph()
plot(Promedio,ExamenJM, col="Blue")
## Cálculo de los coeficientes
Modelo<-lm(ExamenJM~Promedio)
summary(Modelo)
## Cálculo de la ANOVA
anova(Modelo)
#Minimo y maximo
min(Promedio)
max(Promedio)
#Predicción
predict(Modelo, newdata = data.frame(Promedio=c(82.7,63.4)), se.fit = T)
#Gráfico de dispersión con IC e IP al 95%
win.graph()
require(HH)

ci.plot(Modelo, xlab="Promedio",ylab="ExamenJM",cex=1.5)

También podría gustarte