Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Parcial 1 Estadística II
El parcial puede ser desarrollado en parejas. Es necesario enviar el documento
antes del día 05/09/2021 en el siguiente enlace
https://forms.gle/jQYE4D3xSw7AxgnXA.
Parte I (4.0)
Usando la base de datos adjunta la cual corresponde a 3 variables medidas en 100
automóviles:
- mpg (millas por galón)
- peso (peso automóvil)
- caballos (caballos de fuerza)
Formule una ecuación de modelo de regresión lineal simple que relacione, mpg
(variable dependiente) con la variable más relacionada, siguiendo los siguientes
pasos.
1. Determine la variable más correlacionada con mpg. Realice la prueba de
hipótesis en donde pruebe la significancia de la correlación entre mpg y la
variable seleccionada.
Correlación
cor(database)
La relación entre las millas recorridas por galón de gasolina y el peso del
automóvil es mayor que la relación entre las millas recorridas por galón y el
numero de caballos de fuerza del automóvil, como se evidencia en el siguiente
gráfico.
corrplot.mixed(correlacion)
La evidencia grafica muestra que la correlacion mayor existe entre mpg y el
peso del automóvil, esta es seguida por la correlacion entre mpg y el numero de
caballos de fuerza seguida por la relación entre el peso del automóvil y el
numero de caballos de fuerza.
cor.test(y=database$mpg, x=database$peso)
Pearson`s product-moment correlation
y Mpg
x Peso
correlation -0,7922944
t -12.855
p-value 0,001
N.Confianza 95%
Mpg= ^
^ β0+ ^
β 1 Peso
^
Mpg=146,058016−0,048154 Peso
Para determinar si los residuos siguen una distribución normal se realizaron las
siguientes pruebas de significancia
shapiro.test(modelo$residuals)
ad.test(modelo$residuals)
cvm.test(modelo$residuals)
lillie.test(modelo$residuals)
pearson.test(modelo$residuals)
jarque.bera.test(modelo$residuals)
Test de Normalidad
Test Estimador P valor
Shapiro-Wilk 0,97974 0,1268
Anderson-Darling 0,63208 0,09679
Cramer-Von Mises 0,094933 0,1301
Kolmogorov-Smirnov 0,086292 0,06368
Pearson 14,4 0,0155
Jaque Bera 3,5496 0,1695
Linealidad
resettest(modelo)
Test de Modalidad
Test Estimado Grados de Libertad I Grados de Libertad II Valor P
Ramsay Test 1,5353 2 96 0,2206
Independencia
dwtest(modelo)
plot(modelo$residuals, ylab = "Reciduos", xlab = "n")
bgtest(modelo)
Pruebas de Independencia
Test Parametro P Valor
Durbin-Watson 2,0954 0,6902
Breusch-Godfrey 0,27169 0,6022
Según la prueba de Durbin Watson y Breusch Godfrey el modelo cumple con los
supuesto de independencia entre los errores y la variable exógena.
Homocedasticidad
bptest(modelo)
bptest(modelo, varformula =~ database$peso+I(database$peso^2))
ncvTest(modelo)
Test de Homocedasticidad
Test Estimador Grados de Libertad Valor P
Breusch-Pagan 0,63444 1 0,4257
White 1,1839 2 0,5532
Chisquare 0,7732406 1 0,37922
Mpg i= ^
^ β 0+ ^
β1 Pes oi
Parte II (1.0)
Para el modelo y i=β 1 xi + ϵ i, con i=1 , … , n
Función a optimizar
e i= y i−β 1 x1
∑ e 2i =∑ ( y i −β1 x i )2
Minimización de cuadrados
min ∑ e 2i =∑ ( y i −β1 x i) 2
∂ ∑ e2i
=2 ∑ ( y i−β 1 xi ) (−x i )=0
∂ β1
Resultado
∑ ( y i− β1 xi ) (−x i ) =0
operación
∑ ( x i y i−β 1 x 2i )=0
Despeje
∑ x i y i =β1 ∑ x 2i
Resultado
∑ xi y i
β 1=
∑ x 2i