Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Taller - Final - Modelos - de - Regresión Alexander Reyes
Taller - Final - Modelos - de - Regresión Alexander Reyes
Para esto se creó entonces un modelo de regresión lineal sin variables pre-
dictorias de la manera:
1
RLM.completo < −lm(f ormula = price ∼ ., train data) (2)
Posteriormente, se realizó la regresión Stepwise, como se muestra a contin-
uación:
2
de validación con las variables predictivas del modelo de entrenamiento. Es de-
cir, para este segundo conjunto de datos se realizó el mismo pre-procesamiento
(elimnación de ID, fecha y NaN’s). A partir de las predicciones se calcucló el
RMSE como métrica de evaluación. Para este modelo se obtuvo un valor de $
211.618,7 en un conjunto de datos distribuidos como se muestra en la figura 2.
1 Supuestos
1.1 Independencia
Este supuesto es comprobado con el test Durbin-Watson para la variable de-
pendiente (precio) en términos de sus variables predictivas. A partir de esto se
obtuvo un DW = 1.9952 con p-value = 0.377, por lo que los reisuos no están
correlacionados.
1.2 Multicolinealidad
Para identificar si existen fuertes correlaciones entre las variables explicativas
se halló el factor de inflación de la varianza (VIF) del modelo.
Los resultados del VIF para cada uno de los predictores es mostrado en la
figura 3. Como se observa, los valores obtenidos son menores a 10 por lo que
no hay problemas de multicolinealidad. Ası́ mismo, al evaluar el estadı́stico de
3
tolerancia, definido como 1/VIF es mayor a 0.1 en todos los casos (figura 4),
por lo que se concluye que no existe multicolinealidad.
Figure 3: VIF para las variables predictivas del modelo obtenido con Stepwise
1.3 Residuos
Por último, a partir de la gráfica de residuos (figura 5) se verifica que los datos
se ordenan alrededor del cero sin un patrón determinado, como lo harı́a una
distribución normal, no obstante, podrı́a considerarse la evaluacion de los datos
a través de un Q-Q Plot para determinar si se distribuyen normal, y en caso de
que no, oprtar por un modelo no paramétrico para la predicción de los precios.
References
[1] STHDA. Stepwise regression essentials in r - articles.
http://www.sthda.com/english/articles/37-model-selection-essentials-in-
r/154-stepwise-regression-essentials-in-r/.
4
Figure 5: Estadı́stico de Tolerancia