¿Por qué utilizamos regresión múltiple en lugar de regresión simple al estimar una variable dependiente y en qué consiste el análisis de varianza para regresión?
Sucede que utilizamos regresión múltiple en lugar de regresión simple al
estimar una variable dependiente porque en el problema que se nos presenta para resolver de repente nos esta pidiendo variables independientes como el ejemplo #2 de los recursos de la semana 8 en donde el profesor desarrollo una formula con el propósito de predecir las calificaciones de los exámenes. En este problema se utilizaron 4 variables que son: las horas de estudio, el CI, Libros utilizados y edad de cada uno para poder obtener la calificación estimada del estudiante que seria la variable dependiente en este caso.
El análisis de varianza para regresión consiste en poder estimar las diferencias
que se puedan presentar entre 2 o mas medias, por ejemplo si un producto es mejor, igual o peor que otro u otros.
¿Qué es multicolinealidad y en qué consiste el análisis de varianza para
regresión?
“La multicolinealidad en regresión es una condición que ocurre cuando algunas
variables predictoras incluidas en el modelo están correlacionadas con otras variables predictoras” («Soporte de minitab 18», 2019).
Lo que yo comprendo según este concepto es que la multicolinealidad para que
pueda darse necesita que algunas variables predictoras se relacionen con otras, pudiera ser el caso si nos tacara valorar del 1 al 5 (siendo 1 “no estoy de acuerdo” y 5 “Totalmente de acuerdo”), a manera de ejemplo, estos enunciados: “si 1 persona promedio duerme 10 horas al día”, o “si duerme solo 6 horas al día”. Probablemente obtengamos resultados cercanos a 1 en la primera afirmación (pudiéramos asignarle la letra X) y resultados alrededor a 5 en el caso del segundo enunciado (pudiéramos asignarle la letra Y), que de ser así tendríamos una dependencia lineal.
Saludos.
Referencias:
Soporte de minitab 18. (2019). Recuperado 2 de diciembre de 2020, de Support