Está en la página 1de 2

Evaluación de las suposiciones de la regresión múltiple

Una vez analizados los métodos para evaluar de manera estadística la ecuación de regresión
múltiple, saber si al menos uno de los coeficientes no era igual a cero gracias a los resultados
de la prueba y descrito el proceso de evaluación de cada coeficiente de regresión.

Es hora de saber que la validez de las pruebas estadísticas global e individual parten de varias
suposiciones:

1. Existe una relación lineal. Es decir, existe una relación directa entre la variable
dependiente y el conjunto de variables independientes.
2. La variación en los residuos es la misma tanto para valores grandes como pequeños de
Yˆ . En otras palabras, (Y – Yˆ ) no está relacionada, ya sea que Yˆ sea grande o
pequeña.
3. Los residuos siguen la distribución de probabilidad normal. Recuerde que el residuo es
la diferencia entre el valor actual de Y y el valor estimado Yˆ . Por tanto, el término (Y –
Yˆ ) se calcula para cada observación en el conjunto de datos. Estos residuos deberán
seguir de manera aproximada una distribución de probabilidad normal. Además, la
media de los residuos deberá ser 0.
4. Las variables independientes no deberán estar correlacionadas. Es decir, conviene
seleccionar un conjunto de variables independientes que no estén correlacionadas
entre sí.
5. Los residuos son independientes. Esto significa que las observaciones sucesivas de la
variable dependiente no están correlacionadas. Esta suposición con frecuencia se viola
cuando se comprende el tiempo con las observaciones muestreadas.

A continuación se detalla rápidamente cada una de estas suposiciones así como el efecto si
estas suposiciones no se cumplen.

Relación lineal

La idea es que la relación entre el conjunto de variables independientes y la variable


dependiente es lineal.

 Uso de los diagramas de puntos: La evaluación de una ecuación de regresión múltiple


siempre deberá incluir un diagrama de dispersión en el que se trace la variable
dependiente contra cada variable independiente.
 Uso de gráficas de residuos: Recuerde que un residuo (Y – Yˆ ) se calcula mediante la
ecuación de regresión múltiple para cada observación en un conjunto de datos.

La variación en los residuos es igual para valores grandes y pequeños de Yˆ

Se cumple esta suposición cuando la variación respecto de los valores anticipados es


constante, sin importar si los valores anticipados sean grandes o pequeños. El requisito para
una variación constante respecto de la recta de regresión se denomina homoscedasticidad.

Homoscedasticidad: La variación respecto de la ecuación de regresión es igual para


todos los valores de las variables independientes.
Los residuos son trazados contra los valores ajustados de Y. Ésta es la misma gráfica con la cual
se evalúa la suposición de linealidad, esto con el objetivo de verificar la homoscedasticidad.

Distribución de los residuos:

Corroborar que las inferencias en las pruebas de hipótesis global e individual son válidas es
fundamental y para ello se evalúa la distribución de los residuos. Lo óptimo sería que los
residuos sigan una distribución de probabilidad normal. Queriendo evaluar esta suposición, los
residuos se organizan en una distribución de frecuencias. Para esto se realiza una gráfica que
ayude a evaluar la suposición de residuos con una distribución normal.

Dicha gráfica es la Gráfica de Probabilidad Normal, y es la encargada de confirmar la suposición


de residuos normalmente distribuidos si los puntos trazados están muy cerca de la recta
trazada desde la izquierda inferior hasta la derecha superior de la gráfica. Por ende, las
inferencias que se hicieron con base en las hipótesis global e individual se confirman con los
resultados de esta evaluación.