Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso:
ESTADÍSTICA APLICADA A GERENCIA
Semana 07
Docente:
Lic. Elvis Raúl Huaihua Flores
Análisis de regresión lineal múltiple
Definición:
▪ “Es el estudio de la relación lineal existente entre una variable Y , llamada “variable
dependiente” y un conjunto de variables explicativas o independientes X1, X2, X3, …
, XP−1, " (Toma & Rubio, 2019, p 231).
▪ “Es una técnica estadística utilizada para analizar la relación entre una variable
dependiente (endógena o criterio) métrica y varias variables independientes
(exógenas o predictoras) también métricas. El objetivo esencial del análisis de la
regresión múltiple es utilizar las variables independientes, cuyos valores son
conocidos, para predecir la única variable criterio (dependiente) seleccionada por el
investigador” (Pérez Lopez, 2004, p. 5) .
3
Análisis de regresión lineal múltiple
Presentación matricial del modelo estadístico
• Y es un vector aleatorio y X es una
matriz de valores fijos
• β mide la fortaleza con que cada
variable predictiva influencia la variable
criterio. Mientras el valor de β sea mas
grande, más importante es el impacto
del predictor
4
Análisis de regresión lineal múltiple
Criterios para realizar el análisis
• Naturaleza lineal : Los predictores y las variables criterio siguen una línea
recta.
• La variable criterio que será predicha debe ser medida con una escala de
intervalo o de razón. Del mismo modo para las variables predictoras, sin
embargo también puede considerarse variables dicotómicas.
• Multicolinealidad: Deberemos complementariamente verificar que las
variables predictoras correlacionen entre sí, no obstante no debe ser
excesivamente “fuerte”. No deberíamos esperar que las variables
independientes correlacionen de manera muy importante.
• Se debe tener 15 a 20 casos por cada variable ( Stevens, 1996), sin embargo
no siempre existe el consenso.
5
Análisis de regresión lineal múltiple
Métodos
Ejemplo:
Se realiza un estudio sobre la relación entre los beneficios anuales, los gastos en
publicidad y las horas extras al año de los empleados. Se obtienen datos de 7
empresas del sector y área geográfica de interés. Se le pide determinar el modelo de
regresión múltiple.
7
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Pasos a seguir:
10
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Pasos a seguir:
11
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
la población. Niveles inferiores a 0.05 en Sig indican que debemos rechazar la Ho.
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
13
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Intervalos de confianza
Colinealidad
• Los estadísticos de colinealidad de Tolerancia y VIF (FIV: factor de inflación de la varianza) nos ayuda diagnosticar
la presencia de colinealidad. Altos niveles de FIV indican mayor colinealidad.
• Valores de tolerancia muy pequeños indican que esa variable puede ser explicada por una combinación lineal del
resto de variables, lo que significa que existe colinealidad.
• El modelo nos muestra una Tolerancia de 0.478, valor no muy cercano a 0, significando que no existe colinealidad,
además se obtien un un valor VIF= 2.090, concluyendo también baja colinealidad
19
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Independencia:
El valor de Durbin-Watson proporciona información sobre el grado de independencia (no existe inter-
correlación de residuos) , y se asume esta cuando oscila entre 1,5 y 2,5.
20
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Homocedasticidad y linealidad:
21
Homocedasticidad Heterocedasticidad
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Homocedasticidad y linealidad:
• Lo deseado o lo esperado es que la nube de
puntos obtenida se distribuya en una banda
horizontal con respecto a los ejes del plano
cartesiano , significando la ausencia de cualquier
tendencia.
• Para nuestro caso, la figura obtenida sigue una
tendencia esperada con valores que van
aproximadamente entre -2 y +1.
• En el diagrama de dispersión se observa que
aunque los residuos y los pronósticos parecen
ser independientes (la nube de puntos no sigue
ninguna pauta de asociación clara, ni lineal ni de
ningún otro tipo), no está claro que las varianzas
sean homogéneas.
22
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Normalidad
• Con figuras podemos ver histograma y de probabilidad
normal.
• HISTOGRAMA: nos presenta una figura con los residuos
tipificados con una curva normal superpuesta.
• La curva se construye tomando una media de cero y un
desviación típica de uno. Es decir, la misma media y la
misma desviación típica que los residuos típicos
tipificados.
• Para verificar el supuesto de la normalidad, se deberá
obtener el histograma de residuos tipificados y la figura
de probabilidad normal P-P de residuos tipificados.
• Se sigue un patrón de normalidad esperado si la figura
de probabilidad muestra coincidencia entre los valores
de probabilidad acumulada esperada con los de
probabilidad acumulada observada, conformándose en 23
consecuencia una sola línea de tendencia diagonal
Análisis de regresión lineal múltiple
Cálculo de la regresión múltiple usando SPSS
Normalidad
• Observamos en el eje de abscisas la
probabilidad acumulada que corresponde a
cada residuo tipificado. El de las ordenadas
representa la probabilidad cumulada teórica
que corresponde a cada desviación típica en
una curva normal (0,1).
• Apreciamos que los puntos no se encuentran
alineados sobre la diagonal de la figura,
indicando el posible incumplimiento del
supuesto de normalidad.
24