Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LINEAL MÚLTIPLE
𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏𝒙𝟏𝒊 + 𝜷𝟐𝒙𝟐𝒊 + . . . 𝜷𝒌𝒙𝒌𝒊 + 𝒖𝒊
𝒚𝒊 = 𝜷𝟎 + 𝜷𝒋𝒙𝒋𝒊 + 𝒖𝒊
𝒋
𝒊 = 𝟏 , 𝟐, 𝟑, … , 𝒏
REGRESIÓN LINEAL MÚLTIPLE
La regresión lineal múltiple es una
extensión de regresión lineal simple para
tomar en cuenta más de una variable
independiente.
Busca predecir una variable dependiente
a través de 2 o más variables
independientes.
Con el uso de más de una variable
independiente, se debe hacer un mejor
trabajo de explicar la variación en y, en
consecuencia hacer predicciones más
precisas.
Modelo de la regresión
múltiple
𝑦ො = 𝛽መ0 + 𝛽መ1𝑥1 + 𝛽መ2𝑥2 + ⋯ + 𝛽መ𝑘𝑥𝑘
de modo que
5
ESTIMADORES MCO
𝛽መ0 = 𝑌ത − 𝛽መ1 𝑋ത1 − 𝛽መ2 𝑋ത2
2
σ 𝑦𝑖 𝑥1𝑖 σ 𝑥2𝑖 2 2
− σ 𝑦𝑖 𝑥2𝑖 σ 𝑥1𝑖 𝑥2𝑖
𝛽መ1 =
2
σ 𝑥1𝑖 2
σ 𝑥2𝑖 2
σ 𝑥1𝑖 2 2
− 𝑥2𝑖
2
σ 𝑦𝑖 𝑥2𝑖 σ 𝑥1𝑖 2 2
− σ 𝑦𝑖 𝑥1𝑖 σ 𝑥1𝑖 𝑥2𝑖
𝛽መ2 =
2
σ 𝑥1𝑖 2
σ 𝑥2𝑖 2
σ 𝑥1𝑖 2 2
− 𝑥2𝑖
EJEMPLO
1 169 6 1 2 1
2 218,5 10 1 2 2
3 216,5 10 1 3 2
4 225 11 1 3 2
5 229,9 13 1 3 1,7
6 235 13 2 3 2,5
7 239,9 13 1 3 2
8 247,9 17 2 3 2,5
9 260 19 2 3 2
10 269,9 18 1 3 2
11 234,9 13 1 4 2
12 255 18 1 4 2
13 269,9 17 2 4 3
14 294,5 20 2 4 3
15 309,9 21 2 4 3
REGRESIÓN LINEAL MÚLTIPLE
En la regresión lineal múltiple aparecen
varias preguntas, muy similares al caso de
regresión lineal simple:
¿Qué tan bien se ajusta el modelo?
¿Qué tan fuerte es la relación entre y y
las variables predictoras?
¿Se han violado suposiciones importantes?
¿Qué tan buenas son las estimaciones y
predicciones?
UNA RECOMENDACIÓN
Mantenga el número de variables
predictoras lo suficientemente
pequeño para que sea efectivo pero
manejable.
Es necesario estar conscientes que
el número de observaciones del
conjunto de datos debe exceder el
número de términos del modelo;
cuanto mayor el exceso, mejor.
Varianza de los estimadores
MCO
La “distribución muestral” de los estimadores está
centrada en torno a los “verdaderos” parámetros
(insesgamiento).
11
Varianza de MCO
2 2
1 𝑋ത12 σ 𝑥2𝑖 + 𝑋ത22 σ 𝑥1𝑖 − 2𝑋ത1 𝑋ത2 σ 𝑥1𝑖 𝑥2𝑖 2
𝑉𝑎𝑟 𝛽መ0 = + 2 σ 2 𝜎
𝑛 σ 𝑥1𝑖 𝑥2𝑖 − 𝑥1𝑖 𝑥2𝑖 2
2
σ 𝑥2𝑖
𝑉𝑎𝑟 𝛽መ1 = 2 2 2
𝜎2
σ 𝑥1𝑖 σ 𝑥2𝑖 − 𝑥1𝑖 𝑥2𝑖
𝜎2
𝑉𝑎𝑟 𝛽መ1 = 2 (1−𝑟 2 )
σ 𝑥1𝑖 12
2
σ 𝑥1𝑖
𝑉𝑎𝑟 𝛽መ2 = 2 2 2
𝜎2
σ 𝑥1𝑖 σ 𝑥2𝑖 − 𝑥1𝑖 𝑥2𝑖
𝜎2
𝑉𝑎𝑟 𝛽መ2 = 2 (1−𝑟 2 )
σ 𝑥2𝑖 12 12
2
𝑟12 es el coeficiente de correlación entre 𝑥1 y 𝑥2
Varianza de MCO (cont.)
Dados los supuestos Gauss−Markov:
𝜎2
𝑉𝑎𝑟 𝛽መ𝑗 =
𝑆𝐶𝑇𝑗 1 − 𝑅𝑗2
donde
2
𝑆𝐶𝑇𝑗 = 𝑥𝑖𝑗 − 𝑥𝑗lj
Error estándar
𝑆𝐶𝐸
𝜎ො =
𝑛−𝑘−1
𝑘 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎𝑠
Con k=2
1 𝑦𝑖 𝑥1𝑖 − 𝛽
𝑢ො 𝑖2 = 𝑦𝑖2 − 𝛽 2 𝑦𝑖 𝑥2𝑖
PRUEBA DE UTILIDAD DEL MODELO
DE REGRESIÓN MÚLTIPLE
17
Coeficiente de correlación
múltiple
19
R cuadrado ajustado
𝛽𝑗 − 𝛽𝑗∗
𝑡0 =
𝑆𝐸(𝛽𝑗 )
Se rechaza H0 si
Depuración del modelo
El procedimiento descrito para probar la significancia de
un coeficiente individual en el modelo no es
completamente decisiva, debido a que en ocasiones los
estimadores no son independientes entre sí, como se
puede apreciar en los elementos fuera dela diagonal de
la matriz de correlación. Esto hace que un coeficiente
aparente ser significativo porque su estimador está
correlacionado con otro estimador de otro coeficiente
que sí tiene una contribución significativa.
A pesar de lo anterior, la prueba t sobre la significancia
de los términos del modelo, combinada con los
coeficientes de determinación y el error estándar de la
regresión, puede ser de utilidad para tener un modelo
depurado en el cual la mayoría de los términos
realmente ayuden a explicar la variable de respuesta.
PRUEBA DE UTILIDAD DEL
MODELO DE REGRESIÓN
MÚLTIPLE
El análisis de varianza de la Prueba F
Se realiza para resolver la interrogante: ¿Al
menos una de las variables predictoras está
aportando información significativa para la
predicción de la variable y?
28
MULTICOLINEALIDAD
EJEMPLO
EJEMPLO
Ventas Precio Precio Ingreso
Rosas Rosas Claveles Familiar Periodo
11484 2,26 3,49 158,11 1
9348 2,54 2,85 173,36 2
8429 3,07 4,06 165,26 3
10079 2,91 3,64 172,92 4
9240 2,73 3,21 178,46 5
8862 2,77 3,66 198,62 6
6216 3,59 3,76 186,28 7
8253 3,23 3,49 188,98 8
8038 2,6 3,13 180,49 9
7476 2,89 3,2 183,33 10
5911 3,77 3,65 181,87 11
7950 3,64 3,6 185 12
6134 2,82 2,94 184 13
5868 2,96 3,12 188,2 14
3160 4,24 3,58 175,67 15
5872 3,69 3,53 188 16
EJEMPLO
Gráfica de dispersión de Ventas Rosas vs. Precio Rosas; Precio Clave;
Precio Rosas Precio Claveles
12000
10000
8000
6000
Ventas Rosas
4000
2,0 2,5 3,0 3,5 4,0 3,00 3,25 3,50 3,75 4,00
10000
8000
6000
4000
R-cuad.
S R-cuad. (ajustado)
969,874 83,47% 77,46%
Fuente GL SC Sec. Contribución SC Ajust. MC Ajust. Valor F Valor p
Regresión 4 52249136 83,47% 52249136 13062284 13,89 0,000
Precio 1 38490403 61,49% 5509737 5509737 5,86 0,034
Rosas
Precio 1 9749329 15,57% 1099921 1099921 1,17 0,303
Claveles
Ingreso 1 455799 0,73% 39601 39601 0,04 0,841
Familiar
Periodo 1 3553605 5,68% 3553605 3553605 3,78 0,078
Error 11 10347220 16,53% 10347220 940656
Total 15 62596356 100,00%
Coeficientes
FIV
El factor de inflación de la
varianza (FIV) indica cuánto se
infla la varianza de un
coeficiente debido a las
correlaciones entre los
predictores incluidos en el
modelo.
FIV
FIV de regresión se
estimó de manera
deficiente debido a
una fuerte
multicolinealidad.
FIV Estado del predictor
FIV = 1 No correlacionados
FIV
Ecuación
Vent EE de
as Ajust ajust IC de Resid Resid D de
Obs Rosas e e 95% Resid est. elim. AA Cook DFITS
12 7950 6005 352 (5230 1945 2,15 2,70 0,131 0,14 1,051 R
; 918 66
6780)
Residuo grande R
Valor de
Variable configuración
Precio Rosas 2,26
Precio Claveles 3,49
Ingreso Familiar 158,11
Periodo 1
Predicción
Configuración
EE de IC de IP de
Ajuste ajuste 95% 95%
Predicción
Valor de
Variable configuración
Precio Rosas 2,26
Precio Claveles 4,06
Ingreso Familiar 198,62
Periodo 1
Predicción de respuesta
múltiple
EE de IC de IP de
Respuesta Ajuste ajuste 95% 95%
Ventas 11912 1233 (9197; (8458;
Rosas 14626) 15365)
Predicción de respuesta
múltiple
EE de IC de IP de
Respuesta Ajuste ajuste 95% 95%
Ventas 11912 1233 (9197; (8458;
Rosas 14626) 15365)
Predicción de respuesta
multiple
Predicción de respuesta
múltiple
Correlación
Ventas Precio Precio Ingreso
Rosas Rosas Claveles Familiar
Precio -0,784
Rosas
0,000
Precio -0,023 0,472
Claveles
0,934 0,065
Ingreso -0,413 0,289 -0,104
Familiar
0,112 0,277 0,700
Periodo -0,852 0,653 -0,127 0,550
0,000 0,006 0,638 0,027