Está en la página 1de 18

Fases en la Construcción del Modelo de

Regresión Múltiple

1. Especificación del modelo o modelos.

2. Estimación del modelo

3. Diagnóstico del modelo.

15-1
1. Especificación del Modelo

Corresponde a la identificación del modelo


Consiste en establecer la estructura del modelo
1. ¿cual es objetivo a alcanzar? Decidir la variable
dependiente.
2. Determinar las posibles variables
independientes.
3. Recolectar la información.

15-2
2. Construcción del Modelo

1. Establecer la ecuacion del modelo.

2. Puede usar un proceso de selección de


variables independientes (x).

3. Tenga en cuenta la teoría o contexto del


modelo.

4. Puede usar algunos graficos de dispersion para


establecer posibles relaciones.
15-3
3. Diagnóstico del Modelo

1. Pruebas sobre las correlaciones.

2. Pruebas sobre los residuales.

3. Inspección gráfica.

4. Si el modelo no cumple, iniciar el proceso de


construcción del modelo nuevamente.

15-4
Ejemplo

Un vendedor de helados desea estudiar la relación


entre la demanda de los mismos en libras y las
variables precio por libra y la inversión en
publicidad mensual.
Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Demanda(lb) 350 460 350 430 350 380 430 470 450 490 340 300 440 450 300
Precio($/lb) 5.50 7.50 8.00 8.00 6.80 7.50 4.50 6.40 7.00 5.00 7.20 7.90 5.90 5.00 7.00
Publicidad($) 330 330 300 450 300 400 300 370 350 400 350 320 400 350 270

15-5
1. Especificación del Modelo

◼ Objetivo: Se desea establecer un modelo de


regresion lineal multiple que permita predecir la
demanda mensual de helado, en libras, en
funcion del precio por libra y de la inversion en
publicidad mensual.
◼ Se propone el modelo con:
Demanda = variable dependiente.
Precio= variable independiente.
Publicidad = variable independiente.
◼ Los datos son los Presentados anteriormente.
15-6
2. Construccion del Modelo

Se propone el modelo:
Demanda = β0 + β1(Precio) + β2(Publicidad) + ε

Chequeo gráfico

15-7
2. Construccion del Modelo

Matriz de correlaciones:
Demanda Precio Publicidad
Demanda 1.0000000 -0.44327318 0.55631986
Precio -0.4432732 1.00000000 0.03043758
Publicidad 0.5563199 0.03043758 1.00000000

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 306.5262 114.2539 2.683 0.0199 *
Precio -24.9751 10.8321 -2.306 0.0398 *
Publicidad 0.7413 0.2597 2.855 0.0145 *
Residual standard error: 47.46 on 12 degrees of freedom
Multiple R-squared: 0.5215, Adjusted R-squared: 0.4417
F-statistic: 6.539 on 2 and 12 DF, p-value: 0.01201

15-8
2. Construcción del Modelo

El modelo estimado es:


Demanda = 306.52 - 24.9751 (Precio) + 0.7413 (Publicidad)

Interprete adecuadamente los valores de los


parámetros estimados.
Interpreta el valor del coeficiente de determinación:
Multiple R-squared: 0.5215

15-9
3. Diagnóstico del Modelo

Prueba de linealidad:
H0: β0 = β1 = β2 = 0
H1: β0 = 0 o β1 = 0 o β2 =0
F-statistic: 6.539 on 2 and 12 DF, p-value: 0.01201

Para un nivel de significancia de 5% se rechaza la


hipótesis nula.
Por lo tanto al menos uno de los tres parámetros es
estadísticamente diferente e cero.

15-10
3. Diagnóstico del Modelo

Inspeccion gráfica de los supuestos:

15-11
3. Diagnóstico del Modelo

Prueba de normalidad de los errores:


Ho: Los errores se distribuyen normal.
H1: Los errores no se distribuyen normal.

One-sample Kolmogorov-Smirnov test

data: df$rstudent.modelo
D = 0.11254, p-value = 0.98 alternative hypothesis: two-sided

No se puede rechazar Ho, por lo tanto se puede


asumir que los errores se distribuyen normales.

15-12
3. Diagnóstico del Modelo

Prueba de Homogeneidad de varianzas de los


errores:
Ho: Los errores son homogeneos.
H1: Los errores no son homogeneos

Breusch-Pagan test
data: modelo
BP = 1.1055, df = 2, p-value = 0.5754

No se puede rechazar Ho, por lo tanto se puede


asumir que los errores tiene varianzas homogenea.
15-13
3. Diagnóstico del Modelo

Prueba de Independencia de los errores:


Ho: Los errores son independientes.
H1: Los errores estan correlacionados.
Durbin-Watson test

data: modelo
DW = 1.6831, p-value = 0.6037
alternative hypothesis: true autocorrelation is not 0

No se puede rechazar Ho, por lo tanto se puede


asumir que los errores son independientes.

15-14
3. Diagnóstico del Modelo

Multicolinealidad
En los modelos multiples se debe analizar la
multicolinealidad de las variables, es decir el efecto
de tener variables independeientes altamente
correlacionadas. Los problemas que causa la
multicolinealidad es:
- No proporciona nueva información.
- Coeficientes inestables (error estándar grande y
valores t bajos).
- Los signos de los coeficientes podrían no ser
coherentes con nuestras expectativas iniciales y
con la matriz de correlación. 15-15
3. Diagnóstico del Modelo

Multicolinealidad
Indices de inflación de varianza.
1
VIFj =
1 − R 2j

R2j es el coeficiente de determinación de la regresión de la jma variable


independiente contra las restantes k – 1 variables independientes

Si VIFj ≥ 5, entonces xj está altamente


correlacionado con las otras variables explicativas

15-16
3. Diagnóstico del Modelo

Multicolinealidad
Indices de inflación de varianza.
vif(lm(Demanda ~ Precio + Publicidad, data = df))
Precio Publicidad
1.000927 1.000927

Se puede concluir que el modelo no presenta


multicolinealidad.

15-17
4. Uso del Modelo

Para un mes donde el precio del helado se fije en


$8.50 por libra y se tenga una inversion en
publicidad de $500 encuentre la demanda
pronosticadad, asi como sus intervalos de
confianza.

15-18

También podría gustarte