Está en la página 1de 5

Modelos polinomiales de Regresion.

Ejercicio 7.17
Véase el modelo cuadrático de regresión del problema 7.16. Determinar los factores de
inflación de varianza y comentar la multicolinealidad en ese modelo.

Solución:

Ejercicio 7.16: Un artículo en la revista Journal of Pharmaceuthical Sciences (80,971-


977,1991) presenta datos sobre la solubilidad observada, en fracción molar, de un soluto
a temperatura constante, junto con X1=Solubilidad parcial de la dispersión,
X2=Solubilidad parcial dipolar y X3=Solubilidad parcial de Hansen por puentes de
hidrógeno. La respuesta Y es el logaritmo negativo de la solubilidad en fracción mol.

Nro de Obs Y X1 X2 X3
1 0.222 7.3 0 0
2 0.395 8.7 0 0.3
3 0.422 8.8 0.7 1
4 0.437 8.1 4 0.2
5 0.428 9 0.5 1
6 0.467 8.7 1.5 2.8
7 0.444 9.3 2.1 1
8 0.378 7.6 5.1 3.4
9 0.494 10 0 0.3
10 0.456 8.4 3.7 4.1
11 0.452 9.3 3.6 2
12 0.112 7.7 2.8 7.1
13 0.432 9.8 4.2 2
14 0.101 7.3 2.5 6.8
15 0.232 8.5 2 6.6
16 0.306 9.5 2.5 5
17 0.0923 7.4 2.8 7.8
18 0.116 7.8 2.8 7.7
19 0.0764 7.7 3 8
20 0.439 10.3 1.7 4.2
21 0.0944 7.8 3.3 8.5
22 0.117 7.1 3.9 6.6
23 0.0726 7.7 4.3 9.5
24 0.0412 7.4 6 10.9
25 0.251 7.3 2 5.2
26 0.00002 7.6 7.8 20.7
 Utilizamos el software Minitab para la obtención del modelo cuadrático de
regresión, el ANOVA, las estimaciones de los coeficientes del modelos y el VIF
(Factor de inflación de la varianza).

Análisis de Varianza (ANOVA)

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 9 0.655671 0.072852 19.63 0.000
X1 1 0.007595 0.007595 2.05 0.172
X2 1 0.010745 0.010745 2.89 0.108
X3 1 0.012323 0.012323 3.32 0.087
X1*X1 1 0.004913 0.004913 1.32 0.267
X2*X2 1 0.001419 0.001419 0.38 0.545
X3*X3 1 0.001213 0.001213 0.33 0.575
X1*X2 1 0.010120 0.010120 2.73 0.118
X1*X3 1 0.005352 0.005352 1.44 0.247
X2*X3 1 0.000497 0.000497 0.13 0.719
Error 16 0.059386 0.003712
Total 25 0.715057

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
0.0609233 91.69% 87.02% 0.00%

Coeficientes

EE del
Término Coef coef. Valor T Valor p VIF
Constante -1.77 1.29 -1.37 0.188
X1 0.421 0.294 1.43 0.172 521.01
X2 0.222 0.131 1.70 0.108 401.59
X3 -0.1280 0.0702 -1.82 0.087 688.02
X1*X1 -0.0193 0.0168 -1.15 0.267 501.51
X2*X2 -0.0074 0.0120 -0.62 0.545 173.60
X3*X3 0.00082 0.00144 0.57 0.575 99.68
X1*X2 -0.0199 0.0120 -1.65 0.118 204.43
X1*X3 0.00915 0.00762 1.20 0.247 456.01
X2*X3 0.00258 0.00704 0.37 0.719 349.97

Ecuación de regresión

Y1 = -1.77 + 0.421 X1 + 0.222 X2 - 0.1280 X3 - 0.0193 X1*X1


- 0.0074 X2*X2 + 0.00082 X3*X3 - 0.0199 X1*X2 + 0.00915 X1*X3
+ 0.00258 X2*X3
 Utilizamos el software R-Studio para la obtención del modelo cuadrático de
regresión, las estimaciones de los coeficientes y el VIF (Factor de inflación
de la varianza).
R script:
setwd("C:/Users/Jose/Desktop/03-06-2018")
data<-read.csv("Ejercicio 7.17.csv",sep=",",dec=".",header=TRUE)
data
head(data)

## Ajuste del modelo


modelo<-lm( Y1~X1+X2+X3+I(X1^2)+I(X2^2)+I(X3^2)+I(X1*X2)+I(X1*X3)+I(X2
*X3), data=data)
summary(modelo)

## Calculando el VIF
library(carData)
library(car)
vif(modelo)

Consola:
> setwd("C:/Users/Jose/Desktop/03-06-2018")
> data<-read.csv("Ejercicio 7.17.csv",sep=",",dec=".",header=TRUE)
> data
Y1 X1 X2 X3
1 0.22200 7.3 0.0 0.0
2 0.39500 8.7 0.0 0.3
3 0.42200 8.8 0.7 1.0
4 0.43700 8.1 4.0 0.2
5 0.42800 9.0 0.5 1.0
6 0.46700 8.7 1.5 2.8
7 0.44400 9.3 2.1 1.0
8 0.37800 7.6 5.1 3.4
9 0.49400 10.0 0.0 0.3
10 0.45600 8.4 3.7 4.1
11 0.45200 9.3 3.6 2.0
12 0.11200 7.7 2.8 7.1
13 0.43200 9.8 4.2 2.0
14 0.10100 7.3 2.5 6.8
15 0.23200 8.5 2.0 6.6
16 0.30600 9.5 2.5 5.0
17 0.09230 7.4 2.8 7.8
18 0.11600 7.8 2.8 7.7
19 0.07640 7.7 3.0 8.0
20 0.43900 10.3 1.7 4.2
21 0.09440 7.8 3.3 8.5
22 0.11700 7.1 3.9 6.6
23 0.07260 7.7 4.3 9.5
24 0.04120 7.4 6.0 10.9
25 0.25100 7.3 2.0 5.2
26 0.00002 7.6 7.8 20.7
> head(data)
Y1 X1 X2 X3
1 0.222 7.3 0.0 0.0
2 0.395 8.7 0.0 0.3
3 0.422 8.8 0.7 1.0
4 0.437 8.1 4.0 0.2
5 0.428 9.0 0.5 1.0
6 0.467 8.7 1.5 2.8
> ## Ajuste del modelo
> modelo<-lm( Y1~X1+X2+X3+I(X1^2)+I(X2^2)+I(X3^2)+I(X1*X2)+I(X1*X3)+I(
X2*X3), data=data)
> summary(modelo)

Call:
lm(formula = Y1 ~ X1 + X2 + X3 + I(X1^2) + I(X2^2) + I(X3^2) +
I(X1 * X2) + I(X1 * X3) + I(X2 * X3), data = data)

Residuals:
Min 1Q Median 3Q Max
-0.063213 -0.037282 -0.001113 0.016738 0.122539

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.769364 1.286976 -1.375 0.1881
X1 0.420799 0.294173 1.430 0.1718
X2 0.222453 0.130742 1.701 0.1082
X3 -0.127995 0.070245 -1.822 0.0872 .
I(X1^2) -0.019325 0.016797 -1.150 0.2668
I(X2^2) -0.007449 0.012048 -0.618 0.5451
I(X3^2) 0.000824 0.001441 0.572 0.5754
I(X1 * X2) -0.019876 0.012037 -1.651 0.1182
I(X1 * X3) 0.009151 0.007621 1.201 0.2473
I(X2 * X3) 0.002576 0.007039 0.366 0.7192
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.06092 on 16 degrees of freedom


Multiple R-squared: 0.9169, Adjusted R-squared: 0.8702
F-statistic: 19.63 on 9 and 16 DF, p-value: 5.051e-07

>
> ## Calculando el VIF (FACTOR DE INFLACION DE LA VARIANZA)
> library(carData)
> library(car)
> vif(modelo)
X1 X2 X3 I(X1^2) I(X2^2) I(X3^2)
521.01297 401.58833 688.02220 501.50614 173.60055 99.67708
I(X1 * X2) I(X1 * X3) I(X2 * X3)
204.43081 456.00750 349.97018

OBSERVACIÓN:

Prueba de Multicolinealidad con factores de inflación de varianza (VIF)

El factor de inflación de varianza (VIF), identifica la correlación entre las variables


independientes y la fuerza de esa correlación.

El factor de inflación de varianza para la j-ésima variable independiente de regresión


se puede escribir como:
1
𝑉𝐼𝐹𝑗 =
1−𝑅𝑗2
Donde 𝑅𝑗2 es el coeficiente de determinación múltiple obtenido haciendo la
regresión de xj sobre las demás variables regresoras.
Interpretación de la multicolinealidad:

 𝑉𝐼𝐹𝑗 =1, No existe una correlación entre esta variable independiente y


ninguna otra.
 1 < 𝑉𝐼𝐹𝑗 <= 5, Sugieren que existe una correlación moderada.

 𝑉𝐼𝐹𝑗 > 5, Representan niveles críticos de multicolinealidad.

Luego, como podemos apreciar, obtenemos los mismos resultados al determinar los
factores de inflación de varianza (VIF) usando ambos software. Los resultados son:

MINITAB R-STUDIO
Término VIF Término VIF
X1 521.01 X1 521.01297
X2 401.59 X2 401.58833
X3 688.02 X3 688.0222
X1*X1 501.51 X1^2 501.50614
X2*X2 173.6 X2^2 173.60055
X3*X3 99.68 X3^2 99.67708
X1*X2 204.43 X1*X2 204.43081
X1*X3 456.01 X1*X3 456.0075
X2*X3 349.97 X2*X3 349.97018

Los factores de inflación de la varianza son todos muy grandes, lo que indica que hay
un problema grave de multicolinealidad en el modelo de regresión.

Ecuación de regresión

Y1 = -1.77 + 0.421 X1 + 0.222 X2 - 0.1280 X3 - 0.0193 X1*X1


- 0.0074 X2*X2 + 0.00082 X3*X3 - 0.0199 X1*X2 + 0.00915 X1*X3
+ 0.00258 X2*X3

También podría gustarte