Está en la página 1de 26

Unidad Profesional Interdisciplinaria de Ingeniería

Campus Guanajuato IPN

IPN

PROYECTO: “Modelos de Regresión en Acción”

MATERIA: Estadística

Docente: Edgar Reyes Ayona

Integrantes:
Suarez Sánchez Héctor
Trujillo Jasso Víctor Manuel
Osvaldo Martínez Rodríguez
Tabla de contenido
INTRODUCCIÓN..................................................................................................................................3
PLANTEAMIENTO DEL PROBLEMA.....................................................................................................3
DESARROLLO......................................................................................................................................4
CONCLUSION....................................................................................................................................26
INTRODUCCIÓN
La empresa se llama “Moreno renta” y se encarga renta de inflables, mesas, sillas
y carpas considerando el número de personas que van a asistir a una fiesta, en
este modelo se basara en las mesas, costo, el tipo de fiesta ; teniendo en cuenta
lo anterior nuestra empresa brinda servicios para fiestas tomando en cuenta el tipo
de ubicación, temática y el día en que se hace el servicio.

PLANTEAMIENTO DEL PROBLEMA


En una microempresa dedicada a la renta de inflables, mesas, sillas y carpas,
considerando el numero de personas que van a asistir a una fiesta, en este
modelo se basara en las mesas, costo, el tipo de fiesta
Variables
Esta variable corresponde a la renta por fiesta
Variable Descripción
y Número de personas
X1 Numero de carpas
X2 El costo al cuadrado
X3 Las mesas al cuadrado
X4 El tipo (codificado)
Datos
DESARROLLO
Aquí se realizo se mete las variables en R el numero de personas (se
metieron todas las variables; carpas, costo, costo al cuadrado, carpa al
cuadrado, inflable, inflable al cuadrado, mesas, mesas al cauadrado, el sexo
del cliente, y el sexo al cuadrado, temática, temática la cuadrado, tipo 1 y
tipo 1 al cauadarado. Tipo 2, tipo 2 al caudarado)
La variable de respuesta es el numero de personas que asistirán a la fiesta
> Dataset <- readXL("C:/Users/jose_/OneDrive/Escritorio/IPN/3er semestre/estadistica/proy.xlsx",

+ rownames=FALSE, header=TRUE, na="", sheet="Hoja1", stringsAsFactors=TRUE)

Se utilizo una ecuación cuadratica

> LinearModel.1 <- lm(No.PER ~ CA +I(CA ^2)+Costo +I(Costo ^2)+IN1 +I(IN1 ^2)+Mesas +I(Mesas

+ ^2)+SE1 +I(SE1 ^2)+SEM1 +I(SEM1 ^2)+TEM +I(TEM ^2)+TIEM +I(TIEM ^2) + TIPO1 +I(TIPO1

+ ^2)+TIPO2 +I(TIPO2 ^2)+Ub1 +I(Ub1 ^2), data=Dataset)

> summary(LinearModel.1)

Call:

lm(formula = No.PER ~ CA + I(CA^2) + Costo + I(Costo^2) + IN1 +

I(IN1^2) + Mesas + I(Mesas^2) + SE1 + I(SE1^2) + SEM1 + I(SEM1^2) +

TEM + I(TEM^2) + TIEM + I(TIEM^2) + TIPO1 + I(TIPO1^2) +

TIPO2 + I(TIPO2^2) + Ub1 + I(Ub1^2), data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-14.231 -4.194 -1.016 3.018 41.702

Coefficients: (8 not defined because of singularities)

Estimate Std. Error t value Pr(>|t|)

(Intercept) 39.77182384 22.18562298 1.793 0.0890 .


CA -42.57620812 16.59417800 -2.566 0.0189 *

I(CA^2) NA NA NA NA

Costo 0.07008103 0.04837426 1.449 0.1637

I(Costo^2) -0.00002029 0.00003055 -0.664 0.5146

IN1 -3.19107769 21.18589067 -0.151 0.8819

I(IN1^2) NA NA NA NA

Mesas -5.11077200 4.23607336 -1.206 0.2424

I(Mesas^2) 0.97276523 0.54459615 1.786 0.0900 .

SE1 -7.41622334 5.69479958 -1.302 0.2084

I(SE1^2) NA NA NA NA

SEM1 0.58312243 7.20071757 0.081 0.9363

I(SEM1^2) NA NA NA NA

TEM -0.16446790 7.40035492 -0.022 0.9825

I(TEM^2) NA NA NA NA

TIEM -0.29952180 0.59018812 -0.508 0.6176

I(TIEM^2) 0.00365048 0.00791081 0.461 0.6497

TIPO1 -9.08158506 16.22158081 -0.560 0.5821

I(TIPO1^2) NA NA NA NA

TIPO2 -20.96561540 8.73838056 -2.399 0.0268 *

I(TIPO2^2) NA NA NA NA

Ub1 -2.76622718 5.29310584 -0.523 0.6073

I(Ub1^2) NA NA NA NA

---Como lo subrayado en amarillo no aporta nada se quitan esas variables


del modelo dejando la ecuación así
Estos son los valores de alfa para rechazar los valores P
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residuos: F:0

Residual standard error: 12.43 on 19 degrees of freedom

Multiple R-squared: 0.6851, Adjusted R-squared: 0.4531


F-statistic: 2.953 on 14 and 19 DF, p-value: 0.01487

> LinearModel.2 <- lm(No.PER ~ CA + Costo + I(Costo^2) + IN1 + Mesas + I(Mesas^2) + SE1

+ + SEM1 + TEM + TIEM + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data=Dataset)

Asi es como quedo el modelo después de quitar los variables que no aportan nada

(Resumen del modelo)

> summary(LinearModel.2)

Call:

lm(formula = No.PER ~ CA + Costo + I(Costo^2) + IN1 + Mesas +

I(Mesas^2) + SE1 + SEM1 + TEM + TIEM + I(TIEM^2) + TIPO1 +

TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-14.231 -4.194 -1.016 3.018 41.702

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 39.77182384 22.18562298 1.793 0.0890 .

CA -42.57620812 16.59417800 -2.566 0.0189 *

Costo 0.07008103 0.04837426 1.449 0.1637

I(Costo^2) -0.00002029 0.00003055 -0.664 0.5146

IN1 -3.19107769 21.18589067 -0.151 0.8819

Mesas -5.11077200 4.23607336 -1.206 0.2424

I(Mesas^2) 0.97276523 0.54459615 1.786 0.0900 .

SE1 -7.41622334 5.69479958 -1.302 0.2084

SEM1 0.58312243 7.20071757 0.081 0.9363


TEM -0.16446790 7.40035492 -0.022 0.9825

TIEM -0.29952180 0.59018812 -0.508 0.6176

I(TIEM^2) 0.00365048 0.00791081 0.461 0.6497

TIPO1 -9.08158506 16.22158081 -0.560 0.5821

TIPO2 -20.96561540 8.73838056 -2.399 0.0268 *

Ub1 -2.76622718 5.29310584 -0.523 0.6073

---Como se ve que en algunos valores P son muy altos para el nivel de


confianza 97% (o para un alfa del 0.03) se van eliminando
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 12.43 on 19 degrees of freedom

Multiple R-squared: 0.6851, Adjusted R-squared: 0.4531

F-statistic: 2.953 on 14 and 19 DF, p-value: 0.01487

Y así uno por uno se fueron quitando las variables


> LinearModel.3 <- lm(No.PER ~ CA + Costo + I(Costo^2) + IN1 + Mesas + I(Mesas^2) + SE1

+ + SEM1 + TIEM + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data=Dataset)

> summary(LinearModel.3)

Call:

lm(formula = No.PER ~ CA + Costo + I(Costo^2) + IN1 + Mesas +

I(Mesas^2) + SE1 + SEM1 + TIEM + I(TIEM^2) + TIPO1 + TIPO2 +

Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-14.137 -4.223 -1.024 3.006 41.644


Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 39.81649108 21.53523536 1.849 0.0793 .

CA -42.67539486 15.57826786 -2.739 0.0126 *

Costo 0.07019658 0.04687690 1.497 0.1499

I(Costo^2) -0.00002030 0.00002978 -0.682 0.5032

IN1 -3.42180670 18.00042104 -0.190 0.8512

Mesas -5.11000813 4.12873134 -1.238 0.2302

I(Mesas^2) 0.97132981 0.52706731 1.843 0.0802 .

SE1 -7.45814503 5.23733765 -1.424 0.1699

SEM1 0.61274774 6.89717165 0.089 0.9301

TIEM -0.29970332 0.57519661 -0.521 0.6081

I(TIEM^2) 0.00364125 0.00769998 0.473 0.6414

TIPO1 -9.02385257 15.60699554 -0.578 0.5696

TIPO2 -21.02455970 8.11544030 -2.591 0.0175 *

Ub1 -2.73947299 5.02394698 -0.545 0.5916

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 12.12 on 20 degrees of freedom

Multiple R-squared: 0.6851, Adjusted R-squared: 0.4804

F-statistic: 3.347 on 13 and 20 DF, p-value: 0.007587

> LinearModel.4 <- lm(No.PER ~ CA + Costo + I(Costo^2) + Mesas + I(Mesas^2) + SE1 + SEM1

+ + TIEM + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data=Dataset)

> summary(LinearModel.4)
Call:

lm(formula = No.PER ~ CA + Costo + I(Costo^2) + Mesas + I(Mesas^2) +

SE1 + SEM1 + TIEM + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-14.044 -4.154 -1.153 3.003 41.662

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 38.63351287 20.13780778 1.918 0.06875 .

CA -41.17176257 13.10913795 -3.141 0.00494 **

Costo 0.06973371 0.04572667 1.525 0.14218

I(Costo^2) -0.00002087 0.00002894 -0.721 0.47872

Mesas -4.96070137 3.95922187 -1.253 0.22400

I(Mesas^2) 0.95393186 0.50700848 1.881 0.07384 .

SE1 -7.29201001 5.04400552 -1.446 0.16303

SEM1 0.67191147 6.73016588 0.100 0.92142

TIEM -0.28607112 0.55745767 -0.513 0.61319

I(TIEM^2) 0.00358828 0.00751627 0.477 0.63801

TIPO1 -11.34293176 9.50795154 -1.193 0.24618

TIPO2 -20.86700743 7.88556318 -2.646 0.01510 *

Ub1 -3.00025901 4.72079820 -0.636 0.53194

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.84 on 21 degrees of freedom

Multiple R-squared: 0.6845, Adjusted R-squared: 0.5043

F-statistic: 3.797 on 12 and 21 DF, p-value: 0.003695


Apartir de aqui vamos checando los VIF, que son los Factores de inflación
de la varianza, para ver que las variables sean independientes tienen que
ser menor que 3 y las que son mayores se van quitando del modelo, por
ejemplo:

> vif(LinearModel.4)

CA Costo I(Costo^2) Mesas I(Mesas^2) SE1 SEM1 TIEM

7.504127 42.616094 36.673177 14.259259 9.839324 1.522245 1.141094 12.811002

I(TIEM^2) TIPO1 TIPO2 Ub1

12.604001 5.010331 1.566518 1.333412

Y se van quitando uno por uno las variables con VIF mayor a 3

> round(cov2cor(vcov(LinearModel.4)), 3) # Correlations of parameter estimates

(Intercept) CA Costo I(Costo^2) Mesas I(Mesas^2) SE1 SEM1 TIEM

(Intercept) 1.000 -0.248 -0.487 0.534 -0.086 0.129 -0.342 -0.380 -0.555

CA -0.248 1.000 -0.562 0.438 0.604 -0.355 0.258 0.148 0.164

Costo -0.487 -0.562 1.000 -0.965 -0.545 0.357 0.004 0.031 0.058

I(Costo^2) 0.534 0.438 -0.965 1.000 0.499 -0.376 -0.102 -0.061 -0.118

Mesas -0.086 0.604 -0.545 0.499 1.000 -0.889 -0.039 0.087 0.142

I(Mesas^2) 0.129 -0.355 0.357 -0.376 -0.889 1.000 0.038 -0.101 -0.116

SE1 -0.342 0.258 0.004 -0.102 -0.039 0.038 1.000 0.055 0.220

SEM1 -0.380 0.148 0.031 -0.061 0.087 -0.101 0.055 1.000 0.023

TIEM -0.555 0.164 0.058 -0.118 0.142 -0.116 0.220 0.023 1.000

I(TIEM^2) 0.505 -0.181 0.012 0.021 -0.216 0.200 -0.206 -0.042 -0.947

TIPO1 -0.179 0.830 -0.546 0.495 0.615 -0.418 0.059 0.049 0.164

TIPO2 -0.581 0.282 0.146 -0.181 0.159 -0.175 0.287 0.016 0.108

Ub1 0.110 -0.187 -0.042 0.044 -0.181 0.075 0.020 0.132 -0.159

I(TIEM^2) TIPO1 TIPO2 Ub1

(Intercept) 0.505 -0.179 -0.581 0.110


CA -0.181 0.830 0.282 -0.187

Costo 0.012 -0.546 0.146 -0.042

I(Costo^2) 0.021 0.495 -0.181 0.044

Mesas -0.216 0.615 0.159 -0.181

I(Mesas^2) 0.200 -0.418 -0.175 0.075

SE1 -0.206 0.059 0.287 0.020

SEM1 -0.042 0.049 0.016 0.132

TIEM -0.947 0.164 0.108 -0.159

I(TIEM^2) 1.000 -0.202 -0.132 0.163

TIPO1 -0.202 1.000 0.083 -0.302

TIPO2 -0.132 0.083 1.000 -0.103

Ub1 0.163 -0.302 -0.103 1.000

> LinearModel.5 <- lm(No.PER ~ CA + I(Costo^2) + Mesas + I(Mesas^2) + SE1 + SEM1 + TIEM

+ + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data=Dataset)

> summary(LinearModel.5)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + Mesas + I(Mesas^2) +

SE1 + SEM1 + TIEM + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-15.391 -6.083 -2.627 4.305 38.917

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 53.590484158 18.110186012 2.959 0.00725 **


CA -29.929149867 11.161596766 -2.681 0.01363 *

I(Costo^2) 0.000021736 0.000007764 2.800 0.01044 *

Mesas -1.673013538 3.419397525 -0.489 0.62949

I(Mesas^2) 0.678246885 0.487748075 1.391 0.17826

SE1 -7.319180274 5.193719488 -1.409 0.17274

SEM1 0.352447827 6.926613174 0.051 0.95988

TIEM -0.335496633 0.573036534 -0.585 0.56419

I(TIEM^2) 0.003449500 0.007738843 0.446 0.66014

TIPO1 -3.433015741 8.205157028 -0.418 0.67971

TIPO2 -22.621875040 8.032750433 -2.816 0.01006 *

Ub1 -2.696522126 4.856621042 -0.555 0.58434

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 12.19 on 22 degrees of freedom

Multiple R-squared: 0.6496, Adjusted R-squared: 0.4744

F-statistic: 3.708 on 11 and 22 DF, p-value: 0.004305

> vif(LinearModel.5)

CA I(Costo^2) Mesas I(Mesas^2) SE1 SEM1 TIEM I(TIEM^2)

5.130897 2.489712 10.031484 8.588447 1.522226 1.139988 12.767699 12.602153

TIPO1 TIPO2 Ub1

3.519290 1.533159 1.331038

> round(cov2cor(vcov(LinearModel.5)), 3) # Correlations of parameter estimates

(Intercept) CA I(Costo^2) Mesas I(Mesas^2) SE1 SEM1 TIEM I(TIEM^2)

(Intercept) 1.000 -0.723 0.282 -0.480 0.371 -0.389 -0.418 -0.604 0.585

CA -0.723 1.000 -0.487 0.429 -0.200 0.314 0.200 0.238 -0.211


I(Costo^2) 0.282 -0.487 1.000 -0.122 -0.132 -0.377 -0.117 -0.238 0.125

Mesas -0.480 0.429 -0.122 1.000 -0.887 -0.045 0.124 0.208 -0.249

I(Mesas^2) 0.371 -0.200 -0.132 -0.887 1.000 0.039 -0.120 -0.147 0.210

SE1 -0.389 0.314 -0.377 -0.045 0.039 1.000 0.055 0.220 -0.206

SEM1 -0.418 0.200 -0.117 0.124 -0.120 0.055 1.000 0.021 -0.042

TIEM -0.604 0.238 -0.238 0.208 -0.147 0.220 0.021 1.000 -0.950

I(TIEM^2) 0.585 -0.211 0.125 -0.249 0.210 -0.206 -0.042 -0.950 1.000

TIPO1 -0.607 0.756 -0.147 0.453 -0.285 0.073 0.078 0.234 -0.233

TIPO2 -0.590 0.445 -0.155 0.287 -0.246 0.289 0.012 0.101 -0.135

Ub1 0.102 -0.256 0.011 -0.243 0.097 0.020 0.134 -0.157 0.164

TIPO1 TIPO2 Ub1

(Intercept) -0.607 -0.590 0.102

CA 0.756 0.445 -0.256

I(Costo^2) -0.147 -0.155 0.011

Mesas 0.453 0.287 -0.243

I(Mesas^2) -0.285 -0.246 0.097

SE1 0.073 0.289 0.020

SEM1 0.078 0.012 0.134

TIEM 0.234 0.101 -0.157

I(TIEM^2) -0.233 -0.135 0.164

TIPO1 1.000 0.196 -0.388

TIPO2 0.196 1.000 -0.098

Ub1 -0.388 -0.098 1.000

> LinearModel.6 <- lm(No.PER ~ CA + I(Costo^2) + Mesas + I(Mesas^2) + SE1 + SEM1 +

+ I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data=Dataset)

> summary(LinearModel.6)
Call:

lm(formula = No.PER ~ CA + I(Costo^2) + Mesas + I(Mesas^2) +

SE1 + SEM1 + I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-15.364 -6.282 -2.229 4.276 38.603

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 47.188860122 14.229121913 3.316 0.00301 **

CA -28.370958430 10.683657597 -2.656 0.01413 *

I(Costo^2) 0.000020652 0.000007431 2.779 0.01067 *

Mesas -1.257605026 3.296836221 -0.381 0.70636

I(Mesas^2) 0.636379345 0.475534013 1.338 0.19390

SE1 -6.650003699 4.993482838 -1.332 0.19599

SEM1 0.438836010 6.825383066 0.064 0.94929

I(TIEM^2) -0.000852889 0.002391592 -0.357 0.72463

TIPO1 -2.308703843 7.862469768 -0.294 0.77167

TIPO2 -22.147119845 7.876707563 -2.812 0.00990 **

Ub1 -3.142534021 4.727475333 -0.665 0.51283

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 12.01 on 23 degrees of freedom

Multiple R-squared: 0.6441, Adjusted R-squared: 0.4894

F-statistic: 4.163 on 10 and 23 DF, p-value: 0.002258


> vif(LinearModel.6)

CA I(Costo^2) Mesas I(Mesas^2) SE1 SEM1 I(TIEM^2) TIPO1

4.839174 2.348148 9.599562 8.403832 1.448505 1.139471 1.238961 3.326518

TIPO2 Ub1

1.517535 1.298289

> round(cov2cor(vcov(LinearModel.6)), 3) # Correlations of parameter estimates

(Intercept) CA I(Costo^2) Mesas I(Mesas^2) SE1 SEM1 I(TIEM^2) TIPO1

(Intercept) 1.000 -0.748 0.178 -0.455 0.358 -0.330 -0.508 0.045 -0.601

CA -0.748 1.000 -0.456 0.400 -0.172 0.276 0.201 0.050 0.741

I(Costo^2) 0.178 -0.456 1.000 -0.077 -0.174 -0.343 -0.116 -0.335 -0.096

Mesas -0.455 0.400 -0.077 1.000 -0.885 -0.095 0.122 -0.170 0.425

I(Mesas^2) 0.358 -0.172 -0.174 -0.885 1.000 0.074 -0.119 0.228 -0.261

SE1 -0.330 0.276 -0.343 -0.095 0.074 1.000 0.052 0.010 0.023

SEM1 -0.508 0.201 -0.116 0.122 -0.119 0.052 1.000 -0.071 0.076

I(TIEM^2) 0.045 0.050 -0.335 -0.170 0.228 0.010 -0.071 1.000 -0.036

TIPO1 -0.601 0.741 -0.096 0.425 -0.261 0.023 0.076 -0.036 1.000

TIPO2 -0.667 0.436 -0.136 0.273 -0.235 0.275 0.010 -0.127 0.179

Ub1 0.010 -0.227 -0.028 -0.218 0.076 0.056 0.139 0.048 -0.366

TIPO2 Ub1

(Intercept) -0.667 0.010

CA 0.436 -0.227

I(Costo^2) -0.136 -0.028

Mesas 0.273 -0.218

I(Mesas^2) -0.235 0.076

SE1 0.275 0.056

SEM1 0.010 0.139

I(TIEM^2) -0.127 0.048

TIPO1 0.179 -0.366


TIPO2 1.000 -0.084

Ub1 -0.084 1.000

> LinearModel.7 <- lm(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + SEM1 + I(TIEM^2) +

+ TIPO1 + TIPO2 + Ub1, data=Dataset)

> summary(LinearModel.7)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + SEM1 +

I(TIEM^2) + TIPO1 + TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-16.284 -5.818 -2.003 4.192 39.159

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 44.721219233 12.445949800 3.593 0.00146 **

CA -26.742696465 9.617959815 -2.780 0.01039 *

I(Costo^2) 0.000020435 0.000007276 2.808 0.00974 **

I(Mesas^2) 0.475850517 0.217461078 2.188 0.03862 *

SE1 -6.830242811 4.881781278 -1.399 0.17457

SEM1 0.756591458 6.652671352 0.114 0.91040

I(TIEM^2) -0.001008043 0.002314416 -0.436 0.66706

TIPO1 -1.033305018 6.988318460 -0.148 0.88369

TIPO2 -21.325591612 7.440463414 -2.866 0.00851 **

Ub1 -3.535988804 4.530706872 -0.780 0.44276

---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.8 on 24 degrees of freedom

Multiple R-squared: 0.6419, Adjusted R-squared: 0.5076

F-statistic: 4.78 on 9 and 24 DF, p-value: 0.001024

> vif(LinearModel.7)

CA I(Costo^2) I(Mesas^2) SE1 SEM1 I(TIEM^2) TIPO1 TIPO2

4.066696 2.334355 1.822308 1.435536 1.122499 1.203125 2.724970 1.404086

Ub1

1.236486

> round(cov2cor(vcov(LinearModel.7)), 3) # Correlations of parameter estimates

(Intercept) CA I(Costo^2) I(Mesas^2) SE1 SEM1 I(TIEM^2) TIPO1 TIPO2

(Intercept) 1.000 -0.693 0.162 -0.107 -0.421 -0.512 -0.037 -0.506 -0.633

CA -0.693 1.000 -0.466 0.425 0.344 0.167 0.131 0.688 0.370

I(Costo^2) 0.162 -0.466 1.000 -0.521 -0.353 -0.107 -0.354 -0.071 -0.120

I(Mesas^2) -0.107 0.425 -0.521 1.000 -0.021 -0.023 0.168 0.273 0.016

SE1 -0.421 0.344 -0.353 -0.021 1.000 0.064 -0.006 0.070 0.315

SEM1 -0.512 0.167 -0.107 -0.023 0.064 1.000 -0.051 0.026 -0.025

I(TIEM^2) -0.037 0.131 -0.354 0.168 -0.006 -0.051 1.000 0.041 -0.085

TIPO1 -0.506 0.688 -0.071 0.273 0.070 0.026 0.041 1.000 0.072

TIPO2 -0.633 0.370 -0.120 0.016 0.315 -0.025 -0.085 0.072 1.000

Ub1 -0.103 -0.157 -0.046 -0.259 0.037 0.171 0.011 -0.309 -0.026

Ub1

(Intercept) -0.103

CA -0.157

I(Costo^2) -0.046
I(Mesas^2) -0.259

SE1 0.037

SEM1 0.171

I(TIEM^2) 0.011

TIPO1 -0.309

TIPO2 -0.026

Ub1 1.000

> LinearModel.9 <- lm(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + SEM1 + I(TIEM^2) +

+ TIPO2 + Ub1, data=Dataset)

> summary(LinearModel.9)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + SEM1 +

I(TIEM^2) + TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-16.496 -5.834 -1.580 4.040 39.157

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.790817004 10.525975664 4.160 0.000328 ***

CA -25.763633383 6.837931766 -3.768 0.000897 ***

I(Costo^2) 0.000020358 0.000007115 2.861 0.008402 **

I(Mesas^2) 0.484641252 0.205043430 2.364 0.026181 *

SE1 -6.779894362 4.773672340 -1.420 0.167882

SEM1 0.782507209 6.518964771 0.120 0.905414


I(TIEM^2) -0.000993923 0.002266756 -0.438 0.664806

TIPO2 -21.246827159 7.274739431 -2.921 0.007301 **

Ub1 -3.742846960 4.224162348 -0.886 0.384031

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.56 on 25 degrees of freedom

Multiple R-squared: 0.6415, Adjusted R-squared: 0.5268

F-statistic: 5.593 on 8 and 25 DF, p-value: 0.0004079

> vif(LinearModel.9)

CA I(Costo^2) I(Mesas^2) SE1 SEM1 I(TIEM^2) TIPO2 Ub1

2.139236 2.322666 1.686102 1.428551 1.121720 1.201077 1.396889 1.118592

Como aqui se ve todas las VIF son menores que 3, dando a entender que
todas son independientes, ahora se seguirá descartando variable con un
valor p mayor a 0.03
> round(cov2cor(vcov(LinearModel.9)), 3) # Correlations of parameter estimates

(Intercept) CA I(Costo^2) I(Mesas^2) SE1 SEM1 I(TIEM^2) TIPO2 Ub1

(Intercept) 1.000 -0.551 0.146 0.037 -0.448 -0.578 -0.019 -0.694 -0.316

CA -0.551 1.000 -0.576 0.340 0.409 0.206 0.141 0.444 0.081

I(Costo^2) 0.146 -0.576 1.000 -0.522 -0.349 -0.106 -0.352 -0.115 -0.071

I(Mesas^2) 0.037 0.340 -0.522 1.000 -0.042 -0.031 0.163 -0.003 -0.190

SE1 -0.448 0.409 -0.349 -0.042 1.000 0.063 -0.009 0.311 0.061

SEM1 -0.578 0.206 -0.106 -0.031 0.063 1.000 -0.052 -0.026 0.188

I(TIEM^2) -0.019 0.141 -0.352 0.163 -0.009 -0.052 1.000 -0.088 0.025

TIPO2 -0.694 0.444 -0.115 -0.003 0.311 -0.026 -0.088 1.000 -0.004

Ub1 -0.316 0.081 -0.071 -0.190 0.061 0.188 0.025 -0.004 1.000
> LinearModel.10 <- lm(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + I(TIEM^2) + TIPO2 +

+ Ub1, data=Dataset)

> summary(LinearModel.10)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + I(TIEM^2) +

TIPO2 + Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-16.490 -5.752 -1.808 4.079 39.265

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 44.520898536 8.426456745 5.283 0.0000159 ***

CA -25.932533831 6.563537304 -3.951 0.000531 ***

I(Costo^2) 0.000020449 0.000006939 2.947 0.006695 **

I(Mesas^2) 0.485408541 0.201021803 2.415 0.023082 *

SE1 -6.815712046 4.673163140 -1.458 0.156684

I(TIEM^2) -0.000979666 0.002220323 -0.441 0.662697

TIPO2 -21.223702704 7.133021842 -2.975 0.006247 **

Ub1 -3.838392477 4.069101055 -0.943 0.354210

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R CUADRADO que significa que tan bueno es el modelo

Residual standard error: 11.34 on 26 degrees of freedom

Multiple R-squared: 0.6413, Adjusted R-squared: 0.5448

F-statistic: 6.642 on 7 and 26 DF, p-value: 0.0001484


> LinearModel.11 <- lm(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + TIPO2 + Ub1,

+ data=Dataset)

> summary(LinearModel.11)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + TIPO2 +

Ub1, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-16.387 -5.779 -2.308 3.805 39.242

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 44.297681891 8.284867308 5.347 0.000012 ***

CA -25.481448577 6.386006342 -3.990 0.000454 ***

I(Costo^2) 0.000019346 0.000006377 3.034 0.005286 **

I(Mesas^2) 0.499740122 0.195399374 2.558 0.016473 *

SE1 -6.826938586 4.602874975 -1.483 0.149604

TIPO2 -21.505584988 6.997603291 -3.073 0.004797 **

Ub1 -3.774862469 4.005447921 -0.942 0.354328

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.17 on 27 degrees of freedom

Multiple R-squared: 0.6387, Adjusted R-squared: 0.5584


F-statistic: 7.954 on 6 and 27 DF, p-value: 0.00005332

> LinearModel.12 <- lm(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + TIPO2, data=Dataset)

> summary(LinearModel.12)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + I(Mesas^2) + SE1 + TIPO2,

data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-14.333 -6.770 -2.596 3.873 37.467

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 42.292879081 7.991102696 5.292 0.0000125 ***

CA -25.248206886 6.368453966 -3.965 0.000462 ***

I(Costo^2) 0.000019091 0.000006358 3.003 0.005582 **

I(Mesas^2) 0.463560275 0.191208101 2.424 0.022042 *

SE1 -6.606568526 4.587743270 -1.440 0.160942

TIPO2 -21.477552181 6.983553274 -3.075 0.004657 **

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.15 on 28 degrees of freedom

Multiple R-squared: 0.6268, Adjusted R-squared: 0.5601

F-statistic: 9.404 on 5 and 28 DF, p-value: 0.00002399


Y al final después de quitar aquellas variables con VIF alto y valor P mayor
que 0.03 el modelo final queda así
> LinearModel.13 <- lm(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + TIPO2, data=Dataset)

> summary(LinearModel.13)

Call:

lm(formula = No.PER ~ CA + I(Costo^2) + I(Mesas^2) + TIPO2, data = Dataset)

Residuals:

Min 1Q Median 3Q Max

-12.843 -7.166 -0.792 4.557 40.493

Dejando los valores p y valores de Beta de la siguiente forma:


Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 36.409934980 6.993922102 5.206 0.0000143 ***

CA -21.482409094 5.913303953 -3.633 0.00107 **

I(Costo^2) 0.000015695 0.000006013 2.610 0.01417 *

I(Mesas^2) 0.455237970 0.194626749 2.339 0.02643 *

TIPO2 -18.314957820 6.750850906 -2.713 0.01110 *

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.35 on 29 degrees of freedom

Multiple R-squared: 0.5991, Adjusted R-squared: 0.5438

F-statistic: 10.84 on 4 and 29 DF, p-value: 0.00001697


Ahora se calculan los valores ajustados y los errores
> Dataset<- within(Dataset, {

+ fitted.LinearModel.13 <- fitted(LinearModel.13)

+ residuals.LinearModel.13 <- residuals(LinearModel.13)

+ })

> library(zoo, pos=17)

> library(lmtest, pos=17)

> bptest(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + TIPO2, varformula = ~

+ fitted.values(LinearModel.13), studentize=FALSE, data=Dataset)

Ahora con la prueba de heterosedasticidad de Breusch-Pagan cuya prueba


de hipótesis es:
H0: Los errores tienen una varianza constante
H1: Los errores NO tienen una varianza constante
Breusch-Pagan test

data: No.PER ~ CA + I(Costo^2) + I(Mesas^2) + TIPO2

BP = 0.095318, df = 1, p-value = 0.7575

Y como Podemos ver el Alpha es menor que el valor p así que no hay
evidencia para rechazar la hipótesis nula

Ahora con la prueba de normalidad de los errores usaremos la prueba de


Chi-cuadrada de Pearson cuya prueba de hipótesis es:
H0: 𝞊∼N(0,𝞼^2)
H1: : 𝞊≁N(0,𝞼^2)
> normalityTest(~residuals.LinearModel.13, test="pearson.test", data=Dataset)

Pearson chi-square normality test

data: residuals.LinearModel.13

P = 12.588, p-value = 0.05006

Y como Podemos ver el Alpha es menor que el valor p así que no hay
evidencia para rechazar la hipótesis nula

Ahora con la prueba de no linealidad usaremos la prueba de test RESET de


no linealidad cuya prueba de hipótesis es:
H0: E(y)=𝞫0+ 𝞫CA(CA)+ 𝞫I(Mesas^2)(I(Mesas^2))+ 𝞫TIPO2(TIPO2)
H1: E(y)≠𝞫0+ 𝞫CA(CA)+ 𝞫I(Mesas^2)(I(Mesas^2))+ 𝞫TIPO2(TIPO2)

> resettest(No.PER ~ CA + I(Costo^2) + I(Mesas^2) + TIPO2, power=2:3, type="fitted",

+ data=Dataset)

RESET test

data: No.PER ~ CA + I(Costo^2) + I(Mesas^2) + TIPO2

RESET = 3.6354, df1 = 2, df2 = 27, p-value = 0.03999

Y como Podemos ver el Alpha es menor que el valor p así que no hay
evidencia para rechazar la hipótesis nula
CONCLUSION
En conclusión nuestro modelo resulto bien porque cumples todas las condiciones para
cumplir un modelo lineal funcional que los valores son independientes, que el error tenga
una varianza contante, que cumpla la homocedasticidad que los errores siguen una
distribución normal con media cero y varianza sigma cuadrada.

También podría gustarte