Está en la página 1de 14

UNIVERSIDAD TECNOLÓGICA DE SANTIAGO.

UTESA-SEDE.
Facultad de Arquitectura e Ingeniería.
Carrera de Ingeniería Industrial

Trabajo Presentado Como Requisito de la Asignatura de

Laboratorio de Métodos Numéricos.

(INF-706-004)

Presentado Por:

Lissie Nicole Jorge Feliz. Matrícula: 1-17-7542.

Profesor:

Ing. Félix Suriel, M.A.

Tema:

Tarea Regresión Lineal Múltiple y Regresión Lineal Simple. 2do parcial.


Valorado en 5 puntos.

Santiago de los Caballeros, Santiago.


República Dominicana.
Julio, 2021.
Entrada:
#Regresion multiple

require(MASS) require(ISLR) require(psych)


entrega=
read.csv("C:/Users/LissieJorge/Desktop/Guardados/DocMetNum.csv")
View(entrega)
plot(entrega)

fit2=lm(N_cajas~Distancia+Tiempo, data=entrega) summary(fit2)

cor(entrega)

residuos=rstandard(fit2) hist(residuos)

qqnorm(residuos) qqline(residuos)

Consola:
require(MASS)
> require(ISLR)
> require(psych)
> entrega=
read.csv("C:/Users/LissieJorge/Desktop/Guardados/DocMetNum.csv”
)
> View(entrega)
> plot(entrega)
> fit2=lm(N_cajas~Distancia+Tiempo, data=entrega)
> summary(fit2)
Call:
lm(formula = N_cajas ~ Distancia + Tiempo, data = entrega)

Residuals:
Min 1Q Median 3Q Max
-2.9582 -1.4618 -0.5859 0.5690 8.9907

Coefficients:
Estimate Std. Error t
value Pr(>|t|) (Intercept)
5.7969 5.5029 1.053
0.31289
Distancia -0.4847 0.1320 -3.673 0.00319 **
Tiempo 0.8350 0.1457 5.732 9.43e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.064 on 12


degrees of freedom Multiple R-squared:
0.7764, Adjusted R-squared:
0.7392
F-statistic: 20.84 on 2 and 12 DF, p-value: 0.0001249

> cor(entrega)
N_cajas Distancia Tiempo
N_cajas 1.0000000 -0.4052976 0.7246466
Distancia -0.4052976 1.0000000 0.1269032
Tiempo 0.7246466 0.1269032 1.0000000
> residuos=rstandard(fit2)
> hist(residuos)
> qqnorm(residuos)
> qqline(residuos)
>
>
Gráficos correspondientes al problema anterior (RLM):
Conclusiones (RLM):
Según puedo comprender y analizar los resultados obtenidos puedo ver que
en este modelo o problema la gráfica de los residuos la mayoría de los puntos
pasan por la línea por lo que podemos concluir que el resultado es el adecuado
ya que eso es lo que se busca el realizar este tipo graficación en esta regresión
lineal.
Ya que la regresión lineal múltiple busca obtener el valor de las variables
respuesta o dependiente, entonces podemos decir que en este caso la
variable independiente afecta a todas las variables dependientes
encontradas.
Con la variable tiempo encontrada podemos tener el coeficiente de
determinación que sería 77.64% de la variabilidad de los datos, esto ya que
fue el valor estimado lanzado por la variable tiempo en el problema.
Como se expresó anteriormente todas las variables llevan una relación estable
entre sí puesto que en el gráfico pasan directamente por la línea esto quiere
decir que llevan una relación afirmativa. Una variabilidad que pude notar es
que a diferencia de las demás variables la distancia disminuye mientras las
demás variables aumentan, por lo tanto, en este caso podemos afirmar que la
distancia mantiene una relación negativa frente a las demás variables en el
problema planteado.
Entrada:
require(MASS)
require(ISLR)
require datos=( rock ) View(datos)
dataS<-datos[,c(1:2)] View(dataS)
dataS2<-dataS[c(1:30),] View(dataS2) pairs(dataS2) cor(dataS2)
plot(dataS2)
modrls=lm(area~peri, data = dataS2) names(modrls)
summary(modrls) confint(modrls, level = 0.95)
nuevo_dato<-data.frame(peri=seq(1:20)) View(nuevo_dato)
predict(modrls,nuevo_dato)
predict(object = modrls, newdata = nuevo_dato, interval
="prediction", level=0.95)
plot(dataS2$peri, dataS2$area, xlab=' area', ylab='Perimetro')
abline(modrls)
ic=predict(modrls,nuevo_dato,interval = 'confidence') ic
lines(nuevo_dato$peri, ic[,2], lty = 2, col = 'blue')
lines(nuevo_dato$peri, ic[,3], lty = 2, col = 'blue')
ic
ic<-predict(modrls, nuevo_dato, interval = 'prediction') ic
lines(nuevo_dato$peri, ic[,2], lty = 2, col = 'red')
lines(nuevo_dato$peri, ic[,3], lty = 2, col = 'red')
residuos<-rstandard(modrls)

residuos
valores.ajustados<-fitted(modrls) plot(valores.ajustados,residuos)
qqnorm(residuos)
qqline(residuos
Consola:
require(MASS)
> require(ISLR)
Loading required package: ISLR Warning message:
In library(package, lib.loc = lib.loc, character.only = TRUE,
logical.return = TRUE, : there is no package called ‘ISLR’
> require
function (package, lib.loc = NULL, quietly = FALSE, warn.conflicts,
character.only = FALSE, mask.ok, exclude, include.only,
attach.required = missing(include.only))
{
if (!character.only)
package <- as.character(substitute(package)) loaded <-
paste0("package:", package) %in% search() if (!loaded) {
if (!quietly)
packageStartupMessage(gettextf("Loading required package: %s",
package), domain = NA)
value <- tryCatch(library(package, lib.loc = lib.loc,
character.only = TRUE, logical.return = TRUE, warn.conflicts =
warn.conflicts, quietly = quietly, mask.ok = mask.ok, exclude =
exclude,
include.only = include.only, attach.required = attach.required),
error = function(e) e)
if (inherits(value, "error")) { if (!quietly) {
msg <- conditionMessage(value) cat("Failed with error: ",
sQuote(msg), "\n", file = stderr(), sep = "")
.Internal(printDeferredWarnings())
}
return(invisible(FALSE))
}
if (!value) return(invisible(FALSE))
}
else value <- TRUE invisible(value)
}
<bytecode: 0x00000000087986a8>
<environment: namespace:base> datos=( rock )
View(datos)
dataS<-datos[,c(1:2)] View(dataS)
dataS2<-dataS[c(1:30),] View(dataS2)
pairs(dataS2) cor(dataS2)
area peri
area 1.0000000 0.8400299
peri 0.8400299 1.0000000
plot(dataS2)
modrls=lm(area~peri, data = dataS2) names(modrls)
[1] "coefficients" "residuals" "effects" "rank"
"fitted.values"
[6] "assign" "qr" "df.residual" "xlevels"
"call"
[11] "terms" "model" summary(modrls)

Call:
lm(formula = area ~ peri, data = dataS2)

Residuals:
Min 1Q Median 3Q Max
-2076.59 -911.98 -13.41 630.69 2226.60

Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 2447.8598
746.2523 3.280 0.00278 **
peri 1.6543 0.2019 8.193 6.43e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1168 on 28 degrees of freedom Multiple R-


squared: 0.7057, Adjusted R-squared: 0.6951
F-statistic: 67.12 on 1 and 28 DF, p-value: 6.433e-09

confint(modrls, level = 0.95)


2.5 % 97.5 %
(Intercept) 919.231377 3976.488293
peri 1.240717 2.067949
nuevo_dato<-data.frame(peri=seq(1:20)) View(nuevo_dato)
predict(modrls,nuevo_dato)
1 2 3 4 5 6 7 8 9
2449.514 2451.169 2452.823 2454.477 2456.131 2457.786 2459.440
2461.094 2462.749
10 11 12 13 14 15 16 17 18
2464.403 2466.057 2467.712 2469.366 2471.020 2472.675 2474.329
2475.983 2477.638
19 20
2479.292 2480.946
predict(object = modrls, newdata = nuevo_dato,
+ interval ="prediction", level=0.95) fit lwr upr
1 2449.514 -389.2506 5288.279
2 2451.169 -387.3829 5289.720
3 2452.823 -385.5153 5291.161
4 2454.477 -383.6477 5292.602
5 2456.131 -381.7801 5294.043
6 2457.786 -379.9126 5295.484
7 2459.440 -378.0451 5296.925
8 2461.094 -376.1777 5298.367
9 2462.749 -374.3103 5299.808
10 2464.403 -372.4430 5301.249
11 2466.057 -370.5757 5302.691
12 2467.712 -368.7085 5304.132
13 2469.366 -366.8413 5305.574
14 2471.020 -364.9741 5307.015
15 2472.675 -363.1070 5308.457
16 2474.329 -361.2399 5309.898
17 2475.983 -359.3729 5311.340
18 2477.638 -357.5059 5312.782
19 2479.292 -355.6390 5314.223
20 2480.946 -353.7721 5315.665
plot(dataS2$peri, dataS2$area, xlab=' area', ylab='Perimetro')
abline(modrls)
ic=predict(modrls,nuevo_dato,interval = 'confidence') ic
fit lwr upr
1 2449.514 921.2821 3977.746
2 2451.169 923.3328 3979.004
3 2452.823 925.3835 3980.262
4 2454.477 927.4341 3981.520
5 2456.131 929.4848 3982.778
6 2457.786 931.5354 3984.036
7 2459.440 933.5861 3985.294
8 2461.094 935.6367 3986.552
9 2462.749 937.6874 3987.810
10 2464.403 939.7380 3989.068
11 2466.057 941.7886 3990.326
12 2467.712 943.8392 3991.584
13 2469.366 945.8898 3992.843
14 2471.020 947.9404 3994.101
15 2472.675 949.9909 3995.359
16 2474.329 952.0415 3996.617
17 2475.983 954.0920 3997.875
18 2477.638 956.1426 3999.133
19 2479.292 958.1931 4000.391
20 2480.946 960.2436 4001.649
lines(nuevo_dato$peri, ic[,2], lty = 2, col = 'blue')
lines(nuevo_dato$peri, ic[,3], lty = 2, col = 'blue') ic
fit lwr upr
1 2449.514 921.2821 3977.746
2 2451.169 923.3328 3979.004
3 2452.823 925.3835 3980.262
4 2454.477 927.4341 3981.520
5 2456.131 929.4848 3982.778
6 2457.786 931.5354 3984.036
7 2459.440 933.5861 3985.294
8 2461.094 935.6367 3986.552
9 2462.749 937.6874 3987.810
10 2464.403 939.7380 3989.068
11 2466.057 941.7886 3990.326
12 2467.712 943.8392 3991.584
13 2469.366 945.8898 3992.843
14 2471.020 947.9404 3994.101
15 2472.675 949.9909 3995.359
16 2474.329 952.0415 3996.617
17 2475.983 954.0920 3997.875
18 2477.638 956.1426 3999.133
19 2479.292 958.1931 4000.391
20 2480.946 960.2436 4001.649
ic<-predict(modrls, nuevo_dato, interval = 'prediction') ic
fit lwr upr
1 2449.514 -389.2506 5288.279
2 2451.169 -387.3829 5289.720
3 2452.823 -385.5153 5291.161
4 2454.477 -383.6477 5292.602
5 2456.131 -381.7801 5294.043
6 2457.786 -379.9126 5295.484
7 2459.440 -378.0451 5296.925
8 2461.094 -376.1777 5298.367
9 2462.749 -374.3103 5299.808
10 2464.403 -372.4430 5301.249
11 2466.057 -370.5757 5302.691
12 2467.712 -368.7085 5304.132
13 2469.366 -366.8413 5305.574
14 2471.020 -364.9741 5307.015
15 2472.675 -363.1070 5308.457
16 2474.329 -361.2399 5309.898
17 2475.983 -359.3729 5311.340
18 2477.638 -357.5059 5312.782
19 2479.292 -355.6390 5314.223
20 2480.946 -353.7721 5315.665
> lines(nuevo_dato$peri, ic[,2], lty = 2, col = 'red')
> lines(nuevo_dato$peri, ic[,3], lty = 2, col = 'red')
> residuos<-rstandard(modrls)
> residuos
1 2 3 4 5 6
-1.824407437 -1.645208752 -1.215540854 -1.305891230 -0.905482756 -
0.963850356
7 8 9 10 11 12
-0.267591852 -1.254917456 -0.127344372 -1.003752173 -0.437393074 -
0.365521814
13 14 15 16 17 18
1.333476829 0.522652195 0.308294516 0.367951162 0.789001376
0.334558515
19 20 21 22 23 24
1.238486350 0.007686981 -0.245757913 1.959167025 1.772392987 -
0.030943054
25 26 27 28 29 30
0.580531046 -0.505426862 1.634069939 0.162616391 0.910867030
0.377471161
valores.ajustados<-fitted(modrls) plot(valores.ajustados,residuos)

qqnorm(residuos)

qqline(residuos)

>

>
Gráficos correspondientes al problema anterior (RLS):
Conclusiones (RLS):

Desde mi punto de vista en esta regresión voy a analizar el área vs el perímetro


para determinar qué tanta relación hay entre ellas.
La relación entre la variable price y sqft_living es una relación afirmativa ya que
cuando una crece la otra aumenta. Esto también se puede notar ya que en la
gráfica todos los puntos se encuentran cerca de la línea lo que representa esta
como un modelo o problema afirmativo y lineal., lo cual es lo indicado, ya que es
lo que se busca al realizar este tipo de regresiones.
La variable independiente afecta significativamente la variable dependiente. La
variable independiente siempre se va a comportar entre 168.0938 y 302.7839 es
decir hay un 95% de confianza de que los resultados de la variable independiente
se van a encontrar entre ese rango.
En el grafico hay una correlación buena ya que en el grafico me da valores muy
cercanos a mi base de datos inicial, esto confirma aun mas la validez de los datos
encontrados en el problema anterior.

También podría gustarte