Está en la página 1de 7

Precio=c(250,130,165,310,320,400,200,80,69,179,120,223,300,198,165,69,73,123,356,183)

Superficie=c(120,80,100,180,190,250,99,90,60,100,110,120,180,130,90,50,60,70,120,130)

Antiguedad=c(15,20,30,15,12,40,30,27,14,20,22,25,21,33,5,12,6,10,28,30)

#a) Crear un data frame de nombre pisos que almacene los datos del ejercicio propuesto

datos1 <- data.frame(Precio,Superficie,Antiguedad)

##b) Dibujar el diagrama de dispersión de las variables precio y superficie

## y determinar si puede existir una cierta relación lineal entre ambas

plot(datos1$Precio, datos1$Superficie, col= "red")


## En esta grafica se podria decir que si exsite una relacion lineal entre ambas

# variables pero deberia confirmarse mediante metodos analiticos.

#c) ¿Cuál es la recta de regresión lineal simple que considera a precio como variable

#dependiente y a la superficie como variable independiente? Interpreta los parámetros

#de esa recta

modelo1=lm(Precio ~ Superficie, data = datos1)

modelo1

summary(modelo1)
# En la grafica se muestra una regresion lineal simple en donde los valores de

## intercept son -7.813 es el Precio para un piso que tenga 0 de superficie

# cual no tiene logica, pero para superficie por cada m2 de incremento

# de la superficie aumenta el precio en 1.747 dolares.

#distribucion de los residuos

qqnorm(modelo1$residuals)

qqline(modelo1$residuals)

## d) ¿Son significativos estos parámetros? ¿Qué puede decirse del ajuste del

## Modelo a los datos?


## P valor es aceptable ya que es menor al 0.05 pvalor= 2.399e-07

## La Adjusted R-squared: 0.7688 es aceptable ya que es superior a 0.5

##e) ¿Cuál es la correlación lineal de Pearson entre ambas variables? ¿Es significativa?

cor.test(Precio, Superficie, data= datos1,method = c("pearson"))

## grafico de corelación

library(corrplot)

corrplot(cor(dplyr::select(datos1,Precio,Superficie)),

method = "number", tl.col = "black")

# Esta grafica muestra la correlación de los datos en donde se muestra el nivel


# de intensidad de menos azul a mas azul de igual manera de menos rojo a mas rojo

# indicando el nivel de corelación alta de 0.88 llegando a 1

#f) ¿Cuál es la recta de regresión lineal si se considera también

#como variable independiente la antigüedad?

modelo2=lm(Precio ~ Antiguedad, data = datos1 )

modelo2

## La recta de regresion se encuentra en Precio= 110.423 + 4.107 Antiguedad

##g) Ajustar un modelo de regresión lineal múltiple. Obtener una

##estimación de los parámetros del modelo y su interpretación

modelo3=lm(Precio ~ Superficie + Antiguedad, data = datos1 )

modelo3
# La recta de regresion se encuentra en Precio= -6.82133 + 1.75516 Superficie

## -0.09239 Antiguedad

##h) Contrastar la significación del modelo propuesto

summary(modelo3)

# El unico valor significativo del modelo propuesto es el de superficie con un

#Pvalor menor al 0.05% pvalor=2.25e-06


##i) ¿Puede eliminarse alguna variable del modelo? Razona la respuesta

# Si se debería eliminar la variable con el pvalor mayor en este caso Antigüedad

# Con un pvalor de 0.945.

step(object = modelo3,direction = "both",trace = 1)

##j) Coeficiente de determinación y de determinación corregido. Interpretación

## El coeficiente de determinación es de 0.781 y de determinación corregido es de 0.7553

## en donde podemos notar que no hay un suficiente variabilidad de entre estos coeficientes

## podemos decir que el 78,11% de la variación en el precio de los pisos se explican

## en este modelo propuesto.

También podría gustarte