Está en la página 1de 5

REGRESION LINEAL Y MULTIPLE

 Regresión: es un modelo que permite estudiar la relación funcional entre dos o mas
variables cuantitativas a través de la ecuación matemática
 Tipos de regresión
o Lineal: si la variable respuesta (Variable dependiente Y) es explicada mediante una
línea resta gracias una variable independiente (X1)
o Múltiple: si la variable respuesta (Variable dependiente Y) es explicada por do o más
variables independientes (X1, X2,X3…)
Modelo
Valor esperado Error
Y = B0 + B1X1 + B2X2 + B3X3 + … + E
 El modelo tiene tres parámetros:
o B0  intercepto
o B1 coeficiente de regresión o pendiente
o Б2 error
 X es la variable independiente /explicativa / regresiva
 Y es la variable dependiente / salida / respuesta
o Es única

 Objetivo: estimar los coeficientes de regresión B0, B1 y la varianza del error para un
conjunto de datos (x, y)
 Correlación NO implica causalidad
 Interpretación del coeficiente de Regresión B: Mide el cambio promedio que se producirá
en la variable dependiente y por un cambio unitario en la variable X
 Se utilizan variables métricas y puede ser que utilices variables nominales
 DAM tranformacion de variable nominal a una metrica

Planteamiento de hipótesis
 Hipótesis nula (Ho):
o B1 = 0 Pendiente es 0
o No existe relación entre X y Y
o Modelo no valido o no significativo
 Hipótesis alterna (Ha)
o B1 ≠ 0
o Existe relación entre X y Y
o Modelo valido o significativo
Pasos R
1. Cargo las librerías
o Library (car)
2. Importo los datos
3. Identifico mis variable dependiente e independiente
o INDEP= Nombre archivo$ variable
o DEPEN= Nombre archivo$ variable
o model1= Im (Variable DEPEN ~ Variable Independiente 1 + variable independiente
2, data = nombre del Archivo Excel)
o summary (model1)
o Para crear dummies:
 Attach(nombre del archivo Excel)
 D1- (Encabezado columna 1 ==1); D2- (Encabezado columna 2 ==2); D1-
(Encabezado columna 3 ==3)
o Para crear variables interacción:
 Encabezado 1: Encabezado 2
4. Para sacar la multicolinealidad
o vif(model1)  hay presencia de multicolinealidad si es mayor a 4
5. Regresión hacia atrás o metodo “Backward”
o model1_Backward=step (object=model1, direction =*backward*, trace=1)
o summary (model1_Backward)
6. Para pronosticar
o Estimado= c(dato1, dato2, dato3, dato4, …)
o CoefModel1= model1$coefficients
o Estimado%*%CoefModel1
7. Para graficar
o Inicio
 Library (ggplot2)
 ggplot(Nombre del archivo Excel , aes(x=encabezado de la variable
independiente, y=encabezado de la variable dependiente))+ geom_point() +
theme_bw() + ylab (“nombre eje y”)+ xlab(“nombre del eje x”)
o Regresión estimada
 ggplot( model1, aes (x=encabezado de variable independiente, y= encabezado
de la variable dependiente))+ geom_point() + geom_smooth(method=lm.se=F)
+ theme_bw()
Resultados e interpretaciones en R

 R2:
o Muestra que tenemos un ajuste (exacto, bueno, regular, malo)
 Bueno cercano a 1
 Malo cercano a 0
o El X% de la variabilidad en Y es explicada por la variación conjunta de las X variables
 R2 ajustado:
o Lo usamos para comparar los modelos
o Notamos que el primer modelo (modelo basado en …) nos brinda un mejor/peor
pronóstico que el segundo (R2ajus1> o <Reajust2) porque está más cercano/lejano a
uno
 Comparar modelos, se utiliza el R2 ajustado
 Se utiliza R2 o R2 ajustado, el mejor modelo será entonces el que tenga mayor R2 ajustado
 P-valor global (Prueba F) no puede especificar cual variable es la significativa
o Si hay variable significativa, se debe analizar el P-valor individual o prueba T
o Si p-valor < Alpha
 Como mi p valor es menor a mí Alfa, rechazamos la hipótesis nula, lo que
significa que al menos un B es diferente de cero, o sea, al menos 1 de las
variables es significativa. entonces existe regresión
o Si p-valor > Alpha
 comunidad valores mayor el Alfa rechazamos la hipótesis alterna, lo que
significa que todos mis coeficientes B son iguales a cero o sea no existen
variables explicativa significantes para este modelo, entonces no existe
regresión.
 P-valor individual (Prueba T)
o Si p-valor < Alpha
o Nos fijamos en los que tengan un p-valor < Alpha pues serán los que expliquen
o Podemos mencionar que las variables ___,_____,___ son significativas para este
modelo es decir explican el comportamiento de Y
 Coeficientes (estimate)
o Si p-valor < Alpha
o Al aumentar en uno (variables independientes), la (variable dependiente) se
incrementa si es positivo o decrece si es negativo en B

 Variables Dummy
o Se utilizan cuando identificamos variables cualitativas.
o Toman solo 2 valores (1 o 0) que nos indican la ausencia o presencia de alguna
categoría
o Mayor a 4: se presenta multicolinealidad en la variable ____ y ____
o Si piden explicar porque sucede esto podemos inferir que sucede esto porque ….

Resultados e Interpretaciones en SPSS

También podría gustarte