Documentos de Académico
Documentos de Profesional
Documentos de Cultura
U6 - Regresión y Correlación
U6 - Regresión y Correlación
Unidad:
Regresión y Correlación
Importancia
En la Investigación social, el análisis de regresión se utiliza para
predecir un amplio rango de fenómenos, desde medidas
económicas hasta diferentes aspectos del comportamiento
humano, así mismo en el ámbito de investigación de mercados,
predecir el número de ventas de un producto y observar que
variables tienen mas correlación con la satisfacción de dichos
productos
Contenido general
• Regresión lineal
• Correlación
Regresión lineal
Regresión
Regresión Lineal
Representación
𝑌 = 𝑓(𝑥)
y
Presión Compresión 4
(N) (Cm)
X Y
3
1 1
2 1 2
3 2
1
4 2
5 4
0 1 2 3 4 X
Un tipo de modelo probabilístico, el modelo de regresión lineal simple, supone que el valor medio de Y para un
valor dado de X se grafica como una línea recta y que los puntos se desvían de esta línea de medias en una
cantidad aleatoria (positiva o negativa) igual a , es decir:
y 0 1 x
Valor medio de y Error
para una x dada aleatorio
y 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
4 )
Y ˆ0 ˆ1 x E() = 0
3
Modelo de regresión lineal simple estimado
2 𝑦 = 𝛽0 + 𝛽1 𝑥
ˆ1 pendiente
Donde: y = variable dependiente
1
x = variable independiente
0
1 2 3 4 X Cálculo de coeficientes
𝑿 𝒀−𝒏 𝑿𝒀
𝜷𝟏 =
ˆ0 ordenada al origen Paso1:
𝑿 2−𝒏 𝑿2
𝒀 − 𝜷𝟏 𝑿
Paso2: 𝜷𝟎 =
𝒏
Correlación
Correlación
Coeficiente de Correlación
El coeficiente de correlación de Pearson(r), pensado para variables cuantitativas, es un índice que mide el grado
de covariación entre distintas variables relacionadas linealmente. Esto significa que puede haber variables
fuertemente relacionadas, pero no de forma lineal.
Relación
𝒏 𝑿𝒀 − 𝑿 𝒀 inversa
𝒓= Relación
perfecta directa casi
2 2 Variables
𝒏 𝑿2 −( 𝑿) . 𝒏 𝒀2 −( 𝒀) incorrelada perfecta
s
-1 0 +1
Rango de valores r
r = -1 Si –1< r < -0.8 Correlación Inversa intensa
Correlación inversa perfecta Si –0.2 < r < 0 Correlación Inversa débil
Si 0 < r < 0.2 Correlación Directa débil
r= 1
Correlación directa perfecta Si 0.8 < r < 1 Correlación Directa intensa
Correlación
Regresión Lineal simple: Interpretación de coeficientes
ŷ 0 1 x
El coeficiente de regresión: es el cambio (aumento o
disminución) en promedio en Y cuando X varía en una
unidad.
Supuesto de Linealidad
Existe linealidad si se presenta una relación significativa entre la variable que se quiere predecir y las otras
variables. Puede usarse el coeficiente "R cuadrado ajustado", para saber si existe linealidad (mayor o igual a 0.7
suele ser "indicio" de linealidad)
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlación
Coeficiente de Correlación
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlación
Coeficiente de Determinación
0 ≤ 𝑅2 ≤ 1
Descomposición de la variabilidad de Y:
2 2 2
(𝑌 − 𝑌) (𝑌 − 𝑌) (𝑌 − 𝑌)
= +
Propina(S/) 1 3 3 2 6 1 2 3 4
Tiempo de Atención
3 2 2 4 1 4 3 2 2
(minutos)
a) Identifique las variables de Interés y clasifique cada uno de ellos ¿Cómo se relacionan ambas variables?
b) Estime el modelo de Regresión lineal estimada e interprete los coeficientes
c) Halle e interprete el coeficiente de Correlación y coeficiente de determinación
d) Pronosticar: ¿Cuánto en Promedio recibirá de propina un mozo que se ha demorado en atender 3.5 minutos?
Regresión y correlación
Solución a.
𝑦 = 𝛽0 + 𝛽1 𝑥 Paso1:
𝑿 𝒀−𝒏 𝑿𝒀
Y (propina) X (tiempo) 𝑋2 𝑌2 𝑋𝑌 𝜷𝟏 =
𝑿 2−𝒏 𝑿2
1 3 9 1 3
3 2 4 9 6 23 ∗ 25 − 9 ∗ 53
𝜷𝟏 = = −1.324
3 2 4 9 6 232 − 9 ∗ 67
2 4 16 4 8 Paso2:
6 1 1 36 6
1 4 16 1 4 𝒀 − 𝜷𝟏 𝑿 𝟐𝟓 − −𝟏, 𝟑𝟐𝟒 ∗ 𝟐𝟑
𝜷𝟎 = =
2 3 9 4 6 𝒏 𝟗
3 2 4 9 6
𝜷𝟎 = 𝟔. 𝟏𝟔𝟏𝟑
4 2 4 16 8
⌢
𝑌 = 25 𝑋 =23 𝑋 2 =67 𝑌 2 =89 𝑋𝑌 =53 Pr𝑜𝑝 𝑖𝑛𝑎 = 6.1613 − 1.324𝑇𝑖𝑒𝑚𝑝𝑜
Modelo de Regresión Estimada
Interpretación de coeficiente
𝛽1 = −1.324: Por cada minutos adicional del atención la propina disminuye en promedio 1.324 soles.
Regresión y correlación
Solución C: Coeficiente de correlación(r)
𝐘 = 𝟐𝟓 𝐗 =23 𝐗 𝟐 =67 𝐘 𝟐 =89 𝐗𝐘 =53
𝒏 𝑿𝒀 − 𝑿 𝒀
𝒓=
2 2
𝒏 𝑿2 −( 𝑿) . 𝒏 𝒀2 −( 𝒀)
9 53 − 23 25
r= = −0.8587
9 67 − 232 . 9 89 − 252
r = −0.8587
𝑅2 = 𝑟 2
𝑅2 = 73.74%
Propina
2 4
6 1 3
1 4
2 3 2
3 2
4 2 1
0
0 1 2 3 4 5
Tiempo
⌢
Pr𝑜𝑝 𝑖𝑛𝑎 = 6.16 − 1.324𝑇𝑖𝑒𝑚𝑝𝑜
Conclusiones
1. Regresión lineal
2. Correlación