Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REGRESIÓN LINEAL
SEMANA 14
SESIÓN 27-28
RESULTADO DE APRENDIZAJE DE LA SESIÓN
• ¿Qué es estimación?
✓ DIAGRAMA DE DISPERSIÓN
✓ COEFICIENTE DE CORRELACIÓN.
✓ REGRESIÓN LINEAL
✓ SUPUESTOS DE LA REGRESIÓN
LINEAL
✓ COEFICIENTE DE DETERMINACIÓN
INTRODUCCIÓN
En las clases anteriores se analizaban en forma descriptiva una sola
variable (análisis univariado), pero sin embargo es posible analizar al
mismo tiempo dos variables, ya sean estas cuantitativa o cualitativas y sirve
para determinar:
- Si dos variables tiene relación entre si.
- Si la relación entre ellas es fuerte, moderada o débil.
- Que dirección tiene la relación.
- Un pronóstico
Supuestos:
• Tanto X como Y son variables continuas aleatorias. Es decir, tanto Y como X
deben de variar libremente.
• La unidad de análisis es un par ordenado: ( Xi ; Yi )
• La distribución conjunta de los datos es normal. Esto recibe el nombre de
distribución normal bivariado.
https://bit.ly/3IUblfl
CORRELACIÓN
El coeficiente de correlación poblacional se obtiene:
𝜎𝑥𝑦
𝜌= donde − 1 ≤ 𝜌 ≤ 1
𝜎𝑥 𝜎𝑦
CORRELACIÓN
Para tener una idea cuando dos variables cuantitativas están correlacionadas, se
hace mediante el DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS, que
consiste en graficar los datos (pares ordenados) en un plano cartesiano.
110
1; 110 Comentario:
Coeficiente de inteligencia
2; 105
3; 100 4; 101
Del gráfico se aprecia que hay
100
5; 98
6; 97 una correlación inversa de las
90 variables en estudio con
7; 86
80
8; 84
tendencia lineal.
70 9; 70
10; 60
60
0 1 2 3 4 5 6 7 8 9 10 11
Numero de hijos en la familia
CORRELACIÓN
Procesamiento y análisis de los datos
Para obtener el coeficiente de correlación
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌
estimado, primero se realiza los siguientes 𝑟=
cálculos preliminares: 𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
COEFICIENTE DE
NUMERO DE
INTELIGENCIA
HIJOS EN
LA FAMILIA
PROMEDIO DE LOS
X² Y² X*Y 10 4690 − 55 920
X
HIJOS 𝑟=
Y 10 385 − 55 2 10 86452 − 920 2
1 110 1 12100 110
2 105 4 11025 210
3 100 9 10000 300 𝑟 = −0.957
4 101 16 10201 404
5 98 25 9604 490
6 97 36 9409 582 Interpretación:
7 86 49 7396 602 Existe una correlación lineal inversa intensa
8 84 64 7056 672 entre el número de hijos en la familia y el
9 70 81 4900 630 coeficiente de inteligencia promedio de los
10 69 100 4761 690 hijos; es decir; a medida que aumenta el
55 920 385 86452 4690 número de hijos entonces el coeficiente de
inteligencia promedio disminuye.
ΣX ΣY ΣX² ΣY² ΣX*Y
REGRESIÓN LINEAL
SIMPLE
REGRESIÓN LINEAL SIMPLE
Es la relación funcional probable entre dos variables uno conocida como variable
dependiente “Y” y la otra como independiente “X”
El modelo de regresión lineal simple POBLACIONAL está dado por:
OBJETIVOS:
➢ Establecer una relación funcional entre dos o más variables relacionadas.
➢ PREDECIR y/o EXPLICAR el valor de una variable (v. Dependiente), dado el
valor de otra(s) variable(s) relacionada(s) (v. Independiente(s)).
REGRESIÓN LINEAL SIMPLE
SUPUESTOS
➢ Normalidad: Para cada valor de X hay
una sub población de valores de Y.
Cada una de ellas deben estar
normalmente distribuidas.
➢ Homocedasticidad: Las varianzas de
las subpoblaciones deben ser iguales a
σ2 Y/X.
➢ Independencia de error: Los valores de
Y son estadísticamente independientes;
es decir, los valores de Y dependen de
un valor de X. No dependen de los
valores de Y para otro valor de X.
➢ Linealidad: Los promedios de las
subpoblaciones de Y están sobre una
línea recta.
REGRESIÓN LINEAL SIMPLE
ESTIMACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE
Para resolver el problema tenemos que AJUSTAR una línea entre los puntos observados,
a fin de usarla para predecir el valor de Y (variable dependiente) a partir de un valor
conocido de X (variable independiente).
σ𝑌 σ𝑋
𝑎= −𝑏 es decir 𝑎 = 𝑦ത − 𝑏𝑥ҧ
𝑛 𝑛
Sin embargo, aún con la ecuación, como todos los puntos no están exactamente
sobre una línea recta, se cometen errores en el ajuste.
REGRESIÓN LINEAL SIMPLE
Por tanto el MODELO ESTIMADO es:
𝑦ො = 116.67 - 4.48x
2) Interprete el coeficiente de regresión.
b: -4.48
Al aumentar el número de hijos en uno el coeficiente de inteligencia disminuye en
promedio en 4.48.
.- Si b>0; indica que por cada unidad que se incremente en X, Y aumenta en promedio
en b unidades.
𝟏𝟎 𝟒𝟔𝟗𝟎 −(𝟓𝟓)(𝟗𝟐𝟎)
𝒓= = - 0.9570
𝟏𝟎∗𝟑𝟖𝟓−𝟓𝟓𝟐 [𝟏𝟎∗𝟖𝟔𝟒𝟓𝟐−𝟗𝟐𝟎𝟐 ]
𝑦=
ො 116.67 - 4.48x
Diagrama de dispersión
14
12 Interpretación: del
grafico se aprecia que
Y: producción
10
8 hay una correlación
6 directa de las variables
4 en estudio con
2 tendencia lineal.
0
0 2 4 6 8 10 12
X: horas de trabajo
b) Calcule el coeficiente de correlación e interprete. Obs. 𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌 1 10 11 100 121 110
𝑟= 2 7 10 49 100 70
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
3 10 12 100 144 120
4 5 6 25 36 30
Remplazando en la formula. 5 8 10 64 100 80
10 789 − 80 96 6 8 7 64 49 56
𝑟=
10 668 − 80 2 10 952 − 96 2 7 6 9 36 81 54
8 7 10 49 100 70
9 9 11 81 121 99
𝑟 = 0.7198
10 10 10 100 100 100
Σ 80 96 668 952 789
Interpretación: Existe una correlación lineal positiva
alta, es decir al aumentar horas de trabajo aumenta X: horas de trabajo
la producción. Y: producción
c) Estime la ecuación de regresión lineal simple.
𝑦ො = 𝑎 + 𝑏𝑥
Donde,
σ𝑋 σ𝑌 80 96
σ 𝑋𝑌 − 789 −
𝑏= 𝑛 = 10
σ 𝑋 2 80 2 = 0.75
σ 𝑋2 − 668 −
𝑛 10
96 80
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 0.75 = 3.6
10 10
Temperatura 10 28 12 31 30 19 24 15 https://bit.ly/35IdjRt
Pedidos 21 65 19 72 75 36 67 24
Diagrama de dispersión
80
70 Interpretación: del
60 grafico se aprecia que
hay una correlación
Y: pedidos
50
40 directa de las variables
30 en estudio con
tendencia lineal.
20
10
0
0 10 20 30 40
X: temperatura
b) Calcule el coeficiente de correlación lineal.
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌
Obs. 𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
𝑟= 1 10 21 100 441 210
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
2 28 65 784 4225 1820
3 12 19 144 361 228
Remplazando en la formula.
4 31 72 961 5184 2232
8 9392 − 169 379
𝑟= 5 30 75 900 5625 2250
8 4051 − 1692 8 22197 − 3792 6 19 36 361 1296 684
7 24 67 576 4489 1608
𝑟 = 0.9702 8 15 24 225 576 360
Σ 169 379 4051 22197 9392
Interpretación: Existe una correlación lineal
X: temperatura
positiva alta, es decir al aumentar temperatura Y: pedidos
aumenta los pedidos.
c) Halle la ecuación de regresión lineal.
𝑦ො = 𝑎 + 𝑏𝑥
Donde,
σ𝑋 σ𝑌 169 379
σ 𝑋𝑌 − 9392 −
𝑏= 𝑛 = 8 = 2.88
σ 𝑋 2 169 2
σ 𝑋2 − 4051 −
𝑛 8
379 169
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 2.88 = −13.47
8 8
Edad (años) 12 8 10 11 7 7 10 14
Peso (Kg) 56 42 51 54 40 39 49 58
389 79
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 2.93 = 19.69
8 8
81.9 13.5
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 1.43 = 6.96
9 9
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.82700064
Coeficiente de determinación R^2 0.68393006
R^2 ajustado 0.65232306
Error típico 0.30805844
https://shutr.bz/3tIjQDW
Observaciones 12
Coeficiente de determinación
Coeficiente de correlación
y = 1.45 + 0.074x
1.- Estime la ecuación de regresión lineal simple
y = 1.45 + 0.074x
2.- Interprete el coeficiente de regresión.
b: 0.074
.- Si b>0: Indica que por cada unidad que se incremente en X, Y aumenta en promedio en
b unidades.
.- Si b<0: Indica que por cada unidad que se incremente en X, Y disminuye en promedio
en b unidades.
3.- Determine el coeficiente de correlación y el coeficiente de
determinación(la bondad de ajuste del modelo). Interprete.
r:0.8270
Existe un correlación lineal positiva alta es decir al aumentar el
número de pies del espacio estante aumenta las ventas semanales en
cientos de dólares.
R2 = r²*100%=(0.8270)2 ∗ 100%=68.39%
Interpretación: El 68.39% de la variabilidad total de los valores de las ventas
semanales esta siendo explicada por la regresión lineal.
Nos indica que porcentaje de la variabilidad total de los valores de Y está siendo explicada
por la regresión lineal simple (modelo).
4) Estime las ventas semanales para un espacio de 22 pies.
Interprete.
y = 1.45 + 0.074x