Está en la página 1de 64

CORRELACIÓN Y

REGRESIÓN LINEAL

SEMANA 14
SESIÓN 27-28
RESULTADO DE APRENDIZAJE DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta la


relación de variables cuantitativas usando la fórmula
correcta y apreciando su importancia en
la investigación.
Relación de Variables Cuantitativas
REFLEXIÓN DESDE LA EXPERIENCIA
COEFICIENTE DE
Interés: Determinar la correlación entre el número de hijos NUMERO DE
HIJOS EN
INTELIGENCIA
en la familia y el coeficiente de inteligencia promedio de LA FAMILIA
PROMEDIO DE LOS
HIJOS
los hijos. Mediante un estudio transversal se obtuvo los X Y
siguientes resultados:
1 110
Estime el coeficiente de inteligencia 2 105
promedio que se espera obtener para una 3 100
familia de 11 hijos. 4 101
5 98
6 97
7 86
8 84
9 70
10 69
55 920 3
REFLEXIÓN DESDE LA EXPERIENCIA

Responde en el Padlet las siguientes


preguntas

• ¿Qué es estimación?

• ¿Qué es un modelo matemático?


Temas :

✓ DIAGRAMA DE DISPERSIÓN
✓ COEFICIENTE DE CORRELACIÓN.
✓ REGRESIÓN LINEAL
✓ SUPUESTOS DE LA REGRESIÓN
LINEAL
✓ COEFICIENTE DE DETERMINACIÓN
INTRODUCCIÓN
En las clases anteriores se analizaban en forma descriptiva una sola
variable (análisis univariado), pero sin embargo es posible analizar al
mismo tiempo dos variables, ya sean estas cuantitativa o cualitativas y sirve
para determinar:
- Si dos variables tiene relación entre si.
- Si la relación entre ellas es fuerte, moderada o débil.
- Que dirección tiene la relación.
- Un pronóstico

Para ello existen técnicas estadísticas para realizar el análisis bivariado,


siendo algunas de ellas el análisis de correlación y regresión.
CORRELACIÓN
CORRELACIÓN

➢ Mide la intensidad de la relación lineal que puede existir entre dos


variables, su grado de relación y su sentido.

➢ Para medir que tan intensa es la relación lineal se utiliza el


coeficiente de correlación de Pearson denotado por  (rho).

➢ El termino “correlación” significa relación mutua, ya que indica el


grado en el que los valores de una variable se relacionan con los
valores de otra.
CORRELACIÓN

Supuestos:
• Tanto X como Y son variables continuas aleatorias. Es decir, tanto Y como X
deben de variar libremente.
• La unidad de análisis es un par ordenado: ( Xi ; Yi )
• La distribución conjunta de los datos es normal. Esto recibe el nombre de
distribución normal bivariado.

https://bit.ly/3IUblfl
CORRELACIÓN
El coeficiente de correlación poblacional se obtiene:
𝜎𝑥𝑦
𝜌= donde − 1 ≤ 𝜌 ≤ 1
𝜎𝑥 𝜎𝑦
CORRELACIÓN
Para tener una idea cuando dos variables cuantitativas están correlacionadas, se
hace mediante el DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS, que
consiste en graficar los datos (pares ordenados) en un plano cartesiano.

No hay correlación Hay correlación Correlación lineal Correlación lineal


𝑟~0 no lineal positivo negativo
𝑟~0 𝑟~ + 1 𝑟~ − 1
CORRELACIÓN
Para estimar el coeficiente de correlación poblacional 𝜌 se recurre a
una muestra aleatoria de tamaño 𝑛: 𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 , ⋯, 𝑥𝑛 , 𝑦𝑛 .
Siendo el coeficiente de correlación estimado o muestral 𝑟.
Su valor se obtiene con la formula:

𝑛 σ𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − σ𝑛𝑖=1 𝑥𝑖 σ𝑛𝑖=1 𝑦𝑖


𝑟=
2 2
𝑛 σ𝑛𝑖=𝑖 𝑥𝑖2 − 𝑛
σ𝑖=𝑖 𝑥𝑖 𝑛 σ𝑛𝑖=𝑖 𝑦𝑖2 − 𝑛
σ𝑖=𝑖 𝑦𝑖

O de forma simplifica, se tiene:


𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌
𝑟=
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
CORRELACIÓN
Interés: Determinar la correlación entre el número de hijos en la NUMERO DE
COEFICIENTE DE
INTELIGENCIA
HIJOS EN
familia y el coeficiente de inteligencia promedio de los hijos. LA FAMILIA
PROMEDIO DE LOS
HIJOS X
Mediante un estudio transversal se obtuvo los siguientes X Y
resultados: 1 110
2 105
3 100
4 101
5 98
6 97
Comentario:
7 86
En el cuadro se aprecia que hay
8 84
una correlación inversa de las 9 70
variables en estudio. 10 69 1
55 920 3
ΣX ΣY Σ
CORRELACIÓN
Procesamiento y análisis de los datos del estudio:
Para tener una idea empírica de la tendencia de los datos de las variables en
estudio, se elabora el gráfico de diagrama de puntos.

FAMILIAS SEGUN NUMERO DE HIJOS Y COEFICIENTE


120
DE INTELIGENCIA PROMEDIO

110
1; 110 Comentario:
Coeficiente de inteligencia

2; 105
3; 100 4; 101
Del gráfico se aprecia que hay
100
5; 98
6; 97 una correlación inversa de las
90 variables en estudio con
7; 86
80
8; 84
tendencia lineal.
70 9; 70

10; 60
60
0 1 2 3 4 5 6 7 8 9 10 11
Numero de hijos en la familia
CORRELACIÓN
Procesamiento y análisis de los datos
Para obtener el coeficiente de correlación
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌
estimado, primero se realiza los siguientes 𝑟=
cálculos preliminares: 𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2

COEFICIENTE DE
NUMERO DE
INTELIGENCIA
HIJOS EN
LA FAMILIA
PROMEDIO DE LOS
X² Y² X*Y 10 4690 − 55 920
X
HIJOS 𝑟=
Y 10 385 − 55 2 10 86452 − 920 2
1 110 1 12100 110
2 105 4 11025 210
3 100 9 10000 300 𝑟 = −0.957
4 101 16 10201 404
5 98 25 9604 490
6 97 36 9409 582 Interpretación:
7 86 49 7396 602 Existe una correlación lineal inversa intensa
8 84 64 7056 672 entre el número de hijos en la familia y el
9 70 81 4900 630 coeficiente de inteligencia promedio de los
10 69 100 4761 690 hijos; es decir; a medida que aumenta el
55 920 385 86452 4690 número de hijos entonces el coeficiente de
inteligencia promedio disminuye.
ΣX ΣY ΣX² ΣY² ΣX*Y
REGRESIÓN LINEAL
SIMPLE
REGRESIÓN LINEAL SIMPLE

Es la relación funcional probable entre dos variables uno conocida como variable
dependiente “Y” y la otra como independiente “X”
El modelo de regresión lineal simple POBLACIONAL está dado por:

Y = α + β*X + e Error aleatorio con


Variable media 0 y varianza
dependiente ²y/x.
Coeficiente Coeficiente de Variable
debido al regresión independiente
intercepto

OBJETIVOS:
➢ Establecer una relación funcional entre dos o más variables relacionadas.
➢ PREDECIR y/o EXPLICAR el valor de una variable (v. Dependiente), dado el
valor de otra(s) variable(s) relacionada(s) (v. Independiente(s)).
REGRESIÓN LINEAL SIMPLE
SUPUESTOS
➢ Normalidad: Para cada valor de X hay
una sub población de valores de Y.
Cada una de ellas deben estar
normalmente distribuidas.
➢ Homocedasticidad: Las varianzas de
las subpoblaciones deben ser iguales a
σ2 Y/X.
➢ Independencia de error: Los valores de
Y son estadísticamente independientes;
es decir, los valores de Y dependen de
un valor de X. No dependen de los
valores de Y para otro valor de X.
➢ Linealidad: Los promedios de las
subpoblaciones de Y están sobre una
línea recta.
REGRESIÓN LINEAL SIMPLE
ESTIMACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE
Para resolver el problema tenemos que AJUSTAR una línea entre los puntos observados,
a fin de usarla para predecir el valor de Y (variable dependiente) a partir de un valor
conocido de X (variable independiente).

Aplicando el método de mínimos cuadrados se obtuvieron las constantes 𝑎 y 𝑏.


El primer paso para determinar la ecuación es hallar b con la fórmula:
σ𝑋 σ𝑌
σ 𝑋𝑌 −
𝑏= 𝑛
2 σ𝑋 2
σ𝑋 −
𝑛
Conociendo 𝑏 es posible hallar el valor de 𝑎 con la ecuación:

σ𝑌 σ𝑋
𝑎= −𝑏 es decir 𝑎 = 𝑦ത − 𝑏𝑥ҧ
𝑛 𝑛

Sin embargo, aún con la ecuación, como todos los puntos no están exactamente
sobre una línea recta, se cometen errores en el ajuste.
REGRESIÓN LINEAL SIMPLE
Por tanto el MODELO ESTIMADO es:

INTERPRETACIÓN DEL COEFICIENTE DE REGRESION “b”

.- Si b>0; indica que por cada unidad que se incremente en X, Y aumenta


en promedio en b unidades.

.- Si b<0; indica que por cada unidad que se incremente en X, Y


disminuye en promedio en b unidades.
REGRESIÓN LINEAL SIMPLE
COEFICIENTE DETERMINACION «R2»
Para medir el ajuste de los puntos a la recta utilizamos el coeficiente de
determinación.

R2 = r²*100% ; 0%≤ R2 ≤100%

Nos indica que porcentaje de la variabilidad total de los valores


de Y está siendo explicada por la regresión lineal simple
(modelo).
REGRESIÓN LINEAL SIMPLE
Retomando el CASO 01:
COEFICIENTE DE
NUMERO DE
INTELIGENCIA
HIJOS EN
PROMEDIO DE LOS 1.- Estime la ecuación de regresión lineal
LA FAMILIA
HIJOS X² Y² X*Y simple
X Y
1 110 1 12100 110
2.- Interprete el coeficiente de regresión.
2 105 4 11025 210
3 100 9 10000 300
3.- Determine la bondad de ajuste del modelo.
4 101 16 10201 404
Interprete.
5 98 25 9604 490
6 97 36 9409 582
4.- Estime el coeficiente de inteligencia
7 86 49 7396 602
promedio para una familia de 11 hijos.
8 84 64 7056 672
Interprete.
9 70 81 4900 630
10 69 100 4761 690
55 920 385 86452 4690
ΣX ΣY ΣX² ΣY² ΣX*Y
COEFICIENTE DE
NUMERO DE
INTELIGENCIA
HIJOS EN
PROMEDIO DE LOS
LA FAMILIA
HIJOS X² Y² X*Y
X Y
1)Estime la ecuación de regresión lineal simple
1 110 1 12100 110
2 105 4 11025 210
3 100 9 10000 300
4 101 16 10201 404
5 98 25 9604 490
6 97 36 9409 582
7 86 49 7396 602
b=- 4.48
8 84 64 7056 672
9 70 81 4900 630
10 69 100 4761 690
55 920 385 86452 4690
ΣX ΣY ΣX² ΣY² ΣX*Y a=116.67

𝑦ො = 116.67 - 4.48x
2) Interprete el coeficiente de regresión.

Coeficiente de inteligencia promedio = 116.67 - 4.48*número de hijos

b: -4.48
Al aumentar el número de hijos en uno el coeficiente de inteligencia disminuye en
promedio en 4.48.

INTERPRETACIÓN DEL COEFICIENTE DE REGRESION “b”

.- Si b>0; indica que por cada unidad que se incremente en X, Y aumenta en promedio
en b unidades.

.- Si b<0; indica que por cada unidad que se incremente en X, Y disminuye en


promedio en b unidades.
Primero hallamos el coeficiente de correlación

𝟏𝟎 𝟒𝟔𝟗𝟎 −(𝟓𝟓)(𝟗𝟐𝟎)
𝒓= = - 0.9570
𝟏𝟎∗𝟑𝟖𝟓−𝟓𝟓𝟐 [𝟏𝟎∗𝟖𝟔𝟒𝟓𝟐−𝟗𝟐𝟎𝟐 ]

Existe una correlación negativa muy alta, es decir al


aumentar el número de hijos disminuye el coeficiente de
inteligencia promedio.
3.- Determine la bondad de ajuste del modelo. Interprete.

𝑹𝟐 = 𝒓² ∗ 𝟏𝟎𝟎% = (−0.9570)2 ∗ 100%=91.58%

El 91.58% de la variabilidad total de los valores del coeficiente de inteligencia


promedio de los hijos esta siendo explicada por la regresión lineal.

Nos indica que porcentaje de la variabilidad total de los valores de Y


está siendo explicada por la regresión lineal simple (modelo).
4) Estime el coeficiente de inteligencia promedio para una familia de 11 hijos. Interprete.

𝑦=
ො 116.67 - 4.48x

Coeficiente de inteligencia promedio = 116.67 - 4.48*número de hijos

Coeficiente de inteligencia promedio = 116.67 - 4.48*11

Coeficiente de inteligencia promedio = 67.39

El coeficiente de inteligencia promedio para una familia de 11 hijos es de 67.39.


Coeficiente de inteligencia promedio (Y)

Número de hijos en la familia (X)

Del gráfico se aprecia que hay una correlación inversa de las


variables en estudio con tendencia lineal.
APLIQUEMOS LO APRENDIDO
EJERCICIO 1. Supongamos que conocemos los datos X: horas de
de producción y horas laboradas de 10 trabajadores Y: producción
trabajo
de una fábrica en un momento de tiempo (corte 10 11
transversal). 7 10
Sean: Y=producción y X=horas de trabajo. 10 12
5 6
a) Grafique el diagrama de dispersión e interprete. 8 10
b) Calcule el coeficiente de correlación e interprete. 8 7
c) Estime la ecuación de regresión lineal simple 6 9
d) Interprete el coeficiente de regresión. 7 10
e) Determina la bondad de ajuste del modelo e 9 11
interprete. 10 10
f) Estime la producción para 11 horas de trabajo.
Solución.
a) Grafique el diagrama de dispersión e interprete.

Diagrama de dispersión
14
12 Interpretación: del
grafico se aprecia que
Y: producción

10
8 hay una correlación
6 directa de las variables
4 en estudio con
2 tendencia lineal.
0
0 2 4 6 8 10 12
X: horas de trabajo
b) Calcule el coeficiente de correlación e interprete. Obs. 𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌 1 10 11 100 121 110
𝑟= 2 7 10 49 100 70
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
3 10 12 100 144 120
4 5 6 25 36 30
Remplazando en la formula. 5 8 10 64 100 80
10 789 − 80 96 6 8 7 64 49 56
𝑟=
10 668 − 80 2 10 952 − 96 2 7 6 9 36 81 54
8 7 10 49 100 70
9 9 11 81 121 99
𝑟 = 0.7198
10 10 10 100 100 100
Σ 80 96 668 952 789
Interpretación: Existe una correlación lineal positiva
alta, es decir al aumentar horas de trabajo aumenta X: horas de trabajo
la producción. Y: producción
c) Estime la ecuación de regresión lineal simple.
𝑦ො = 𝑎 + 𝑏𝑥
Donde,
σ𝑋 σ𝑌 80 96
σ 𝑋𝑌 − 789 −
𝑏= 𝑛 = 10
σ 𝑋 2 80 2 = 0.75
σ 𝑋2 − 668 −
𝑛 10

96 80
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 0.75 = 3.6
10 10

Luego, la ecuación de RLS es:


𝑦ො = 3.6 + 0.75𝑥
d) Interprete el coeficiente de regresión.
𝑏 = 0.75
Interpretación: Al aumentar horas de trabajo en una hora, la producción se
incrementa en promedio en 0.75.

e) Determina la bondad de ajuste del modelo e interprete.


𝑅2 = 𝑟 2 100% = 0.7198 2 100% = 51.81%
Interpretación: El 51.81% de la variabilidad total de los valores de la producción
esta siendo explicada por la regresión lineal.

f) Estime la producción para 11 horas de trabajo.


𝑦ො = 3.6 + 0.75𝑥
entonces, 𝑦ො = 3.6 + 0.75 11 = 11.85
Un trabajador de una fábrica que labora 11 horas producirá 12 unidades.
EJERCICIO 2. Un investigador de una fábrica de refrescos ha
tomado al azar 8 semanas del año observando en cada semana
la temperatura media (°C) y la cantidad de refrescos (miles)
pedidos durante cada uno de dichos períodos. La información
es la siguiente:

Temperatura 10 28 12 31 30 19 24 15 https://bit.ly/35IdjRt

Pedidos 21 65 19 72 75 36 67 24

a) Grafique el diagrama de dispersión.


b) Calcule el coeficiente de correlación lineal.
c) Halle la ecuación de regresión lineal.
d) Estimar el pedido de refrescos para una semana cuya
temperatura media es de 20°C.
Solución.
a) Grafique el diagrama de dispersión.

Diagrama de dispersión
80
70 Interpretación: del
60 grafico se aprecia que
hay una correlación
Y: pedidos

50
40 directa de las variables
30 en estudio con
tendencia lineal.
20
10
0
0 10 20 30 40
X: temperatura
b) Calcule el coeficiente de correlación lineal.
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌
Obs. 𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
𝑟= 1 10 21 100 441 210
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
2 28 65 784 4225 1820
3 12 19 144 361 228
Remplazando en la formula.
4 31 72 961 5184 2232
8 9392 − 169 379
𝑟= 5 30 75 900 5625 2250
8 4051 − 1692 8 22197 − 3792 6 19 36 361 1296 684
7 24 67 576 4489 1608
𝑟 = 0.9702 8 15 24 225 576 360
Σ 169 379 4051 22197 9392
Interpretación: Existe una correlación lineal
X: temperatura
positiva alta, es decir al aumentar temperatura Y: pedidos
aumenta los pedidos.
c) Halle la ecuación de regresión lineal.
𝑦ො = 𝑎 + 𝑏𝑥
Donde,
σ𝑋 σ𝑌 169 379
σ 𝑋𝑌 − 9392 −
𝑏= 𝑛 = 8 = 2.88
σ 𝑋 2 169 2
σ 𝑋2 − 4051 −
𝑛 8

379 169
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 2.88 = −13.47
8 8

Luego, la ecuación de regresión lineal es:


𝑦ො = −13.47 + 2.88𝑥
d) Estimar el pedido de refrescos para una semana cuya
temperatura media es de 20°C.
𝑦ො = −13.47 + 2.88𝑥
Evaluando, 𝑦ො = −13.47 + 2.88 20 = 44.13

Cuando la temperatura media es de 20°C, entonces el pedido de


refrescos para una semana será de 44 mil.
EJERCICIO 3. En una muestra de 8 pacientes se miden las cantidades
antropométricas peso y edad obteniéndose los siguientes resultados.

Edad (años) 12 8 10 11 7 7 10 14
Peso (Kg) 56 42 51 54 40 39 49 58

a) Calcule e interprete el coeficiente de correlación.


b) Halle la ecuación de regresión lineal.
c) Estime el peso para un paciente de 10 años de edad.
d) Determine e interprete el coeficiente de determinación.
a) Calcule e interprete el coeficiente de correlación.
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌
Obs. 𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
𝑟= 1 12 56 144 3136 672
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2
2 8 42 64 1764 336
3 10 51 100 2601 510
Remplazando en la formula.
4 11 54 121 2916 594
8 3967 − 79 389
𝑟= 5 7 40 49 1600 280
8 823 − 792 8 19303 − 3892 6 7 39 49 1521 273
7 10 49 100 2401 490
𝑟 = 0.9742 8 14 58 196 3364 812
Σ 79 389 823 19303 3967
Interpretación: Existe una correlación lineal
positiva alta, es decir al aumentar la edad X: Edad (años)
Y: Peso (kg)
aumenta el peso de los pacientes.
b) Halle la ecuación de regresión lineal.
𝑦ො = 𝑎 + 𝑏𝑥
Donde,
σ𝑋 σ𝑌 79 389
σ 𝑋𝑌 − 3967 −
𝑏= 𝑛 = 8 = 2.93
σ 𝑋 2 79 2
σ 𝑋2 − 823 −
𝑛 8

389 79
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 2.93 = 19.69
8 8

Luego, la ecuación de regresión lineal es:


𝑦ො = 19.69 + 2.93𝑥
c) Estime el peso para un paciente de 10 años de edad.
𝑦ො = 19.69 + 2.93𝑥
Evaluando, 𝑦ො = 19.69 + 2.93 10 = 48.99

Se estima que si un paciente tiene 10 años de edad, entonces tendrá


un peso de 48.99 kg.

d) Determine e interprete el coeficiente de determinación (bondad de ajuste)


𝑅2 = 𝑟 2 100% = 0.9742 2 100% = 94.91%
Interpretación: El 94.91% de la variabilidad total de los valores del peso de los
pacientes esta siendo explicada por la regresión lineal.
EJERCICIO 4. Se realizó un estudio sobre la cantidad Temperatura Azúcar
de azúcar convertida en cierto proceso a distintas (X) convertida (Y)
temperaturas. Los datos se codificaron y se 1.1 7.8
registraron como sigue: 1.2 8.5
1.3 9.8
a) Calcule e interprete el coeficiente de correlación.
1.4 9.5
b) Halle la ecuación de regresión lineal.
1.5 8.7
c) Calcule la cantidad media de azúcar convertida
1.6 8.6
que se produce cuando se registra una
temperatura codificada de 1.75. 1.7 10.4
1.8 9.4
1.9 9.2
a) Calcule e interprete el coeficiente de
correlación. Obs. 𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
1 1.1 7.8 1.21 60.84 8.58
𝑛 σ 𝑋𝑌 − σ 𝑋 σ 𝑌 2 1.2 8.5 1.44 72.25 10.2
𝑟=
𝑛 σ 𝑋2 − σ 𝑋 2 𝑛 σ 𝑌2 − σ 𝑌 2 3 1.3 9.8 1.69 96.04 12.74
4 1.4 9.5 1.96 90.25 13.3
Remplazando en la formula. 5 1.5 8.7 2.25 75.69 13.05
9 123.71 − 13.5 81.9 6 1.6 8.6 2.56 73.96 13.76
𝑟=
9 20.85 − 13.52 9 750.19 − 81.92 7 1.7 10.4 2.89 108.16 17.68
8 1.8 9.4 3.24 88.36 16.92
𝑟 = 0.5016 9 1.9 9.2 3.61 84.64 17.48
Σ 13.5 81.9 20.85 750.19 123.71
Interpretación: Existe una correlación lineal X: temperatura
positiva media, es decir al aumentar la Y: azúcar convertida
temperatura aumenta la cantidad de azúcar
convertida.
b) Halle la ecuación de regresión lineal.
𝑦ො = 𝑎 + 𝑏𝑥
Donde,
σ𝑋 σ𝑌 13.5 81.9
σ 𝑋𝑌 − 123.71 −
𝑏= 𝑛 = 9 = 1.43
σ𝑋 2 13.5 2
σ 𝑋2 − 20.85 −
𝑛 9

81.9 13.5
𝑎 = 𝑦ത − 𝑏𝑥ҧ = − 1.43 = 6.96
9 9

Luego, la ecuación de regresión lineal es:


𝑦ො = 6.96 + 1.43𝑥
c) Calcule la cantidad media de azúcar convertida que se produce
cuando se registra una temperatura codificada de 1.75.
𝑦ො = 6.96 + 1.43𝑥
Evaluando, 𝑦ො = 6.96 + 1.43 1.75 = 9.46

Si la temperatura codificada es de 1.75, entonces la cantidad media de


azúcar convertida que se produce es de 9.46.
EJERCICIO 5: Al gerente de marketing de una gran cadena de supermercados le
gustaría utilizar el espacio en el estante para predecir la ventas de alimento para
mascotas. Se selecciono una muestra aleatoria de 12 tiendas de igual tamaño con
los siguientes resultados:
X: Espacio en el Y: Ventas semanales a) Estime la ecuación de regresión
Tienda
estante (en pies) (en cientos de dólares)
lineal simple.
1 5 1.6
2 5 2.2 b) Interprete el coeficiente de
3 5 1.4 regresión.
4 10 1.9 c) Determine el coeficiente de
5 10 2.4 correlación y el coeficiente de
6 10 2.6 determinación (la bondad de
7 15 2.3
ajuste del modelo). Interprete.
8 15 2.7
9 15 2.8
d) Estime las ventas semanales para
10 20 2.6 un espacio de 22 pies. Interprete.
11 20 2.9
12 20 3.1
Diagrama de dispersión para las ventas semanales

Ventas Semanales (y)

Espacio en el estante (x)


Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.82700064
Coeficiente de determinación R^2 0.68393006
R^2 ajustado 0.65232306
Error típico 0.30805844
https://shutr.bz/3tIjQDW
Observaciones 12

Coeficiente de determinación
Coeficiente de correlación

Coeficientes Error típico Estadístico t Probabilidad


Intercepción 1.45 0.21783 6.65656 5.66278E-05
Espacio en el estante (X) 0.074 0.01591 4.65173 0.000905656

y = 1.45 + 0.074x
1.- Estime la ecuación de regresión lineal simple

y = 1.45 + 0.074x
2.- Interprete el coeficiente de regresión.

b: 0.074

ventas semanales = 1.45 + 0.074*espacio


Interpretación : Al aumentar el espacio del estante en un pie las ventas semanales se
incrementa en promedio en 0.074 cientos de dólares (7.4 dólares)
INTERPRETACIÓN DEL COEFICIENTE DE REGRESION “b”

.- Si b>0: Indica que por cada unidad que se incremente en X, Y aumenta en promedio en
b unidades.

.- Si b<0: Indica que por cada unidad que se incremente en X, Y disminuye en promedio
en b unidades.
3.- Determine el coeficiente de correlación y el coeficiente de
determinación(la bondad de ajuste del modelo). Interprete.

r:0.8270
Existe un correlación lineal positiva alta es decir al aumentar el
número de pies del espacio estante aumenta las ventas semanales en
cientos de dólares.
R2 = r²*100%=(0.8270)2 ∗ 100%=68.39%
Interpretación: El 68.39% de la variabilidad total de los valores de las ventas
semanales esta siendo explicada por la regresión lineal.

Nos indica que porcentaje de la variabilidad total de los valores de Y está siendo explicada
por la regresión lineal simple (modelo).
4) Estime las ventas semanales para un espacio de 22 pies.
Interprete.

y = 1.45 + 0.074x

ventas semanales = 1.45 + 0.074*espacio

ventas semanales = 1.45 + 0.074*22

ventas semanales = 3.078 (ciento de dólares)

ventas semanales = 307.8 dólares

Las ventas semanales para un espacio de 22 pies es de 307.8 dólares


INTEGREMOS LO APRENDIDO
El Coeficiente de correlación r indica:
a. El porcentaje de la variabilidad de la variable independiente que, de forma
conjunta, explican las variables dependientes del modelo.
b. La fuerza de la relación entre una variable dependiente y otra independientes
tomadas conjuntamente.
La fuerza de no relación entre una variable dependiente y otras independientes (2 o
más) tomadas conjuntamente.
El Coeficiente R2 (Coeficiente de Determinación) indica:
a. El porcentaje de la variabilidad de la variable dependiente que es
explicado por la variable independiente del modelo.
b. El porcentaje de la variabilidad de la variable independiente que, de
forma conjunta, explican las variables dependientes del modelo.
c. La fuerza de la relación entre una variable dependiente y otras
independientes (2 o más) tomadas conjuntamente.
INTEGREMOS LO APRENDIDO

• ¿Qué es lo que más te ha gustado de la


sesión desarrollada?

• ¿Qué es lo que aún puedes mejorar para


estimar la correlación y regresión lineal?

• ¿Cómo puedes aplicar lo aprendido en la


sesión a tu vida profesional?
https://bit.ly/3pKZIzI
Actividad Asincrónica (virtual)

Resolver el cuestionario virtual


de la semana 14
Referencias Bibliográficas
SECCIÓN DE REFERENCIA
SECCIÓN DE REFERENCIA

También podría gustarte