Está en la página 1de 23

Estadística Aplicada a los Negocios

Unidad:
Regresión y Correlación

Docente: Fredy Vivanco Huaytara


Logro
Al término de la unidad, el estudiante aplica los diferentes
conceptos relacionados con la regresión lineal, correlación
adecuadamente en situaciones reales.

Importancia
En la Investigación social, el análisis de regresión se utiliza para
predecir un amplio rango de fenómenos, desde medidas
económicas hasta diferentes aspectos del comportamiento
humano, así mismo en el ámbito de investigación de mercados,
predecir el número de ventas de un producto y observar que
variables tienen mas correlación con la satisfacción de dichos
productos
Contenido general

• Regresión lineal

• Correlación
Regresión lineal
Regresión
Regresión Lineal

El análisis de regresión involucra el estudio la relación entre


dos variables CUANTITATIVAS

Frecuentemente resulta de interés conocer el efecto que una o


varias variables pueden causar sobre otra, es decir nos
encontramos en la vida real y científica con modelos en los que
el comportamiento de una variable, Y, se puede explicar a
través de una variable X;

Representación
𝑌 = 𝑓(𝑥)

La regresión lineal es un modelo estadístico usado para


aproximar la relación de dependencia entre una variable
dependiente Y, las variables independientes Xi y un
término aleatorio ε
Regresión
Regresión Lineal simple: Ejemplo Demostrativo
Se prueban cinco trozos experimentales del material bajo diferentes presiones. Los valores de x ( en Newton ) y
las magnitudes de compresión y resultantes (en unidades de cm)

y
Presión Compresión 4
(N) (Cm)
X Y
3
1 1
2 1 2

3 2
1
4 2
5 4
0 1 2 3 4 X

Y tiende a aumentar de forma lineal conforme X aumenta


Regresión
Regresión Lineal simple:
La solución es construir un modelo probabilístico que relacione y con x; uno que contemple la variación aleatoria
de los puntos de datos a los lados de una línea recta.

Un tipo de modelo probabilístico, el modelo de regresión lineal simple, supone que el valor medio de Y para un
valor dado de X se grafica como una línea recta y que los puntos se desvían de esta línea de medias en una
cantidad aleatoria (positiva o negativa) igual a , es decir:

y   0  1 x  
Valor medio de y Error
para una x dada aleatorio

Donde 0 y 1 son parámetros desconocidos del modelo.


Regresión
Regresión Lineal simple:

y 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
4 )
Y  ˆ0  ˆ1 x E() = 0
3
Modelo de regresión lineal simple estimado

2 𝑦 = 𝛽0 + 𝛽1 𝑥
ˆ1  pendiente
Donde: y = variable dependiente
1
x = variable independiente
0
1 2 3 4 X Cálculo de coeficientes

𝑿 𝒀−𝒏 𝑿𝒀
𝜷𝟏 =
ˆ0  ordenada al origen Paso1:
𝑿 2−𝒏 𝑿2

𝒀 − 𝜷𝟏 𝑿
Paso2: 𝜷𝟎 =
𝒏
Correlación
Correlación
Coeficiente de Correlación
El coeficiente de correlación de Pearson(r), pensado para variables cuantitativas, es un índice que mide el grado
de covariación entre distintas variables relacionadas linealmente. Esto significa que puede haber variables
fuertemente relacionadas, pero no de forma lineal.

Relación
𝒏 𝑿𝒀 − 𝑿 𝒀 inversa
𝒓= Relación
perfecta directa casi
2 2 Variables
𝒏 𝑿2 −( 𝑿) . 𝒏 𝒀2 −( 𝒀) incorrelada perfecta
s

-1 0 +1

Rango de valores r
r = -1 Si –1< r < -0.8  Correlación Inversa intensa
Correlación inversa perfecta Si –0.2 < r < 0  Correlación Inversa débil
Si 0 < r < 0.2  Correlación Directa débil
r= 1
Correlación directa perfecta Si 0.8 < r < 1  Correlación Directa intensa
Correlación
Regresión Lineal simple: Interpretación de coeficientes

ŷ   0  1 x
El coeficiente de regresión: es el cambio (aumento o
disminución) en promedio en Y cuando X varía en una
unidad.

Supuestos Regresión Lineal:

 Supuesto de Linealidad
Existe linealidad si se presenta una relación significativa entre la variable que se quiere predecir y las otras
variables. Puede usarse el coeficiente "R cuadrado ajustado", para saber si existe linealidad (mayor o igual a 0.7
suele ser "indicio" de linealidad)

 Supuesto de Normalidad de Residuos

 Supuesto de Independencia de los Residuos


Correlación
Coeficiente de Correlación
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlación
Coeficiente de Correlación
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlación
Coeficiente de Determinación

El coeficiente de determinación es la proporción o porcentaje de variación total en Y respecto a su media, que


es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola
por cien

0 ≤ 𝑅2 ≤ 1
Descomposición de la variabilidad de Y:
2 2 2
(𝑌 − 𝑌) (𝑌 − 𝑌) (𝑌 − 𝑌)
= +

SCT = SCR + SCE


Variación = Variación + Variación no
El resultado del 𝑅2 oscila entre 0 y 1.
total (Y) Explicada explicada
Cuanto más cerca de 1 se sitúe su valor,
2
mayor será el ajuste del modelo a la
(𝑌 − 𝑌) variable que estamos intentando
𝑟2 = 2 explicar. De forma inversa, cuanto más
(𝑌 − 𝑌)
cerca de cero, menos ajustado estará el
modelo y, por tanto, menos fiable será.
Coeficiente de determinación
Coeficiente de Determinación
Ejemplo: si se tiene los siguiente resultados
𝑌 = 2.56665 + 2.7565𝑋
𝑅2 = 0.8998 𝑟 = 0.9485
Interpretación
El ajuste del modelo es bueno, ya que el valor de 𝑅2 = 0.8998
es cercano a 1, en concreto, el 89,98% de la variabilidad de
la variable Y a su promedio es explicado por el modelo de
regresión ajustado. Podemos concluir que el modelo lineal
es adecuado para describir la relación que existe entre estas
variables.
El coeficiente de correlación de 𝑟 = 0.9485, indica que
existe una relación lineal intensa entre X e Y de manera
directa

En una regresión lineal simple el coeficiente de


determinación coincide con la correlación de Pearson
elevada al cuadrado.
𝑅2 = 𝑟 2
Regresión y correlación
Ejercicio:
La Propina que se le otorga a un mozo en un restaurante depende de muchos factores, por ejemplo la cordialidad
del personal, Tipo de ambiente, Satisfacción por el servicio, etc.
En el siguiente cuadro se tiene la cantidad de propina (s/.) que los clientes de un restaurant dan a los mozos en
función al tiempo en que se demora en servir una orden(minutos).

Propina(S/) 1 3 3 2 6 1 2 3 4
Tiempo de Atención
3 2 2 4 1 4 3 2 2
(minutos)

a) Identifique las variables de Interés y clasifique cada uno de ellos ¿Cómo se relacionan ambas variables?
b) Estime el modelo de Regresión lineal estimada e interprete los coeficientes
c) Halle e interprete el coeficiente de Correlación y coeficiente de determinación
d) Pronosticar: ¿Cuánto en Promedio recibirá de propina un mozo que se ha demorado en atender 3.5 minutos?
Regresión y correlación

Solución a.

Las variables de Interés


 Variable Independiente: Tiempo de Atención( minutos )(X)
 Variable dependiente: Propina (s/) (Y)

La propina que se otorga a un mozo depende del tiempo de


atención en servir el orden.
Regresión y correlación

Solución b. Modelo de Regresión Estimada Pr𝑜𝑝 𝑖𝑛𝑎 = 𝛽0 + 𝛽1 𝑇𝑖𝑒𝑚𝑝𝑜

𝑦 = 𝛽0 + 𝛽1 𝑥 Paso1:
𝑿 𝒀−𝒏 𝑿𝒀
Y (propina) X (tiempo) 𝑋2 𝑌2 𝑋𝑌 𝜷𝟏 =
𝑿 2−𝒏 𝑿2
1 3 9 1 3
3 2 4 9 6 23 ∗ 25 − 9 ∗ 53
𝜷𝟏 = = −1.324
3 2 4 9 6 232 − 9 ∗ 67
2 4 16 4 8 Paso2:
6 1 1 36 6
1 4 16 1 4 𝒀 − 𝜷𝟏 𝑿 𝟐𝟓 − −𝟏, 𝟑𝟐𝟒 ∗ 𝟐𝟑
𝜷𝟎 = =
2 3 9 4 6 𝒏 𝟗
3 2 4 9 6
𝜷𝟎 = 𝟔. 𝟏𝟔𝟏𝟑
4 2 4 16 8

𝑌 = 25 𝑋 =23 𝑋 2 =67 𝑌 2 =89 𝑋𝑌 =53 Pr𝑜𝑝 𝑖𝑛𝑎 = 6.1613 − 1.324𝑇𝑖𝑒𝑚𝑝𝑜
Modelo de Regresión Estimada
Interpretación de coeficiente
𝛽1 = −1.324: Por cada minutos adicional del atención la propina disminuye en promedio 1.324 soles.
Regresión y correlación
Solución C: Coeficiente de correlación(r)
𝐘 = 𝟐𝟓 𝐗 =23 𝐗 𝟐 =67 𝐘 𝟐 =89 𝐗𝐘 =53

𝒏 𝑿𝒀 − 𝑿 𝒀
𝒓=
2 2
𝒏 𝑿2 −( 𝑿) . 𝒏 𝒀2 −( 𝒀)

9 53 − 23 25
r= = −0.8587
9 67 − 232 . 9 89 − 252

–1< r < -0.8  Correlación Inversa intensa

Existe una correlación intensa entre el tiempo de


atención(X) y la propina otorgada por el cliente (Y) y la
relacon es de manera inversa, decir mientras mas tiempo se
demora en atender a un clientes menos propina dará este.
Regresión y correlación
Solución C: Coeficiente de determinación(r)

r = −0.8587
𝑅2 = 𝑟 2

𝑅2 = 73.74%

El 73.74% de la variabilidad de la variable Y (propina) a su


promedio es explicado por el modelo de regresión
ajustado.

Solución D: Pronóstico de la propina cuando el tiempo


De atención es 3.5 minutos

Pr𝑜𝑝 𝑖𝑛𝑎 = 6.1613 − 1.324𝑇𝑖𝑒𝑚𝑝𝑜

Pr𝑜𝑝 𝑖𝑛𝑎 = 6.1613 − 1.324 3.5

Pr𝑜𝑝 𝑖𝑛𝑎 = 1.53 soles
Regresión y correlación
7
Resumen
Y (propina) X (tiempo) 6 R² = 0.7374
1 3
3 2 5
3 2 y = 6.16-1.3243x
4

Propina
2 4
6 1 3
1 4
2 3 2
3 2
4 2 1

0
0 1 2 3 4 5
Tiempo


Pr𝑜𝑝 𝑖𝑛𝑎 = 6.16 − 1.324𝑇𝑖𝑒𝑚𝑝𝑜
Conclusiones
1. Regresión lineal

 La regresión lineal es un modelo estadístico usado para aproximar


la relación de dependencia entre una variable dependiente Y,
las variables independientes Xi y un término aleatorio ε

2. Correlación

 El coeficiente de correlación de Pearson(r) mide el grado de


covariación entre distintas variables relacionadas linealmente.

 El coeficiente de determinación es la proporción o porcentaje de


variación total en Y que es explicada por el modelo de regresión.
Gracias
Docente: Fredy Vivanco Huaytara

También podría gustarte