Está en la página 1de 25

CASO DE APLICACIÓN

El gerente de una agencia de alquiler de limusinas que opera en Lima Metropolitana, quiere
determinar si el tiempo en minutos, que llevaría transportar pasajeros desde varios lugares al
aeropuerto del Callao, durante las horas no pico está explicado por la distancia recorrida, en
kilómetros. Se seleccionó una muestra aleatoria de 12 viajes durante un día en particular en las
horas no pico, con los siguientes resultados:
Distancia
10.3 11.6 12.1 14.3 15.7 16.1 18.4 20.2 21.8 24.3 25.4 26.7
en km.
Tiempo en
19.71 18.15 21.88 24.21 27.08 22.96 29.38 37.24 36.84 40.59 41.21 38.19
minutos

Estime el tiempo de transportar pasajeros desde varios lugares al aeropuerto del Callao si la
distancia recorrida es de 19.3 km.

¿El tipo que presentan las variables de estudio son cuantitativas?, ¿En este caso,
se puede decir que una variable está en función de la otra?
REGRESIÓN Y
CORRELACIÓN
LINEAL SIMPLE

Videoconferencia 14

Probabilidad y
Estadística Videoconferencia
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

CAPACIDAD LOGRADA DE LA CLASE

Cuando culmines el estudio de la clase,


estarás en condición de:
Analizar, resolver e interpretar
problemas de situaciones reales, en las
cuales se utilice el Análisis de
regresión lineal simple, haciendo uso
de muestras.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Temario
1. Introducción
2. Análisis de Regresión Lineal Simple
3. Medidas de Bondad de Ajuste
3.1. Coeficiente de Correlación.
3.2. Coeficiente de Correlación de Pearson.
3.3. Coeficiente de Determinación.
4. Ejemplos Aplicativos
5. Conclusiones
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

1 INTRODUCCIÓN

Es frecuente que estudiemos sobre una misma población los valores de dos variables
estadísticas (X,Y) distintas, con el fin de ver si existe alguna relación entre ellas.

Ejemplo: Si sobre una población de niños entre 1 y 5


años, estudiamos las variables peso y estatura,
esperamos que en general ocurra que a mayor
estatura, también encontremos mayor peso, aunque es
posible que en algunos pocos casos no ocurra así.

En este tema trataremos de describir y medir este tipo de relaciones, que aparecen en
gran cantidad de problemas.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

2 ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

REGRESIÓN. Es un método que se emplea para encontrar una función que se


ajusta a una nube de puntos o diagrama de dispersión, con la finalidad de
obtener una predicción aproximada de una de las variables a partir de la otra.

Diagrama de Dispersión
160 Ŷ  f ( X )
140
Ventas en Millones

120

100

80

60

40

20

0
0 2 4 6 8 10
Gastos en Publicidad (Millones)
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

2 ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

Este tipo de regresión se utiliza cuando existe una variable independiente X para una variable
dependiente Y. Está definida por la siguiente ecuación lineal en su forma general (Ecuación de
regresión estimada):

Ecuación de La Regresión Lineal


෡𝟎 + 𝜷
෡=𝜷
𝒀 ෡ 𝟏𝑿

෡ 𝟎 : Intercepto con el eje. Es el valor de Y que se obtiene cuando X = 0


𝜷
෡ 𝟏 : Pendiente de la recta. Mide el cambio que se producirá en la variable dependiente Y,
𝜷
cuando la variable independiente X varía en una unidad

La relación entre X e Y puede ser:


 Directa: 𝜷෡ 𝟏 > 𝟎 𝐩𝐞𝐧𝐝𝐢𝐞𝐧𝐭𝐞 𝐩𝐨𝐬𝐢𝐭𝐢𝐯𝐚
 Inversa: 𝜷෡ 𝟏 < 𝟎 𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆 𝐧𝐞𝐠𝐚𝐭𝐢𝐯𝐚
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

2 ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

DIAGRAMA DE DISPERSIÓN
Se utiliza para graficar la relación entre dos variables X e Y, consiste en una nube de puntos que
indicará si existe o no correlación dependiendo de la tendencia de los puntos.

TIPOS DE DIAGRAMA DE DISPERSIÓN

25 6
20

Var. Dependiente (Y)

Var. Dependiente (Y)


Var. Dependiente (Y)

20 5
15 4
15
3
10 10
2
5 5 1
0 0
0 0 10 20 30 0 10 20
0 5 10 15
Var. Independiente (X) Var. Independiente (X)
Var. Independiente (X)

Correlación Correlación Sin


Positiva Negativa Correlación
(Directa) (Inversa)
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

2 ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

SUPUESTOS DEL MODELO


Se debe de validar los supuestos y autocorrelación de los errores
1. NORMALIDAD DE LOS ERRORES (KOLMOGOROV – SMIRNOV)
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

Estadístico de prueba: KS
Si P-valor > alfa No se rechaza H0
Se cumple el supuesto de Normalidad de errores

2. AUTOCORRELACIÓN DE LOS ERRORES (DURBÍN WATSON – DW)


Estadístico de prueba: Durbin-Watson 0 1 3 4

No Hay
Si 1 ≤ DW ≤ 3 Autocorrelación +
Autocorrelación
Autocorrelación -

1 ≤ DW ≤3
Se cumple el supuesto de no autocorrelación de errores.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

3 MEDIDAS DE BONDAD DE AJUSTE

3.1 COEFICIENTES DE CORRELACIÓN


Es un número que indica el grado de asociación entre las variables y se define del siguiente modo:

r=
n  xy -  x  y
 n x 2
- ( x)   n  y - ( y)
2 2 2


Características:
i) El coeficiente r es un número comprendido entre -1 y +1
1  r  1
ii) Si r0 Existe una correlación directa o positiva

iii) Si r0 Existe una correlación Inversa o negativa

iv) Si r  1 Existe una perfecta asociación positiva entre las dos variables
v) Si r  1 Existe una perfecta asociación negativa entre las dos variables
vi) Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

3 MEDIDAS DE BONDAD DE AJUSTE

3.2 COEFICIENTES DE CORRELACIÓN DE PEARSON


NIVELES DE CORRELACIÓN (r)
El siguiente diagrama resume el análisis del coeficiente de correlación entre
dos variables:
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

3 MEDIDAS DE BONDAD DE AJUSTE

COEFICIENTES DE CORRELACIÓN
Ejemplo: la siguiente tabla muestra la relación entre los gastos en publicidad y las ventas de una
Empresa exportadora de espárragos:

Gastos en Diagrama de Dispersión


Ventas en 160
Año publicidad en
millones (Y) 140
millones (X)
120

Ventas en Millones
2012 3 20 100
2013 5 40 80
2014 5 80 60
2015 6 120 40

2016 6 90 20

2017 7 125 0
0 2 4 6 8 10
2018 4 35 Gastos en Publicidad (Millones)

2019 8 135

¿Qué tipo de relación se observa en el Diagrama de dispersión? Sustente su respuesta


REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

3 MEDIDAS DE BONDAD DE AJUSTE

COEFICIENTES DE CORRELACIÓN

Interpretación: Como r=0.932, existe una alta correlación directa positiva,


entre los gastos en publicidad y las ventas.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

3 MEDIDAS DE BONDAD DE AJUSTE

3.3 COEFICIENTES DE DETERMINACIÓN


Mide el porcentaje de variabilidad en Y que puede explicarse a través del
conocimiento de la variable independiente X. Se calcula con la siguiente
fórmula:

Características:

i) Es un valor no negativo ya que se encuentra entre 0 y 1 0  R2  1


ii) Es un valor muy importante en cualquier análisis de regresión, ya que muestra el grado
hasta el cual están relacionadas la variabilidad de X e Y
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

CASO:

Carlos Rodríguez, gerente de ventas de la Empresa MIYASATO EIRL, con el fin de


implementar un bono en los salarios de sus vendedores, analiza las ventas mensuales (en
miles de soles) con los años de experiencia, seleccionando en forma aleatoria algunos de
sus vendedores. Los datos se muestran a continuación:

N° Experiencia (X) Ventas(miles) a) Mediante el diagrama de dispersión, analice la


relación de las variables.
1 13 26
b) Con el fin de pronosticar las ventas, determine la
2 16 33
3 30 36
ecuación de regresión e interprete los coeficientes.
4 2 16 c) Predecir la venta de un empleado con 40 años de
5 8 26 experiencia (Estimar Y para un valor X=40).
6 6 19 d) Hallar el coeficiente de determinación.
7 31 38 e) Demostrar los supuestos de Durbín Watson.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

a) Mediante el diagrama de dispersión, analice la relación de las variables.

Diagrama de dispersión
Usando Megastat
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

a) Mediante el diagrama de dispersión, analice la relación de las variables.

Según el diagrama de dispersión si existe una relación lineal. Con una


correlación positiva (directa)
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

b) Con el fin de pronosticar las ventas, determine la ecuación de regresión e interprete los coeficientes.
Cálculo de los Coeficientes De Regresión
Usando Megastat

Regression output confidence interval


variables coefficients std. error t (df=5) p-value 95% lower 95% upper
Intercept 17.2901
Experiencia (X) 0.6884 0.1123 6.129 .0017 0.3997 0.9771
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS
b) Con el fin de pronosticar las ventas, determine la ecuación de regresión e interprete los
coeficientes.
Entonces la ecuación de regresión estimada será: INTERPRETACION DE LOS
COEFICIENTES DE REGRESION:
Ŷ  17.29  0.688 X
• bo: es el valor de predicción de Y,
Interpretación: cuando la variable independiente
b0  17.29 , Son las ventas de un empleado cuando X es cero o X toma valor cero.
cuando no tienen años de experiencia. En otras palabras un • b1: es el cambio promedio de Y
vendedor tendrá en promedio ventas de S/. 17290 si no tiene años de cuando X cambia en una unidad
experiencia. de medición.
• si b 1 > 0, la tendencia lineal es
b1  0.688 , Es el incremento en 0.688 cuando X aumenta en una
creciente.(Pendiente positiva)
unidad. En otras palabras es el aumento en S/. 688 por cada año de • Si b <0, la tendencia lineal es
1
experiencia que adquiera un empleado.
decreciente (Pendiente negativa)
• Si b 1 = 0 no hay regresión.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

c) Predecir la venta de un empleado con 40 años de experiencia (Estimar Y para un valor X=40)

Ŷ  17.29  0.688 X
PREDICCIÓN PARA X=40 44.826

Un empleado con 40 años de experiencia en ventas, venderá aproximadamente S/.44826

Usando Megastat

Predicted values for: Ventas(miles) (Y)

95% Confidence Interval 95% Prediction Interval

Experiencia (X) Predicted lower upper lower upper Leverage


40 44.826 37.025 52.626 33.589 56.063 0.930
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

d) Hallar el coeficiente de determinación


Usando Megastat

Regression Analysis
r² 0.883 n 7
r 0.939 k 1
Std. Error 3.147 Dep. Var. Ventas(miles) (Y)

Interpretación: El 88.3% de las variaciones de las ventas (Y) son explicados


por los años de experiencia. Existe además un (100-88.3)% = 11.7% que no es
explicado por los años de experiencia.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

4 EJEMPLOS APLICATIVOS

e) Demostrar los supuestos (Durbín Watson)

Usando Megastat

Ventas(miles)
Observation (Y) Predicted Residual
1 26.0 26.2 -0.2
2 33.0 28.3 4.7
3 36.0 37.9 -1.9
4 16.0 18.7 -2.7
5 26.0 22.8 3.2
6 19.0 21.4 -2.4
7 38.0 38.6 -0.6
Durbin-Watson = 2.79
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

5 EJERCICIO PROPUESTO
El director de escuela de una universidad afirma que los estudiantes universitarios que aprenden más rápido tienen
mejores calificaciones y por lo tanto mejores oportunidades de obtener buenos empleos después de graduarse. Suponga
que resultados que se presentan a continuación representan las calificaciones promedio (entre cero y diez puntos) de 15
recién graduados y sus correspondientes salarios iniciales (en miles de soles):

Calificación Promedio 2.95 3.2 3.4 3.6 3.2 2.85 3.1 2.85 3.05 2.7 2.75 3.1 3.15 2.95 2.75

Salario Inicial 18.5 20 21.1 22.4 21.2 15 18 18.8 15.7 14.4 15.5 17.2 19 17.2 16.8

Se pide:
a) Verifique el cumplimiento de los supuestos. Use un α = 0.025.
b) Determine la recta de regresión lineal simple que permita estimar el salario inicial de los recién graduados en
función de la calificación promedio. Interprete el coeficiente de regresión estimado.
c) Estime el salario inicial del recién graduado si tuvo una calificación promedio 3.8 puntos.
d) Con un nivel de significancia del 2.5%, ¿se puede afirmar que el modelo de regresión lineal simple es significativo?
e) ¿Qué porcentaje de variabilidad total del salario inicial es explicado por la calificación promedio?
f) Con un nivel de confianza del 97.5%, estime el salario promedio inicial del recién graduado si tuvo una calificación
promedio 3.8 puntos.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

5 CONCLUSIONES

 La correlación mide la fuerza de relación entre 2 variables cuantitativas.

 El coeficiente de determinación mide el porcentaje de variabilidad

 El modelo lineal sirve para pronosticar el valor de la variable

dependiente (Y) a partir de la variable independiente (X).


REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Metacognicion

¿Que aspectos le han parecido interesantes?


¿Que contenido considera más importante del
tema trabajado?
¿Qué competencias del tema podría aplicar en su
vida diaria?

También podría gustarte