Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El gerente de una agencia de alquiler de limusinas que opera en Lima Metropolitana, quiere
determinar si el tiempo en minutos, que llevaría transportar pasajeros desde varios lugares al
aeropuerto del Callao, durante las horas no pico está explicado por la distancia recorrida, en
kilómetros. Se seleccionó una muestra aleatoria de 12 viajes durante un día en particular en las
horas no pico, con los siguientes resultados:
Distancia
10.3 11.6 12.1 14.3 15.7 16.1 18.4 20.2 21.8 24.3 25.4 26.7
en km.
Tiempo en
19.71 18.15 21.88 24.21 27.08 22.96 29.38 37.24 36.84 40.59 41.21 38.19
minutos
Estime el tiempo de transportar pasajeros desde varios lugares al aeropuerto del Callao si la
distancia recorrida es de 19.3 km.
¿El tipo que presentan las variables de estudio son cuantitativas?, ¿En este caso,
se puede decir que una variable está en función de la otra?
REGRESIÓN Y
CORRELACIÓN
LINEAL SIMPLE
Videoconferencia 14
Probabilidad y
Estadística Videoconferencia
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Temario
1. Introducción
2. Análisis de Regresión Lineal Simple
3. Medidas de Bondad de Ajuste
3.1. Coeficiente de Correlación.
3.2. Coeficiente de Correlación de Pearson.
3.3. Coeficiente de Determinación.
4. Ejemplos Aplicativos
5. Conclusiones
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
1 INTRODUCCIÓN
Es frecuente que estudiemos sobre una misma población los valores de dos variables
estadísticas (X,Y) distintas, con el fin de ver si existe alguna relación entre ellas.
En este tema trataremos de describir y medir este tipo de relaciones, que aparecen en
gran cantidad de problemas.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Diagrama de Dispersión
160 Ŷ f ( X )
140
Ventas en Millones
120
100
80
60
40
20
0
0 2 4 6 8 10
Gastos en Publicidad (Millones)
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Este tipo de regresión se utiliza cuando existe una variable independiente X para una variable
dependiente Y. Está definida por la siguiente ecuación lineal en su forma general (Ecuación de
regresión estimada):
DIAGRAMA DE DISPERSIÓN
Se utiliza para graficar la relación entre dos variables X e Y, consiste en una nube de puntos que
indicará si existe o no correlación dependiendo de la tendencia de los puntos.
25 6
20
20 5
15 4
15
3
10 10
2
5 5 1
0 0
0 0 10 20 30 0 10 20
0 5 10 15
Var. Independiente (X) Var. Independiente (X)
Var. Independiente (X)
Estadístico de prueba: KS
Si P-valor > alfa No se rechaza H0
Se cumple el supuesto de Normalidad de errores
No Hay
Si 1 ≤ DW ≤ 3 Autocorrelación +
Autocorrelación
Autocorrelación -
1 ≤ DW ≤3
Se cumple el supuesto de no autocorrelación de errores.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
r=
n xy - x y
n x 2
- ( x) n y - ( y)
2 2 2
Características:
i) El coeficiente r es un número comprendido entre -1 y +1
1 r 1
ii) Si r0 Existe una correlación directa o positiva
iv) Si r 1 Existe una perfecta asociación positiva entre las dos variables
v) Si r 1 Existe una perfecta asociación negativa entre las dos variables
vi) Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
COEFICIENTES DE CORRELACIÓN
Ejemplo: la siguiente tabla muestra la relación entre los gastos en publicidad y las ventas de una
Empresa exportadora de espárragos:
Ventas en Millones
2012 3 20 100
2013 5 40 80
2014 5 80 60
2015 6 120 40
2016 6 90 20
2017 7 125 0
0 2 4 6 8 10
2018 4 35 Gastos en Publicidad (Millones)
2019 8 135
COEFICIENTES DE CORRELACIÓN
Características:
4 EJEMPLOS APLICATIVOS
CASO:
4 EJEMPLOS APLICATIVOS
Diagrama de dispersión
Usando Megastat
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
4 EJEMPLOS APLICATIVOS
4 EJEMPLOS APLICATIVOS
b) Con el fin de pronosticar las ventas, determine la ecuación de regresión e interprete los coeficientes.
Cálculo de los Coeficientes De Regresión
Usando Megastat
4 EJEMPLOS APLICATIVOS
b) Con el fin de pronosticar las ventas, determine la ecuación de regresión e interprete los
coeficientes.
Entonces la ecuación de regresión estimada será: INTERPRETACION DE LOS
COEFICIENTES DE REGRESION:
Ŷ 17.29 0.688 X
• bo: es el valor de predicción de Y,
Interpretación: cuando la variable independiente
b0 17.29 , Son las ventas de un empleado cuando X es cero o X toma valor cero.
cuando no tienen años de experiencia. En otras palabras un • b1: es el cambio promedio de Y
vendedor tendrá en promedio ventas de S/. 17290 si no tiene años de cuando X cambia en una unidad
experiencia. de medición.
• si b 1 > 0, la tendencia lineal es
b1 0.688 , Es el incremento en 0.688 cuando X aumenta en una
creciente.(Pendiente positiva)
unidad. En otras palabras es el aumento en S/. 688 por cada año de • Si b <0, la tendencia lineal es
1
experiencia que adquiera un empleado.
decreciente (Pendiente negativa)
• Si b 1 = 0 no hay regresión.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
4 EJEMPLOS APLICATIVOS
c) Predecir la venta de un empleado con 40 años de experiencia (Estimar Y para un valor X=40)
Ŷ 17.29 0.688 X
PREDICCIÓN PARA X=40 44.826
Usando Megastat
4 EJEMPLOS APLICATIVOS
Regression Analysis
r² 0.883 n 7
r 0.939 k 1
Std. Error 3.147 Dep. Var. Ventas(miles) (Y)
4 EJEMPLOS APLICATIVOS
Usando Megastat
Ventas(miles)
Observation (Y) Predicted Residual
1 26.0 26.2 -0.2
2 33.0 28.3 4.7
3 36.0 37.9 -1.9
4 16.0 18.7 -2.7
5 26.0 22.8 3.2
6 19.0 21.4 -2.4
7 38.0 38.6 -0.6
Durbin-Watson = 2.79
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
5 EJERCICIO PROPUESTO
El director de escuela de una universidad afirma que los estudiantes universitarios que aprenden más rápido tienen
mejores calificaciones y por lo tanto mejores oportunidades de obtener buenos empleos después de graduarse. Suponga
que resultados que se presentan a continuación representan las calificaciones promedio (entre cero y diez puntos) de 15
recién graduados y sus correspondientes salarios iniciales (en miles de soles):
Calificación Promedio 2.95 3.2 3.4 3.6 3.2 2.85 3.1 2.85 3.05 2.7 2.75 3.1 3.15 2.95 2.75
Salario Inicial 18.5 20 21.1 22.4 21.2 15 18 18.8 15.7 14.4 15.5 17.2 19 17.2 16.8
Se pide:
a) Verifique el cumplimiento de los supuestos. Use un α = 0.025.
b) Determine la recta de regresión lineal simple que permita estimar el salario inicial de los recién graduados en
función de la calificación promedio. Interprete el coeficiente de regresión estimado.
c) Estime el salario inicial del recién graduado si tuvo una calificación promedio 3.8 puntos.
d) Con un nivel de significancia del 2.5%, ¿se puede afirmar que el modelo de regresión lineal simple es significativo?
e) ¿Qué porcentaje de variabilidad total del salario inicial es explicado por la calificación promedio?
f) Con un nivel de confianza del 97.5%, estime el salario promedio inicial del recién graduado si tuvo una calificación
promedio 3.8 puntos.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
5 CONCLUSIONES
Metacognicion