Está en la página 1de 28

CURSO : ESTADISTICA APLICADA A LOS NEGOCIOS

SESIÓN : 13
TEMA : ANÁLISIS DE REGRESIÓN LINEAL Y CORRELACIÓN.
DIAGRAMAS DE DISPERSIÓN, COEFICIENTE DE DETERMINACIÓN
Y DE CORRELACIÓN. Y MODELOS DE REGRESIÓN LINEAL
SIMPLE.

ESCUELA DE ADMINISTRACIÓN
2020- II
ESTIMACION DE PARAMETROS DE LA
REGRESION y=B0+B1 X -> Ecuación Lineal

  Para que dicha ecuación esté definida es necesario que se conozca “βo” y “β1”. Dichos

parámetros se calcula utilizando el método de mínimos cuadrados.

 El “Método de Mínimos cuadrados” busca o fija los datos de la muestra o población a una
línea recta de modo que las diferencias de cada observación a la línea de regresión sea lo
menos posible.
n
, n = nº de observaciones (tamaño de la muestra)
 e  minimo
i 1
i

 Luego de minimizar cada valor de ei, se obtienen las fórmulas de “a” y “b”.
n XY  ( X )( Y ) o  Y  b X
1 
n  X 2  ( X ) 2

Donde:
βo = Intercepto de la ecuación de regresión con el eje Y
β1 = coeficiente de regresión.
Xi = valores de la variable independiente
Yi = valores de la variable dependiente
= Promedio de los valores de la variable independiente
= Promedio de los valores de la variable dependiente.
 

a= : Constante o parámetro de posición.


Es el valor promedio de la variable de respuesta Y
cuando X es cero.
Si se tiene certeza de que la variable predictora X no
puede asumir el valor 0, entonces la interpretación no
tiene sentido.
 b= : Coeficiente de regresión.
Es el cambio (incremento o disminución según el signo
de β1) promedio en la variable de respuesta Y cuando
X se incrementa en una unidad.

y=a+bX
y=B0+B1X
Si b > 0, entonces, la tendencia lineal es creciente, es decir a
mayores valores de X corresponden mayores valores de Y.
Si b < 0, entonces, la tendencia lineal es decreciente, es decir a
mayores valores de X corresponden menores valores de Y.
Si b = 0, entonces, Y = a; Y permanece estacionario para
cualquier valor de X.
ERROR ESTANDAR DE ESTIMACION
 El error estándar de estimación llamado también
desviación estándar es una medida de dispersión
alrededor de una línea de regresión.
 Es una medida de dispersión de los valores observados,
con respecto a la línea de regresión (valores estimados).
 Entre el valor observado y el valor estimado Y* existe
una diferencia o sesgo, que puede ser menor o mayor en
la medida que los n-puntos del diagrama de dispersión
estén más o menos cerca de la línea de regresión.

S
SCE

Y 2
 a  Y  b XY
n2 n2
Ejemplo: Analizar la relación entre la edad y el tiempo
efectivo de servicio de los trabajadores, para el efecto se
consideró una muestra de 15 trabajadores:

Edad 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de Servicio 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
a) Hallar el coeficiente de correlación
b) Hallar el coeficiente de determinación
c) Hallar el error estándar
d) Hallar un modelo de regresión adecuado
e) Comprobar si los datos se ajusta al modelo
PASO 1: Definir las variables:
Definir en primer lugar: ¿Cuál será la variable
dependiente e independiente?
Y: Tiempo de Servicio (Variable Dependiente)
X: Edad (Variable Independiente)
PASO 2: Diagrama de dispersión
En el grafico se observa que la nube de puntos tiene una
forma alargada, con una relación positiva en donde es
posible ajustar o representar por una línea recta, la cual
será:
Y *  b0  b1 x

 


20

 

15


10 

5

30 35 40 45

Edad d e tr abajador es
Edad X Tiempo de
Servicio Y XY X2 Y2 Y*
48 24 1152 2304 576 23.685
40 18 720 1600 324 16.677
30 9 270 900 81 7.917
39 14 546 1521 196 15.801
46 22 1012 2116 484 21.933
42 22 924 1764 484 18.429
27 4 108 729 16 5.289
36 13 468 1296 169 13.173
34 10 340 1156 100 11.421
46 20 920 2116 400 21.933
32 12 384 1024 144 9.669
42 18 756 1764 324 18.429
40 16 640 1600 256 16.677
32 8 256 1024 64 9.669
27 6 162 729 36 5.289
561 216 8658 21643 3654 215.991
PASO 3: El coeficiente de correlación es:
Cov( X , Y ) n XY   X  Y
r 
S X SY n X 2    X  n Y 2    Y 
2 2

15(8658)  561(216)
r
15( 21643)   561 15(3654)   216 
2 2

r  0.9663

Interpretación: Hay un alto grado de asociación entre la


edad y el tiempo de servicio
PASO 4:
PASO 5:

El coeficiente de determinación es:

Interpretación: El 93.37% dela variación en el tiempo de servicio se explica


por la variación en la edad de los trabajadores
PASO 6: Hallar el Modelo de Regresión
Hallando los parámetros: b0 , b1

Y *  b0  b1 x

b0 = -18.363
b1 = 0.876;

Significa que por cada edad adicional de los trabajadores puede esperarse aumentar casi 1 año de
tiempo de servicio

Y *  18.363  0.876 x
En el grafico se observa la línea de regresión
(Y* = Tiempo de Servicio y X = Edad)


1Tiempo de Servicio = -18,36 + 0,88 * Edad Reg resión lineal
 


20

 

15



10

5

30 35 40 45

Edad de tr abajadores
PASO 7:

¿Cuál es el tiempo de servicio estimado Y* para un


trabajador de 35 años de edad?
Y* = -18.363 + 0.876(35) = 12.3 años
Aproximadamente tendría 12 años de tiempo de
servicio efectivo
PASO 8:

El error estándar es:

S
SCE
   a Y  b XY  3654  (18.363)(216)  0.876(8658)
Y 2

n2 n2 13
S  1.6641

PASO 9: ANÁLISIS DE VARIANZA

H0: Los datos se ajustan al modelo


H1: Los datos no se ajusta al modelo
ANVA

FUENTES DE GRADOS DE SUMA DE CUADRADO


VARIACIÓN LIBERTAD CUADRADOS MEDIO F-CALCULADO
REGRESIÓN 1 507.7 507.7 183.85
ERROR 13 35.9 2.76  
TOTAL 14 543.6    

F(1,13,0.05)=
Gráfica de distribución
F; df1=1; df2=13
0.8

0.7

0.6

0.5
Densidad

Rechazar H0. 0.4

0.3

0.2

0.1
0.05
0.0
0 4.667
X
EJERCICIO:

Una empresa dedicada a la producción de cierto artículo


perecible ZZ, desea evaluar la relación existente entre la
distancia recorrida para transportar su producto a los
diferentes puntos de comercialización y las mermas
producidas por dicho transporte. Con este fin, se lleva a
cabo un estudio, observándose entre otras variables: Y=
Porcentaje de carga útil final (luego del transporte);
X=Distancia recorrida (Km)
Encontrándose en una muestra aleatoria de 12 viajes o
recorridos los siguientes resultados:
Carga útil final Distancia recorrida

91 33

95 12

93 18

98 3

97 4

97 8

88 66

94 5

89 37

90 29

92 15

95 10
a) Hallar un modelo de regresión adecuado
b) Hallar el coeficiente de correlación
c) Hallar el coeficiente de determinación
d) Hallar el error estándar

También podría gustarte