Está en la página 1de 16

Regresión lineal simple y correlación

La correlación lineal y la regresión lineal simple son métodos estadísticos que estudian la relación lineal existente entre dos
variables. Diferencias: La correlación lineal cuantifica que tan relacionadas están dos variables, mientras que la regresión
lineal consiste en generar un modelo (ecuación) que en base a ambas variables permita decidir el valor de una a partir de la
otra.

La regresión lineal simple consiste en generar un modelo (ecuación de una recta) que permita explicar la relación lineal que
existe entre dos variables . A la variable dependiente se le identifica como 𝒚 y a la variable predictora o independiente como X

El modelo de regresión lineal simple se describe de acuerdo a la ecuación:


Y=β0+β1X1+ϵ

Siendo β0 la ordenada en el origen, β1 la pendiente y ϵ el error aleatorio. Este último representa la diferencia entre el valor
ajustado por la recta y el valor real. Recoge el efecto de todas aquellas variables que influyen en Y pero que no se incluyen en
el modelo como predictores. Al error aleatorio también se le conoce como residuo.

En la gran mayoría de casos, los valores β0 y β1 poblacionales son desconocidos, por lo que, a partir de una muestra, se
obtienen sus estimaciones β^0 y β^1

Estas estimaciones se conocen como coeficientes de regresión, ya que toman aquellos valores que minimizan la suma de
cuadrados residuales, dando lugar a la recta que pasa más cerca de todos los puntos. (Existen alternativas al método de
mínimos cuadrados para obtener las estimaciones de los coeficientes).
PLANTEAMIENTO
Una compañía de seguros desea determinar el grado de relación entre el
ingreso familiar “x” y el monto de seguro de vida “y” del jefe de familia.
Con base en una muestra aleatoria de 18 familias, se obtuvo la siguiente
información (en miles de dólares).

Ingreso 45 20 40 40 47 30 25 20 15 35 40 55 50 60 15 30 35 45
(x)

Seguro 70 50 60 50 90 55 55 35 40 65 75 105 110 120 30 40 65 80


de vida
(y)
DIAGRAMA DE DISPERCION
Tema 1: Regresión lineal simple y correlación.
DIAGRAMA DE DISPERCION
¿QUE INDICA MI DIAGRAMA? DESCRIPCCION
En este diagrama de flujo con los datos obtenidos del problema, nos El diagrama de dispersión se usa comúnmente para mostrar
muestra como resultado que el diagrama de dispersión va de Forma cómo dos variables se relacionan entre sí. De este modo, permite
ascendente. Lo que significa que mientras mas alto es el ingreso de la estudiar las relaciones que existen entre dos factores, problemas
o causas relacionadas.
familia puede acceder a mejores seguros de vida

SEGURO DE
INGRESOS VIDA
DIAGRAMA DE DISPERSION 45 70
20 50
140
40 60
120 40 50
SEGURO DE VIDA

100 47 90
80 30 55
25 55
60
20 35
40 15 40
20 35 65
0 40 75
10 20 30 40 50 60 70 55 105
INGRESO FAMILIAR 50 110
60 120
15 30
30 40
35 65
45 80
MEJOR ESTIMACION DE LA RECTA
Tema 1: Regresión lineal simple y correlación.
DATOS FORMULAS SUSTITUCION
a= =2.500227
N= 18 Ῡ= a + bx
a=
b= = 1.77
b=
Ῡ = 2.500227+1.77X

SEGURO DE VIDA Ῡ
INGRESOS (X) (Y) (X)(Y) X² x = 2.500227+1.77x
45 70 3150 2025 45 82.150227
20 50 1000 400 20 37.900227
40 60 2400 1600 40 73.300227
40 50 2000 1600 40 73.300227
47 90 4230 2209 47 85.690227
30 55 1650 900 30 55.600227
25 55 1375 625 25 46.750227
20 35 700 400 20 37.900227
15 40 600 225 15 29.050227
35 65 2275 1225 35 64.450227
40 75 3000 1600 40 73.300227
55 105 5775 3025 55 99.850227
50 110 5500 2500 50 91.000227
60 120 7200 3600 60 108.700227
15 30 450 225 15 29.050227
30 40 1200 900 30 55.600227
35 65 2275 1225 35 64.450227
45 80 3600 2025 82.150227
45
=647 =1195 48380 =26309 =647 =1190.194086
MEJOR ESTIMACION DE LA RECTA x Ῡ= 2.500227+1.77x
45 82.150227
20 37.900227
Una recta que mejor se ajusta es una línea recta que es la mejor 40 73.300227
aproximación del conjunto de datos dado. Es usada para estudiar la 40 73.300227
naturaleza de la relación entre dos variables. 47 85.690227
30 55.600227
Una recta que mejor se ajusta puede ser determinada aproximadamente 25 46.750227
usando el método visual al dibujar una línea recta en una grafica de 20 37.900227
15 29.050227
dispersión para que tanto el número de puntos arriba de la 35 64.450227
recta y debajo de la recta sean casi iguales (y la línea pasa a través de 40 73.300227
tantos puntos como sea posible). 55 99.850227
50 91.000227
60 108.700227
¿QUE INDICA MI DIAGRAMA? 15 29.050227
De igual manera que con los datos de el diagrama de dispersión se 30 55.600227
35 64.450227
observa que la recta va de forma ascendente. 45 82.150227
=647 =1190.194086
Una recta que se ajusta mejor es una línea recta, la cual es la mejor
aproximación del conjunto de datos dado.

DIAGRAMA DE DISPERCION Y MEJOR


ESTIMACION DE LA RECTA
140
120 MEJOR ESTIMACION DE LA
SEGURO DE VIDA

100 RECTA
80
60
DIAGRAMA DE FLUJO O
40
DISPERCION
20
0
10 20 30 40 50 60 70
INGRESO FAMILIAR
ERROR ESTANDAR EN LA MEJOR
ESTIMACION DE LA RECTRA
Tema 1: Regresión lineal simple y correlación.
ERROR ESTANDAR EN LA MEJOR ESTIMACION DE
LA RECTA
FORMULA SUSTITUCION SEGURO DE =2.500227+1.77
INGRESOS (X) VIDA (Y) x (
s 45 70 82.150227 147.6280162
20 50 37.900227 146.4045067
40 60 73.300227 176.8960383

s S= 40
47
50
90
73.300227
85.690227
542.9005783
18.57414331

S= 11.1711 30
25
55
55
55.600227
46.750227
0.360272452
68.05875455
20 35 37.900227 8.411316652
15 40 29.050227 119.8975288
35 65 64.450227 0.302250352
40 75 73.300227 2.889228252
55 105 99.850227 26.52016195
50 110 91.000227 360.9913741
60 120 108.700227 127.6848699
ERROR ESTANDAR EN LA MEJOR ESTIMACION DE LA RECTRA 15 30 29.050227 0.902068752
30 40 55.600227 243.3670825
35 65 64.450227 0.302250352
La desviación estándar de una estimación se denomina 45 80 82.150227 4.623476152
error estándar. El error estándar del coeficiente mide la
precisión con la que el modelo estima el valor desconocido
del coeficiente. El error estándar del coeficiente siempre es
positivo.
647 1195 1190.1941 1996.713917

El error estándar de la estimación de la recta mide la dispersión de la línea de regresión.


Es una medida de cuanto pueden variar los valores que se alejan de la línea.
COEFICIENTE DE CORRELACION
DE PEARSON
Tema 1: Regresión lineal simple y correlación.
COEFICIENTE DE CORRELACION DE PEARSON SEGURO
INGRESO DE VIDA
S (X) (Y) (X)(Y) X² y²
FORMULAS SUSTITUCION 45 70 3150 2025 4900
20 50 1000 400 2500
s s 40 60 2400 1600 3600
s=3052.944 40
47
50
90
2000
4230
1600
2209
2500
8100
s s 30 55 1650 900 3025
25 55 1375 625 3025

s s=11640.27 20
15
35
40
700
600
400
225
1225
1600
s 35 65 2275 1225 4225
40 75 3000 1600 5625
r= s= 5426.388 55 105 5775 3025 11025
r= 50
60
110
120
5500
7200
2500
3600
12100
14400
r= 0.3256 15 30 450 225 900
30 40 1200 900 1600
35 65 2275 1225 4225
45 80 3600 2025 6400

∑=647 ∑=1195 ∑ 48380


= ∑=26309 ∑=90975

DESCRIPCION
El coeficiente de correlación de Pearson es una prueba que mide la relación
estadística entre dos variables continuas. Si la asociación entre los elementos no es
lineal, entonces el coeficiente no se encuentra representado adecuadamente. El
coeficiente de correlación puede tomar un rango de valores de +1 a -1.
VALOR TIPO DE CORRELACION El coeficiente de
-1 Correlación negativa grande y
correlación de
perfecta Pearson es de 0.32 el
-0.9 A -0.99 Correlación negativa muy alta tipo de correlación
es correlación
-0.7 A -0.89 Correlación negativa alta
positiva baja
-0.4 A -0.69 Correlación negativa moderada

-0.2 A -0.39 Correlación negativa baja

-0.01 A -0.19 Correlación negativa muy baja

0 Correlación nula

0.01 A 0.19 Correlación positiva muy baja

0.2 A 0.39 Correlación positiva baja

0.4 A 0.69 Correlación positiva moderada

0.7 A 0.89 Correlación positiva alta

0.9 A 0.99 Correlación positiva muy alta

1 Correlación positiva grande y


perfecta
COEFICIENTE DE CORRELACION
DE SPEARMAN
Tema 1: Regresión lineal simple y correlación.
RELACION ENTRE EL COEFICIENTE DE
CORRELACION DE PEARON Y SPEARMAN
Tema 1: Regresión lineal simple y correlación.
VARIANZA Y DESVIACION
ESTANDAR
Tema 1: Regresión lineal simple y correlación.
RELACION ENTRE DESVIACION
ESTANDAR Y EL ERROR ESTANDAR EN LA
MEJOR ESTIMACION DE LA RECTA
Tema 1: Regresión lineal simple y correlación.

También podría gustarte