Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión lineal
• El modelo de regresión lineal es el más utilizado a la hora de predecir los valores de una
variable cuantitativa a partir de los valores de otra variable explicativa también cuantitativa
(modelo de regresión lineal simple).
Cant. 1 2 3 4 5 6 7 8 9 10 11
Est.
Edad 15 14 17 16 15 16 15 13 17 16 16
Horas 2 0 3 4 3 4 3 1 4 3 5
Conex.
0
0 2 4 6 8 10 12 14 16 18
Si miramos la gráfica y podemos trazar un óvalo que englobe los puntos del
mismo, podemos deducir que las variables tienen alguna relación, si la
relación es positiva, el óvalo quedará como el de nuestro ejemplo, y si queda
hacia abajo la relación será negativa – pero en ambos casos habrá relación
entre ellas.
Ahora deduciremos la ecuación de una recta que pase entre los datos y que
podría quedar como la que graficamos a continuación.
Horas Conex.
6
0
0 2 4 6 8 10 12 14 16 18
La ecuación de una recta sería la que sigue:
Y= a+bX
b= n. (x . y) - x. y
n. x 2 – ( x) 2
b= 11.(508)-(170).(32) = 0,91
11.(2642)-(170)2
Para x= 18
Y=(-11,15)+0,91.18=5,23
Para X= 12
Y=(-11,15)+0,91.13=0,68
Correlación lineal
Para estudiar la relación lineal existente entre dos variables continuas es necesario
disponer de parámetros que permitan cuantificar dicha relación. Uno de estos
parámetros es la covarianza, que indica el grado de variación conjunta de dos
variables aleatorias.
Coeficiente de Pearson
El coeficiente de correlación de Pearson es la covarianza estandarizada, y su
ecuación difiere dependiendo de si se aplica a una muestra, Coeficiente de Pearson
muestral (r), o si se aplica la población Coeficiente de Pearson poblacional (ρ).
Condiciones
• La relación que se quiere estudiar entre ambas variables es lineal (de lo
contrario, el coeficiente de Pearson no la puede detectar).
• Las dos variables deben de ser cuantitativas.
• Normalidad: ambas variables se tienen que distribuir de forma
normal. Varios textos defienden su robustez cuando las variables se alejan
moderadamente de la normal.
Características
• Toma valores entre [-1, +1], siendo +1 una correlación lineal positiva perfecta
y -1 una correlación lineal negativa perfecta.
• Es una medida independiente de las escalas en las que se midan las variables.
• No varía si se aplican transformaciones a las variables.
• No tiene en consideración que las variables sean dependientes o
independientes.
• El coeficiente de correlación de Pearson no equivale a la pendiente de la recta
de regresión.
• Es sensible a outliers, por lo que se recomienda en caso de poder justificarlos,
excluirlos del análisis.