Está en la página 1de 31

Tema 9.

Correlación entre variables


cuantitativas
1.  Concepto de correlación lineal
2.  Covarianza: sxy
3.  Coeficiente de correlación de Pearson: rxy

1
Concepto de correlación lineal
•  Existe correlación positiva si los sujetos con valores altos en X (por
encima de la media en X) tienen también valores altos en Y (por encima de
la media en Y), los sujetos con valores bajos en X (por debajo de la media
en X) tienen también valores bajos en Y (por debajo de la media en Y) y
los sujetos con valores en torno a la media en X también tienen valores en
torno a la media en Y
•  Existe correlación negativa si los sujetos con valores altos en X (por
encima de la media en X) tienen valores bajos en Y (por debajo de la media
en Y), los sujetos con valores bajos en X (por debajo de la media en X)
tienen valores altos en Y (por encima de la media en Y) y los sujetos con
valores en torno a la media en X también tienen valores en torno a la
media en Y
•  No existe correlación si algunos sujetos con valores altos en X (por encima
de la media en X) tienen valores bajos en Y (por debajo de la media en Y),
otros valores altos en Y (por encima de la media en Y) y otros en torno a
la media en Y 2
Concepto de correlación lineal
Previo al cálculo de un índice de relación lineal es necesario comprobar que los
puntos en el diagrama de dispersión se sitúan en torno a una línea recta
Ejemplo:Consumo diario de cigarrillos (X); Días de ausencia al trabajo (Y)
12 y = 0.2429x + 2.8714

10

8
ausencias

0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34

cigarrillos
3
Covarianza (Sxy)

Cálculo

n n

#(X " X )(Y " Y ) # X Y


i i i i

Sxy = i=1 = i=1 " X •Y


n n

4
Covarianza (Sxy)
Número de Días de
cigarros al ausencia al
día trabajo (X " X ) (Y " Y ) (X " X )(Y " Y )
Sujeto 1 8 4 (8 " 17) = "9 (4 " 7) = "3 +27
Sujeto 2 8 6 (8 " 17) = "9 (6 " 7) = "1 +9
! (16!
!
Sujeto 3 16 6 " 17) = "1 (6 " 7) = "1 +1
! ! !
Sujeto 4 16 7 (16 " 17) = "1 (7 " 7) = 0 0
! ! !
Sujeto 5 20 8 (20 " 17) = +3 (8 " 7) = +1 +3
! ! !
Sujeto 6 20 7 (20 "17) = +3 (7 " 7) = 0 0
! ! !
Sujeto 7 24 8 (24 " 17) = +7 (8 " 7) = +1 +7
! ! !
Sujeto 8 24 10 (24 " 17) = +7 (10 " 7) = +3 21
! ! !
∑ 136 56
! !
0 0
!
68
n
!
X = 136 /8 = 17 # X )(Y " Y )
( X "
!
!
! !
!
68 5
Y =!56 /8 = 7 S! i=1 = 8,5
xy = =
n 8
Covarianza (Sxy)
Interpretación
1.  Ver si existe correlación
S xy = 0 " No existe relación lineal entre las dos variables
2. Signo
S xy > 0 " Existe correlación lineal positiva si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen también
valores altos en Y (por encima de la media en Y), los sujetos con
valores bajos en X (por debajo de la media en X) tienen también
valores bajos en Y (por debajo de la media en Y) y los sujetos con
valores en torno a la media en X también tienen valores en torno a
la media en Y
S xy < 0 " Existe correlación lineal negativa si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen valores
bajos en Y (por debajo de la media en Y), los sujetos con valores
bajos en X (por debajo de la media en X) tienen valores altos en Y
(por encima de la media en Y) y los sujetos con valores en torno a
la media en X también tienen valores en torno a la media en Y 6
Covarianza (Sxy)
Propiedades
1.  Si transformamos linealmente las variables X e Y, la covarianza
queda multiplicada por el producto de las pendientes
Vi=A+BXi
Wi=C+DYi
Svw=BDSxy

2. Es función de las unidades de medida de los datos, por lo


tanto, un valor mayor de la covarianza no siempre indica
una correlación mayor no es un buen índice para
determinar la intensidad de la relación
7
Coeficiente de correlación de Pearson:
rxy
•  Es un valor abstracto que no depende de las unidades de medida
de las variables

Cálculo

n
n#
Xi " X &# Y " Y & ) ( X i " X )(Yi " Y )
) % (% i (
i=1
% S (% S (
x '$ y Sxy
rxy = i=1$ '
= n =
n Sx Sy Sx Sy

8
!
Coeficiente de correlación de Pearson: rxy

Cálculo n n n
n # X Y " # X #Y
i i i i

rxy = i=1 i=1 i=1


En puntuaciones directas n $ n '2 n $ n '2
& ) & )
n
n # X i2 " &
&
#
Xi ) n
)
#
Y i2 " &
&
Yi )
)
#
i=1 % i=1 ( i=1 % i=1 (
"x y i i

rxy = i=1 En puntuaciones diferenciales


n n
!
"x "y 2
i
2
i
i=1 i=1
n

En puntuaciones típicas
"Z xi Z yi
! rxy = i=1
n 9
Coeficiente de correlación de Pearson: rxy
Cigarros (X) Días (Y) (XY ) X2 Y2
Sujeto 1 8 4 8 • 4 = 32 64 16
Sujeto 2 8 6 8 • 6 = 48 64 36
Sujeto 3 16 6! 16 • 6 =!96 256 !! 36
!
Sujeto 4 16 7! 16 • 7 = 112
!
256 ! 49
!
Sujeto 5 20 8 20 • 8 = 160 400 ! 64
! !
Sujeto 6 20 7 20 • 7 = 140 400 ! 49
! !
Sujeto 7 24 8 24 • 8 = 192 576 ! 64
! !
Sujeto 8 24 10 24 •10 = 240 576 100
! ! !
∑ 136 56
!
1020 ! 2592 ! 414
n
!Y
n n
! !
n" XiYi ! " Xi " i
i=1 i=1 i=1 ! 8•1020 !136 • 56
! !
rxy!= ! = = 0,86
8• 2592 !136 2 8• 414 ! 56 2
2 2
n # & n n #n &
n" X ! % " X i (
i
2
n"Yi ! %"Yi (
2
10
i=1 $ i=1 ' i=1 $ i=1 '
Coeficiente de correlación de Pearson: rxy
Cigarros (X) Días (Y) x = (X " X ) y = (Y " Y ) x2 y2 xy
Sujeto 1 8 4 (8 " 17) = "9 (4 " 7) = "3 81 9 +27
Sujeto 2 8 6 (8 " 17) = "9 (6 " 7) = "1 !81 1 +9
! !
!
Sujeto 3 16 (16 " 17) = "1 (6 " 7) = "1 1 ! 1
!6
+1
! ! ! !
Sujeto 4 16 7 (16 " 17) = "1 (7 " 7) = 0 1 0 0
! ! ! ! !
Sujeto 5 20 (20 " 17) = +3 (8 " 7) = +1 9 1
! 8
+3
! ! ! !
Sujeto 6 20 (20 "17) = +3 (7 " 7) = 0 9
! 7 !
0 0
! ! !
Sujeto 7 24 (24 " 17) = +7 (8 " 7) = +1 49 1
! 8
+7
! ! ! !
Sujeto 8 24 (24 " 17) = +7 (10 " 7) = +3 49 9
! 10
+21
! ! ! !
∑ 136
!
56 0
!
0
! !
280
!
22 69
n
! x y! ! ! !
X = 17 " i i
69
! =0,86
i=1
! !=
rxy != ! !
!
280 22
n n
Y =7 " x 2i " yi2 11
i=1 i=1
Coeficiente de correlación de Pearson: rxy
(X " 17) (Y " 7)
Cigarros Días (Y) X2 Y2 Zx =
5'92
Zy =
1,66
Zx • Zy
(X) 64 16 "1,52 "1,8 ("1,52)("1,8) = 2,74
Sujeto 1 8 4 64 ! 36 !
"1,52 "0,6 ! ("1,52)("0,6) = 0,91
! !
Sujeto 2 8 6 256 36 "0,17 "0,6 ("0,17)("0,6) = 0,102
! ! ! ! !
Sujeto 3 16 6 256 49 "0,17 0 ("0,17)(0) = 0
! ! ! ! !
Sujeto 4 16 7 400 64 +0,51 +0,6 (+0,51)(+0,6) = 0,306
! ! ! ! !
Sujeto 5 20 8 400 49 +0,51 0 (+0,51)(0) = 0
! ! ! ! !
Sujeto 6 20 7 576 64 +1,18 +0,6 (+1,18)(+0,6) = 0,708
! ! ! ! !
Sujeto 7 24 8 576 100 +1,18 +1,8 (+1,18)(+1,8) = 2,12
! ! ! ! !
Sujeto 8 24 10 2592 414 0 0 6,89
! ! ! ! !
∑ 136 56
! ! ! ! !
n
X = 17 " X 2 # X 2 != 2592
! #172!=5,92
Y =7
Sx =
n 8
!
"Z !
xi Z yi
! !"Y 2
2 414 #72 =1,66 rxy = i=1 =
6,89 = 0,86
Sy = #Y 12
!
n
=
8 n 8
Coeficiente de correlación de Pearson: rxy
Propiedades
1. "1 # rxy # +1
rxy = +1 "Existe una relación lineal directa perfecta, para
todos los sujetos Zx=Zy
Y

X
13
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy = "1 # Existe una relación lineal inversa perfecta, para
todos los sujetos Zx=-Zy

X
14
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy > 0 Existe una relación lineal directa

15
Coeficiente de correlación de Pearson: rxy

Propiedades (cont.)
rxy < 0 " Existe una relación lineal inversa

Y
!

X
16
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy = 0 " No existe relación lineal

X
17
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
2. El valor absoluto del coeficiente de correlación de Pearson
no varía frente a cualquier transformación lineal de las
variables (el signo de la correlación queda multiplicado por el
producto del signo de las pendientes)
V = A + BX
W = C + DY
rvw = rxy
Si B D Si B D
+ . +=+ + . - =-
- . - =+
" rvw = rxy - . + =-
" rvw = #rxy
! 18
Coeficiente de correlación de Pearson: rxy
Ejemplos
rxy=+0,7 rxy=-0,7 rxy=+0,7 rxy=-0,7
V=5+7X V=5+7X V=5-7X V=5-7X
W=3+5Y W=3+5Y W=3-5Y W=3-5Y
rvw=+0,7 rvw=-0,7 rvw=+0,7 rvw=-0,7

rxy=+0,7 rxy=-0,7
V=5-7X V=5-7X
W=3+5Y W=3+5Y
rvw=-0,7 rvw=+0,7
19
Coeficiente de correlación de Pearson: rxy
•  El coeficiente de correlación de Pearson sólo indica la existencia
o inexistencia de relación lineal
Si rxy= 0, podemos afirmar que no existe relación lineal pero
puede existir otro tipo de relación

Ejemplo Y
realizar una tarea
Nº de errores al

Motivación X
20
Coeficiente de correlación de Pearson: rxy
Interpretación
1.  Ver si existe relación
rxy = 0 " No existe relación lineal entre las dos variables
2. Signo
rxy > 0 " Existe correlación lineal positiva si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen también
valores altos en Y (por encima de la media en Y), los sujetos con
valores bajos en X (por debajo de la media en X) tienen también
valores bajos en Y (por debajo de la media en Y) y los sujetos con
valores en torno a la media en X también tienen valores en torno
a la media en Y
rxy < 0 " Existe correlación lineal negativa si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen valores
bajos en Y (por debajo de la media en Y), los sujetos con valores
bajos en X (por debajo de la media en X) tienen valores altos en
Y (por encima de la media en Y) y los sujetos con valores en
torno a la media en X también tienen valores en torno a la media
21
en Y
Coeficiente de correlación de Pearson: rxy
Interpretación (cont.)
3. Intensidad de la relación
- cuanto más próximo esté el valor a 0, menor será la intensidad
- cuanto más próximo esté |rxy|a 1, mayor será la intensidad

Siempre conviene comparar con los valores obtenidos en otras


investigaciones realizadas con las mismas variables

22
Coeficiente de correlación de Pearson: rxy

Ejemplo (cont.)
rxy = 0,86
•  Existe relación lineal entre el número de cigarrillos que fuman
los sujetos y los días de ausencia al trabajo
•  Relación de intensidad alta, aunque habría que comparar con
otras investigaciones
•  Los sujetos que más cigarrillos fuman tienden faltar más días al
trabajo y los que fuman menos tienden a faltar menos días

23
Coeficiente de correlación de Pearson: rxy
Porcentaje de varianza común

RENDIMIENTO-LENGUA (Y)
APTITUD VERBAL (X)

hacen variar 2 hacen variar


de forma de forma
sistemática la sistemática el
aptitud rendimiento
i

hacen variar de forma sistemática aptitud y rendimiento

FACTORES NO COMUNES
afectan sólo a la aptitud verbal
afectan sólo al rendimiento en lengua
FACTORES COMUNES
24
afectan simultáneamente a la aptitud y al rendimiento
Coeficiente de correlación de Pearson: rxy
Interpretación (cont.)

2
4. rxy porcentaje de varianza que tienen en común ambas variables
(diapositiva siguiente)

5. Correlación ≠ Causalidad

25
Coeficiente de correlación de Pearson: rxy

Ejemplo (cont.)
rxy = 0,86
•  Existe relación lineal entre el número de cigarrillos que fuman
los sujetos y los días de ausencia al trabajo
•  Relación de intensidad alta, aunque habría que comparar con
otras investigaciones
•  Los sujetos que más cigarrillos fuman tienden faltar más días al
trabajo y los que fuman menos tienden a faltar menos días
2 = 0,862 = 0,75 " Existe un 75% de varianza asociada entre el
• rxy
número de cigarrillos que se fuma y los días
de ausencia al trabajo 26
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy
1. Variabilidad del grupo: restricción del rango
Si la variabilidad es reducida en una o ambas variables el valor de rxy
puede verse reducido
Y

X
27
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
2. Influencia de otras variables: mediación

Rendimiento
adultos Grupos de edad
adolescentes

niños

Altura
28
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
2. Influencia de otras variables: moderación

Motivación alta
Rendimiento
Motivación media

Motivación baja

Inteligencia
29
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
2. Influencia de otras variables: moderación

Rendimiento
mujer
varón

Emocionalidad
30
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
3. Existencia de valores atípicos bivariados

datos atípicos
Rendimiento bivariados

Emocionalidad
31

También podría gustarte