Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Concepto de correlación lineal
• Existe correlación positiva si los sujetos con valores altos en X (por
encima de la media en X) tienen también valores altos en Y (por encima de
la media en Y), los sujetos con valores bajos en X (por debajo de la media
en X) tienen también valores bajos en Y (por debajo de la media en Y) y
los sujetos con valores en torno a la media en X también tienen valores en
torno a la media en Y
• Existe correlación negativa si los sujetos con valores altos en X (por
encima de la media en X) tienen valores bajos en Y (por debajo de la media
en Y), los sujetos con valores bajos en X (por debajo de la media en X)
tienen valores altos en Y (por encima de la media en Y) y los sujetos con
valores en torno a la media en X también tienen valores en torno a la
media en Y
• No existe correlación si algunos sujetos con valores altos en X (por encima
de la media en X) tienen valores bajos en Y (por debajo de la media en Y),
otros valores altos en Y (por encima de la media en Y) y otros en torno a
la media en Y 2
Concepto de correlación lineal
Previo al cálculo de un índice de relación lineal es necesario comprobar que los
puntos en el diagrama de dispersión se sitúan en torno a una línea recta
Ejemplo:Consumo diario de cigarrillos (X); Días de ausencia al trabajo (Y)
12 y = 0.2429x + 2.8714
10
8
ausencias
0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
cigarrillos
3
Covarianza (Sxy)
Cálculo
n n
4
Covarianza (Sxy)
Número de Días de
cigarros al ausencia al
día trabajo (X " X ) (Y " Y ) (X " X )(Y " Y )
Sujeto 1 8 4 (8 " 17) = "9 (4 " 7) = "3 +27
Sujeto 2 8 6 (8 " 17) = "9 (6 " 7) = "1 +9
! (16!
!
Sujeto 3 16 6 " 17) = "1 (6 " 7) = "1 +1
! ! !
Sujeto 4 16 7 (16 " 17) = "1 (7 " 7) = 0 0
! ! !
Sujeto 5 20 8 (20 " 17) = +3 (8 " 7) = +1 +3
! ! !
Sujeto 6 20 7 (20 "17) = +3 (7 " 7) = 0 0
! ! !
Sujeto 7 24 8 (24 " 17) = +7 (8 " 7) = +1 +7
! ! !
Sujeto 8 24 10 (24 " 17) = +7 (10 " 7) = +3 21
! ! !
∑ 136 56
! !
0 0
!
68
n
!
X = 136 /8 = 17 # X )(Y " Y )
( X "
!
!
! !
!
68 5
Y =!56 /8 = 7 S! i=1 = 8,5
xy = =
n 8
Covarianza (Sxy)
Interpretación
1. Ver si existe correlación
S xy = 0 " No existe relación lineal entre las dos variables
2. Signo
S xy > 0 " Existe correlación lineal positiva si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen también
valores altos en Y (por encima de la media en Y), los sujetos con
valores bajos en X (por debajo de la media en X) tienen también
valores bajos en Y (por debajo de la media en Y) y los sujetos con
valores en torno a la media en X también tienen valores en torno a
la media en Y
S xy < 0 " Existe correlación lineal negativa si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen valores
bajos en Y (por debajo de la media en Y), los sujetos con valores
bajos en X (por debajo de la media en X) tienen valores altos en Y
(por encima de la media en Y) y los sujetos con valores en torno a
la media en X también tienen valores en torno a la media en Y 6
Covarianza (Sxy)
Propiedades
1. Si transformamos linealmente las variables X e Y, la covarianza
queda multiplicada por el producto de las pendientes
Vi=A+BXi
Wi=C+DYi
Svw=BDSxy
Cálculo
n
n#
Xi " X &# Y " Y & ) ( X i " X )(Yi " Y )
) % (% i (
i=1
% S (% S (
x '$ y Sxy
rxy = i=1$ '
= n =
n Sx Sy Sx Sy
8
!
Coeficiente de correlación de Pearson: rxy
Cálculo
n n n
n # X Y " # X #Y
i i i i
En puntuaciones típicas
"Z xi Z yi
! rxy = i=1
n 9
Coeficiente de correlación de Pearson: rxy
Cigarros (X) Días (Y) (XY ) X2 Y2
Sujeto 1 8 4 8 • 4 = 32 64 16
Sujeto 2 8 6 8 • 6 = 48 64 36
Sujeto 3 16 6! 16 • 6 =!96 256 !! 36
!
Sujeto 4 16 7! 16 • 7 = 112
!
256 ! 49
!
Sujeto 5 20 8 20 • 8 = 160 400 ! 64
! !
Sujeto 6 20 7 20 • 7 = 140 400 ! 49
! !
Sujeto 7 24 8 24 • 8 = 192 576 ! 64
! !
Sujeto 8 24 10 24 •10 = 240 576 100
! ! !
∑ 136 56
!
1020 ! 2592 ! 414
n
!Y
n n
! !
n" XiYi ! " Xi " i
i=1 i=1 i=1 ! 8•1020 !136 • 56
! !
rxy!= ! = = 0,86
8• 2592 !136 2 8• 414 ! 56 2
2 2
n # & n n #n &
n" X ! % " X i (
i
2
n"Yi ! %"Yi (
2
10
i=1 $ i=1 ' i=1 $ i=1 '
Coeficiente de correlación de Pearson: rxy
Cigarros (X) Días (Y) x = (X " X ) y = (Y " Y ) x2 y2 xy
Sujeto 1 8 4 (8 " 17) = "9 (4 " 7) = "3 81 9 +27
Sujeto 2 8 6 (8 " 17) = "9 (6 " 7) = "1 !81 1 +9
! !
!
Sujeto 3 16 (16 " 17) = "1 (6 " 7) = "1 1 ! 1
!6
+1
! ! ! !
Sujeto 4 16 7 (16 " 17) = "1 (7 " 7) = 0 1 0 0
! ! ! ! !
Sujeto 5 20 (20 " 17) = +3 (8 " 7) = +1 9 1
! 8
+3
! ! ! !
Sujeto 6 20 (20 "17) = +3 (7 " 7) = 0 9
! 7 !
0 0
! ! !
Sujeto 7 24 (24 " 17) = +7 (8 " 7) = +1 49 1
! 8
+7
! ! ! !
Sujeto 8 24 (24 " 17) = +7 (10 " 7) = +3 49 9
! 10
+21
! ! ! !
∑ 136
!
56 0
!
0
! !
280
!
22 69
n
! x y! ! ! !
X = 17 " i i
69
! =0,86
i=1
! !=
rxy != ! !
!
280 22
n n
Y =7 " x 2i " yi2 11
i=1 i=1
Coeficiente de correlación de Pearson: rxy
(X " 17) (Y " 7)
Cigarros Días (Y) X2 Y2 Zx =
5'92
Zy =
1,66
Zx • Zy
(X) 64 16 "1,52 "1,8 ("1,52)("1,8) = 2,74
Sujeto 1 8 4 64 ! 36 !
"1,52 "0,6 ! ("1,52)("0,6) = 0,91
! !
Sujeto 2 8 6 256 36 "0,17 "0,6 ("0,17)("0,6) = 0,102
! ! ! ! !
Sujeto 3 16 6 256 49 "0,17 0 ("0,17)(0) = 0
! ! ! ! !
Sujeto 4 16 7 400 64 +0,51 +0,6 (+0,51)(+0,6) = 0,306
! ! ! ! !
Sujeto 5 20 8 400 49 +0,51 0 (+0,51)(0) = 0
! ! ! ! !
Sujeto 6 20 7 576 64 +1,18 +0,6 (+1,18)(+0,6) = 0,708
! ! ! ! !
Sujeto 7 24 8 576 100 +1,18 +1,8 (+1,18)(+1,8) = 2,12
! ! ! ! !
Sujeto 8 24 10 2592 414 0 0 6,89
! ! ! ! !
∑ 136 56
! ! ! ! !
n
X = 17 " X 2 # X 2 != 2592
! #172!=5,92
Y =7
Sx =
n 8
!
"Z !
xi Z yi
! !"Y 2
2 414 #72 =1,66 rxy = i=1 =
6,89 = 0,86
Sy = #Y 12
!
n
=
8 n 8
Coeficiente de correlación de Pearson: rxy
Propiedades
1. "1 # rxy # +1
rxy = +1 "Existe una relación lineal directa perfecta, para
todos los sujetos Zx=Zy
Y
X
13
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy = "1 # Existe una relación lineal inversa perfecta, para
todos los sujetos Zx=-Zy
X
14
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy > 0 Existe una relación lineal directa
15
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy < 0 " Existe una relación lineal inversa
Y
!
X
16
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
rxy = 0 " No existe relación lineal
X
17
Coeficiente de correlación de Pearson: rxy
Propiedades (cont.)
2. El valor absoluto del coeficiente de correlación de Pearson
no varía frente a cualquier transformación lineal de las
variables (el signo de la correlación queda multiplicado por el
producto del signo de las pendientes)
V = A + BX
W = C + DY
rvw = rxy
Si B D Si B D
+ . +=+ + . - =-
- . - =+
" rvw = rxy - . + =-
" rvw = #rxy
! 18
Coeficiente de correlación de Pearson: rxy
Ejemplos
rxy=+0,7 rxy=-0,7 rxy=+0,7 rxy=-0,7
V=5+7X V=5+7X V=5-7X V=5-7X
W=3+5Y W=3+5Y W=3-5Y W=3-5Y
rvw=+0,7 rvw=-0,7 rvw=+0,7 rvw=-0,7
rxy=+0,7 rxy=-0,7
V=5-7X V=5-7X
W=3+5Y W=3+5Y
rvw=-0,7 rvw=+0,7
19
Coeficiente de correlación de Pearson: rxy
• El coeficiente de correlación de Pearson sólo indica la existencia
o inexistencia de relación lineal
Si rxy= 0, podemos afirmar que no existe relación lineal pero
puede existir otro tipo de relación
Ejemplo Y
realizar una tarea
Nº de errores al
Motivación X
20
Coeficiente de correlación de Pearson: rxy
Interpretación
1. Ver si existe relación
rxy = 0 " No existe relación lineal entre las dos variables
2. Signo
rxy > 0 " Existe correlación lineal positiva si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen también
valores altos en Y (por encima de la media en Y), los sujetos con
valores bajos en X (por debajo de la media en X) tienen también
valores bajos en Y (por debajo de la media en Y) y los sujetos con
valores en torno a la media en X también tienen valores en torno
a la media en Y
rxy < 0 " Existe correlación lineal negativa si, en general, los sujetos con
valores altos en X (por encima de la media en X) tienen valores
bajos en Y (por debajo de la media en Y), los sujetos con valores
bajos en X (por debajo de la media en X) tienen valores altos en
Y (por encima de la media en Y) y los sujetos con valores en
torno a la media en X también tienen valores en torno a la media
21
en Y
Coeficiente de correlación de Pearson: rxy
Interpretación (cont.)
3. Intensidad de la relación
- cuanto más próximo esté el valor a 0, menor será la intensidad
- cuanto más próximo esté |rxy|a 1, mayor será la intensidad
22
Coeficiente de correlación de Pearson: rxy
Ejemplo (cont.)
rxy = 0,86
• Existe relación lineal entre el número de cigarrillos que fuman
los sujetos y los días de ausencia al trabajo
• Relación de intensidad alta, aunque habría que comparar con
otras investigaciones
• Los sujetos que más cigarrillos fuman tienden faltar más días al
trabajo y los que fuman menos tienden a faltar menos días
23
Coeficiente de correlación de Pearson: rxy
Porcentaje de varianza común
RENDIMIENTO-LENGUA (Y)
APTITUD VERBAL (X)
FACTORES NO COMUNES
afectan sólo a la aptitud verbal
afectan sólo al rendimiento en lengua
FACTORES COMUNES
24
afectan simultáneamente a la aptitud y al rendimiento
Coeficiente de correlación de Pearson: rxy
Interpretación (cont.)
2
4. rxy porcentaje de varianza que tienen en común ambas variables
(diapositiva siguiente)
5. Correlación ≠ Causalidad
25
Coeficiente de correlación de Pearson: rxy
Ejemplo (cont.)
rxy = 0,86
• Existe relación lineal entre el número de cigarrillos que fuman
los sujetos y los días de ausencia al trabajo
• Relación de intensidad alta, aunque habría que comparar con
otras investigaciones
• Los sujetos que más cigarrillos fuman tienden faltar más días al
trabajo y los que fuman menos tienden a faltar menos días
2 = 0,862 = 0,75 " Existe un 75% de varianza asociada entre el
• rxy
número de cigarrillos que se fuma y los días
de ausencia al trabajo 26
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy
1. Variabilidad del grupo: restricción del rango
Si la variabilidad es reducida en una o ambas variables el valor de rxy
puede verse reducido
Y
X
27
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
2. Influencia de otras variables: mediación
Rendimiento
adultos Grupos de edad
adolescentes
niños
Altura
28
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
2. Influencia de otras variables: moderación
Motivación alta
Rendimiento
Motivación media
Motivación baja
Inteligencia
29
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
2. Influencia de otras variables: moderación
Rendimiento
mujer
varón
Emocionalidad
30
Coeficiente de correlación de Pearson: rxy
Factores que afectan al valor de rxy (cont.)
3. Existencia de valores atípicos bivariados
datos atípicos
Rendimiento bivariados
Emocionalidad
31