Está en la página 1de 39

TEMA 11.

DESCRIPCIÓN CONJUNTA DE
DOS VARIABLES: CORRELACIÓN
1. INTRODUCCIÓN
2. REPRESENTACIÓN GRÁFICA DE UNA RELACIÓN
4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL
4.1. COVARIANZA (Sxy)
4.2. COEFICIENTE DE CORRELACIÓN DE PEARSON
(rxy)
4.2.1. CÁLCULO DE rxy
4.2.2. INTERPRETACIÓN Y PROPIEDADES DE rxy
4.2.3. VALORACIÓN E INTERPRETACIÓN DE rxy
Amón, J. (1991). Estadística para psicólogos. Vol I. Estadística
Descriptiva. Madrid: Pirámide.
Botella, J.; León, O.; San Martín, R., y Barriopedro, M.I. (2001).
Análisis de Datos en Psicología I. Teoría y Ejercicios. Madrid:
Pirámide.
De la Fuente, E.I. y García, J. (1998). Análisis de datos en
Psicología. Ejercicios de estadística descriptiva. Granada:
Urbano.
Escobar, M. (1999). Análisis gráfico/exploratorio. Cuadernos de
Estadística nº 2. Madrid: Muralla-Hespérides.
Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J.
(1992). Análisis Exploratorio de Datos: nuevas técnicas
estadísticas. Barcelona: PPU.
McRae, S. (1995). Modelos y métodos para las Ciencias del
Comportamiento. Barcelona: Ariel.
Merino, J.M; Moreno, E; Padilla, M; Rodríguez-Miñón, P;
Villarino, A. (2001). Análisis de Datos en Psicología I. Madrid:
UNED.
Palmer, A. (1995). El análisis exploratorio de datos. Madrid:
Eudema
Pérez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos
de Análisis de Datos. Madrid: Pirámide.
Pérez, F.J., Manzano, V. y Fazeli, H. (1999). Análisis de Datos en
Psicología. Madrid: Pirámide.
San Martín, R., Espinosa, L. y Fernández, L. (1987).
Psicoestadística Descriptiva. Madrid: Pirámide.
Stenberg, R.J. (1993). Investigar en Psicología. Barcelona: Paidós.
Objetivo
Intentaremos medir la posible relación entre dos
variables. Estudiaremos bajo título
“correlación” los problemas referentes a la
variación conjunta de dos variables, su
intensidad y su sentido (positivo o negativo)
1. INTRODUCCIÓN
 Uno de los objetivos principales de la ciencia consiste en
descubrir las relaciones entre variables, y la estadística ha
desarrollado instrumentos para ello
 En el campo de la Psicología podemos preguntarnos si el
rendimiento laboral en un determinado tipo de trabajo
guarda relación con la personalidad del trabajador, si el
fracaso escolar es mas probable en niños con determinadas
circunstancias familiares y personales, si hay tareas en que la
práctica masiva facilita más el aprendizaje que la práctica
distribuido o si determinados rasgos de personalidad están
asociados a una mayor propensión al suicidio.
 La observación de relaciones claras y estables entre variables
ayuda a comprender los fenómenos y a a encontrar
explicaciones de los mismos e indica las vías probablemente
mas eficaces para intervenir sobre las situaciones
 Desde el punto de vista matemático las relaciones entre
variables pueden ser de muchos tipos (Y=1+2·X; Y=X2; Y=82;
Y=1/X).
 Estas funciones son conceptos matemáticos y, por tanto,
teóricos e ideales. Son habitualmente útiles en las ciencias
exactas, en las que las variables guardan una relación
determinista o funcional.
 Pero en las ciencias sociales, incluida la psicología nunca se
encuentran relaciones deterministas, sino mas bien conjuntos
de observaciones que manifiestan una configuración
concreta, y nos preguntaremos si esa configuración (que
refleja la relación entre variables) se parece a alguno de los
modelos teóricos; en caso afirmativo diremos que ese modelo
explica bien la relación.
 Nosotros nos centraremos en el estudio de las relaciones
lineales, que son las más sencillas.
 Esto es, lo que vamos a exponer en el tema son las formas
más habituales de observar y cuantificar las relaciones
lineales entre variables
 Advertimos por tanto que aunque en el tema hablemos sobre
relaciones o correlaciones entre variables, estrictamente
hablando deberíamos utilizar la expresión relación lineal y si
no lo hacemos será únicamente por economía de espacio.
 Igualmente los índices que vamos a describir son aplicables
exclusivamente a las variables al menos de intervalo. La
asociación entre variables con otros niveles de medida
(nominales u ordinales) se pueden evaluar por otros
procedimientos que exceden los objetivos del temario.
2. REPRESENTACIÓN GRÁFICA DE UNA
RELACIÓN
Los procedimientos para determinar la existencia y grado de
relación lineal entre dos variables deben ser también capaces
de discriminar entre los tres tipos de relación lineal que hay.
Supongamos las variables X e Y:
 Relación lineal positiva o directa: cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores bajos en X
Ejemplo: motivacion y rendimiento
 Relación lineal negativa o inversa: cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores altos en X
Ejemplo: Tiempo de realización de una tarea y número de
errores
 Relación nula: cuando no hay un emparejamiento sistemático
entre ellas en función de sus valores
Ejemplo: estatura y rendimiento

Importante: Una correlación nula no indica ausencia de relación,


sino ausencia de relación lineal. En otras palabras, indica que
el modelo lineal no se ajusta al comportamiento de esas
variables, pero puede haber algún tipo de relación entre ellas
(ejemplo de la activación y el rendimiento)
Veamos los siguientes conjuntos de datos que
representan las relaciones anteriores
SUJ MOTIV RENDIM SUJ TIEMPO ERROR SUJ ESTATU. INTELI.
(X) (Y) (X) ES (Y) (X) (Y)
1 9 5 1 7 4 1 7 3
2 12 5 2 11 2 2 8 1
3 6 1 3 5 4 3 5 3
4 9 4 4 5 5 4 12 3
5 7 2 5 6 4 5 8 2
6 9 2 6 9 4 6 9 4
7 5 1 7 13 1 7 7 4
8 9 3 8 8 2 8 6 4
9 7 3 9 4 5 9 6 3
10 3 1 10 9 3 10 9 2
11 10 4 11 6 3 11 9 3
12 6 2 12 10 2 12 6 2
13 11 5 13 11 1 13 10 2
14 4 2 14 9 2 14 10 4
15 13 5 15 7 3 15 8 5
La representaciones gráficas conjunta de dos variables
permite observar visualmente este tipo de
relaciones.
Estas representaciones gráficas se denominan
diagramas de dispersión, que constituyen nubes de
puntos donde representamos los pares de valores de
X e Y para cada uno de los sujetos y los
representamos en un eje de coordenadas
Relación lineal positiva. Relación lineal negativa.
Motivación y rendimiento Tiempo en una tarea y numero
de errores

Ausencia de relación lineal.


Estatura e Inteligencia
Destaquemos que este tipo de relación, bien positiva o negativa
en que los puntos forman una línea perfecta son situaciones
que no se dan nunca en relaciones reales entre variables
psicológicas; sólo podemos considerarlo como un modelo
ideal.
4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL
4.1. COVARIANZA (Sxy)
Desarrollaremos procedimientos precisos capaces de distinguir
entre los tres tipos de relación descritos y cuantificar el grado
de relación
Un primer procedimientos consistiría en hallar el promedio de los
productos cruzados de las puntuaciones diferenciales
Al hablar de productos cruzados nos referimos al producto para
cada sujeto o caso de sus puntuaciones diferenciales en ambas
variables

 Xi  X Yi  Y 
n

i 1
n
Es lo que se denomina covarianza y se representa
Sxy
a) Datos no agrupados

 Xi  X Yi  Y 
n

Cov( X , Y )  Sxy  i 1
n
n

x y i i
Cov( X , Y )  Sxy  i 1
 X ·Y
n

b) Datos agrupados

 n Xi  X Yi  Y 
n

ij
Cov( X , Y )  Sxy  i 1
n
n

n x y ij i i
Cov( X , Y )  Sxy  i 1
 X ·Y
n
Interpretación:
Sxy positivo: covarianza positiva
Sxy negativo: covarianza negativa
Sxy cero: ausencia de covariación

Propiedades
1. El índice es capaz de discriminar entre los tres tipos de relación
lineal

2. Problemas en la interpretación:
a) Depende de las unidades de medida de las variables (no
permite comparar)
b) Es un valor no acotado (carece de máximos y mínimos estables)
con lo cual no tenemos información sobre su cuantía y es difícil su
interpretación

Solución: Coeficiente de correlación de Pearson (Rxy)


Ejemplo: Obtención de la covarianza entre cinco pares de puntuaciones para
los mismos sujetos en ansiedad y depresión medidos en dos cuestionarios
diferentes (X, Y) y (V,W)

Ans(X) Depr(Y) XY Ans(V) Depr(W) VW


1,71 78 133,38 5,61 171,96 964,70
1,60 65 104 5,25 143,30 752,33
1,57 63 98,91 5,15 138,89 715,28
1,66 74 122,84 5,45 163,14 889,11
1,67 73 121,91 5,48 160,94 881,95
8,21 353 581,04 26,94 778,23 4203,37

X  1,624 Y  70,6 V  5,388 W  155,646


581,04
Sxy   1,624·70,6  0,283
5
4203,37
Svw   5,388·155,646  2,053
5
4.2. COEFICIENTE DE CORRELACIÓN DE
PEARSON (Rxy)
Un segundo índice de asociación lineal consistirá en hallar
también un promedio de productos cruzados, pero no de las
puntuaciones diferenciales, sino de las puntuaciones típicas.
Este índice se denomina coeficiente de correlación de Pearson
y se representa por la letra r (a veces puede aparecer en
mayúsculas). Así, en teoría las correlación de Pearson entre X
e Y será:

rxy 
 z xi ·z yi

n
La correlación no es, por tanto, más que una covarianza hallada
sobre las puntuaciones tipificadas; por eso a veces se dice que la
correlación es una covarianza estandarizada o que es una
covarianza adimensional.
La formula anterior no resulta muy práctica a la hora de hacer
cálculos, pues exige la tipificación de cada puntuación, y para
ello hay que hallar previamente las medias y desviaciones típicas
de cada variable.
Para facilitar el cálculo se han derivado otras fórmulas alternativas
equivalentes que en la mayoría de casos resultan más prácticas:

rxy 
 x yi· i

n·Sx·Sy
Sxy
rxy 
Sx·Sy
4.2.1. CÁLCULO DE rxy

1. Datos no agrupados

n XiYi   Xi  Yi 
rxy 
n Xi   Xi  n Yi   Yi 
2 2 2 2
2. Datos agrupados

n  nxy XiYi   nx Xi  n yYi 


rxy 
n nx Xi   nx Xi  n n yYi   n yYi 
2 2 2 2

Donde:
nx: observaciones o frecuencias marginales de X
ny: observaciones o frecuencias marginales de Y
Nxy: observaciones dentro de las casillas interiores
de la tabla de frecuencias. Es decir, el número de
observaciones que pertenecen a un cierto intervalo
de la variable X y a otro de la variable Y
4.2.2. INTERPRETACIÓN Y PROPIEDADES DE Rxy

1. El coeficiente de correlación de Pearson no puede


valer menos que -1 y mas que 1, esto es -1≤ 0 ≤ 1
 Cercano a -1: correlación lineal negativa
 Cercano a 0: ausencia de correlación lineal
 Cercano a 1: correlación lineal positiva

2. Es un valor adimensional, es invariante frente a


cualquier unidad de medida –permite comparar
diferentes variables o la misma variable medida en
diferentes grupos-
3. Si hacemos transformaciones lineales de una o de las
dos variables, en que las constantes multiplicadoras
son positivas, el coeficiente de correlación de
Pearson no se altera
Si U= a·X+b y V= c·Y+d siendo (a y c >0)
entonces Ruv=Rxy
Ejemplo 1: Covarianza y Correlación entre inteligencia y
rendimiento
X Y X2 Y2 X·Y
9 5 81 25 45
12 5 144 25 60
6 1 36 1 6
120 45
9 4 81 16 36 X 8 Y  3
7 2 49 4 14 15 15
9 2 81 4 18 415
5 1 25 1 5 Sxy   8·3  3,666
15
9 3 81 9 27
15·415  120·45
7 3 49 9 21 rxy  
3 1 9 1 3 15·1078  120 · 15·169  45
2 2

10 4 100 16 40  0.868
6 2 36 4 12
11 5 121 25 55
4 2 16 4 8
13 5 169 25 65
120 45 1078 169 415
Ejemplo 2: Covarianza y correlación entre tiempo y número
de errores
X Y X2 Y2 X·Y
7 4 49 16 28
11 2 121 4 22
5 4 25 16 20
5 5 25 25 25 120 45
X 8 Y  3
6 4 36 16 24 15 15
9 4 81 16 36 319
13 1 169 1 13 Sxy   8·3  2,733
8 2 64 4 16
15
15·319  120·45
4 5 16 25 20
rxy  
9 3 81 9 27 15·1054  120 · 15·159  45
2 2

6 3 36 9 18
 0.863
10 2 100 4 20
11 1 121 1 11
9 2 81 4 18
7 3 49 9 21

120 45 1054 159 319


Ejemplo 3: Covarianza y Correlación entre estatura e
inteligencia
X Y X2 Y2 X·Y
7 3 49 9 21
8 1 64 1 8
5 3 25 9 15
12 3 144 9 36 120 45
8 2 64 4 16
X 8 Y  3
15 15
9 4 81 16 36
359
7 4 49 16 28 Sxy   8·3  0.067
6 4 36 16 24 15
6 3 36 9 18 15·359  120·45
rxy   0.035
9 2 81 4 18
15·1010  120 · 15·151  45
2 2
9 3 81 9 27
6 2 36 4 12
10 2 100 4 20
10 4 100 16 40
8 5 64 25 40

120 45 1010 151 359


Ejemplo 4: Covarianza y correlación en un ejemplo de
relación lineal perfecta

X Y X2 Y2 X·Y
8 3 64 9 24 56 21
10 4 100 16 40
X 8 Y  3
7 7
6 2 36 4 12
224
14 6 196 36 84 Sxy   8·3  8
2 0 4 0 0 7
12 5 144 25 60 7·224  56·21
rxy  1
4 1 16 1 4 7·560  56 · 7·91  21
2 2

56 21 560 91 224
4.2.3. VALORACIÓN E INTERPRETACIÓN DE rxy
 En la interpretación de Rxy hay que separar dos aspectos distintos: su
cuantía y su sentido. La cuantía se refiere al grado en que la relación
entre dos variables queda bien definida con un índice de asociación
lineal como R. Mientras que el sentido se refiere al tipo de relación
lineal: positiva, negativa o nula.
 La interpretación de la correlación depende del campo de estudio.
Por ejemplo si estudiamos Fiabilidad en cualquier test; Test-
retest<0.80, no sería adecuado mientras que en un test de
Personalidad; = 0.30 resulta muy importante. En cada área de estudio
se va desarrollando un conocimiento que permite valorar los
coeficientes de correlación en términos muy relativos. Esta es la
razón por la que no se pueden proponer categorías generales de
valoración. Los coeficientes de correlación deben valorarse
comparándolos unos con otros o comparándolos con los valores que
típicamente se suelen encontrar en el campo de estudio del que se
trate.
Una correlación nula no indica ausencia de relación, sino ausencia
de relación lineal. En otras palabras, indica que el modelo lineal no
se ajusta al comportamiento de esas variables, pero puede haber
algún tipo de relación entre ellas (ejemplo de la activación y el
rendimiento)

Una relación de tipo lineal entre las variables no implica relación de


tipo causal (X no tiene por qué causar a Y, aunque estén
relacionadas linealmente). Por ejemplo, puede existir relación
lineal directa entre el número de coches por cada mil habitantes y
el nivel cultural medio de los habitantes de un país, pero no por eso
si regalamos coches a esos habitantes se incrementará el nivel
cultural. Está claro que existe otras variables que están actuando
conjuntamente con estas dos (nivel económico, por ejemplo).
 A veces se establecen entre las variables lo que se denominan
correlaciones espurias. Esto es, parece existir una relación
entre dos variables y se deben al efecto de otras variables que
al tener una relación con las otras primeras dos crea esta falsa
relación.
Ejemplo, correlación positiva entre el presupuesto en educación
en España y el número de salidas al extranjero de los
españoles. Esto no quiere decir que al aumentar la educación
los españoles se vayan al extranjero, sino que hay otras
variables, como el aumento de la renta que puede estar
provocando la correlación entre las variables anteriores.
Ejemplos del cálculo de rxy
Ejemplo 1
Supongamos que queremos ver si existe correlación lineal entre el nivel de
puntuación obtenida por 5 pacientes en un test de ansiedad social (X) y el
número de evitaciones semanales ante situaciones que implican contacto
social (Y)

X Y Diagrama de dispersión

3 9 20

N.evitaciones (Y)
15
5 12
10
4 0
5
7 18 0
1 6 0 2 4 6 8
Ansiedad social (X)
X Y X2 Y2 X·Y

3 9 9 81 27
5 12 25 144 60
4 0 16 0 0
7 18 49 324 126
1 6 1 36 6
20 45 100 585 219
X  20 / 5  4
Y  45 / 5  9 n XY   X  Y  5219  2045
rxy  
n X 2   X  n Y 2   Y  5100  202 5585  452
2 2
Sxy  39 / 5  7,8

Sx  20 / 5  2
1095  900 195
   0.65
100 900 1030
Sy  180 / 5  6

Sxy 7.8
rxy    0.65
SxSy 2·6
Ejemplo 2
Relación entre medidas neuroanatómicas e inteligencia en gemelos
monocigóticos.
Los gemelos monocigóticos comparten varios rasgos físicos,
psicológicos y patológicos. El tratamiento de imágenes del cerebro
permite, mediante resonancia magnética y análisis computerizados,
cuantificar determinadas medidas y parámetros neuroanatómicos.
Se diseña un estudio utilizando estas técnicas para establecer si
dichas características tienen alguna relación con el cociente
intelectual y si existe alguna relación entre estas medidas.
Utilizando estas técnicas se obtuvieron el área de la superficie del
córtex cerebral, el área del corpus callosum sagital y el volumen de
la cabeza, medido en diferentes pares de gemelos monocigóticos.
Además, se obtuvieron medidas del peso corporal, el cociente
intelectual y la circunferencia de la cabeza.
En este estudio se desea establecer si existe relación en las medidas
neuroanatómicas entre gemelos monocigóticos y si existe relación
entre el cociente intelectual y las medidas neuroanatómicas.
La siguiente tabla muestra la relación entre el cociente intelectual y el área del
córtex cerebral de 20 pares de gemelos.

X Y
9 72
10 76
6 59 Diagrama de dispersión
8 68
100
10 60
80
5 58
60
8 70

Y
40
7 65 20
4 54 0
11 83 0 2 4 6 8 10 12
X
7 64
7 66
6 61
8 66
5 57
11 81
5 59
9 71
6 62
10 75
X Y X2 Y2 XY
9 72 81 5184 648
10 76 100 5776 760
6 59 36 3481 354
8 68 64 4624 544
10 60 100 3600 600
5 58 25 3364 290
8 70 64 4900 560
7 65 49 4225 455
4 54 16 2916 216
11 83 121 6889 913
7 64 49 4096 448
7 66 49 4356 462
6 61 36 3721 366
8 66 64 4356 528
5 57 25 3249 285
11 81 121 6561 891
5 59 25 3481 295
9 71 81 5041 639
6 62 36 3844 372
10 75 100 5625 750

152 1327 1242 89289 10376


152 1327
X  7. 6 Y  66.35
20 20

 Yi  Y 
n

 Xi  X 
n
2
86.8
1242.55 S2y  i 1
  4.34
S 2x  i 1
  62.12 n 20
n 20
Sx  62.12  7.88 n Sy  4.34  2.08
x y i i
Sxy  i 1
 X ·Y 
n
10376
  7.6·66.35  14.54
20
Sxy 14.54 14.54
rxy     0.885
SxSy 7.88·2.08 16.39
n XY   X  Y 
rxy  
n X   X  n Y   Y 
2 2 2 2


2010376  1521327  
201242  1522 2089289  1327 2
207520  201704
 
24840  23104 1785780  1760929
5816 5816 5816
    0.885
1736 24851 41.66·157.64 6567.28

También podría gustarte