Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 11
Tema 11
DESCRIPCIÓN CONJUNTA DE
DOS VARIABLES: CORRELACIÓN
1. INTRODUCCIÓN
2. REPRESENTACIÓN GRÁFICA DE UNA RELACIÓN
4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL
4.1. COVARIANZA (Sxy)
4.2. COEFICIENTE DE CORRELACIÓN DE PEARSON
(rxy)
4.2.1. CÁLCULO DE rxy
4.2.2. INTERPRETACIÓN Y PROPIEDADES DE rxy
4.2.3. VALORACIÓN E INTERPRETACIÓN DE rxy
Amón, J. (1991). Estadística para psicólogos. Vol I. Estadística
Descriptiva. Madrid: Pirámide.
Botella, J.; León, O.; San Martín, R., y Barriopedro, M.I. (2001).
Análisis de Datos en Psicología I. Teoría y Ejercicios. Madrid:
Pirámide.
De la Fuente, E.I. y García, J. (1998). Análisis de datos en
Psicología. Ejercicios de estadística descriptiva. Granada:
Urbano.
Escobar, M. (1999). Análisis gráfico/exploratorio. Cuadernos de
Estadística nº 2. Madrid: Muralla-Hespérides.
Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J.
(1992). Análisis Exploratorio de Datos: nuevas técnicas
estadísticas. Barcelona: PPU.
McRae, S. (1995). Modelos y métodos para las Ciencias del
Comportamiento. Barcelona: Ariel.
Merino, J.M; Moreno, E; Padilla, M; Rodríguez-Miñón, P;
Villarino, A. (2001). Análisis de Datos en Psicología I. Madrid:
UNED.
Palmer, A. (1995). El análisis exploratorio de datos. Madrid:
Eudema
Pérez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos
de Análisis de Datos. Madrid: Pirámide.
Pérez, F.J., Manzano, V. y Fazeli, H. (1999). Análisis de Datos en
Psicología. Madrid: Pirámide.
San Martín, R., Espinosa, L. y Fernández, L. (1987).
Psicoestadística Descriptiva. Madrid: Pirámide.
Stenberg, R.J. (1993). Investigar en Psicología. Barcelona: Paidós.
Objetivo
Intentaremos medir la posible relación entre dos
variables. Estudiaremos bajo título
“correlación” los problemas referentes a la
variación conjunta de dos variables, su
intensidad y su sentido (positivo o negativo)
1. INTRODUCCIÓN
Uno de los objetivos principales de la ciencia consiste en
descubrir las relaciones entre variables, y la estadística ha
desarrollado instrumentos para ello
En el campo de la Psicología podemos preguntarnos si el
rendimiento laboral en un determinado tipo de trabajo
guarda relación con la personalidad del trabajador, si el
fracaso escolar es mas probable en niños con determinadas
circunstancias familiares y personales, si hay tareas en que la
práctica masiva facilita más el aprendizaje que la práctica
distribuido o si determinados rasgos de personalidad están
asociados a una mayor propensión al suicidio.
La observación de relaciones claras y estables entre variables
ayuda a comprender los fenómenos y a a encontrar
explicaciones de los mismos e indica las vías probablemente
mas eficaces para intervenir sobre las situaciones
Desde el punto de vista matemático las relaciones entre
variables pueden ser de muchos tipos (Y=1+2·X; Y=X2; Y=82;
Y=1/X).
Estas funciones son conceptos matemáticos y, por tanto,
teóricos e ideales. Son habitualmente útiles en las ciencias
exactas, en las que las variables guardan una relación
determinista o funcional.
Pero en las ciencias sociales, incluida la psicología nunca se
encuentran relaciones deterministas, sino mas bien conjuntos
de observaciones que manifiestan una configuración
concreta, y nos preguntaremos si esa configuración (que
refleja la relación entre variables) se parece a alguno de los
modelos teóricos; en caso afirmativo diremos que ese modelo
explica bien la relación.
Nosotros nos centraremos en el estudio de las relaciones
lineales, que son las más sencillas.
Esto es, lo que vamos a exponer en el tema son las formas
más habituales de observar y cuantificar las relaciones
lineales entre variables
Advertimos por tanto que aunque en el tema hablemos sobre
relaciones o correlaciones entre variables, estrictamente
hablando deberíamos utilizar la expresión relación lineal y si
no lo hacemos será únicamente por economía de espacio.
Igualmente los índices que vamos a describir son aplicables
exclusivamente a las variables al menos de intervalo. La
asociación entre variables con otros niveles de medida
(nominales u ordinales) se pueden evaluar por otros
procedimientos que exceden los objetivos del temario.
2. REPRESENTACIÓN GRÁFICA DE UNA
RELACIÓN
Los procedimientos para determinar la existencia y grado de
relación lineal entre dos variables deben ser también capaces
de discriminar entre los tres tipos de relación lineal que hay.
Supongamos las variables X e Y:
Relación lineal positiva o directa: cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores bajos en X
Ejemplo: motivacion y rendimiento
Relación lineal negativa o inversa: cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores altos en X
Ejemplo: Tiempo de realización de una tarea y número de
errores
Relación nula: cuando no hay un emparejamiento sistemático
entre ellas en función de sus valores
Ejemplo: estatura y rendimiento
Xi X Yi Y
n
i 1
n
Es lo que se denomina covarianza y se representa
Sxy
a) Datos no agrupados
Xi X Yi Y
n
Cov( X , Y ) Sxy i 1
n
n
x y i i
Cov( X , Y ) Sxy i 1
X ·Y
n
b) Datos agrupados
n Xi X Yi Y
n
ij
Cov( X , Y ) Sxy i 1
n
n
n x y ij i i
Cov( X , Y ) Sxy i 1
X ·Y
n
Interpretación:
Sxy positivo: covarianza positiva
Sxy negativo: covarianza negativa
Sxy cero: ausencia de covariación
Propiedades
1. El índice es capaz de discriminar entre los tres tipos de relación
lineal
2. Problemas en la interpretación:
a) Depende de las unidades de medida de las variables (no
permite comparar)
b) Es un valor no acotado (carece de máximos y mínimos estables)
con lo cual no tenemos información sobre su cuantía y es difícil su
interpretación
rxy
z xi ·z yi
n
La correlación no es, por tanto, más que una covarianza hallada
sobre las puntuaciones tipificadas; por eso a veces se dice que la
correlación es una covarianza estandarizada o que es una
covarianza adimensional.
La formula anterior no resulta muy práctica a la hora de hacer
cálculos, pues exige la tipificación de cada puntuación, y para
ello hay que hallar previamente las medias y desviaciones típicas
de cada variable.
Para facilitar el cálculo se han derivado otras fórmulas alternativas
equivalentes que en la mayoría de casos resultan más prácticas:
rxy
x yi· i
n·Sx·Sy
Sxy
rxy
Sx·Sy
4.2.1. CÁLCULO DE rxy
1. Datos no agrupados
n XiYi Xi Yi
rxy
n Xi Xi n Yi Yi
2 2 2 2
2. Datos agrupados
Donde:
nx: observaciones o frecuencias marginales de X
ny: observaciones o frecuencias marginales de Y
Nxy: observaciones dentro de las casillas interiores
de la tabla de frecuencias. Es decir, el número de
observaciones que pertenecen a un cierto intervalo
de la variable X y a otro de la variable Y
4.2.2. INTERPRETACIÓN Y PROPIEDADES DE Rxy
10 4 100 16 40 0.868
6 2 36 4 12
11 5 121 25 55
4 2 16 4 8
13 5 169 25 65
120 45 1078 169 415
Ejemplo 2: Covarianza y correlación entre tiempo y número
de errores
X Y X2 Y2 X·Y
7 4 49 16 28
11 2 121 4 22
5 4 25 16 20
5 5 25 25 25 120 45
X 8 Y 3
6 4 36 16 24 15 15
9 4 81 16 36 319
13 1 169 1 13 Sxy 8·3 2,733
8 2 64 4 16
15
15·319 120·45
4 5 16 25 20
rxy
9 3 81 9 27 15·1054 120 · 15·159 45
2 2
6 3 36 9 18
0.863
10 2 100 4 20
11 1 121 1 11
9 2 81 4 18
7 3 49 9 21
X Y X2 Y2 X·Y
8 3 64 9 24 56 21
10 4 100 16 40
X 8 Y 3
7 7
6 2 36 4 12
224
14 6 196 36 84 Sxy 8·3 8
2 0 4 0 0 7
12 5 144 25 60 7·224 56·21
rxy 1
4 1 16 1 4 7·560 56 · 7·91 21
2 2
56 21 560 91 224
4.2.3. VALORACIÓN E INTERPRETACIÓN DE rxy
En la interpretación de Rxy hay que separar dos aspectos distintos: su
cuantía y su sentido. La cuantía se refiere al grado en que la relación
entre dos variables queda bien definida con un índice de asociación
lineal como R. Mientras que el sentido se refiere al tipo de relación
lineal: positiva, negativa o nula.
La interpretación de la correlación depende del campo de estudio.
Por ejemplo si estudiamos Fiabilidad en cualquier test; Test-
retest<0.80, no sería adecuado mientras que en un test de
Personalidad; = 0.30 resulta muy importante. En cada área de estudio
se va desarrollando un conocimiento que permite valorar los
coeficientes de correlación en términos muy relativos. Esta es la
razón por la que no se pueden proponer categorías generales de
valoración. Los coeficientes de correlación deben valorarse
comparándolos unos con otros o comparándolos con los valores que
típicamente se suelen encontrar en el campo de estudio del que se
trate.
Una correlación nula no indica ausencia de relación, sino ausencia
de relación lineal. En otras palabras, indica que el modelo lineal no
se ajusta al comportamiento de esas variables, pero puede haber
algún tipo de relación entre ellas (ejemplo de la activación y el
rendimiento)
X Y Diagrama de dispersión
3 9 20
N.evitaciones (Y)
15
5 12
10
4 0
5
7 18 0
1 6 0 2 4 6 8
Ansiedad social (X)
X Y X2 Y2 X·Y
3 9 9 81 27
5 12 25 144 60
4 0 16 0 0
7 18 49 324 126
1 6 1 36 6
20 45 100 585 219
X 20 / 5 4
Y 45 / 5 9 n XY X Y 5219 2045
rxy
n X 2 X n Y 2 Y 5100 202 5585 452
2 2
Sxy 39 / 5 7,8
Sx 20 / 5 2
1095 900 195
0.65
100 900 1030
Sy 180 / 5 6
Sxy 7.8
rxy 0.65
SxSy 2·6
Ejemplo 2
Relación entre medidas neuroanatómicas e inteligencia en gemelos
monocigóticos.
Los gemelos monocigóticos comparten varios rasgos físicos,
psicológicos y patológicos. El tratamiento de imágenes del cerebro
permite, mediante resonancia magnética y análisis computerizados,
cuantificar determinadas medidas y parámetros neuroanatómicos.
Se diseña un estudio utilizando estas técnicas para establecer si
dichas características tienen alguna relación con el cociente
intelectual y si existe alguna relación entre estas medidas.
Utilizando estas técnicas se obtuvieron el área de la superficie del
córtex cerebral, el área del corpus callosum sagital y el volumen de
la cabeza, medido en diferentes pares de gemelos monocigóticos.
Además, se obtuvieron medidas del peso corporal, el cociente
intelectual y la circunferencia de la cabeza.
En este estudio se desea establecer si existe relación en las medidas
neuroanatómicas entre gemelos monocigóticos y si existe relación
entre el cociente intelectual y las medidas neuroanatómicas.
La siguiente tabla muestra la relación entre el cociente intelectual y el área del
córtex cerebral de 20 pares de gemelos.
X Y
9 72
10 76
6 59 Diagrama de dispersión
8 68
100
10 60
80
5 58
60
8 70
Y
40
7 65 20
4 54 0
11 83 0 2 4 6 8 10 12
X
7 64
7 66
6 61
8 66
5 57
11 81
5 59
9 71
6 62
10 75
X Y X2 Y2 XY
9 72 81 5184 648
10 76 100 5776 760
6 59 36 3481 354
8 68 64 4624 544
10 60 100 3600 600
5 58 25 3364 290
8 70 64 4900 560
7 65 49 4225 455
4 54 16 2916 216
11 83 121 6889 913
7 64 49 4096 448
7 66 49 4356 462
6 61 36 3721 366
8 66 64 4356 528
5 57 25 3249 285
11 81 121 6561 891
5 59 25 3481 295
9 71 81 5041 639
6 62 36 3844 372
10 75 100 5625 750
Yi Y
n
Xi X
n
2
86.8
1242.55 S2y i 1
4.34
S 2x i 1
62.12 n 20
n 20
Sx 62.12 7.88 n Sy 4.34 2.08
x y i i
Sxy i 1
X ·Y
n
10376
7.6·66.35 14.54
20
Sxy 14.54 14.54
rxy 0.885
SxSy 7.88·2.08 16.39
n XY X Y
rxy
n X X n Y Y
2 2 2 2
2010376 1521327
201242 1522 2089289 1327 2
207520 201704
24840 23104 1785780 1760929
5816 5816 5816
0.885
1736 24851 41.66·157.64 6567.28