Está en la página 1de 41

TEMA 13.

DESCRIPCIN CONJUNTA DE DOS VARIABLES: CORRELACIN

1. INTRODUCCIN 2. REPRESENTACIN GRFICA DE UNA RELACIN 4. CUANTIFICACIN DE UNA RELACIN LINEAL 4.1. COVARIANZA (Sxy). Propiedades. 4.2. COEFICIENTE DE CORRELACIN DE PEARSON (rxy). Propiedades. 5. CUANTIFICACIN DE LA DEPENDENCIA ENTRE DOS VARIABLES (UNA CUANTITATIVA Y UNA CATEGRICA) 5.1. RAZN DE CORRELACIN. 2. Propiedades.

Amn, J. (1991). Estadstica para psiclogos. Vol I. Estadstica Descriptiva. Madrid: Pirmide. Botella, J.; Len, O.; San Martn, R., y Barriopedro, M.I. (2001). Anlisis de Datos en Psicologa I. Teora y Ejercicios. Madrid: Pirmide. De la Fuente, E.I. y Garca, J. (1998). Anlisis de datos en Psicologa. Ejercicios de estadstica descriptiva. Granada: Urbano. Escobar, M. (1999). Anlisis grfico/exploratorio. Cuadernos de Estadstica n 2. Madrid: Muralla-Hesprides. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992). Anlisis Exploratorio de Datos: nuevas tcnicas estadsticas. Barcelona: PPU. McRae, S. (1995). Modelos y mtodos para las Ciencias del Comportamiento. Barcelona: Ariel.

Merino, J.M; Moreno, E; Padilla, M; Rodrguez-Min, P; Villarino, A. (2001). Anlisis de Datos en Psicologa I. Madrid: UNED. Palmer, A. (1995). El anlisis exploratorio de datos. Madrid: Eudema Prez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos de Anlisis de Datos. Madrid: Pirmide. Prez, F.J., Manzano, V. y Fazeli, H. (1999). Anlisis de Datos en Psicologa. Madrid: Pirmide. San Martn, R., Espinosa, L. y Fernndez, L. (1987). Psicoestadstica Descriptiva. Madrid: Pirmide. Stenberg, R.J. (1993). Investigar en Psicologa. Barcelona: Paids.

Objetivo
Intentaremos medir la posible relacin entre dos variables. Estudiaremos bajo ttulo correlacin los problemas referentes a la variacin conjunta de dos variables, su intensidad y su sentido (positivo o negativo)

1. INTRODUCCIN
Uno de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la estadstica ha desarrollado instrumentos para ello En el campo de la Psicologa podemos preguntarnos si el rendimiento laboral en un determinado tipo de trabajo guarda relacin con la personalidad del trabajador, si el fracaso escolar es mas probable en nios con determinadas circunstancias familiares y personales, si hay tareas en que la prctica masiva facilita ms el aprendizaje que la prctica distribuido o si determinados rasgos de personalidad estn asociados a una mayor propensin al suicidio. La observacin de relaciones claras y estables entre variables ayuda a comprender los fenmenos y a a encontrar explicaciones de los mismos e indica las vas probablemente mas eficaces para intervenir sobre las situaciones

Desde el punto de vista matemtico las relaciones entre variables pueden ser de muchos tipos (Y=1+2X; Y=X2; Y=82; Y=1/X). Estas funciones son conceptos matemticos y, por tanto, tericos e ideales. Son habitualmente tiles en las ciencias exactas, en las que las variables guardan una relacin determinista o funcional. Pero en las ciencias sociales, incluida la psicologa nunca se encuentran relaciones deterministas, sino mas bien conjuntos de observaciones que manifiestan una configuracin concreta, y nos preguntaremos si esa configuracin (que refleja la relacin entre variables) se parece a alguno de los modelos tericos; en caso afirmativo diremos que ese modelo explica bien la relacin. Nosotros nos centraremos en el estudio de las relaciones lineales, que son las ms sencillas.

Esto es, lo que vamos a exponer en el tema son las formas ms habituales de observar y cuantificar las relaciones lineales entre variables Advertimos por tanto que aunque en el tema hablemos sobre relaciones o correlaciones entre variables, estrictamente hablando deberamos utilizar la expresin relacin lineal y si no lo hacemos ser nicamente por economa de espacio, salvo en el ltimo apartado del tema, en que hablamos de valoracin d relaciones no lineales, con la razn de correlacin. Igualmente los ndices que vamos a describir son aplicables exclusivamente a las variables al menos de intervalo. La asociacin entre variables con otros niveles de medida (nominales u ordinales) se pueden evaluar por otros procedimientos que exceden los objetivos del temario. En el caso de la razn de correlacin, es una variable a nivel de intervalos y uhna categrica.

Los procedimientos para determinar la existencia y grado de relacin lineal entre dos variables deben ser tambin capaces de discriminar entre los tres tipos de relacin lineal que hay. Supongamos las variables X e Y: Relacin lineal positiva o directa: cuando los valores altos en Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores bajos en X Ejemplo: motivacion y rendimiento Relacin lineal negativa o inversa: cuando los valores altos en Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores altos en X Ejemplo: Tiempo de realizacin de una tarea y nmero de errores

2. REPRESENTACIN GRFICA DE UNA RELACIN

Relacin nula: cuando no hay un emparejamiento sistemtico entre ellas en funcin de sus valores Ejemplo: estatura y rendimiento Importante: Una correlacin nula no indica ausencia de relacin, sino ausencia de relacin lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algn tipo de relacin entre ellas (ejemplo de la activacin y el rendimiento)

Veamos los siguientes conjuntos de datos que representan las relaciones anteriores
SUJ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 MOTIV (X) 9 12 6 9 7 9 5 9 7 3 10 6 11 4 13 RENDIM (Y) 5 5 1 4 2 2 1 3 3 1 4 2 5 2 5 SUJ TIEMPO (X) ERROR ES (Y) SUJ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ESTATU. (X) 7 8 5 12 8 9 7 6 6 9 9 6 10 10 8 INTELI. (Y) 3 1 3 3 2 4 4 4 3 2 3 2 2 4 5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

7 11 5 5 6 9 13 8 4 9 6 10 11 9 7

4 2 4 5 4 4 1 2 5 3 3 2 1 2 3

La representaciones grficas conjunta de dos variables permite observar visualmente este tipo de relaciones. Estas representaciones grficas se denominan diagramas de dispersin, que constituyen nubes de puntos donde representamos los pares de valores de X e Y para cada uno de los sujetos y los representamos en un eje de coordenadas

Relacin lineal positiva. Motivacin y rendimiento

Relacin lineal negativa. Tiempo en una tarea y numero de errores

Ausencia de relacin lineal. Estatura e Inteligencia

Destaquemos que este tipo de relacin, bien positiva o negativa en que los puntos forman una lnea perfecta son situaciones que no se dan nunca en relaciones reales entre variables psicolgicas; slo podemos considerarlo como un modelo ideal.

4. CUANTIFICACIN DE UNA RELACIN LINEAL


4.1. COVARIANZA (Sxy)
Desarrollaremos procedimientos precisos capaces de distinguir entre los tres tipos de relacin descritos y cuantificar el grado de relacin Un primer procedimientos consistira en hallar el promedio de los productos cruzados de las puntuaciones diferenciales Al hablar de productos cruzados nos referimos al producto para cada sujeto o caso de sus puntuaciones diferenciales en ambas variables

Xi X Yi Y
n i 1

Es lo que se denomina covarianza y se representa Sxy

Cov( X , Y ) Sxy

Xi X Yi Y
n i 1

Cov( X , Y ) Sxy

x y
i 1 i

X Y

Interpretacin: Sxy positivo: covarianza positiva Sxy negativo: covarianza negativa Sxy cero: ausencia de covariacin Propiedades 1. El ndice es capaz de discriminar entre los tres tipos de relacin lineal 2. Problemas en la interpretacin: a) Depende de las unidades de medida de las variables (no permite comparar) b) Es un valor no acotado (carece de mximo estable) con lo cual no tenemos informacin sobre su cuanta y es difcil su interpretacin Solucin: Coeficiente de correlacin de Pearson (rxy)

Ejemplo: Obtencin de la covarianza entre cinco pares de puntuaciones para los mismos sujetos en ansiedad y depresin medidos en dos cuestionarios diferentes (X, Y) y (V,W)

Ans(X)
1,71 1,60 1,57 1,66 1,67 8,21

Depr(Y)
78 65 63 74 73 353

XY
133,38 104 98,91 122,84 121,91 581,04

Ans(V)
5,61 5,25 5,15 5,45 5,48 26,94

Depr(W)
171,96 143,30 138,89 163,14 160,94 778,23

VW
964,70 752,33 715,28 889,11 881,95 4203,37

X 1,624 Y 70,6 Sxy

V 5,388

W 155,646

581,04 1,62470,6 0,283 5 4203,37 Svw 5,388 ,646 2,053 155 5

4.2. COEFICIENTE DE CORRELACIN DE PEARSON (rxy)


Un segundo ndice de asociacin lineal consistir en hallar tambin un promedio de productos cruzados, pero no de las puntuaciones diferenciales, sino de las puntuaciones tpicas. Este ndice se denomina coeficiente de correlacin de Pearson y se representa por la letra r (a veces puede aparecer en maysculas). As, en teora las correlacin de Pearson entre X e Y ser:

rxy

zxizyi n

La correlacin no es, por tanto, ms que una covarianza hallada sobre las puntuaciones tipificadas; por eso a veces se dice que la correlacin es una covarianza estandarizada o que es una covarianza adimensional. La formula anterior no resulta muy prctica a la hora de hacer clculos, pues exige la tipificacin de cada puntuacin, y para ello hay que hallar previamente las medias y desviaciones tpicas de cada variable. Para facilitar el clculo se han derivado otras frmulas alternativas equivalentes que en la mayora de casos resultan ms prcticas:

rxy

nSxSy Sxy rxy SxSy

x y

i i

4.2.1. CLCULO DE rxy

rxy

n Xi Xi
2

n XiYi Xi Yi
2 2

n Yi Yi

4.2.2. INTERPRETACIN Y PROPIEDADES DE rxy


1. El coeficiente de correlacin de Pearson no puede valer menos que -1 y mas que 1, esto es -1 rxy 1 Cercano a -1: correlacin lineal negativa Cercano a 0: ausencia de correlacin lineal Cercano a 1: correlacin lineal positiva
2. Es un valor adimensional, es invariante frente a cualquier unidad de medida permite comparar diferentes variables o la misma variable medida en diferentes grupos-

3. Si hacemos transformaciones lineales de una o de las dos variables, en que las constantes multiplicadoras son positivas, el coeficiente de correlacin de Pearson no se altera Si U= aX+b y V= cY+d siendo (a y c >0) entonces ruv=rxy

Ejemplo 1: Covarianza y Correlacin entre inteligencia y rendimiento


X 9 12 6 9 7 9 5 9 7 3 10 6 11 4 13 120 Y 5 5 1 4 2 2 1 3 3 1 4 2 5 2 5 45 X2 81 144 36 81 49 81 25 81 49 9 100 36 121 16 169 1078 Y2 25 25 1 16 4 4 1 9 9 1 16 4 25 4 25 169 XY 45 60 6 36 14 18 5 27 21 3 40 12 55 8 65 415

120 45 8 Y 3 15 15 415 Sxy 83 3,666 15 15415 12045 rxy 2 2 15 1078 120 15 45 169 0.868 X

Ejemplo 2: Covarianza y correlacin entre tiempo y nmero de errores


X
7 11 5 5 6 9 13 8 4 9 6 10 11 9 7 120

Y
4 2 4 5 4 4 1 2 5 3 3 2 1 2 3 45

X2
49 121 25 25 36 81 169 64 16 81 36 100 121 81 49 1054

Y2
16 4 16 25 16 16 1 4 25 9 9 4 1 4 9 159

XY
28 22 20 25 24 36 13 16 20 27 18 20 11 18 21 319

120 45 8 Y 3 15 15 319 Sxy 83 2,733 15 15319 12045 rxy 2 2 15 1054 120 15 45 159 0.863 X

Ejemplo 3: Covarianza y Correlacin entre estatura e inteligencia


X
7 8 5 12 8 9 7 6 6 9 9 6 10 10 8 120

Y
3 1 3 3 2 4 4 4 3 2 3 2 2 4 5 45

X2
49 64 25 144 64 81 49 36 36 81 81 36 100 100 64 1010

Y2
9 1 9 9 4 16 16 16 9 4 9 4 4 16 25 151

XY
21 8 15 36 16 36 28 24 18 18 27 12 20 40 40 359

120 45 8 Y 3 15 15 359 Sxy 83 0.067 15 15359 12045 rxy 0.035 2 2 15 1010 120 15 45 151 X

Ejemplo 4: Covarianza y correlacin en un ejemplo de relacin lineal perfecta

X
8 10 6 14 2 12 4 56

Y
3 4 2 6 0 5 1 21

X2
64 100 36 196 4 144 16 560

Y2
9 16 4 36 0 25 1 91

XY
24 40 12 84 0 60 4 224

56 21 8 Y 3 7 7 224 Sxy 83 8 7 7224 5621 rxy 1 2 2 7560 56 791 21 X

4.2.3. VALORACIN E INTERPRETACIN DE rxy


En la interpretacin de rxy hay que separar dos aspectos distintos: su cuanta y su sentido. La cuanta se refiere al grado en que la relacin entre dos variables queda bien definida con un ndice de asociacin lineal como r. Mientras que el sentido se refiere al tipo de relacin lineal: positiva, negativa o nula. La interpretacin de la correlacin depende del campo de estudio. Por ejemplo si estudiamos Fiabilidad en cualquier test; Testretest<0.80, no sera adecuado mientras que en un test de Personalidad; = 0.30 resulta muy importante. En cada rea de estudio se va desarrollando un conocimiento que permite valorar los coeficientes de correlacin en trminos muy relativos. Esta es la razn por la que no se pueden proponer categoras generales de valoracin. Los coeficientes de correlacin deben valorarse comparndolos unos con otros o comparndolos con los valores que tpicamente se suelen encontrar en el campo de estudio del que se trate.

Una correlacin nula no indica ausencia de relacin, sino ausencia de relacin lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algn tipo de relacin entre ellas (ejemplo de la activacin y el rendimiento)
Una relacin de tipo lineal entre las variables no implica relacin de tipo causal (X no tiene por qu causar a Y, aunque estn relacionadas linealmente). Por ejemplo, puede existir relacin lineal directa entre el nmero de coches por cada mil habitantes y el nivel cultural medio de los habitantes de un pas, pero no por eso si regalamos coches a esos habitantes se incrementar el nivel cultural. Est claro que existe otras variables que estn actuando conjuntamente con estas dos (nivel econmico, por ejemplo).

A veces se establecen entre las variables lo que se denominan correlaciones espureas. Esto es, parece existir una relacin entre dos variables y se deben al efecto de otras variables que al tener una relacin con las otras primeras dos crea esta falsa relacin. Ejemplo, correlacin positiva entre el presupuesto en educacin en Espaa y el nmero de salidas al extranjero de los espaoles. Esto no quiere decir que al aumentar la educacin los espaoles se vayan al extranjero, sino que hay otras variables, como el aumento de la renta que puede estar provocando la correlacin entre las variables anteriores.

Ejemplos del clculo de rxy

Ejemplo 1
Supongamos que queremos ver si existe correlacin lineal entre el nivel de puntuacin obtenida por 5 pacientes en un test de ansiedad social (X) y el nmero de evitaciones semanales ante situaciones que implican contacto social (Y) X 3 5 4 7 1 Y 9 12 0 18 6
N.evitaciones (Y)
20 15 10 5 0 0 2 4 Ansiedad social (X) 6 8

Diagrama de dispersin

X 3 5 4 7 1 20

Y 9 12 0 18 6 45

X2 9 25 16 49 1

Y2 81 144 0 324 36

XY 27 60 0 126 6 219

100 585

X 20 / 5 4 Y 45 / 5 9 Sxy 39 / 5 7,8 Sx 20 / 5 2 Sy 180 / 5 6


rxy

n X 2 X

n XY X Y
2

n Y 2 Y

5219 20 45 5100 20 2 5585 45 2

1095 900 195 0.65 100 900 10 30

Sxy 7.8 rxy 0.65 SxSy 26

Ejemplo 2
Relacin entre medidas neuroanatmicas e inteligencia en gemelos monocigticos. Los gemelos monocigticos comparten varios rasgos fsicos, psicolgicos y patolgicos. El tratamiento de imgenes del cerebro permite, mediante resonancia magntica y anlisis computerizados, cuantificar determinadas medidas y parmetros neuroanatmicos. Se disea un estudio utilizando estas tcnicas para establecer si dichas caractersticas tienen alguna relacin con el cociente intelectual y si existe alguna relacin entre estas medidas. Utilizando estas tcnicas se obtuvieron el rea de la superficie del crtex cerebral, el rea del corpus callosum sagital y el volumen de la cabeza, medido en diferentes pares de gemelos monocigticos. Adems, se obtuvieron medidas del peso corporal, el cociente intelectual y la circunferencia de la cabeza. En este estudio se desea establecer si existe relacin en las medidas neuroanatmicas entre gemelos monocigticos y si existe relacin entre el cociente intelectual y las medidas neuroanatmicas.

La siguiente tabla muestra la relacin entre el cociente intelectual y el rea del crtex cerebral de 20 pares de gemelos.
X
9 10 6 8 10 5 8 7 4 11 7 7 6 8 5 11 5 9 6 10

Y
72 76 59 68 60 58 70 65 54 83 64 66 61 66 57 81 59 71 62 75

Diagrama de dispersin
100 80 60

Y
40 20 0 0 2 4 6 X 8 10 12

X 9 10 6 8 10 5 8 7 4 11 7 7 6 8 5 11 5 9 6 10 152

Y 72 76 59 68 60 58 70 65 54 83 64 66 61 66 57 81 59 71 62 75 1327

X2 81 100 36 64 100 25 64 49 16 121 49 49 36 64 25 121 25 81 36 100 1242

Y2 5184 5776 3481 4624 3600 3364 4900 4225 2916 6889 4096 4356 3721 4356 3249 6561 3481 5041 3844 5625 89289

XY 648 760 354 544 600 290 560 455 216 913 448 462 366 528 285 891 295 639 372 750 10376

152 X 7.6 20

1327 Y 66.35 20
2

S 2x

Xi X
n i 1

n Sx 62.12 7.88

1242.55 62.12 20

S2y

Yi Y
n i 1

Sxy

x y
i 1 i

n Sy 4.34 2.08
i

86.8 4.34 20

X Y

10376 7.666.35 14.54 20

Sxy 14 .54 14 .54 rxy 0.885 SxSy 7.882.08 16 .39

rxy

2010376 1521327 2 2 201242 152 2089289 1327

n X X
2

n XY X Y
2 2

n Y Y

207520 201704 24840 23104 1785780 1760929 5816 5816 5816 0.885 1736 24851 41.66157.64 6567.28

5. RAZN DE CORRELACIN DE Y SOBRE X

5.1. CLCULO

n Y Y Y Y
c i 2 ij

Edad. C1 H A B I L I D A D 10 8 7 6 9 10 7 9 11 7 5 9 8 9 5

Edad. C2 10 8 8 14 12 12 6 8 10 8 10 8 10 14 10 12 14 8 8 10 10 12 12 8 8 250

Edad. C3 7 7 6 4 6 7 6 5 6 6 Calculemos la razn de correlacin de la habilidad mecnica sobre la edad:

M E C A N I C A

n Y Y Y Y
c i 2 ij

122 0,412 296

120

60

5. RAZN DE CORRELACIN DE Y SOBRE X PROPIEDADES


1. Slo permite establecer el sentido de la relacin 2. Oscila entre 0 y 1 3. No tiene unidad de medida 4. La relacin entre el cuadrado del coeficiente de Pearson y la Razn de Correlacin, nos lleva a la interpretacin del tipo de relacin que hay entre mis variables, de forma que:
r2 aproximadamente igual a 2 significa que hay una relacin lineal entre las variables r2 << 2 significa que hay una relacin no lineal entre las variables

También podría gustarte