Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIN 2. REPRESENTACIN GRFICA DE UNA RELACIN 4. CUANTIFICACIN DE UNA RELACIN LINEAL 4.1. COVARIANZA (Sxy). Propiedades. 4.2. COEFICIENTE DE CORRELACIN DE PEARSON (rxy). Propiedades. 5. CUANTIFICACIN DE LA DEPENDENCIA ENTRE DOS VARIABLES (UNA CUANTITATIVA Y UNA CATEGRICA) 5.1. RAZN DE CORRELACIN. 2. Propiedades.
Amn, J. (1991). Estadstica para psiclogos. Vol I. Estadstica Descriptiva. Madrid: Pirmide. Botella, J.; Len, O.; San Martn, R., y Barriopedro, M.I. (2001). Anlisis de Datos en Psicologa I. Teora y Ejercicios. Madrid: Pirmide. De la Fuente, E.I. y Garca, J. (1998). Anlisis de datos en Psicologa. Ejercicios de estadstica descriptiva. Granada: Urbano. Escobar, M. (1999). Anlisis grfico/exploratorio. Cuadernos de Estadstica n 2. Madrid: Muralla-Hesprides. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992). Anlisis Exploratorio de Datos: nuevas tcnicas estadsticas. Barcelona: PPU. McRae, S. (1995). Modelos y mtodos para las Ciencias del Comportamiento. Barcelona: Ariel.
Merino, J.M; Moreno, E; Padilla, M; Rodrguez-Min, P; Villarino, A. (2001). Anlisis de Datos en Psicologa I. Madrid: UNED. Palmer, A. (1995). El anlisis exploratorio de datos. Madrid: Eudema Prez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos de Anlisis de Datos. Madrid: Pirmide. Prez, F.J., Manzano, V. y Fazeli, H. (1999). Anlisis de Datos en Psicologa. Madrid: Pirmide. San Martn, R., Espinosa, L. y Fernndez, L. (1987). Psicoestadstica Descriptiva. Madrid: Pirmide. Stenberg, R.J. (1993). Investigar en Psicologa. Barcelona: Paids.
Objetivo
Intentaremos medir la posible relacin entre dos variables. Estudiaremos bajo ttulo correlacin los problemas referentes a la variacin conjunta de dos variables, su intensidad y su sentido (positivo o negativo)
1. INTRODUCCIN
Uno de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la estadstica ha desarrollado instrumentos para ello En el campo de la Psicologa podemos preguntarnos si el rendimiento laboral en un determinado tipo de trabajo guarda relacin con la personalidad del trabajador, si el fracaso escolar es mas probable en nios con determinadas circunstancias familiares y personales, si hay tareas en que la prctica masiva facilita ms el aprendizaje que la prctica distribuido o si determinados rasgos de personalidad estn asociados a una mayor propensin al suicidio. La observacin de relaciones claras y estables entre variables ayuda a comprender los fenmenos y a a encontrar explicaciones de los mismos e indica las vas probablemente mas eficaces para intervenir sobre las situaciones
Desde el punto de vista matemtico las relaciones entre variables pueden ser de muchos tipos (Y=1+2X; Y=X2; Y=82; Y=1/X). Estas funciones son conceptos matemticos y, por tanto, tericos e ideales. Son habitualmente tiles en las ciencias exactas, en las que las variables guardan una relacin determinista o funcional. Pero en las ciencias sociales, incluida la psicologa nunca se encuentran relaciones deterministas, sino mas bien conjuntos de observaciones que manifiestan una configuracin concreta, y nos preguntaremos si esa configuracin (que refleja la relacin entre variables) se parece a alguno de los modelos tericos; en caso afirmativo diremos que ese modelo explica bien la relacin. Nosotros nos centraremos en el estudio de las relaciones lineales, que son las ms sencillas.
Esto es, lo que vamos a exponer en el tema son las formas ms habituales de observar y cuantificar las relaciones lineales entre variables Advertimos por tanto que aunque en el tema hablemos sobre relaciones o correlaciones entre variables, estrictamente hablando deberamos utilizar la expresin relacin lineal y si no lo hacemos ser nicamente por economa de espacio, salvo en el ltimo apartado del tema, en que hablamos de valoracin d relaciones no lineales, con la razn de correlacin. Igualmente los ndices que vamos a describir son aplicables exclusivamente a las variables al menos de intervalo. La asociacin entre variables con otros niveles de medida (nominales u ordinales) se pueden evaluar por otros procedimientos que exceden los objetivos del temario. En el caso de la razn de correlacin, es una variable a nivel de intervalos y uhna categrica.
Los procedimientos para determinar la existencia y grado de relacin lineal entre dos variables deben ser tambin capaces de discriminar entre los tres tipos de relacin lineal que hay. Supongamos las variables X e Y: Relacin lineal positiva o directa: cuando los valores altos en Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores bajos en X Ejemplo: motivacion y rendimiento Relacin lineal negativa o inversa: cuando los valores altos en Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores altos en X Ejemplo: Tiempo de realizacin de una tarea y nmero de errores
Relacin nula: cuando no hay un emparejamiento sistemtico entre ellas en funcin de sus valores Ejemplo: estatura y rendimiento Importante: Una correlacin nula no indica ausencia de relacin, sino ausencia de relacin lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algn tipo de relacin entre ellas (ejemplo de la activacin y el rendimiento)
Veamos los siguientes conjuntos de datos que representan las relaciones anteriores
SUJ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 MOTIV (X) 9 12 6 9 7 9 5 9 7 3 10 6 11 4 13 RENDIM (Y) 5 5 1 4 2 2 1 3 3 1 4 2 5 2 5 SUJ TIEMPO (X) ERROR ES (Y) SUJ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ESTATU. (X) 7 8 5 12 8 9 7 6 6 9 9 6 10 10 8 INTELI. (Y) 3 1 3 3 2 4 4 4 3 2 3 2 2 4 5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
7 11 5 5 6 9 13 8 4 9 6 10 11 9 7
4 2 4 5 4 4 1 2 5 3 3 2 1 2 3
La representaciones grficas conjunta de dos variables permite observar visualmente este tipo de relaciones. Estas representaciones grficas se denominan diagramas de dispersin, que constituyen nubes de puntos donde representamos los pares de valores de X e Y para cada uno de los sujetos y los representamos en un eje de coordenadas
Destaquemos que este tipo de relacin, bien positiva o negativa en que los puntos forman una lnea perfecta son situaciones que no se dan nunca en relaciones reales entre variables psicolgicas; slo podemos considerarlo como un modelo ideal.
Xi X Yi Y
n i 1
Cov( X , Y ) Sxy
Xi X Yi Y
n i 1
Cov( X , Y ) Sxy
x y
i 1 i
X Y
Interpretacin: Sxy positivo: covarianza positiva Sxy negativo: covarianza negativa Sxy cero: ausencia de covariacin Propiedades 1. El ndice es capaz de discriminar entre los tres tipos de relacin lineal 2. Problemas en la interpretacin: a) Depende de las unidades de medida de las variables (no permite comparar) b) Es un valor no acotado (carece de mximo estable) con lo cual no tenemos informacin sobre su cuanta y es difcil su interpretacin Solucin: Coeficiente de correlacin de Pearson (rxy)
Ejemplo: Obtencin de la covarianza entre cinco pares de puntuaciones para los mismos sujetos en ansiedad y depresin medidos en dos cuestionarios diferentes (X, Y) y (V,W)
Ans(X)
1,71 1,60 1,57 1,66 1,67 8,21
Depr(Y)
78 65 63 74 73 353
XY
133,38 104 98,91 122,84 121,91 581,04
Ans(V)
5,61 5,25 5,15 5,45 5,48 26,94
Depr(W)
171,96 143,30 138,89 163,14 160,94 778,23
VW
964,70 752,33 715,28 889,11 881,95 4203,37
V 5,388
W 155,646
rxy
zxizyi n
La correlacin no es, por tanto, ms que una covarianza hallada sobre las puntuaciones tipificadas; por eso a veces se dice que la correlacin es una covarianza estandarizada o que es una covarianza adimensional. La formula anterior no resulta muy prctica a la hora de hacer clculos, pues exige la tipificacin de cada puntuacin, y para ello hay que hallar previamente las medias y desviaciones tpicas de cada variable. Para facilitar el clculo se han derivado otras frmulas alternativas equivalentes que en la mayora de casos resultan ms prcticas:
rxy
x y
i i
rxy
n Xi Xi
2
n XiYi Xi Yi
2 2
n Yi Yi
3. Si hacemos transformaciones lineales de una o de las dos variables, en que las constantes multiplicadoras son positivas, el coeficiente de correlacin de Pearson no se altera Si U= aX+b y V= cY+d siendo (a y c >0) entonces ruv=rxy
120 45 8 Y 3 15 15 415 Sxy 83 3,666 15 15415 12045 rxy 2 2 15 1078 120 15 45 169 0.868 X
Y
4 2 4 5 4 4 1 2 5 3 3 2 1 2 3 45
X2
49 121 25 25 36 81 169 64 16 81 36 100 121 81 49 1054
Y2
16 4 16 25 16 16 1 4 25 9 9 4 1 4 9 159
XY
28 22 20 25 24 36 13 16 20 27 18 20 11 18 21 319
120 45 8 Y 3 15 15 319 Sxy 83 2,733 15 15319 12045 rxy 2 2 15 1054 120 15 45 159 0.863 X
Y
3 1 3 3 2 4 4 4 3 2 3 2 2 4 5 45
X2
49 64 25 144 64 81 49 36 36 81 81 36 100 100 64 1010
Y2
9 1 9 9 4 16 16 16 9 4 9 4 4 16 25 151
XY
21 8 15 36 16 36 28 24 18 18 27 12 20 40 40 359
120 45 8 Y 3 15 15 359 Sxy 83 0.067 15 15359 12045 rxy 0.035 2 2 15 1010 120 15 45 151 X
X
8 10 6 14 2 12 4 56
Y
3 4 2 6 0 5 1 21
X2
64 100 36 196 4 144 16 560
Y2
9 16 4 36 0 25 1 91
XY
24 40 12 84 0 60 4 224
Una correlacin nula no indica ausencia de relacin, sino ausencia de relacin lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algn tipo de relacin entre ellas (ejemplo de la activacin y el rendimiento)
Una relacin de tipo lineal entre las variables no implica relacin de tipo causal (X no tiene por qu causar a Y, aunque estn relacionadas linealmente). Por ejemplo, puede existir relacin lineal directa entre el nmero de coches por cada mil habitantes y el nivel cultural medio de los habitantes de un pas, pero no por eso si regalamos coches a esos habitantes se incrementar el nivel cultural. Est claro que existe otras variables que estn actuando conjuntamente con estas dos (nivel econmico, por ejemplo).
A veces se establecen entre las variables lo que se denominan correlaciones espureas. Esto es, parece existir una relacin entre dos variables y se deben al efecto de otras variables que al tener una relacin con las otras primeras dos crea esta falsa relacin. Ejemplo, correlacin positiva entre el presupuesto en educacin en Espaa y el nmero de salidas al extranjero de los espaoles. Esto no quiere decir que al aumentar la educacin los espaoles se vayan al extranjero, sino que hay otras variables, como el aumento de la renta que puede estar provocando la correlacin entre las variables anteriores.
Ejemplo 1
Supongamos que queremos ver si existe correlacin lineal entre el nivel de puntuacin obtenida por 5 pacientes en un test de ansiedad social (X) y el nmero de evitaciones semanales ante situaciones que implican contacto social (Y) X 3 5 4 7 1 Y 9 12 0 18 6
N.evitaciones (Y)
20 15 10 5 0 0 2 4 Ansiedad social (X) 6 8
Diagrama de dispersin
X 3 5 4 7 1 20
Y 9 12 0 18 6 45
X2 9 25 16 49 1
Y2 81 144 0 324 36
XY 27 60 0 126 6 219
100 585
n X 2 X
n XY X Y
2
n Y 2 Y
Ejemplo 2
Relacin entre medidas neuroanatmicas e inteligencia en gemelos monocigticos. Los gemelos monocigticos comparten varios rasgos fsicos, psicolgicos y patolgicos. El tratamiento de imgenes del cerebro permite, mediante resonancia magntica y anlisis computerizados, cuantificar determinadas medidas y parmetros neuroanatmicos. Se disea un estudio utilizando estas tcnicas para establecer si dichas caractersticas tienen alguna relacin con el cociente intelectual y si existe alguna relacin entre estas medidas. Utilizando estas tcnicas se obtuvieron el rea de la superficie del crtex cerebral, el rea del corpus callosum sagital y el volumen de la cabeza, medido en diferentes pares de gemelos monocigticos. Adems, se obtuvieron medidas del peso corporal, el cociente intelectual y la circunferencia de la cabeza. En este estudio se desea establecer si existe relacin en las medidas neuroanatmicas entre gemelos monocigticos y si existe relacin entre el cociente intelectual y las medidas neuroanatmicas.
La siguiente tabla muestra la relacin entre el cociente intelectual y el rea del crtex cerebral de 20 pares de gemelos.
X
9 10 6 8 10 5 8 7 4 11 7 7 6 8 5 11 5 9 6 10
Y
72 76 59 68 60 58 70 65 54 83 64 66 61 66 57 81 59 71 62 75
Diagrama de dispersin
100 80 60
Y
40 20 0 0 2 4 6 X 8 10 12
X 9 10 6 8 10 5 8 7 4 11 7 7 6 8 5 11 5 9 6 10 152
Y 72 76 59 68 60 58 70 65 54 83 64 66 61 66 57 81 59 71 62 75 1327
Y2 5184 5776 3481 4624 3600 3364 4900 4225 2916 6889 4096 4356 3721 4356 3249 6561 3481 5041 3844 5625 89289
XY 648 760 354 544 600 290 560 455 216 913 448 462 366 528 285 891 295 639 372 750 10376
152 X 7.6 20
1327 Y 66.35 20
2
S 2x
Xi X
n i 1
n Sx 62.12 7.88
1242.55 62.12 20
S2y
Yi Y
n i 1
Sxy
x y
i 1 i
n Sy 4.34 2.08
i
86.8 4.34 20
X Y
rxy
n X X
2
n XY X Y
2 2
n Y Y
207520 201704 24840 23104 1785780 1760929 5816 5816 5816 0.885 1736 24851 41.66157.64 6567.28
5.1. CLCULO
n Y Y Y Y
c i 2 ij
Edad. C1 H A B I L I D A D 10 8 7 6 9 10 7 9 11 7 5 9 8 9 5
Edad. C2 10 8 8 14 12 12 6 8 10 8 10 8 10 14 10 12 14 8 8 10 10 12 12 8 8 250
M E C A N I C A
n Y Y Y Y
c i 2 ij
120
60