Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tiempo
0,00
500,00
1000,00
1500,00
Espacio
Presion
0,00
5,00
10,00
15,00
20,00
Volumen
4
obtendrn exactamente la misma puntuacin en rendimiento. Unos obtendrn ms
o
menos en funcin de otras variables, tales como motivacin o personalidad. Si
relacionsemos ambas variables dada una muestra de sujetos tendramos un
grfico de las
siguientes caractersticas:
Se observa que para un mismo valor en inteligencia existen diferentes posibles
valores
en rendimiento. Se trata de una correlacin positiva pero no perfecta. Este
conjunto de
puntos, denominado diagrama de dispersin o nube de puntos tiene inters como
primera
toma de contacto para conocer la naturaleza de la relacin entre dos variables. Si
tal
nube es alargada -apunta a una recta- y ascendente como es el caso que nos
ocupa, es
susceptible de aplicarse el coeficiente lineal de Pearson. El grosor de la nube da
una
cierta idea de la magnitud de la correlacin; cuanto ms estrecha menor ser el
margen
de variacin en Y para los valores de X, y por tanto, ms acertado los pronsticos,
lo que
implica una mayor correlacin.
Si la nube de puntos es alargada y descendente nos encontramos con una
correlacin
negativa. Supongamos, en este sentido, que relacionsemos la cantidad de
alcohol
ingerida y el grado de memorizacin ante determinados estmulos. Obtendramos
un
grfico como el siguiente:
0,00 0,20 0,40 0,60 0,80
Alcohol
0,00
5,00
10,00
15,00
20,00
25,00
Memoria
Horas de estudio
2,000
4,000
6,000
8,000
10,000
Calificacin
5
Se observa que a mayor cantidad de alcohol ingerida menor material recordado.
Igual
que anteriormente no puede establecerse con exactitud el grado de memorizacin
en
funcin del alcohol ingerido, aunque queda claro la tendencia existente.
Por ltimo, si la nube de puntos adopta una configuracin ms o menos
redondeada de
tal forma que no pueda especificarse ningn tipo de relacin, nos encontramos
con
una correlacin nula. Supongamos que relacionsemos peso con inteligencia.
Obtendramos el siguiente grfico:
Se observa que las personas con poco peso obtienen en inteligencia tanto
puntuaciones
bajas como medias o altas. Lo mismo sucede con personas de peso alto. No
puede
establecerse, pues, ningn tipo de relacin. Ambas variables son independientes
entre
s; la variacin de una de ellas no influye para nada en la variacin de la otra.
1.3.1.- Formula utilizada
El coeficiente de correlacin de Pearson viene definido por la siguiente expresin:
Esto es, el coeficiente de correlacin de Pearson hace referencia a la media de los
productos cruzados de las puntuaciones estandarizadas de X y de Y. Esta formula
rene
algunas propiedades que la hacen preferible a otras. A operar con puntuaciones
estandarizadas es un ndice libre de escala de medida. Por otro lado, su valor
oscila,
como ya se ha indicado, en trminos absolutos, entre 0 y 1.
Tngase en cuenta que las puntuaciones estandarizadas muestran, precisamente,
la
posicin en desviaciones tipo de un individuo respecto a su media. Reflejan la
medida en
que dicho individuo se separa de la media. En este sentido, supongamos que para
cada
individuo tomamos dos medidas en X e Y. La correlacin entre estas dos variables
ser
N
ZZ
r xy
xy
Peso
100,00
110,00
120,00
130,00
140,00
Inteligencia
6
perfecta positiva cuando cada individuo manifieste la misma superioridad o
inferioridad en cada una de ellas. Esto se cumple cuando su posicin relativa sea
la
misma, es decir, cuando sus puntuaciones tipo sean iguales (Zx = Zy). En este
caso la
formula de la correlacin se transforma en:
1
2
N
Z
N
ZZ
N
ZZ
r xyxxx
xy
1
2
N
Z
N
ZZ
N
ZZ
r xyxxx
xy
xy
SS
XY
N
XY
r
xy
xyxyxy
xyxy
xyxy
xy
SS
XY
N
XY
XY XY XY
N
XY
NSS
NXY
N
XY
N
YX
N
XY
SS
NS S
XY XY XY XY
NS S
XXYY
N
S
YY
S
XX
N
ZZ
r
11
*
7
Esta formula es especialmente til cuando se conocen las medias de X e Y as
como sus
desviaciones tipo, lo cual es relativamente frecuente. Si por cualquier circunstancia
no
dispusiramos de la informacin de estos estadsticos podramos calcular rxy
recurriendo a la expresin en puntuaciones directas:
Podemos expresar, igualmente, el coeficiente de correlacin de Pearson en
puntuaciones
diferenciales o centradas mediante la siguiente formula:
donde x = X - X e y = Y - Y. Para su demostracin partamos de (1.5):
Ejemplo 1.1.- Tengamos las siguientes puntuaciones en las variables X
(inteligencia) e
Y (rendimiento acadmico):
X: 105 116 103 124 137 126 112 129 118 105
Y: 4 8 2 7 9 9 3 10 7 6
Calcular el coeficiente de correlacin de Pearson: a) en puntuaciones directas, b)
puntuaciones diferenciales y c) puntuaciones estandarizadas.
SOL:
2
2
2
2
2
2
2
NXXNYY
N XY X Y
N
Y
N
Y
N
X
N
X
N
Y
N
X
N
XY
SS
XY
N
XY
2
r
xy
xy
xy
xy
rxy
22
222222
*
xy
xy
N
y
N
x
N
xy
N
YY
N
XX
N
XXYY
NS S
XXYY
N
S
YY
S
XX
N
ZZ
r
xy
xyxy
xy
8
Antes de calcular el coeficiente de correlacin de Pearson hemos de comprobar si
existe una tendencia lineal en la relacin. Aunque ms adelante ofreceremos
procedimientos analticos que permitan verificar con exactitud la Hiptesis de
linealidad, por el momento, recurriremos a procedimientos grficos, que en una
primera
instancia, pueden resultar suficientes:
Se observa la existencia de una cierta tendencia lineal en la relacin. Podemos, en
consecuencia, proceder a calcular el coeficiente de correlacin de Pearson.
a) Puntuaciones directas.
Configuremos la siguiente tabla:
X Y X2 Y2 XY
________________________________
105 4 11025 16 420
116 8 13456 64 928
103 2 10609 4 206
124 7 15376 49 868
137 9 18769 81 1233
126 9 15876 81 1134
112 3 12544 9 336
129 10 16641 100 1290
118 7 13924 49 826
105 6 11025 36 630
________________________________
1175 65 139245 489 7871
100,00 110,00 120,00 130,00 140,00
Inteligencia
2,00
4,00
6,00
8,00
10,00
Rendimiento
9
De donde:
Aplicando (1.9):
b) Puntuaciones diferenciales o centradas
Hagamos las siguientes transformaciones:
x=X-X
y=YY
X Y x y x2 y2 xy
______________________________________________________
105 4 -12.50 -2.50 156.25 6.25 31.25
116 8 -1.50 1.50 2.25 2.25 -2.25
103 2 -14.50 -4.50 210.25 20.25 65.25
124 7 6.50 .50 42.25 .25 3.25
137 9 19.50 2.50 380.25 6.25 48.75
126 9 8.50 2.50 72.25 6.25 21.25
112 3 -5.50 -3.50 30.25 12.25 19.25
129 10 11.50 3.50 132.25 12.25 40.25
118 7 .50 .50 .25 .25 .25
105 6 -12.50 -.50 156.25 .25 6.25
______________________________________________________
1175 65 0 0 1182.5 66.5 233.5
579 6.5 2.
10
489
117.5 10.874
10
139245
6.5
10
65
117.5
10
1175
22
2
22
2
Y
N
Y
S
X
N
X
S
N
Y
Y
N
X
X
x
x
0.8327
10.874* 2.579
117.5*6.5
10
7871
xy
SS
XY
N
XY
r
10
Apliquemos (1.10):
_
c) Puntuaciones estandarizadas
Hagamos las oportunas transformaciones:
Y configuremos la siguiente tabla:
X Y Zx Zy ZxZy
_____________________________________
105.0 4.0 -1.15 -.97 1.11
116.0 8.0 -.14 .58 -.08
103.0 2.0 -1.33 -1.74 2.33
124.0 7.0 .60 .19 .12
137.0 9.0 1.79 .97 1.74
126.0 9.0 .78 .97 .76
xy
xy
xy
rxy
0.8327
10
8.327
N
ZZ
r xy
xy
y
y
x
x
S
YY
Z
S
XX
Z
11
1.4.- Significacin del coeficiente de correlacin
Una vez calculado el valor del coeficiente de correlacin interesa determinar si tal
valor obtenido muestra que las variables X e Y estn relacionadas en realidad o
tan solo
presentan dicha relacin como consecuencia del azar. En otras palabras, nos
preguntamos por la significacin de dicho coeficiente de correlacin.
Un coeficiente de correlacin se dice que es significativo si se puede afirmar, con
una
N
r
r
t
xy
xy
2
12
N
r
S xy
r
12
( ,N2) t t Se rechaza la Hiptesis nula. La correlacin obtenida no procede de
una
poblacin cuyo valor 0 xy . Por tanto las variables estn relacionadas.
( ,N2) t t Se acepta la Hiptesis nula. La correlacin obtenida procede de una
poblacin cuyo valor 0 xy . Por tanto ambas variables no estn relacionadas.
Ejemplo 1.2.- Determinar la significacin del coeficiente de correlacin del ejemplo
1.1.
SOL:
Apliquemos (1.12):
Buscamos en la tabla de t de Student para 0.05 y 10-2 = 8 grados de libertad,
tal
como se observa a continuacin donde se muestra un fragmento de dicha tabla:
4.21
10 2
1 0,8327
0.8327
2
1
0
22
N
r
r
t
xy
xy
13
El valor marcado con una elipse:
Comparamos el valor t obtenido con el de las tablas:
Inteligencia
2
4
6
8
10
Rendimiento
A
A
A
A
AA
A
A
A
A
Bibliografa
Achen, C. H. (1982). Interpreting and using regression. London: Sage.
Amon, J. (1990). Estadstica para psiclogos (1). Estadstica Descriptiva. Madrid:
Pirmide. (*)
Amon, J. (1990). Estadstica para psiclogos (2). Probabilidad. Estadstica
Inferencial.
Madrid: Pirmide.
Berry, W. D., & Feldman, S. (1985). Multiple Regression in Practice. Sage
University
Paper Series on Quantitative Applications in the Social Sciences, series no. 07050).
Newbury Park, CA: Sage.
Botella y Sanmartin, R. (1992). Anlisis de datos en Psicologa I. Madrid: Pirmide.
Cohen, J., & Cohen, P. (1983). Applied multiple regression/correlation analysis for
the
behavioral sciences. Hillsdale, NJ: Lawrence Erlbaum Associates, Inc.
Cook, R. D. and Weisberg S. (1982). Residual and influence in regression. New
York:
Chapman & Hall.
Chatterjee, S. (1977). Regression analysis by example. New York: Wiley
Domenech, J. M. (1985). Mtodos estadsticos: modelo lineal de regresin.
Barcelona:
Etxeberria, J. (1999). Regresin Mltiple. Cuadernos de Estadstica. Ed. La
Muralla S.A.
Esprides, Salamanca
Pedhazur, E. J., (1997). Multiple Regression in Behavioral Research (3rd ed.).
Orlando,
FL:Harcourt Brace.
Wonnacott, T. H. and Wonnacott, R. J. (1981). Regression: a second course in
statistics.
New York: Wiley.
20
Internet
Correlacin en Wikipedia (espaol):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n
Relacin entre variables cuantitativas:
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas2.pdf
Correlation en Wikipedia (ingls): http://en.wikipedia.org/wiki/Correlation
Electronic Statistics Textbook: http://www.statsoft.com/textbook/stathome.html
Stat notes: An Online Textbook, by G. David Garson of North Carolina State
University:
http://www2.chass.ncsu.edu/garson/pa765/statnote.htm
Pgina de Karl Wnsch sobre correlacin:
http://core.ecu.edu/psyc/wuenschk/docs30/corr6430.doc