Está en la página 1de 40

.

D escrip cin d e l cap tu lo

Variable independiente o prdictora y Controversias y desarrollos recientes: v


variable dependiente. qu es una gran correlacin?
Cmo graficar correlaciones: diagrama Coeficientes de correlacin seguirse >
de dispersin. describen enpublcacjones cientficas.
Patrones de correlacin. Resuifien. "T.-' .
Clculo de un ndice del grado d Trminos clave.
correlacin lineal: coeficiente Ejercicios/
de correlacin de Pearsn;
Apndice i del captulo: frmula de. : ;
Integracin de los distintos pasos. clculo optativa para el .coeficiente de
Otros ejemplos. "correlacin, v : /yv/i
Prueba de a significacin estadstica Apndice II del capitul: prueba de
del coeficiente de correlacin./ v hiptesis y su potencia sobre el .
Cuestiones relacionadas con la coeficiente de correlacin.
interpretacin del coeficiente de
correlacin.

n un estudio realizado recientemente (Aron & Fraley, 1998), 84 alumnos universita-


rios, que en el momento del estudio mantenan relaciones amorosas, completaron va-
rios cuestionarios. Uno de los cuestionarios era una escala de intimidad (basada en
Siernber, 1986) que inclua tems tales como mantengo una relacin de mutuo en-
tendimiento con mi pareja y recibo considerable contencin emocional de mi pare-
ja". Otro cuestionario era una escala de idealizacin (basada en Murray, 1998) que preguntaba a
los alumnos cmo calificaban a sus parejas en cuanto a ingenio y ocurrencia, inteligencia,
seguridad en s mismo, y as sucesivamente. Investigaciones previas haban mostrado que la es-
cala de idealizacin indica en qu medida un individuo percibe que su pareja posee esas caracte-
rsticas positivas independientemente del grado en que su pareja realmente las posea (segn
las medidas obtenidas a travs del informe propio de la pareja en cuestin).
Uno de los resultados del estudio fue que cunto mayor era la intimidad que un individuo
crea tener con su pareja, ms la idealizaba. Es decir, en general, los estudiantes que presentaban
registros altos en la escala de intimidad tambin presentaban registros altos en la de idealizacin.
Los estudiantes que presentaban registros bajos en la escala de intimidad tendan a presentar re-
gistros bajos en la escala de idealizacin.
Tambin podemos observar este patrn visuamente, La figura 3-1 muestra el grfico de ios
resultados arrojados por el estudio. Los valores de la escala de idealizacin se encuentran en el eje
vertical; los valores de la escala de intimidad se encuentran en el eje horizontal. Ambos valores
observados en cada estudiante se representa con un punto. El patrn general muestra que los pun-
tos se ubican desde el ngulo inferior izquierdo hacia el ngulo superior derecho. Es decir, los va-
lores bajos en una variable en general coinciden con valores bajos en la otra variable, y los valores
altos con los altos. Si bien el patrn est lejos de reflejar una coincidencia uno a uno, puede obser-
varse una clara tendencia general.
Este patrn de valores altos en una variable que coinciden con los valores altos en la
otra variable, y bajos que coinciden con bajos, y moderados con moderados, es un ejemplo de
correlacin.
Existen innumerables ejemplos de correlacin: en el caso de los nios, existe correlacin en-
tre la edad y la capacidad de coordinacin; con respecto a los estudiantes, generalmente supone-
mos que existe correlacin entre la cantidad de tiempo de estudio y la cantidad aprendida; en
cuanto al mercado, usualmente suponemos que existe correlacin entre precio y calidad, que los
precios elevados coinciden con la buena calidad y los precios bajos con la mala calidad.
Este captulo explora la naturaleza de la correlacin, la forma de describirla grficamente, los
diferentes tipos de correlacin, la forma de calcular el coeficiente de correlacin (una medida del
grado de correlacin) y otros temas relacionados con la interpretacin de un coeficiente de corre-
lacin. En el captulo 4 tratamos el modo en que se utiliza la correlacin para predecir el valor de
una persona con respecto a una variable basndonos en e valor de esa persona en relacin con
otra variable (por ejemplo, predecir las calificaciones de una persona en la facultad sobre la base
de sus calificaciones en la escuela secundaria). Al abordar los temas de la correlacin y de la pre-
diccin, pasamos de la estadstica que trata una sola variable (captulos 1 y 2) a la estadstica refe-
rida a la relacin entre dos o ms variable.

VARIABLES INDEPENDIENTES O PREDICTORAS


Y VARIABLES DEPENDIENTES__________________________________________
Sin embargo, antes de dedicamos al tema de la correlacin es necesario presentar algunos trmi-
nos importantes. Al estudiar la relacin entre dos variables, frecuentemente pensamos en una va-
riable como la causa y en la otra variable como el efecto. Por ejemplo, podramos considerar a
la intimidad como causa de la idealizacin. La variable considerada causa se denomina variable
independiente, y la considerada efecto se denomina variable dependiente. (La variable depen-
diente se denomina as porque su valor depende del valor de la variable independiente. La varia-
ble independiente, por el contrario, se denomina de ese modo porque su valor no depende de la
variable dependiente. En este pequeo mundo formado por slo dos variables, en el que una es
la causa de la otra, una es independiente y la otra es dependiente de la primera). En nuestro
ejemplo, la intimidad (causa) sera la variable independiente y la idealizacin (efecto) la varia-
ble dependiente.
Sin embargo, tanto en el ejemplo mencionado como en muchos casos en psicologa, es posi-
ble invertir la variable considerada causa y la variable considerada efecto. Fuera del laboratorio
de pruebas, idealizar a nuestra pareja, por ejemplo, podra hacemos sentir que la relacin es nti-
ma, del mismo modo en que el hecho de sentir que la relacin es ntima podra hacemos idealizar
a nuestra pareja. La principal excepcin aparece en experimentos reales, en los que el experimen-
tador controla el nivel de la variable independiente; por ejemplo, asignando personas de manera
aleatoria a diferentes niveles de esa variable (vase apndice A).
Muchas veces a los investigadores no les agrada utilizar los trminos variable independien-
te y variable dependiente en estudios en los que dos variables se miden, simplemente, tal como
se manifiestan en un grupo de personas (como ocurre en nuestro ejemplo de intimidad e idealiza-
cin). Sin embargo, aun cuando no podamos determinar con certeza cul es la causa y cul el
efecto, es posible utilizar el conocimiento sobre una variable para predecir los valores corrspon-
dientes a la otra variable. Por ejemplo, segn los hallazgos realizados en el estudio sobre intimi-
dad e idealizacin, es razonable llegar a la conclusin de que es probable que las personas que
sienten una relacin especialmente ntima con sus parejas tambin las idealicen de una forma es-
pecial. En ese caso, estamos utilizando la intimidad para predecir la idealizacin. No importa
realmente cul es la causa o efecto subyacente, siempre que intimidad e idealizacin estn firme-
mente relacionadas.
Por lo tanto, al analizar dos variables relacionadas, algunos investigadores prefieren llamar a
aquella a partir de la cual realizan la prediccin, variable predictora. Sin embargo, la otra varia-
ble generalmente contina denominndose variable dependiente, (El trmino adecuado para la
variable predicha es variable de criterio, pero este trmino rara vez se utiliza en psicologa, ex-
cepto en algunos textos sobre estadstica). Segn lo acostumbrado, en nuestro libro generalmente
nos referiremos a una de las dos variables correlacionadas como la variable predictora, y a la otra
como la variable dependiente.
Ms adelante, en este mismo captulo, profundizaremos el tema de la causalidad, y en el cap-
tulo 4 veremos exclusivamente la prediccin. Presentamos estos temas ahora en forma concisa,
porque al estudiar la correlacin es til poder emplear los nombres de las dos variables que se co-
rrelacionan, y los nombres que hemos dado son los nombres convencionales. De hecho, es fre-
cuente que en el campo de la psicologa lo que nos interese sea slo el grado en el que dos
variables se relacionan. Probablemente no sea necesario dar a una variable ninguna condicin es-
pecial como causa de la otra o como base para realizar predicciones sobre la otra. Sin embargo, a
menudo los psiclogos se ven forzados a realizar tales distinciones aunque tengan que hacerlo en
forma arbitraria, simplemente para cumplir los estndares establecidos para la creacin de grfi-
cos (como veremos muy pronto), Lo mismo sucede con la correlacin mltiple, que es ms com-
pleja y que trataremos en el captulo 4.

CMO GRAFICAR CORRELACIONES: DIAGRAMA DE DISPERSIN


La figura 3-1 representa la correlacin entre intimidad e idealizacin: es un ejemplo de diagrama
de dispersin. Un diagrama de dispersin permite observar a simple vista el grado y el patrn de
relacin entre las dos variables.

Cmo confeccionar un diagrama de dispersin


La creacin de un diagrama de dispersin puede dividirse en tres pasos:
1. Dibujar los ejes y determinar qu variable se representa en cada uno de ellos. La variable
independiente o predictora se ubica en el eje horizontal, la variable dependiente en el vertical. En
la figura 3-1 ubicamos la variable intimidad en el eje horizontal y la variable idealizacin en el
vertical. Lo hicimos de ese modo porque en el estudio estbamos interesados en observar si el
grado de intimidad podra ser causa del grado de idealizacin.
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Los nmeros deben ir ascendiendo en cada eje, a partir del punto en el que los dos ejes se
cortan. Comnmente, comenzamos con el valor 0 con el menor valor que pueda tener la medi-
da, y ascendemos gradualmente hasta llegar al mayor valor posible de esa medida. Cuando no
exista un valor mnimo o mximo posible, que sea evidente o razonable, comenzamos o termina-
mos la serie con el valor mnimo o mximo presentado comnmente por las personas que confor-
man el grupo de inters para el estudio. (Por otro lado, a diferencia del tipo de grficos descriptos
en el captulo 1, un diagrama de dispersin no se dibuja siguiendo la relacin de 1,5 a 1 para el an-
Figura 3 - 1 . D iagram a de dispersin que m uestra la co rrelacin entre intim idad e id e a liz a c i n d e 85 alum -
n o s universitarios al describir sus actuales r ela cio n es am orosas. (Fuente: A ron & Fraley, 1998),

cho y para la altura respectivamente. Los diagramas de dispersin son cuadrados, con una rela-
cin 1 a 1 para los ejes horizontales y verticales).
En la figura 3-1, el eje horizontal comienza con el valor 1 (el menor puntaje posible en la es-
cala de intimidad, que es un promedio de varias preguntas contestadas cada una de ellas con refe-
rencia a una escala del 1 al 9). El eje vertical comienza con 19, que es la menor puntuacin
posible de la escala de idealizacin (esta escala incluye 19 tems, clasificados del 1 al 9. El punta-
je total de la escala es la suma de los 19 tems). El valor ms alto en el eje horizontal es 9,0, la m-
xima puntuacin posible en la escala de intimidad. El valor ms alto en el eje vertical es 171, la
mayor puntuacin posible en la escala de idealizacin.
3, Marcar un punto por el par de observaciones de cada persona. Ubicar el lugar en el eje ho-
rizontal que corresponde al valor observado de la persona en la variable predictora, Luego mover-
se haca arriba hasta llegar a la altura en el eje vertical que corresponde al valor observado de la
misma persona con respecto a esa variable, y marcar un punto bien claro.
Si en un mismo lugar coinciden dos casos, se puede escribir el nmero 2 en ese lugar o mar-
car un segundo punto lo ms cerca posible del primero, si es posible tocndolo, pero dejando en
claro que en realidad hay 2 puntos en el mismo lugar.

Ejemplo
Supongamos que una empresa est pensando aumentar la cantidad de personal bajo el mando de
cada uno de sus gerentes de piso. Sin embargo, la empresa est preocupada por el estrs que sto
podra provocar a sus gerentes. La empresa supone que cuantas ms personas supervise un geren-
te, mayor ser el estrs sufrido por l. Para analizar la situacin, un psiclogo laboral sugiere es-
tudiar a cinco gerentes seleccionados al azar de entre todos los gerentes de piso de la empresa.
(En la prctica, debera utilizarse un grupo mucho mayor, pero aqu utilizaremos slo cinco casos
para simplificar el ejemplo). Se entrega a cada uno de los cinco gerentes un cuestionario de medi-
cin de estrs en el cual los posibles registros van de 0 (estrs nulo) a 10 (estrs extremo). Los re-
sultados podran ser como los que indica la tabla 3-1.
1. Dibujar los ejes y determinar qu variable representa cada uno de ellos. La empresa est in-
teresada en el efecto causado en el nivel de estrs por la cantidad de empleados supervisados. Por
lo tanto, consideramos la cantidad de empleados supervisados como la variable predictora y ubi-
camos esa informacin en el eje horizontal; el nivel de estrs es la variable dependiente y, por lo
tanto, debe ubicarse en el eje vertical. (Vase figura 3-2a).
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Para el eje horizontal, supongamos que en esta empresa no se permite a ningn gerente su-
pervisar ms de 12 empleados. Por lo tanto, el eje horizontal va de 0 a 12. Eeje vertical va de 0 a
10, que son los lmites del cuestionario de medicin de estrs. (Vase figura 3-2b).
3. Marcar un punto por el par de observaciones de cada persona. En el caso del primer geren-
te, la cantidad de empleados supervisados es . Localizamos el nmero en el eje horizontal.
Luego, subimos hasta alcanzar el nivel del nmero 7 en el eje vertical (el nivel de estrs del pri-
mer gerente). Marcamos un punto en ese lugar (vase figura 3-2c). Seguimos el mismo procedi-
miento con cada uno de ios cuatro gerentes restantes. El resultado debera ser el que muestra la
figura 3-2d.

PATRONES DE CORRELACIN
Hasta ahora hemos considerado aquellas situaciones en las que los valores altos coinciden con los
altos, los bajos con los bajos y los medianos con los medianos. A ese tipo de situacin se la deno-
mina correlacin positiva. Debido a que el patrn que muestra el diagrama de dispersin se
aproxima a una lnea recta, es tambin un ejemplo de correlacin lineal.
Por ejemplo, en el diagrama de dispersin de la figura 3-1 se podra dibujar una recta que
muestre la tendencia general de los puntos, tal como lo hemos hecho en la figura 3-3. Del mismo
modo, se podra dibujar una recta en nuestro segundo ejemplo, como lo muestra la figura 3-4.
(Una de las razones por las que estos casos de correlaciones lineales se denominan positivas se
debe a que, en geometra, la pendiente de una recta es positiva cuando observarnos que la recta se
eleva a medida que desplazamos nuestra mirada desde la izquierda hacia la derecha del grfico.
En el captulo 4, aprenderemos reglas precisas para trazar tales rectas y determinar su pendiente).

T a b la 3 - 1 .
E m p l e a d o s s u p e r v i s a d o s y n iv e l d e e s t r s ( d a t o s f i c t i c io s ) .

E m p ic a d o s su p e r v isa d o s N iv el d e e str s seg n c u estio n a rio

6 7
8 8
3 i
10 . $
8 6
, (^tidadde em|Me^ipryi$d<. .

io' ' ; \:>lM';7vS

;;':,;0V v V .;'2 ;;' :3 4- 5 6 7 8 9 10, II' 2 ' .. /. 0 3 4 / 5," 6 Q & } ;^


:M ';-''\.V:;VCJantdd<ie'empleados soperrados.: ' / ' Can'Hilad d lic ^ ^ p le d p .4 ^ p ^ sa d p K V x ,1,' , ; " v ; ?

F ig u r a 3 -2 , C m o hacer un diagram a de dispersin , (a) S e determ inan los e je s, la variable pred ictora (e m -
p le a d o s su p erv isa d o s) se ub ica en e l e je horizontal y la variable d ep en d ien te (n iv el d e estrs) en. e l e je v erti-
cal. (b ) S e m arca la serie v a lo res so b re lo s ejes, (c ) S e m arca el pu nto determ inad o por e l par d e va lores
o b serv a d o s co rresp o n d ien tes al prim er gerente, (d ) S e m arca un punto d o n d e s e cruza p o r ca d a par d e v a lo -
res o b serv a d o s d e lo s c in c o gerentes.

Correlaciones negativas
A veces, la relacin entre las variables no es positiva. Por el contrario, los valores altos coinciden
con ios bajos y los bajos con los altos. A esto se denomina correlacin negativa. Por ejemplo, en
un estudio de las relaciones amorosas entre estudiantes (Aron & Fraley, 1998), ios investigadores
descubrieron que cuanto ms lejos de su pareja vive una persona (en funcin de los minutos de
viaje), menos cantidad de actividades comparte con su pareja. El diagrama de dispersin de la fi-
gura 3-5 representa grficamente este patrn de correlacin.
Incluimos una recta en la figura para remarcar la tendencia general de los puntos; as, podemos
observar que a medida que la recta avanza hacia la derecha, tambin se dirige hacia abajo. Es de-
cir. cuantas ms son las horas de viaje, menos actividades se realizan en pareja.
F ig u r a 3 -3 . D iagram a d e d isp ersi n de la figura 3-1 c o n un a recta q u e in d ica la ten d en cia general. (F u e n te :
A ron & Fraley, 19 9 8 ).

F ig u r a 3 -4 . D ia g ra m a d e d isp e r si n d e la
figura 3 -2 d c o n una recta qu e in d ica la tend en-
c ia general.

Una investigacin realizada por Bardsley y Rhodes (1996), dos psiclogos especializados en
organizaciones empresariales, ilustra tambin una correlacin negativa. A travs de un estudio
realizado con 174 obreros, descubrieron que el hecho de llegar tarde a trabajar tena una corre-
lacin lineal negativa con la satisfaccin laboral. Cuanto mayor era el grado de satisfaccin la-
F ig u r a 3 -5 . D ia g ra m a de d isp ersin c o n una recta q u e in d ic a la ten d en cia g en eral d e una correla cin n e g a -
tiva entre d o s variables: d istan cia en m in u tos d e v ia je y can tid ad d e activid ad es d iferen tes q u e e l p artici-
pante realiza co n su pareja. (F u e n te : A ron & F raley, 1 9 9 8 ).

boral de los obreros, menos frecuentemente llegaban tarde. En otras palabras, cuanto menor era
el nivel de satisfaccin de los obreros, con ms frecuencia llegaban tarde a trabajar.

Correlaciones curvilneas
En algunos casos, la relacin entre dos variables no sigue una lnea recta positiva o negativa, sino
un patrn ms complejo denominado correlacin curvilnea. Por ejemplo, se sabe que hasta de-
terminado nivel, una mayor ansiedad fisiolgica hace que uno se desempee mejor en cualquier
tarea (como por ejemplo, una prueba de matemtica). A partir de ese nivel, una mayor ansiedad
fisiolgica hace que el rendimiento empeore. Es decir, desde estar casi dormido hasta un nivel
moderado de ansiedad, la efectividad aumenta. Al superar ese nivel moderado, el aumento de la
ansiedad puede acelerar demasiado a un individuo, impidindole tener un buen rendimiento.
Este patrn curvilneo en particular est representado en la figura 3-6, en donde se observa que
sera imposible dibujar una lnea recta para describirlo. La figura 3-7 muestra algunos otros ejem-
plos de relaciones curvilneas.
A travs del mtodo usual de clculo de la correlacin (mtodo que aprenderemos en este ca-
ptulo) obtenemos el grado de correlacin lineal. Si el verdadero patrn de asociacin es curvil-
neo, calcular la correlacin con el mtodo usual podra dar como resultado muy poca correlacin
o una correlacin nula. Por eso es muy importante observar los diagramas de dispersin para des-
cubrir estas relaciones ms interesantes, antes de realizar correlaciones automticamente con el
mtodo usual, suponiendo que la tnica relacin posible sea una lnea recta.
F ig u r a 3 -6 . E jem p lo d e relacin
curvilnea: d e sem p e a en una tarea
y ansiedad.

cin de d g ito s p or sm b o lo s y m otivaci n en nios,


Correlacin nula
Tambin es posible que no exista ningn tipo de relacin entre dos variables. Por ejemplo, si hi-
ciramos un anlisis entre la creatividad y el numero de calzado, los resultados podran ser simi-
lares a los que muestra la figura 3-8. Los puntos se dispersan en todas las direcciones, y no existe
lnea recta ni de ningn otro tipo que pueda considerarse indicio razonable de una tendencia. Esto
simplemente es una correlacin nula.
En investigaciones reales, algunas veces existe una relacin entre dos variables, pero al no ser
muy fuerte, es difcil notarla en un diagrama de dispersin. Esto suele suceder especialmente en
anlisis en los que se estudia a una gran cantidad de personas y la relacin entre las dos variables
es muy leve o subliminal. En esos casos, uno podra estar seguro de que la relacin es ms que
una coincidencia, justamente debido a su leve pero consistente presencia en un grupo tan grande
de personas. La figura 3-9 muestra un diagrama de dispersin con una leve correlacin lineal po-
sitiva entre dos variables. Es posible observarla?

F ig u r a 3 -8 . D o s variab les sin a so c ia c i n entre s, cre-


atividad y n m ero d e ca lza d o (d atos fic ticio s).

F ig u r a 3 -9 . D iagram a de
dispersin en e l que se en-
contr un a le v e co rrela -
c i n lin e a l p o sitiv a entre
las d o s variab les.
CLCULO DE UN NDICE DEL GRADO
DE CORRELACIN LINEAL:
COEFICIENTE DE CORRELACIN DE PEARSON
Al observar un diagrama de dispersin obtenemos un indicio aproximado del tipo y grado de rela-
cin entre dos variables. Sin embargo, observar el grfico no es un mtodo muy preciso. Es nece-
sario obtener un nmero que represente el grado exacto de correlacin.

Grado de correlacin
El grado de correlacin indica en qu medida existe un patrn claro de alguna relacin en par-
ticular entre dos variables. Por ejemplo, vimos que existe una correlacin lineal positiva cuan-
do los valores altos coinciden con los valores altos, los medios con los medios y los bajos con
los bajos. Por lo tanto, el grado de una correlacin de este tipo determina cuntos valores altos
coinciden con otros tambin altos, y as sucesivamente. Del mismo modo, el grado de correla-
cin lineal negativa indica cuntos valores altos de una variable coinciden con valores bajos de
la otra, y as sucesivamente. En cuanto a los diagramas de dispersin, un alto grado de correla-
cin lineal significa que todos los puntos se encuentran muy cerca de una lnea recta (la recta
que se inclina hacia arriba o hacia abajo segn la correlacin lineal sea positiva o negativa).
Una correlacin lineal perfecta es aquella en la que todos los puntos estn ubicados exactamen-
te sobre la lnea recta.

Determinacin del grado de correlacin lineal


Lo primero que necesitamos para determinar el grado de correlacin lineal es alguna forma de
medir qu es un valor alto o bajo, y en qu medida es alto o bajo un determinado valor alto o bajo.
(Otro mtodo, descripo en el captulo 4, consiste en determinar la distancia entre cada punto y la
lnea). El mtodo aqu propuesto implica comparar valores de diferentes variables en forma cohe-
rente. Como vimos en el captulo 2, la mejor forma de resolver el problema de comparar manza-
nas con naranjas es a travs de las puntuaciones Z.
A modo de revisin, una puntuacin Z es la-cantidad de desvos estndar a los que se encuen-
tra una observacin de la media. No importa la escala con la cual se haya realizado la medicin; si
uno convierte las puntuaciones originales en puntuaciones Z, el efecto es el mismo. Una puntua-
cin original alta (es decir, que se encuentra por encima de la media de los otros valores de la va-
riable) siempre tendr una puntuacin Z positiva, y una puntuacin original baja (por debajo de la
media) siempre tendr una puntuacin Z negativa. Ms an, cualquiera sea la medida usada en
particular, las puntuaciones Z brindan un indicio estndar de cun alta o baja es cada puntuacin.
Por ejemplo, una puntuacin Z de 1 est siempre exactamente 1 desvo estndar por sobre la me-
dia, una puntuacin Z de 2 est siempre dos desvos estndar por sobre la media. Las puntuacio-
nes Z de una variable son directamente comparables con las puntuaciones Z de otra variable.
Existe otra razn por la cual se utilizan puntuaciones Z para calcular el grado de correlacin,
y est relacionada con lo que sucede si se multiplica un valor de una variable por un valor de la
otra variable, clculo que se denomina producto cruzado. Cuando se utilizan puntuaciones Z, el
clculo se denomina producto cruzado de puntuaciones Z. Si se multiplica una puntuacin Z
alta por una puntuacin Z alta, siempre se obtiene un producto cruzado positivo debido a que,
ms all de qu escala se utilice, los valores que se encuentran por sobre la media (valores altos)
se transforman en puntuaciones Z positivas, y un nmero positivo multiplicado por un nmero
positivo siempre produce un nmero positivo. Ms an, y esto es lo interesante, si se multiplica
una puntuacin Z baja por otra puntuacin Z baja, tambin se obtiene siempre un producto cruza-
do positivo debido a que, ms all de qu escala se utilice, los valores que se encuentran por deba-
jo de la media (valores bajos) se convierten en puntuaciones Z negativas, y un nmero negativo
multiplicado por un nmero negativo siempre produce un nmero positivo.
Cuando los valores altos de una variable coinciden con los altos de la otra, y los bajos de una
con los bajos de la otra, el producto cruzado de puntuaciones Z siempre ser positivo. Suponga-
mos que tomamos toda una distribucin de valores observados y multiplicamos la puntuacin Z
de cada persona en una variable por la puntuacin Z de esa persona en la otra variable. El resulta-
do de esta operacin, cuando ios valores altos coinciden con ios altos y los bajos con los bajos, es
que todos los productos resultarn positivos. Si luego sumamos esos productos cruzados de pun-
tuaciones Z de todas las personas incluidas en el estudio, que son todos positivos, obtendremos un
gran nmero positivo.
Por otro lado, consideremos lo que sucedera con una correlacin lineal negativa, en la que
los valores altos coinciden con los bajos y los bajos con los altos. En cuanto a las puntuaciones Z,
esto significara multiplicar positivos con negativos y negativos con positivos, y obtendramos to-
dos productos cruzados negativos que, sumados, daran como resultado un gran nmero negativo.
Finalmente, supongamos que no existe una correlacin lineal. En esa situacin, en algunos
casos los valores altos de una variable coincidiran con valores altos de la otra variable (y algunos
valores bajos coincidiran con valores bajos), dando como resultado productos cruzados positi-
vos. En otros casos, los valores altos de una variable coincidiran con valores bajos de la otra (y
algunos valores bajos coincidiran con valores altos), dando productos cruzados negativos. Al su-
mar los productos cruzados de todas las personas incluidas en el estudio, los productos cruzados
positivos y negativos se cancelaran unos a otros, dando un total cercano a 0 .
En cada una de las situaciones arriba mencionadas convertimos todos los valores en puntua-
ciones Z, multiplicamos las dos puntuaciones Z de cada persona y sumamos los productos cruza-
dos. El resultado es un gran nmero positivo, si existe una correlacin lineal positiva; un gran
nmero negativo, si existe una correlacin lineal negativa, y un nmero cercano a 0, si no existe
correlacin lineal.
Sin embargo, todava no hemos resuelto el problema de determinar el grado de una correla-
cin positiva o negativa. Aparentemente, cuanto mayor sea el nmero, mayor ser la correlacin.
Pero a partir de qu nivel se considera que un nmero grande es tal, y qu nmeros grandes no lo
son tanto? No podemos definirlo simplemente por la suma de los productos cruzados, que aumen-
ta slo por el hecho de incluir ms participantes en el estudio. (Es decir, un estudio con 100 parti-
cipantes presentara una suma mayor de productos cruzados que el mismo estudio con slo 25
participantes).
La solucin a este problema es dividir la suma de productos cruzados de puntuaciones Z por
la cantidad de casos. Es decir, calculamos el promedio de los productos cruzados de puntua-
ciones Z, que nunca podr ser mayor a + 1, y que en el caso de ser igual a +1, indicara una corre-
lacin perfecta lineal positiva. Por otro lado, el valor mnimo de este promedio es -1, e indicara
una correlacin perfecta lineal negativa. En el caso de que no exista correlacin lineal, el prome-
dio de los productos cruzados de puntuaciones Z ser 0.
Generalmente, las correlaciones no son perfectas. En el caso de una correlacin lineal positi-
va que no es perfecta, el promedio de los productos cruzados de puntuaciones Z estar entre 0 y
+1. Para decirlo de otro modo, si la tendencia general de las puntuaciones es ascendente y hacia la
derecha, pero no coinciden exactamente con la lnea recta, este nmero estar entre 0 y +1. La
misma regla se aplica para las correlaciones negativas: el nmero estar entre 0 y - 1.
Francis Galton es considerado l invnibr conclusin de que cada retrato requera un
del clculo estadstico denominado corre- promedio d 20.000 pinceladas. Y mientras
lacin, aunque Kar. Pearson y. otros desa- caminaba por las caes de variis ciudades -
rrollaron las frmulas. En l captulo 14 de las Islas Britnicas, claificl belleza
(cuadro 14-1) aprenderemos algo sobre de los habitantes: femehinbs pulsando un
Pearson, y en el captulo 9 (cuadr 9-1) so- mecanismo de grabacin que llevaba en su. :
bre William S. Gosset, otro importante es- bolsillo con el que registraba bueno, re -: .
tadstico precursor, inventor de la prueb . guiar o malo. . . . / ' / : '
Gosset era alumno y colega de Kari Pear- Sin embargo, el inters que consuma a :
son. Pearson, a su vez, fue alumno y colega, Galton era contar la caritidad. de genios, cri- -
de Gal ton (a quien Pearson otorg todo el mnales y otros caracteres tpicos existentes
crdito por el descubrimiento de la crrela-, en las distintas familias. Quera compren-
cin). En otras palabras, el mundo de la es- der cmo se produca cada tipo paira quer -
tadstica en ese momento perteneca a un a ciencia pudiera mejorar la raza hqmana: La. ;.
pequeo y selecto club britnico (vase finalidad: sera estimular los gobiernos a .
cuadro 16-1). De hecho, casi toda la ciencia imponer la eitgenesia, es decir, la procrea-v
en general era una especie de club apenas cin selectiva orientada a.lograr uri mayor; :
ms amplio. Por ejemplo, Galton estaba muy nivel de inteligencia, comportamiento mo--
influenciado tambin por su propio prim, ral adecuado y otras cualidades, que serian
Charles Darwin. deterininadas, por supuesto, por el eiigenis-, -
De todos los miembros de este club,. ta. (A partir de esa poca, la eugenesia cay -
Galton era tal vez el ms tpico de su poca,' en el descrdito)..El concepto de crrela-
un caballero cientfico, excntrico y acau-. cin surgi directaipnte de los 'primeros.y.
daiado. Adems de su trabajo-en estadsti- sencillos esfuerzos de Galton en. ese. sent-,
ca, posea un ttulo en medicina, explor el , do: el estudio de la relacin; entre la altura d . :
Africa oscura, invent anteojos para leer los nios y sus padres. .
debajo dl agua, experiment con mapas: En realidad, gran parte;de l ciencia
estereoscpicos, incursion en la meteoro- ; estadstica, o. biometra, como la deno- ..
logia y antropologa y escribi un informe minaba Galton, surgi como- aplicacin de
sobre la recepcin de seales inteligibles la matemtica a temas relacionados con la
desde las estrellas. biologa y las ciencias sociales. Y de todos
Sobre todo, Galton era un contador ios clculos estadsticos, la correlacin fue;;,;
compulsivo. Algunos de sus recuentos eran una herramienta..especialmente til :para;
infames. Una vez, mientras asista a na c- estas ciencias en las que, por lo general,; no
tedra, cont las veces por minuto en que la podan realizarse experimentos:-riguroso .
audiencia se impacientaba, buscando varia- tales como; los experimentos d procrea-
ciones relacionadas con io aburrido dl te- cin en humanos. Al principio, el mtodo
ma tratado. En dos oportunidades se hizo de Galton para medir la tendencia con que
retratar y se dedic a contar las pinceladas una cosa ocurra junto con otra pareca
que daba el artista por hora, ,llegando a'la ser casi el mismo que .para probar la causa
de.algo. Por ejemplo, si poda demostrarse sar por alto las diferencias en cuanto a
mtmticamente que la .mayora de las oportunidades.educativas). El msmp/estu~.\
personas'ms brillantes provenan de unas dio podr probar en forma ms convin-
pocas familias britnicas de alta alcurnia, y cente que si uno era miembro de una de las
la mayora de las personas numos inteli- ;r a e jo i^ -a n ^ -.lstoriailo.
gentes provenan de. .las familias., pobres, .. convertira.en un excelente ejemplo de la
: aparentemente se probara, que la inteli- facilidad con que se malinterpreta el signi-
gencia era producto de la herencia de cier- ficado de la correlacin. / / , ;
tos genes , (siempre que uno fuera lo
suficientemente prejuicioso como para pa- R eferentas:peers'(1987); Tankard {1984),-.:

El coeficiente de correlacin
El promedio de los productos cruzados de puntuaciones Z es, entonces, un excelente modo
de calcular el grado de correlacin lineal. Se lo denomina coeficiente de correlacin. Tam-
bin se lo llama coeficiente de correlacin de Pearson (o, para ser muy tradicionales, coefi-
ciente de correlacin producto-m om ento de Pearson), Lleva el nombre de Karl Pearson (a
quien presentaremos en el cuadro 4-1). Pearson, junto con Francis Galton (vase cuadro 3-1),
desempe un papel fundamental en el desarrollo del coeficiente de correlacin. El coefi-
ciente de correlacin se representa con la letra r, que es la forma abreviada de regresin, un
concepto muy relacionado con la correlacin (que veremos en el captulo 4). Tambin es im-
portante saber que en algunas publicaciones cientficas se hace referencia a los coeficientes
de correlacin como correlaciones de orden cero (veremos las razones para este nombre en
el captulo 17).
La figura 3-10 muestra diagramas de dispersin e indica el coeficiente de correlacin de va-
rios ejemplos.

F igura 3-10. D iagram as d e d isp ersi n y c o e fic ie n te s d e co rrela ci n d e d iv erso s e je m p lo s c o n d iferen tes gra-
d o s d e co rrela ci n lin eal.
Figura 3-10. {continuacin)
La exposicin precedente puede resumirse en unos pocos smbolos, ia frmala del coeficiente de
correlacin:
r = ,ggx.gx, (3-1)
N
r es el coeficiente de correlacin, Zx es la puntuacin Z de cada persona en la variable X, Zy es la
puntuacin Z de cada persona en la variable Y. ZxZy es igual al producto Zx por Zy (el producto
cruzado de puntuaciones 2 ) de cada persona, y 2 ZxZy es la suma de los productos cruzados de to-
das las personas incluidas en el estudio. N es la cantidad de personas que participan en el estudio.
Uniendo todos los datos, 2ZxZy dividida por V, es el promedio de los productos cruzados de pun-
tuaciones 2 .

Pasos que se deben seguir para calcular el coeficiente de correlacin


Los cuatro pasos que se deben seguir para calcular el coeficiente de correlacin son los
siguientes:
.1. Convertir todas las observaciones en puntuaciones Z. Para esto es necesario calcular ia me-
dia y el desvo estndar de cada variable y luego la puntuacin Z correspondiente a cada valor ob-
servado.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. Es decir, por cada per-
sona, multiplicar la puntuacin Z en una variable por la puntuacin Z en la otra variable.
3. Sumar todos los productos cruzados de puntuaciones Z.
4. Dividir el resultado por la cantidad de personas que participan en el estudio.

Frmula de definicin versus frmula de clculo para el coeficiente de correlacin


El procedimiento que acabamos de describir, basado en la frmula de definicin, esclarece la
lgica implcita en el clculo del coeficiente de correlacin. Seguir estos pasos en los ejerci-
cios que presentamos a continuacin (y en los ejercicios al final del captulo) ayuda a incorpo-
rar la lgica mencionada. Sin embargo, para calcular el coeficiente de correlacin en un
estudio real, casi siempre usaramos una computadora. La frmula de clculo que aparece en
el apndice I de este captulo facilitar mucho el trabajo, si alguna vez fuera realmente nece-
sario. En un estudio real con muchos registros, calcular un coeficiente de correlacin manual-
mente (o con una calculadora).

Ejemplo
Intentemos aplicar los pasos enumerados ai ejemplo del nivel de estrs de los gerentes.
1. Convertir todas las observaciones en puntuaciones Z. Comenzando con la cantidad de em-
pleados supervisados, la media es 7 (la suma, que es igual a 35, dividida por 5 gerentes) y el des-
vo estndar es 2,37 (la suma de los desvos cuadrticos, 28, dividida por 5 gerentes, es igual a
una varianza de 5,6, cuya raz cuadrada es 2,37). En el caso del primer gerente, entonces, un valor
observado de 6 es una unidad por debajo de la media 7, y 1 dividido 2,37 es 0,42. Por lo tanto, la
puntuacin Z del primer gerente referido a la cantidad de empleados supervisados se ubica a 0,42
desvos estndares por debajo de la media o, lo que es igual, presenta una puntuacin Z de - 0,42.
Calculamos el resto de las puntuaciones Z del mismo modo y las ordenamos en las columnas co-
rrespondientes de la tabla 3-2.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. En el caso del primer
gerente, multiplicamos - 0,42 por 0,38: el resultado es -0,16. La ultima columna de la tabla 3-2
muestra los productos cruzados de iodos los gerentes.
3. Sumarlos productos cruzados de puntuaciones Z. Como lo indica la tabla 3-2, el total es 4,38.
4. Dividir el resultado del paso anterior por la cantidad de personas incluidas en el estudio, es
decir, 4,38 dividido 5 (la cantidad de gerentes incluidos en el estudio). El resultado es 0,876. Este
es el coeficiente de correlacin que, redondeado, es igual a 0,88. Aplicando la frmula del coefi-
ciente de correlacin,
5 2 ^ 4 3 8
N 5

Dado que el coeficiente de correlacin calculado es positivo y cercano a 1, es decir, el mayor va-
lor posible, podemos afirmar que estamos frente a una correlacin lineal fuertemente positiva.

INTEGRACIN DE LOS DISTNTOS PASOS.


OTROS EJEMPLOS ______________________________________________
En general, cuando nos encontramos frente a un problema relacionado con la correlacin, el m-
todo adecuado consiste en hacer primero un diagrama de dispersin. Luego, si el diagrama de dis-
persin no muestra un patrn curvilneo claro, se procede a calcular el coeficiente de correlacin.
Aun cuando no exista un patrn curvilneo, es conveniente observar un poco ms en detalle el dia-
grama de dispersin. La idea es estimar en forma aproximada el grado y la direccin de la corre-
lacin lineal, como forma de control en el caso de que haya errores al calcular concretamente ei
coeficiente de correlacin.

T a b la 3 - 2 .
C lc u lo d e l c o e fic ie n te d e c o r r e la c i n p a r a e l e je m p lo d e l n iv e l d e e s t r s d e lo s g e r e n te s
( d a t o s fic tic io s ).

C a n tid a d d e E m p le a d o s S u p e rv isa d o s (X ) N ivel d e E str s (Y ) Prod. C ruzados

X X -M (X - M f zx Y Y -M T -M )2 Zy ZxZy
6 -1 1 - 0 ,4 2 7 1 1 0,38 - 0 ,1 6
I--.V-M.; 0 ,4 2 A :8 l ; . r .-2 ( S o I B M 0 ,3 2 ' ;
3 -4 16 -1 ,6 9 1 -5 25 - 1 ,9 2 3 ,2 4
.10 ;V; "3' ' 1,27 .8 " : '2- .. - 4 7 r i ;
8 1 1 0 ,4 2 6 0 0 0 ,0 0 0 ,0 0

a 35 SS = 28 2 = 30 SS - 3 4 2 Z x Z r = 4 ,3 8
=7 SD3 = 5 ,6 0 M = 6 S D * = 6 ,8 0 r - 0,88
SD * 2 ,3 7 SD = 2,61
Combinando los distintos procedimientos tratados en este captulo, los pasos a seguir son los siguientes:
1. Construir un diagrama de dispersin.
a ) D ib u ja r l o s e j e s y d e te r m in a r q u v a r ia b le v a e n c a d a u n o d e e llo s .
b) Determinar ia serie de valores que se van a utilizar para cada variable y marcarla en
los ejes.
c) Marcar un punto por el par de observaciones de cada persona.
2. Determinar si el patrn es claramente curvilneo. Si lo es, no se calcula el coeficiente de co-
rrelacin (o si se lo calcula, debe tenerse en cuenta que slo se est describiendo el grado
de relacin lineal).
3. Estimar la direccin y el grado de correlacin lineal.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z.
c) Calcular el producto cruzado de las puntuaciones Z de cada persona.
d) Sumar los productos cruzados de puntuaciones Z.
e) Dividir el resultado por la cantidad de personas incluidas en el estudio.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado, comparndolo con
la estimacin visual realizada a partir del diagrama de dispersin.

Como observamos anteriormente, en una investigacin real el coeficiente de correlacin se


calculara en cuestin de segundos utilizando una computadora. La mayora de ios paquetes de
computacin pueden realizar tambin un diagrama de dispersin (y algunos hasta explican cmo
se establecen sus ejes y escalas). Sin embargo, la finalidad de incluir los ejemplos (y resolver los
ejercicios al final del captulo) y aplicar todos estos pasos bastante tediosos es comprender la l-
gica implcita en los resultados que, con tanta facilidad, surgen de la computadora.

Ejemplo
Supongamos que una persona que investiga el funcionamiento de la memoria realiza un experi-
mento para comprobar la teora de que la cantidad de exposiciones a una palabra aumenta las pro-
babilidades de que sea recordada. Dos individuos son elegidos al azar para observar una lista de
10 palabras una sola vez, otros dos individuos observan la lista dos veces, y as sucesivamente,
hasta llegar a ocho exposiciones de cada palabra, y 16 participantes en total. La tabla 3-3 indica
los resultados de este experimento ficticio. (Un estudio real de este tipo probablemente dara un
resultado ms curvilneo debido a que, en esta clase de investigaciones, cuanto mayor sea la can-
tidad de exposiciones, menor ser el aumento relativo de palabras recordadas).
1. Construir un diagrama de dispersin.
a) Trazar los ejes y determinar qu variable deber marcarse en cada uno de ellos. Segn el
diseo del experimento, la cantidad de exposiciones es la variable independiente, por lo
que estar ubicada en el eje horizontal. La cantidad de palabras recordadas es la variable
dependiente, por lo que estar ubicada en el eje vertical (vase figura 3-1 la).
b) Determinar la serie de valores que se van a utilizar para cada variable, y luego marcarla
en los ejes. En el estudio que estamos analizando, la-cantidad de exposiciones vara de 1
a 8, pero comenzaremos con 0 para cumplir con las reglas convencionales. La cantidad
de palabras recordadas no puede ser menor que 0 ni mayor que 10, cantidad total de pa-
labras en la lista (vase figura 3-1 Ib).
T a b la 3 - 3 .
Efecto del nmero de exposiciones en la cantidad de palabras recordadas.

Nmero de identificacin Cantidad de exposiciones Cantidad de palabras recordadas

c) Marcar los puntos determinados por el par de observaciones de cada persona. El primer
punto se ubica con coordenada 1 segn el eje horizontal, y 4 segn el eje vertical. Mar-
cando cada uno de los punios, de este mismo modo, completamos el diagrama de disper-
sin (vase figura 3- i 1c).
2. Determinar s el diagrama es claramente curvilneo. Parece existir una fuerte tendencia lineal.
3. Estimar la direccin y el grado de correlacin lineal. Los puntos van hacia arriba y hacia la
derecha, y la mayora de ellos estn ubicados muy cerca de una lnea recta imaginaria. Por
lo tanto, aparentemente se trata de una correlacin lineal positiva bastante fuerte.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de exposi-
ciones es 4,50, con un desvo estndar de 2,29. Por lo tanto, la primera observacin, que
es igual a I, se ubica 3,5 unidades por debajo de la media, lo que implica 1,53 desvos
estndares debajo de la media, o sea Z = -1,53. Utilizando el mismo procedimiento para
todas las otras observaciones se obtienen las puntuaciones Z que aparecen en las colum-
nas correspondientes de la tabla 3-4. (La tabla no indica los pasos para el cmputo del
desvo y del desvo cuadrtico utilizados para calcular el desvo estndar).
b) Calcular el producto cruzado de las puntuaciones Z de cada persona. Por ejemplo, el pri-
mer producto cruzado es -1,53 por -0,74, lo que da un resultado de +1,13. Todos los
productos cruzados aparecen en la columna ubicada a la derecha en la tabla 3-4.
c) Sumar los productos cruzados de las puntuaciones Z. El total es 10,80.
d) Dividir el resultado por la cantidad de personas. El resultado de dividir la suma de los
productos cruzados de puntuaciones Z, 10,80, por la cantidad de personas, 16, es 0,68,
que es el coeficiente de correlacin. Es decir, r = 0,68.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado comparndolo con
, la estimacin realizada a partir del diagrama de dispersin. El resultado calculado de +0,68
es, como esperbamos, una correlacin lineal positiva bastante marcada.

C orreteeoa 87
10 '
9
8
7
6
5
*.
.3
2
i-
. - ..... ......................................... ; :

Exposiciones O.. i.' 2 ' .'3


(a) ' Exposiciones
(b)
.10
.- 9

8'

S B illli!
r
i. - - : . " v. . . .'^. : : 4 'i ' .-Vivvii

'0 1 2 -3 4-5 6 7 8
. :

. Exposiciones. \ \r
" (c) y-?' -S
"vi;"

Figura 3-11. Pasos que se deben seguir para confeccionar un diagrama de dispersin segn ios datos de la
tabla 3-3. (a) Establecer los ejes, la variable independiente (cantidad de exposiciones) en el eje horizontal,
la variable dependiente (cantidad de palabras recordadas) en el eje vertical; (b) determinar la serie de valo-
res, y marcarlos en los ejes; (c) ubicar un punto por cada par de observaciones de cada uno de los 16 parti-
cipantes (datos ficticios).

Otro Ejemplo
Supongamos que una psicloga educacional averigu la cantidad promedio de alumnos por clase
y los promedios de calificaciones en las pruebas de nivel de cinco escuelas primarias de determi-
nado distrito escolar. La tabla 3-5 muestra los datos. La pregunta formulada por la psicloga es:
Cul es la relacin entre estas dos variables?
1. Construir un diagrama de dispersin.
a) Dibujar los ejes y determinar en cul se ubica cada variable. Dado que resulta razonable
pensar que la cantidad de alumnos por clase afecta las calificaciones en las pruebas de
nivel, y no al revs, podemos trazar en la parte inferior el eje correspondiente a la canti-
dad de alumnos por clase.
Tabla 3-4.
Clculo d d coeficiente de correlacin del efecto producido por el nmero de exposiciones en la
cantidad de palabras recordadas (datos ficticios).

Id en tifica ci n C a n tid a d d e esp o sicio n es C a n tid a d de p a la b ra s record ad as P ro d u cto cru za d o


d el p a rticip a n te (v a r ia b le in d ep en d ien te) (v a ria b le d ep en d ien te) d e p u n tu a c io n es Z

X Zx Y Zy 2xZ y
1 -1 ,5 3 4 - 0 ,7 4 1,13
2 : 1 -1 ,5 3 3. -1 ,2 1 1,85
3 2 - 2 ,0 9 3 -1 ,2 1 1,32
4 2 -1 ,0 9 .5 - 0 ,2 6 0 ,2 8
5 3 -0 ,6 5 6 0,21 -0 ,1 4
3 - 0 ,6 5 4 - 0 ,7 4 0,48
7 4 - 0 ,2 2 4 - 0 ,7 4 0 ,1 6
8 ; ; 4 ' - 0 ,2 2 ... 6 0,21 -0 ,0 5
9 5 0 ,2 2 5 -0 ,2 6 - 0 ,0 6
10 V : 5 r ., 0 ,2 2 .. .. 7 --, 0,68 - ' 0,15 ...-V:
11 6 0,65 2 1,68 - 1 ,0 9
-, 12 0,65 . v V - L , 9 1,62 ^ i , 5
13 7 1,09 0,21 0,2 3
. V 14 7 ' 1,09 V - i,i5
. .;..c -L 1,25
15 8 1,53' 9 1,62 2 ,4 8
16 . .8 1,53 . '.v, . v . 8;. 1,15 1,76

: 72 89 10,80
M: 4,5 0 5.56 r = 0,68
S D ~ i % m 6 = 2,29 ^ 7 2 /1 6 2,12

Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
b)
ejes. Presumiremos que las calificaciones en las pruebas de nivel van de 0 a 100. La can-
tidad de alumnos por clase debe ser por lo menos de 1 (y seguramente la poltica de la
junta escolar exige que sean ms). No conocamos el mximo, as que supusimos que
poda ser 50.
c) Marcar un punto por cada par de observaciones obtenidas de las personas (en este caso,
de las escuelas). La figura 3-12 muestra el diagrama de dispersin completo.
2. Determinar si el diagrama muestra claramente una correlacin curvilnea. En trminos ge-
nerales, la correlacin parece mantener un patrn lineal (aunque con tan pocos puntos es
difcil de decir).

Tabla 3-5.
Promedios de cantidad de alumnos por clase y de calificaciones en las pruebas de nivel en cinco
escuelas primarias (datos ficticios).

E scu ela T am a o C alificacin en la p ru eb a


p rim a ria de la cla se d e ren d im ien to

M ain Street 25 80
Casat 14 98
Hara ad 33 50
Shady Grove 28 82
Jefferson 20 90
Figura 3-12. ltimo paso en la confeccin de un dia-
grama de dispersin con la informacin contenida en
la tabla 3-5: se ha dibujado un punto por cada par de
observaciones de las cinco escuelas (datos ficticios),

^ :'15 SS;--4$43|5ap

3. Estimar la direccin y el grado de correlacin lineal. Los pumos tienen una direccin mar-
cada haca abajo y hacia la derecha, indicando una fuerte correlacin lineal negativa.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de alum-
nos por case es 24 y el desvo estndar es 6,54. La puntuacin Z de la cantidad de alum-
nos de la primera ciase, 25, es igual a (25 - 24)/6,54 - 0,15. Todas las puntuaciones Z
aparecen en la columna correspondiente de la tabla 3-6.
b) Calcular los productos cruzados de las puntuaciones Z de cada persona (en este caso,
de cada escuela). El primer producto cruzado es 0,15 x 0, que es igual a 0. El segundo
es -1,53 x 1,10, que es igual a -1,68. Todos los productos cruzados de las puntuaciones
Z aparecen en a columna de la derecha de la tabla 3-6.
c) Sumar los productos cruzados de las puntuaciones Z. El total es -4,52.
d) Dividir el total por la cantidad de personas (en este caso, escuelas). La suma (-4,52) divi-
dida por 5 es igual a -0,90. Es decir, r - -0,90.
5. Controlar el signo y el tamao de coeficiente de correlacin calculado, comparndolo con
la estimacin realizada a partir del diagrama de dispersin. Un coeficiente de 4),90 con-
cuerda perfectamente con la estimacin original que indicaba una fuerte correlacin lineal
negativa.

Tabla 3-6.
Clculo del coeficiente de correlacin entre las cantidades promedio de alum nos por case y de
calificaciones en ias pruebas de rendimiento en cinco escuelas prim arias (datos ficticios).

E s c u e la T a m a o d e la d a s e C a lif ic a c i n e n la p r u e b a p r o d u cto C ru za d o
d e r e n d im ie n to

X Zx Y Zy Z*Zr
M ain Street 25 0,15 80 0,00 0 ,0 0
Casat 14 4 ,5 3 98 u o 1,68
Harland 33 1,38 50 -1 ,8 4 2,53
Shady Grove 28 0,61 82 0,12 0,08
Jefferson 20 -0 ,6 1 90 - 0,61 0,38

2: 120 400 - 4 0 ,5 2
M: 24 80 r = - 0 ,9 0
S D - ^24/5 = 6,5 4 T l 328/5 - 16,30
PRUEBA DE LA SIGNIFICACIN ESTADSTICA
DEL COEFICIENTE DE CORRELACIN
Por s mismo, el coeficiente de correlacin es un estadstico descriptivo. Describe el grado y la di-
reccin de la correlacin lineal de determinado grupo de personas analizadas. Sin embargo, cuan-
do realizamos una investigacin en el campo de la psicologa, por lo general estamos ms
interesados en una serie de observaciones en cuanto representan a una poblacin mayor que no se
ha analizado directamente. Por ejemplo, el psiclogo laboral entreg los cuestionarios sobre es-
trs slo a cinco gerentes de la empresa, pero con la intencin de considerarlos tpicos represen-
tantes de los otros gerentes de esa misma empresa. (En la prctica se necesitara un grupo con
muchas ms de cinco personas para lograr ese objetivo. Hemos utilizado cantidades pequeas de
personas en nuestros ejemplos para que sean ms fciles de comprender).
El problema, sin embargo, es que analizando slo algunas de las personas es posible elegir
por casualidad aquellas en las cuales los valores altos coinciden con los altos y los bajos con los
bajos, aun cuando, habiendo estudiado a todas las personas, no hubiera existido correlacin algu-
na. Decimos que una correlacin es significativa si no resulta verosmil que hubisemos podido
obtener una correlacin de esa magnitud y si, en realidad, en el grupo completo no hubiera corre-
lacin alguna. Especficamente, determinamos si esa verosimilitud es menor que algn bajo gra-
do de probabilidad (p), como un 5% un 1%. Si esa verosimilitud es tan baja, decimos que la
correlacin es estadsticamente significativa con p < 0,05 llp < 0 ,01.
El mtodo y la lgica para determinar la significacin estadstica es el tema central de es-
te libro a partir del captulo 5. Estaamos adelantando temas si intentramos explicarlos ahora.
De todos modos, para cuando hayamos completado los captulos siguientes, la lgica y los de-
talles quedarn bien claros. (El apndice II de este captulo contiene la informacin necesaria
para aplicar estos conocimientos a la correlacin, pero en realidad no ser muy til hasta des-
pus de haber completado el captulo 9). Slo mencionamos el tema aqu para dar una idea ge-
neral de lo que significa, en caso de que al leer alguna publicacin cientfica que informe sobre
coeficientes de correlacin se haga referencia a la significacin estadstica p < 0,05, o a algu-
na frase similar.

1J-' 4 4 Cuadro 3 -2 .
e m u u u , U U 9 U 1 y a . ; x nu a i i u u : i e > i a i H u a t u m u i c L d i i i c m c s t

; de que s es grande, es gordo...

El concepto de correlacin no fue inventado de ausencia de animales. Cuando.vuelva .a


en realidad por los especialistas en estadsti- nevar tendremos que seguir a los animales
ea. Es uno de ios procesos mentales ms b- para no morir de hambre. -.7, (
sicos. Los primeros humanos deben haber De hecho, la correlacin es un proceso.
pensado en trminos, de correlaciones todo mental tan tpicamente humano que pare-
el tiempo, al menos aquellos que sobrevi- ceramos tener una organizacin psicolgi-
vieron. Cada vez que nieva, los animales ca tal que nos lleva a encontrar un. grado de
que cazamos huyen. La nieve es sinnimo correlacin mayor, que el que en realidad
existe, como ocurra con ios aztecas, quie- porque al encontramos por primera Vez cpn .
nes pensaban que ias buenas cosechas esta- experiencias diferentes pensamos ms yen
ban correlacionadas con los sacrificios ellas, procesndolas ms profundamente,
humanos (esperemos que hayan estado de modo que luego son ms fciles de re-
equivocados!), o como los siguientes ejem- cordar (Johnson & Mullen, 1994). S nos .
plos del proceso denominado correlacin encontramos, por ejemplo, con miembros
ilusoria, tomados de. la psicologa social,. . de una minora que no vemos con frecuen-
Correlacin ilusoria es el trmino que cia, o con actos negativos que .rara vez
define la sobresmacin de la intensidad presenciamos o escuchamos, sin duda de-
con la que se relacionan dos variables (tam- dicaremos un tiempo a pensar en ellos. (Si .
bin ha tenido otros significados especiales , los relacionamos en un par, ls analizamos
en eLpasado). Sin duda, ya deben haber en conjunto y vuelven a ' nuestra, memori;.
surgido en la mente, del lector algunas; con mayor rapidez). Precer que tambin :
correlaciones ilusorias' tnicas, raciales, se- .pudiera ocurrir que continuemos procesan-;; -
xuales relacionadas con ia edad, realmen- do informacin acerca de grupos, personas .-
te- nocivas. Una fuente de correlacin ; y sus comportamientos, sin tener concin- )I
ilusoria es la tendencia a relacionar dos h a - . ci de esos procesos, En lgn punt del.
chos poco frecuentes, y por lo tanto, fciles proceso, o en momento de elaboiar un ji- :
de recordar. Supongamos que el grupo B s . ci, asociamos tis dlo debido a los gra-
menos numeroso que el grupo A, y que se - pos o personas que no encontramos con V
sabe que un tercio de las personas de am-: frecuencia con los comportamientos ,poco : ;
bos grupos comete, espordicamente, algu- usuales (negativos) (McConneli, Sherman,
nas acciones indeseables. En este tipo de . & Hamilton, 1994). . , '-(;
situaciones, las investigaciones demuestran . De todos modos, la mayora de las cq-y.
que el grupo B , a cuyos miembros se los ve rrelaciones ilusorias se 'producen coma:rr )
con menor frecuencia, ser en efecto culpa- sultado de los prejuicios.Los> .pr^uiaosyA
do por muchas, ms acciones n:deseadas : Sonteoras implcitas, y erihsq-hems^
que el grupo A. Las cosas ocurren de ese: . incorporado. Por ejemplo, consideramos y
modo aun cuando ristah. mayores chances . que Jemos hallado una mayor confirma-,
de que determinada: accin hayajsdo. c o -.. dn de la relacin entre dos caractersticas
metida por un integrante del grupo A, datio : .: sociales de la que en realidad se desprende
que. tiene ms; miembros. El problema es . de lo observado: habifidad/para; conducir y *
que los hechos poco frecuentes se unen en -, detenninada edad; nivel acadmico y'gnt^:y
la memoria) Ser miembro del grupo menos' :v.. po tnico spcfico; determind fomia de y-
numerso, y . ls comportamientos poco : hablar, vestirse o comportannto1social y ;
frecuentes, forman una correlacin.'iluso- residencia en. alguna Un;,
ria. Una consecuencia obvia es que recor- ejemplo muy interesante es que la mayora;
damos cualquier acto fuera de lo comn, de los empresarios breen qu ef niveide'.s.a- ..
llevado a cabo por un miembro de una mi- tisfaccin laboral y el1nivel de,desempe - :
nora, mucho mejor de lo que recordamos estn. estrechamente ligdos: cundo, en
cualquier acto fuera de lo comn realizado . ' realidad* la correlacin es bstante .baja, ;:
por un miembro de un grupo mayortario. Muchas personas a quienes no les gusta su
La correlacin ilusoria que nace' como, trabajo pueden de todos modos desemp-- v-,
resultado de la distincin de eventos apa- fiarse a la perfeccin, mientras que otras
reados (la vinculacin mental de dos he- ' muy entusiasmadas con su ocupacin reali-
chos poco .usuales) puede tener lugar ' zan su trabajo con desgano. . : V ;y.:
Lo importante es 'que l prxima vez - estadstica puedetransformarse en una em-.v
.. que el lector se pregunte por qu est esfor- presa romntica, en tanto representa un m o -'
. zndose tanto por aprender estadstica, pue- ;: do de vencer errores maiyados con lapreza ..'.
de resultarle til considerar que ese esfuerzo . de los nmeros, de: someter ios prejuicios. -
: constituye una bsqueda destinada a lograr profanos con la honestidad de los datos.; .
, que sus procesos mentales sean ms justos... . Referendas; Hamn (19?1); Hamiltor. y Gifford '
Por ese; motivo, volvms- a afumar que la .(1976); Johnson and Mullen (1994)..

CUESTIONES RELACIONADAS CON LA INTERPRETACIN


DEL COEFICIENTE DE CORRELACIN________________ _______________________
Un coeficiente de correlacin describe la direccin y el grado de la correlacin lineal entre dos
variables. Sin embargo, al interpretar un coeficiente de correlacin deben tomarse en cuenta algu-
nas precauciones sutiles.

Causalidad y correlacin
Si dos variables presentan una correlacin lineal significativa, normalmente suponemos que exis-
te algo que las correlaciona. Sin embargo, la direccin de causalidad (justamente, qu es la cau-
sa de qu) no puede determinarse solamente a partir de la correlacin. En toda correlacin entre
dos variables X e Y, existen tres posibles direcciones de causalidad: X podra ser la causa de Y, Y la
de L, o algn tercer factor podra ser la causa de ambas, X e Y. Tambin es posible (y a menudo
probable) que exista ms de una direccin de causalidad.
Tomemos el ejemplo del estrs de los gerentes. El estudio comenz con la nocin implcita de
que supervisar un mayor nmero de personas (X) causa un aumento del nivel de estrs (Y). El re-
sultado del estudio fue una marcada correlacin positiva entre X e Y, que ciertamente coincide
con la idea de que X es la causa de Y. Sin embargo, tambin coincide de la misma forma con la
idea de que Y es la causa de X . (Tal vez los gerentes que parecen sufrir de estrs sean considerados
muy trabajadores y ese sea el motivo por el cual sus superiores asignen mayor cantidad de perso-
nas a su cargo). Tambin es posible que la correlacin sea el resultado de algn tercer factor que
cause que X e Y se desarrollen de manera conjunta. Por ejemplo, algunos sectores de la fbrica
podran necesitar ms personal y tambin generar ms estrs. Es decir, determinado sector de la
fbrica causa estrs y requiere de muchos empleados para supervisar.
Existe bastante confusin acerca de este asunto de la correlacin y la causalidad. El tema
se complica al existir dos usos de la palabra correlacin. Algunas veces se utiliza para descri-
bir un procedimiento estadstico (como lo hemos hecho en este captulo), y otras veces se utili-
za para describir un tipo de diseo de investigacin en el que se miden dos variables en un
grupo de personas, sin realizar una asignacin aleatoria de sujetos a determinados valores de
una de las variables (vase el apndice A). Comnmente, los diseos de investigacin correla-
cinales son analizados estadsticamente utilizando el coeficiente de correlacin, y los diseos
de investigacin experimentales se analizan utilizando procedimientos que veremos en los ca-
ptulos 9 al 13.
Sin embargo, existen excepciones. En este mismo captulo utilizamos un ejemplo en el que
los participantes eran asignados al azar en determinada cantidad de exposiciones y luego se me-
da la cantidad de palabras recordadas. A partir de los datos obtenidos, calculamos un coeficiente
de correlacin. No obstante, en el estudio no se utiliz un diseo de investigacin correlaciona];
fue un verdadero experimento, ya que los participantes eran asignados al azar a diferentes valores
de la variable independiente. Por s mismo, el coeficiente de correlacin que calculamos no nos
indic nada acerca de la causalidad. Aun as, qued claro, por el diseo de investigacin, que la
nica direccin causal posible es que la cantidad de exposiciones haya causado la diferencia en la
cantidad recordada.

El coeficiente de correlacin y la reduccin proporcional de error


Un coeficiente de correlacin indica la fuerza o el grado de una relacin lineal; mayores valores
de r (valores alejados de 0) indican un mayor grado de correlacin. Es decir, una r de 0,4 signifi-
ca que existe una correlacin lineal ms fuerte que una r de 0,2. Sin embargo, la mayora de los
investigadores sostendran que una r de 0,4 no es el doble de fuerte que una r de 0,2; Para compa-
rar correlaciones ntre s, la medida utilizada por la mayora de los investigadores es r2, A esto se
lo denomina, por razones que veremos en el captulo 4, reduccin proporcional dei error (y
tambin proporcin de varianza explicada).
Una correlacin de 0,2 es equivalente a una r2 de 0,04, y una correlacin de 0,4 es equivalen-
te a una r2 de 0,16. Por lo tanto, una correlacin de 0,4 implica en realidad una relacin cuatro
veces ms fuerte que una de 0,2 !

Restriccin del rango


Supongamos que un psicolgo especializado en educacin est interesado en la relacin entre el
grado que cursa un nio y los conocimientos sobre geografa. S el investigador estudiara el rango
completo de grados escolares, los resultados podran ser como los que aparecen en el diagrama de
dispersin de la figura 3- 13a. Es decir, el investigador podra encontrar una fuerte correlacin po-
sitiva. Pero supongamos que el investigador hubiera estudiado slo los tres primeros grados (en

Figura 3-13. E jem p lo d e restriccin d el ran go com parand o d os d iagram as d e d isp ersin : (a) c u an d o s e
m uestra la serie d e va lo res c o m p le ta (grado e sc o la r y c o n o c im ie n to s sob re g eo g ra fa ) y (b ) cu a n d o se
restringe la s er ie d e v alores (a lo s prim eros tres grados).
los que se ensea poca geografa). El diagrama de dispersin (vase figura 3-13b) reflejara muy
poca, o casi ninguna correlacin (la correlacin calculada sera cercana a 0) y, sin embargo, el in-
vestigador estara incurriendo en error si llegara a la conclusin de que el grado no est relaciona-
do con los conocimientos sobre geografa en ninguno de los grados escolares.
El problema en este caso es que la-correlacin.est basada en una serie de observaciones que
incluyen slo un rango limitado de los valores posibles de una de las variables. (En este ejemplo
existe un rango limitado de grados escolares). Es errneo pensar en la correlacin como si se apli-
cara a todo el rango de valores que podra tener la variable. Esta situacin se denomina restric-
cin del rango.
Es fcil cometer estos errores al interpretar correlaciones, las cuales incluso aparecen oca-
sionalmente en publicaciones cientficas y se oyen con frecuencia an mayor en discusiones in-
formales sobre resultados de investigaciones. Por ejemplo, en el rea de los negocios, a veces se
intenta determinar si las pruebas de aptitud laboral reflejan lo exitosas que resultan ser en sus
funciones las personas contratadas. Por lo general, la relacin es baja, porque no se tiene en
cuenta que se contratan slo a las personas que tuvieron buenos resultados en las pruebas. Los
estudios que miden ei xito en el empleo incluyen slo e subgrupo que presenta los registros al-
tos. La figura 3-14 grfica este ejemplo.

Falta de confiabilidad de la medicin


Como hemos sealado, puede considerarse que el coeficiente de correlacin describe la proximi-
dad entre los puntos y una lnea recta en el diagrama de dispersin. Sin embargo, una de las razo-
nes por las que los puntos pueden no estar ubicados cerca de la lnea es el error casual en la
medicin; por ejemplo, un cuestionario que incluye algunos tems ambiguos. Con frecuencia, en
psicologa, las mediciones no son perfectamente precisas o confiables (veremos este concepto
en el captulo 17 y en el apndice A). El resultado es que una correlacin calculada entre dos va-
riables, tales como intimidad e idealizacin (para utilizar nuestro ejemplo anterior) resulta menor
de lo que sera si tuviramos medidas perfectas de estas variables.
La reduccin en una correlacin, debido a la falta de confiabilidad de las medidas, se denomi-
na atenuacin. Los libros de estadstica ms avanzada y los textos sobre medicin psicolgica
describen frmulas para la correccin por atenuacin, que suponen que puede determinarse el
grado de confiabilidad de las medidas, cuestin que no siempre es posible. En algunas publica-

y ' '( ^ Personas postulabas \ (bj Persbris.pdstua4s^;!;i v-

:.;;vgS;y:y:; y ,y 5 0 ; :r y m:
Puntuacin en ia prueba .' Puntuacin en la prueba '

Figura 3-14. E jem p lo d e l e fe c to c a u sad o en la corr e la c i n por la restriccin d e l rango.


clones cientficas podremos ieer que ia correlacin ha sido "desatenuada o que la atenuacin ha
sido corregida. Significa que el investigador realiz ciertos clculos para aumentar las correla-
ciones al nivel que se estim que tendran si se hubieran aplicado mediciones perfectas de las va-
riables que se correlacionan.
Los procedimientos para corregir la atenuacin superan el alcance de este libro. Aun as, es
conveniente recordar la regla general que se aplica cuando las medidas son poco confiables, como
ocurre en el caso de algunos cuestionarios, procedimientos observacionales, o en las observa-
ciones psicolgicas en general. Las correlaciones que aparecen en publicaciones que emplean
medidas poco confiables pueden subestimar sustancialmente la verdadera correlacin entre las
variables que estas medidas imperfectas pretenden revelar.

CONTROVERSIAS Y DESARROLLOS RECIENTES:


QUE ES UNA GRAN CORRELACIN?_______________________________________
Con respecto al coeficiente de correlacin existe en la actualidad una controversia sobre la defini-
cin de una gran r. Tradicionalmente, en psicologa se consideraba una gran correlacin aqu-
lla que era igual o superior a 0,50; moderada, aqulla de aproximadamente 0,30, y pequea,
aqulla cercana a 0,10 (Cohn, 1988). De hecho, en psicologa es raro obtener correlaciones ma-
yores a 0,40. Aun cuando estemos seguros de que X es la causa de Y, seguramente no ser la-ni-
ca causa. Si bien la intimidad provoca idealizacin, es slo uno de los muchos factores que la
causan. Todos los otros factores no forman parte de nuestra correlacin. Ninguna correlacin po-
dra reflejar la historia completa. Las correlaciones pequeas son tambin causadas por la poca
confiabidad de muchas medidas psicolgicas.
Es tradicional advertir que una correlacin pequea no es muy importante aun cuando sea
estadsticamente significativa. (Como veremos ms adelante, una correlacin pequea puede
ser estadsticamente significativa si el estudio incluye una gran cantidad de participantes), Des-
pus de todo, una correlacin de 0,10 equivale slo a un 1% de reduccin del error.
Ms an, incluso psiclogos experimentados dedicados a la investigacin, tienden a sobresti-
mar el grado de asociacin que representa un coeficiente de correlacin. Michael Oakes (1982),
en la Universidad de Sussex, dio a 30 psiclogos dedicados a la investigacin las dos columnas de
datos que muestra la tabla 3-7. Luego Ies pidi que estimaran r (sin realizar ningn clculo). Qu

T a b ie a 3 -7 .
T a b la p r e s e n ta d a a 3 0 p s ic lo g o s p a r a e s tim a r r.

X Y
1
2 10 f
3 2
4 9
5 5
6 4 jU
7 6 v
8 3
9 11
10 8
11 7
12 12
4
Fuente: Oakes (1982).
opina el lector? La intuicin de los investigadores britnicos (que como grupo estn, al menos,
tan bien capacitados en estadstica como los psiclogos de cualquier lugar del mundo) indicaba
desde -0,20 a +0,60, con una media de 0,24. Si el lector lo desea puede calcular la verdadera co-
rrelacin. Es de 0,50! Es decir, que en forma abstracta los psiclogos dan a una correlacin de
0,50 un grado mucho ms alto de correlacin del que le otorgan cuando observan los datos reales
(datos que, aun con una r - 0,50, slo se vean como de 0,24).
Oakes dio a otro grupo de treinta investigadores slo la columna de X, y les pidi que comple-
taran la columna de Y con nmeros tales que reflejaran una correlacin de 0,50 (nuevamente, s-
lo utilizando su intuicin y sin realizar ningn clculo). Cuando Oakes calcul las correlaciones

S
i que representaban ios nmeros indicados por los investigadores, el promedio result ser de
En otras palabras, incluso los investigadores experimentados consideran que un coeficiente
relacin representa un grado de asociacin mayor de lo que en realidad implica.
Por el contrario, otros psiclogos sostienen que las pequeas correlaciones pueden ser muy
importantes tericamente, las cuales tienen mayor inferencia prctica por el hecho de que los pe-
queos efectos pueden acumularse a lo largo del tiempo (Prentice & Miller, 1992).
Para demostrar la importancia prctica de pequeas correlaciones, Rosnow y Rosenthal
(1989b) ofrecen un ejemplo de un estudio actualmente famoso relacionado con el hecho de que
algunos mdicos tomaran o no aspirinas a diario, y la relacin de esa ingesta con los ataques
cardacos (Comisin Directiva del Grupo Mdico de Investigacin sobre Estudios Sanitarios
[Steering Committee of the Physicians Health Study Research Group], 1988). Los resultados de-
mostraron que el hecho de ingerir aspirina estaba correlacionado en un -0,034 con los ataques
cardacos.1Es decir, produce aproximadamente un 0,1% de reduccin proporcional de error. Sin
embargo, consideremos la parte superior de la tabla 3-8 (en la que se describen los ataques carda-
cos con im (Infarto demiocaxdio). La correlacin de slo 3,4 significaba que entre los ms de
20.000 mdicos que estaban incluidos en el estudio, existan 72 ataques cardacos ms en el gru-
po que no tomaba aspirina. (De hecho, la parte inferior de la tabla indica que tambin existan 13
muertes ms por ataques cardacos en el grupo que no tomaba aspirina).
La parte central de la tabla 3-8 es especialmente interesante desde el punto de vista de la estadsti-
ca. En esa parte de la tabla, los porcentajes correspondientes a cada grupo referido a los ataques
cardacos (ausencia d e a t y presencia de i m ) estn divididos entre el porcentaje que tomaba y el
que no tomaba aspirinas (el grupo placebo). Observemos que la diferencia en porcentajes en cual-
quiera de los grupos es de exactamente +3,4% -3,4%. (Por ejemplo, dentro del grupo que haba
sufrido ataques cardacos, el 48,3% que tomaba aspirinas menos el 51,7% del grupo placebo
equivale a -3,4%). Lo importante aqu es que 3,4% es exactamente igual al coeficiente de correla-
cin (0,034).
No es una coincidencia. En este tipo de tablas, que se denominan del tam ao del efecto a
una exposicin dicotomica, la diferencia de los porcentajes siempre resultar exactamente igual
al coeficiente de correlacin. Esto facilita sorprendentemente la comprensin de las correlaciones
en cualquier situacin en la que una de las variables representa el xito y el fracaso (como no su-
frir un ataque cardaco o sufrirlo), y la otra variable representa la ciase de tratamiento recibido
(como aspirina o placebo). En este tipo de situaciones, la correlacin marca la diferencia en por-
centajes entre el xito y el fracaso en relacin con el tratamiento recibido,

* Para calcular la correlacin entre tener un ataque cardaco y tomar aspirinas, tendramos que convertir las dos varia-
bles en nmeros. Por ejemplo, podramos representar el hecho de tener un ataque cardaco con l , y no tenerlo con 0; de
forma similar, podramos considerar que estar en el grupo que consume aspirinas es igual a 1, y estar en ei grupo place-
bo guai a 0. N o tiene importancia cul de los dos nmeros utilicemos para cada uno de los dos valores de cada variable.
Cualesquiera sean los dos nmeros utilizados, ei resultado ser el mismo despus de convertirlos en puntuaciones Z. La
nica diferencia que puede surgir en relacin con ios nmeros utilizados es que, segn a q u valor se aplique el nmero
mayor, esto determinar que la correlacin sea positiva o negativa.
T ab la 3 -8 .
E fe c t o s d e la a s p ir in a en lo s a ta q u e s c a r d a c o s .

C o n d ici n A u se n c ia de im P r e se n c ia de im

Aspirina 10.933 104


Placebo 10.845 189

T a m a o d ei e fecto a u n a e x p o sic i n d ico t m ica

Aspirina 51,7 48,3


Placebo 48,3 51,7
Total 100,0 100,0

im no fa ta l im fa ta l

Aspirina 99 5
Placebo 171 18

N ota: m = infarto de miocardio. Fuente: Com isin Directiva del Grupo M dico de investigacin Sobre Estudios
Sanitarios [Steering Committee o f the Physicians Health Study Research Group] (1988).

Ciertamente, un 3,4% de diferencia entre sufrir o no ataques cardacos es un dato interesante,


aunque es slo una pequea parte de lo que afecta a las personas que sufren ataques cardacos. No
deja de ser cierto que el 99,9% de la variacin, en cuanto a que la gente sufra o no ataques carda-
cos, se debe a otros factores (dieta, ejercicio, herencia, etc.). Ms an, algunos estadsticos (por
ejemplo Strahan, 1991; Thompson & Schumacker, 1997) sostienen que este tamao del efecto a
la exposicin dicotmica distorsiona la situacin real, excepto cuando la frecuencia de los valores
de ambas variables estn en la relacin 50-50. (En este caso, la relacin entre aspirina y placebo
es cercana ai 50-50, pero con respecto a presencia y ausencia de m la relacin est muy lejos de
ser 50-50).
Otra discusin sobre la importancia de las pequeas correlaciones est basada en los mtodos
de investigacin. Prentice y Miller (1992) explican:
Demostrar que un efecto perdura aun bajo las circunstancias ms inverosmiles puede ser tan
impresionante (o en algunos casos, tal vez ms impresionante) que demostrar que el efecto contri-
buye en una gran parte a la varianza (p. 163).
Algunos de los ejemplos de estos autores se refieren a estudios que demuestran una correlacin
entre el sentimiento de atraccin y las sentencias de culpabilidad o inocencia emitidas en juicios
(por ejemplo Sgall & strove, 1975). Lo importante es que las sentencias legales no deberan
ser afectadas por factores tan accidentales como el sentimiento de atraccin. Por lo tanto, s exis-
ten estudios que demuestran que la atraccin est relacionada con las sentencias, aunque ms no
sea levemente, entonces nos convenceramos de la importancia que podra tener la atraccin por
su influencia en las opiniones sociales en general.

COEFICIENTES DE CORRELACIN SEGN SE DESCRIBEN


EN LAS PUBLICACIONES CIENTFICAS
Los coeficientes de correlacin aparecen en las publicaciones cientficas tanto en el texto como
en las tablas (algunas veces tambin se hace referencia al nivel de significacin, como por
ejemplo, $0-0,05). El resultado del estudio con el que comenzamos el captulo se describira en
el texto de la siguiente manera: Exista una fuerte correlacin positiva entre la idealizacin y la
intimidad, r ~ 0,74.
Las tablas de correlaciones son muy comunes cuando se trabaja con varias variables. Usual-
mente, se disea la tabla de modo que cada variable aparezca tanto en la parte superior como en el
margen izquierdo, y la correlacin entre cada par de variables se indica dentro de la tabla, a la que
se denomina m atriz de correlacin.
La tabla 3-9 proviene de una publicacin que describe los resultados de un gran estudio euro-
peo sobre dietas alimenticias saludables (Wardle et al 1997). En este caso en particular, los auto-
res incluyen las matrices de correlacin separadas una para mujeres y otra para hombres. El
ejemplo que presentamos aqu ilustra varias caractersticas tpicas del modo en que se disean las
matrices de correlacin. En primer lugar, podemos observar que no se indica la correlacin de
una variable consigo misma. En este ejemplo, el espacio se completa con un guin; con frecuen-
cia slo se deja el espacio libre. Podemos observar tambin que slo la mitad superior de cada
matriz est completa. Esto ocurre porque completar la otra mitad sera repetitivo; por ejemplo, la
correlacin entre evitar las grasas con consumir fibras es la misma que la correlacin entre consu-
mir fibras y evitar las grasas (en algunos casos se completa la mitad inferior y se deja en blanco la
mitad superior). Existe otra forma de resumir la informacin ahorrando espacio en la pgina: los
nombres de las variables aparecen slo en el costado de la tabla; en la parte superior slo se escri-
ben los nmeros correspondientes a cada una de ellas. Finalmente, observamos que los coeficien-
tes significativos estn indicados con un asterisco, y se incluye una nota al pie que explica el nivel
de probabilidad que representa el asterisco.
Observando el ejemplo, podemos ver, entre otras cosas, que las correlaciones entre evitar
grasas y consumir fibras son bastante altas (0,42 en el caso de las mujeres y 0,41 en el caso
de los hombres). Tambin es interesante el hecho de que exista muy poca o ninguna correla-
cin entre consumir frutas diariamente y limitar las carnes rojas (0,00 para las mujeres y 0,01
para los hombres).

Tabla 3-9.
Correlaciones de Pearson entre las costumbres alimenticias de hombres y de mujeres.

S u b -e sc a la 1 2 3 4 5

M ujeres (n = 9 ,182)
1, Evitar las grasas 0 ,42* 0,16* 0,14* 0,11*
2, Consum ir fibras 0,15* 0,12* 0,09*
3. C om er fru tas diariamente 0,05* 0.0 0
4. Limitar las carnes roj as -- 0,12*
5. Limitar la sai

H om bres ( = 7 .3 0 4 )
1. Evitar las grasas 0,41* 0,13* 0,12* 0,10*
2. C om er fibras 0,13* 0,11* 0,08*
3. C om er frutas diariamente 0,02* 0,01*
4. Limitar las carnes rojas 0,07*
5, Limitar la sal _

*p< 0,001.
Fuente: Wardie, J et ai. (1997), tab, 2. Prcticas alimenticias saludables de alumnos europeos. " P sico lo g a sa n ita r ia ,
16, 443-450, Copyright, 1997, por la Asociacin Americana de Psicologa (American Psychological Association].
Reimpreso con autorizacin.
RESUMEN
Un diagrama de dispersin muestra la relacin entre dos variables. En ei eje horizontal se ubican
los valores de ia variable independiente o predictora, ordenados de menor a mayor. En el eje ver-
tical se ubican los valores de la variable dependiente, ordenados de menor a mayor. Cada par de
valores correspondientes a un individuo se marca con un punto.
Cuando en trminos generales los puntos del diagrama de dispersin siguen una lnea recta,
hablamos de una correlacin lineal. En una correlacin lineal positiva, la recta va hacia arriba y
hacia la derecha (es decir, los valores bajos coinciden con los bajos y los altos con los altos). En
una correlacin lineal negativa, la recta va hacia abajo y hacia la derecha (es decir, los valores ba-
jos coinciden con los altos y los altos con los bajos). En una correlacin curvilnea, los puntos si-
guen un patrn distinto de una simple lnea recta. Existe correlacin nula cuando los puntos no
siguen ningn tipo de patrn sistemtico.
El coeficiente de correlacin (r) indica el grado de correlacin lineal. Es el promedio de los
productos cruzados de puntuaciones Z Cuando existe una fuerte correlacin lineal positiva, el
coeficiente de correlacin es altamente positivo debido a que las puntuaciones Z positivas se mul-
tiplican por positivas y las puntuaciones Z negativas por negativas. Cuando existe una fuerte co-
rrelacin lineal negativa, el coeficiente de correlacin es altamente negativo debido a que las
puntuaciones Z positivas se multiplican por negativas y las puntuaciones Z negativas por positi-
vas. Cuando no existe correlacin lineal, el coeficiente de correlacin es 0, debido a que las pun-
tuaciones Z positivas son multiplicadas a veces por puntuaciones Z positivas, y otras por
puntuaciones Z negativas, mientras que las puntuaciones Z negativas son multiplicadas a veces
por puntuaciones Z negativas, y otras por puntuaciones Z positivas. Por lo tanto, los productos
cruzados positivos y negativos se cancelan entre s.
El mximo valor positivo posible d e r e s + l , r = +l , y ocurre cuando existe una correlacin li-
neal positiva perfecta. El mximo valor negativo posible de r es -1, r = -1, y ocurre cuando existe
una correlacin lineal negativa perfecta.
Una correlacin generalmente est basada en valores observados de determinado grupo que
pretende representar a un grupo ms amplio. Cuando ios resultados de los procedimientos esta-
dsticos (que aprenderemos ms adelante) no son coherentes con la idea de que la correlacin en
ese grupo ms amplio es 0 , decimos que la correlacin es estadsticamente significativa.
Las comparaciones del grado de correlacin lineal se consideran ms precisas si se realizan
con el cuadrado del coeficiente de correlacin (r1), llamado reduccin proporcional del error.
La correlacin no muestra la direccin de causalidad. Si dos variables, X e y, estn correla-
cionadas, esto podra ser porque X est causando Y, Y est causando X, o un tercer factor est cau-
sando X e Y.
Un coeficiente de correlacin puede representar la verdadera correlacin por debajo de su ni-
vel verdadero si se basa en las observaciones de un grupo de estudio cuyo rango de valores es res-
tringido, o cuyos valores se basan en medidas poco confiables.
Muchos psiclogos sostienen que el coeficiente de correlacin es una sobrestimacin de la
importancia de la asociacin entre dos variables. En efecto, los estudios realizados sugieren que
los psiclogos tienden a considerar cualquier coeficiente de correlacin en particular como repre-
sentante de un mayor grado de asociacin del que realmente existe. Sin embargo, las pequeas
correlaciones pueden tener importancia prctica (que puede ser demostrada a travs del tamao
del efecto a una exposicin dicotmica, el cual describe la relacin entre dos variables con dos
valores cada una, y examinando la tabla 2 x 2 resultante). Las pequeas correlaciones tambin
pueden ser muy efectivas para demostrar ia importancia de una relacin cuando un estudio de-
muestra que la correlacin se mantiene aun bajo lo que pareceran condiciones poco probables.
Las publicaciones cientficas generalmente presentan resultados correlacinales tanto en sus
textos, con el valor r (y algunas veces con el nivel de significacin), como en tablas especiales
(matrices de correlacin) que ilustran las correlaciones entre diversas variables.

Trminos clave
- Correccin por atenuacin. - Variable dependiente. - Correlacin positiva.
- Correlacin. - Direccin de causalidad. - Variable predictora.
- Coeficiente de correlacin (r). - Variable independiente. - Reduccin proporcional
- Matriz de correlacin. - Correlacin lineal. del error (r2).
- Producto cruzado de puntuaciones Z. - Correlacin negativa. - Restriccin de rango.
- Correlacin curvilnea. - Correlacin nula. - Diagrama de dispersin.
- Grado de correlacin. - Correlacin perfecta. - Significacin estadstica.

Ejercicios rrelacin, si existe; c) calcule el coeficiente de


correlacin; d) explique la lgica de lo que ha
Los ejercicios implican la realizacin de hecho, escribiendo como si se dirigiera a al-
clculos (con la ayuda de una calculadora). guien que nunca ha asistido a un curso de esta-
La mayora de los problemas estadsti- dstica (pero que s entiende qu es la media, el
cos reales se resuelven por computadora, desvo estndar y las puntuaciones Z), y e) pre-
pero aunque exista la posibilidad de utilizar- sente tres direcciones de causalidad lgica-
la, es conveniente realizar estos ejercicios mente posibles, indicando en cada caso si se
manualmente para incorporar el mtodo de trata de una explicacin razonable para la co-
trabajo. rrelacin segn las variables involucradas (y
Para adquirir prctica en la utilizacin de por qu),
una computadora, para resolver problemas 1. Un investigador estaba interesado en la
estadsticos, se puede utilizar la seccin de relacin entre el grado de empatia de los psico-
computacin de cada captulo, publicada en terapeutas y el nivel de satisfaccin de sus pa-
la Guia de estudio y libro de tareas de compu- cientes con la terapia. Como estudio piloto se
tacin para el alumno [Students Study Gui- analizaron cuatro parejas de terapeutas y pa-
de and Computer Workbook] que acompaa cientes. Estos son los resultados:
este libro.
Todos los datos de esta seccin son ficti-
cios (a menos que se especifique lo contrario). N m ero de E m p a tia d el S a tisfa cci n
Las respuestas a los ejercicios de la serie I p areja tera p eu ta del p a cien te
se encuentran al final del libro. 1 70 4
2 94 5
3 36 2
4 48 1

SERIE 1
Realice las siguientes tareas para los ejer- 2, Un instructor pregunt a cinco alumnos
cicios 1 y 2; a) Confeccione un diagrama de cuntas horas haban estudiado para un exa-
dispersin con las puntuaciones originales; b) men. A continuacin se detalla la cantidad de
describa con palabras el patrn general de co- horas de estudio y sus calificaciones.
de depresin de las mujeres en la primera y
H o r a s d e estu d io C a lifica ci n en la p ru eb a
en la segunda entrevista.
0 52 Explique los resultados de las medidas co-
10 95
mo si estuviera escribiendo para una persona
83
8 71 que nunca ha asistido a un curso de estadstica.
6 64 Especficamente, a) explique qu significa un
coeficiente de correlacin, utilizando una de
3, En un estudio realizado a personas que
las correlaciones como ejemplo; b) analice la
recin se conocan, se midi el nivel de extra- tabla y Juego comente los patrones de los re-
versin de uno de los integrantes de la pareja y sultados, indicando las variables que presentan
el aprecio del otro integrante de la pareja por el una correlacin relativamente fuerte y las que
primero. Estos son los resultados: no, y c) comente las limitaciones que deben te-
nerse en cuenta al sacar conclusiones sobre
E x tr a v er si n d e u n o A p recio p or causalidad sobre la base de esta informacin,
de los in teg r a n tes ese in teg ra n te utilizando como ejemplo una correlacin espe-
P u n tu a c i n P u n tu a c i n P u n tu a c i n P u n tu a c i n cfica (nombre al menos una direccin de cau-
o r ig in a l Z o r ig in a l Z salidad alternativa posible y explique por qu
18 0,37 8 1,10 esa alternativa es posible).
17 0,17 9 1,47 5. Para cada una de las siguientes situacio-
20 0 ,8 0 6 0,37
nes, indique por qu el coeficiente de correla-
8 - 1 ,7 2 1 -1 ,4 7
13 - 0 ,6 7 7 0,74
cin podra ser una estimacin distorsionada
24 1,63 1 -1 ,4 7 de la correlacin real (y qu clase de distorsin
11 - 1 ,0 9 3 -0 ,7 4 esperara):
12 -0 ,8 8 5 0 ,0 0 a) Puntuaciones en dos cuestionarios de
18 0,38 7 0,74 medicin de personalidad estn correlacionados.
21 1,00 3 -0 ,7 4
b) La calidad de vida y la felicidad de un
En este ejercicio damos las puntuaciones Z pa- grupo de millonarios estn correlacionadas.
ra ahorrar tiempo de clculo, a) Construya un 6 . La siguiente informacin ha sido pre-
diagrama de dispersin de las puntuaciones parada de forma tal que las series de datos B
originales; b) describa con palabras el patrn hasta D sean versiones levemente modificadas
de la serie A. Confeccione diagramas de dis-
general de la asociacin, si existe, y c) calcule
persin y calcule los coeficientes de correla-
el coeficiente de correlacin.
cin de cada serie de datos (slo damos la
4. Chapman, Hobfoll y Ritter (1997) en-
solucin de las seres A y B).
trevistaron dos veces durante el embarazo a
68 mujeres de una zona cntrica y superpo-
S e r ie A S e r ie B S e r ie C S e r ie D
blada de una ciudad y a sus maridos (o no-
vios); la primera vez, entre el tercer y sexto X Y X Y X Y X Y
mes de embarazo, y la siguiente vez, entre el i 1 1 l 1 5 1 1
sexto y el noveno mes de embarazo. La tabla 2 2 2 2 2 2 2 4
3 3 3 3 3 3 3 3
3-10 muestra las correlaciones entre varias de
4 4 4 5 4 4 4 2
las medidas. Lo ms importante en esta tabla
5 5 5 4 5 1 5 5
es la correlacin entre lo que las mujeres in-
formaban sobre su propio estrs, lo que los 7. Un investigador est interesado en ave-
hombres informaban sobre el estrs de sus riguar si un nuevo medicamento produce algn
compaeras, la percepcin de las mujeres so- efecto en caso de resfro. Ocho personas son
bre el apoyo brindado por sus parejas en la analizadas: cuatro toman el medicamento y
primera y en la segunda entrevista y el nivel cuatro no (las que lo toman son calificadas con
un l t las que no, con un 0) y luego se registra si que nunca asisti a un curso de estadstica (pe-
se resfran (calificacin 1) o no (calificacin ro que s comprende qu es la media, el desvo
0). A continuacin aparecen cuatro resultados estndar y las puntuaciones Z), y e) indique
posibles. Calcule el coeficiente de correlacin tres direcciones de causalidad lgicam en-
en cada caso (slo damos la solucin para las te posibles, explicando en cada caso si es una
posibilidades A y B). direccin razonable de la correlacin segn las
variables involucradas (y por qu?).
P o s ib ilid a d P o s ib ilid a d P o s ib ilid a d P o s ib ilid a d 1. Se entrega a cuatro individuos una prue-
A B C D
ba de habilidad manual (los valores altos signi-
Toma Se Toma Se Toma S e Toma S e fican mayor habilidad) y una prueba de ansiedad
M ed. resfra M ed. resfra M e d , resfra M ed. resfra
(los valores altos implican mayor ansiedad).
0 1 0 1 0 1 0 1
0 1 0 i 0 1 0 1 Los valores observados de los cuatro individuos
0 1 0 1 0 0 0 1 son los siguientes:
0 1 0 0 0 0 0 0
1 0 3 1 1 1 1 0
1 0 1 0 1 1 1 0 P erso n a H a b ilid a d A n s ie d a d
1 0 1 0 1 0 1 0 1 1 10
1 0 1 0 0 1 0
2 1 8
3 2 4

SERIE II 4 4 ~2

Realice lo siguiente en los ejercicios 1 y 2 : a)


construya un diagrama de dispersin de las 2. Se controla de cerca a cuatro nios pe-
puntuaciones originales; b) describa con pala- queos durante un periodo de varias semanas
bras el patrn general de correlacin, si existe; para medir qu cantidad de programas de tele-
c) calcule el coeficiente de correlacin; d) ex- visin violenta miran y la medida de su com-
plique la lgica de lo que ha hecho, escribien- portamiento violento hacia sus compaeros de
do como si estuviera hacindolo para alguien juego. Los resultados fueron los siguientes:

T a b la 3 - 1 0 .
C o r r e l a c i o n e s d e o r d e n c e r o d e l a s v a r i a b l e s d e l e s t u d io .

Variable 1 2 3 4 5 6 7 S
I.Estrs informado por mujeres _

2. Estrs de mujeres informado


por hombres 0,17

3. Apoyo de pareja 1 -0,28* -0,18

4, Apoyo de pareja 2 -0,27* -0,18 044***


5. Estado depresivo 0,23* OJO -0,34** -0,17

6. Estado depresivo 2 0,50*** 0,14 -0,42*** -0,41** * 0 55***

7. Edad de las mujeres 0,06 0,16 0,04 -0,24* -0*35* -0,09

8. Origen tnico de las mujeres -0,19 -0,09 -0,16 0,14 0,11 0,13 - 0,02
9, Estado civil de las mujeres -0,18 0,01 0,12 0,24* -0,04 - 0,20 0,05 -0,34**
10. Paridad 0,19 0,13 - 0,11 -0,17 OJO 0,16 0,26* 0,31*
*p < 0,05; **p < 0,Q t, ***< 0,001.
Fuente: Chapman, H, A., Hobfoll, S. B., & Ritter, C. (1997), tab. 2. El hecho de que el compaero subestime el estrs
sufrido por ellas provoca angustia en las mujeres: estudio sobre mujeres embarazadas de zonas cntricas y superpobla-
das de la ciudad. P e r i d ic o s o b r e P s ic o lo g a S o c ia l y d e P e r s o n a lid a d { J o u r n a l o f P e r s o n a l i t y a n d S o c ia l P s y c h o l o g y ] ,
73, 418-425. Copyright, 1997, por la Asociacin Americana de Psicologa [American Psychoogical Association],
Reimpreso con autorizacin.
C a n tid a d d e C alificacin R e g istro s en
N m ero C a n tid a d sem a n a l accion es N i o p o r p rolijid ad p r u e b a d e n v
d e c d ig o (h o ra s) de T V v io len ta s o agresivas
X zx X Zy
d e lo s n i o s vio len ta s h a c ia c o m p a ero s
Janet 18 0 ,5 2 60 - 0 ,6 6
G 3368 14 9 Gareth 24 1,43 58 -1 ,0 9
R 8 904 8 Grove 14 1,82 70 1,47
C 9890 6 Kevin 19 0 ,2 0 58 - 1 ,0 9
L 87 2 2 12 8 Joshua 20 0,13 66 0,62
N ic o le 23 1,11 68 1,04
En los ejercicios 3 y 4, a) construya un diagra- Susan 20 0,13 65 0 ,4 0
22 0,78 68 1,04
ma de dispersin de las puntuaciones origina- D rew
M arie 15 1,50 56 -1 ,5 1
les; b) describa con palabras el patrn general Chad 21 0 ,4 6 62 - 0 ,2 3
de correlacin, si existe, y c) calcule el coefi-
ciente de correlacin. En los dos ejercicios da- 5. Como parte de un estudio ms amplio,
mos las puntuaciones Z para ahorrarle tiempo. Speed y Gangestad (1997) obtuvieron califi-
3. Supongamos que el Museo de Louvre caciones y nominaciones sobre diversas carac-
tersticas de 66 hombres de una fraternidad,
est interesado en la relacin entre la antige-
otorgadas por sus compaeros de fraternidad. El
dad de una pintura y el inters del publico en siguiente prrafo fue tomado de la seccin de re-
esa pintura. Durante una semana se controla la sultados del estudio:
cantidad de personas que se detienen a obser-
var a cada una de las O pinturas elegidas ai L a popularidad romntica de los hombres e s-
taba significativam ente correlacionada con
azar. Los resultados son los siguientes:
varias caractersticas: mejor vestimenta (r =
0,48), mayor atractivo fsico ( r = 0,47), ms
C an tid ad sociabilidad (r 0,47), ms confianza en s
A n tig ed a d d e p erson as m ism o ( r ~ 0,44), m ejor lder (r = 0,38), ms
T tu lo a p ro x im ad a q u e se detien en divertido ( r - 0,37), ms satisfecho ( r ~ 0,32)
d e la p in tu r a (a o s) a o b serv a rla y m as independiente ( r = 0 ,2 8 ). Sin embargo,
inesperadamente, e l potencial de los hombres
X z* X Zy
en relacin con e l xito financiero no estaba
El Entierro 465 1.39 68 -0 ,6 9 significativam ente correlacionado con su po-
M ys Mar Ste Catherine 515 1,71 71 0,59
pularidad romntica (r - 0,10). (p. 931).
Las Baistas 240 - 0 ,0 9 123 1,19
E l T oilette 107 0,96 Explique los resultados como si estuviera escri-
112 0 ,8 2
Retrato de Castiglione 376 0,80 biendo para una persona que nunca ha asistido
48 -1 ,3 8
Carlos I de Inglaterra 355 0,67 84 0,14
a un curso de estadstica. Especficamente, a)
Crispin y Scapiti 140 -0 ,7 5 66 - 0 ,7 6
explique qu significa un coeficiente de corre-
D esnudo al Sol 115 0,91 148 2,05
lacin utilizando una de las correlaciones como
E l B alcn 122 -0 ,8 6 71 0,59
E l Circo 99 -1 ,0 1
ejemplo; b) explique, qu significa significati-
91 0 ,1 0
vamente" y no significativamente", en gene-
ral, refirindose al menos a un ejemplo espec-
fico y c) especule sobre el significado del pa-
4. Un maestro de escuela crey notar que
trn de los resultados, teniendo en cuenta el te-
los alumnos que se vestan ms prolijamente
ma de la direccin de causalidad.
eran, en lneas generales, mejores estudiantes. 6 . Seleccione arbitrariamente ocho nom-
Para probar est idea, el maestro hizo que un bres personales completos, de ocho hojas dife-
amigo calificara a cada uno de los alumnos rentes de la gua telefnica. Confeccione un
segn su prolijidad en el vestir. A continua-, diagrama de dispersin y calcule el coeficiente
cin detallamos las calificaciones por proliji- de correlacin entre la cantidad de letras en el
dad, junto con las calificaciones de los alumnos primer nombre y en el apellido. Describa el re-
en una prueba estandarizada de rendimiento sultado con palabras y sugiera una posible in-
escolar. terpretacin de sus resultados.
APNDICE I DEL CAPTULO: FRMULA DE CLCULO OPTATIVA DEL
COEFICIENTE DE CORRELACIN
Los pasos para calcular un coeficiente de correlacin pueden combinarse en una sola frmula pa-
ra realizar clculos a mano (o con una calculadora) en un estudio con gran cantidad de participan-
tes. Comnmente, los pasos para calcular una correlacin son: calcular a) las puntuaciones Z de
cada puntuacin original, b) los productos cruzados de las puntuaciones Z y c) el promedio de los
productos cruzados de las puntuaciones Z. (El alumno habr notado, ai realizarlos ejercicios, que
calcular las puntuaciones Z es particularmente tedioso cuando se trabaja a mano, especialmente si
primero es necesario calcular las medias y los desvos estndares). Con un poco de manipulacin
algebraica, la frmula puede transformarse en la que se indica a continuacin, (Aunque parezca
terrible, resulta realmente ms sencilla para aplicar en un estudio rea] con grandes cantidades de
participantes que si tuvieran que calcularse los resultados a mano).

jv s x r-(x x )(x r)
r
(3-2)

Cuando se utiliza este procedimiento resulta til organizar los datos en un cuadro de cinco colum-
nas, formado por las columnas X, X2, 7, Y2, y los productos cruzados de XY. Cabe destacar que no
se mencionan las puntuaciones Z, y que los productos cruzados se calculan directamente sobre la
base de puntuaciones originales. Adems, tal como lo recordamos en el apndice del captulo 2,
IX 2 se logra tomando cada valor X y elevndolo al cuadrado, y luego sumando estos cuadrados;
por el contrario, (YX)2 se logra sumando todos los valores X (sin elevar al cuadrado ninguno de
ellos), y luego elevando el total al cuadrado.
La tabla 3-11 muestra el clculo correspondiente al ejemplo del estrs de los gerentes utili-
zando esta frmula. Comprela con la tabla 3-2.

APNDICE II DEL CAPTULO; PRUEBA DE HIPTESIS Y SU POTENCIA


SOBRE EL COEFICIENTE DE CORRELACIN
Este material est dirigido a aquellos alumnos que ya han completado al menos hasta el captulo 9
y ahora vuelven a estudiar este captulo.

Significacin de un coeficiente de correlacin


La prueba de hiptesis de un coeficiente de correlacin sigue el proceso usual de cinco pasos. Sin
embargo, cabe destacar tres puntos importantes. Primero, la hiptesis nula establece, en lneas ge-
nerales, que la correlacin en una poblacin como la observada no es diferente de la de una
poblacin .en la que la verdadera correlacin es 0. Segundo, si los supuestos (explicados en el
siguiente prrafo) se cumplen, la distribucin comparativa es una distribucin f con grados de li-
bertad iguales a la cantidad de participantes menos 2. Tercero, el estadstico de prueba que corres-
ponde al de correlacin en esa distribucin t se calcula utilizando la siguiente frmula:

(3-3)
Tabla 3-11.
C m p u to s d e l c o e fic ie n te d e c o r r e la c i n d e l e s tu d io s o b r e e l e str s d e lo s g e r e n te s , r e a liz a d o s c o n la
f r m u la d e c lc u lo (d a to s fic tic io s ).

E m p lea d o s su p erv isa d o s N iv el d e estrs P r o d u c io s cru za d o s


X X! Y
y*
XY
6 36 7 49 42
8 64 S 64 64
3 9 1 1 3
10 100 8 64 80
8 64 6 36 48
X: 35 273 30 214 237

w xxr- ( 2 X )(X y)

U Z X * - (XXX ] [V iv x r - ( X f ) 1 ]

(5X 237)
- (35X 30)

[V(5X 273) - (3 5 )* ] [V (5X 214) - ( 3 0 X 3

1.185 - 1.050
r ~ ------------------------------------------------------------------------------
(V 1.365 - 1 .2 2 5 }

135 135 135

(7 W )C f 0 ) ( 11,83 ) ( 1 3 3 )4 ) 154,26

Adems, queremos destacar que las pruebas de significacin de una correlacin, como por ejem-
plo una prueba t, pueden ser de una o dos colas. Una prueba de una cola significa que el investiga-
dor ha predicho el signo (positivo o negativo) de la correlacin2.
Los supuestos de las pruebas de significacin de un coeficiente de correlacin son algo com-
plejos. Comnmente, ambas variables deberan estar normalmente distribuidas. Adems, la dis-
tribucin de cada variable, condicionada por cada valor de la otra variable, debera tener
aproximadamente la misma varianza. Sin embargo, como ocurre con la prueba t y el anlisis de
varianza, los incumplimientos moderados de estos supuestos no son fatales.
A continuacin presentamos un ejemplo utilizando el estudio del estrs de los gerentes. Su-
pondremos que los investigadores predijeron una correlacin positiva entre la cantidad de em-
pleados supervisados y el estrs, la que ser probada a nivel 0,05.
1. Reformule el problema en forma de hiptesis de investigacin e hiptesis nula acerca de
las poblaciones. Las poblaciones de inters son las siguientes:
Poblacin 1; gerentes como los analizados en este estudio.
Poblacin 2: gerentes para los cuales no existe correlacin entre cantidad de empleados su
pervisados y estrs.

2 Dunlap y Myers (1997) encuentran un modo ms corto de descubrir la significacin de un coeficiente de correlacin.
Sucede que e l r necesario para una significacin de nivel 0,05 (dos colas) es muy aproximado a 2 fyN . Por ejemplo, pa-
ra N ~ 5, necesitaramos una correlacin de 0,89 (2/^/5= 2/2,24 = 0,89). Dunlop y Myers tambin nos brindan una ma-
nera ms corta para lograr una aproximacin a la cantidad de participantes necesarios para un poder de entre un 80% y
90%. El tamao de muestra necesario es simplemente 8 dividido r2. Por ejemplo, utilizando esta frmula, para r - 0,10,
la cantidad de participantes necesaria es 8 /0 ,102, es decir, 800.
La hiptesis nula establece que las dos poblaciones tienen la misma correlacin. La hiptesis de
investigacin establece que la poblacin 1 tiene una correlacin mayor que la poblacin 2. (Es de-
cir, la prediccin es que la correlacin de la poblacin es mayor a 0).
2. Determine las caractersticas de la distribucin comparativa. Suponiendo que se cumplen
los supuestos (en la prctica, con slo cinco casos sera difcil de determinar), la distribucin
comparativa es una distribucin t con gl = 3. (Es decir, gl = N - 2 = 5 - 2 = 3).
3. Determine el punto crtico en la distribucin comparativa, en el cual la hiptesis nula debe-
ra ser rechazada. La tabla (tabla B-2 del apndice B) muestra que para una prueba de una cola a
nivel 0,05, con 3 grados de libertad, necesitamos una t de al menos 2,353.
4. Determine el valor del estadstico de prueba. Calculamos una correlacin de r ~ 0,88 y
iV= 5. Aplicando la frmula para encontrar el t equivalente, obtenemos:

f . (4/^=2) (0,j|(./3) (0,8g(l,73) _ _


Vl_ r2 Vi -0,77 /o,23 0,48 '
5. Compare los valores obtenidos en los pasos 3 y 4 para decidir si se rechaza la hiptesis nu-
la. El valor t de 3,17, obtenido de la muestra estudiada, es ms extremo que el punto crtico nece-
sario de 2,353. Se rechaza la hiptesis nula y se sostiene la hiptesis de investigacin.

Tamao del efecto y potencia


El coeficiente de correlacin es, en s mismo, una medida del tamao del efecto. Las reglas de
Cohn (1988) para el coeficiente de correlacin establecen que el tamao del efecto de 0,10 es pe-
queo, de 0,30 es mediano y de 0,50 es grande. La tabla 3-12 nos muestra la potencia aproximada,
y la tabla 3-13 el tamao mnimo de muestra para obtener una potencia del 80% (vase tambin
nota al pie 1), Se pueden encontrar tablas ms completas en Cohn (1988), pp. 84 95 y 101-102.

T a b la 3 - 1 3 .
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e -
Tabla 3-12. s a r i o s p a r a lo g r a r u n 8 0 % d e p o t e n c i a e n u n
P o te n c ia a p r o x im a d a d e e st u d io s q u e u t iliz a n e l e s t u d io q u e u t iliz a e l c o e f ic ie n te d e c o r r e la -
c o e f i c i e n t e d e c o r r e l a c i n (r ) p a r a p r u e b a s d e h i p - c i n (r ) p a r a p r o b a r u n a h i p t e s i s c o n n i v e l
t e s is c o n n iv e l d e s i g n i f i c a c i n d e 0 , 0 5 . d e s i g n i f i c a c i n d e 0 ,0 5 .

T a m a o d el efecto T a m a o d e l e fe c to
Pequeo M e d ia n o G ran de P equeo M e d ia n o G ra n d e
(r ~ 0 ,1 0 ) (r = 0 ,3 0 ) ( r ss 0 ,5 0 ) ( r := 0 ,1 0 ) (r -0 ,3 0 ) ( r = 0 ,5 0
D o s colas D o s colas 783 85 28
Total N: 10 0 ,0 6 0,13 0,33 U na cola 617 68 22
20 0,07 0,25 0,64
30 0,08 0,37 0,83
40 0,09 0 ,48 0,92
50 0,11 0 ,5 7 0,97
100 0,17 0,86 1
U na cola
Total N ; 10 0,08 0 ,22 0,4 6
20 0,11 0 ,3 7 0,75
30 0,13 0,50 0,9 0
40 0,15 0,6 0 0,9 6
50 0,1 7 0,69 0,98
100 0,26 0,9 2

aCasi 1,00.

También podría gustarte