Documentos de Académico
Documentos de Profesional
Documentos de Cultura
cho y para la altura respectivamente. Los diagramas de dispersin son cuadrados, con una rela-
cin 1 a 1 para los ejes horizontales y verticales).
En la figura 3-1, el eje horizontal comienza con el valor 1 (el menor puntaje posible en la es-
cala de intimidad, que es un promedio de varias preguntas contestadas cada una de ellas con refe-
rencia a una escala del 1 al 9). El eje vertical comienza con 19, que es la menor puntuacin
posible de la escala de idealizacin (esta escala incluye 19 tems, clasificados del 1 al 9. El punta-
je total de la escala es la suma de los 19 tems). El valor ms alto en el eje horizontal es 9,0, la m-
xima puntuacin posible en la escala de intimidad. El valor ms alto en el eje vertical es 171, la
mayor puntuacin posible en la escala de idealizacin.
3, Marcar un punto por el par de observaciones de cada persona. Ubicar el lugar en el eje ho-
rizontal que corresponde al valor observado de la persona en la variable predictora, Luego mover-
se haca arriba hasta llegar a la altura en el eje vertical que corresponde al valor observado de la
misma persona con respecto a esa variable, y marcar un punto bien claro.
Si en un mismo lugar coinciden dos casos, se puede escribir el nmero 2 en ese lugar o mar-
car un segundo punto lo ms cerca posible del primero, si es posible tocndolo, pero dejando en
claro que en realidad hay 2 puntos en el mismo lugar.
Ejemplo
Supongamos que una empresa est pensando aumentar la cantidad de personal bajo el mando de
cada uno de sus gerentes de piso. Sin embargo, la empresa est preocupada por el estrs que sto
podra provocar a sus gerentes. La empresa supone que cuantas ms personas supervise un geren-
te, mayor ser el estrs sufrido por l. Para analizar la situacin, un psiclogo laboral sugiere es-
tudiar a cinco gerentes seleccionados al azar de entre todos los gerentes de piso de la empresa.
(En la prctica, debera utilizarse un grupo mucho mayor, pero aqu utilizaremos slo cinco casos
para simplificar el ejemplo). Se entrega a cada uno de los cinco gerentes un cuestionario de medi-
cin de estrs en el cual los posibles registros van de 0 (estrs nulo) a 10 (estrs extremo). Los re-
sultados podran ser como los que indica la tabla 3-1.
1. Dibujar los ejes y determinar qu variable representa cada uno de ellos. La empresa est in-
teresada en el efecto causado en el nivel de estrs por la cantidad de empleados supervisados. Por
lo tanto, consideramos la cantidad de empleados supervisados como la variable predictora y ubi-
camos esa informacin en el eje horizontal; el nivel de estrs es la variable dependiente y, por lo
tanto, debe ubicarse en el eje vertical. (Vase figura 3-2a).
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Para el eje horizontal, supongamos que en esta empresa no se permite a ningn gerente su-
pervisar ms de 12 empleados. Por lo tanto, el eje horizontal va de 0 a 12. Eeje vertical va de 0 a
10, que son los lmites del cuestionario de medicin de estrs. (Vase figura 3-2b).
3. Marcar un punto por el par de observaciones de cada persona. En el caso del primer geren-
te, la cantidad de empleados supervisados es . Localizamos el nmero en el eje horizontal.
Luego, subimos hasta alcanzar el nivel del nmero 7 en el eje vertical (el nivel de estrs del pri-
mer gerente). Marcamos un punto en ese lugar (vase figura 3-2c). Seguimos el mismo procedi-
miento con cada uno de ios cuatro gerentes restantes. El resultado debera ser el que muestra la
figura 3-2d.
PATRONES DE CORRELACIN
Hasta ahora hemos considerado aquellas situaciones en las que los valores altos coinciden con los
altos, los bajos con los bajos y los medianos con los medianos. A ese tipo de situacin se la deno-
mina correlacin positiva. Debido a que el patrn que muestra el diagrama de dispersin se
aproxima a una lnea recta, es tambin un ejemplo de correlacin lineal.
Por ejemplo, en el diagrama de dispersin de la figura 3-1 se podra dibujar una recta que
muestre la tendencia general de los puntos, tal como lo hemos hecho en la figura 3-3. Del mismo
modo, se podra dibujar una recta en nuestro segundo ejemplo, como lo muestra la figura 3-4.
(Una de las razones por las que estos casos de correlaciones lineales se denominan positivas se
debe a que, en geometra, la pendiente de una recta es positiva cuando observarnos que la recta se
eleva a medida que desplazamos nuestra mirada desde la izquierda hacia la derecha del grfico.
En el captulo 4, aprenderemos reglas precisas para trazar tales rectas y determinar su pendiente).
T a b la 3 - 1 .
E m p l e a d o s s u p e r v i s a d o s y n iv e l d e e s t r s ( d a t o s f i c t i c io s ) .
6 7
8 8
3 i
10 . $
8 6
, (^tidadde em|Me^ipryi$d<. .
F ig u r a 3 -2 , C m o hacer un diagram a de dispersin , (a) S e determ inan los e je s, la variable pred ictora (e m -
p le a d o s su p erv isa d o s) se ub ica en e l e je horizontal y la variable d ep en d ien te (n iv el d e estrs) en. e l e je v erti-
cal. (b ) S e m arca la serie v a lo res so b re lo s ejes, (c ) S e m arca el pu nto determ inad o por e l par d e va lores
o b serv a d o s co rresp o n d ien tes al prim er gerente, (d ) S e m arca un punto d o n d e s e cruza p o r ca d a par d e v a lo -
res o b serv a d o s d e lo s c in c o gerentes.
Correlaciones negativas
A veces, la relacin entre las variables no es positiva. Por el contrario, los valores altos coinciden
con ios bajos y los bajos con los altos. A esto se denomina correlacin negativa. Por ejemplo, en
un estudio de las relaciones amorosas entre estudiantes (Aron & Fraley, 1998), ios investigadores
descubrieron que cuanto ms lejos de su pareja vive una persona (en funcin de los minutos de
viaje), menos cantidad de actividades comparte con su pareja. El diagrama de dispersin de la fi-
gura 3-5 representa grficamente este patrn de correlacin.
Incluimos una recta en la figura para remarcar la tendencia general de los puntos; as, podemos
observar que a medida que la recta avanza hacia la derecha, tambin se dirige hacia abajo. Es de-
cir. cuantas ms son las horas de viaje, menos actividades se realizan en pareja.
F ig u r a 3 -3 . D iagram a d e d isp ersi n de la figura 3-1 c o n un a recta q u e in d ica la ten d en cia general. (F u e n te :
A ron & Fraley, 19 9 8 ).
F ig u r a 3 -4 . D ia g ra m a d e d isp e r si n d e la
figura 3 -2 d c o n una recta qu e in d ica la tend en-
c ia general.
Una investigacin realizada por Bardsley y Rhodes (1996), dos psiclogos especializados en
organizaciones empresariales, ilustra tambin una correlacin negativa. A travs de un estudio
realizado con 174 obreros, descubrieron que el hecho de llegar tarde a trabajar tena una corre-
lacin lineal negativa con la satisfaccin laboral. Cuanto mayor era el grado de satisfaccin la-
F ig u r a 3 -5 . D ia g ra m a de d isp ersin c o n una recta q u e in d ic a la ten d en cia g en eral d e una correla cin n e g a -
tiva entre d o s variables: d istan cia en m in u tos d e v ia je y can tid ad d e activid ad es d iferen tes q u e e l p artici-
pante realiza co n su pareja. (F u e n te : A ron & F raley, 1 9 9 8 ).
boral de los obreros, menos frecuentemente llegaban tarde. En otras palabras, cuanto menor era
el nivel de satisfaccin de los obreros, con ms frecuencia llegaban tarde a trabajar.
Correlaciones curvilneas
En algunos casos, la relacin entre dos variables no sigue una lnea recta positiva o negativa, sino
un patrn ms complejo denominado correlacin curvilnea. Por ejemplo, se sabe que hasta de-
terminado nivel, una mayor ansiedad fisiolgica hace que uno se desempee mejor en cualquier
tarea (como por ejemplo, una prueba de matemtica). A partir de ese nivel, una mayor ansiedad
fisiolgica hace que el rendimiento empeore. Es decir, desde estar casi dormido hasta un nivel
moderado de ansiedad, la efectividad aumenta. Al superar ese nivel moderado, el aumento de la
ansiedad puede acelerar demasiado a un individuo, impidindole tener un buen rendimiento.
Este patrn curvilneo en particular est representado en la figura 3-6, en donde se observa que
sera imposible dibujar una lnea recta para describirlo. La figura 3-7 muestra algunos otros ejem-
plos de relaciones curvilneas.
A travs del mtodo usual de clculo de la correlacin (mtodo que aprenderemos en este ca-
ptulo) obtenemos el grado de correlacin lineal. Si el verdadero patrn de asociacin es curvil-
neo, calcular la correlacin con el mtodo usual podra dar como resultado muy poca correlacin
o una correlacin nula. Por eso es muy importante observar los diagramas de dispersin para des-
cubrir estas relaciones ms interesantes, antes de realizar correlaciones automticamente con el
mtodo usual, suponiendo que la tnica relacin posible sea una lnea recta.
F ig u r a 3 -6 . E jem p lo d e relacin
curvilnea: d e sem p e a en una tarea
y ansiedad.
F ig u r a 3 -9 . D iagram a de
dispersin en e l que se en-
contr un a le v e co rrela -
c i n lin e a l p o sitiv a entre
las d o s variab les.
CLCULO DE UN NDICE DEL GRADO
DE CORRELACIN LINEAL:
COEFICIENTE DE CORRELACIN DE PEARSON
Al observar un diagrama de dispersin obtenemos un indicio aproximado del tipo y grado de rela-
cin entre dos variables. Sin embargo, observar el grfico no es un mtodo muy preciso. Es nece-
sario obtener un nmero que represente el grado exacto de correlacin.
Grado de correlacin
El grado de correlacin indica en qu medida existe un patrn claro de alguna relacin en par-
ticular entre dos variables. Por ejemplo, vimos que existe una correlacin lineal positiva cuan-
do los valores altos coinciden con los valores altos, los medios con los medios y los bajos con
los bajos. Por lo tanto, el grado de una correlacin de este tipo determina cuntos valores altos
coinciden con otros tambin altos, y as sucesivamente. Del mismo modo, el grado de correla-
cin lineal negativa indica cuntos valores altos de una variable coinciden con valores bajos de
la otra, y as sucesivamente. En cuanto a los diagramas de dispersin, un alto grado de correla-
cin lineal significa que todos los puntos se encuentran muy cerca de una lnea recta (la recta
que se inclina hacia arriba o hacia abajo segn la correlacin lineal sea positiva o negativa).
Una correlacin lineal perfecta es aquella en la que todos los puntos estn ubicados exactamen-
te sobre la lnea recta.
El coeficiente de correlacin
El promedio de los productos cruzados de puntuaciones Z es, entonces, un excelente modo
de calcular el grado de correlacin lineal. Se lo denomina coeficiente de correlacin. Tam-
bin se lo llama coeficiente de correlacin de Pearson (o, para ser muy tradicionales, coefi-
ciente de correlacin producto-m om ento de Pearson), Lleva el nombre de Karl Pearson (a
quien presentaremos en el cuadro 4-1). Pearson, junto con Francis Galton (vase cuadro 3-1),
desempe un papel fundamental en el desarrollo del coeficiente de correlacin. El coefi-
ciente de correlacin se representa con la letra r, que es la forma abreviada de regresin, un
concepto muy relacionado con la correlacin (que veremos en el captulo 4). Tambin es im-
portante saber que en algunas publicaciones cientficas se hace referencia a los coeficientes
de correlacin como correlaciones de orden cero (veremos las razones para este nombre en
el captulo 17).
La figura 3-10 muestra diagramas de dispersin e indica el coeficiente de correlacin de va-
rios ejemplos.
F igura 3-10. D iagram as d e d isp ersi n y c o e fic ie n te s d e co rrela ci n d e d iv erso s e je m p lo s c o n d iferen tes gra-
d o s d e co rrela ci n lin eal.
Figura 3-10. {continuacin)
La exposicin precedente puede resumirse en unos pocos smbolos, ia frmala del coeficiente de
correlacin:
r = ,ggx.gx, (3-1)
N
r es el coeficiente de correlacin, Zx es la puntuacin Z de cada persona en la variable X, Zy es la
puntuacin Z de cada persona en la variable Y. ZxZy es igual al producto Zx por Zy (el producto
cruzado de puntuaciones 2 ) de cada persona, y 2 ZxZy es la suma de los productos cruzados de to-
das las personas incluidas en el estudio. N es la cantidad de personas que participan en el estudio.
Uniendo todos los datos, 2ZxZy dividida por V, es el promedio de los productos cruzados de pun-
tuaciones 2 .
Ejemplo
Intentemos aplicar los pasos enumerados ai ejemplo del nivel de estrs de los gerentes.
1. Convertir todas las observaciones en puntuaciones Z. Comenzando con la cantidad de em-
pleados supervisados, la media es 7 (la suma, que es igual a 35, dividida por 5 gerentes) y el des-
vo estndar es 2,37 (la suma de los desvos cuadrticos, 28, dividida por 5 gerentes, es igual a
una varianza de 5,6, cuya raz cuadrada es 2,37). En el caso del primer gerente, entonces, un valor
observado de 6 es una unidad por debajo de la media 7, y 1 dividido 2,37 es 0,42. Por lo tanto, la
puntuacin Z del primer gerente referido a la cantidad de empleados supervisados se ubica a 0,42
desvos estndares por debajo de la media o, lo que es igual, presenta una puntuacin Z de - 0,42.
Calculamos el resto de las puntuaciones Z del mismo modo y las ordenamos en las columnas co-
rrespondientes de la tabla 3-2.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. En el caso del primer
gerente, multiplicamos - 0,42 por 0,38: el resultado es -0,16. La ultima columna de la tabla 3-2
muestra los productos cruzados de iodos los gerentes.
3. Sumarlos productos cruzados de puntuaciones Z. Como lo indica la tabla 3-2, el total es 4,38.
4. Dividir el resultado del paso anterior por la cantidad de personas incluidas en el estudio, es
decir, 4,38 dividido 5 (la cantidad de gerentes incluidos en el estudio). El resultado es 0,876. Este
es el coeficiente de correlacin que, redondeado, es igual a 0,88. Aplicando la frmula del coefi-
ciente de correlacin,
5 2 ^ 4 3 8
N 5
Dado que el coeficiente de correlacin calculado es positivo y cercano a 1, es decir, el mayor va-
lor posible, podemos afirmar que estamos frente a una correlacin lineal fuertemente positiva.
T a b la 3 - 2 .
C lc u lo d e l c o e fic ie n te d e c o r r e la c i n p a r a e l e je m p lo d e l n iv e l d e e s t r s d e lo s g e r e n te s
( d a t o s fic tic io s ).
X X -M (X - M f zx Y Y -M T -M )2 Zy ZxZy
6 -1 1 - 0 ,4 2 7 1 1 0,38 - 0 ,1 6
I--.V-M.; 0 ,4 2 A :8 l ; . r .-2 ( S o I B M 0 ,3 2 ' ;
3 -4 16 -1 ,6 9 1 -5 25 - 1 ,9 2 3 ,2 4
.10 ;V; "3' ' 1,27 .8 " : '2- .. - 4 7 r i ;
8 1 1 0 ,4 2 6 0 0 0 ,0 0 0 ,0 0
a 35 SS = 28 2 = 30 SS - 3 4 2 Z x Z r = 4 ,3 8
=7 SD3 = 5 ,6 0 M = 6 S D * = 6 ,8 0 r - 0,88
SD * 2 ,3 7 SD = 2,61
Combinando los distintos procedimientos tratados en este captulo, los pasos a seguir son los siguientes:
1. Construir un diagrama de dispersin.
a ) D ib u ja r l o s e j e s y d e te r m in a r q u v a r ia b le v a e n c a d a u n o d e e llo s .
b) Determinar ia serie de valores que se van a utilizar para cada variable y marcarla en
los ejes.
c) Marcar un punto por el par de observaciones de cada persona.
2. Determinar si el patrn es claramente curvilneo. Si lo es, no se calcula el coeficiente de co-
rrelacin (o si se lo calcula, debe tenerse en cuenta que slo se est describiendo el grado
de relacin lineal).
3. Estimar la direccin y el grado de correlacin lineal.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z.
c) Calcular el producto cruzado de las puntuaciones Z de cada persona.
d) Sumar los productos cruzados de puntuaciones Z.
e) Dividir el resultado por la cantidad de personas incluidas en el estudio.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado, comparndolo con
la estimacin visual realizada a partir del diagrama de dispersin.
Ejemplo
Supongamos que una persona que investiga el funcionamiento de la memoria realiza un experi-
mento para comprobar la teora de que la cantidad de exposiciones a una palabra aumenta las pro-
babilidades de que sea recordada. Dos individuos son elegidos al azar para observar una lista de
10 palabras una sola vez, otros dos individuos observan la lista dos veces, y as sucesivamente,
hasta llegar a ocho exposiciones de cada palabra, y 16 participantes en total. La tabla 3-3 indica
los resultados de este experimento ficticio. (Un estudio real de este tipo probablemente dara un
resultado ms curvilneo debido a que, en esta clase de investigaciones, cuanto mayor sea la can-
tidad de exposiciones, menor ser el aumento relativo de palabras recordadas).
1. Construir un diagrama de dispersin.
a) Trazar los ejes y determinar qu variable deber marcarse en cada uno de ellos. Segn el
diseo del experimento, la cantidad de exposiciones es la variable independiente, por lo
que estar ubicada en el eje horizontal. La cantidad de palabras recordadas es la variable
dependiente, por lo que estar ubicada en el eje vertical (vase figura 3-1 la).
b) Determinar la serie de valores que se van a utilizar para cada variable, y luego marcarla
en los ejes. En el estudio que estamos analizando, la-cantidad de exposiciones vara de 1
a 8, pero comenzaremos con 0 para cumplir con las reglas convencionales. La cantidad
de palabras recordadas no puede ser menor que 0 ni mayor que 10, cantidad total de pa-
labras en la lista (vase figura 3-1 Ib).
T a b la 3 - 3 .
Efecto del nmero de exposiciones en la cantidad de palabras recordadas.
c) Marcar los puntos determinados por el par de observaciones de cada persona. El primer
punto se ubica con coordenada 1 segn el eje horizontal, y 4 segn el eje vertical. Mar-
cando cada uno de los punios, de este mismo modo, completamos el diagrama de disper-
sin (vase figura 3- i 1c).
2. Determinar s el diagrama es claramente curvilneo. Parece existir una fuerte tendencia lineal.
3. Estimar la direccin y el grado de correlacin lineal. Los puntos van hacia arriba y hacia la
derecha, y la mayora de ellos estn ubicados muy cerca de una lnea recta imaginaria. Por
lo tanto, aparentemente se trata de una correlacin lineal positiva bastante fuerte.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de exposi-
ciones es 4,50, con un desvo estndar de 2,29. Por lo tanto, la primera observacin, que
es igual a I, se ubica 3,5 unidades por debajo de la media, lo que implica 1,53 desvos
estndares debajo de la media, o sea Z = -1,53. Utilizando el mismo procedimiento para
todas las otras observaciones se obtienen las puntuaciones Z que aparecen en las colum-
nas correspondientes de la tabla 3-4. (La tabla no indica los pasos para el cmputo del
desvo y del desvo cuadrtico utilizados para calcular el desvo estndar).
b) Calcular el producto cruzado de las puntuaciones Z de cada persona. Por ejemplo, el pri-
mer producto cruzado es -1,53 por -0,74, lo que da un resultado de +1,13. Todos los
productos cruzados aparecen en la columna ubicada a la derecha en la tabla 3-4.
c) Sumar los productos cruzados de las puntuaciones Z. El total es 10,80.
d) Dividir el resultado por la cantidad de personas. El resultado de dividir la suma de los
productos cruzados de puntuaciones Z, 10,80, por la cantidad de personas, 16, es 0,68,
que es el coeficiente de correlacin. Es decir, r = 0,68.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado comparndolo con
, la estimacin realizada a partir del diagrama de dispersin. El resultado calculado de +0,68
es, como esperbamos, una correlacin lineal positiva bastante marcada.
C orreteeoa 87
10 '
9
8
7
6
5
*.
.3
2
i-
. - ..... ......................................... ; :
8'
S B illli!
r
i. - - : . " v. . . .'^. : : 4 'i ' .-Vivvii
'0 1 2 -3 4-5 6 7 8
. :
. Exposiciones. \ \r
" (c) y-?' -S
"vi;"
Figura 3-11. Pasos que se deben seguir para confeccionar un diagrama de dispersin segn ios datos de la
tabla 3-3. (a) Establecer los ejes, la variable independiente (cantidad de exposiciones) en el eje horizontal,
la variable dependiente (cantidad de palabras recordadas) en el eje vertical; (b) determinar la serie de valo-
res, y marcarlos en los ejes; (c) ubicar un punto por cada par de observaciones de cada uno de los 16 parti-
cipantes (datos ficticios).
Otro Ejemplo
Supongamos que una psicloga educacional averigu la cantidad promedio de alumnos por clase
y los promedios de calificaciones en las pruebas de nivel de cinco escuelas primarias de determi-
nado distrito escolar. La tabla 3-5 muestra los datos. La pregunta formulada por la psicloga es:
Cul es la relacin entre estas dos variables?
1. Construir un diagrama de dispersin.
a) Dibujar los ejes y determinar en cul se ubica cada variable. Dado que resulta razonable
pensar que la cantidad de alumnos por clase afecta las calificaciones en las pruebas de
nivel, y no al revs, podemos trazar en la parte inferior el eje correspondiente a la canti-
dad de alumnos por clase.
Tabla 3-4.
Clculo d d coeficiente de correlacin del efecto producido por el nmero de exposiciones en la
cantidad de palabras recordadas (datos ficticios).
X Zx Y Zy 2xZ y
1 -1 ,5 3 4 - 0 ,7 4 1,13
2 : 1 -1 ,5 3 3. -1 ,2 1 1,85
3 2 - 2 ,0 9 3 -1 ,2 1 1,32
4 2 -1 ,0 9 .5 - 0 ,2 6 0 ,2 8
5 3 -0 ,6 5 6 0,21 -0 ,1 4
3 - 0 ,6 5 4 - 0 ,7 4 0,48
7 4 - 0 ,2 2 4 - 0 ,7 4 0 ,1 6
8 ; ; 4 ' - 0 ,2 2 ... 6 0,21 -0 ,0 5
9 5 0 ,2 2 5 -0 ,2 6 - 0 ,0 6
10 V : 5 r ., 0 ,2 2 .. .. 7 --, 0,68 - ' 0,15 ...-V:
11 6 0,65 2 1,68 - 1 ,0 9
-, 12 0,65 . v V - L , 9 1,62 ^ i , 5
13 7 1,09 0,21 0,2 3
. V 14 7 ' 1,09 V - i,i5
. .;..c -L 1,25
15 8 1,53' 9 1,62 2 ,4 8
16 . .8 1,53 . '.v, . v . 8;. 1,15 1,76
: 72 89 10,80
M: 4,5 0 5.56 r = 0,68
S D ~ i % m 6 = 2,29 ^ 7 2 /1 6 2,12
Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
b)
ejes. Presumiremos que las calificaciones en las pruebas de nivel van de 0 a 100. La can-
tidad de alumnos por clase debe ser por lo menos de 1 (y seguramente la poltica de la
junta escolar exige que sean ms). No conocamos el mximo, as que supusimos que
poda ser 50.
c) Marcar un punto por cada par de observaciones obtenidas de las personas (en este caso,
de las escuelas). La figura 3-12 muestra el diagrama de dispersin completo.
2. Determinar si el diagrama muestra claramente una correlacin curvilnea. En trminos ge-
nerales, la correlacin parece mantener un patrn lineal (aunque con tan pocos puntos es
difcil de decir).
Tabla 3-5.
Promedios de cantidad de alumnos por clase y de calificaciones en las pruebas de nivel en cinco
escuelas primarias (datos ficticios).
M ain Street 25 80
Casat 14 98
Hara ad 33 50
Shady Grove 28 82
Jefferson 20 90
Figura 3-12. ltimo paso en la confeccin de un dia-
grama de dispersin con la informacin contenida en
la tabla 3-5: se ha dibujado un punto por cada par de
observaciones de las cinco escuelas (datos ficticios),
^ :'15 SS;--4$43|5ap
3. Estimar la direccin y el grado de correlacin lineal. Los pumos tienen una direccin mar-
cada haca abajo y hacia la derecha, indicando una fuerte correlacin lineal negativa.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de alum-
nos por case es 24 y el desvo estndar es 6,54. La puntuacin Z de la cantidad de alum-
nos de la primera ciase, 25, es igual a (25 - 24)/6,54 - 0,15. Todas las puntuaciones Z
aparecen en la columna correspondiente de la tabla 3-6.
b) Calcular los productos cruzados de las puntuaciones Z de cada persona (en este caso,
de cada escuela). El primer producto cruzado es 0,15 x 0, que es igual a 0. El segundo
es -1,53 x 1,10, que es igual a -1,68. Todos los productos cruzados de las puntuaciones
Z aparecen en a columna de la derecha de la tabla 3-6.
c) Sumar los productos cruzados de las puntuaciones Z. El total es -4,52.
d) Dividir el total por la cantidad de personas (en este caso, escuelas). La suma (-4,52) divi-
dida por 5 es igual a -0,90. Es decir, r - -0,90.
5. Controlar el signo y el tamao de coeficiente de correlacin calculado, comparndolo con
la estimacin realizada a partir del diagrama de dispersin. Un coeficiente de 4),90 con-
cuerda perfectamente con la estimacin original que indicaba una fuerte correlacin lineal
negativa.
Tabla 3-6.
Clculo del coeficiente de correlacin entre las cantidades promedio de alum nos por case y de
calificaciones en ias pruebas de rendimiento en cinco escuelas prim arias (datos ficticios).
E s c u e la T a m a o d e la d a s e C a lif ic a c i n e n la p r u e b a p r o d u cto C ru za d o
d e r e n d im ie n to
X Zx Y Zy Z*Zr
M ain Street 25 0,15 80 0,00 0 ,0 0
Casat 14 4 ,5 3 98 u o 1,68
Harland 33 1,38 50 -1 ,8 4 2,53
Shady Grove 28 0,61 82 0,12 0,08
Jefferson 20 -0 ,6 1 90 - 0,61 0,38
2: 120 400 - 4 0 ,5 2
M: 24 80 r = - 0 ,9 0
S D - ^24/5 = 6,5 4 T l 328/5 - 16,30
PRUEBA DE LA SIGNIFICACIN ESTADSTICA
DEL COEFICIENTE DE CORRELACIN
Por s mismo, el coeficiente de correlacin es un estadstico descriptivo. Describe el grado y la di-
reccin de la correlacin lineal de determinado grupo de personas analizadas. Sin embargo, cuan-
do realizamos una investigacin en el campo de la psicologa, por lo general estamos ms
interesados en una serie de observaciones en cuanto representan a una poblacin mayor que no se
ha analizado directamente. Por ejemplo, el psiclogo laboral entreg los cuestionarios sobre es-
trs slo a cinco gerentes de la empresa, pero con la intencin de considerarlos tpicos represen-
tantes de los otros gerentes de esa misma empresa. (En la prctica se necesitara un grupo con
muchas ms de cinco personas para lograr ese objetivo. Hemos utilizado cantidades pequeas de
personas en nuestros ejemplos para que sean ms fciles de comprender).
El problema, sin embargo, es que analizando slo algunas de las personas es posible elegir
por casualidad aquellas en las cuales los valores altos coinciden con los altos y los bajos con los
bajos, aun cuando, habiendo estudiado a todas las personas, no hubiera existido correlacin algu-
na. Decimos que una correlacin es significativa si no resulta verosmil que hubisemos podido
obtener una correlacin de esa magnitud y si, en realidad, en el grupo completo no hubiera corre-
lacin alguna. Especficamente, determinamos si esa verosimilitud es menor que algn bajo gra-
do de probabilidad (p), como un 5% un 1%. Si esa verosimilitud es tan baja, decimos que la
correlacin es estadsticamente significativa con p < 0,05 llp < 0 ,01.
El mtodo y la lgica para determinar la significacin estadstica es el tema central de es-
te libro a partir del captulo 5. Estaamos adelantando temas si intentramos explicarlos ahora.
De todos modos, para cuando hayamos completado los captulos siguientes, la lgica y los de-
talles quedarn bien claros. (El apndice II de este captulo contiene la informacin necesaria
para aplicar estos conocimientos a la correlacin, pero en realidad no ser muy til hasta des-
pus de haber completado el captulo 9). Slo mencionamos el tema aqu para dar una idea ge-
neral de lo que significa, en caso de que al leer alguna publicacin cientfica que informe sobre
coeficientes de correlacin se haga referencia a la significacin estadstica p < 0,05, o a algu-
na frase similar.
1J-' 4 4 Cuadro 3 -2 .
e m u u u , U U 9 U 1 y a . ; x nu a i i u u : i e > i a i H u a t u m u i c L d i i i c m c s t
Causalidad y correlacin
Si dos variables presentan una correlacin lineal significativa, normalmente suponemos que exis-
te algo que las correlaciona. Sin embargo, la direccin de causalidad (justamente, qu es la cau-
sa de qu) no puede determinarse solamente a partir de la correlacin. En toda correlacin entre
dos variables X e Y, existen tres posibles direcciones de causalidad: X podra ser la causa de Y, Y la
de L, o algn tercer factor podra ser la causa de ambas, X e Y. Tambin es posible (y a menudo
probable) que exista ms de una direccin de causalidad.
Tomemos el ejemplo del estrs de los gerentes. El estudio comenz con la nocin implcita de
que supervisar un mayor nmero de personas (X) causa un aumento del nivel de estrs (Y). El re-
sultado del estudio fue una marcada correlacin positiva entre X e Y, que ciertamente coincide
con la idea de que X es la causa de Y. Sin embargo, tambin coincide de la misma forma con la
idea de que Y es la causa de X . (Tal vez los gerentes que parecen sufrir de estrs sean considerados
muy trabajadores y ese sea el motivo por el cual sus superiores asignen mayor cantidad de perso-
nas a su cargo). Tambin es posible que la correlacin sea el resultado de algn tercer factor que
cause que X e Y se desarrollen de manera conjunta. Por ejemplo, algunos sectores de la fbrica
podran necesitar ms personal y tambin generar ms estrs. Es decir, determinado sector de la
fbrica causa estrs y requiere de muchos empleados para supervisar.
Existe bastante confusin acerca de este asunto de la correlacin y la causalidad. El tema
se complica al existir dos usos de la palabra correlacin. Algunas veces se utiliza para descri-
bir un procedimiento estadstico (como lo hemos hecho en este captulo), y otras veces se utili-
za para describir un tipo de diseo de investigacin en el que se miden dos variables en un
grupo de personas, sin realizar una asignacin aleatoria de sujetos a determinados valores de
una de las variables (vase el apndice A). Comnmente, los diseos de investigacin correla-
cinales son analizados estadsticamente utilizando el coeficiente de correlacin, y los diseos
de investigacin experimentales se analizan utilizando procedimientos que veremos en los ca-
ptulos 9 al 13.
Sin embargo, existen excepciones. En este mismo captulo utilizamos un ejemplo en el que
los participantes eran asignados al azar en determinada cantidad de exposiciones y luego se me-
da la cantidad de palabras recordadas. A partir de los datos obtenidos, calculamos un coeficiente
de correlacin. No obstante, en el estudio no se utiliz un diseo de investigacin correlaciona];
fue un verdadero experimento, ya que los participantes eran asignados al azar a diferentes valores
de la variable independiente. Por s mismo, el coeficiente de correlacin que calculamos no nos
indic nada acerca de la causalidad. Aun as, qued claro, por el diseo de investigacin, que la
nica direccin causal posible es que la cantidad de exposiciones haya causado la diferencia en la
cantidad recordada.
Figura 3-13. E jem p lo d e restriccin d el ran go com parand o d os d iagram as d e d isp ersin : (a) c u an d o s e
m uestra la serie d e va lo res c o m p le ta (grado e sc o la r y c o n o c im ie n to s sob re g eo g ra fa ) y (b ) cu a n d o se
restringe la s er ie d e v alores (a lo s prim eros tres grados).
los que se ensea poca geografa). El diagrama de dispersin (vase figura 3-13b) reflejara muy
poca, o casi ninguna correlacin (la correlacin calculada sera cercana a 0) y, sin embargo, el in-
vestigador estara incurriendo en error si llegara a la conclusin de que el grado no est relaciona-
do con los conocimientos sobre geografa en ninguno de los grados escolares.
El problema en este caso es que la-correlacin.est basada en una serie de observaciones que
incluyen slo un rango limitado de los valores posibles de una de las variables. (En este ejemplo
existe un rango limitado de grados escolares). Es errneo pensar en la correlacin como si se apli-
cara a todo el rango de valores que podra tener la variable. Esta situacin se denomina restric-
cin del rango.
Es fcil cometer estos errores al interpretar correlaciones, las cuales incluso aparecen oca-
sionalmente en publicaciones cientficas y se oyen con frecuencia an mayor en discusiones in-
formales sobre resultados de investigaciones. Por ejemplo, en el rea de los negocios, a veces se
intenta determinar si las pruebas de aptitud laboral reflejan lo exitosas que resultan ser en sus
funciones las personas contratadas. Por lo general, la relacin es baja, porque no se tiene en
cuenta que se contratan slo a las personas que tuvieron buenos resultados en las pruebas. Los
estudios que miden ei xito en el empleo incluyen slo e subgrupo que presenta los registros al-
tos. La figura 3-14 grfica este ejemplo.
:.;;vgS;y:y:; y ,y 5 0 ; :r y m:
Puntuacin en ia prueba .' Puntuacin en la prueba '
T a b ie a 3 -7 .
T a b la p r e s e n ta d a a 3 0 p s ic lo g o s p a r a e s tim a r r.
X Y
1
2 10 f
3 2
4 9
5 5
6 4 jU
7 6 v
8 3
9 11
10 8
11 7
12 12
4
Fuente: Oakes (1982).
opina el lector? La intuicin de los investigadores britnicos (que como grupo estn, al menos,
tan bien capacitados en estadstica como los psiclogos de cualquier lugar del mundo) indicaba
desde -0,20 a +0,60, con una media de 0,24. Si el lector lo desea puede calcular la verdadera co-
rrelacin. Es de 0,50! Es decir, que en forma abstracta los psiclogos dan a una correlacin de
0,50 un grado mucho ms alto de correlacin del que le otorgan cuando observan los datos reales
(datos que, aun con una r - 0,50, slo se vean como de 0,24).
Oakes dio a otro grupo de treinta investigadores slo la columna de X, y les pidi que comple-
taran la columna de Y con nmeros tales que reflejaran una correlacin de 0,50 (nuevamente, s-
lo utilizando su intuicin y sin realizar ningn clculo). Cuando Oakes calcul las correlaciones
S
i que representaban ios nmeros indicados por los investigadores, el promedio result ser de
En otras palabras, incluso los investigadores experimentados consideran que un coeficiente
relacin representa un grado de asociacin mayor de lo que en realidad implica.
Por el contrario, otros psiclogos sostienen que las pequeas correlaciones pueden ser muy
importantes tericamente, las cuales tienen mayor inferencia prctica por el hecho de que los pe-
queos efectos pueden acumularse a lo largo del tiempo (Prentice & Miller, 1992).
Para demostrar la importancia prctica de pequeas correlaciones, Rosnow y Rosenthal
(1989b) ofrecen un ejemplo de un estudio actualmente famoso relacionado con el hecho de que
algunos mdicos tomaran o no aspirinas a diario, y la relacin de esa ingesta con los ataques
cardacos (Comisin Directiva del Grupo Mdico de Investigacin sobre Estudios Sanitarios
[Steering Committee of the Physicians Health Study Research Group], 1988). Los resultados de-
mostraron que el hecho de ingerir aspirina estaba correlacionado en un -0,034 con los ataques
cardacos.1Es decir, produce aproximadamente un 0,1% de reduccin proporcional de error. Sin
embargo, consideremos la parte superior de la tabla 3-8 (en la que se describen los ataques carda-
cos con im (Infarto demiocaxdio). La correlacin de slo 3,4 significaba que entre los ms de
20.000 mdicos que estaban incluidos en el estudio, existan 72 ataques cardacos ms en el gru-
po que no tomaba aspirina. (De hecho, la parte inferior de la tabla indica que tambin existan 13
muertes ms por ataques cardacos en el grupo que no tomaba aspirina).
La parte central de la tabla 3-8 es especialmente interesante desde el punto de vista de la estadsti-
ca. En esa parte de la tabla, los porcentajes correspondientes a cada grupo referido a los ataques
cardacos (ausencia d e a t y presencia de i m ) estn divididos entre el porcentaje que tomaba y el
que no tomaba aspirinas (el grupo placebo). Observemos que la diferencia en porcentajes en cual-
quiera de los grupos es de exactamente +3,4% -3,4%. (Por ejemplo, dentro del grupo que haba
sufrido ataques cardacos, el 48,3% que tomaba aspirinas menos el 51,7% del grupo placebo
equivale a -3,4%). Lo importante aqu es que 3,4% es exactamente igual al coeficiente de correla-
cin (0,034).
No es una coincidencia. En este tipo de tablas, que se denominan del tam ao del efecto a
una exposicin dicotomica, la diferencia de los porcentajes siempre resultar exactamente igual
al coeficiente de correlacin. Esto facilita sorprendentemente la comprensin de las correlaciones
en cualquier situacin en la que una de las variables representa el xito y el fracaso (como no su-
frir un ataque cardaco o sufrirlo), y la otra variable representa la ciase de tratamiento recibido
(como aspirina o placebo). En este tipo de situaciones, la correlacin marca la diferencia en por-
centajes entre el xito y el fracaso en relacin con el tratamiento recibido,
* Para calcular la correlacin entre tener un ataque cardaco y tomar aspirinas, tendramos que convertir las dos varia-
bles en nmeros. Por ejemplo, podramos representar el hecho de tener un ataque cardaco con l , y no tenerlo con 0; de
forma similar, podramos considerar que estar en el grupo que consume aspirinas es igual a 1, y estar en ei grupo place-
bo guai a 0. N o tiene importancia cul de los dos nmeros utilicemos para cada uno de los dos valores de cada variable.
Cualesquiera sean los dos nmeros utilizados, ei resultado ser el mismo despus de convertirlos en puntuaciones Z. La
nica diferencia que puede surgir en relacin con ios nmeros utilizados es que, segn a q u valor se aplique el nmero
mayor, esto determinar que la correlacin sea positiva o negativa.
T ab la 3 -8 .
E fe c t o s d e la a s p ir in a en lo s a ta q u e s c a r d a c o s .
C o n d ici n A u se n c ia de im P r e se n c ia de im
im no fa ta l im fa ta l
Aspirina 99 5
Placebo 171 18
N ota: m = infarto de miocardio. Fuente: Com isin Directiva del Grupo M dico de investigacin Sobre Estudios
Sanitarios [Steering Committee o f the Physicians Health Study Research Group] (1988).
Tabla 3-9.
Correlaciones de Pearson entre las costumbres alimenticias de hombres y de mujeres.
S u b -e sc a la 1 2 3 4 5
M ujeres (n = 9 ,182)
1, Evitar las grasas 0 ,42* 0,16* 0,14* 0,11*
2, Consum ir fibras 0,15* 0,12* 0,09*
3. C om er fru tas diariamente 0,05* 0.0 0
4. Limitar las carnes roj as -- 0,12*
5. Limitar la sai
H om bres ( = 7 .3 0 4 )
1. Evitar las grasas 0,41* 0,13* 0,12* 0,10*
2. C om er fibras 0,13* 0,11* 0,08*
3. C om er frutas diariamente 0,02* 0,01*
4. Limitar las carnes rojas 0,07*
5, Limitar la sal _
*p< 0,001.
Fuente: Wardie, J et ai. (1997), tab, 2. Prcticas alimenticias saludables de alumnos europeos. " P sico lo g a sa n ita r ia ,
16, 443-450, Copyright, 1997, por la Asociacin Americana de Psicologa (American Psychological Association].
Reimpreso con autorizacin.
RESUMEN
Un diagrama de dispersin muestra la relacin entre dos variables. En ei eje horizontal se ubican
los valores de ia variable independiente o predictora, ordenados de menor a mayor. En el eje ver-
tical se ubican los valores de la variable dependiente, ordenados de menor a mayor. Cada par de
valores correspondientes a un individuo se marca con un punto.
Cuando en trminos generales los puntos del diagrama de dispersin siguen una lnea recta,
hablamos de una correlacin lineal. En una correlacin lineal positiva, la recta va hacia arriba y
hacia la derecha (es decir, los valores bajos coinciden con los bajos y los altos con los altos). En
una correlacin lineal negativa, la recta va hacia abajo y hacia la derecha (es decir, los valores ba-
jos coinciden con los altos y los altos con los bajos). En una correlacin curvilnea, los puntos si-
guen un patrn distinto de una simple lnea recta. Existe correlacin nula cuando los puntos no
siguen ningn tipo de patrn sistemtico.
El coeficiente de correlacin (r) indica el grado de correlacin lineal. Es el promedio de los
productos cruzados de puntuaciones Z Cuando existe una fuerte correlacin lineal positiva, el
coeficiente de correlacin es altamente positivo debido a que las puntuaciones Z positivas se mul-
tiplican por positivas y las puntuaciones Z negativas por negativas. Cuando existe una fuerte co-
rrelacin lineal negativa, el coeficiente de correlacin es altamente negativo debido a que las
puntuaciones Z positivas se multiplican por negativas y las puntuaciones Z negativas por positi-
vas. Cuando no existe correlacin lineal, el coeficiente de correlacin es 0, debido a que las pun-
tuaciones Z positivas son multiplicadas a veces por puntuaciones Z positivas, y otras por
puntuaciones Z negativas, mientras que las puntuaciones Z negativas son multiplicadas a veces
por puntuaciones Z negativas, y otras por puntuaciones Z positivas. Por lo tanto, los productos
cruzados positivos y negativos se cancelan entre s.
El mximo valor positivo posible d e r e s + l , r = +l , y ocurre cuando existe una correlacin li-
neal positiva perfecta. El mximo valor negativo posible de r es -1, r = -1, y ocurre cuando existe
una correlacin lineal negativa perfecta.
Una correlacin generalmente est basada en valores observados de determinado grupo que
pretende representar a un grupo ms amplio. Cuando ios resultados de los procedimientos esta-
dsticos (que aprenderemos ms adelante) no son coherentes con la idea de que la correlacin en
ese grupo ms amplio es 0 , decimos que la correlacin es estadsticamente significativa.
Las comparaciones del grado de correlacin lineal se consideran ms precisas si se realizan
con el cuadrado del coeficiente de correlacin (r1), llamado reduccin proporcional del error.
La correlacin no muestra la direccin de causalidad. Si dos variables, X e y, estn correla-
cionadas, esto podra ser porque X est causando Y, Y est causando X, o un tercer factor est cau-
sando X e Y.
Un coeficiente de correlacin puede representar la verdadera correlacin por debajo de su ni-
vel verdadero si se basa en las observaciones de un grupo de estudio cuyo rango de valores es res-
tringido, o cuyos valores se basan en medidas poco confiables.
Muchos psiclogos sostienen que el coeficiente de correlacin es una sobrestimacin de la
importancia de la asociacin entre dos variables. En efecto, los estudios realizados sugieren que
los psiclogos tienden a considerar cualquier coeficiente de correlacin en particular como repre-
sentante de un mayor grado de asociacin del que realmente existe. Sin embargo, las pequeas
correlaciones pueden tener importancia prctica (que puede ser demostrada a travs del tamao
del efecto a una exposicin dicotmica, el cual describe la relacin entre dos variables con dos
valores cada una, y examinando la tabla 2 x 2 resultante). Las pequeas correlaciones tambin
pueden ser muy efectivas para demostrar ia importancia de una relacin cuando un estudio de-
muestra que la correlacin se mantiene aun bajo lo que pareceran condiciones poco probables.
Las publicaciones cientficas generalmente presentan resultados correlacinales tanto en sus
textos, con el valor r (y algunas veces con el nivel de significacin), como en tablas especiales
(matrices de correlacin) que ilustran las correlaciones entre diversas variables.
Trminos clave
- Correccin por atenuacin. - Variable dependiente. - Correlacin positiva.
- Correlacin. - Direccin de causalidad. - Variable predictora.
- Coeficiente de correlacin (r). - Variable independiente. - Reduccin proporcional
- Matriz de correlacin. - Correlacin lineal. del error (r2).
- Producto cruzado de puntuaciones Z. - Correlacin negativa. - Restriccin de rango.
- Correlacin curvilnea. - Correlacin nula. - Diagrama de dispersin.
- Grado de correlacin. - Correlacin perfecta. - Significacin estadstica.
SERIE 1
Realice las siguientes tareas para los ejer- 2, Un instructor pregunt a cinco alumnos
cicios 1 y 2; a) Confeccione un diagrama de cuntas horas haban estudiado para un exa-
dispersin con las puntuaciones originales; b) men. A continuacin se detalla la cantidad de
describa con palabras el patrn general de co- horas de estudio y sus calificaciones.
de depresin de las mujeres en la primera y
H o r a s d e estu d io C a lifica ci n en la p ru eb a
en la segunda entrevista.
0 52 Explique los resultados de las medidas co-
10 95
mo si estuviera escribiendo para una persona
83
8 71 que nunca ha asistido a un curso de estadstica.
6 64 Especficamente, a) explique qu significa un
coeficiente de correlacin, utilizando una de
3, En un estudio realizado a personas que
las correlaciones como ejemplo; b) analice la
recin se conocan, se midi el nivel de extra- tabla y Juego comente los patrones de los re-
versin de uno de los integrantes de la pareja y sultados, indicando las variables que presentan
el aprecio del otro integrante de la pareja por el una correlacin relativamente fuerte y las que
primero. Estos son los resultados: no, y c) comente las limitaciones que deben te-
nerse en cuenta al sacar conclusiones sobre
E x tr a v er si n d e u n o A p recio p or causalidad sobre la base de esta informacin,
de los in teg r a n tes ese in teg ra n te utilizando como ejemplo una correlacin espe-
P u n tu a c i n P u n tu a c i n P u n tu a c i n P u n tu a c i n cfica (nombre al menos una direccin de cau-
o r ig in a l Z o r ig in a l Z salidad alternativa posible y explique por qu
18 0,37 8 1,10 esa alternativa es posible).
17 0,17 9 1,47 5. Para cada una de las siguientes situacio-
20 0 ,8 0 6 0,37
nes, indique por qu el coeficiente de correla-
8 - 1 ,7 2 1 -1 ,4 7
13 - 0 ,6 7 7 0,74
cin podra ser una estimacin distorsionada
24 1,63 1 -1 ,4 7 de la correlacin real (y qu clase de distorsin
11 - 1 ,0 9 3 -0 ,7 4 esperara):
12 -0 ,8 8 5 0 ,0 0 a) Puntuaciones en dos cuestionarios de
18 0,38 7 0,74 medicin de personalidad estn correlacionados.
21 1,00 3 -0 ,7 4
b) La calidad de vida y la felicidad de un
En este ejercicio damos las puntuaciones Z pa- grupo de millonarios estn correlacionadas.
ra ahorrar tiempo de clculo, a) Construya un 6 . La siguiente informacin ha sido pre-
diagrama de dispersin de las puntuaciones parada de forma tal que las series de datos B
originales; b) describa con palabras el patrn hasta D sean versiones levemente modificadas
de la serie A. Confeccione diagramas de dis-
general de la asociacin, si existe, y c) calcule
persin y calcule los coeficientes de correla-
el coeficiente de correlacin.
cin de cada serie de datos (slo damos la
4. Chapman, Hobfoll y Ritter (1997) en-
solucin de las seres A y B).
trevistaron dos veces durante el embarazo a
68 mujeres de una zona cntrica y superpo-
S e r ie A S e r ie B S e r ie C S e r ie D
blada de una ciudad y a sus maridos (o no-
vios); la primera vez, entre el tercer y sexto X Y X Y X Y X Y
mes de embarazo, y la siguiente vez, entre el i 1 1 l 1 5 1 1
sexto y el noveno mes de embarazo. La tabla 2 2 2 2 2 2 2 4
3 3 3 3 3 3 3 3
3-10 muestra las correlaciones entre varias de
4 4 4 5 4 4 4 2
las medidas. Lo ms importante en esta tabla
5 5 5 4 5 1 5 5
es la correlacin entre lo que las mujeres in-
formaban sobre su propio estrs, lo que los 7. Un investigador est interesado en ave-
hombres informaban sobre el estrs de sus riguar si un nuevo medicamento produce algn
compaeras, la percepcin de las mujeres so- efecto en caso de resfro. Ocho personas son
bre el apoyo brindado por sus parejas en la analizadas: cuatro toman el medicamento y
primera y en la segunda entrevista y el nivel cuatro no (las que lo toman son calificadas con
un l t las que no, con un 0) y luego se registra si que nunca asisti a un curso de estadstica (pe-
se resfran (calificacin 1) o no (calificacin ro que s comprende qu es la media, el desvo
0). A continuacin aparecen cuatro resultados estndar y las puntuaciones Z), y e) indique
posibles. Calcule el coeficiente de correlacin tres direcciones de causalidad lgicam en-
en cada caso (slo damos la solucin para las te posibles, explicando en cada caso si es una
posibilidades A y B). direccin razonable de la correlacin segn las
variables involucradas (y por qu?).
P o s ib ilid a d P o s ib ilid a d P o s ib ilid a d P o s ib ilid a d 1. Se entrega a cuatro individuos una prue-
A B C D
ba de habilidad manual (los valores altos signi-
Toma Se Toma Se Toma S e Toma S e fican mayor habilidad) y una prueba de ansiedad
M ed. resfra M ed. resfra M e d , resfra M ed. resfra
(los valores altos implican mayor ansiedad).
0 1 0 1 0 1 0 1
0 1 0 i 0 1 0 1 Los valores observados de los cuatro individuos
0 1 0 1 0 0 0 1 son los siguientes:
0 1 0 0 0 0 0 0
1 0 3 1 1 1 1 0
1 0 1 0 1 1 1 0 P erso n a H a b ilid a d A n s ie d a d
1 0 1 0 1 0 1 0 1 1 10
1 0 1 0 0 1 0
2 1 8
3 2 4
SERIE II 4 4 ~2
T a b la 3 - 1 0 .
C o r r e l a c i o n e s d e o r d e n c e r o d e l a s v a r i a b l e s d e l e s t u d io .
Variable 1 2 3 4 5 6 7 S
I.Estrs informado por mujeres _
8. Origen tnico de las mujeres -0,19 -0,09 -0,16 0,14 0,11 0,13 - 0,02
9, Estado civil de las mujeres -0,18 0,01 0,12 0,24* -0,04 - 0,20 0,05 -0,34**
10. Paridad 0,19 0,13 - 0,11 -0,17 OJO 0,16 0,26* 0,31*
*p < 0,05; **p < 0,Q t, ***< 0,001.
Fuente: Chapman, H, A., Hobfoll, S. B., & Ritter, C. (1997), tab. 2. El hecho de que el compaero subestime el estrs
sufrido por ellas provoca angustia en las mujeres: estudio sobre mujeres embarazadas de zonas cntricas y superpobla-
das de la ciudad. P e r i d ic o s o b r e P s ic o lo g a S o c ia l y d e P e r s o n a lid a d { J o u r n a l o f P e r s o n a l i t y a n d S o c ia l P s y c h o l o g y ] ,
73, 418-425. Copyright, 1997, por la Asociacin Americana de Psicologa [American Psychoogical Association],
Reimpreso con autorizacin.
C a n tid a d d e C alificacin R e g istro s en
N m ero C a n tid a d sem a n a l accion es N i o p o r p rolijid ad p r u e b a d e n v
d e c d ig o (h o ra s) de T V v io len ta s o agresivas
X zx X Zy
d e lo s n i o s vio len ta s h a c ia c o m p a ero s
Janet 18 0 ,5 2 60 - 0 ,6 6
G 3368 14 9 Gareth 24 1,43 58 -1 ,0 9
R 8 904 8 Grove 14 1,82 70 1,47
C 9890 6 Kevin 19 0 ,2 0 58 - 1 ,0 9
L 87 2 2 12 8 Joshua 20 0,13 66 0,62
N ic o le 23 1,11 68 1,04
En los ejercicios 3 y 4, a) construya un diagra- Susan 20 0,13 65 0 ,4 0
22 0,78 68 1,04
ma de dispersin de las puntuaciones origina- D rew
M arie 15 1,50 56 -1 ,5 1
les; b) describa con palabras el patrn general Chad 21 0 ,4 6 62 - 0 ,2 3
de correlacin, si existe, y c) calcule el coefi-
ciente de correlacin. En los dos ejercicios da- 5. Como parte de un estudio ms amplio,
mos las puntuaciones Z para ahorrarle tiempo. Speed y Gangestad (1997) obtuvieron califi-
3. Supongamos que el Museo de Louvre caciones y nominaciones sobre diversas carac-
tersticas de 66 hombres de una fraternidad,
est interesado en la relacin entre la antige-
otorgadas por sus compaeros de fraternidad. El
dad de una pintura y el inters del publico en siguiente prrafo fue tomado de la seccin de re-
esa pintura. Durante una semana se controla la sultados del estudio:
cantidad de personas que se detienen a obser-
var a cada una de las O pinturas elegidas ai L a popularidad romntica de los hombres e s-
taba significativam ente correlacionada con
azar. Los resultados son los siguientes:
varias caractersticas: mejor vestimenta (r =
0,48), mayor atractivo fsico ( r = 0,47), ms
C an tid ad sociabilidad (r 0,47), ms confianza en s
A n tig ed a d d e p erson as m ism o ( r ~ 0,44), m ejor lder (r = 0,38), ms
T tu lo a p ro x im ad a q u e se detien en divertido ( r - 0,37), ms satisfecho ( r ~ 0,32)
d e la p in tu r a (a o s) a o b serv a rla y m as independiente ( r = 0 ,2 8 ). Sin embargo,
inesperadamente, e l potencial de los hombres
X z* X Zy
en relacin con e l xito financiero no estaba
El Entierro 465 1.39 68 -0 ,6 9 significativam ente correlacionado con su po-
M ys Mar Ste Catherine 515 1,71 71 0,59
pularidad romntica (r - 0,10). (p. 931).
Las Baistas 240 - 0 ,0 9 123 1,19
E l T oilette 107 0,96 Explique los resultados como si estuviera escri-
112 0 ,8 2
Retrato de Castiglione 376 0,80 biendo para una persona que nunca ha asistido
48 -1 ,3 8
Carlos I de Inglaterra 355 0,67 84 0,14
a un curso de estadstica. Especficamente, a)
Crispin y Scapiti 140 -0 ,7 5 66 - 0 ,7 6
explique qu significa un coeficiente de corre-
D esnudo al Sol 115 0,91 148 2,05
lacin utilizando una de las correlaciones como
E l B alcn 122 -0 ,8 6 71 0,59
E l Circo 99 -1 ,0 1
ejemplo; b) explique, qu significa significati-
91 0 ,1 0
vamente" y no significativamente", en gene-
ral, refirindose al menos a un ejemplo espec-
fico y c) especule sobre el significado del pa-
4. Un maestro de escuela crey notar que
trn de los resultados, teniendo en cuenta el te-
los alumnos que se vestan ms prolijamente
ma de la direccin de causalidad.
eran, en lneas generales, mejores estudiantes. 6 . Seleccione arbitrariamente ocho nom-
Para probar est idea, el maestro hizo que un bres personales completos, de ocho hojas dife-
amigo calificara a cada uno de los alumnos rentes de la gua telefnica. Confeccione un
segn su prolijidad en el vestir. A continua-, diagrama de dispersin y calcule el coeficiente
cin detallamos las calificaciones por proliji- de correlacin entre la cantidad de letras en el
dad, junto con las calificaciones de los alumnos primer nombre y en el apellido. Describa el re-
en una prueba estandarizada de rendimiento sultado con palabras y sugiera una posible in-
escolar. terpretacin de sus resultados.
APNDICE I DEL CAPTULO: FRMULA DE CLCULO OPTATIVA DEL
COEFICIENTE DE CORRELACIN
Los pasos para calcular un coeficiente de correlacin pueden combinarse en una sola frmula pa-
ra realizar clculos a mano (o con una calculadora) en un estudio con gran cantidad de participan-
tes. Comnmente, los pasos para calcular una correlacin son: calcular a) las puntuaciones Z de
cada puntuacin original, b) los productos cruzados de las puntuaciones Z y c) el promedio de los
productos cruzados de las puntuaciones Z. (El alumno habr notado, ai realizarlos ejercicios, que
calcular las puntuaciones Z es particularmente tedioso cuando se trabaja a mano, especialmente si
primero es necesario calcular las medias y los desvos estndares). Con un poco de manipulacin
algebraica, la frmula puede transformarse en la que se indica a continuacin, (Aunque parezca
terrible, resulta realmente ms sencilla para aplicar en un estudio rea] con grandes cantidades de
participantes que si tuvieran que calcularse los resultados a mano).
jv s x r-(x x )(x r)
r
(3-2)
Cuando se utiliza este procedimiento resulta til organizar los datos en un cuadro de cinco colum-
nas, formado por las columnas X, X2, 7, Y2, y los productos cruzados de XY. Cabe destacar que no
se mencionan las puntuaciones Z, y que los productos cruzados se calculan directamente sobre la
base de puntuaciones originales. Adems, tal como lo recordamos en el apndice del captulo 2,
IX 2 se logra tomando cada valor X y elevndolo al cuadrado, y luego sumando estos cuadrados;
por el contrario, (YX)2 se logra sumando todos los valores X (sin elevar al cuadrado ninguno de
ellos), y luego elevando el total al cuadrado.
La tabla 3-11 muestra el clculo correspondiente al ejemplo del estrs de los gerentes utili-
zando esta frmula. Comprela con la tabla 3-2.
(3-3)
Tabla 3-11.
C m p u to s d e l c o e fic ie n te d e c o r r e la c i n d e l e s tu d io s o b r e e l e str s d e lo s g e r e n te s , r e a liz a d o s c o n la
f r m u la d e c lc u lo (d a to s fic tic io s ).
w xxr- ( 2 X )(X y)
U Z X * - (XXX ] [V iv x r - ( X f ) 1 ]
(5X 237)
- (35X 30)
1.185 - 1.050
r ~ ------------------------------------------------------------------------------
(V 1.365 - 1 .2 2 5 }
(7 W )C f 0 ) ( 11,83 ) ( 1 3 3 )4 ) 154,26
Adems, queremos destacar que las pruebas de significacin de una correlacin, como por ejem-
plo una prueba t, pueden ser de una o dos colas. Una prueba de una cola significa que el investiga-
dor ha predicho el signo (positivo o negativo) de la correlacin2.
Los supuestos de las pruebas de significacin de un coeficiente de correlacin son algo com-
plejos. Comnmente, ambas variables deberan estar normalmente distribuidas. Adems, la dis-
tribucin de cada variable, condicionada por cada valor de la otra variable, debera tener
aproximadamente la misma varianza. Sin embargo, como ocurre con la prueba t y el anlisis de
varianza, los incumplimientos moderados de estos supuestos no son fatales.
A continuacin presentamos un ejemplo utilizando el estudio del estrs de los gerentes. Su-
pondremos que los investigadores predijeron una correlacin positiva entre la cantidad de em-
pleados supervisados y el estrs, la que ser probada a nivel 0,05.
1. Reformule el problema en forma de hiptesis de investigacin e hiptesis nula acerca de
las poblaciones. Las poblaciones de inters son las siguientes:
Poblacin 1; gerentes como los analizados en este estudio.
Poblacin 2: gerentes para los cuales no existe correlacin entre cantidad de empleados su
pervisados y estrs.
2 Dunlap y Myers (1997) encuentran un modo ms corto de descubrir la significacin de un coeficiente de correlacin.
Sucede que e l r necesario para una significacin de nivel 0,05 (dos colas) es muy aproximado a 2 fyN . Por ejemplo, pa-
ra N ~ 5, necesitaramos una correlacin de 0,89 (2/^/5= 2/2,24 = 0,89). Dunlop y Myers tambin nos brindan una ma-
nera ms corta para lograr una aproximacin a la cantidad de participantes necesarios para un poder de entre un 80% y
90%. El tamao de muestra necesario es simplemente 8 dividido r2. Por ejemplo, utilizando esta frmula, para r - 0,10,
la cantidad de participantes necesaria es 8 /0 ,102, es decir, 800.
La hiptesis nula establece que las dos poblaciones tienen la misma correlacin. La hiptesis de
investigacin establece que la poblacin 1 tiene una correlacin mayor que la poblacin 2. (Es de-
cir, la prediccin es que la correlacin de la poblacin es mayor a 0).
2. Determine las caractersticas de la distribucin comparativa. Suponiendo que se cumplen
los supuestos (en la prctica, con slo cinco casos sera difcil de determinar), la distribucin
comparativa es una distribucin t con gl = 3. (Es decir, gl = N - 2 = 5 - 2 = 3).
3. Determine el punto crtico en la distribucin comparativa, en el cual la hiptesis nula debe-
ra ser rechazada. La tabla (tabla B-2 del apndice B) muestra que para una prueba de una cola a
nivel 0,05, con 3 grados de libertad, necesitamos una t de al menos 2,353.
4. Determine el valor del estadstico de prueba. Calculamos una correlacin de r ~ 0,88 y
iV= 5. Aplicando la frmula para encontrar el t equivalente, obtenemos:
T a b la 3 - 1 3 .
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e -
Tabla 3-12. s a r i o s p a r a lo g r a r u n 8 0 % d e p o t e n c i a e n u n
P o te n c ia a p r o x im a d a d e e st u d io s q u e u t iliz a n e l e s t u d io q u e u t iliz a e l c o e f ic ie n te d e c o r r e la -
c o e f i c i e n t e d e c o r r e l a c i n (r ) p a r a p r u e b a s d e h i p - c i n (r ) p a r a p r o b a r u n a h i p t e s i s c o n n i v e l
t e s is c o n n iv e l d e s i g n i f i c a c i n d e 0 , 0 5 . d e s i g n i f i c a c i n d e 0 ,0 5 .
T a m a o d el efecto T a m a o d e l e fe c to
Pequeo M e d ia n o G ran de P equeo M e d ia n o G ra n d e
(r ~ 0 ,1 0 ) (r = 0 ,3 0 ) ( r ss 0 ,5 0 ) ( r := 0 ,1 0 ) (r -0 ,3 0 ) ( r = 0 ,5 0
D o s colas D o s colas 783 85 28
Total N: 10 0 ,0 6 0,13 0,33 U na cola 617 68 22
20 0,07 0,25 0,64
30 0,08 0,37 0,83
40 0,09 0 ,48 0,92
50 0,11 0 ,5 7 0,97
100 0,17 0,86 1
U na cola
Total N ; 10 0,08 0 ,22 0,4 6
20 0,11 0 ,3 7 0,75
30 0,13 0,50 0,9 0
40 0,15 0,6 0 0,9 6
50 0,1 7 0,69 0,98
100 0,26 0,9 2
aCasi 1,00.