Documentos de Académico
Documentos de Profesional
Documentos de Cultura
desvío estándar
D escrip ción del cap ítu lo
► Medía. ► Resumen,
► Medidas alternativas de la tendencia. ► Términos clave.
■ / central. ■- • ^ Ejercicios.
► Varianza y desvío estándar. ► Apéndice del capítulo: fórmulas
► Puntuaciones Z. _ optativas para el cálculo de la
► Controversias y limitaciones: la tiranía varianza y el desvío estándar.
_• v de la media.:••V ■.•’¿V> )VV( V\ ■ V. . V: •-.:j. V:
► la media y el desvío estándar según se
i describen en publicaciones científicas.
C
cilmente comprensibles un grupo de observaciones. Hemos visto algunas formas de
lograr esa comprensión a través de tablas y gráficos. Es este capítulo, considerare
mos las principales técnicas estadísticas para describir un grupo de observaciones
utilizando ciertos números. Estos números son: la media, la varianza, el desvío es
tándar y las puntuaciones Z. La media es el promedio. La varianza y el desvío estándar describen
el grado de variación de las observaciones. Una puntuación Z describe la desviación de una ob
servación en particular respecto del promedio.
MEDIA
Comúnmente, el mejor número para describir un grupo de observaciones es el promedio normal,
es decir, la suma de todas las observaciones dividida por la cantidad de observaciones. En estadís
tica, ese promedio se denomina media. A veces se dice que el promedio o media de un grupo de
registros muestra la tendencia central o el valor típico o representativo de un grupo de observa
ciones. Más adelante Veremos que existen otras formas, además de la media, para describir la ten
dencia central de un grupo de observaciones.
Supongamos que una psicoterapeuta observó cuántas sesiones habían tardado sus últimos 10
pacientes en completar una terapia breve. Las cantidades de sesiones eran las siguientes:
7,8,8,7, 3,1,6,9,3,8
La media de las 10 observaciones anteriores es 6 (la suma de 60 sesiones dividida por 10 pa
cientes), Es decir, en promedio, los últimos 10 pacientes de la terapeuta habían asistido a 6 sesio
nes. Así, la información referida a los 10 pacientes se resume sólo en este número.
A muchos estudiantes les resulta útil visualizar la media como una especie de punto de equilibrio de la
distribución de observaciones. Intentemos visualizar una tabla en equilibrio sobre un tronco, como un
Figura 2-1. Media de ia distribución de cantidad de se
siones de terapia realizadas según un ejemplo ficticio,
ilustrada a través de una analogía con cubos apoyados
encima de una tabla en equilibrio sobre un tronco.
sube y baja rudimentario. Imaginemos pilas de cubos distribuidos a lo largo de la tabla según los valo
res que representan, es decir, un cubo para cada observación de la distribución. (La figura resultante es
similar a un histograma construido con cubos). La medía sería el punto de la tabla donde el peso de los
cubos se equilibra perfectamente. La figura 2-1 representa lo antedicho utilizando e! ejemplo de la
cantidad de sesiones a las que asistieron los 10 pacientes de nuestra terapeuta imaginaria.
La figura 2-2 muestra algunos otros ejemplos. Cabe destacar, que ni siquiera es necesario que
haya un cubo exactamente en el punto de equilibrio. Es decir, la media no necesariamente debe
corresponder a una observación real en la distribución. La media es simplemente el promedio de
las observaciones, el punto de equilibrio. La media incluso podría ser un número cuya aparición
en la distribución fuera imposible, como en el caso de una media representada por un número de
cimal cuando todos los números en la distribución deben ser números enteros (2,3 niños, por
ejemplo), Otra característica es que los cubos pueden estar muy separados o muy juntos y que no
necesiten estar distribuidos en forma pareja. En cualquiera de esos casos, aun es posible encontrar
un punto de equilibrio. (Cabe mencionar que esta analogía, que utiliza cubos en equilibrio encima
de una tabla apoyada sobre un tronco, funcionaría en la realidad sólo si la tabla no tuviera peso).
JX (2- 1)
M=
N
Figura 2-2. Medias de varias distribuciones ficticias ilustradas utilizando la analogía de los cubos apoyados
encima de una tabla en equilibrio sobre un tronco.
M es un símbolo que representa la media. (Más adelante aprenderemos otro símbolo para repre
sentar la media, la letra griega ¡i, “mu”, que se utiliza en circunstancias particulares. También es
bastante utilizado un tercer símbolo, X, a veces denominado X-raya).
X, la letra griega mayúscula “sigma,” es el símbolo que representa la “suma de”; significa
“suma de todas las cantidades siguientes”. Es el símbolo aritmético especial más comúnmente
utilizado en estadística.
La X se refiere a las observaciones en la distribución de la variable X. Podríamos haber elegi
do cualquier otra letra. Sin embargo, cuando existe sólo una distribución, generalmente se la de
nomina X. En capítulos posteriores veremos situaciones en las que se analizan dos distribuciones
al mismo tiempo. En ese caso, se utiliza una segunda letra, generalmente la Y. Otra alternativa es
utilizar subíndices, como por ejemplo X l y X2. En el caso de un tratamiento matemático más for
mal de la estadística, ios símbolos utilizados en varias fórmulas son aún más complejos. Es preci
samente esa complejidad la que permite que las fórmulas representen casos complicados sin
confusión. Sin embargo, los libros de estadística para psicólogos, aun los textos más avanzados,
utilizan símbolos simples. La forma más simple rara vez crea ambigüedad en las fórmulas esta
dísticas que utilizan los psicólogos.
XX significa “la suma de X”. índica que se deben sumar todos los valores observados de la dis
tribución de la variable X. Supongamos que X se refiere a la cantidad de sesiones de terapia en la dis
tribución de nuestro ejemplo. XX sería igual a 60, la suma de 7 + 8 + 8 + 7 + 3 4 -1 + 0 + 9 + 3 + 8.
N es un número. Se utiliza en estadística para indicar la cantidad de observaciones de una dis
tribución. En nuestro ejemplo existen 10 observaciones, por lo tanto, N es igual a 10.
Resumiendo, la fórmula indica dividir la suma de todas las observaciones de la distribución
de la variable X por la cantidad total de observaciones M En nuestro ejemplo, significa que debe
mos dividir 60 por 10. La fórmula sería la siguiente;
XX 60
M= =6
N 10
XX 975
M= = 6,46
M 151
La fórmula nos indica que la puntuación promedio de estrés en la escala de 10 puntos fue de 6,46
(redondeando). Esta cifra se encuentra claramente por encima del punto medio de la escala. El
ejemplo también puede representarse gráficamente. Consideremos otra vez el histograma como
una pila de cubos encima de una tabla, y la media 6,46 como el punto en el que la tabla se equili
bra sobre el fulcro que tiene debajo, (véase figura 2-3). Este único número simplifica enorme
mente la información délas 151 puntuaciones de estrés.
De modo similar, analicemos el ejemplo de las interacciones sociales de los alumnos
(McLaughlin-Volpe et al., 1998). Las cantidades de interacciones de ios 94 alumnos durante una
semana fueron las siguientes:
48,15,33,3,21,19,17,16,44,25,30,3, 5,9,35,32,26,13,14,14,47,47,29,18,11, 5,19,24,17,
6,25,8,18,29,1,18,22,3,22,29,2,6,10,29,10,21,38, 41,16,17, 8,40,8,10,18, 7,4,4, 8, 11,
3,23,10,19,21,13,12,10,4,17,11,21, 9 , 8,7, 5, 3,22, 14,25,4,11,10, 18,1, 28,27, 19, 24, 35,
9,30,8,26
La tabla de frecuencias, la tabla de frecuencias agrupadas, el histograma y el polígono de frecuen
cias que construimos en el capítulo 1 simplificaron considerablemente la visualización de los da
tos. Pero incluso, después de todo ese proceso también sería útil obtener un resumen de un sólo
número. Por lo tanto, podemos calcular la media en la forma usual. En este caso:
1.635
= 17,40
94
Es decir, si sumamos las cantidades de interacciones de los 94 alumnos, la “suma de X ' da 1.635.
Al dividir este número por la cantidad de observaciones, obtenemos una media de interacciones
de 17,40. La figura 2-4 gráfica este caso.
M = 755
N 100
La figura 2-5 representa este caso gráficamente.
• / * ¥ Media ¿ 7 .
5 6 • 7. ; 8 9 10 •-
sa de que las mujeres prefieran tener sólo una pareja estable, debido a que una mujer sólo puede
tener una pequeña cantidad de hijos durante su vida, y es más probable que los genes de la mujer
sobrevivan si esos pocos hijos son bien cuidados. Los hombres, sin embargo, pueden tener una
gran cantidad de hijos durante su vida; por eso, según la misma teoría, para ellos lo mejor es una
postura semejante al disparo de escopeta. Si tienen muchas parejas es más probable que sus genes
sobrevivan. Coherentemente con esta presunción, los psicólogos evolucionistas descubrieron que
los hombres expresaban necesitar muchas más parejas que las mujeres.
Otros teóricos (p.ej., Milier & Fishkin, 1998), sin embargo, han cuestionado esta visión. Sos
tienen que hombres y mujeres preferirían aproximadamente la misma cantidad de parejas debido
a que los individuos que tienen una predisposición básica a buscar un lazo íntimo fuerte son los
que tienen las mayores probabilidades de sobrevivir a la niñez, y que este deseo de lazos fuertes
perdura (y tiene otros beneficios) en la etapa adulta. Los mismos investigadores también pregun
taron a mujeres y hombres cuántas parejas necesitaban, y ios resultados mostraron la misma dife
rencia en cuanto a las medias; los hombres necesitaban un promedio de 64,32 y las mujeres un
promedio de 2,79. Sin embargo, la escena cambia drásticamente si observamos la mediana o la
moda (véase tabla 2-1). La figura 2-9, tomada directamente de la publicación preparada por los
investigadores, nos explica la situación. La mayoría de las mujeres y los hombres desean sólo una
pareja; unos pocos desean más de una, y síganos desean muchas más. La gran diferencia reside
en que hay muchos más hombres dentro del pequeño grupo que desea muchas más parejas. (Los
valores observados más extremos estaban tan alejados -los hombres que deseaban más de 100 pa
rejas-, que ios investigadores ni siquiera los incluyeron al calcular las medias).
Por lo tanto, ¿cuál de las dos teorías es la correcta? Tal vez uno podría sostener cualquiera de
las dos formas para analizar esta información. La verdad es que concentrarse sólo en la media, en
este caso, desfigura drásticamente la realidad de la distribución.
Tabla 2-1.
Respuestas de 106 hombres y 160 mujeres a la pregunta: “¿Cuántas parejas desearía tener en los
próximos 30 años?”
M ed ia M ed ia n a M od a
M ujeres 2,8 1 1
Hom bres 64,3 1 1
Sin embargo, a menos que existan valores extremos, los psicólogos casi siempre utilizan la media
como medida de la tendencia central. En realidad, la media cumple la función de piedra angular
para la mayoría de las otras técnicas estadísticas.
Varianza
La varianza de un grupo de observaciones indica la dispersión de esos valores alrededor de la
medía. Para ser más precisos, la varianza es el promedio de los cuadrados de la diferencia entre
cada observación y la media. A continuación, detallamos los pasos para calcular la varianza;
1 Esta sección está dedicada a la varianza y al desvío estándar com o indicadores de dispersión. Existe otra forma de des
cribir la dispersión de un grupo de observaciones, la am plitud, e l registro mayor menos el registro menor. Supongamos
que en una clase en particular el registro más alto en un examen parcial es 98 y el menor es 60; la amplitud es 38 (es de
cir 98 - 6 0 = 38). La amplitud rara vez es utilizada por investigadores psicológicos ya que se trata de un medio muy bur
do de describir la dispersión. Es burdo debido a que no tiene en cuenta la distancia entre las observaciones dentro de la
distribución.
Figura 2 -1 0 .
E jem p lo s d e d istrib u cio n es c o n (a) la m ism a m ed ia con d iferen tes grados d e d isp e r sió n y (b)
diferentes m ed ias co n e l m ism o grado d e d ispersión .
1. Restar la media a cada observación para obtener el desvío de cada una de ellos. El desvío
indica la distancia entre la observación en cuestión y la media.
2. Elevar cada uno de los desvíos al cuadrado (multiplicar cada uno de ellos por sí mismo). Se
obtiene así el desvío cuadrático de cada registro.
3. Sumar los desvíos cuadráticos. El total logrado con este cálculo se denomina suma de los
cuadrados.
4. Dividir la suma de los cuadrados por la cantidad de desvíos cuadráticos (es decir, por la
cantidad de observaciones), Se obtiene así el promedio o media de desvíos cuadráticos, es decir,
la varianza.
Aunque este procedimiento pueda parecer un poco extraño o difícil de recordar al principio,
en verdad funciona muy bien. Supongamos que una distribución es más dispersa que otra. La dis
tribución con mayor dispersión presenta una varianza mayor porque la misma dispersión hace
que los desvíos sean mayores. Si los desvíos son mayores, los desvíos cuadráticos también lo son
y, por lo tanto, también la varianza.
En el ejemplo de la clase en la que todos tenían 38 años de edad, la varianza sería exactamen
te 0. Es decir, no habría varianza. (En términos numéricos, el desvío de cada persona sería
38 *- 38 - 0; 0 al cuadrado es 0. El promedio de 0 es 0). Por el contrario, la clase con la mitad de
los alumnos de 18 años de edad y la otra mitad de 58 años de edad tendría una varianza bastante
alta, es decir, 400. (Los alumnos de 18 años de edad tendrían cada uno un desvío de 18 - 38 =-20,
Los alumnos de 58 años de edad tendrían desvíos de 58 - 38 = 20. En ambos casos, los desvíos
cuadráticos, tanto -20 al cuadrado como 20 al cuadrado, darían como resultado 400. Y, cuando to
dos ios números son 400, el promedio es 400).
La varianza es importante en muchos otros procedimientos estadísticos (incluso en la mayoría de
los temas tratados en la segunda mitad de este libro). Sin embargo, la varianza se utiliza sólo ocasio
nalmente como estadística descriptiva, debido a que está basada en desvíos cuadráticos, y los desvíos
cuadráticos no transmiten claramente la dispersión de las observaciones. Son verdaderos
desvíos o son no cuadráticos. Por ejemplo, queda claro que una clase con una varianza de 400 pre
senta una distribución mucho más dispersa que otra cuya varianza es 200. Sin embargo, el número
400 no refleja con claridad la variación real entre las edades, ninguna de las cuales se acerca a 400.2
Desvío estándar
La estadística más ampliamente utilizada para describir la dispersión de una distribución es el
desvío estándar. El desvío estándar es la raíz cuadrada positiva de la varianza: para encontrar
el desvío estándar, primero es necesario calcular la varianza y luego sacar su raíz cuadrada. Si la
varianza de una distribución es 400, el desvío estándar es 20; si la varianza es 9, el desvío estándar
es 3, y si la varianza es 100, el desvío estándar es 10.
La varianza se basa en los desvíos de la medía, al cuadrado. Por lo tanto, su raíz cuadrada, el
desvío estándar, se basa en la distancia simple, no elevada al cuadrado, de la media. Sin entrar en
detalles, el desvío estándar es e! promedio de las diferencias entre las observaciones y la media.
Por ejemplo, analicemos una clase donde las edades presentan un desvío estándar de 20 años. Esto
nos indicaría que las edades se dispersan, en promedio, aproximadamente 20 años en cada dirección
a partir de la media. Conocer el desvío estándar ofrece una idea general del grado de dispersión.
Daremos otro ejemplo. La distribución de la cantidad de hijos por familia en un país en par
ticular podría tener una media de 4 y un desvío estándar de L Significaría que, por cada familia
con exactamente cuatro hijos (desvío 0 de la media), bien podríamos encontrar una con seis o dos
hijos (desvío de 2 hijos de la media). Sin embargo, podría no funcionar de esa forma. Podría ser
que la mitad de las familias tuvieran exactamente 5 y la otra mitad exactamente 3. O podría ser
que la mayoría tuviera 4, pero unas pocas no tuvieran ninguno y otras pocas tuvieran 8 (véase fi
gura 2- 11). No obstante, conocer el desvío estándar brinda una noción general del grado de dis
persión, aun cuando no indique la forma precisa de distribución.
El desvío estándar no es exactamente el promedio de las diferencias entre las observaciones
y la media. Para ser precisos, el desvío estándar es la raíz cuadrada del promedio de los desvíos
cuadráticos de la media, Elevar los desvíos al cuadrado, promediarlos, y luego calcular la raíz
cuadrada, da un resultado ligeramente diferente al simple promedio de los desvíos de los registros
con respecto a la media, Aun así, el resultado de este procedimiento tiene ventajas técnicas que
superan la ligera desventaja de dar sólo una descripción aproximada de la variación promedio con
respecto a la media (véase nota al pie N° 2).
2 El alumno seguramente se estará preguntando por qué ios estadísticos no trabajan sólo con los desvíos, simplemente
haciendo que todos ios desvíos sean positivos, y utilizando sus promedios. En realidad, en el pasado, ese era ei procedi
miento. El promedio de los desvíos (tratando a todos los desvíos com o positivos) se denomina desvío prom edio o des
vío m edio, En efecto, algunos psicólogos han hecho resurgir esta cuestión observando algunas ventajas sutiles del
desvío promedio (Catanzaro &TayIor, 1996), Sin embargo, a pesar de su simplicidad conceptual y de cálculo, ei desvío
promedio no funciona muy bien como parte de procedimientos estadísticos más complejos, debido a que resulta difícil
realizar manipulaciones algebraicas con una fórmula que ignora los signos de algunos de sus números.
F ig u r a 2 -1 1 . R ep resen ta ció n gráfica d e varias p o sib le s d istrib u cion es d e un e je m p lo fic tic io d e c o m p o s i
c ió n fa m ilia r e n e l q u e la m e d ia e s 4 y e l d e sv ío estándar e s 1.
SD2 ~ (2-2)
M
SD2 es el símbolo de varianza. (Más adelante aprenderemos sus otros símbolos, S1 y o 1, la letra
griega “sigma” minúscula al cuadrado. Los diferentes símbolos corresponden a diferentes cir
cunstancias en las que se utiliza la varianza y, en algunos casos, incluso a cálculos ligeramente di
ferentes).
SD es la abreviatura de desvío estándar; recalca que la varianza es el desvío estándar ele
vado al cuadrado. La parte superior de la fórmula describe la suma de los desvíos cuadráticos.
X se refiere a cada observación en la distribución. M es la media. Por lo tanto, X - M es la ob
servación menos la inedia, es decir, el desvío. El índice sobrescrito 2 indica que se debe elevar
el desvío a! cuadrado. Finalmente, el signo de suma (X) indica que se deben sumar todos los
desvíos cuadráticos.
La suma de los cuadrados es un cálculo importante en muchos procedimientos estadísticos;
por lo tanto, tiene su propio símbolo, SS. Por esta razón, algunas veces la fórmula de la varianza
se escribe utilizando este símbolo en el numerador, en lugar de £ (X - M)2:
SD 2 = — (2-3)
N
Ya sea que se utilice el símbolo simplificado SS o la descripción completa de la suma de cuadra
dos, la parte inferior de la fórmula es simplemente N, la cantidad de observaciones. Es decir, la
fórmula indica dividir la suma de cuadrados por la cantidad de desvíos cuadráticos (la cantidad de
observaciones en la distribución).
El desvío estándar es la raíz cuadrada de la varianza. De modo tal que si se conoce la varian
za, la fórmula es simplemente:
sd ~ 4 si ? (2"4)
La fórmula del desvío estándar comenzando desde el principio es la raíz cuadrada del cálculo de
la varianza:
cn = fi(X -M )2 (2-5)
N
( 2- 6)
primeras y últimas observaciones para ahorrar espacio). En términos aproximados, el tiempo pro
medio que tarda un participante en leer una oración ambigua varía 0,142 segundos de la media de
2,755 segundos. La figura 2-Í3 representa los datos mencionados.
T abla 2 -3.
Cálculo de la varianza y el desvío estándar de la cantidad de interacciones sociales vividas por 94
estudiantes universitarios durante una semana.
C antidad de - m ed ia d e S3 D e sv ío
interacciones in tera ccion es D esv ío cu a d r á tic o
48 1 7 ,40 3 0 ,6 0 9 3 6 ,3 6
15 17,40 - 2 ,4 0 5,76
33 17,40 15,60 2 4 3 ,3 6
3 17,40 - 1 4 ,4 0 2 0 7 ,3 6
21 17,40 3,60 12,96
35 17,40 17,60 3 0 9 ,7 6
9 17,40 - 8 ,4 0 7 0 ,5 6
30 17,40 12,60 158,76
8 17,40 - 9 ,4 0 8 8,36
26 17,40 73,96.
2: 0,00 12,406,44
X (X -M )2 12.406,44
Varianza = S D 2 * - 1 3 1 ,9 8
N 94
T a b la 2 -4 .
C á lc u lo d e la v a r ia n z a y el d e s v ío e s tá n d a r e n u n e s t u d io fic tic io d e l tie m p o d e le c tu r a d e o r a c io n e s
a m b ig u a s .
V alor M ed ia D e sv ío
(tiem p o de lectu ra ) - (tiem p o d e lectu ra ) = D esvío c u a d r á tic o
2 ,7 2 2 ,7 5 5 - 0 ,0 3 5 0 ,0 0 1 2
2 ,8 4 2 ,7 5 5 0 ,0 8 5 0 ,0 0 7 2
2 ,6 3 2 ,7 5 5 - 0 ,1 2 5 0 ,0 1 5 6
2 ,5 1 2 ,7 5 5 - 0 ,2 4 5 0 ,0 6 0 0
2 ,5 4 2 ,7 5 5 - 0 ,2 1 5 0 ,0 4 6 2
2 ,9 8 2 ,7 5 5 0 ,2 2 5 0 ,0 5 0 6
2 ,5 2 2 ,7 5 5 - 0 ,2 3 5 0 ,0 5 5 2
2 ,6 6 2 ,7 5 5 - 0 ,0 9 5 0 ,0 0 9 0
2 ,7 4 2 ,7 5 5 - 0 ,0 1 5 0 ,0 0 0 2
2 ,7 3 2 ,7 5 5 - 0 ,0 2 5 0 ,0 0 0 6
2 ,8 8 2 ,7 5 5 0 ,1 2 5 0 ,0 1 5 6
2 ,8 5 2 ,7 5 5 0 .0 9 5 0 .0 0 9 0
X : 0 ,0 0 0 2 ,0 3 3 0
2 ( X ~ M ) 2 _ SS 2 ,0 3 3
Varianza - S D 2 - _ — = 0 ,0 2 0 3
100
D e sv ío estándar = S D = = V O 0203 = 0 ,142
F igura 2-13. Descripciones gráficas del
desvío estándar como la distancia a lo
largo de la base de un histograma, utili
zando el ejemplo referido al tiempo ne
cesario (en segundos) para leer oraciones
ambiguas (datos ficticios).
PUNTUACIONES Z
Hasta aquí hemos aprendido a describir una distribución de observaciones en función de la media
y la varianza. En esta sección, aprenderemos cómo describir una observación en particular según
el lugar que ocupe dentro del grupo de observaciones en conjunto. Es decir, aprenderemos a des
cribir una observación según la misma se encuentre sobre o debajo del promedio y según a qué
distancia hacia abajo o por encima del mismo esté ubicada.
Supongamos que nos informan que alguien llamado Alan tomó 9 sesiones con la psicotera-
peuta (la misma a la cual nos hemos referido en este capítulo). Supongamos también que desco
nocíamos la cantidad de sesiones tomadas por oíros pacientes con la misma terapeuta. En ese
caso, seria difícil decir si Alan asistió a muchas o pocas sesiones en relación con otros pacientes.
Sin embargo, supongamos que sí sabemos que la media es ó y el desvío estándar es 2,57. Con
esos datos, queda claro que Alan asistió a una cantidad de sesiones superior al promedio. También
podemos ver que la cantidad de sesiones en las que Alan se excedió del promedio (3 sesiones
más) era un poco más alta que la cantidad de sesiones en que los pacientes de la terapeuta general
mente varían con respecto al promedio. La figura 2-14 muestra el caso gráficamente.
Otros ejemplos
En la práctica, las puntuaciones Z tienen muchos usos. También son parte importante de muchos
de los procedimientos estadísticos que aprenderemos en lo que resta del libro. Es importante fa
miliarizarse con ellos.
Analicemos otro ejemplo. Supongamos que un psicólogo especializado en el desarrollo ob
servó a un niño de tres años, llamado Peter, en una situación estándar de laboratorio, mientras ju
gaba con otros niños de su edad. Durante la observación, el psicólogo controló la cantidad de
veces que Peter hablaba con los otros niños. El resultado, luego de varias observaciones, fue que
Peter habló con los otros niños aproximadamente 8 veces por hora de juego. Sin ningún patrón de
comparación, sería difícil sacar alguna conclusión a partir de esta información. Supongamos, sin
embargo, que se sabía, por investigaciones previas, que en similares condiciones la cantidad me
dia de veces que los niños hablan por hora de juego es 12, con un desvío estándar de 4. Con esa
información, ahora podemos ver que Peter habló con menos frecuencia que oíros niños en gene
ral, pero no con una frecuencia extremadamente menor. Peter tendría una puntuación Z de --1 (si
M = 12 y SD - 4, una observación de 8 está 1 SD por debajo de la M). Supongamos que observa
mos conversar a Ian con otros niños 20 veces en una hora. Quedaría claro que Tan es inusualmen
te locuaz, con una puntuación Z de + 2 . Ian no sólo hablaría más que el promedio, sino dos veces
más de lo que los niños tienden a desviarse del promedio. (Véase figura 2-1 ó).
Figura 2-16. C antidad da v e c e s por hora qu e d os n iñ os con versan , expresada e n p u n tu acion es brutas y pun
tu a cio n es Z (d atos fic ticio s).
Z « —~ (2-7)
SD
Por ejemplo, si aplicamos la fórmula al ejemplo del niño con un registro de 100 en la prueba de
capacidad lingüística,, la fórmula sería la siguiente:
g __ X - M _ 100 - 82 _ 18 _ ^
SD 6 6 ”
X = (ZXSD) + M (2-8)
Por ejemplo, si un niño presenta una puntuación Z de -1,5 en la prueba de capacidad lingüísti
ca, quiere decir que se encuentra 1,5 desvíos estándar por debajo de la media. Dado que el des
vío estándar en este caso es de ó puntos brutos, el niño está 9 puntos brutos por debajo de la
media. La media es 82. Por lo tanto, 9 puntos por debajo de ella es 73. Utilizando la fórmula,
tendríamos:
ív ¡0 ~
„ 2 (X -A í)2 SS 10 ^
SD2 ^
N N 10
S£> = Vl= 1
8 Si no hubiera errores de redondeo, el resultado sería igual a 10.
CONTROVERSIAS Y LIMITACIONES:
LA TIRANÍA DE LA MEDIA
Aun cuando el uso de la estadística en psicología es tan generalizado que pareciera ser la única
herramienta o el único lenguaje de esta disciplina, siempre ha existido una corriente en desacuer
do con el método puramente numérico. Es nuestra intención informar al lector, a lo largo del li
bro, sobre las controversias que existen en el campo de ía psicología con respecto a la estadística.
Consideramos que un buen tema para comenzar a hacerlo es precisamente el debate referido al
abuso de las estadísticas.
El “padre de la psicología”, Wihelm Wundt, pensaba que los experimentos y las estadísticas
debían limitarse a temas tales como la percepción y la memoria, una opinión que rara vez se men
ciona. El método apropiado para las otras áreas de la psicología era el análisis y 1a interpretación
del significado, procedimientos que prescinden de los números (McLeod, 1996).
El conductismo se describe con frecuencia como la escuela de psicología históricamente más
dedicada a mantener este campo dentro de un ámbito estrictamente científico. El conductismo se
inició alrededor del año 1913, con el rechazo por el estudio de los estados interiores del individuo
debido a la imposibilidad de observarlos objetivamente. Pero el más ardiente portavoz del con
ductismo, B. F. Skinner, se oponía rotundamente a la estadística. Skinner llegó incluso a decir:
“Preferiría ver a un graduado en psicología asistir a un curso de físico-química que de estadística.
E incluiría (presumiblemente antes que la estadística) otras ciencias, incluso poesía, música y ar
te” (Evans, 1976, p. 93),
¿Por qué Skinner se oponía tan rotundamente a la estadística? Él sostenía que observar el com
portamiento es la mejor forma de comprenderlo, y se refería a la observación de casos individuales.
Hacía notar constantemente los datos que se perdían por promediar los resultados de varios casos.
Por ejemplo, Skinner (1956) mencionaba el ejemplo de tres ratones que comían en exceso: uno na
turalmente obeso, otro envenenado con oro y otro cuyo hipotálamo había sido alterado. Cada uno
presentaba una curva de aprendizaje diferente (patrón de velocidad de aprendizaje) en relación con
la destreza necesaria para presionar una barra y alcanzar el alimento; esto revelaba muchos aspec
tos acerca de los hábitos alimenticios ocasionados por cada una de las distintas enfermedades. Si se
hubieran sumado o unificado estadísticamente las curvas de aprendizaje, el resultado no hubiera re
presentado los hábitos alimenticios reales de ningún ratón real. Según el mismo Skinner, “estas tres
curvas Individuales contienen más información de la que podría haber sido generada por medidas
que requirieran un tratamiento estadístico; sin embargo, las mismas serán analizadas con descon
fianza por muchos psicólogos porque representan casos individuales”, (p. 232)
Diferente fue el pedido de precaución emitido por la psicología humanística, cuyos comien
zos datan de la década de 1950 como “tercera fuerza” en contraposición al conductismo y a la
principal alternativa del momento, el psicoanálisis freudiano. El tema central de la psicología hu
manística establecía que la conciencia humana debía ser estudiada íntegramente, como un todo,
exactamente como es experimentada por el individuo. No es posible explicar-totalmente la expe
riencia humana reduciéndola a números (así como tampoco es posible explicarla reduciéndola a
palabras). La experiencia de un individuo es compleja y única.
En el área de la psicología clínica y del estudio de la personalidad, a menudo se han levanta
do voces para argumentar que puede aprenderse mucho más sobre aquello que es realmente im
portante en psicología a partir del análisis profundo de una persona, que respecto de promedios
entre varias de ellas. Es decir, el método ideográfico contra el nomo té tico, para utilizar los térmi
nos que Gordon Allport tomó de Wiihelm Windelband (véase Hilgard, 1987). Y la base filosófica
del análisis profundo de los individuos puede encontrarse en la fenomenología, que nació en Eu
ropa después de la Primera Guerra Mundial (véase Husserl, 1970).
La fenomenología es una posición filosófica opuesta al positivismo lógico. El positivismo ló
gico sostiene que existe una realidad objetiva a ser conocida. Es la posición filosófica que susten
ta tradicionalmente los esfuerzos científicos. Se considera que la ciencia puede descubrir esa
realidad objetiva o verdadera dado que utiliza experimentos que cualquiera puede observar o re
petir para obtener los mismos resultados. Los fenomenólogos sostienen, sin embargo, que inclu
so estas reiteradas observaciones son en realidad hechos particulares realizados en forma
consciente. Uno no puede saber si lo que entiende por “verde” o “la rata presionó la barra siete ve
ces” es lo que cualquier otro entiende por esas mismas palabras. Según los fenomenólogos, no
existe una realidad objetiva de la cual todos podamos estar seguros.
En la actualidad, el principal desafío para la estadística proviene del fuerte renacimiento del
interés en los métodos “cualitativos” de investigación. Ha habido una creciente preocupación en
tre algunos psicólogos con respecto a que, luego de cien años de investigación estadística cuanti
tativa, la psicología ha producido lo que ellos consideran conocimientos de muy poca utilidad
social (Jessor, 1996). Esperan que, analizando cuidadosamente como un todo a unos pocos seres
humanos en su contexto se puedan obtener mejores resultados
Highlen y Finley (1996) describen cinco posibles posiciones filosóficas que acompañan la in
vestigación cualitativa. La primera adopta el positivismo lógico y busca una realidad objetiva a
través de métodos cualitativos. También existe el pospositivismo, que sostiene la existencia de
una realidad verdadera pero que nunca conoceremos completamente. No obstante, esforzándonos
podemos acercamos a ella. La visión dei constructivismo subraya la existencia de múltiples rea
lidades. Cada uno de nosotros construye un significado a partir de la experiencia, y la psicología
debería intentar comprender algunos de esos significados. La visión crítica también niega cual
quier realidad objetiva. Sostiene que toda ciencia sirve al propósito de alguien, y el propósito co
rrecto es la liberación de los más débiles a través de, por ejemplo, el feminismo o el neomarxis-
mo. Finalmente, la visión postestructural persigne el objetivo de desafiar toda realidad social
mente establecida, la cual es considerada el producto de quienquiera que detente el poder. Si el
alumno aún no ha considerado este tema, aconsejamos averiguar y leer al respecto para comenzar
a formar una opinión propia.
Cualquiera sea ia posición filosófica subyacente, los métodos cualitativos incluyen análisis
de casos, etnografía, fenomenología, interaccionismo simbólico, análisis de sistemas e “investi
gación de la acción1’ (Híghlen & Fíniey, 1996). Estos métodos se desarrollaron principalmente en
antropología, en donde el conducdsmo y el positivismo lógico nunca tuvieron la influencia que
lograron en la psicología. Los métodos cualitativos usualmente implican largas entrevistas u ob
servaciones de unos pocos individuos; mientras se realizan las entrevistas, el investigador alta
mente capacitado decide qué aspectos merecen ser recordados, registrados y analizados por
medio de otras preguntas y observaciones. Según esta postura, la mente del investigador es la he
rramienta principal, ya que sólo esa mente puede localizar las relaciones importantes entre las
muchas categorías de hechos que surgen de las palabras de quien responde.
Algunos psicólogos (p. ej., Kenney, 1995; McCracken, 1988) sostienen que los métodos
cuantitativos y cualitativos pueden y deben complementarse. Primero deberíamos descubrir las
categorías importantes a través de un enfoque cualitativo, y luego determinar su incidencia en una
población mayor a través de métodos cuantitativos. Este grupo de psicólogos sostiene que, con
frecuencia, los investigadores cuantitativos deciden apresuradamente cuáles son las categorías
importantes sin explorar primero la experiencia humana con respecto a ellas, a través de entrevis
tas de preguntas abiertas u observaciones.
También resultan de interés las opiniones muy originales del psiquiatra Cari Jung sobre lo
que él llamaba “el estado de ánimo estadístico”. Tal como lo expresara la analista jungiana Mane
Louise von Franz (1979), “tenemos un estado de ánimo estadístico cuando caminamos por una
calle y observamos los cientos de rostros inexpresivos y comenzamos a sentimos disminuidos”.
Nos sentimos simplemente uno más de la multitud, comunes. O bien, cuando estamos enamora
dos, sentimos que la otra persona es única y maravillosa; no obstante, cuando nuestro estado de
ánimo es estadístico, nos damos cuenta de que la otra persona es común, igual a muchas otras.
Von Franz señala, sin embargo, que si sucediera una catástrofe, cada persona respondería de
forma única. En la vida existe al menos tanta irregularidad como regularidad.
El hecho de que esta mesa no levite sino que permanezca donde está sólo se debe a que los miles y
miles y miles de millones de electrones que la forman tienden a comportarse de ese modo estadís
ticamente. Pero cada electrón por sí mismo podría comportarse de modo diferente, (p, rv-17)
Según Franz, el estado de ánimo estadístico es dañino para el amor y la vida. Para contrarres
tarlo, “se necesita un acto de lealtad para con nuestros propios sentimientos” (p. rv-18). Los senti
mientos “hacen que la vida, al igual que las relaciones y los actos parezcan únicos y les dan un
valor definido” (pp. iv-18-rv-19). En particular, sentir la importancia de nuestras acciones indivi
duales hace menos posibles las inmoralidades, como por ejemplo la guerra y el homicidio. No po
demos contar los muertos como si fueran números sino que debemos tratarlos como personas,
con emociones y objetivos, como nosotros mismos,.
Para resumir, podemos decir que siempre han existido buenas razones para limitar nuestro
pensamiento estadístico a su propio territorio, y dejar que nuestro corazón gobierne libremente
los otros.
LA MEDIA Y EL DESVÍO ESTÁNDAR
SEGÚN SE DESCRIBEN EN PUBLICACIONES CIENTÍFICAS
En ias publicaciones científicas normalmente se hace referencia a la media y al desvío estándar.
Aunque la varianza y las puntuaciones Z son extremadamente importantes como pasos de procedi
mientos avanzados que aprenderemos más adelante, rara vez son mencionadas en las publicaciones.
En algunas oportunidades, la media y el desvío estándar son incluidos en el texto de una pu
blicación. Por ejemplo, nuestra psicoterapeuta ficticia podría escribir: “La cantidad media de se
siones tomadas por los últimos 10 pacientes fue 6,0 (SD ~ 2,57).”
En ias tablas, frecuentemente se hace referencia a la media o al desvío estándar, en especial
cuando se involucran varios grupos o cuando los participantes en la investigación son analizados
en varias condiciones diferentes. Por ejemplo, Orbach y sus colegas (1997), en un estudio realiza
do en Israel, compararon un grupo de pacientes suicidas de un hospital para enfermos con proble
mas mentales (individuos que habían realizado intentos serios de suicidio), pacientes no suicidas
de un hospital para enfermos con problemas mentales con diagnosis similares, y un grupo de con
trol (voluntarios de la comunidad). El objetivo del estudio era probar la teoría de que los suicidas
tienen mayor tolerancia al dolor físico; que su más alto umbral de dolor hace que para ellos sea
más sencillo realizar los dolorosos actos que implica un suicidio. Los investigadores realizaron
jas pruebas de rutina para medir el umbral de dolor y otras sensaciones, y entregaron varios cues
tionarios a los tres grupos. La tabla 2-6, reproducción de la que aparece en su artículo, refleja la
media de cada grupo en todas las mediciones.
Tabla 2-6.
M edias y desvíos estándar de medidas de dolor, tendencias suicidas, disociación y medidas emocio
nales del grupo de estudio.
Nota: Altos índices de atracción hacia ia vida y repulsión a la muerte representan bajas tendencias suicidas; bajos índi
ces de repulsión a la muerte y atracción hacia la vida representan altas tendencias suicidas.
Fuente: Orbach, I. et al. (1997), tab. 1. “Umbral y tolerancia al dolor físico en adolescentes suicidas y no suicidas”. R e
vista C ien tífica de P sic o lo g ía d e A se so ra m ie n to y C lín ica {J o u rn a l o f C o n su ltin g a n d C lin ic a l P sych o lo g yj , 65,
6 4 6-652. Copyright, 1997, por la A sociación Americana de Psicología (American Psychological Association]. Reim
preso con autorización.
Como podemos observar en la tabla, coincídentemente con las predicciones de los investiga
dores, el grupo suicida presentaba un umbral más alto de dolor que los otros dos grupos y difería
de éstos también en varias otras medidas. (Cabe destacar especialmente la gran diferencia entre el
grupo suicida y los otros dos grupos en cuanto a la “desesperanza'’)- Por supuesto, tal como lo in
dican los desvíos estándar, hay mucha superposición entre los grupos con respecto a estas medi
ciones. Es decir, aunque teniendo en cuenta el promedio, el grupo suicida presenta un mayor
umbral de dolor; existen muchos pacientes suicidas con umbrales de dolor menores a los de los
otros grupos, y muchos individuos no suicidas con mayor umbral de dolor.
La tabla 2-7 (tomada de Norcross et al., 1996) presenta un ejemplo particularmente interesan
te. No muestra desvíos estándar pero sí medias y medianas. Por ejemplo, en 1992, la media de as
pirantes a doctorados de asesoramiento psicológico era 120,2, pero la mediana era sólo 110. Esto
sugiere que existían ciertos programas con una gran cantidad de aspirantes que tomaban asimétri
ca la distribución. De hecho, podemos ver en la tabla que en casi todos los casos, y tanto para so
licitudes como para inscripciones, las medias son usualmente mayores que las medianas. (Es
probable que resulte asombrosa la competitividad que presenta el ingreso a un doctorado en mu
chas de las áreas de la psicología. Según nuestra experiencia, uno de los factores con bastante in
fluencia en este aspecto, es haber tenido éxito en los cursos sobre estadística).
Tabla 2-7.
Estadística de solicitudes e inscripciones por área y año: Doctorados.
Solicitudes Inscripciones
N ” de programas M M dn M M dn
Programa 1973a 1979a 1992 1973a 1979a 1992 1973a 1979s 1992 1992 1992
Clínica 105 i 30 225 314.4 252,6 191,1 290 234 168 12,0 8
Cognitiva 47 24,6 22 2,6 2
Comunitaria 4 2 5 90,5 24,4 60 23 3,2 2
Asesoramiento 29 43 62 133,4 90,9 120,2 120 84 no 7,3 6
Desarrollo 56 72 97 54,1 38,9 27,6 41 30 24 2,8 2
Educacional 23 28 30 67,8 39,7 20,0 34 26. 12 6,0 4
Experimental y general 118 127 78 56,2 33,2 31,3 42 25 26 4,4 3
Salud 7 40.7 30 4,4 5
índustriai/organizacional 20 25 49 39,9 54,7 66,2 37 48 70 4,9 4
Personalidad 23 1S 10 42,5 24,7 12,3 33 17 6 1,0 1
Percepcion/psicofísica 15 8,3 6 1,4 1
Fisíología/biopsicología 40 43 76 33,2 29,3 20,0 29 24 20 3,9 2
Escolar 30 39 56 78,5 54,0 31,3 53 34 32 5,4 5
Social 58 72 59 46,7 30,9 47,1 40 24 37 3,3 3
Otras 47 37 273 61,6 74,1 26,6 27 25 15 3,3 2
Total 566 645 1,089 106,1 85,2 69,4 31 5,6 4
N ota: L os años académicos corresponden a las ediciones de postrado de psicología de 1975-1976,1981-1982, y 1994
respectivamente.
“Fuente: Stoup y Benjamín (1982).
Fuente: Norcross, J. C., Hanych, J. M-, &Terranova, R. D. (1996), tab. 7. Postgrado de Psicología: 1992-1993. P s ic ó lo
g o A m e ric a n o [A m erica n P s y ch o lo g ist), 51, 631-643. Copyright 1996, por la A sociación Americana de Psicología
[American Psychological Association]. Reimpreso con autorización.
Resumen
La media es un promedio común, es decir, la suma de las observaciones dividida por la cantidad
de ellas. Expresado en símbolos, M - I XIN.
Otras formas alternativas menos comunes de descripción de la tendencia central de una distri
bución son la moda (el valor más común) y la mediana (el valor del registro medio después de or
denar todas las observaciones de menor a mayor).
La variación de un grupo de observaciones puede ser descripta a través de la varíanza, es de
cir, el promedio de los desvíos cuadráticos de cada observación con respecto a la media. Expresa
do en símbolos; SD2 =Z(X - M)2/N. La suma de los desvíos cuadráticos también se simboliza
como SS. Por lo tanto SD2 = SS/N,
El desvío estándar es la raíz cuadrada de la varianza. Expresado en símbolos: SD = "VSD2.
Para explicarlo en forma más clara, es aproximadamente el promedio de las diferencias entre las
observaciones y la media.
Una puntuación Z indica a cuántos desvíos estándar por encima o por debajo de la media se
encuentra una puntuación bruta. Entre otras cosas, las puntuaciones Z sirven para comparar ob
servaciones de variables que tienen diferentes escalas.
Siempre ha habido psicólogos que advirtieron los riesgos que implica el uso de la metodolo
gía estadística, ya que en el proceso.de resumir los datos en un promedio se pierde información
sobre cada caso individual.
Las publicaciones científicas generalmente hacen referencia a la media y al desvío estándar,
tanto en el texto como en las tablas. En cambio, rara vez se refieren a la varianza y a las puntua
ciones Z.
Términos clave
- Tendencia central. - Moda. - Suma de cuadrados (SS).
- Fórmulas de cálculo. - N. - Varianza (SD2).
- Fórmulas de definición. - Puntuaciones brutas. - Puntuaciones Z.
- Desvío. - Desvío cuadrático. -Z.
- Media (M). - Desvío estándar (SD).
- Mediana. - Puntuaciones estándar.
Observemos que EX2 implica que se eleva al cuadrado cada observación y luego se suman esos
cuadrados. Por otro lado, (EX)2 implica que primero se suman todas las observaciones y luego se
eleva esa suma al cuadrado.
La fórmula de cálculo del desvío estándar es la raíz cuadrada de la fórmula de cálculo de la
varianza;
EX2 ~(XX)2/1V
SD =
N
La tabla 2-8 muestra el cálculo de la varianza y el desvío estándar de la información corres
pondiente a nuestro ejemplo sobre sesiones de terapia, utilizando la fórmula de cálculo. Compare
este cálculo con el que aparece en la tabla 2-2, que se basa en la misma información pero utiliza la
fórmula de definición.
Tabla 2.8.
Cálculo de la varianza y ei desvío estándar correspondiente al ejemplo sobre sesiones de terapia,
utilizando las fórmulas de cálculo.
2 :6 0 426