Documentos de Académico
Documentos de Profesional
Documentos de Cultura
medición y diseño
de investigación
UC UdjlUO UCi 1(1 peí ouildliutu
Datos de autorreporte (datos A)
Datos de reporte del observador (datos O)
Datos de prueba (datos P)
Datos de resultados de la vida (datos V)
Problemas en la evaluación de la personalidad
KtnidAjiuii uc ím me
Confiabilidad
Validez
Generabilidad
ísenos ae investí^
Métodos experimentales
Estudios correlaciónales
Estudios de caso
Cuándo usar diseños experimentales, correlaciónales y de estudio de caso
R esum en y evaluació n
iü
■'■•i
_______ ______________ ______
24
INTRODUCCION
I
RESI DE
wmvJohnKei
John
JCIIM
R JE
% -r*
* %c
f e
<§p§*:
Quizá la fuente más obvia de información sobre una persona son los datos de au torrep o rte
(datos A), la información que revela una persona, basada en algún procedimiento, como un
cuestionario o una entrevista. Es obvio que los individuos pueden no siempre dar información
precisa sobre sí mismos por una variedad de razones, como el deseo de presentarse bajo una
luz positiva. No obstante, las revistas que publican las investigaciones más recientes de la per
sonalidad revelan que el autorreporte es el método más común para medirla.
Los datos de autorreporte pueden obtenerse a través de una variedad de medios, incluyendo
entrevistas que plantean preguntas a una persona, informes periódicos de una persona que re
gistra los eventos conforme suceden y cuestionarios de varias clases. El método del cuestio
nario, en el que los individuos responden a una serie de reactivos que solicitan información
acerca de ellos mismos, es con mucho el procedimiento de evaluación del autorreporte más
usado.
Existen buenas razones para usar el autorreporte. La razón más obvia es que los indivi
duos tienen acceso a una riqueza de información sobre sí mismos que es inaccesible para al
guien más. Los individuos pueden informar acerca de sus sentimientos, emociones, deseos,
creencias y experiencias personales. Pueden informar acerca de su autoestima, así como de su
percepción de la estima en la que creen que los tienen otros. Pueden informar sobre sus temo
res y fantasías más secretos. Pueden informar sobre la forma en que se relacionan con otros y
cómo otros se relacionan con ellos. Y pueden informar acerca de sus metas inmediatas y a lar
go plazo. Debido a esta riqueza de información potencial, el autorreporte es una fuente indis
pensable de datos sobre la personalidad.
El autorreporte puede adoptar una variedad de formas, que van desde preguntas abier
tas tipo “llene los espacios en blanco” hasta preguntas de elección forzada como verdadero
o falso. A veces se conocen como pruebas de personalidad no estru c tu rad as (abiertas, co
mo “Cuénteme sobre las fiestas que le gustan más”) y e stru c tu rad as (“Me gustan las fies
tas ruidosas y atestadas”, responda “verdadero” o “falso”). Un ejemplo destacado de la
forma abierta de autorreporte es la Prueba de las veinte afirmaciones (véase la sección “Un
acercamiento detallado” para más información). En esta prueba, un participante recibe una
hoja de papel que está en blanco casi por completo, con excepción de las palabras “Yo soy”
repetidas 20 veces. Hay un espacio después de cada una de estas afirmaciones parciales, y
se les pide a los participantes que las completen. Por ejemplo, una persona podría decir, en
este orden: Yo soy una mujer; Yo soy joven; Yo soy tímida; Yo soy inteligente; Yo soy alguien
a quien le gustan las noches tranquilas en casa; Yo soy introvertida; y así en forma sucesi
va. Los instrumentos de personalidad que usan formatos de pregunta abierta requieren es
quemas de codificación para clasificar las respuestas que obtienen. En otras palabras, los
psicólogos deben idear una forma de calificar o interpretar de alguna otra manera para dar
Capítulo Dos Evaluación de la, personalidad, medición y diseño de inyesliiafión 27
sentido a las respuestas abiertas del participante. Por ejemplo, para darse una idea de cuán
sociable es la mujer de nuestra prueba, el psicólogo podría contar cuántas afirmaciones se
refieren a características sociales.
Más comunes que los cuestionarios abiertos son los cuestionarios de personalidad es
tructurados, en los que se proporcionan las opciones de respuesta. La forma más simple del
Introducción
r
cuestionario de autorreporte estructurado implica una serie de adjetivos descriptivos de ras
gos, como activo, ambicioso, ansioso, arrogante, artístico, generoso, gregario, codicioso,
bondadoso, xenofóbico y disparatado. Se les pide a los individuos que indiquen si cada ad
jetivo los describe o no. El formato más simple para presentar estos términos es una lista de
verificación, como la Lista de Verificación de Adjetivos (Adjective Check List, ACL: Gough,
1980). Al completar la LVA, los individuos tan sólo colocan una marca junto a aquellos ad
jetivos que sienten que los describen mejor. La persona marca los reactivos que la describen
y deja en blanco aquellos reactivos que no la describen. Un método más complejo implica
solicitar a los participantes que indiquen en forma numérica el grado en que cada término del
rasgo los caracteriza, digamos en una escala de valoración de 7 puntos que va de 1 (menos
característico) a 7 (más característico). Esta se llama escala de estimación Likert (en honor
de la persona que la inventó) y tan sólo es una forma para que alguien exprese con números
el grado en que un rasgo particular lo describe. Una típica escala de estimación Likert luce
como ésta:
ENÉRGICO
1 2 3 4 5 6 7
De manera más común, una escala de personalidad consiste en sumar las puntuaciones
en una serie de escalas de estimación individuales. Una escala de personalidad para el nivel
de actividad, por ejemplo, podría consistir en sumar puntuaciones de escalas de estimación en
enérgico, activo y vigoroso.
10
Instrucciones: Esta lista contiene una serie de adjetivos. Por favor léalos rápido y ponga una X
sobre la raya junto a cada uno de los que considere autodescriptivos.
Sin embargo, son más comunes los cuestionarios de autorreporte en forma de afirma
ciones que las listas de verificación de adjetivos. Ejemplos de inventarios de autorreporte usa
dos en forma amplia son el Inventario de Personalidad n e o (Costa y McCrae, 2000) y el
Inventario Psicológico de California (California Psychological Inventory, c p i ) (Gough,
1957/1987). Reactivos de muestra del CPI son Disfruto las reuniones sociales tan sólo por
estar con personas; Respeto a mi padre como un hombre ideal; Una persona necesita “fa n
farronear” un poco de vez en cuando; Tengo un deseo muy intenso de tener éxito en el mundo;
Soy muy lento para decidirme. Los participantes leen cada afirmación y luego indican en una
hoja de respuestas si están de acuerdo con la afirmación y sienten que es verdadera para ellos
o están en desacuerdo con la afirmación y sienten que es falsa respecto a ellos. Reactivos de
muestra del Inventario de Personalidad n e o son Me gusta la mayoría de la gente que conoz-
('APÍTL10 Dos Evaluación de la personalidad, medición y diseño de invesliflifión
co, me río con facilidad; Con frecuencia me disgusto con la gente con la que tengo que tratar.
Los participantes indican el grado en que están de acuerdo en que el reactivo los describe
usando una escala L ik ert del 1 al 5, con 1 anclado a frase fuertemente en desacuerdo y 5
anclado a fuertemente de acuerdo.
Escoja una característica de personalidad que le gustaría medir. Empiece por escribir una defi
nición clara de esa característica. Por ejemplo, podría elegir características como amigable, dili
gente, ansioso o narcisista. Luego escriba un cuestionario breve, de unos cinco reactivos de largo,
para medir esta característica. Sus reactivos pueden ser afirmaciones o adjetivos, y pueden ser
abiertos, verdadero-falso o en una escala de respuesta Likert. Luego dé su cuestionario a otras
personas. ¿Qué tan fácil fue escribir los reactivos? ¿Considera que su medida evalúa con preci
sión el rasgo?
Las medidas de autorreporte, como todos los métodos, tienen limitaciones y desventa
jas. Para que el método de autorreporte sea efectivo, los que responden deben estar dispues
tos y ser capaces de responder las preguntas que se les hacen, pero las personas no siempre
son honestas, en especial cuando se les pregunta sobre experiencias poco convencionales, co
mo deseos inusuales, prácticas sexuales poco convencionales y rasgos que podrían ser consi
derados indeseables. Algunas personas pueden carecer de un conocimiento preciso de sí
mismos. Debido a estas limitaciones, los psicólogos de la personalidad a menudo usan fuen
tes de información que no dependen de la honestidad o perspicacia del participante. Una de
esas fuentes son los observadores.
Aplicación
El muestreo de experiencia; una nueva idea en el autorreporte. Una fuente de datos relativamen
te nueva en la investigación de la personalidad se llama muestreo de experiencia (por ejemplo,
Hormuth, 1986; Larsen, 1989). En este método, las personas responden algunas preguntas, qui
zá acerca de sus estados de ánimo o síntomas físicos, todos los días durante varias semanas o
más. Por lo general se hace contacto con las personas en forma electrónica (con radiolocalizador)
una o más veces al día a intervalos aleatorios para completar las medidas. En un estudio, 74 es
tudiantes universitarios reportaron sus estados de ánimo todos los días durante 84 días consecu
tivos (Larsen y Kasimatis, 1990). Los investigadores estaban interesados en descubrir los
vínculos entre el día de la semana y el estado de ánimo. De modo no sorprendente, encontraron
un fuerte ciclo semanal en los estados de ánimo de tales estudiantes universitarios, con los esta
dos de ánimo positivos llegando a un máximo en viernes y sábado, y los estados de ánimo nega
tivos llegando a un máximo en martes y miércoles (el lunes no fue el peor día de la semana). Los
introvertidos resultaron tener un ciclo de estado de ánimo semanal mucho más regular que los
extrovertidos. Es decir, los estados de ánimo de los introvertidos fueron más predecibles a partir
de este ritmo de siete días que los estados de ánimo de los extrovertidos. Es probable que esta di
ferencia se debiera al hecho de que los extrovertidos tienen menos probabilidad de esperar al fin
de semana para hacer cosas que los ponen de buen humor: ir a fiestas, socializar o salir a una co
mida especial con sus amigos. Los extrovertidos por lo regular evitan la rutina en su vida diaria,
mientras que los introvertidos llevan vidas más predecibles.
Aplicación (continuación)
Selección de observadores
Un punto clave de decisión que enfrentan los investigadores cuando usan observadores es el có
mo seleccionarlos. Los investigadores de la personali
dad han desarrollado dos estrategias. Una estrategia es
usar evaluadores de la personalidad profesionales
que no conocen al participante con antelación. La
otra estrategia es usar individuos que ya conocen a
los participantes objetivo. Expondremos cada estra
tegia a su vez.
Un escenario en el que se usan observadores
profesionales es el Institute fo r Personality and So
cial Research, i p s r en la Universidad de California en
Berkeley. Los participantes acuden al instituto por pe
riodos que van de uno a cinco días, así que puede rea
lizarse una gran variedad de evaluaciones de la
personalidad a fondo. Los participantes son invitados
a ir al ip s r como parte de estudios específicos. Por
fuente de información sobre la personalidad. ejemplo, un estudio se puso en contacto con un con
junto de arquitectos que fueron juzgados por sus colegas como muy creativos, dentro de un
estudio para determinar los predictores de la personalidad para la creatividad. Otro estudio ob
servó a novelistas considerados como creativos. Un tercero evaluó a estudiantes de un progra
ma de maestría en administración para determinar los predictores de la personalidad del éxito
en los negocios. Durante los estudios en el ip s r , los evaluadores capacitados de la personali
dad observan a los participantes en una variedad de contextos. Después, cada observador pro
porciona una descripción de la personalidad independiente de los participantes.
Una segunda estrategia para obtener datos de observación es emplear individuos que sí
conocen en realidad a los participantes objetivo. Por ejemplo, se ha incurrido a amigos cerca
nos, cónyuges, madres y compañeros de escuela para proporcionar datos de personalidad de
los participantes (por ejemplo, Buss, 1984; Ozer y Buss, 1991). El uso de observadores que
tienen relaciones preexistentes con el participante tiene ventajas y desventajas cuando se com
para con los evaluadores profesionales. Una ventaja es que tales observadores están en una
mejor posición para observar el comportamiento natural del participante. En el contexto rela
tivamente público de una evaluación del ip s r , en contraste, los observadores profesionales no
pueden atestiguar las acciones más privadas de una persona y deben conformarse con obser
var su persona pública. Un cónyuge o amigo cercano tiene acceso a información privilegiada
con frecuencia inaccesible por medio de otras fuentes.
Una segunda ventaja de usar observadores íntimos es que pueden evaluarse las m últi
ples personalidades sociales (Craik, 1987). Cada uno de nosotros exhibe lados diferentes de
nosotros mismos a diferentes personas; podemos ser amables con nuestros amigos, despiada
dos con nuestros enemigos, amantes hacia un cónyuge y conflictivos hacia nuestros padres.
En otras palabras, nuestras personalidades manifiestas varían de un escenario social a otro,
dependiendo de la naturaleza de las relaciones que tenemos con otros individuos. El uso de
múltiples observadores proporciona un método para evaluar los muchos aspectos de la perso
nalidad de un individuo.
Aunque hay ventajas en el uso de observadores cercanos en la evaluación de la perso
nalidad, también hay inconvenientes. Debido a que los observadores cercanos tienen relacio
nes con la persona objetivo, pueden estar prejuiciados de diferentes formas. Una madre del
participante, por ejemplo, puede pasar por alto las características negativas y enfatizar las po
sitivas de su hijo. Además, las características de personalidad y planes personales de los ob
servadores pueden afectar las estimaciones de la personalidad. Varios factores pueden
reducir la precisión de los reportes del observador, incluyendo si los observadores tienen in
formación relevante para un juicio particular, si han puesto atención a dicha información y
si son capaces de usar esta información para hacer una estimación confiable del participante
(Funder, 1995).
Más allá de las fuentes de datos de autorreporte y de reporte del observador, una tercera fuen
te común de información relevante para la personalidad proviene de pruebas estandarizadas:
los datos de p ru eb a (datos P). En estas medidas, los participantes son colocados en una si
tuación de prueba estandarizada. La idea es ver si personas diferentes reaccionan de manera
diferente ante una situación idéntica. La situación es diseñada para generar comportamien
tos que sirvan como indicadores de variables de personalidad (Block, 1977). Un ejemplo in
teresante es la prueba de construcción de un puente que se encuentra en el libro clásico de
Henry Murray (1937) The Assessment o f Men. En esta prueba, a la persona que se está eva
luando se le asignan dos asistentes y una cantidad de madera, cuerda y herramientas, tenien
do la tarea de construir un puente sobre un pequeño arroyo. La persona a la que se está
evaluando no puede hacer el trabajo por sí misma sino que debe instruir a los dos asistentes
sobre la manera de construir el puente. Sin el conocimiento de la persona que se está eva
luando, los dos asistentes están representando papeles: uno está actuando como limitado in
telectualmente y tiene problemas para entender las instrucciones; el otro es un “sabelotodo”,
quien tiene sus propias ideas acerca de cómo debería construirse el puente y con frecuencia
contradice a la persona que se está evaluando. Estos dos “ayudantes” en realidad están ahí
para frustrar a la persona a la que se está evaluando. Mientras la persona que se está eva
luando piensa que está siendo observada sobre habilidades de liderazgo, la persona en rea
lidad está siendo evaluada respecto a su tolerancia a la frustración y el desempeño bajo la
adversidad.
Un ejemplo fascinante del uso de los datos P es el estudio de Edwin Megargee (1969)
sobre las manifestaciones de la dominación. Megargee deseaba diseñar una situación de prue
ba de laboratorio en la que pudiera evaluar el efecto de la dominación en el liderazgo. Con ese
fin, administró primero la escala de Dominación del Inventario Psicológico de California a un
grupo grande de hombres y mujeres que podrían servir como participantes potenciales en la
investigación. Luego seleccionó sólo a aquellos hombres y mujeres que obtuvieron puntua
ciones muy altas o muy bajas en dominación. Al completar este procedimiento de selección,
Megargee llevó parejas de individuos al laboratorio, haciendo parejas en cada caso con un
participante muy dominante y un participante poco dominante. Creó cuatro condiciones: 1)
un hombre muy dominante con un hombre poco dominante, 2) una mujer muy dominante
con una mujer poco dominante, 3) un hombre muy dominante con una mujer poco domi
nante y 4) una mujer muy dominante con un hombre poco dominante.
Luego Megargee le presentó a cada pareja una caja grande que contenía muchas tuer
cas, pernos y palancas rojos, amarillos y verdes. Se les dijo a los participantes que el propó
sito del estudio era explorar la relación entre la personalidad y el liderazgo bajo estrés. Cada
pareja de participantes tenía que trabajar como un equipo de expertos para reparar la caja lo
más rápido posible, quitando tuercas y tornillos con ciertos colores y reemplazándolos con
otros colores. Se les dijo a los participantes que una persona del equipo tenía que ser el líder,
una posición que implicaba dar instrucciones a su pareja. La segunda persona tenía que ser el
Capítulo Dos Evaluación de la personalidad, medición y diseño de investigación
Técnicas proyectivas
Otro tipo de datos P son las técnicas proyectivas, en las que a la persona se le presenta un es
tímulo estándar y se le pregunta qué ve. La técnica proyectiva más famosa para evaluar la per
sonalidad es el conjunto de manchas de tinta elaborado por Hermann Rorschach. Sin embargo,
hay otras; por ejemplo, la técnica de la mano, en la que se le dan a la persona ilustraciones de
manos y se le pide que elabore una historia acerca de lo que acaban de hacer las manos y qué
van a hacer a continuación. El distintivo de cualquier técnica proyectiva es que se le presenta
a la persona un estímulo ambiguo, como una mancha de tinta o la ilustración de una mano.
Capítulo Dos Evaluación de la personalidad, medición v diseño de investigación
Luego se le pide a la persona que imponga una estructura a este estímulo describiendo lo que
ve; por ejemplo, qué hay en la mancha de tinta o qué acaba de hacer la mano. La idea detrás
de las técnicas proyectivas es que lo que ve la persona en el estímulo se relaciona en forma
directa con lo que está en su mente. Lo que la persona ve en el estímulo se interpreta para re
velar algo acerca de su personalidad. Se supone que la persona “proyecta” sus preocupacio
nes, conflictos, rasgos y formas de ver o enfrentar al mundo en el estímulo ambiguo.
Las técnicas proyectivas se consideran datos P debido a que a todas las personas se les
presenta una situación estímulo estándar, a todos se les dan las mismas instrucciones y la si
tuación de prueba genera comportamientos que se piensa revelan rasgos de personalidad.
Una razón por la que uno podría no pensar en las medidas proyectivas como datos P es que,
en su mayor parte, no se califican en forma mecánica, aunque hay excepciones (véase Wood,
Nezworski y Stejskal, 1996, para un examen crítico). Por ejemplo, los dispositivos de obser
vación mecánicos, como el actómetro, y los dispositivos de registro fisiológico, como los
monitores del ritmo cardiaco, se califican usando procedimientos objetivos gobernados por
reglas. La calificación es mecánica. Las técnicas proyectivas, por otra parte, por lo general
deben interpretarse.
Para que el psicólogo interprete las respuestas de una persona a las manchas de tinta, el
contenido de esas respuestas es importante. Por ejemplo, lo más probable es que un partici
pante que ha visto un murciélago, un perro muerto y un caníbal sea bastante diferente de al
guien que observa la misma tarjeta y ve una flor, nubes aborregadas y dos payasos jugando al
pastelazo. Además del contenido, el psicólogo está interesado en la manera en que se forman
las percepciones. Por ejemplo, un participante podría concentrarse en las líneas que dividen la
tinta del área blanca, mientras otro podría hacerlo sólo en la tinta.
En resumen, todas las medidas proyectivas le presentan al participante estímulos ambi
guos, pidiéndole que le proporcione una estructura interpretando, dibujando o narrando una
historia acerca de los estímulos. Los psicólogos que apoyan las medidas proyectivas afirman
que son útiles para entrar en contacto con las aspiraciones, deseos fantasías y conflictos de
los que los participantes mismos pueden no percatarse y, así, podrían no informarlas en un
cuestionario. Otros critican las pruebas proyectivas, cuestionando su validez y confiabilidad
como medidas precisas de la personalidad (Wood et a l, 1996).
A l interpretar una mancha de tinta una persona puede proyectar su personalidad en lo que “ve”
en tal mancha.
38 Introducción
mujeres que habían mostrado berrinches cuando niñas se “casaron con un inferior”, en com
paración con sólo 24% de las mujeres que habían sido ecuánimes cuando niñas. Como con los
hombres, los berrinches en la infancia se vincularon con la frecuencia de divorcio para las mu
jeres. Más o menos 26% de las mujeres que tuvieron berrinches en la infancia estaban divor
ciadas a los 40 años de edad, mientras sólo 12% de las mujeres ecuánimes estaban divorciadas
para esa edad.
Además de los estudios empíricos, como aquellos que predicen el divorcio posterior a
partir de la personalidad infantil, los datos de resultados de la vida se usan en formas reales
que afectan nuestra vida cotidiana. Nuestros registros de conducción, incluyendo multas por
exceso de velocidad y accidentes de tránsito, son usados por las compañías de seguros para
determinar cuánto pagaremos por el seguro del automóvil. Nuestras historias de uso de tarje
tas de crédito en ocasiones son rastreadas por los negocios para determinar nuestras preferen
cias comportamentales, las cuales influyen en los anuncios que nos envían. Y, en fechas más
recientes, los publicistas con frecuencia rastrean los sitios web que visitamos, y usan correo
electrónico “de publicidad no deseada” y anuncios desplegables basados en nuestros patrones
de navegación en Internet. Por tanto, los registros de conducción, de uso de tarjetas de crédi
to y de patrones de uso de Internet se han vuelto fuentes modernas de datos V. ¿Piensa que po
demos predecir estos patrones de datos rastreables en forma pública a partir de variables de
personalidad, como impulsividad (más accidentes automovilísticos), lucha por posición social
(compra de posesiones de prestigio con tarjeta de crédito) e impulso sexual (visitas más fre
cuentes de sitios web de pornografía)? Los estudios futuros de datos V responderán dentro de
poco estas preguntas.
En suma, los datos V pueden servir como una fuente importante de información de la
vida real acerca de la personalidad. Las características de la personalidad medidas temprano
en la vida con frecuencia se vinculan con resultados de la vida importantes varias décadas des
pués. En este sentido, uno puede decir que los resultados de la vida, como el trabajo, matri
monio y divorcio, son, en parte, manifestaciones de la personalidad. No obstante, debe
reconocerse que los resultados de la vida son causados por una variedad de factores, incluyen
do nuestro sexo, raza y grupo étnico, así como las oportunidades a las que uno suele estar ex
puesto. Las características de la personalidad sólo representan un conjunto de causas de estos
resultados de vida.
Piense en una característica de la personalidad que encuentre interesante. Por ejemplo, podría
considerar características como el nivel de actividad, correr riesgos, temperamento o coopera
ción. Usando las cuatro fuentes de datos principales, piense en formas en que podría recopilar
información sobre esta característica. Dé ejemplos específicos de cómo podría evaluar esta carac
terística usando datos A, O, P y V como fuentes de información sobre el nivel de esta caracterís
tica en las personas. Sea específico al dar ejemplos de cómo y qué podría hacer para evaluar la
característica de personalidad seleccionada.
los vínculos entre las diversas fuentes de datos de personalidad? ¿Y qué conclusiones pueden
sacarse cuando diferentes fuentes de datos no llegan a la misma conclusión? El segundo pro
blema implica la confiabilidad de la medición de la personalidad y la forma en que el uso de
múltiples fuentes de datos puede corregir algunos de los problemas asociados con fuentes
de datos únicas.
Una vez que se han identificado medidas de personalidad para la investigación, la siguiente
tarea es someterlas a escrutinio científico, de modo que los investigadores puedan determinar
qué tan buenas son las medidas. En general, se usan tres estándares para evaluar las medidas
de personalidad: confiabilidad, validez y generabilidad. Aunque estos tres estándares se ex
pondrán aquí en el contexto de la evaluación de cuestionarios de personalidad, es importante
tomar en cuenta que son aplicables a todos los métodos de medición dentro de la investiga
ción de la personalidad, no tan sólo a aquellos que implican cuestionarios de personalidad de
autorreporte.
Confiabilidad
La confiabilidad puede definirse como el grado en que una medida obtenida representa el ni
vel verdadero del rasgo que se está midiendo. Suponga por un momento que cada persona tie
ne alguna cantidad verdadera del rasgo que desea medir, y que podría conocer este nivel
verdadero. Si su medida es confiable, entonces se correlacionará con el nivel verdadero. Por
ejemplo, si una persona tiene un ci verdadero de 115, entonces una medida confiable a la per
fección del ci produciría una puntuación de 115 para esa persona. Más aún, una medida con
fiable del ci produciría la misma puntuación de 115 cada vez que se administrara a la persona.
Una medida menos confiable produciría una puntuación, quizá, en un rango, de 112 a 118.
Una medida aún menos confiable produciría una puntuación en un rango aún más amplio, más
o menos entre 100 (el cual es el promedio) y 130 (el cual es genio limítrofe). Los psicólogos
de la personalidad prefieren medidas confiables, de modo que las puntuaciones reflejen con
precisión el nivel verdadero de cada persona de la característica de personalidad que se está
midiendo. Debido a que nunca podemos medir los niveles verdaderos de los rasgos nunca po
demos calcular con exactitud qué tan confiables son nuestras medidas reales. Sin embargo,
hay varias formas de estimar la confiabilidad.
Una forma de estimar la confiabilidad de una medida es por medio de la m edición re
petida. Hay diferentes formas de medición repetida y, por tanto, diferentes versiones de con
fiabilidad. Un procedimiento común es repetir una medición para la misma muestra de
r Introducción
personas a lo largo del tiempo; por ejemplo, con un intervalo de un mes. Si las dos pruebas se
correlacionan mucho entre la primera y la segunda prueba, produciendo puntuaciones simila
res para la mayoría de las personas, entonces se dice que la medida resultante tiene una con-
fiabilidad de prueba y repetición de la prueba alta.
Una segunda forma de determinar la confiabilidad de una escala es examinar las rela
ciones entre los reactivos en sí en un solo punto en el tiempo. Si los reactivos dentro de una
prueba, vistos como una forma de medición repetida, se correlacionan bien entre sí, entonces
se dice que la escala tiene una confiabilidad de consistencia interna alta. La confiabilidad es
interna porque se evalúa dentro de la misma prueba. El fundamento para usar la consistencia
interna como un índice de confiabilidad es que los psicólogos que construyen varias medidas
suponen que todos los reactivos en una escala miden la misma característica. Si lo hacen, en
tonces los reactivos deberían correlacionarse en forma positiva entre sí.
Una tercera forma de medir la confiabilidad, aplicable sólo al uso de medidas de perso
nalidad basadas en un observador, es obtener mediciones de muchos observadores. Cuando
diferentes observadores concuerdan entre sí, se dice que la medida tiene una confiabilidad en
tre jueces alta. Cuando diferentes estimadores no están de acuerdo, se dice que la medida tie
ne poca confiabilidad entre jueces.
Es importante demostrar que una medida de personalidad es confiable, ya sea por me
dio de la confiabilidad de prueba y repetición de la prueba, la confiabilidad de consistencia in
terna o la confiabilidad entre jueces. Sin embargo, éste sólo es el primer paso en la evaluación
de una medida de personalidad. El siguiente paso es examinar si es válida.
. ).
icapon
Prejuicio histórico en pruebas de personalidad estructuradas. Algunas pruebas de personalidad
estructuradas, como el Inventario Multifásico de la Personalidad de Minnesota ( m m p i ), contie
nen un número no especificado de reactivos de prueba que se refieren a eventos históricos en la
vida de una persona. Ejemplos de dichos reactivos son Nunca he tenido problemas con la ley; En
la escuela a veces me enviaban con el director por hacer tonterías; He usado alcohol en exceso;
Solía robar a veces cuando era joven. Reactivos como éstos se usan para evaluar constructos de
la personalidad como desviación sicopática y el grado en que una persona está de acuerdo con
las normas de la sociedad (véase Gough, 1980). Cuando los individuos que completan las medi
das que contienen reactivos históricos son honestos en sus respuestas, las puntuaciones de la
prueba pueden contener un grado de estabilidad o confiabilidad que podrían resultar erróneas
cuando se ven a lo largo del tiempo.
Piense en una persona que responde dos veces una prueba de personalidad que contiene
reactivos con contenido histórico, una durante la adolescencia y de nuevo a los 25 años de edad.
Imagine que esta persona fue muy rebelde cuando adolescente, pero sentó cabeza y se volvió un
ciudadano responsable de adulto. Si la persona responde con veracidad a la prueba, siempre es
tará de acuerdo con los reactivos históricos relativos a la rebelión (por ejemplo, escapar de casa,
usar alcohol en exceso, pelear con sus padres), sin importar cuánto haya cambiado su personali
dad en la adultez. En resumen, las pruebas que contienen reactivos que se refieren a comporta
mientos pasados pueden parecer más confiables o estables de lo que deberían. Cuando se mide
la personalidad a lo largo del tiempo, es prudente evitar depender en exceso de instrumentos de
evaluación de autorreporte que contienen prejuicios históricos.
Capítulo Dos Evaluación de la personalidad, medición v diseño de iiivesli.gat-ión
VaMez
La validez se refiere al grado en que una prueba mide lo que afirma medir (Cronbach y Meehl,
1955; Wiggins, 2003). Establecer si una prueba en realidad mide lo que está diseñada para me
dir es una tarea compleja y desafiante. Hay cinco tipos de validez: validez aparente, validez
predictiva, validez convergente, validez discriminante y validez de constracto. La faceta más
simple de la validez se llama validez aparente. La validez aparente se refiere a si la prueba,
en la superficie, parece medir lo que se supone que mide. Por ejemplo, una escala que mide
un rasgo como la manipulación podría incluir los siguientes reactivos con validez aparente:
Hago un amigo tan sólo para obtener un favor; Embauqué a un amigo para que me diera in
formación personal; Me las arreglé para salirme con la mía aparentando ser cooperativo;
Fingí que estaba herido para conseguir que alguien me hiciera un favor. En vista de que la
mayoría de la gente está de acuerdo en que estos actos son manipuladores, la escala que los
contiene tiene una validez aparente muy alta. La validez aparente tal vez es el aspecto menos
importante de la validez. De hecho, algunos psicólogos afirman que la validez aparente se re
fiere a la suposición de validez, no a evidencia de validez real.
Un componente más importante de la validez es la validez predictiva. La validez pre
dictiva se refiere a si la prueba predice criterios externos a la prueba (por lo que a veces se lla
ma validez de criterio). Una escala que pretende medir la búsqueda de sensaciones, por
ejemplo, debería predecir cuáles individuos en verdad corren riesgos para obtener emociones
y excitación, como saltar en paracaídas o conducir una motocicleta. Un estudio reciente, por
ejemplo, encontró que una medida de búsqueda de sensaciones en realidad tuvo éxito al pre
decir una variedad de comportamientos de juegos de azar, como comprar billetes de lotería,
apostar en eventos deportivos, jugar póquer en video y usar máquinas tragamonedas, atesti
guando la validez predictiva de la medida de búsqueda de sensaciones (McDaniel y Zucker-
man, 2003). Una escala creada para medir la escrupulosidad debería predecir cuáles personas
en realidad llegan a tiempo a las reuniones y siguen las reglas. Las escalas que predicen con
éxito lo que deberían predecir tienen una validez predictiva alta.
Un tercer aspecto de la validez, llamado validez convergente, se refiere a si una prue
ba se correlaciona con otras medidas con las que debería correlacionarse. Por ejemplo, si una
medida de autorreporte de tolerancia corresponde bien con los juicios de tolerancia de sus se
mejantes, entonces se dice que la escala tiene una validez convergente alta. Al principio de
este capítulo describimos un estudio del “nivel de actividad”, en el cual los registros mecá
nicos del nivel de actividad tuvieron una correlación alta con los juicios basados en un ob
servador del nivel de actividad, otro ejemplo de validez convergente. La validez convergente
es alta según el grado en que las medidas alternativas del mismo constracto se correlacionen
o convergen con la medida objetivo.
Una cuarta clase de validez, llamada validez discrim inante, con frecuencia se evalúa
en forma simultánea con la validez convergente. Mientras la validez convergente se refiere
a aquello con lo que una medida debería correlacionarse, la validez discriminante se refie
re a aquello con lo que una medida no debería correlacionarse. Por ejemplo, un psicólogo po
dría elaborar una medida de satisfacción con la vida, la tendencia a creer que la vida de uno
es feliz, valiosa y satisfactoria. Sin embargo, hay otro rasgo llamado deseabilidad social, la
tendencia a decir cosas agradables acerca de uno mismo; por tanto, el psicólogo podría estar
preocupado con la validez discriminante de su medida de satisfacción con la vida y tratar de
mostrar que esta medida es diferente de medidas de conveniencia social. Parte de saber qué
mide en realidad una medida consiste en saber qué no mide.
Un tipo final de validez es la validez de constructo, definida como una prueba que mi
de lo que afirma medir, se correlaciona con lo que se supone que se correlaciona y no se co
rrelaciona con lo que se supone que no se correlaciona. Por tanto, es claro que la validez de
constructo es el tipo más amplio de validez, incluyendo la validez aparente, predictiva, con
vergente y discriminante. Esta forma de validez se llama validez de constructo porque se ba
sa en la noción de que las variables de personalidad son constructos teóricos. Si se le pide
Introducción
I
que “muestre su inteligencia” o “muestre su extraversión”, se vería apremiado para responder.
Esto se debe a que no hay algo que pueda producir y decir “Ésta es mi inteligencia” o “Ésta
es mi extro versión”. La inteligencia y la extraversión, como casi todas las variables de perso
nalidad, son abstracciones. No obstante, estos constructos teóricos son útiles para que los psi
cólogos describan y expliquen las diferencias entre personas. Determinar si las medidas reales
pueden afirmar que son formas válidas de evaluar los constructos es la esencia de la validez
de constructo.
¿Entonces, cómo sabemos si una medida tiene validez de constructo? Si una medida
converge con otras medidas del mismo constructo, si se relaciona con otras variables con las
que una teoría del constructo dice que debería y si no se relaciona con fenómenos que la teo
ría dice que no debería relacionarse, entonces tenemos los principios de la validez de cons
tructo. Por ejemplo, digamos que un investigador ha elaborado un cuestionario que mide la
creatividad y se está preguntando acerca de su validez de constructo. ¿Las puntuaciones del
cuestionario se correlacionan con otras medidas de creatividad reunidas en la misma muestra,
como estimaciones de creatividad proporcionadas por amigos (validez convergente) o pre
mios o calificaciones obtenidos en clases de bellas artes (validez predictiva)? Además, ¿los re
sultados se correlacionan con datos de pruebas conductuales de creatividad (por ejemplo,
pruebas en las que se les pide a los participantes que nombren usos creativos para objetos co
munes, como un martillo y una cuerda)?
Por último, si el investigador plantea la hipótesis de que la creatividad es diferente de la
inteligencia, por ejemplo, también será importante demostrar que la medida de creatividad no
se correlaciona con medidas de inteligencia (validez discriminante). Tales datos proporcionan
una base para determinar si una medida tiene validez de constructo. Cuando un número gran
de de relaciones conocidas se acumulan alrededor de una medida, entonces comenzamos a
creer que la medida es creíble como una medida de un constructo de personalidad específico.
Por ejemplo, si sabemos bastante sobre las correlaciones de una medida de creatividad, enton
ces podríamos decir que la medida tiene suficiente validez de constructo para hacer inferen
cias válidas sobre la creatividad, para probar teorías acerca de la creatividad y para medir la
creatividad en muestras de personas.
Generabilidad
Un tercer criterio para evaluar la personalidad mide su generabilidad (Cronbach y Gleser,
1965; Wiggins, 1973). La generabilidad es el grado en que la medida conserva su validez a lo
largo de varios contextos. Un contexto de interés podría ser diferentes grupos de personas. Un
psicólogo de la personalidad, por ejemplo, podría estar interesado en si un cuestionario con
serva su validez predictiva a lo largo de varios grupos de edad, género, culturas o grupos ét
nicos. ¿Una escala particular es igual de válida cuando se usa en hombres que cuando se usa
en mujeres? ¿Una prueba es igual de válida para afroamericanos y para estadounidenses de
origen europeo? ¿Es igual de válida entre japoneses e indonesios? ¿La escala mide el mismo
rasgo o cualidad entre estudiantes universitarios que entre adultos de edad madura? Si la es
cala es aplicable en forma amplia a lo largo de estas personas y contextos culturales, entonces
se dice que la escala tiene una generabilidad alta entre poblaciones de personas. La generabi
lidad es esencial para determinar el grado en que la medida puede aplicarse a lo largo de es
tos contextos sociales y culturales.
Otra faceta de la generabilidad se refiere a diferentes condiciones. ¿Una escala de do
minación, por ejemplo, predice quién se vuelve el líder en escenarios de negocios al igual que
en escenarios informales después del trabajo? ¿Una escala diseñada para medir la escrupulo
sidad predice quién llegará a tiempo a clase, así como quién mantendrá ordenada su recáma
ra? Las escalas tienen una generabilidad alta según el grado que se apliquen en forma amplia
en diferentes situaciones y condiciones.
De hecho, los conceptos de confiabilidad y validez pueden incluirse en el concepto de
generabilidad. La confiabilidad de prueba y repetición de la prueba, por ejemplo, pueden ver
Capítulo Dos Evaluación de la, personalidad, medición v diseño de investigación
se como generabilidad a lo largo del tiempo. La validez predictiva puede verse como genera-
bilidad en diferentes situaciones. Por tanto, empezando con un conjunto de puntuaciones de
escala, uno puede preguntar: “¿Cuáles son los contextos a lo largo de los cuales se pueden ge
neralizar estas puntuaciones?” Estos contextos incluyen la persona, la situación, la cultura y
el tiempo.
Las escalas que tienen un rango reducido de generabilidad pueden ser bastante útiles.
Una escala diseñada para medir las reacciones a vivir en un mundo sin gravedad, por ejem
plo, podría ser útil en extremo para predecir el éxito de astronautas, aun si no tiene generabi
lidad a ninguna persona o condición en la Tierra. El punto es que una mayor generabilidad no
siempre es mejor; más bien, lo que es importante es identificar de manera empírica los con
textos en los que la medida particular es aplicable y en los que no lo es.
En este capítulo hemos examinado los tipos de medidas de la personalidad y los medios p a
ra evaluar la calidad de estas medidas. El siguiente paso en la investigación de la personali
dad es usar estas medidas en diseños de investigación reales. Aunque las variaciones son casi
infinitas, hay tres diseños de investigación básicos en el campo de la psicología de la perso
nalidad: experimental, correlacional y el caso de estudio. Cada uno tiene ventajas y desventa
jas. Cada uno proporciona información que complementa la información proporcionada por
los otros.
Métodos experimentales
Los m étodos experim entales se usan de manera típica para determinar causalidad; es de
cir, para averiguar si una variable influye en otra variable. Una variable tan sólo es una cua
lidad que difiere, o puede tomar valores diferentes, para diferentes personas. La estatura,
por ejemplo, es una variable porque los individuos difieren entre sí en estatura. La agresi
vidad es una variable porque los individuos difieren en sus niveles de agresividad. Las carac
terísticas de la personalidad, como la extro versión y la simpatía, son otros ejemplos de
variables. A fin de establecer la influencia de una variable sobre otra, deben satisfacerse va
rios requisitos clave del diseño experimental óptimo: 1) m anipulación de una o más varia
bles y 2) asegurar que los participantes en cada condición experimental sean equivalentes
entre sí al principio del estudio.
En el primer requisito, manipulación, la variable que se cree que es la influencia se ma
nipula como parte del experimento. Por ejemplo, si se plantea la hipótesis de que un fárma
co influye en la memoria, entonces se le da el fármaco a algunos participantes y a otros
participantes se le dan píldoras de azúcar; luego se examina la memoria de todos los partici
pantes. El segundo requisito, equivalencia, se logra en una de dos formas. Si el experimento
tiene manipulación entre grupos, entonces la asignación aleatoria de los participantes a los
grupos experimentales es un procedimiento que ayuda a asegurar que todos los grupos sean
equivalentes al principio del estudio. Sin embargo, en algunos experimentos, la manipulación
está dentro de cada grupo individual. Por ejemplo, en el experimento de la memoria, se les po
dría dar el fármaco a los participantes y examinárseles la memoria, luego darles las píldoras
de azúcar y examinarles su memoria de nuevo. En este caso, cada participante está en ambas
condiciones. En esta clase de experimento (llamado diseño intraparticipante), la equivalencia
se obtiene contrabalanceando el orden de las condiciones, dando a la mitad de los partici
pantes primero el fármaco y luego la píldora de azúcar, y a la otra mitad primero la píldora de
azúcar y luego el fármaco.
El significado de cada una de estas características se aclarará por medio de un ejem
plo de un experimento de personalidad. Quizá sienta curiosidad acerca de por qué a algu-
ñas personas les gusta estudiar con el estéreo o la televisión encendidos, mientras otras de
mandan silencio total para estudiar. Una teoría de la personalidad predice que estas diferen
cias se relacionan con el nivel de extroversión-introversión de una persona, en cuyo caso
los extrovertidos presentan una tendencia a preferir montones de estimulación y los intro
vertidos prefieren muy poca. Imagine estar interesado en probar la hipótesis de que los ex
trovertidos funcionan mejor bajo condiciones de gran estimulación externa, mientras los
introvertidos funcionan mejor bajo condiciones de poca estimulación. Para probar esta hi
pótesis, podría darle primero a un grupo de participantes un cuestionario de autorreporte
que mide extroversión-introversión. Luego podría seleccionar sólo a aquellos individuos
que obtuvieron una puntuación en cualquier extremo, como muy introvertidos o muy extro
vertidos, para participar en su experimento. A continuación llevaría a estos participantes al
laboratorio y los haría trabajar en problemas de matemáticas y comprensión de la lectura
bajo dos diferentes condiciones: en una condición, un radio estaría sonando en el fondo y,
en la otra, habría silencio total. La mitad de cada grupo (es decir, la mitad de los extrover
tidos y la mitad de los introvertidos) se colocaría al azar primero en la condición de ruido
y luego en la condición callada. La otra mitad se colocaría primero en la condición callada y
luego en la condición ruidosa. Después, mediría el número de errores que cometió cada gru
po bajo cada una de las dos condiciones. Si la teoría de la personalidad que está probando
es correcta, debería obtener un patrón de resultados como el de la figura 2.1. Los resultados
hipotéticos en la figura 2.1 muestran que los extrovertidos cometieron menos errores en la
condición ruidosa y más errores cuando estaban callados. Los introvertidos mostraron el pa
trón opuesto: el ruido obstaculizó su desempeño, mientras que funcionaron mejor bajo con
diciones de silencio.
Este estudio, aunque hipotético, resalta las características clave de un buen diseño ex
perimental. La primera es la manipulación. En este caso, se manipuló la condición externa (la
variable independiente): el hecho de que hubiera mucho o muy poco ruido ambiental en el la
boratorio. La segunda característica es el contrabalanceo: la mitad de los participantes recibió
primero la condición ruidosa, mientras la otra mitad recibió primero la condición silenciosa.
El contrabalanceo es esencial porque podría haber efectos del orden como consecuencia de ser
expuesto primero a una condición. El contrabalanceo permite al experimentador descartar los
efectos de orden como una explicación para los resultados. La tercera característica es la asig
nación aleatoria. Por medio de ésta, todas las personas tienen una oportunidad igual de ser se
leccionados para una condición dada. La aleatorización puede ocurrir al lanzar una moneda o,
en forma más común, por el uso de una tabla de números aleatorios. La aleatorización asegu
ra que no hay patrones predeterminados vinculados con la asignación a la condición que pu
dieran explicar los resultados finales.
Las personas que estudian solas en la biblioteca tienen más probabilidad de ser introvertidas, mientras aquellas personas que estudian
en grupos tienen más probabilidad de ser extrovertidas.
Capítulo Dos Evaluación de la personalidad, medición y diseño de investigación
l
Figura 2.1
Desempeño en problemas de matemáticas y lectura.
Estudios correlaciónales
Un segundo tipo importante de diseño de investigación en la personalidad es el estudio corre-
lacional. En el m étodo correlaciona! se usa un procedimiento estadístico para determinar si
hay una relación entre dos variables o no. Por ejemplo, ¿las personas con una necesidad ele
vada de logro en la universidad ganan en la adultez salarios superiores que las personas con
una necesidad inferior de logro? En los diseños de investigación correlacional, el investigador
está intentando identificar en forma directa las relaciones entre dos o más variables, sin impo
ner las clases de manipulación vistas en los diseños experimentales. Es decir, el diseño corre
lacional de manera típica trata de determinar qué va con qué en la naturaleza, en lugar de
intentar manipular o influir en el fenómeno bajo observación. Podríamos estar interesados, por
ejemplo, en la relación entre la autoestima, evaluada por medio de datos A, y la estima que
otros tienen por una persona, evaluada por medio de datos O. O podríamos estar interesados
en la forma en que una medida de motivación para el logro se relaciona con el rendimiento
académico evaluado por medio del promedio de calificaciones. Una ventaja importante de los
estudios correlaciónales es que nos permiten identificar relaciones entre variables conforme
ocurren en forma natural. Para continuar con el ejemplo de la extroversión-introversión y de
sempeño bajo condiciones ruidosas, podríamos medir las preferencias de las personas para es
tudiar con o sin música en la vida real, luego ver si hay una correlación con sus puntuaciones
en una medida de introversión-extraversión.
El procedimiento estadístico más común para medir las relaciones entre variables es el
coeficiente de correlación. Para entender lo que indican los coeficientes de correlación, to
me en cuenta la relación existente entre la estatura y el peso. Podríamos tomar una muestra de
100 estudiantes universitarios y medir su estatura y su peso. Si hacemos una gráfica de los re
sultados en un diagrama de dispersión, vemos que las personas que son altas también tienden
a ser relativamente pesadas y que las personas que son bajas tienden a pesar menos. Pero hay
excepciones, como puede verse en la figura 2.2.
Los coeficientes de correlación pueden variar de +1.00 pasando por 0.00 hasta -1.00.
Es decir, las variables de interés pueden correlacionarse de manera positiva entre sí (+.01 a
+ 1.00), no relacionarse entre sí (0.00) o correlacionarse de manera negativa entre sí (-.01
a -1.00). Sucede que la estatura y el peso se correlacionan fuertemente en forma positiva
entre sí, con un coeficiente de correlación calculado de +.60, para los datos que se muestran
en la figura 2.2.
Considere un ejemplo de tipo psicológico. Suponga que estamos interesados en la re
lación entre la autoestima de la gente y la cantidad de tiempo que son infelices. Podríamos
ver un diagrama de dispersión como el que se describe en la figura 2.3 más adelante. Este
diagrama de dispersión se obtuvo de una muestra de estudiantes universitarios, usando una
medida de cuestionario estándar de autoestima. Como la segunda variable, una medida de in
felicidad, se les pidió a los participantes que llevaran un diario por dos meses, anotando pa
ra cada día si había sido bueno en general (se sentían felices) o malo en general (se sentían
CAPÍTULO Dos Evaluación de la personalidad, medición y diseño de investigación
109
10 0 - • • •
91 • • •
• •
• •
• •
82
• •
o
£ • •
73 •• • •
• •
63 • • •
55
• •
45 • • •
36 _L l
1.40 1.52 1.65 1.77 1.89 2.01 2.13
Estatura en metros
Figura 2.2
Gráfica de 55 casos que muestra una correlación positiva alta entre la estatura y el peso. Cada símbolo (•)
representa una persona que fue medida tanto en estatura como en peso. Las personas más pesadas tienden
a ser más altas; las personas menos pesadas tienden a ser más bajas.
infelices la mayor parte del día). Luego se calculó el porcentaje de días para cada sujeto don
de reportaba haber sido infeliz. Como puede verse en la figura 2.3, conforme aumenta la au
toestima, el porcentaje de tiempo que una persona es infeliz tiende a disminuir. En contraste,
aquellos con autoestima baja tienden a ser muy infelices. En otras palabras, hay una correla
ción negativa entre la autoestima y el porcentaje de tiempo infeliz, en este caso, aproxima
damente -.60.
Introducción
Como un último ejemplo, suponga que estamos interesados en la relación entre extra
versión y estabilidad emocional (la tendencia a preocuparse y estar ansioso). La relación se
describe en la figura 2.4. Como podrá ver, parece que no hay relación entre la extraversión
y la estabilidad emocional; conforme aumenta una variable en una muestra de personas, la
Capítulo Dos Evaluación de la personalidad, medición y diseño de investigación
9 -
8 -
• • •
• • • «(
7
• • • •
•
— •
6 • • •
• •
• • • •
c • • « M t
'O
’{/> •M
03
> E
0 • • M
O
i_ • • • M
■X .
UJ • • • • •
• •
4 • •
• •
3 -
2 -
1
¡ _______ i _______ ... I !
Estabilidad emocional
Figura 2.4
Gráfica de 57 casos para mostrar la relación entre la estabilidad emocional y la extroversión. La correlación
entre estas dos variables es 0.00, lo que significa que no hay relación. En consecuencia, en el diagrama de
dispersión, vemos que las personas se ubican en forma uniforme en todas las secciones de la gráfica, sin un
patrón claro.
otra puede aumentar, disminuir o permanecer igual. En este caso, el coeficiente de correla
ción es 0.00. Esto significa que puede encontrar personas con todas las combinaciones dife
rentes de extroversión y estabilidad emocional, como personas que son sociables y abiertas,
pero también muy neuróticas e inestables. En resumen, las relaciones entre variables pueden
ser positivas, negativas o ninguna de las dos, como lo indican las correlaciones positivas, ne
gativas o cero.
La mayoría de los investigadores no están interesados tan sólo en la dirección de la re
lación; también se interesan en la magnitud de la relación, o qué tan grande o pequeña es. Aun
que lo que se considera grande o pequeño depende de muchos factores, los científicos sociales
han adoptado una convención general. Las correlaciones alrededor de .10 se consideran pe
queñas; aquellas alrededor de .30 se consideran medianas y aquellas alrededor de .50 o más
se consideran elevadas (Cohén y Cohén, 1975). Usando los ejemplos en las figuras 2.2 a 2.4,
la correlación +.60 entre la estatura y el peso se considera grande, como lo es la correlación
de -.6 0 entre la autoestima y el porcentaje de tiempo infeliz. Estas correlaciones son equiva
lentes en magnitud, pero diferentes en signo.
El concepto de significancia estadística también puede aplicarse a los valores de corre
lación. Esto es, en esencia, parte del cálculo estadístico, y da como resultado un valor numé
rico acerca de la probabilidad de encontrarse una correlación de este tamaño por azar, dadas
las variables medidas y el tamaño de la muestra. Aquí los psicólogos también requieren una
probabilidad de .05 o menos antes de decir que una correlación es significativa.
Es importante tomar en cuenta que uno no puede inferir causalidad de las correlaciones.
Al menos hay dos razones por las que las correlaciones nunca pueden demostrar causalidad.
Una se llama problem a de direccionalidad. Si A y B se correlacionan, no sabemos si A es la
causa de B o si B es la causa de A. Por ejemplo, sabemos que hay una correlación entre extra
versión y felicidad. A partir de este solo hecho, no sabemos si ser extrovertido causa que las
personas sean felices o si ser feliz causa que las personas sean extrovertidas.
La segunda razón de que las correlaciones nunca pueden demostrar causalidad es el
problem a de la tercera variable. Podría ser que dos variables se correlacionen debido a una
tercera variable desconocida que causa ambas. Por ejemplo, la cantidad de helados vendidos
en cualquier día dado puede correlacionarse con el número de personas que se ahogaron ese
día particular. ¿Esto significa que comer helado causa ahogamiento? No necesariamente, ya
que es más probable que esté en funcionamiento una tercera variable: el clima caluroso. En
días muy calurosos, muchas personas comen helado. Además, en días muy calurosos, van a
nadar muchas personas que de otra manera no nadan mucho, así que es probable que un ma
yor número se ahogue en dichos días. Ahogarse no tiene nada que ver con comer helado; más
bien, es probable que estas dos variables sean causadas por una tercera variable: el clima ca
luroso. Tanto con los métodos correlaciónales como con los experimentales, es importante re
conocer que no todos los individuos se ajustan a las generalizaciones establecidas en los
estudios donde participan.
Estudios de caso
A veces un investigador de la personalidad está interesado en examinar la vida de una per
sona a profundidad como un estudio de caso. Hay muchas ventajas en el m étodo del estu
dio de caso. Los investigadores pueden averiguar sobre la personalidad con gran detalle, lo
cual rara vez puede lograrse si el estudio incluye un gran número de personas. Los estudios
de caso pueden dar a los investigadores ideas de la personalidad que luego pueden usarse
para formular una teoría más general que se probará en una población más grande. Y pue
de proporcionar conocimiento profundo de un individuo sobresaliente en particular, como
Mahatma Gandhi o Martin Luther King. Los estudios de caso también pueden ser útiles pa
ra estudiar fenómenos raros, como una persona con una memoria fotográfica o una persona
con personalidades múltiples, casos para los que sería difícil o imposible obtener muestras
grandes.
Un estudio de caso reciente ocupó un número entero del Journal o f Personality
(Nasby y Read, 1997). Este estudio presenta el caso de Dodge Morgan, quien, a la edad de
54 años, completó él solo una circunnavegación de la Tierra sin escalas en un barco peque
ño. El estudio de caso publicado por Nasby y Read es una narración muy legible de este in
teresante hombre que emprendió una tarea casi imposible. El enfoque era ver cómo las
primeras experiencias en la vida del señor Morgan formaron una personalidad adulta particu
Capítulo Dos Evaluación de la personalidad, medición v diseño do ¡m itigación
lar, la cual lo condujo a emprender el acto extremo de viajar solo alrededor del
mundo en un barco pequeño. Los psicólogos usaron la bitácora de viaje de Morgan,
material autobiográfico, entrevistas e incluso cuestionarios de personalidad están
dares para realizar su estudio de caso. El informe es notable porque los psicólogos
también comentaron las ventajas y desventajas del método de estudio de caso para
hacer progresos en la ciencia de la psicología de la personalidad. Los autores con
cluyeron que las teorías de la personalidad proporcionan un lenguaje para exponer
vidas individuales; el análisis de vidas individuales, a su vez, proporciona un me
dio para evaluar las teorías de la personalidad respecto a cómo pueden ayudarnos
a entender individuos específicos.
En el diseño de estudio de caso puede usarse una amplia gama de herra
mientas. Se pueden elaborar sistemas de codificación para ser aplicados a textos
escritos, como las cartas personales y correspondencia de la persona bajo estudio.
Se pueden entrevistar a docenas de personas que conocen al individuo en estudio. Se
puede entrevistar al participante por horas y con una gran profundidad. Se puede
seguir a la persona con una cámara de video y grabar, con sonido e imagen, las
acciones en su vida cotidiana. En suma, las técnicas de evaluación usadas en los
diseños de estudio de caso sólo están limitadas por la imaginación del investigador.
Dodge Morgan tenía 54 años de edad
Estudio de caso: un niño en busca de atención cuando completó solo una circunnave
Uno de los defensores más fuertes del método de estudio de caso fue Gordon All- gación de la Tierra sin escalas en su
port, uno de los fundadores del campo de la psicología moderna de la personalidad. barco American Promise. Un estudio
Allport creía con firmeza que podían surgir hipótesis importantes sobre la persona de caso extenso de este fascinante
lidad a partir del examen a profundidad de individuos aislados. También creía que hombre fue realizado por los psicólo
uno podía probar hipótesis acerca de las características de personalidad subyacen
gos William Nasby y Nancy Read, y lo
tes de un solo individuo usando métodos de estudio de caso. El siguiente ejemplo
ilustra esta clase de formación y prueba de hipótesis: dieron a conocer en su artículo “The
Life Voyage o f a Solo Circumnaviga
Cierto niño mostraba en la escuela una conducta ejemplar; era ordenado, la tor”publicado en Journal of Persona
borioso y atento. Pero en casa era ruidoso, revoltoso y abusivo con los niños lity, 1997, volumen 65, páginas
más pequeños... 787-1053.
Ahora el psicólogo podría plantear la hipótesis: esta disposición central
del niño es un anhelo de atención. Encuentra que consigue su fin mejor en la
escuela conformándose con las reglas; en casa, desobedeciéndolas.
Después de plantear esta hipótesis, el psicólogo podría contar en realidad los ac
tos del niño durante el día (siendo comprobado por algún observador independiente) p a
ra ver cuántos de ellos fueron “equivalentes desde el punto de vista funcional”; es decir,
manifestaban un intento claro de llamar la atención. Si la proporción es alta, podemos
considerar la hipótesis como confirmada, y la disposición de personalidad como estable
cida. (Allport, 1961, p. 368.)
Ted Bundy, asesino serial convicto, muestra la personalidad característica del clásico sociopata.
CAPÍTULO Dos Evaluación de la personalidad, medición y diseño de investigación 55
'
■
c ro c io
Piense en una pregunta acerca de un aspecto de la personalidad. La mayor parte de las pregun
tas adoptan la forma de “¿La variable A se relaciona con la variable B o es causada por ésta?”
Por ejemplo, ¿las personas extrovertidas son mejores que las introvertidas para afrontar el es
trés? ¿Las personas con autoestima alta tienen más probabilidad de ser exitosas que las personas
con autoestima baja? ¿Las personas narcisistas tienen problemas para llevarse bien con otros?
Escriba su pregunta acerca de la personalidad. Ahora piense acerca de cómo podría contestar a
su pregunta usando un experimento, usando el método correlacional y haciendo un estudio de
caso. Describa en forma breve cómo usaría cada uno de estos tres diseños de investigación para
tratar de responder su pregunta.
Sin embargo, hay personas que, por cualesquiera circunstancias desafortunadas, han te
nido varios años de muy mala nutrición. Por tanto, podría hacerse un estudio correlacional so
bre si el nivel de nutrición se relaciona con el desarrollo de la inteligencia. Esta desventaja del
diseño de investigación experimental es precisamente la ventaja del diseño correlacional. Los
diseños correlaciónales son adecuados de manera ideal para establecer la relación entre dos o
más variables que ocurren en la vida cotidiana, como entre la estatura y la dominación, la es
crupulosidad y el promedio de calificaciones, o la ansiedad y la frecuencia de enfermedades.
Pero los diseños correlaciónales son malos para establecer causalidad. No pueden determinar,
por ejemplo, si las enfermedades recurrentes conducen a la ansiedad, si la ansiedad conduce
a la enfermedad o si una tercera variable explica tanto estar con frecuencia enfermo como es
tar con frecuencia ansioso.
Los estudios de caso son ideales para generar hipótesis que pueden probarse después
usando métodos correlaciónales o experimentales. Los estudios de caso pueden usarse para
identificar patrones en el funcionamiento psicológico individual que podrían ser pasado por
alto por el enfoque experimental más riguroso pero artificial y los diseños correlaciónales li
mitados. Además, los estudios de caso son ideales para describir la riqueza y complejidad de
la experiencia humana. A pesar de estas ventajas, los estudios de caso no pueden establecer
causalidad, como los métodos experimentales, ni pueden identificar patrones de covariación
entre individuos conforme ocurren en la naturaleza. Los estudios de caso tampoco pueden ge-
neralizarse a nadie aparte del individuo único que se está estudiando. Juntos, los tres diseños
proporcionan métodos complementarios para explorar la personalidad humana.