Capítulo 2 Evaluación de La Personalidad, Medición y Diseños de Investigación PDF

Evaluación de la personalidad,
medición y diseño
de investigación
UC UdjlUO UCi 1(1 peí ouildliutu
Datos de autorreporte (datos A)
Datos de reporte del observador (datos O)
Datos de prueba (datos P)
Datos de resultados de la vida (datos V)
Problemas en la evaluación de la personalidad
KtnidAjiuii uc ím me
Confiabilidad
Validez
Generabilidad
ísenos ae investí^
Métodos experimentales
Estudios correlaciónales
Estudios de caso
Cuándo usar diseños experimentales, correlaciónales y de estudio de caso
R esum en y evaluació n
iü
■'■•i
_______ ______________ ______
24
INTRODUCCION
I
RESI DE
wmvJohnKei
John
JCIIM
R JE
% -r*
* %c
f e
<§p§*:
Gran parte de la discusión

que rodea a los candidatos
políticos implica sus perso
magine que se aproxima una elección presidencial y se enfrenta a elegir entre nalidades.
dos candidatos. Las personalidades de los candidatos pueden resultar ser esenciales pa
ra su decisión. ¿Cómo se conducirán bajo estrés? ¿Cuáles son sus actitudes hacia el
aborto o el control de armas de fuego? ¿Se mantendrán firmes al negociar con líderes
de otros países? Este capítulo trata de los medios por los cuales obtenemos informa
ción sobre la personalidad de otras personas: las fuentes de las que obtenemos datos de
la personalidad y los diseños de investigación que usamos en el estudio científico de la
personalidad.
Cuando delibere entre los dos candidatos presidenciales, podría desear saber lo
que dicen acerca de sus valores y actitudes, por medio de un autorreporte. Podría de
sear saber lo que otros dicen acerca de sus puntos fuertes al tratar con líderes extranje
ros, por medio del reporte de un observador. Estas dos fuentes de datos pueden decirle
mucho, mas no todo. También podría interesarle colocar a los candidatos en una situa
ción más controlada, como un debate, y ver cómo se desempeña cada uno, es decir, da
tos de prueba. Además, podría desear conocer acerca de ciertos eventos en sus vidas,
como si alguna vez usaron sustancias ilegales, si alguna vez eludieron el servicio mili
tar o si alguna vez han sido involucrados en un escándalo sexual vergonzoso, datos his
tóricos de la vida.
Cada una de estas fuentes de datos revela algo sobre los rasgos de personalidad
de los candidatos presidenciales, pero cada uno de ellos por sí solo está incompleto y
puede estar prejuiciado. (Para análisis fascinantes de la personalidad de candidatos pre
sidenciales, véase Immelman, 2002; Post, 2003; y Renshon, 1998). El candidato puede
reportar una postura dura contra el crimen, pero luego no sostenerla. Los observadores
pueden reportar que el candidato es honesto, pero pueden no estar enterados de las men
tiras que haya dicho. Un debate puede mostrar a un candidato bajo una luz positiva, pe
ro quizá resultó que el otro candidato tenía un resfriado ese día. El registro público de
haber servido en la reserva militar puede no revelar las conexiones familiares que per
mitieron al candidato evitar el combate. Cada fuente de datos proporciona información
importante. Pero cada fuente, por sí sola, es de valor limitado, un cuadro incompleto.
Introducción
En este capítulo se cubren tres temas relacionados con la evaluación y la investigación

de la personalidad. El primero se refiere a dónde obtenemos nuestra información sobre la per
sonalidad: las fuentes de datos de la personalidad y las medidas reales que usan los psicólo
gos de la personalidad. El segundo tema se refiere a cómo evaluamos la calidad de esas
medidas. Y el tercer tema está relacionado con la forma en que usamos estas medidas en di
seños de investigación reales para estudiar la personalidad.
La primera pregunta ofrece el punto de partida más básico: ¿cuáles son las fuentes de
información clave acerca de la personalidad de un individuo?
Quizá la fuente más obvia de información sobre una persona son los datos de au torrep o rte
(datos A), la información que revela una persona, basada en algún procedimiento, como un
cuestionario o una entrevista. Es obvio que los individuos pueden no siempre dar información
precisa sobre sí mismos por una variedad de razones, como el deseo de presentarse bajo una
luz positiva. No obstante, las revistas que publican las investigaciones más recientes de la per
sonalidad revelan que el autorreporte es el método más común para medirla.
Los datos de autorreporte pueden obtenerse a través de una variedad de medios, incluyendo
entrevistas que plantean preguntas a una persona, informes periódicos de una persona que re
gistra los eventos conforme suceden y cuestionarios de varias clases. El método del cuestio
nario, en el que los individuos responden a una serie de reactivos que solicitan información
acerca de ellos mismos, es con mucho el procedimiento de evaluación del autorreporte más
usado.
Existen buenas razones para usar el autorreporte. La razón más obvia es que los indivi
duos tienen acceso a una riqueza de información sobre sí mismos que es inaccesible para al
guien más. Los individuos pueden informar acerca de sus sentimientos, emociones, deseos,
creencias y experiencias personales. Pueden informar acerca de su autoestima, así como de su
percepción de la estima en la que creen que los tienen otros. Pueden informar sobre sus temo
res y fantasías más secretos. Pueden informar sobre la forma en que se relacionan con otros y
cómo otros se relacionan con ellos. Y pueden informar acerca de sus metas inmediatas y a lar
go plazo. Debido a esta riqueza de información potencial, el autorreporte es una fuente indis
pensable de datos sobre la personalidad.
El autorreporte puede adoptar una variedad de formas, que van desde preguntas abier
tas tipo “llene los espacios en blanco” hasta preguntas de elección forzada como verdadero
o falso. A veces se conocen como pruebas de personalidad no estru c tu rad as (abiertas, co
mo “Cuénteme sobre las fiestas que le gustan más”) y e stru c tu rad as (“Me gustan las fies
tas ruidosas y atestadas”, responda “verdadero” o “falso”). Un ejemplo destacado de la
forma abierta de autorreporte es la Prueba de las veinte afirmaciones (véase la sección “Un
acercamiento detallado” para más información). En esta prueba, un participante recibe una
hoja de papel que está en blanco casi por completo, con excepción de las palabras “Yo soy”
repetidas 20 veces. Hay un espacio después de cada una de estas afirmaciones parciales, y
se les pide a los participantes que las completen. Por ejemplo, una persona podría decir, en
este orden: Yo soy una mujer; Yo soy joven; Yo soy tímida; Yo soy inteligente; Yo soy alguien
a quien le gustan las noches tranquilas en casa; Yo soy introvertida; y así en forma sucesi
va. Los instrumentos de personalidad que usan formatos de pregunta abierta requieren es
quemas de codificación para clasificar las respuestas que obtienen. En otras palabras, los
psicólogos deben idear una forma de calificar o interpretar de alguna otra manera para dar
Capítulo Dos Evaluación de la, personalidad, medición y diseño de inyesliiafión 27
Un acercamiento detallado ¿Quién soy?

La Prueba de las veinte afirm aciones fue llazgo im plica que parte de un matrimonio form as en que los Individuos se ven a sí
publicada por un par de sociólogos, M a n - exitoso es incorporar el papel del m atrimo mismos.
ford Kuhn y Thom as M c P a rtla n d , que esta nio en la definición de uno mismo, de modo Ha habido una tendencia hacia el
ban in tere sad o s en las a c titu d e s que que el autoconcepto incluye al cónyuge, uso de la cultura y el origen étnico en las
tenían las personas hacia sí mismas. En relación m atrim onial y fam ilia nueva de a u to d e fin ic io n e s (B o ch n er, 1994). Ésta
1954, publicaron un Inform e de un estudio uno. coincide con el Increm ento repentino en el
en el que idearon la prueba que llam aron En la década de 1970, los investiga interés en la investigación transcuitural.
"¿Quién soy?" Esta prueba era sencilla y dores vieron a la p v a con una m irada más Un ejem plo de un estudio transcuitural
le pedía al participante tan sólo que res crítica. Por ejem plo, es un cuestionario que usó la p v a es un estudio que com para
pondiera esta pregunta com pletando la abierto, así que las personas con poca ca a personas de Kenia con personas de Es
frase "Yo s o y ____________ " 20 veces. Kuhn pacidad verbal no lo com pletan tan rápido tados Unidos. Se com pararon varios gru
y M cP artlan d elaboraron una form a de c a o en form a tan m inuciosa como las perso pos en función del porcentaje de sus 20
lificar la prueba que im plicaba analizar el nas con gran capacidad verbal, lo que respuestas que Incluían referencias a c a
contenido de las respuestas de la perso conduce a que las puntuaciones de la tegorías de grupo social (por ejem plo, soy
na. A dem ás, se consideraba que el orden prueba estén prejuiciadas por diferencias un miembro del consejo de la escuela lo
de cada respuesta era significativo (por de Inteligencia entre los participantes (N u- cal o soy un jugador del equipo local de
ejem plo, algo m encionado antes podría delm an, 1973). Sin em bargo, si se les da softbol). Los estudiantes universitarios es
ser m ás Im portante para la autodeflniclón suficiente tiem po a las personas para tadounidenses m encionaron grupos so
que algo m encionado después). com pletar las 20 preguntas, al menos 15 ciales en sus autodefiniciones 12% del
Los psicólogos se enteraron pronto minutos, entonces parece que se elim ina tiem po. En Kenla, los estudiantes universi
de esta prueba, aun cuando fue publicada el prejuicio de la inteligencia. C onsiderán tarios m encionaron grupos sociales 17%
en American Sociological Review, una re dolo todo, la p v a sobrevivió esta década de del tiem po. Sin em bargo, para los ciu dada
vista que de m anera típica los psicólogos cuestionam lento y surgió como una m edi nos kenianos rurales tradicionales, los re
no leen, y com enzaron a usarla en su Inves da que el cam po consideraba útil para sultados fueron bastante diferentes. Los
tigación. Debido a que la prueba implicaba evaluar la form a en que las personas se integrantes de la tribu m assai en Kenia
hacer que los participantes produjeran 20 definían a sí mismas. m encionaron grupos sociales en sus res
afirm aciones sobre sí mismos, pronto se En la década de 1980, la p v a se usó puestas 80% del tiem po, y m iem bros de la
conoció en la literatura psicológica como la en el estudio de varios tem as de persona tribu sam buru m encionaron grupos so cia
Prueba de las 20 afirm aciones. lidad oportunos, como la influencia del g é les en sus respuestas a la p v a 84% del
En la primera década de uso por los nero y otros pap eles s o c ia le s en las tiem po (M a y Schoenem an, 1997). R esulta
psicólogos, la Prueba de las veinte afirm a a u to d e fin ic io n e s de las personas. Por dos como éstos m uestran cóm o la cultura
ciones (o p v a , para abreviar) se aplicó sobre ejem plo, un estudio com paró a m ujeres en la que somos criados puede te n e r una
todo a preguntas de Investigación clínica y casadas y solteras en función de sus res influencia fuerte en la form a en que nos
de personalidad. Por ejemplo, un estudio puestas a la p v a (Gigy, 1980). Las m ujeres vem os a nosotros mismos y lo que consi
usó la p v a para ver si los autoconceptos de casadas tendieron a responder a la pre deram os que es im portante para definir
las personas en matrimonios "desadapta gunta "¿Quién soy?" m encionando re la nuestra identidad y al responder la pre
dos" diferían de los autoconceptos de las ciones (soy una madre, soy una esposa), gunta "¿Quién soy?" La Prueba de las
personas en matrimonios "bien adaptados" papeles adquiridos en la vida fam iliar (soy veinte afirm aciones es una form a útil para
(Buerkle, 1960). Los resultados mostraron la que alimenta a los niños) y actividades evaluar cóm o se definen a sí m ismas ias
que las personas en matrimonios adapta dom ésticas (soy la que compra ¡a despen personas y para aprender lo que es im por
dos tendían a m encionar a su cónyuge, su sa). Es evidente que el m atrim onio puede tan te para la com prensión de sí misma de
m atrim onio y su fam ilia con m ás fre c u e n significar un gran cam bio en el autocon un individuo.
cia en su autodefiníción que las personas cepto, y estudios como éste docum entan
en m atrim onios desadaptados. Este ha el vínculo entre los papeles sociales y las
sentido a las respuestas abiertas del participante. Por ejemplo, para darse una idea de cuán
sociable es la mujer de nuestra prueba, el psicólogo podría contar cuántas afirmaciones se
refieren a características sociales.
Más comunes que los cuestionarios abiertos son los cuestionarios de personalidad es
tructurados, en los que se proporcionan las opciones de respuesta. La forma más simple del
Introducción
r
cuestionario de autorreporte estructurado implica una serie de adjetivos descriptivos de ras
gos, como activo, ambicioso, ansioso, arrogante, artístico, generoso, gregario, codicioso,
bondadoso, xenofóbico y disparatado. Se les pide a los individuos que indiquen si cada ad
jetivo los describe o no. El formato más simple para presentar estos términos es una lista de
verificación, como la Lista de Verificación de Adjetivos (Adjective Check List, ACL: Gough,
1980). Al completar la LVA, los individuos tan sólo colocan una marca junto a aquellos ad
jetivos que sienten que los describen mejor. La persona marca los reactivos que la describen
y deja en blanco aquellos reactivos que no la describen. Un método más complejo implica
solicitar a los participantes que indiquen en forma numérica el grado en que cada término del
rasgo los caracteriza, digamos en una escala de valoración de 7 puntos que va de 1 (menos
característico) a 7 (más característico). Esta se llama escala de estimación Likert (en honor
de la persona que la inventó) y tan sólo es una forma para que alguien exprese con números
el grado en que un rasgo particular lo describe. Una típica escala de estimación Likert luce
como ésta:
ENÉRGICO
1 2 3 4 5 6 7
Menos característico Más característico
De manera más común, una escala de personalidad consiste en sumar las puntuaciones
en una serie de escalas de estimación individuales. Una escala de personalidad para el nivel
de actividad, por ejemplo, podría consistir en sumar puntuaciones de escalas de estimación en
enérgico, activo y vigoroso.
10
Instrucciones: Esta lista contiene una serie de adjetivos. Por favor léalos rápido y ponga una X
sobre la raya junto a cada uno de los que considere autodescriptivos.
__ distraído ___alegre ___ dependiente

__ activo ___civilizado ___ abatido
__ adaptable ___ lúcido ___ decidido
__ aventurado ___ ingenioso ___ digno
__ afectado ___ honesto ___ discreto
__ afectuoso ___ frío ___ desordenado
__ compasivo ___ susceptible ___ disparatado
Sin embargo, son más comunes los cuestionarios de autorreporte en forma de afirma
ciones que las listas de verificación de adjetivos. Ejemplos de inventarios de autorreporte usa
dos en forma amplia son el Inventario de Personalidad n e o (Costa y McCrae, 2000) y el
Inventario Psicológico de California (California Psychological Inventory, c p i ) (Gough,
1957/1987). Reactivos de muestra del CPI son Disfruto las reuniones sociales tan sólo por
estar con personas; Respeto a mi padre como un hombre ideal; Una persona necesita “fa n
farronear” un poco de vez en cuando; Tengo un deseo muy intenso de tener éxito en el mundo;
Soy muy lento para decidirme. Los participantes leen cada afirmación y luego indican en una
hoja de respuestas si están de acuerdo con la afirmación y sienten que es verdadera para ellos
o están en desacuerdo con la afirmación y sienten que es falsa respecto a ellos. Reactivos de
muestra del Inventario de Personalidad n e o son Me gusta la mayoría de la gente que conoz-
('APÍTL10 Dos Evaluación de la personalidad, medición y diseño de invesliflifión
co, me río con facilidad; Con frecuencia me disgusto con la gente con la que tengo que tratar.
Los participantes indican el grado en que están de acuerdo en que el reactivo los describe
usando una escala L ik ert del 1 al 5, con 1 anclado a frase fuertemente en desacuerdo y 5
anclado a fuertemente de acuerdo.
Escoja una característica de personalidad que le gustaría medir. Empiece por escribir una defi
nición clara de esa característica. Por ejemplo, podría elegir características como amigable, dili
gente, ansioso o narcisista. Luego escriba un cuestionario breve, de unos cinco reactivos de largo,
para medir esta característica. Sus reactivos pueden ser afirmaciones o adjetivos, y pueden ser
abiertos, verdadero-falso o en una escala de respuesta Likert. Luego dé su cuestionario a otras
personas. ¿Qué tan fácil fue escribir los reactivos? ¿Considera que su medida evalúa con preci
sión el rasgo?
Las medidas de autorreporte, como todos los métodos, tienen limitaciones y desventa
jas. Para que el método de autorreporte sea efectivo, los que responden deben estar dispues
tos y ser capaces de responder las preguntas que se les hacen, pero las personas no siempre
son honestas, en especial cuando se les pregunta sobre experiencias poco convencionales, co
mo deseos inusuales, prácticas sexuales poco convencionales y rasgos que podrían ser consi
derados indeseables. Algunas personas pueden carecer de un conocimiento preciso de sí
mismos. Debido a estas limitaciones, los psicólogos de la personalidad a menudo usan fuen
tes de información que no dependen de la honestidad o perspicacia del participante. Una de
esas fuentes son los observadores.
Aplicación
El muestreo de experiencia; una nueva idea en el autorreporte. Una fuente de datos relativamen
te nueva en la investigación de la personalidad se llama muestreo de experiencia (por ejemplo,
Hormuth, 1986; Larsen, 1989). En este método, las personas responden algunas preguntas, qui
zá acerca de sus estados de ánimo o síntomas físicos, todos los días durante varias semanas o
más. Por lo general se hace contacto con las personas en forma electrónica (con radiolocalizador)
una o más veces al día a intervalos aleatorios para completar las medidas. En un estudio, 74 es
tudiantes universitarios reportaron sus estados de ánimo todos los días durante 84 días consecu
tivos (Larsen y Kasimatis, 1990). Los investigadores estaban interesados en descubrir los
vínculos entre el día de la semana y el estado de ánimo. De modo no sorprendente, encontraron
un fuerte ciclo semanal en los estados de ánimo de tales estudiantes universitarios, con los esta
dos de ánimo positivos llegando a un máximo en viernes y sábado, y los estados de ánimo nega
tivos llegando a un máximo en martes y miércoles (el lunes no fue el peor día de la semana). Los
introvertidos resultaron tener un ciclo de estado de ánimo semanal mucho más regular que los
extrovertidos. Es decir, los estados de ánimo de los introvertidos fueron más predecibles a partir
de este ritmo de siete días que los estados de ánimo de los extrovertidos. Es probable que esta di
ferencia se debiera al hecho de que los extrovertidos tienen menos probabilidad de esperar al fin
de semana para hacer cosas que los ponen de buen humor: ir a fiestas, socializar o salir a una co
mida especial con sus amigos. Los extrovertidos por lo regular evitan la rutina en su vida diaria,
mientras que los introvertidos llevan vidas más predecibles.
Aplicación (continuación)
Aunque el muestreo de experiencia usa el autorreporte como la fuente de datos, difiere de

los métodos de autorreporte más tradicionales porque es susceptible de detectar patrones de
comportamiento a lo largo del tiempo. Por tanto, el muestreo de experiencia proporciona infor
mación que no está disponible con facilidad usando cuestionarios aplicados en un solo punto en
el tiempo. Es un método excelente, por ejemplo, para obtener información acerca de la forma
en que puede aumentar y disminuir la autoestima de una persona con el tiempo, o cómo reac
ciona una persona ante el estrés de la vida día con día.
Datos de reporte del observador (datos 0)

En la vida cotidiana nos formamos impresiones y hacemos evaluaciones de otros con quienes
entramos en contacto. Para cada individuo, normalmente hay docenas de observadores que se
forman dichas impresiones. Nuestros amigos, familiares, profesores y conocidos casuales son
todos fuentes potenciales de información acerca de nuestra personalidad. Los datos de re p o r
te deí observador (datos O) conforman estas fuentes y proporcionan herramientas para reco
pilar información acerca de la personalidad de una persona.
Los reportes del observador poseen ventajas y desventajas como fuentes de datos de la
personalidad. Una ventaja es que los observadores pueden tener acceso a información que no
se puede conseguir en otras fuentes. Por ejemplo, los observadores pueden reportar acerca de
las impresiones que da una persona a otros, su reputación social, si las interacciones con otros
son suaves o llenas de conflictos y la posición relativa de la persona dentro de la jerarquía
del grupo.
Una segunda ventaja de los reportes de observadores es que pueden usarse muchos ob
servadores para evaluar a cada individuo, mientras que en el autorreporte sólo una persona
proporciona información. El uso de muchos observadores permite a los investigadores evaluar
el grado de consenso entre observadores, también conocida como confiabilidad entre esti
m adores. Además, los procedimientos estadísticos, como promediar las evaluaciones de múl
tiples observadores, tienen la ventaja de reducir las características idiosincráticas y prejuicios
de observadores únicos. De manera típica, puede lograrse una evaluación de la personalidad
más válida y confiable cuando se usan varios observadores.
Selección de observadores
Un punto clave de decisión que enfrentan los investigadores cuando usan observadores es el có
mo seleccionarlos. Los investigadores de la personali
dad han desarrollado dos estrategias. Una estrategia es
usar evaluadores de la personalidad profesionales
que no conocen al participante con antelación. La
otra estrategia es usar individuos que ya conocen a
los participantes objetivo. Expondremos cada estra
tegia a su vez.
Un escenario en el que se usan observadores
profesionales es el Institute fo r Personality and So
cial Research, i p s r en la Universidad de California en
Berkeley. Los participantes acuden al instituto por pe
riodos que van de uno a cinco días, así que puede rea
lizarse una gran variedad de evaluaciones de la
personalidad a fondo. Los participantes son invitados
a ir al ip s r como parte de estudios específicos. Por
fuente de información sobre la personalidad. ejemplo, un estudio se puso en contacto con un con
junto de arquitectos que fueron juzgados por sus colegas como muy creativos, dentro de un
estudio para determinar los predictores de la personalidad para la creatividad. Otro estudio ob
servó a novelistas considerados como creativos. Un tercero evaluó a estudiantes de un progra
ma de maestría en administración para determinar los predictores de la personalidad del éxito
en los negocios. Durante los estudios en el ip s r , los evaluadores capacitados de la personali
dad observan a los participantes en una variedad de contextos. Después, cada observador pro
porciona una descripción de la personalidad independiente de los participantes.
Una segunda estrategia para obtener datos de observación es emplear individuos que sí
conocen en realidad a los participantes objetivo. Por ejemplo, se ha incurrido a amigos cerca
nos, cónyuges, madres y compañeros de escuela para proporcionar datos de personalidad de
los participantes (por ejemplo, Buss, 1984; Ozer y Buss, 1991). El uso de observadores que
tienen relaciones preexistentes con el participante tiene ventajas y desventajas cuando se com
para con los evaluadores profesionales. Una ventaja es que tales observadores están en una
mejor posición para observar el comportamiento natural del participante. En el contexto rela
tivamente público de una evaluación del ip s r , en contraste, los observadores profesionales no
pueden atestiguar las acciones más privadas de una persona y deben conformarse con obser
var su persona pública. Un cónyuge o amigo cercano tiene acceso a información privilegiada
con frecuencia inaccesible por medio de otras fuentes.
Una segunda ventaja de usar observadores íntimos es que pueden evaluarse las m últi
ples personalidades sociales (Craik, 1987). Cada uno de nosotros exhibe lados diferentes de
nosotros mismos a diferentes personas; podemos ser amables con nuestros amigos, despiada
dos con nuestros enemigos, amantes hacia un cónyuge y conflictivos hacia nuestros padres.
En otras palabras, nuestras personalidades manifiestas varían de un escenario social a otro,
dependiendo de la naturaleza de las relaciones que tenemos con otros individuos. El uso de
múltiples observadores proporciona un método para evaluar los muchos aspectos de la perso
nalidad de un individuo.
Aunque hay ventajas en el uso de observadores cercanos en la evaluación de la perso
nalidad, también hay inconvenientes. Debido a que los observadores cercanos tienen relacio
nes con la persona objetivo, pueden estar prejuiciados de diferentes formas. Una madre del
participante, por ejemplo, puede pasar por alto las características negativas y enfatizar las po
sitivas de su hijo. Además, las características de personalidad y planes personales de los ob
servadores pueden afectar las estimaciones de la personalidad. Varios factores pueden
reducir la precisión de los reportes del observador, incluyendo si los observadores tienen in
formación relevante para un juicio particular, si han puesto atención a dicha información y
si son capaces de usar esta información para hacer una estimación confiable del participante
(Funder, 1995).
Observación naturalista frente a la artificial

Además de decidir qué tipo de observadores usar, los investigadores de la personalidad deben
determinar si la observación ocurre en un escenario natural o en uno artificial. En la observa
ción n atu ralista, los observadores atestiguan y registran eventos que ocurren en el curso nor
mal de la vida de sus participantes. Por ejemplo, un niño podría ser seguido a lo largo de un
día entero, o un observador podría sentarse en el hogar de un participante. En contraste, la ob
servación puede tener lugar en escenarios concebidos o artificiales, como ocurre en el i p s r .
Los experimentadores pueden instruir a los participantes para que ejecuten una tarea, como su
participación en un grupo de discusión, y luego observar cómo se comportan los individuos
en estos escenarios construidos. Por ejemplo, los psicólogos John Gottman y Robert Leven-
son han hecho que parejas de casados vayan a su laboratorio y discutan un tema sobre el cual
estén en desacuerdo. Entonces los psicólogos observan a la pareja tener una pequeña discu
sión. La forma en que una pareja vive una discusión puede predecir la probabilidad de que la
pareja permanecerá junta (Gottman, 1994).
La observación naturalista ofrece a los investigadores la ventaja de ser capaces de con
seguir la información en el contexto realista de la vida cotidiana de una persona, pero al eos-
to de no poder controlar los eventos y muestras conductuales presenciadas. La observación en
situaciones generadas por el experimentador tiene la ventaja de controlar las condiciones y
promover el comportamiento relevante. Pero esta ventaja tiene un costo; sacrificar el realis
mo de la vida cotidiana.
En resumen, hay muchas dimensiones diferentes a lo largo de las cuales difieren los da
tos O y los investigadores de la personalidad deben tomarlas en cuenta. Deben tomarse deci
siones acerca de si usar 1) evaluadores profesionales u observadores cercanos o 2) un
escenario naturalista o uno artificial para la observación con base en los propósitos específi
cos del estudio de la personalidad. Las ventajas y desventajas de las opciones deben evaluar
se con las metas de la investigación en mente. Ningún método aislado es adecuado de manera
ideal para todos los propósitos de evaluación.
Más allá de las fuentes de datos de autorreporte y de reporte del observador, una tercera fuen
te común de información relevante para la personalidad proviene de pruebas estandarizadas:
los datos de p ru eb a (datos P). En estas medidas, los participantes son colocados en una si
tuación de prueba estandarizada. La idea es ver si personas diferentes reaccionan de manera
diferente ante una situación idéntica. La situación es diseñada para generar comportamien
tos que sirvan como indicadores de variables de personalidad (Block, 1977). Un ejemplo in
teresante es la prueba de construcción de un puente que se encuentra en el libro clásico de
Henry Murray (1937) The Assessment o f Men. En esta prueba, a la persona que se está eva
luando se le asignan dos asistentes y una cantidad de madera, cuerda y herramientas, tenien
do la tarea de construir un puente sobre un pequeño arroyo. La persona a la que se está
evaluando no puede hacer el trabajo por sí misma sino que debe instruir a los dos asistentes
sobre la manera de construir el puente. Sin el conocimiento de la persona que se está eva
luando, los dos asistentes están representando papeles: uno está actuando como limitado in
telectualmente y tiene problemas para entender las instrucciones; el otro es un “sabelotodo”,
quien tiene sus propias ideas acerca de cómo debería construirse el puente y con frecuencia
contradice a la persona que se está evaluando. Estos dos “ayudantes” en realidad están ahí
para frustrar a la persona a la que se está evaluando. Mientras la persona que se está eva
luando piensa que está siendo observada sobre habilidades de liderazgo, la persona en rea
lidad está siendo evaluada respecto a su tolerancia a la frustración y el desempeño bajo la
adversidad.
Un ejemplo fascinante del uso de los datos P es el estudio de Edwin Megargee (1969)
sobre las manifestaciones de la dominación. Megargee deseaba diseñar una situación de prue
ba de laboratorio en la que pudiera evaluar el efecto de la dominación en el liderazgo. Con ese
fin, administró primero la escala de Dominación del Inventario Psicológico de California a un
grupo grande de hombres y mujeres que podrían servir como participantes potenciales en la
investigación. Luego seleccionó sólo a aquellos hombres y mujeres que obtuvieron puntua
ciones muy altas o muy bajas en dominación. Al completar este procedimiento de selección,
Megargee llevó parejas de individuos al laboratorio, haciendo parejas en cada caso con un
participante muy dominante y un participante poco dominante. Creó cuatro condiciones: 1)
un hombre muy dominante con un hombre poco dominante, 2) una mujer muy dominante
con una mujer poco dominante, 3) un hombre muy dominante con una mujer poco domi
nante y 4) una mujer muy dominante con un hombre poco dominante.
Luego Megargee le presentó a cada pareja una caja grande que contenía muchas tuer
cas, pernos y palancas rojos, amarillos y verdes. Se les dijo a los participantes que el propó
sito del estudio era explorar la relación entre la personalidad y el liderazgo bajo estrés. Cada
pareja de participantes tenía que trabajar como un equipo de expertos para reparar la caja lo
más rápido posible, quitando tuercas y tornillos con ciertos colores y reemplazándolos con
otros colores. Se les dijo a los participantes que una persona del equipo tenía que ser el líder,
una posición que implicaba dar instrucciones a su pareja. La segunda persona tenía que ser el
Capítulo Dos Evaluación de la personalidad, medición y diseño de investigación
seguidor, quien tendría que ir dentro de la caja y realizar las ta

reas de poca categoría solicitadas por el líder. Entonces el ex
perimentador le dijo a los participantes que les correspondía a
ellos decidir quién sería el líder y quién sería el seguidor.
La variable de interés para Megargee era quién se volve
ría el líder y quién se volvería el seguidor, así que tan sólo re
gistró el porcentaje de participantes muy dominantes dentro de
cada condición que se volvieron líderes. Encontró que 75% de
los hombres muy dominantes y 70% de las mujeres muy do
minantes tomaron el papel de liderazgo en los pares del mis
mo sexo. Sin embargo, cuando los hombres muy dominantes
hacían pareja con mujeres poco dominantes, 90% de los hom
bres se volvieron líderes. Pero el resultado más asombroso
ocurrió cuando la mujer era muy dominante y el hombre era Quien toma el papel de liderazgo cuando las personas trabajan
poco dominante. En esta condición, sólo 20% de las mujeres juntas con frecuencia es una función de la personalidad.
muy dominantes asumieron el papel de liderazgo.
Mediante estos hallazgos de laboratorio, uno podría concluir que las mujeres dominan
tes en esta condición estaban suprimiendo su dominación, o que los hombres en esta condi
ción, a pesar de tener poca dominación, se sentían obligados a asumir un papel sexual
tradicional haciéndose cargo. Resultó, sin embargo, que ninguna de estas conclusiones fue
sustentada. Megargee grabó las conversaciones dentro de cada pareja de participantes mien
tras decidían quién sería el líder. Cuando analizó estas grabaciones, hizo un hallazgo asom
broso: las mujeres muy dominantes nombraron a sus parejas poco dominantes para el puesto
de liderazgo. De hecho, las mujeres muy dominantes en realidad tomaron la decisión final
acerca de los papeles 91% del tiempo. Este hallazgo sugiere que las mujeres expresan su do
minación de una manera diferente que los hombres en la condición de sexos mixtos.
El estudio de Megargee resalta varios puntos esenciales acerca de los estudios de labo
ratorio. Primero, muestra que es posible establecer condiciones de tal manera que puedan ob
servarse indicadores clave de la personalidad. Segundo, sugiere que los experimentadores de
laboratorio deben ser sensibles a las manifestaciones de la personalidad que ocurren en partes
incidentales del experimento, como pueden ser las discusiones entre los participantes. Y, ter
cero, con frecuencia hay vínculos interesantes entre los datos A obtenidos por medio de cues
tionarios y los datos P obtenidos por medio de condiciones de prueba más controladas. Tales
vínculos aumentan la validez tanto del cuestionario como de la prueba de dominación en la
boratorio.
Como todas las fuentes de datos, los datos P tienen limitaciones. Primera, algunos par
ticipantes podrían tratar de adivinar qué rasgo se está midiendo y entonces alterar su com
portamiento o respuestas en un esfuerzo por crear una impresión específica de sí mismos. Un
segundo reto es la dificultad de verificar que los participantes en la investigación definen la
situación de prueba de la misma manera que el experimentador. Un experimento diseñado
para probar “la obediencia a la autoridad” podría ser malinterpretado como una prueba de “in
teligencia”, quizá elevando la ansiedad en formas que distorsionan las respuestas subsiguien
tes. La falla en confirmar la correspondencia entre las concepciones de los experimentadores
y aquellas de los participantes puede introducir error.
Una tercera precaución en el uso de los datos P es que estas situaciones son interperso
nales de modo inherente, y un investigador puede influir de manera inadvertida la forma en
que se comportan los participantes. Un investigador con una personalidad sociable y amisto
sa, por ejemplo, puede obtener más cooperación de los participantes que un experimentador
frío y distante (véase Kintz et al., 1965). La elección de quién dirige el experimento, en resu
men, incluyendo la personalidad y comportamiento del experimentador, puede introducir de
manera inadvertida efectos que desvirtúan los resultados obtenidos.
A pesar de estas limitaciones, los datos P siguen siendo una fuente valiosa e irrempla-
zable de información sobre la personalidad. Los procedimientos usados para obtener datos P
pueden diseñarse para obtener comportamiento que sería difícil observar en la vida cotidiana.
Permiten a los investigadores controlar el contexto y eliminar fuentes de influencia extrañas.
Y, quizá lo más importante, permiten a los experimentadores probar hipótesis específicas ejer
ciendo control sobre las variables que se presume tienen influencia causal. Por estas razones,
los procedimientos para datos P siguen siendo un conjunto de herramientas indispensable pa
ra el investigador de la personalidad.
Dispositivos mecánicos de registro

Los psicólogos de la personalidad han estado decididos a adaptar las innovaciones tecnoló
gicas para el estudio de la personalidad. Un ejemplo del ingenio de los investigadores es el
uso del “actómetro” para evaluar diferencias de personalidad en el nivel de actividad o ener
gía. El actómetro es en esencia un reloj de cuerda automática modificado, el cual puede su
jetarse con una correa a los brazos o piernas de los participantes (de manera típica, a niños).
El movimiento activa el mecanismo de cuerda, registrando la actividad de la persona en las
manecillas de la carátula. Por supuesto, las fluctuaciones día con día e incluso hora con ho
ra en el estado de ánimo, fisiología y escenario limitan la utilidad de cualquier muestra ais
lada de nivel de actividad. Sin embargo, pueden registrarse varias muestras del nivel de
actividad en días diferentes para generar calificaciones compuestas que reflejen, para cada
persona, si es hiperactiva, activa en forma normal o sedentaria (Block, 1976; Buss, Block y
Block, 1980).
En un estudio, niños preescolares de tres y cuatro años de edad usaron actómetros en la
muñeca de la mano no favorecida por alrededor de dos horas (Buss et al., 1980). La carátula
de cada actómetro fue cubierta con cinta, de modo que no distrajera a los niños. De hecho, en
la prueba previa, los niños que podían observar la carátula se preocupaban por ella, sentándo
se en un sitio, sacudiendo el dispositivo de acá para allá, una práctica que interfería con la uti
lidad de la medida. Los experimentadores tuvieron que tener cuidado de eliminar los datos del
niño si se quitaba el reloj durante la sesión o si la enfermedad o el tiempo inclemente limita
ban el rango dentro del cual podía expresarse el nivel de actividad de un niño. Se llevaron a
cabo, por separado varias sesiones de registro, y se sumaron las lecturas del actómetro a fin
de obtener un índice más confiable del nivel de actividad de cada niño.
Luego los experimentadores buscaron respuestas a tres interrogantes: 1) ¿el nivel de
actividad medido con el actómetro produjo los mismos resultados que el nivel de actividad
medido por medio de la observación? 2) ¿En qué grado el nivel de actividad se mantiene a
lo largo del tiempo? 3) ¿Las mediciones del nivel de actividad usando este dispositivo de re
gistro mecánico se relacionan con los juicios de observadores del funcionamiento de la per
sonalidad? Para responder estas preguntas, los maestros de los niños proporcionaron
evaluaciones del observador usando la versión para niños de la Clasificación Q de Califor
nia (California Q-Sort), un instrumento diseñado para producir una descripción amplia de las
características de personalidad de los niños (Block y Block, 1980). Ejemplos de reactivos en
la Clasificación Q son es un individuo locuaz; se comporta en una form a determinada hacia
los demás; es en esencia sumiso; es astuto y embustero, manipulador, oportunista; tiene un
nivel de energía alto. Estas observaciones se hicieron cuando los niños tenían tres, cuatro y
siete años de edad, mientras que las medidas con el actómetro se registraron a los tres y cua
tro años de edad.
Resultó que hubo una correspondencia fuerte entre las medidas con el actómetro del ni
vel de actividad y las medidas basadas en un observador. El nivel de actividad también resultó
ser estable en forma moderada a lo largo del tiempo. Por ejemplo, las medidas con el actóme
tro a los tres años de edad mostraron una correspondencia moderada con las medidas con el ac
tómetro a los cuatro años de edad. ¿Hay alguna relación entre las mediciones con el actómetro
del nivel de actividad y los juicios basados en un observador de la personalidad? Los niños
muy activos, según la evaluación con el actómetro, fueron evaluados por sus maestros como
vitales, enérgicos y activos. Además, los niños muy activos fueron evaluados como desasose
gados e inquietos, todos atributos que más o menos son indicativos de hiperactividad. Es de
('apíti’LQ I)ds Evaluación de la personalidad, medición v diseño de investigación
particular interés que los niños activos también fueron vistos

por los maestros como desinhibidos, asertivos, competitivos,
agresivos física y verbalmente, acaparadores de la atención y
manipuladores de los demás. Por tanto, las puntuaciones de
actividad basadas en el actómetro están vinculadas con otras
características de la personalidad, rasgos que tienen conse
cuencias importantes para la interacción social.
En resumen, ciertos aspectos de la personalidad pueden
evaluarse por medio de dispositivos mecánicos de registro,
como el actómetro. Estas formas de datos P tienen varias ven
tajas y desventajas. Su principal ventaja es que proporcionan
un medio mecánico para evaluar la personalidad, uno que no
es obstaculizado por los prejuicios que podrían introducirse
cuando está implicado un observador humano. Una segunda
ventaja es que pueden obtenerse en escenarios relativamente
naturalistas, como el patio de juegos de los niños. Su princi
pal desventaja es que se prestan con facilidad relativamente
pocas disposiciones de personalidad para ser evaluadas con
dispositivos mecánicos. No hay dispositivos mecánicos, por
ejemplo, para medir en forma directa la introversión o la es
crupulosidad. No obstante, los dispositivos mecánicos pueden
servir como fuentes poderosas de datos de la personalidad en
los dominios en los que puedan utilizarse. Quizá avances tec
nológicos futuros expandirán el rango de rasgos de persona
lidad susceptibles de evaluación mecánica.
D atos fisiológicos El nivel de actividad es estable a lo largo del tiempo y se corre

Una fuente crítica de datos de personalidad que disfruta de un laciona con las estimaciones de vital, enérgico y activo por parte
resurgimiento de interés es la medición fisiológica. Las medi del maestro.
das fisiológicas pueden proporcionar información sobre el ni
vel de excitación de una persona, la sensibilidad de una
persona a varios estímulos y la velocidad a la que una persona adquiere información nueva,
todos indicadores potenciales de la personalidad. Pueden colocarse sensores en diferentes par
tes del cuerpo de una persona, por ejemplo, para medir la actividad del sistema nervioso sim
pático, la presión sanguínea, el ritmo cardiaco y la contracción muscular. También pueden
evaluarse las ondas cerebrales, como la sensibilidad a los estímulos. E incluso pueden medir
se los cambios fisiológicos asociados con la excitación sexual por medio de instrumentos co
mo un calibrador de la presión penil (Geer y Head, 1990) o un medidor del flujo sanguíneo
vaginal.
En el capítulo 7 entraremos en algunos detalles sobre las medidas fisiológicas. Para
nuestros propósitos de examinar formas alternas de medir la personalidad, veremos sólo un
ejemplo del uso de los datos fisiológicos como una fuente de información sobre la personali
dad. El psicólogo Christopher Patrick había estado estudiando psicópatas, en particular hom
bres en prisión que habían cometido crímenes graves contra otras personas, en especial
crímenes violentos. Una teoría sobre los psicópatas es que no tienen la respuesta de miedo o
ansiedad normal que tiene la mayoría de la gente. Las cosas que podrían poner ansiosa a la
mayoría de la gente pueden no poner ansioso al psicópata. Para probar esta idea, el doctor Pa
trick usó una técnica llamada “reflejo del parpadeo de sobresalto”, la cual se había usado con
anterioridad en estudios del miedo.
Cuando nos sobresaltamos, como cuando hay un ruido intenso, exhibimos el reflejo de
sobresalto, el cual consiste en parpadear, bajar nuestra barbilla hacia el pecho e inhalar en
forma súbita. Si ya estamos ansiosos por alguna razón, exhibimos el reflejo de sobresalto
más rápido que cuando nos sentimos normales. Esto tiene cierto sentido, ya que estaremos
36 Introducción
preparados para tener un sobresalto defensivo más rápido si

ya estamos en un estado de miedo o ansiedad. Usted puede
comprobar esto mostrando a personas cuadros de escenas ate
morizantes o desagradables, como una serpiente, un perro fu
rioso o arañas, las cuales la mayoría de las personas encuentra
que las hace sentir un poco ansiosas. Mientras las personas
ven dichas escenas, si están sobresaltadas, exhibirán una res
puesta de parpadeo de sobresalto más rápida que cuando ven
Las medidas de respuestas fisiológicas son una fuente de datos objetos no temidos, como una casa, un árbol o una mesa. De
en la investigación de la personalidad. manera interesante, Patrick encontró que los psicópatas, quie
nes estaban en prisión por crímenes violentos, no exhibían la
respuesta de parpadeo rápido ante las fotografías ansiosas, lo que sugiere que no sentían el
mismo nivel de temor o ansiedad que los participantes normales ante estos objetos. Tal vez
los psicópatas cometen sus crímenes porque no tienen el nivel normal de ansiedad o culpa
que previene que la mayoría de nosotros haga algo malo. Éste es un buen ejemplo de la for
ma en que pueden usarse las medidas fisiológicas para examinar y entender varias caracte
rísticas de la personalidad.
Una fuente de datos fisiológicos más reciente proviene de la obtención de imágenes
por resonancia magnética funcional (irmí). La i r m í es una técnica usada para identificar las
áreas del cerebro que se “iluminan” cuando se realizan ciertas tareas, como tareas verbales o
problemas de navegación espacial, medidas por la cantidad de oxígeno que llega a esos luga
res particulares en el cerebro. Cuando una determinada parte del cerebro está muy activa, re
quiere de grandes cantidades de sangre. El oxígeno transportado por la sangre se acumula en
esa región del cerebro. El i r m í es capaz de detectar concentraciones de hierro llevadas por el
oxígeno contenido en los glóbulos rojos, y, por tanto, identifica la parte del cerebro que se usa
para realizar ciertas tareas. Las imágenes a color que se obtienen con las exploraciones cere
brales por i r m í con frecuencia son bastante impresionantes.
En principio, el i r m í proporciona una fuente de datos fisiológicos que puede vincularse
con disposiciones de personalidad, inteligencia o psicopatología. En la práctica, sin embargo,
el método tiene limitaciones sobre lo que revela. En vista de que el i r m í debe comparar el es
tado “activado” con un estado de “reposo”, se vuelve esencial conocer cómo era en realidad
el estado de reposo. Si el estado de reposo en los hombres tiende más hacia los deportes y el
estado de reposo en las mujeres tiende más hacia las interacciones sociales, por ejemplo, es
posible que una comparación de una tarea como ver los rostros en el estado de reposo sugeri
ría que los hombres y las mujeres están realizando la tarea en forma diferente, cuando de he
cho la diferencia se debe por completo a la diferencia sexual en el estado de reposo (Kosslyn
y Rosenberb, 2004).
Uno de los beneficios esenciales de los datos fisiológicos es que es difícil para los par
ticipantes fingir las respuestas, en particular en medidas de excitación o respuestas reflejas,
como el reflejo de parpadeo de sobresalto. No obstante, los procedimientos de registro fisio
lógico comparten la mayor parte de las mismas limitaciones que otros datos de prueba de la
boratorio. En particular, el registro es restringido de manera típica por una situación de
laboratorio relativamente artificial, y la precisión del registro depende de si los participantes
interpretan la situación en la manera en que el experimentador desea que las interpreten.
Técnicas proyectivas
Otro tipo de datos P son las técnicas proyectivas, en las que a la persona se le presenta un es
tímulo estándar y se le pregunta qué ve. La técnica proyectiva más famosa para evaluar la per
sonalidad es el conjunto de manchas de tinta elaborado por Hermann Rorschach. Sin embargo,
hay otras; por ejemplo, la técnica de la mano, en la que se le dan a la persona ilustraciones de
manos y se le pide que elabore una historia acerca de lo que acaban de hacer las manos y qué
van a hacer a continuación. El distintivo de cualquier técnica proyectiva es que se le presenta
a la persona un estímulo ambiguo, como una mancha de tinta o la ilustración de una mano.
Capítulo Dos Evaluación de la personalidad, medición v diseño de investigación
Luego se le pide a la persona que imponga una estructura a este estímulo describiendo lo que
ve; por ejemplo, qué hay en la mancha de tinta o qué acaba de hacer la mano. La idea detrás
de las técnicas proyectivas es que lo que ve la persona en el estímulo se relaciona en forma
directa con lo que está en su mente. Lo que la persona ve en el estímulo se interpreta para re
velar algo acerca de su personalidad. Se supone que la persona “proyecta” sus preocupacio
nes, conflictos, rasgos y formas de ver o enfrentar al mundo en el estímulo ambiguo.
Las técnicas proyectivas se consideran datos P debido a que a todas las personas se les
presenta una situación estímulo estándar, a todos se les dan las mismas instrucciones y la si
tuación de prueba genera comportamientos que se piensa revelan rasgos de personalidad.
Una razón por la que uno podría no pensar en las medidas proyectivas como datos P es que,
en su mayor parte, no se califican en forma mecánica, aunque hay excepciones (véase Wood,
Nezworski y Stejskal, 1996, para un examen crítico). Por ejemplo, los dispositivos de obser
vación mecánicos, como el actómetro, y los dispositivos de registro fisiológico, como los
monitores del ritmo cardiaco, se califican usando procedimientos objetivos gobernados por
reglas. La calificación es mecánica. Las técnicas proyectivas, por otra parte, por lo general
deben interpretarse.
Para que el psicólogo interprete las respuestas de una persona a las manchas de tinta, el
contenido de esas respuestas es importante. Por ejemplo, lo más probable es que un partici
pante que ha visto un murciélago, un perro muerto y un caníbal sea bastante diferente de al
guien que observa la misma tarjeta y ve una flor, nubes aborregadas y dos payasos jugando al
pastelazo. Además del contenido, el psicólogo está interesado en la manera en que se forman
las percepciones. Por ejemplo, un participante podría concentrarse en las líneas que dividen la
tinta del área blanca, mientras otro podría hacerlo sólo en la tinta.
En resumen, todas las medidas proyectivas le presentan al participante estímulos ambi
guos, pidiéndole que le proporcione una estructura interpretando, dibujando o narrando una
historia acerca de los estímulos. Los psicólogos que apoyan las medidas proyectivas afirman
que son útiles para entrar en contacto con las aspiraciones, deseos fantasías y conflictos de
los que los participantes mismos pueden no percatarse y, así, podrían no informarlas en un
cuestionario. Otros critican las pruebas proyectivas, cuestionando su validez y confiabilidad
como medidas precisas de la personalidad (Wood et a l, 1996).
A l interpretar una mancha de tinta una persona puede proyectar su personalidad en lo que “ve”
en tal mancha.
38 Introducción
Datos de resultados de la vida (datos V)

Los datos de resultados de la vida (datos V) se refieren a información que puede recogerse
de los eventos, actividades y resultados en la vida de una persona, que están disponibles para
el escrutinio público. Por ejemplo, los matrimonios y divorcios son un asunto de registro pú
blico. Los psicólogos de la personalidad pueden en ocasiones conseguir información sobre los
clubes a los que se afilia una persona, si es que hay alguno; cuántas multas por exceso de ve
locidad ha recibido una persona en años recientes; y si posee una pistola. Si una persona es
arrestada por un crimen violento o de cuello blanco es cuestión de registro público. El éxito
en el trabajo de uno, si está uno ascendiendo o descendiendo, y los productos creativos que
concibe uno, como libros publicados y música grabada, con frecuencia son resultados impor
tantes en la vida de una persona. Todo esto puede servir como fuentes importantes de infor
mación sobre la personalidad.
Los psicólogos de la personalidad con frecuencia usan los datos A y los datos O para
predecir los datos V. Un ejemplo que ilustra cómo pueden usarse los datos O para predecir
eventos importantes de la vida es proporcionado por Avshalom Caspi y sus colegas (Caspi, Ei
der y Bem, 1987). Con base en entrevistas clínicas con madres de niños con edades de 8, 9 y
10 años, estos investigadores crearon dos escalas de personalidad para medir el mal carácter.
Una escala se basó en la severidad de los berrinches; evaluaba comportamientos físicos como
morder, patear, golpear y lanzar cosas, y expresiones verbales como maldecir, gritar y llorar.
La otra escala evaluaba la frecuencia de estos berrinches. Cas
pi y sus colegas sumaron estas dos escalas para crear una sola
medida de los berrinches. Esta medida representaba datos O,
ya que se basaba en las observaciones reales de la madre. Lue
go, en la adultez, cuando los participantes tenían 30 a 40 años
de edad, los investigadores recopilaron información acerca de
los resultados de la vida, como educación, trabajo, matrimo
nio y paternidad. Luego examinaron si la característica de per
sonalidad de mal carácter, medida en la infancia como datos
O, predijo resultados significativos dos o tres décadas des
pués, medidas como datos V.
Los resultados demostraron ser importantes. Para los hom
bres, los berrinches en la infancia se vincularon con muchos
resultados negativos en la vida adulta. Los hombres que ha
bían exhibido berrinches en la infancia se ubicaron en un ran
go significativamente inferior en su servicio militar. Tendieron
a tener vidas laborales erráticas, cambiando de empleo con
más frecuencia y experimentando más desempleo que aque
llos que no habían sido juzgados con mal carácter cuando ni
ños. Además, fue menos probable que estos hombres tuvieran
un matrimonio satisfactorio que sus contrapartes ecuánimes.
46% de los hombres de mal carácter estaban divorciados a los
40 años de edad, mientras que sólo 22% de los hombres en la
categoría de pocos berrinches estaban divorciados a los 40
años de edad.
Los resultados para las mujeres mostraron algunos patro
nes similares, pero también algunas diferencias cuando se
compararon con los de los participantes varones. Para las mu
jeres, los berrinches en la infancia no tuvieron relación con
sus vidas laborales, en contraste con los de los hombres. Sin
La tendencia a tener berrinches frecuentes en la infancia se embargo, las mujeres que tuvieron berrinches cuando niñas
ha vinculado con resultados negativos ya de adultos, como un tendieron a casarse con hombres que tenían una posición ocu-
aumento en la probabilidad de divorcio.
pacional significativamente inferior a la de ellas; 40% de las
Capítulo Dos Evaluación de la personalidad, medición v diseño de investigación
mujeres que habían mostrado berrinches cuando niñas se “casaron con un inferior”, en com
paración con sólo 24% de las mujeres que habían sido ecuánimes cuando niñas. Como con los
hombres, los berrinches en la infancia se vincularon con la frecuencia de divorcio para las mu
jeres. Más o menos 26% de las mujeres que tuvieron berrinches en la infancia estaban divor
ciadas a los 40 años de edad, mientras sólo 12% de las mujeres ecuánimes estaban divorciadas
para esa edad.
Además de los estudios empíricos, como aquellos que predicen el divorcio posterior a
partir de la personalidad infantil, los datos de resultados de la vida se usan en formas reales
que afectan nuestra vida cotidiana. Nuestros registros de conducción, incluyendo multas por
exceso de velocidad y accidentes de tránsito, son usados por las compañías de seguros para
determinar cuánto pagaremos por el seguro del automóvil. Nuestras historias de uso de tarje
tas de crédito en ocasiones son rastreadas por los negocios para determinar nuestras preferen
cias comportamentales, las cuales influyen en los anuncios que nos envían. Y, en fechas más
recientes, los publicistas con frecuencia rastrean los sitios web que visitamos, y usan correo
electrónico “de publicidad no deseada” y anuncios desplegables basados en nuestros patrones
de navegación en Internet. Por tanto, los registros de conducción, de uso de tarjetas de crédi
to y de patrones de uso de Internet se han vuelto fuentes modernas de datos V. ¿Piensa que po
demos predecir estos patrones de datos rastreables en forma pública a partir de variables de
personalidad, como impulsividad (más accidentes automovilísticos), lucha por posición social
(compra de posesiones de prestigio con tarjeta de crédito) e impulso sexual (visitas más fre
cuentes de sitios web de pornografía)? Los estudios futuros de datos V responderán dentro de
poco estas preguntas.
En suma, los datos V pueden servir como una fuente importante de información de la
vida real acerca de la personalidad. Las características de la personalidad medidas temprano
en la vida con frecuencia se vinculan con resultados de la vida importantes varias décadas des
pués. En este sentido, uno puede decir que los resultados de la vida, como el trabajo, matri
monio y divorcio, son, en parte, manifestaciones de la personalidad. No obstante, debe
reconocerse que los resultados de la vida son causados por una variedad de factores, incluyen
do nuestro sexo, raza y grupo étnico, así como las oportunidades a las que uno suele estar ex
puesto. Las características de la personalidad sólo representan un conjunto de causas de estos
resultados de vida.
Piense en una característica de la personalidad que encuentre interesante. Por ejemplo, podría
considerar características como el nivel de actividad, correr riesgos, temperamento o coopera
ción. Usando las cuatro fuentes de datos principales, piense en formas en que podría recopilar
información sobre esta característica. Dé ejemplos específicos de cómo podría evaluar esta carac
terística usando datos A, O, P y V como fuentes de información sobre el nivel de esta caracterís
tica en las personas. Sea específico al dar ejemplos de cómo y qué podría hacer para evaluar la
característica de personalidad seleccionada.
Problemas en la evaluación de la personalidad

Ahora que hemos delineado las fuentes de datos básicas, es útil dar un paso hacia atrás y con
siderar dos problemas amplios en la evaluación de la personalidad. El primer problema impli
ca usar dos o más fuentes de datos dentro de un solo estudio de la personalidad. ¿Cuáles son
Introducción
.............. i
los vínculos entre las diversas fuentes de datos de personalidad? ¿Y qué conclusiones pueden
sacarse cuando diferentes fuentes de datos no llegan a la misma conclusión? El segundo pro
blema implica la confiabilidad de la medición de la personalidad y la forma en que el uso de
múltiples fuentes de datos puede corregir algunos de los problemas asociados con fuentes
de datos únicas.
Vínculos entre varias fuentes de datos

Un problema clave que deben abordar los psicólogos de la personalidad es qué tan estrecha
mente corresponden los hallazgos obtenidos con una fuente de datos a los hallazgos de otra
fuente de datos. Si, por ejemplo, una persona se califica a sí misma como dominante, ¿los
observadores, como sus amigos y cónyuge, también la ven como dominante? ¿Los hallazgos
obtenidos con dispositivos de registro mecánicos, como un actómetro, muestran una corres
pondencia estrecha con los datos obtenidos de informes de observador o autorreportes del ni
vel de actividad?
Según la variable de personalidad bajo consideración, el acuerdo entre fuentes de da
tos tiende a variar de bajo a moderado. Por ejemplo, Ozer y Buss (1991) examinaron la re
lación entre el autorreporte y el reporte del cónyuge para ocho dimensiones de personalidad.
Encontraron que el grado de acuerdo varió dependiendo del rasgo particular y de lo obser
vable del rasgo. Rasgos como la extroversión mostraron un acuerdo moderado entre fuen
tes de datos. El rasgo de “calculador”, por otra parte mostró un acuerdo bajo entre el
autorreporte y el informe del cónyuge. Los rasgos que son observables con facilidad y re
quieren pocas inferencias de parte del observador (como la extroversión) muestran un gra
do mayor de acuerdo entre sí mismo y el observador que los rasgos, los cuales son difíciles
de observar en forma directa y requieren inferencias sobre estados mentales internos, como
el ser calculador.
Una de las ventajas principales de usar medidas múltiples en la investigación es que ca
da medida tiene idiosincrasias únicas que no tienen nada que ver con el constructo de interés
subyacente. Usando medidas múltiples de varias fuentes de datos, los investigadores son ca
paces de promediar estas idiosincrasias y concentrarse en las variables clave bajo análisis.
Un problema importante al evaluar las conexiones entre las fuentes de datos de perso
nalidad es si las fuentes se ven como medidas alternativas del mismo constructo o como eva
luaciones de fenómenos diferentes. El autorreporte de una persona acerca de su dominación
relativa, por ejemplo, tiene acceso a una riqueza de información; a saber, sus interacciones con
docenas de otras personas en su ambiente social. Cualquier observador particular, un amigo
cercano, por ejemplo, sólo tiene acceso a una muestra limitada y selectiva de comportamien
to relevante. Por tanto, si el amigo califica a la mujer como muy dominante, mientras la mu
jer se califica a sí misma sólo como dominante en forma moderada, el desacuerdo puede
deberse por completo a las muestras conductuales diferentes en las que cada persona está ba
sando sus calificaciones. Por tanto, la falta de acuerdo no necesariamente significa un error
de medición (aunque por supuesto podría serlo). En su lugar puede significar que los obser
vadores están basando sus conclusiones en diferentes muestras conductuales.
En resumen, la interpretación de los vínculos entre las fuentes de datos de personalidad
depende en gran medida de la interrogante de investigación planteada. Un acuerdo sólido en
te dos fuentes de datos lleva a los investigadores a confiar en que sus medidas alternativas es
tán explorando el mismo fenómeno de personalidad, como se demuestra en el caso de la
extroversión y el nivel de actividad. La falta de un acuerdo sólido, por otra parte, puede sig
nificar que las diferentes fuentes de datos están evaluando fenómenos diferentes, o puede in
dicar que una o más fuentes de datos son falibles o tienen problemas, una cuestión que
abordaremos enseguida.
La confiabilidad de la medición de la personalidad

Cada fuente de datos tiene sus propios problemas y dificultades que limitan su utilidad. Es
to sucede con todos los métodos en la ciencia. Aun los supuestos instrumentos científicos ob
jetivos, como los telescopios, son menos que perfectos debido a imperfecciones menores, co
mo una deformación ligera en la lente, y pueden introducir errores en las observaciones. La
naturaleza falible de las medidas científicas no es menos cierta en la investigación de la per
sonalidad.
Una estrategia poderosa de evaluación de la personalidad, por consiguiente, es exami
nar los resultados que trascienden las fuentes de datos, un procedimiento al que en ocasiones
se hace referencia como triangulación. Si se encuentra un efecto particular, por ejemplo, la
influencia de la dominación al asumir el liderazgo, ¿el efecto ocurre cuando se mide la do
minación con autorreporte al igual que con informes de un observador? Si los extrovertidos
se aburren con más facilidad que los introvertidos, ¿esto se muestra cuando el aburrimiento se
evalúa con dispositivos de registro fisiológico (por ejemplo, ondas cerebrales que sugieren
que la persona está casi dormida) al igual que por medio del autorreporte?
A lo largo de este libro, conforme expongamos los hallazgos empíricos que se han acumu
lado dentro de cada dominio de la personalidad, pondremos especial atención a los hallazgos
que trascienden las limitaciones de la evaluación de una sola fuente de datos. Si se encuentran
los mismos resultados con dos o más fuentes de datos, entonces los investigadores pueden te
ner una mayor confianza en la credibilidad de esos hallazgos.
Una vez que se han identificado medidas de personalidad para la investigación, la siguiente
tarea es someterlas a escrutinio científico, de modo que los investigadores puedan determinar
qué tan buenas son las medidas. En general, se usan tres estándares para evaluar las medidas
de personalidad: confiabilidad, validez y generabilidad. Aunque estos tres estándares se ex
pondrán aquí en el contexto de la evaluación de cuestionarios de personalidad, es importante
tomar en cuenta que son aplicables a todos los métodos de medición dentro de la investiga
ción de la personalidad, no tan sólo a aquellos que implican cuestionarios de personalidad de
autorreporte.
Confiabilidad
La confiabilidad puede definirse como el grado en que una medida obtenida representa el ni
vel verdadero del rasgo que se está midiendo. Suponga por un momento que cada persona tie
ne alguna cantidad verdadera del rasgo que desea medir, y que podría conocer este nivel
verdadero. Si su medida es confiable, entonces se correlacionará con el nivel verdadero. Por
ejemplo, si una persona tiene un ci verdadero de 115, entonces una medida confiable a la per
fección del ci produciría una puntuación de 115 para esa persona. Más aún, una medida con
fiable del ci produciría la misma puntuación de 115 cada vez que se administrara a la persona.
Una medida menos confiable produciría una puntuación, quizá, en un rango, de 112 a 118.
Una medida aún menos confiable produciría una puntuación en un rango aún más amplio, más
o menos entre 100 (el cual es el promedio) y 130 (el cual es genio limítrofe). Los psicólogos
de la personalidad prefieren medidas confiables, de modo que las puntuaciones reflejen con
precisión el nivel verdadero de cada persona de la característica de personalidad que se está
midiendo. Debido a que nunca podemos medir los niveles verdaderos de los rasgos nunca po
demos calcular con exactitud qué tan confiables son nuestras medidas reales. Sin embargo,
hay varias formas de estimar la confiabilidad.
Una forma de estimar la confiabilidad de una medida es por medio de la m edición re
petida. Hay diferentes formas de medición repetida y, por tanto, diferentes versiones de con
fiabilidad. Un procedimiento común es repetir una medición para la misma muestra de
r Introducción
personas a lo largo del tiempo; por ejemplo, con un intervalo de un mes. Si las dos pruebas se
correlacionan mucho entre la primera y la segunda prueba, produciendo puntuaciones simila
res para la mayoría de las personas, entonces se dice que la medida resultante tiene una con-
fiabilidad de prueba y repetición de la prueba alta.
Una segunda forma de determinar la confiabilidad de una escala es examinar las rela
ciones entre los reactivos en sí en un solo punto en el tiempo. Si los reactivos dentro de una
prueba, vistos como una forma de medición repetida, se correlacionan bien entre sí, entonces
se dice que la escala tiene una confiabilidad de consistencia interna alta. La confiabilidad es
interna porque se evalúa dentro de la misma prueba. El fundamento para usar la consistencia
interna como un índice de confiabilidad es que los psicólogos que construyen varias medidas
suponen que todos los reactivos en una escala miden la misma característica. Si lo hacen, en
tonces los reactivos deberían correlacionarse en forma positiva entre sí.
Una tercera forma de medir la confiabilidad, aplicable sólo al uso de medidas de perso
nalidad basadas en un observador, es obtener mediciones de muchos observadores. Cuando
diferentes observadores concuerdan entre sí, se dice que la medida tiene una confiabilidad en
tre jueces alta. Cuando diferentes estimadores no están de acuerdo, se dice que la medida tie
ne poca confiabilidad entre jueces.
Es importante demostrar que una medida de personalidad es confiable, ya sea por me
dio de la confiabilidad de prueba y repetición de la prueba, la confiabilidad de consistencia in
terna o la confiabilidad entre jueces. Sin embargo, éste sólo es el primer paso en la evaluación
de una medida de personalidad. El siguiente paso es examinar si es válida.
. ).
icapon
Prejuicio histórico en pruebas de personalidad estructuradas. Algunas pruebas de personalidad
estructuradas, como el Inventario Multifásico de la Personalidad de Minnesota ( m m p i ), contie
nen un número no especificado de reactivos de prueba que se refieren a eventos históricos en la
vida de una persona. Ejemplos de dichos reactivos son Nunca he tenido problemas con la ley; En
la escuela a veces me enviaban con el director por hacer tonterías; He usado alcohol en exceso;
Solía robar a veces cuando era joven. Reactivos como éstos se usan para evaluar constructos de
la personalidad como desviación sicopática y el grado en que una persona está de acuerdo con
las normas de la sociedad (véase Gough, 1980). Cuando los individuos que completan las medi
das que contienen reactivos históricos son honestos en sus respuestas, las puntuaciones de la
prueba pueden contener un grado de estabilidad o confiabilidad que podrían resultar erróneas
cuando se ven a lo largo del tiempo.
Piense en una persona que responde dos veces una prueba de personalidad que contiene
reactivos con contenido histórico, una durante la adolescencia y de nuevo a los 25 años de edad.
Imagine que esta persona fue muy rebelde cuando adolescente, pero sentó cabeza y se volvió un
ciudadano responsable de adulto. Si la persona responde con veracidad a la prueba, siempre es
tará de acuerdo con los reactivos históricos relativos a la rebelión (por ejemplo, escapar de casa,
usar alcohol en exceso, pelear con sus padres), sin importar cuánto haya cambiado su personali
dad en la adultez. En resumen, las pruebas que contienen reactivos que se refieren a comporta
mientos pasados pueden parecer más confiables o estables de lo que deberían. Cuando se mide
la personalidad a lo largo del tiempo, es prudente evitar depender en exceso de instrumentos de
evaluación de autorreporte que contienen prejuicios históricos.
Capítulo Dos Evaluación de la personalidad, medición v diseño de iiivesli.gat-ión
VaMez
La validez se refiere al grado en que una prueba mide lo que afirma medir (Cronbach y Meehl,
1955; Wiggins, 2003). Establecer si una prueba en realidad mide lo que está diseñada para me
dir es una tarea compleja y desafiante. Hay cinco tipos de validez: validez aparente, validez
predictiva, validez convergente, validez discriminante y validez de constracto. La faceta más
simple de la validez se llama validez aparente. La validez aparente se refiere a si la prueba,
en la superficie, parece medir lo que se supone que mide. Por ejemplo, una escala que mide
un rasgo como la manipulación podría incluir los siguientes reactivos con validez aparente:
Hago un amigo tan sólo para obtener un favor; Embauqué a un amigo para que me diera in
formación personal; Me las arreglé para salirme con la mía aparentando ser cooperativo;
Fingí que estaba herido para conseguir que alguien me hiciera un favor. En vista de que la
mayoría de la gente está de acuerdo en que estos actos son manipuladores, la escala que los
contiene tiene una validez aparente muy alta. La validez aparente tal vez es el aspecto menos
importante de la validez. De hecho, algunos psicólogos afirman que la validez aparente se re
fiere a la suposición de validez, no a evidencia de validez real.
Un componente más importante de la validez es la validez predictiva. La validez pre
dictiva se refiere a si la prueba predice criterios externos a la prueba (por lo que a veces se lla
ma validez de criterio). Una escala que pretende medir la búsqueda de sensaciones, por
ejemplo, debería predecir cuáles individuos en verdad corren riesgos para obtener emociones
y excitación, como saltar en paracaídas o conducir una motocicleta. Un estudio reciente, por
ejemplo, encontró que una medida de búsqueda de sensaciones en realidad tuvo éxito al pre
decir una variedad de comportamientos de juegos de azar, como comprar billetes de lotería,
apostar en eventos deportivos, jugar póquer en video y usar máquinas tragamonedas, atesti
guando la validez predictiva de la medida de búsqueda de sensaciones (McDaniel y Zucker-
man, 2003). Una escala creada para medir la escrupulosidad debería predecir cuáles personas
en realidad llegan a tiempo a las reuniones y siguen las reglas. Las escalas que predicen con
éxito lo que deberían predecir tienen una validez predictiva alta.
Un tercer aspecto de la validez, llamado validez convergente, se refiere a si una prue
ba se correlaciona con otras medidas con las que debería correlacionarse. Por ejemplo, si una
medida de autorreporte de tolerancia corresponde bien con los juicios de tolerancia de sus se
mejantes, entonces se dice que la escala tiene una validez convergente alta. Al principio de
este capítulo describimos un estudio del “nivel de actividad”, en el cual los registros mecá
nicos del nivel de actividad tuvieron una correlación alta con los juicios basados en un ob
servador del nivel de actividad, otro ejemplo de validez convergente. La validez convergente
es alta según el grado en que las medidas alternativas del mismo constracto se correlacionen
o convergen con la medida objetivo.
Una cuarta clase de validez, llamada validez discrim inante, con frecuencia se evalúa
en forma simultánea con la validez convergente. Mientras la validez convergente se refiere
a aquello con lo que una medida debería correlacionarse, la validez discriminante se refie
re a aquello con lo que una medida no debería correlacionarse. Por ejemplo, un psicólogo po
dría elaborar una medida de satisfacción con la vida, la tendencia a creer que la vida de uno
es feliz, valiosa y satisfactoria. Sin embargo, hay otro rasgo llamado deseabilidad social, la
tendencia a decir cosas agradables acerca de uno mismo; por tanto, el psicólogo podría estar
preocupado con la validez discriminante de su medida de satisfacción con la vida y tratar de
mostrar que esta medida es diferente de medidas de conveniencia social. Parte de saber qué
mide en realidad una medida consiste en saber qué no mide.
Un tipo final de validez es la validez de constructo, definida como una prueba que mi
de lo que afirma medir, se correlaciona con lo que se supone que se correlaciona y no se co
rrelaciona con lo que se supone que no se correlaciona. Por tanto, es claro que la validez de
constructo es el tipo más amplio de validez, incluyendo la validez aparente, predictiva, con
vergente y discriminante. Esta forma de validez se llama validez de constructo porque se ba
sa en la noción de que las variables de personalidad son constructos teóricos. Si se le pide
Introducción
I
que “muestre su inteligencia” o “muestre su extraversión”, se vería apremiado para responder.
Esto se debe a que no hay algo que pueda producir y decir “Ésta es mi inteligencia” o “Ésta
es mi extro versión”. La inteligencia y la extraversión, como casi todas las variables de perso
nalidad, son abstracciones. No obstante, estos constructos teóricos son útiles para que los psi
cólogos describan y expliquen las diferencias entre personas. Determinar si las medidas reales
pueden afirmar que son formas válidas de evaluar los constructos es la esencia de la validez
de constructo.
¿Entonces, cómo sabemos si una medida tiene validez de constructo? Si una medida
converge con otras medidas del mismo constructo, si se relaciona con otras variables con las
que una teoría del constructo dice que debería y si no se relaciona con fenómenos que la teo
ría dice que no debería relacionarse, entonces tenemos los principios de la validez de cons
tructo. Por ejemplo, digamos que un investigador ha elaborado un cuestionario que mide la
creatividad y se está preguntando acerca de su validez de constructo. ¿Las puntuaciones del
cuestionario se correlacionan con otras medidas de creatividad reunidas en la misma muestra,
como estimaciones de creatividad proporcionadas por amigos (validez convergente) o pre
mios o calificaciones obtenidos en clases de bellas artes (validez predictiva)? Además, ¿los re
sultados se correlacionan con datos de pruebas conductuales de creatividad (por ejemplo,
pruebas en las que se les pide a los participantes que nombren usos creativos para objetos co
munes, como un martillo y una cuerda)?
Por último, si el investigador plantea la hipótesis de que la creatividad es diferente de la
inteligencia, por ejemplo, también será importante demostrar que la medida de creatividad no
se correlaciona con medidas de inteligencia (validez discriminante). Tales datos proporcionan
una base para determinar si una medida tiene validez de constructo. Cuando un número gran
de de relaciones conocidas se acumulan alrededor de una medida, entonces comenzamos a
creer que la medida es creíble como una medida de un constructo de personalidad específico.
Por ejemplo, si sabemos bastante sobre las correlaciones de una medida de creatividad, enton
ces podríamos decir que la medida tiene suficiente validez de constructo para hacer inferen
cias válidas sobre la creatividad, para probar teorías acerca de la creatividad y para medir la
creatividad en muestras de personas.
Generabilidad
Un tercer criterio para evaluar la personalidad mide su generabilidad (Cronbach y Gleser,
1965; Wiggins, 1973). La generabilidad es el grado en que la medida conserva su validez a lo
largo de varios contextos. Un contexto de interés podría ser diferentes grupos de personas. Un
psicólogo de la personalidad, por ejemplo, podría estar interesado en si un cuestionario con
serva su validez predictiva a lo largo de varios grupos de edad, género, culturas o grupos ét
nicos. ¿Una escala particular es igual de válida cuando se usa en hombres que cuando se usa
en mujeres? ¿Una prueba es igual de válida para afroamericanos y para estadounidenses de
origen europeo? ¿Es igual de válida entre japoneses e indonesios? ¿La escala mide el mismo
rasgo o cualidad entre estudiantes universitarios que entre adultos de edad madura? Si la es
cala es aplicable en forma amplia a lo largo de estas personas y contextos culturales, entonces
se dice que la escala tiene una generabilidad alta entre poblaciones de personas. La generabi
lidad es esencial para determinar el grado en que la medida puede aplicarse a lo largo de es
tos contextos sociales y culturales.
Otra faceta de la generabilidad se refiere a diferentes condiciones. ¿Una escala de do
minación, por ejemplo, predice quién se vuelve el líder en escenarios de negocios al igual que
en escenarios informales después del trabajo? ¿Una escala diseñada para medir la escrupulo
sidad predice quién llegará a tiempo a clase, así como quién mantendrá ordenada su recáma
ra? Las escalas tienen una generabilidad alta según el grado que se apliquen en forma amplia
en diferentes situaciones y condiciones.
De hecho, los conceptos de confiabilidad y validez pueden incluirse en el concepto de
generabilidad. La confiabilidad de prueba y repetición de la prueba, por ejemplo, pueden ver
Capítulo Dos Evaluación de la, personalidad, medición v diseño de investigación
se como generabilidad a lo largo del tiempo. La validez predictiva puede verse como genera-
bilidad en diferentes situaciones. Por tanto, empezando con un conjunto de puntuaciones de
escala, uno puede preguntar: “¿Cuáles son los contextos a lo largo de los cuales se pueden ge
neralizar estas puntuaciones?” Estos contextos incluyen la persona, la situación, la cultura y
el tiempo.
Las escalas que tienen un rango reducido de generabilidad pueden ser bastante útiles.
Una escala diseñada para medir las reacciones a vivir en un mundo sin gravedad, por ejem
plo, podría ser útil en extremo para predecir el éxito de astronautas, aun si no tiene generabi
lidad a ninguna persona o condición en la Tierra. El punto es que una mayor generabilidad no
siempre es mejor; más bien, lo que es importante es identificar de manera empírica los con
textos en los que la medida particular es aplicable y en los que no lo es.
En este capítulo hemos examinado los tipos de medidas de la personalidad y los medios p a
ra evaluar la calidad de estas medidas. El siguiente paso en la investigación de la personali
dad es usar estas medidas en diseños de investigación reales. Aunque las variaciones son casi
infinitas, hay tres diseños de investigación básicos en el campo de la psicología de la perso
nalidad: experimental, correlacional y el caso de estudio. Cada uno tiene ventajas y desventa
jas. Cada uno proporciona información que complementa la información proporcionada por
los otros.
Métodos experimentales
Los m étodos experim entales se usan de manera típica para determinar causalidad; es de
cir, para averiguar si una variable influye en otra variable. Una variable tan sólo es una cua
lidad que difiere, o puede tomar valores diferentes, para diferentes personas. La estatura,
por ejemplo, es una variable porque los individuos difieren entre sí en estatura. La agresi
vidad es una variable porque los individuos difieren en sus niveles de agresividad. Las carac
terísticas de la personalidad, como la extro versión y la simpatía, son otros ejemplos de
variables. A fin de establecer la influencia de una variable sobre otra, deben satisfacerse va
rios requisitos clave del diseño experimental óptimo: 1) m anipulación de una o más varia
bles y 2) asegurar que los participantes en cada condición experimental sean equivalentes
entre sí al principio del estudio.
En el primer requisito, manipulación, la variable que se cree que es la influencia se ma
nipula como parte del experimento. Por ejemplo, si se plantea la hipótesis de que un fárma
co influye en la memoria, entonces se le da el fármaco a algunos participantes y a otros
participantes se le dan píldoras de azúcar; luego se examina la memoria de todos los partici
pantes. El segundo requisito, equivalencia, se logra en una de dos formas. Si el experimento
tiene manipulación entre grupos, entonces la asignación aleatoria de los participantes a los
grupos experimentales es un procedimiento que ayuda a asegurar que todos los grupos sean
equivalentes al principio del estudio. Sin embargo, en algunos experimentos, la manipulación
está dentro de cada grupo individual. Por ejemplo, en el experimento de la memoria, se les po
dría dar el fármaco a los participantes y examinárseles la memoria, luego darles las píldoras
de azúcar y examinarles su memoria de nuevo. En este caso, cada participante está en ambas
condiciones. En esta clase de experimento (llamado diseño intraparticipante), la equivalencia
se obtiene contrabalanceando el orden de las condiciones, dando a la mitad de los partici
pantes primero el fármaco y luego la píldora de azúcar, y a la otra mitad primero la píldora de
azúcar y luego el fármaco.
El significado de cada una de estas características se aclarará por medio de un ejem
plo de un experimento de personalidad. Quizá sienta curiosidad acerca de por qué a algu-
ñas personas les gusta estudiar con el estéreo o la televisión encendidos, mientras otras de
mandan silencio total para estudiar. Una teoría de la personalidad predice que estas diferen
cias se relacionan con el nivel de extroversión-introversión de una persona, en cuyo caso
los extrovertidos presentan una tendencia a preferir montones de estimulación y los intro
vertidos prefieren muy poca. Imagine estar interesado en probar la hipótesis de que los ex
trovertidos funcionan mejor bajo condiciones de gran estimulación externa, mientras los
introvertidos funcionan mejor bajo condiciones de poca estimulación. Para probar esta hi
pótesis, podría darle primero a un grupo de participantes un cuestionario de autorreporte
que mide extroversión-introversión. Luego podría seleccionar sólo a aquellos individuos
que obtuvieron una puntuación en cualquier extremo, como muy introvertidos o muy extro
vertidos, para participar en su experimento. A continuación llevaría a estos participantes al
laboratorio y los haría trabajar en problemas de matemáticas y comprensión de la lectura
bajo dos diferentes condiciones: en una condición, un radio estaría sonando en el fondo y,
en la otra, habría silencio total. La mitad de cada grupo (es decir, la mitad de los extrover
tidos y la mitad de los introvertidos) se colocaría al azar primero en la condición de ruido
y luego en la condición callada. La otra mitad se colocaría primero en la condición callada y
luego en la condición ruidosa. Después, mediría el número de errores que cometió cada gru
po bajo cada una de las dos condiciones. Si la teoría de la personalidad que está probando
es correcta, debería obtener un patrón de resultados como el de la figura 2.1. Los resultados
hipotéticos en la figura 2.1 muestran que los extrovertidos cometieron menos errores en la
condición ruidosa y más errores cuando estaban callados. Los introvertidos mostraron el pa
trón opuesto: el ruido obstaculizó su desempeño, mientras que funcionaron mejor bajo con
diciones de silencio.
Este estudio, aunque hipotético, resalta las características clave de un buen diseño ex
perimental. La primera es la manipulación. En este caso, se manipuló la condición externa (la
variable independiente): el hecho de que hubiera mucho o muy poco ruido ambiental en el la
boratorio. La segunda característica es el contrabalanceo: la mitad de los participantes recibió
primero la condición ruidosa, mientras la otra mitad recibió primero la condición silenciosa.
El contrabalanceo es esencial porque podría haber efectos del orden como consecuencia de ser
expuesto primero a una condición. El contrabalanceo permite al experimentador descartar los
efectos de orden como una explicación para los resultados. La tercera característica es la asig
nación aleatoria. Por medio de ésta, todas las personas tienen una oportunidad igual de ser se
leccionados para una condición dada. La aleatorización puede ocurrir al lanzar una moneda o,
en forma más común, por el uso de una tabla de números aleatorios. La aleatorización asegu
ra que no hay patrones predeterminados vinculados con la asignación a la condición que pu
dieran explicar los resultados finales.
Las personas que estudian solas en la biblioteca tienen más probabilidad de ser introvertidas, mientras aquellas personas que estudian
en grupos tienen más probabilidad de ser extrovertidas.
l
Condición ruidosa Condición silenciosa
Figura 2.1
Desempeño en problemas de matemáticas y lectura.
En diseños experimentales, es común desear establecer si los grupos en las diferentes

condiciones son significativamente diferentes o no. En el ejemplo introversión-extraver
sión, deseamos saber si el desempeño de los introvertidos y los extrovertidos en la condi
ción ruidosa son significativamente diferentes. ¿El desempeño de los introvertidos es
significativamente diferente del de los extrovertidos en la condición callada? Para respon
der estas preguntas, necesitamos conocer cinco cosas: el tamaño de la muestra, la media, la
desviación estándar, la prueba t y el valor p (significancia de las diferencias entre las con
diciones).
La media se refiere al promedio; en este caso, el número promedio de errores dentro de
cada condición. La desviación estándar es una medida de variabilidad dentro de cada condi
ción. En vista de que no todos los participantes cometen el mismo número promedio de erro
res, necesitamos una forma de estimar cuánto varían los participantes dentro de cada condición;
esta estimación es la desviación estándar. Usando estos números, podemos usar una prueba
estadística, llamada prueba t, para calcular la diferencia entre dos medias.
El siguiente paso es ver si la diferencia es lo bastante grande para considerarse signifi
cativamente diferente (el valor p). Aunque “bastante grande” es un concepto un tanto arbitra
rio, los psicólogos han adoptado la siguiente convención: si es probable que la diferencia entre
las medias ocurriera sólo por azar (es decir, debido a fluctuaciones aleatorias en los datos) só
lo una vez de cada 20 o menos, entonces la diferencia es estadísticam ente significativa en el
nivel p < .05 (el .05 se refiere al nivel de posibilidad de 5%, o 1 vez en 20). Una diferencia
entre medias que sea significativa en el nivel .05 implica que es probable que el hallazgo ocu
rra sólo por azar sólo 5 veces de 100. Otra forma de pensar en esto es imaginar que, si el ex
perimento se repitiera un total de 100 veces, esperaríamos encontrar estos resultados sólo por
azar 5 veces de 100.
En resumen, el método experimental es efectivo para demostrar relaciones entre varia
bles. Experimentos parecidos al descrito, por ejemplo, han establecido un vínculo entre la ex-
troversión-introversión y el desempeño bajo condiciones de ruido alto contra bajo. Los
procedimientos de manipular las condiciones, contrabalancear el orden en el que ocurren las
condiciones y asignar en forma aleatoria a los participantes a las condiciones ayudan a asegu
rar que se cancelen factores extraños, los cuales podrían afectar el desempeño (aunque los in
vestigadores nunca pueden controlar todos los factores que podrían afectar el desempeño).
Luego, después de calcular las medias y las desviaciones estándar, se usan los procedimien
tos estadísticos de comparación de los dos grupos, usando pruebas t y valores p, para deter
minar si las diferencias entre los dos grupos en las dos condiciones son estadísticamente
significativas. De esta manera, los investigadores pueden determinar si la personalidad pare
ce influir en la forma en que se desempeñan las personas bajo varias condiciones.
Estudios correlaciónales
Un segundo tipo importante de diseño de investigación en la personalidad es el estudio corre-
lacional. En el m étodo correlaciona! se usa un procedimiento estadístico para determinar si
hay una relación entre dos variables o no. Por ejemplo, ¿las personas con una necesidad ele
vada de logro en la universidad ganan en la adultez salarios superiores que las personas con
una necesidad inferior de logro? En los diseños de investigación correlacional, el investigador
está intentando identificar en forma directa las relaciones entre dos o más variables, sin impo
ner las clases de manipulación vistas en los diseños experimentales. Es decir, el diseño corre
lacional de manera típica trata de determinar qué va con qué en la naturaleza, en lugar de
intentar manipular o influir en el fenómeno bajo observación. Podríamos estar interesados, por
ejemplo, en la relación entre la autoestima, evaluada por medio de datos A, y la estima que
otros tienen por una persona, evaluada por medio de datos O. O podríamos estar interesados
en la forma en que una medida de motivación para el logro se relaciona con el rendimiento
académico evaluado por medio del promedio de calificaciones. Una ventaja importante de los
estudios correlaciónales es que nos permiten identificar relaciones entre variables conforme
ocurren en forma natural. Para continuar con el ejemplo de la extroversión-introversión y de
sempeño bajo condiciones ruidosas, podríamos medir las preferencias de las personas para es
tudiar con o sin música en la vida real, luego ver si hay una correlación con sus puntuaciones
en una medida de introversión-extraversión.
El procedimiento estadístico más común para medir las relaciones entre variables es el
coeficiente de correlación. Para entender lo que indican los coeficientes de correlación, to
me en cuenta la relación existente entre la estatura y el peso. Podríamos tomar una muestra de
100 estudiantes universitarios y medir su estatura y su peso. Si hacemos una gráfica de los re
sultados en un diagrama de dispersión, vemos que las personas que son altas también tienden
a ser relativamente pesadas y que las personas que son bajas tienden a pesar menos. Pero hay
excepciones, como puede verse en la figura 2.2.
Los coeficientes de correlación pueden variar de +1.00 pasando por 0.00 hasta -1.00.
Es decir, las variables de interés pueden correlacionarse de manera positiva entre sí (+.01 a
+ 1.00), no relacionarse entre sí (0.00) o correlacionarse de manera negativa entre sí (-.01
a -1.00). Sucede que la estatura y el peso se correlacionan fuertemente en forma positiva
entre sí, con un coeficiente de correlación calculado de +.60, para los datos que se muestran
en la figura 2.2.
Considere un ejemplo de tipo psicológico. Suponga que estamos interesados en la re
lación entre la autoestima de la gente y la cantidad de tiempo que son infelices. Podríamos
ver un diagrama de dispersión como el que se describe en la figura 2.3 más adelante. Este
diagrama de dispersión se obtuvo de una muestra de estudiantes universitarios, usando una
medida de cuestionario estándar de autoestima. Como la segunda variable, una medida de in
felicidad, se les pidió a los participantes que llevaran un diario por dos meses, anotando pa
ra cada día si había sido bueno en general (se sentían felices) o malo en general (se sentían
CAPÍTULO Dos Evaluación de la personalidad, medición y diseño de investigación
109
10 0 - • • •
91 • • •
• •
• •
• •
82
• •
o
£ • •
73 •• • •
• •
63 • • •
55
• •
45 • • •
36 _L l
1.40 1.52 1.65 1.77 1.89 2.01 2.13
Estatura en metros
Figura 2.2
Gráfica de 55 casos que muestra una correlación positiva alta entre la estatura y el peso. Cada símbolo (•)
representa una persona que fue medida tanto en estatura como en peso. Las personas más pesadas tienden
a ser más altas; las personas menos pesadas tienden a ser más bajas.
infelices la mayor parte del día). Luego se calculó el porcentaje de días para cada sujeto don
de reportaba haber sido infeliz. Como puede verse en la figura 2.3, conforme aumenta la au
toestima, el porcentaje de tiempo que una persona es infeliz tiende a disminuir. En contraste,
aquellos con autoestima baja tienden a ser muy infelices. En otras palabras, hay una correla
ción negativa entre la autoestima y el porcentaje de tiempo infeliz, en este caso, aproxima
damente -.60.
Introducción
Como un último ejemplo, suponga que estamos interesados en la relación entre extra
versión y estabilidad emocional (la tendencia a preocuparse y estar ansioso). La relación se
describe en la figura 2.4. Como podrá ver, parece que no hay relación entre la extraversión
y la estabilidad emocional; conforme aumenta una variable en una muestra de personas, la
9 -
8 -
• • •
• • • «(
7
• • • •
•
— •
6 • • •
• •
• • • •
c • • « M t
'O
’{/> •M
03
> E
0 • • M
O
i_ • • • M
■X .
UJ • • • • •
• •
4 • •
• •
3 -
2 -
1
¡ _______ i _______ ... I !
1.5 2.5 3.5 4.5 5.5 6.5 7.5
Estabilidad emocional
Figura 2.4
Gráfica de 57 casos para mostrar la relación entre la estabilidad emocional y la extroversión. La correlación
entre estas dos variables es 0.00, lo que significa que no hay relación. En consecuencia, en el diagrama de
dispersión, vemos que las personas se ubican en forma uniforme en todas las secciones de la gráfica, sin un
patrón claro.
otra puede aumentar, disminuir o permanecer igual. En este caso, el coeficiente de correla
ción es 0.00. Esto significa que puede encontrar personas con todas las combinaciones dife
rentes de extroversión y estabilidad emocional, como personas que son sociables y abiertas,
pero también muy neuróticas e inestables. En resumen, las relaciones entre variables pueden
ser positivas, negativas o ninguna de las dos, como lo indican las correlaciones positivas, ne
gativas o cero.
La mayoría de los investigadores no están interesados tan sólo en la dirección de la re
lación; también se interesan en la magnitud de la relación, o qué tan grande o pequeña es. Aun
que lo que se considera grande o pequeño depende de muchos factores, los científicos sociales
han adoptado una convención general. Las correlaciones alrededor de .10 se consideran pe
queñas; aquellas alrededor de .30 se consideran medianas y aquellas alrededor de .50 o más
se consideran elevadas (Cohén y Cohén, 1975). Usando los ejemplos en las figuras 2.2 a 2.4,
la correlación +.60 entre la estatura y el peso se considera grande, como lo es la correlación
de -.6 0 entre la autoestima y el porcentaje de tiempo infeliz. Estas correlaciones son equiva
lentes en magnitud, pero diferentes en signo.
El concepto de significancia estadística también puede aplicarse a los valores de corre
lación. Esto es, en esencia, parte del cálculo estadístico, y da como resultado un valor numé
rico acerca de la probabilidad de encontrarse una correlación de este tamaño por azar, dadas
las variables medidas y el tamaño de la muestra. Aquí los psicólogos también requieren una
probabilidad de .05 o menos antes de decir que una correlación es significativa.
Es importante tomar en cuenta que uno no puede inferir causalidad de las correlaciones.
Al menos hay dos razones por las que las correlaciones nunca pueden demostrar causalidad.
Una se llama problem a de direccionalidad. Si A y B se correlacionan, no sabemos si A es la
causa de B o si B es la causa de A. Por ejemplo, sabemos que hay una correlación entre extra
versión y felicidad. A partir de este solo hecho, no sabemos si ser extrovertido causa que las
personas sean felices o si ser feliz causa que las personas sean extrovertidas.
La segunda razón de que las correlaciones nunca pueden demostrar causalidad es el
problem a de la tercera variable. Podría ser que dos variables se correlacionen debido a una
tercera variable desconocida que causa ambas. Por ejemplo, la cantidad de helados vendidos
en cualquier día dado puede correlacionarse con el número de personas que se ahogaron ese
día particular. ¿Esto significa que comer helado causa ahogamiento? No necesariamente, ya
que es más probable que esté en funcionamiento una tercera variable: el clima caluroso. En
días muy calurosos, muchas personas comen helado. Además, en días muy calurosos, van a
nadar muchas personas que de otra manera no nadan mucho, así que es probable que un ma
yor número se ahogue en dichos días. Ahogarse no tiene nada que ver con comer helado; más
bien, es probable que estas dos variables sean causadas por una tercera variable: el clima ca
luroso. Tanto con los métodos correlaciónales como con los experimentales, es importante re
conocer que no todos los individuos se ajustan a las generalizaciones establecidas en los
estudios donde participan.
Estudios de caso
A veces un investigador de la personalidad está interesado en examinar la vida de una per
sona a profundidad como un estudio de caso. Hay muchas ventajas en el m étodo del estu
dio de caso. Los investigadores pueden averiguar sobre la personalidad con gran detalle, lo
cual rara vez puede lograrse si el estudio incluye un gran número de personas. Los estudios
de caso pueden dar a los investigadores ideas de la personalidad que luego pueden usarse
para formular una teoría más general que se probará en una población más grande. Y pue
de proporcionar conocimiento profundo de un individuo sobresaliente en particular, como
Mahatma Gandhi o Martin Luther King. Los estudios de caso también pueden ser útiles pa
ra estudiar fenómenos raros, como una persona con una memoria fotográfica o una persona
con personalidades múltiples, casos para los que sería difícil o imposible obtener muestras
grandes.
Un estudio de caso reciente ocupó un número entero del Journal o f Personality
(Nasby y Read, 1997). Este estudio presenta el caso de Dodge Morgan, quien, a la edad de
54 años, completó él solo una circunnavegación de la Tierra sin escalas en un barco peque
ño. El estudio de caso publicado por Nasby y Read es una narración muy legible de este in
teresante hombre que emprendió una tarea casi imposible. El enfoque era ver cómo las
primeras experiencias en la vida del señor Morgan formaron una personalidad adulta particu
Capítulo Dos Evaluación de la personalidad, medición v diseño do ¡m itigación
lar, la cual lo condujo a emprender el acto extremo de viajar solo alrededor del
mundo en un barco pequeño. Los psicólogos usaron la bitácora de viaje de Morgan,
material autobiográfico, entrevistas e incluso cuestionarios de personalidad están
dares para realizar su estudio de caso. El informe es notable porque los psicólogos
también comentaron las ventajas y desventajas del método de estudio de caso para
hacer progresos en la ciencia de la psicología de la personalidad. Los autores con
cluyeron que las teorías de la personalidad proporcionan un lenguaje para exponer
vidas individuales; el análisis de vidas individuales, a su vez, proporciona un me
dio para evaluar las teorías de la personalidad respecto a cómo pueden ayudarnos
a entender individuos específicos.
En el diseño de estudio de caso puede usarse una amplia gama de herra
mientas. Se pueden elaborar sistemas de codificación para ser aplicados a textos
escritos, como las cartas personales y correspondencia de la persona bajo estudio.
Se pueden entrevistar a docenas de personas que conocen al individuo en estudio. Se
puede entrevistar al participante por horas y con una gran profundidad. Se puede
seguir a la persona con una cámara de video y grabar, con sonido e imagen, las
acciones en su vida cotidiana. En suma, las técnicas de evaluación usadas en los
diseños de estudio de caso sólo están limitadas por la imaginación del investigador.
Dodge Morgan tenía 54 años de edad
Estudio de caso: un niño en busca de atención cuando completó solo una circunnave
Uno de los defensores más fuertes del método de estudio de caso fue Gordon All- gación de la Tierra sin escalas en su
port, uno de los fundadores del campo de la psicología moderna de la personalidad. barco American Promise. Un estudio
Allport creía con firmeza que podían surgir hipótesis importantes sobre la persona de caso extenso de este fascinante
lidad a partir del examen a profundidad de individuos aislados. También creía que hombre fue realizado por los psicólo
uno podía probar hipótesis acerca de las características de personalidad subyacen
gos William Nasby y Nancy Read, y lo
tes de un solo individuo usando métodos de estudio de caso. El siguiente ejemplo
ilustra esta clase de formación y prueba de hipótesis: dieron a conocer en su artículo “The
Life Voyage o f a Solo Circumnaviga
Cierto niño mostraba en la escuela una conducta ejemplar; era ordenado, la tor”publicado en Journal of Persona
borioso y atento. Pero en casa era ruidoso, revoltoso y abusivo con los niños lity, 1997, volumen 65, páginas
más pequeños... 787-1053.
Ahora el psicólogo podría plantear la hipótesis: esta disposición central
del niño es un anhelo de atención. Encuentra que consigue su fin mejor en la
escuela conformándose con las reglas; en casa, desobedeciéndolas.
Después de plantear esta hipótesis, el psicólogo podría contar en realidad los ac
tos del niño durante el día (siendo comprobado por algún observador independiente) p a
ra ver cuántos de ellos fueron “equivalentes desde el punto de vista funcional”; es decir,
manifestaban un intento claro de llamar la atención. Si la proporción es alta, podemos
considerar la hipótesis como confirmada, y la disposición de personalidad como estable
cida. (Allport, 1961, p. 368.)
Estudio de caso: el asesino serial Ted Bundy

Aunque Ted Bundy fue condenado por el asesinato de tres mujeres, era sospechoso de haber
violado y matado a 36 mujeres durante su media década de series de asesinatos en los estados
de Oregon, Washington, Colorado y Florida en la década de 1970 (Rule, 2000). Se han dedi
cado estudios de caso a explicar lo que llevó a Bundy a violar y matar. Algunos se remontan
al hecho de que fue adoptado y sentía una vergüenza severa por el hecho de nunca haber cono
cido a sus padres biológicos. Algunos lo vinculaban con el fracaso de sus aspiraciones como
abogado, donde se había frustrado una motivación para esforzarse por una posición. Algunos
se remontan al hecho que desarrolló una profunda hostilidad hacia las mujeres después de ha
ber sido rechazado por su novia, una mujer que era considerablemente superior a él en posi
ción socioeconómica y quien él sentía era imposible de reemplazar. Todos los estudios de caso
de Bundy revelan, sin embargo, que compartía muchos rasgos con otros asesinos en serie. Te
Introducción
... . •
i
nía una personalidad soeiopática “clásica”: grandiosidad, un sentido extremo de privilegios,

preocupación con fantasías irreales de éxito y poder, carencia de empatia por otras personas,
una larga historia de engaños, fracasos repetidos para cumplir con las obligaciones que se es
peran por lo normal en la escuela y el trabajo, y niveles altos de explotación interpersonal.
Además, Ted Bundy mostraba disposiciones de comportamiento y personalidad tempranas
que se sabe están asociadas con los asesinos en serie, la llamada “tríada del asesino en serie”:
1) torturar animales cuando era niño, 2) iniciar incendios destructivos y 3) mojar la cama. Es
tudios de caso como los de Ted Bundy pueden revelar aspectos únicos de su vida (por ejem
plo, ser rechazado por una novia de posición superior, fracaso en lograr una posición como
abogado), así como disposiciones de personalidad comunes que con frecuencia se vinculan
con los asesinos en serie (por ejemplo, el caso reciente de Keith Hunter Jesperson, quien con
fesó haber violado y matado a ocho mujeres; Olson, 2002). En el caso de Bundy, su persona
lidad y su vida terminaron y no matará más. Después de dos escapes exitosos de la cárcel,
Bundy mató a su última víctima en Florida y por fin fue capturado y declarado culpable. Des
pués de una década en la que se agotaron las apelaciones legales, Ted Bundy fue ejecutado en
Florida en 1989.
A pesar de las ventajas del método de estudio de caso profundo, tiene algunas limita
ciones esenciales. La más importante es que los hallazgos basados en un individuo no pue
den generalizarse a otras personas. En este sentido, un estudio de caso es a otros diseños de
investigación lo que un estudio del planeta Marte es al estudio de los sistemas planetarios. Po
demos averiguar mucho sobre Marte (o una persona particular), pero lo que averigüemos pue
de no ser aplicable a otros planetas (u otras personas). Por esta razón, los estudios de caso se
usan con más frecuencia como una fuente de hipótesis y como un medio para ilustrar un prin
cipio trayéndolo a la vida. No obstante, los estudios de caso de la personalidad pueden verse
como un método de investigación valioso de manera excepcional, y con frecuencia pueden ser
interesantes de manera intrínseca al iluminar la vida de individuos excepcionales.
Ted Bundy, asesino serial convicto, muestra la personalidad característica del clásico sociopata.
CAPÍTULO Dos Evaluación de la personalidad, medición y diseño de investigación 55
Cuándo usar diseños experimentales, correlaciónales y de estudio de caso

Cada uno de los tres tipos principales de diseños de investigación tienen ventajas y desventa
jas o, con más precisión, interrogantes para las que cada uno es bueno o malo para respon
der. El método experimental es adecuado en forma ideal para establecer relaciones causales
entre variables. Por ejemplo, puede usarse para determinar si las condiciones ruidosas obstacu
lizan el desempeño de los introvertidos, pero no de los extrovertidos. Por otra parte, el mé
todo experimental es malo para identificar las relaciones entre variables cuando ocurren de
manera natural en la vida cotidiana. Es más, puede ser poco práctico o poco ético usar el mé
todo experimental para algunas cuestiones. Por ejemplo, si un investigador está interesado en
la función de la nutrición en el desarrollo de la inteligencia, sería poco ético llevar a cabo un
experimento en el que la mitad de los participantes cuando niños fueran puestos a una dieta
de hambre por varios años para ver si esto afecta su ci cuando adultos.
'
■
c ro c io
Piense en una pregunta acerca de un aspecto de la personalidad. La mayor parte de las pregun
tas adoptan la forma de “¿La variable A se relaciona con la variable B o es causada por ésta?”
Por ejemplo, ¿las personas extrovertidas son mejores que las introvertidas para afrontar el es
trés? ¿Las personas con autoestima alta tienen más probabilidad de ser exitosas que las personas
con autoestima baja? ¿Las personas narcisistas tienen problemas para llevarse bien con otros?
Escriba su pregunta acerca de la personalidad. Ahora piense acerca de cómo podría contestar a
su pregunta usando un experimento, usando el método correlacional y haciendo un estudio de
caso. Describa en forma breve cómo usaría cada uno de estos tres diseños de investigación para
tratar de responder su pregunta.
Sin embargo, hay personas que, por cualesquiera circunstancias desafortunadas, han te
nido varios años de muy mala nutrición. Por tanto, podría hacerse un estudio correlacional so
bre si el nivel de nutrición se relaciona con el desarrollo de la inteligencia. Esta desventaja del
diseño de investigación experimental es precisamente la ventaja del diseño correlacional. Los
diseños correlaciónales son adecuados de manera ideal para establecer la relación entre dos o
más variables que ocurren en la vida cotidiana, como entre la estatura y la dominación, la es
crupulosidad y el promedio de calificaciones, o la ansiedad y la frecuencia de enfermedades.
Pero los diseños correlaciónales son malos para establecer causalidad. No pueden determinar,
por ejemplo, si las enfermedades recurrentes conducen a la ansiedad, si la ansiedad conduce
a la enfermedad o si una tercera variable explica tanto estar con frecuencia enfermo como es
tar con frecuencia ansioso.
Los estudios de caso son ideales para generar hipótesis que pueden probarse después
usando métodos correlaciónales o experimentales. Los estudios de caso pueden usarse para
identificar patrones en el funcionamiento psicológico individual que podrían ser pasado por
alto por el enfoque experimental más riguroso pero artificial y los diseños correlaciónales li
mitados. Además, los estudios de caso son ideales para describir la riqueza y complejidad de
la experiencia humana. A pesar de estas ventajas, los estudios de caso no pueden establecer
causalidad, como los métodos experimentales, ni pueden identificar patrones de covariación
entre individuos conforme ocurren en la naturaleza. Los estudios de caso tampoco pueden ge-
neralizarse a nadie aparte del individuo único que se está estudiando. Juntos, los tres diseños
proporcionan métodos complementarios para explorar la personalidad humana.
La evaluación y medición de la personalidad comienzan con la identificación de las fuentes

de datos de personalidad, los lugares en los que obtenemos información sobre la personalidad.
Las cuatro fuentes principales de datos de personalidad son el autorreporte (datos A), reporte
de un observador (datos O), pruebas de laboratorio (datos P) y resultados de la historia de vi
da (datos V). Cada una de estas fuentes de datos tiene ventajas y desventajas. En el autorre
porte, por ejemplo, los participantes podrían fingir o mentir. Los observadores en el modo de
datos O pueden carecer de acceso a la información relevante. Las pruebas de laboratorio pue
den ser inadecuadas para identificar patrones que ocurren en forma natural en la vida cotidia
na. Sin embargo, cada fuente de datos de personalidad es en extremo valiosa, y cada una
proporciona información que no puede obtenerse por medio de las otras fuentes. Además, nue
vas técnicas de medición continúan inventándose y explorándose; un ejemplo reciente es la
iRMf, o imagen por resonancia magnética funcional, la cual detecta la ubicación y los patro
nes de actividad cerebral cuando el individuo realiza tareas particulares.
Una vez que se han seleccionado las fuentes de datos para medir la personalidad, en
tonces el investigador las somete a pruebas para evaluar su calidad. Las medidas de perso
nalidad, de manera ideal, deberían ser confiables en el sentido de llegar a las mismas
puntuaciones a través de la medición repetida. Deberían ser válidas, midiendo lo que se supo
ne que miden. Y los investigadores deberían establecer qué tan generalizables son sus medi
das, determinando las personas, escenarios y culturas en las que es más aplicable la medida.
Las escalas aplicables sólo a estudiantes universitarios en Estados Unidos, por ejemplo, son
menos generalizables que las escalas aplicables a personas de diferentes edades, sectores eco
nómicos, grupos éticos y culturas.
El siguiente paso en la investigación de la personalidad implica seleccionar un diseño
de investigación particular dentro del cual usar las medidas. Hay tres tipos básicos de diseños de
investigación. El primero, el diseño de investigación experimental, implica controlar o mani
pular las variables de interés, y es más adecuado para determinar la causalidad entre dos va
riables. El segundo, diseño de investigación correlacional, es más adecuado para identificar
relaciones entre variables que ocurren en forma natural, pero es menos adecuado para deter
minar causalidad. El tercero es el método de estudio de caso, el cual es más adecuado para ge
nerar nuevas hipótesis acerca de la personalidad y entender a individuos por separado.
Quizá el principio más importante de la evaluación y medición de la personalidad es
que las decisiones acerca de la fuente de datos y el diseño de investigación dependen en
gran medida del propósito de la investigación. No hay métodos perfectos; no hay diseños
perfectos. Pero hay fuentes de datos y métodos que son más adecuados para algunos propó
sitos que para otros. Por tanto, mientras examina las teorías y hallazgos de investigación en
este libro, tome en cuenta que diferentes investigadores usan diferentes fuentes de datos y
diferentes diseños de investigación porque tienen metas y propósitos diferentes al realizar
su investigación.
Capítulo Dos Evaluación de la personalidad, medición v diseño de investi,pación
Datos de autorreporte (datos A) 26 Técnicas proyectivas 36 Constructos teóricos 43

No estructuradas 26 Datos de resultados de la vida Generabilidad 44
Estructuradas 26 (datos V) 38 Métodos experimentales 45
Escala Likert 29 Confiabilidad 41 Manipulación 45
Muestreo de experiencia 29 Medición repetida 41 Asignación aleatoria 45
Datos de reporte del observador Prejuicio histórico 42 Contrabalanceo 45
(datos O) 30 Validez 43 Estadísticamente significativa 47
Confiabilidad entre estimadores 30 Validez aparente 43 Método correlacional 48
Múltiples personalidades sociales 31 Validez predictiva 43 Coeficiente de correlación 48
Observación naturalista 31 Validez de criterio 43 Problema de direccionalidad 52
Datos de prueba (datos P) 32 Validez convergente 43 Problema de la tercera variable 52
Obtención de imágenes por resonancia Validez discriminante 43 Método del estudio de caso 52
magnética funcional (iRMf) 36 Validez de constructo 43

Capítulo 2 Evaluación de La Personalidad, Medición y Diseños de Investigación PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Capítulo 2 Evaluación de La Personalidad, Medición y Diseños de Investigación PDF

Cargado por

Copyright:

Formatos disponibles

Evaluación de la personalidad,

Gran parte de la discusión

En este capítulo se cubren tres temas relacionados con la evaluación y la investigación

Un acercamiento detallado ¿Quién soy?

Menos característico Más característico

__ distraído ___alegre ___ dependiente

Aunque el muestreo de experiencia usa el autorreporte como la fuente de datos, difiere de

Datos de reporte del observador (datos 0)

Observación naturalista frente a la artificial

seguidor, quien tendría que ir dentro de la caja y realizar las ta­

Dispositivos mecánicos de registro

particular interés que los niños activos también fueron vistos

D atos fisiológicos El nivel de actividad es estable a lo largo del tiempo y se corre­

preparados para tener un sobresalto defensivo más rápido si

Datos de resultados de la vida (datos V)

Problemas en la evaluación de la personalidad

Vínculos entre varias fuentes de datos

La confiabilidad de la medición de la personalidad

Condición ruidosa Condición silenciosa

En diseños experimentales, es común desear establecer si los grupos en las diferentes

1.5 2.5 3.5 4.5 5.5 6.5 7.5

Estudio de caso: el asesino serial Ted Bundy

nía una personalidad soeiopática “clásica”: grandiosidad, un sentido extremo de privilegios,

Cuándo usar diseños experimentales, correlaciónales y de estudio de caso

La evaluación y medición de la personalidad comienzan con la identificación de las fuentes

Datos de autorreporte (datos A) 26 Técnicas proyectivas 36 Constructos teóricos 43

También podría gustarte

distraído _alegre ___ dependiente

seguidor, quien tendría que ir dentro de la caja y realizar las ta

D atos fisiológicos El nivel de actividad es estable a lo largo del tiempo y se corre