Psicología Experimental

Machine Translated by Google
Experimental
Psicología
NOVENA EDICIÓN
Barry. H. Kantowitz
Universidad de Michigan
Enrique L. Roediger III

Universidad de Washington en St. Louis
David G. Elmes
Universidad de Washington y Lee
Australia • Brasil • Japón • Corea • México •

Singapur • España • Reino Unido • Estados Unidos
Psicología Experimental, Novena Edición © 2009, 2005 Wadsworth, Cengage Learning

Barry H. Kantowitz, Henry L. Roediger III, David
RESERVADOS TODOS LOS DERECHOS. Ninguna parte de este trabajo cubierto por
G. Elmes
los derechos de autor del presente puede reproducirse, transmitirse, almacenarse o usarse
Editorial: Michele Sordi de ninguna forma o por ningún medio gráfico, electrónico o mecánico, incluidos, entre otros,
fotocopias, grabaciones, escaneos, digitalizaciones, grabaciones, Web distribución, redes
Asistente de edición: Rebecca Rosenberg
de información o sistemas de almacenamiento y recuperación de información, excepto según
Gerente de Proyectos de Tecnología: Lauren Keyes lo permitido por la Sección 107 o 108 de la Ley de derechos de autor de los Estados Unidos
Gerente de Mercadeo: Michelle Williams de 1976, sin el permiso previo por escrito del editor.
Asistente de marketing: Melanie Cregger

Para obtener información sobre productos y asistencia tecnológica, contáctenos en
Gerente de Comunicaciones de Mercadeo:
Soporte de ventas y atención al cliente de Cengage Learning, 1-800-354-9706
linda yip
Para obtener permiso para usar material de este texto o producto,
Gerente de Proyectos, Producción Editorial: envíe todas las solicitudes en línea en cengage.com/permissions
pat waldo Se pueden enviar más preguntas sobre permisos por correo
electrónico a allowrequest@cengage.com
Director Creativo: Rob Hugel
Director de arte: Vernon Boes

Número de control de la Biblioteca del Congreso: 2008920142
Diseñadora de texto: Cheryl Carrington
ISBN-13: 978-0-495-59533-5
Comprador de impresión: Paula Vang
Editor de permisos de texto/arte: ISBN-10: 0-495-59533-0
Margaret Chamberlain-Gastón
Editor de permisos de imagen: Deanna Ettinger Wadsworth

10 Davis Drive
Servicio de Producción: Carol O'Connell, Gráfico
Belmont, CA 94002-3098
Servicios editoriales mundiales
ciervo
Investigador fotográfico: Susan Van Etten
Ilustradora: Lori Heckleman

Cengage Learning es un proveedor líder de soluciones de aprendizaje personalizadas
Diseñador de portada: Bill Stanton
con oficinas en todo el mundo, incluidos Singapur, el Reino Unido, Australia, México,
Imagen de portada: © Ryuichi Okano/Getty Images Brasil y Japón. Localice su oficina local en international.cengage.com/region.
(imagen principal) y © Akira Inoue/Getty
Imágenes (imagen insertada)
Compositor: Graphic World Inc.

Los productos de Cengage Learning están representados en Canadá por Nelson
Education, Ltd.
Para su curso y soluciones de aprendizaje, visite academic.cengage.com.
Compre cualquiera de nuestros productos en su tienda universitaria local o en nuestra tienda

en línea preferida www.ichapters.com.
Impreso en los Estados Unidos de América

1 2 3 4 5 6 7 12 11 10 09 08
59533_01_fm_pi-xxiv.indd ii 9533_01_fm_pi-xxiv.indd ii 3/6/08 /6/08

A tres destacados psicólogos que compartieron la diversión

y el entusiasmo de la psicología experimental con nosotros,
David A. Grant, William M. Hinton y L. Starling Reid
59533_01_fm_pi-xxiv.indd iii 9533_01_fm_pi-xxiv.indd iii 3/6/08 /6/08

Esta página se dejó en blanco intencionalmente

SOBRE LOS AUTORES
BARRY H. KANTOWITZ es profesor de psicología,

profesor de ingeniería industrial y operativa y ex
director del Instituto de Investigación del Transporte
de la Universidad de Michigan. Antes de eso, fue
Científico Jefe del Centro de Transporte de
Factores Humanos del Instituto Battelle Memorial
en Seattle. Recibió el Ph.D. Licenciado en
Psicología Experimental de la Universidad de
Wisconsin en 1969. De 1969 a 1987 ocupó cargos
como Asistente, Asociado y Profesor de Ciencias Psicológicas en la
Universidad de Purdue, West Lafayette, Indiana.
El Dr. Kantowitz fue elegido miembro de la Asociación Estadounidense de

Psicología en 1974. Ha sido miembro postdoctoral del Instituto Nacional de
Salud Mental en la Universidad de Oregón, profesor titular de ergonomía en
el Instituto Noruego de Tecnología, Trondheim, Noruega, y Profesor visitante
de Psicología Técnica en la Universidad de Lulea, Suecia. Ha escrito y
editado más de una docena de libros. Su investigación sobre la atención
humana, la carga de trabajo mental, el tiempo de reacción, la interacción
hombre-máquina y los factores humanos ha sido apoyada por la Oficina de
Educación, el Instituto Nacional de Salud Mental, la Administración Nacional
de Aeronáutica y del Espacio, la Oficina de Investigación Científica y la
Administración Federal de Carreteras. Se ha desempeñado como editor de
Transportation Human Factors Journal, editor asociado de Human Factors y
edita la serie de libros Human Factors in Transportation.
HENRY L. ROEDIGER III es el James S.

Profesor Universitario Distinguido de Psicología de la
Universidad de McDonnell y Decano de Planificación
Académica de la Universidad de Washington en St.
Louis, donde ha enseñado desde 1996. Recibió una
licenciatura en psicología de la Universidad de
Washington and Lee en 1969 y un Ph.D. en psicología
cognitiva de la Universidad de Yale en 1973.
Ha enseñado en la Universidad Rice (1988–1996) y la
Universidad Purdue (1973–1988) y pasó 3 años como profesor invitado en la
Universidad de Toronto. Sus intereses de investigación se encuentran en la
psicología cognitiva, particularmente en el aprendizaje y la memoria humanos.
El Dr. Roediger ha publicado más de 180 artículos, capítulos y reseñas,
en
59533_01_fm_pi-xxiv.indd v 9533_01_fm_pi-xxiv.indd v 3/6/08 /6/08

así como otros dos libros de texto: Psicología (en coautoría con ED Capaldi, SG Paris, J. Polivy y
P. Herman) y Métodos de investigación en psicología (con DG Elmes y BH Kantowitz). También
coeditó Varieties of Memory and Consciousness: Essays in Honor of Endel Tulving (1989) y The
Science of Memory: Concepts (2007), así como varios otros libros. El Dr. Roediger se desempeñó
como editor del Journal of Experimental Psychology: Learning, Memory and Cognition (1984–1989)
y fue el editor fundador de Psychonomic Bulletin & Review (1994-1997). Es editor consultor de
nueve revistas, incluidas Psychological Science, Journal of Experimental Psychology: Learning,
Memory, and Cognition, Journal of Memory and Language, and Memory,
entre otros. Se ha desempeñado como presidente de la Sociedad Estadounidense de Psicología, la

Asociación Psicológica del Medio Oeste y la División de Psicología Experimental de la Asociación
Estadounidense de Psicología. Fue miembro de la Junta de Gobierno de la Psychonomic Society
durante 5 años y su presidente en 1989–1990. Ha sido nombrado Investigador Altamente Citado
por el Instituto de Información Científica y también recibió una beca Guggenheim. Roediger ha sido
elegido miembro de la Sociedad de Psicólogos Experimentales y de la Academia Estadounidense
de las Artes y las Ciencias, además de ser elegido Miembro de la Asociación Estadounidense para
el Avance de la Ciencia, la Asociación Estadounidense de Psicología, la Asociación de Ciencias
Psicológicas y la Asociación Psicológica Canadiense.
DAVID G. ELMES es Profesor Emérito de Psicología en la Universidad

Washington and Lee, donde enseñó durante 40 años. Obtuvo su
licenciatura con altos honores de la Universidad de Virginia y completó
la maestría y el doctorado. grados en psicología allí. El Dr. Elmes fue
profesor adjunto en Hampden-Sydney College, fue investigador
asociado durante un año en el Human Performance Center de la
Universidad de Michigan y fue miembro visitante del University College
de la Universidad de Oxford. En Washington and Lee, codirigió el
Programa de Ciencias Cognitivas durante 14 años y presidió el
Departamento de Psicología durante diez años. El profesor Elmes
editó Lecturas en Psicología Experimental, Directorio de Investigación
en Psicología en Principalmente Instituciones de Pregrado, y es coautor de la octava edición de
Métodos de Investigación en Psicología (2006, con BH Kantowitz y HL Roediger III). El Dr. Elmes
ha publicado numerosos artículos relacionados con el aprendizaje, la memoria y el sentido del olfato
humanos y animales. La investigación del olor ha sido apoyada por el Instituto Nacional de Ciencias
de la Salud Ambiental. Frecuentemente revisa artículos enviados a revistas técnicas y fue editor
consultor del Journal of Experimental Psychology: Learning, Memory and Cognition durante varios
años.
El profesor Elmes es un apasionado del valor educativo de la investigación de pregrado.

Durante varios años participó activamente en el Consejo de Investigación de Pregrado, para el cual
se desempeñó como Consejero de Psicología, Presidente de la División de Psicología y Presidente.
El Dr. Elmes es miembro de la Asociación de Ciencias Psicológicas.
59533_01_fm_pi-xxiv.indd vi 9533_01_fm_pi-xxiv.indd vi 3/6/08 /6/08

CONTENIDOS EN BREVE
ÿ PRIMERA PARTE FUNDAMENTOS DE LA INVESTIGACIÓN 1
Capítulo 1 Explicación en Psicología Científica 3
Capitulo 2 Técnicas de Investigación: Observación

y Correlación 24
Capítulo 3 Técnicas de Investigación: Experimentos 51
Capítulo 4 Ética en la Investigación Psicológica 82
Capítulo 5 Cómo leer y escribir informes de investigación 99
ÿ SEGUNDA PARTE PRINCIPIOS Y PRÁCTICAS

DE LA PSICOLOGÍA EXPERIMENTAL 151
Capítulo 6 Psicofísica 153
Capítulo 7 Percepción 180
Capítulo 8 Atención y tiempo de reacción 207
Capítulo 9 Condicionamiento y aprendizaje 227
Capítulo 10 Recordar y olvidar 261
Capítulo 11 Pensamiento y resolución de problemas 297
Capítulo 12 Diferencias individuales y desarrollo 327
Capítulo 13 Psicología Social 358
capitulo 14 Psicología Ambiental 388
Capítulo 15 Factores humanos 410
viii
59533_01_fm_pi-xxiv.indd vii 9533_01_fm_pi-xxiv.indd vii 3/6/08 /6/08


CONTENIDO
ÿ PRIMERA PARTE FUNDAMENTOS DE LA INVESTIGACIÓN 1
CAPÍTULO 1 EXPLICACIÓN EN PSICOLOGÍA CIENTÍFICA 3
Dar sentido al mundo 4

Pan Social de 4
Curiosidad: la fuente de la ciencia 5
Fuentes de conocimiento 6
Fijación de la creencia 6
La naturaleza de la explicación científica 8 ¿Qué es una

teoría? 8 Inducción y deducción 9 De la teoría a la
hipótesis 12 Evaluación de teorías 14 Variables
intervinientes 15 Zorros y erizos deambulando por
la teoría psicológica 17 La ciencia de la psicología
18 La psicología y el mundo real 19 Resumen 22
Términos clave 23 Preguntas de discusión 23
Conexiones web 23
CAPÍTULO 2 TÉCNICAS DE INVESTIGACIÓN: OBSERVACIÓN Y

CORRELACIÓN Observación naturalista 26 ¿Qué 24
observamos? 28
Reactividad 30
El estudio de caso 31
Investigación de encuestas 32
Ventajas y desventajas de las observaciones naturalistas 33
El enfoque relacional 36
Investigación de contingencias 36
Investigación correlacional 38
El coeficiente de correlación 38
Procedimientos correlacionales complejos 44
ix
59533_01_fm_pi-xxiv.indd ix 9533_01_fm_pi-xxiv.indd ix 3/6/08 /6/08

Causa: una nota 46
Resumen 48
Términos clave 49
Preguntas de discusión 49
Conexiones web 50
Recurso de laboratorio 50
CAPÍTULO 3 TÉCNICAS DE INVESTIGACIÓN: EXPERIMENTOS ¿Qué es un 51

experimento? 52 Ventajas de los experimentos 53 Por qué
se realizan los experimentos 54 Variables 55
Variables independientes 55 Variables dependientes
56 Variables de control 57 Nombre de las variables 57 Más
de una variable independiente 58 Más de una

variable dependiente 63 Diseños experimentales
64 Diseños entre sujetos 64 Diseños dentro de los
sujetos 65 Diseños de n pequeña 66 Diseños
mixtos 67 Condiciones de control 67 Dificultades

68
Cuasi-Experimentos 71
Del problema al experimento: las tuercas y los tornillos 76

Realización de un experimento 76
Del problema al experimento 76
Datos 77
Obtención de datos 77
Análisis de datos 78
Informe de datos 78
Resumen 79
Términos clave 80
Conexiones web 81
CAPÍTULO 4 ÉTICA EN LA INVESTIGACIÓN PSICOLÓGICA 82
Investigación con participantes humanos 83

Consentimiento informado y engaño 85
Libertad de retiro 86
Protección contra daños y debriefi ng 87

Eliminación de consecuencias dañinas 87
Confianza 88
59533_01_fm_pi-xxiv.indd x 9533_01_fm_pi-xxiv.indd x 3/6/08 /6/08

Ética en la Investigación con Animales 89
Argumentos en contra de la Investigación con Animales 89
Argumentos a favor de la investigación con animales 90

Directrices para el uso de animales en la investigación 91
Fraude científi co 92
Monitoreo de Prácticas Éticas 94

Resumen 95
Términos clave 96
Conexiones web 96
Lecturas sugeridas 97
Psicología en acción: comprender y recordar los formularios de consentimiento 97
CAPÍTULO 5 CÓMO LEER Y ESCRIBIR INFORMES DE INVESTIGACIÓN 99

Cómo hacer una búsqueda de literatura 100
Las partes de un artículo 101
Título y Autor(es) 101

Resumen 101
Introducción 102
Método 102
Resultados 102
Discusión 105
Referencias 105
Lista de verificación para el lector crítico 105
Introducción 106
Método 106
Resultados 107
Discusión 107
Resumen de la lista de verificación 108
Ejemplo de artículo de diario 109

Redacción de un informe de investigación 118
Formato 119
Ejemplo de manuscrito 121
Estilo 143
Publicación de un Artículo 146
Resumen 147
Términos clave 147
Conexiones web 148
Psicología en acción: una búsqueda bibliográfica 148
59533_01_fm_pi-xxiv.indd xi 9533_01_fm_pi-xxiv.indd xi 3/6/08 /6/08

ÿ SEGUNDA PARTE PRINCIPIOS Y PRÁCTICAS
DE LA PSICOLOGÍA EXPERIMENTAL 151
CAPÍTULO 6 PSICOFÍSICA 153
Medición de sensaciones 154

6.1 Temas experimentales e ilustraciones de investigación
Definición operativa: umbrales 156 Introducción
de las variables 157 6.2 Temas experimentales e
ilustraciones de investigación
Escalas de medida: Ley de Fechner y Ley de Stevens 169
6.3 Temas experimentales e ilustraciones de investigación Diseño

de n pequeña : métodos psicofísicos 174 Del problema
al experimento: las tuercas y los tornillos ¿Tienen las palomas

umbrales visuales? 176 Resumen 177 Términos clave
177 Preguntas de debate 178 Conexiones web
178
Psicología en Acción: Ley de Weber 178
CAPÍTULO 7 PERCEPCIÓN 180
Problemas en la percepción
181 Percepción directa e indirecta
181 Conciencia y percepción 183
Introducción de las variables 186 7.1
Temas experimentales e ilustraciones de investigación
Informe verbal: Percepción sin conciencia 187 7.2
Temas experimentales e ilustraciones de investigación
Operaciones convergentes: Percepción sin conciencia y percepción con conciencia explícita 196
Del problema al experimento: las tuercas y los tornillos
La ilusión de distancia de color 201
Resumen 204
Términos clave 205
Conexiones web 205
Psicología en acción: el efecto Stroop 206
CAPÍTULO 8 ATENCIÓN Y TIEMPO DE REACCIÓN 207

El ABC del tiempo de reacción 208

Confusión: inserción pura 210 Introducción de
las variables 211
59533_01_fm_pi-xxiv.indd xii 9533_01_fm_pi-xxiv.indd xii 3/6/08 /6/08

Selección de la variable dependiente: equilibrio entre velocidad y precisión
215 8.3 Temas experimentales e ilustraciones de investigación Efectos de interacción:

control cognitivo 221 Del problema al experimento: las tuercas y tornillos que
miden la atención 222 Resumen 225 Términos clave 225 Preguntas de discusión 225
Conexiones web 226
Psicología en acción: equilibrio entre velocidad y precisión 226
CAPITULO 9 CONDICIONAMIENTO Y APRENDIZAJE 227
Tipos de condicionamiento 229

Condicionamiento clásico: ¿Te suena el nombre de Pavlov? 229
Condicionamiento instrumental (operante) 231 Introducción de las
variables 234 9.1 Temas experimentales e ilustraciones de investigación
Diseños dentro y entre sujetos: intensidad del estímulo 235

Equilibrio: contraste simultáneo 240 9.3 Temas
experimentales y aplicaciones de investigación
Diseños con n pequeña : problemas de comportamiento en niños 246

El efecto de extinción de refuerzo parcial 253
Resumen 257
Términos clave 258
Conexiones web 259
Psicología en acción: el conocimiento de los resultados como refuerzo 259
CAPÍTULO 10 RECORDAR Y OLVIDO 261
La contribución de Ebbinghaus: cuando la memoria era joven 262

Variedades de la memoria 266 Introducción de las variables 267 10.1
Temas experimentales e ilustraciones de investigación Atenuación de
escala: diferencias de modalidad 268 10.2 Temas experimentales e
ilustraciones de investigación Generalidad de los resultados:
niveles de procesamiento 274 10.3 Temas experimentales e ilustraciones
de investigación
Efectos de interacción: pruebas de memoria implícita y explícita 281

¿Qué es más efectivo, leer o escuchar? 291
59533_01_fm_pi-xxiv.indd xiii 9533_01_fm_pi-xxiv.indd xiii 3/6/08 /6/08

Resumen 293
Términos clave 294
Conexiones web 295
Recursos de laboratorio 295
Psicología en acción: recordando los ataques terroristas del 11 de septiembre 296
CAPÍTULO 11 PENSAMIENTO Y RESOLUCIÓN DE PROBLEMAS 297
Dos enfoques del pensamiento 299 El

aprendizaje por ensayo y error de Thorndike
299 Insight en los chimpancés de Köhler 300
Confiabilidad y replicación: razonamiento analógico 301
Introducción de las variables 303 11.2 Temas experimentales e
ilustraciones de investigación Control experimental: fijeza funcional

311 11.3 Temas experimentales e ilustraciones de investigación
Informes verbales: exceso de confianza en los juicios 315

Incubación en la resolución de problemas 319
Resumen 323
Términos clave 323
Conexiones web 325
Psicología en acción: sesgo de confirmación 325
CAPÍTULO 12 DIFERENCIAS INDIVIDUALES Y DESARROLLO Enfoques de las 327
diferencias individuales 329 Enfoques metodológicos de las

diferencias individuales 329 Variables que conducen a las
diferencias individuales 330 Introducción de las variables 332
Confiabilidad de las medidas: inteligencia y diseños de investigación del desarrollo 333

Definiciones operativas: inteligencia 339 12.3 Temas
experimentales e ilustraciones de investigación Artefactos de

regresión: evaluación educativa 345
Del problema al experimento: las tuercas y los tornillos ¿Qué

papel juegan la motivación y la emoción en el desempeño intelectual? 350 Resumen 354
Términos clave 355 Preguntas de debate 355 Conexiones web 356
Psicología en acción: una demostración de artefactos de regresión 356
59533_01_fm_pi-xxiv.indd xiv 9533_01_fm_pi-xxiv.indd xiv 3/6/08 /6/08

CAPÍTULO 13 PSICOLOGÍA SOCIAL 358
Los orígenes de la psicología social 359 13.1

Temas experimentales e ilustraciones de investigación Control
experimental: obediencia a la autoridad 362
Introducción de las variables 363 Condiciones que fomentan
la obediencia 367 13.2 Temas experimentales e
ilustraciones de investigación
Características de la demanda y sesgo del experimentador: hipnosis 370

Investigación de campo: intervención del espectador
374 13.4 Temas experimentales e ilustraciones de
investigación Elección de la variable dependiente: medición de estereotipos y
prejuicios 378 Del problema al experimento: las tuercas y tornillos
¿Cómo afecta la presencia de otras personas el desempeño de una persona en una tarea? 381 Resumen
384 Términos clave 385 Preguntas de discusión 385 Conexiones web 386 Recursos de
laboratorio 386
Psicología en acción: el poder de ser en un experimento 386
CAPÍTULO 14 PSICOLOGÍA AMBIENTAL ¿Es la ciencia el 388
único camino hacia la verdad? 389

Descubriendo la verdad sobre la vida en la
ciudad 391 14.1 Temas experimentales e ilustraciones de

investigación Generalización de resultados: hacinamiento
393 Introducción de las variables 394 14.2 Temas experimentales
e ilustraciones de investigación
Cuasi-Experimentos: Ruido y Rendimiento Cognitivo 401

Cuestiones éticas: engaño y encubrimiento 403 Del
problema al experimento: las tuercas y tornillos ¿La exposición al

ruido es mala para usted? 405 Resumen 407 Términos
clave 408 Preguntas de discusión 408 Conexiones
web 408 Recursos de laboratorio 408
Psicología en Acción: Ruido y Memoria 409
CAPÍTULO 15 FACTORES HUMANOS 410

Factores humanos y comportamiento humano 411
Definición 411
Honra a tu usuario 412

El valor de la vida 413
59533_01_fm_pi-xxiv.indd xv 9533_01_fm_pi-xxiv.indd xv 3/6/08 /6/08

Introducción de las variables 414 15.1
Temas experimentales e ilustraciones de investigación Diseño de

n pequeña : agudeza visual dinámica 415 15.2 Temas
experimentales e ilustraciones de investigación

Selección de variable dependiente: carga de trabajo mental 417

Investigación de campo: la luz de freno montada en alto centrada 425

Mida la carga de trabajo mental del piloto en el vuelo 427
Resumen 428
Términos clave 428
Conexiones web 429
Psicología en acción: comprensión de los símbolos de las señales de tráfico 429
APÉNDICE A PSICOLOGÍA EXPERIMENTAL: UN ESQUEMA HISTÓRICO 432
Orígenes de la Psicología Experimental: Filosofía y Fisiología 433

La Contribución de Helmholtz 435
Psicología científica temprana 435

ernesto weber 436
Gustav Fechner 436
Guillermo Wundt 437
Hermann Ebbinghaus 437
Facultades de Psicología 438

Estructuralismo: la estructura de la vida mental 438
Funcionalismo: los usos de la mente 439
Conductismo: Rechazo de explicaciones mentales 440

Psicología de la Gestalt: Percepción del Todo 441
Algunas tendencias modernas 442

La Segunda Guerra Mundial y la Extensión de la Psicología 442
Psicología cognitiva: el retorno de la mente 442
Neurociencia cognitiva: la década del cerebro 443
Especialización 444
Resumen 446
Términos clave 447
Conexiones web 447
APÉNDICE B RAZONAMIENTO ESTADÍSTICO: UNA INTRODUCCIÓN 448
Estadística descriptiva: decir las cosas como son 449

Tendencia central 450
Medidas de dispersión 451
Una nota sobre el cálculo 453
La distribución normal 454
Coeficiente de correlación 456
59533_01_fm_pi-xxiv.indd xvi 9533_01_fm_pi-xxiv.indd xvi 3/6/08 /6/08

Estadística inferencial 458
Muestreo 458
La distribución de medias muestrales 460
Prueba de hipótesis 463
Pruebas de diferencias entre dos grupos 469 Prueba t
473
Magnitud del efecto 476

El análisis de varianza 477
2
Prueba de Independencia 486
Usos indebidos de las estadísticas 487
Uso de muestras pequeñas o sesgadas 488

Comparaciones ausentes o inapropiadas 489
La falacia del jugador 490
Resumen 491
Términos clave 492
Conexiones web 492
APÉNDICE C TABLAS ESTADÍSTICAS 494

Tabla A
Proporciones del área bajo la curva normal 495
Tabla B
Valores críticos del estadístico U de la prueba de Mann-Whitney 498
Tabla C
Distribución para el Sign Test 500
Tabla D
Valores críticos del estadístico T de Wilcoxon para la prueba de rangos con signo de pares emparejados 502
Tabla E
Valores críticos de t 503
Tabla F
Valores críticos de la distribución F 504
Tabla G
Valores críticos de la 2 Distribución 508
Tabla H
números aleatorios 509
REFERENCIAS 511
GLOSARIO 528
ÍNDICE DE NOMBRES 542
ÍNDICE DE MATERIA 545
59533_01_fm_pi-xxiv.indd xvii 9533_01_fm_pi-xxiv.indd xvii 3/6/08 /6/08


PREFACIO
El término psicología experimental solía denotar solo unos pocos temas

seleccionados en psicología. En, digamos, 1930, se realizaron experimentos
para comprender la sensación, la percepción, el aprendizaje, la memoria y
algunos otros temas. La situación es bastante diferente hoy en día: se
utilizan métodos experimentales para investigar la psicología social, la
psicología del desarrollo, las diferencias individuales y muchos otros temas
(como la psicología ambiental) que no se consideraban en la visión de la
psicología hace ochenta años. El uso de métodos experimentales se ha
expandido para incluir la mayoría de los temas en el campo. Por lo tanto,
escribir un libro de texto dirigido a este tema se ha convertido en un desafío
cada vez mayor.
Este libro de texto es la novena edición de un libro publicado por
primera vez en 1978. Cada edición ha visto cambios mayores y menores en
respuesta a los comentarios de estudiantes y profesores, y esta edición no
es una excepción. Los lectores familiarizados con la edición anterior
encontrarán cambios en cada capítulo. Hemos tratado de combinar los
mejores aspectos de las ocho ediciones anteriores con nuevas características
para hacer que el libro sea aún más atractivo. (Describimos los cambios
con más detalle a continuación). Nos complace que la continua popularidad
de este texto nos haya permitido producir esta nueva edición, porque
creemos que hemos podido mejorarla y hemos disfrutado trabajar en ella
nuevamente.
El título Experimental Psychology ha aparecido en muchos libros de
texto que se han convertido en clásicos, comenzando con el par de EB
Titchener a principios del siglo XX, pasando por el texto de Woodworth de
1928 y su revisión (Woodworth & Schlossberg, 1954), y finalmente hasta
los libros de Osgood (1953). ) y Underwood (1966). Todos estos libros
proporcionaron una introducción a la metodología de la investigación, pero
lo hicieron en el contexto de la investigación fundamental en psicología
experimental. Los libros trataban principalmente sobre el contenido de la
psicología experimental, con énfasis en los métodos de investigación
utilizados para adquirir el conocimiento. Vemos nuestro libro de texto como
firmemente dentro de esta tradición, aunque mucho menos enciclopédico
que los grandes libros mencionados anteriormente.
Hoy este enfoque es único; Durante las décadas de 1970 y 1980,
aparecieron muchos textos sobre “métodos de investigación” que organizan
el tema de manera bastante diferente. en lugar de proporcionar
xix
59533_01_fm_pi-xxiv.indd xix 9533_01_fm_pi-xxiv.indd xix 3/6/08 /6/08

metodología en el contexto en el que se utiliza, estos libros tratan temas metodológicos (p. ej.,
diseños entre sujetos, diseños de n pequeña ) como títulos de capítulos e introducen ejemplos de
contenido para profundizar en la discusión de los métodos. Este también es un enfoque excelente,
y hemos producido otro texto que encarna este método (Research Methods in Psychology, de
Elmes, Kantowitz y Roediger, también publicado por Wadsworth). Sin embargo, la Psicología
Experimental busca proporcionar una mezcla integrada de contenido y metodología, con métodos
discutidos en el contexto de la investigación real. Las principales diferencias entre nuestro texto y
los de nuestros predecesores en esta tradición son que nuestro enfoque es seleccionar ejemplos
particulares que ilustren mejor el punto metodológico en consideración y que nuestro libro está
destinado principalmente a una audiencia de pregrado con solo un primer curso en psicología.
como fondo
Debemos notar un punto acerca de los términos en nuestro libro. En 1994, el Manual de
publicación de la Asociación Estadounidense de Psicología recomendó que el término tradicional
sujetos, que se había utilizado durante más de un siglo para referirse a las personas que fueron
evaluadas en la investigación psicológica, se cambiara por participantes. Este cambio recibió una
reacción mixta en la comunidad de investigación, y algunas otras organizaciones que publican
revistas de psicología no estuvieron de acuerdo. Por ejemplo, la Psychonomic Society permite el
uso de cualquier término en artículos publicados en sus revistas. Además, los correctores de estilo
de las revistas de la Asociación Americana de Psicología no insisten en que los participantes se
utilicen como el término preferido, sino que fomentan su uso. Debido a que la situación no está
resuelta, hemos seguido la convención de utilizar tanto sujetos como participantes cuando nos
referimos a personas en la investigación psicológica. Tendemos a usar sujetos cuando nos
referimos a animales no humanos en la investigación, pero usamos ambos términos cuando nos
referimos a humanos. Por lo tanto, el uso en nuestro texto refleja la práctica actual en el campo
en general.
ÿ ORGANIZACIÓN DEL TEXTO
La filosofía del texto permanece invariable. Al igual que con las primeras ocho ediciones, nos
hemos esforzado por lograr un tratamiento integrado de la psicología experimental con una
metodología y un contenido que unen los vínculos sin fisuras. El libro incluye dos partes principales.
Los primeros cinco capítulos constituyen la Parte Uno, Fundamentos de la Investigación, y
discuten algunos preliminares metodológicos básicos que necesitan los estudiantes. En estos
capítulos describimos algunos aspectos generales de la ciencia y la construcción de teorías; las
características de (y las diferencias entre) los métodos observacionales, correlacionales y
experimentales (con énfasis en el último); cuestiones éticas en la investigación; y cómo leer y
escribir informes de investigación.
En los diez capítulos restantes, que componen la segunda parte, Principios y prácticas de la
investigación, desarrollamos los aspectos básicos proporcionados en la primera parte al ilustrar
temas metodológicos en el contexto de problemas reales de investigación. Los capítulos cuentan
con títulos de contenido (por ejemplo, Percepción), y parte del contenido se cubre por derecho
propio, pero el objetivo principal de los capítulos es presentar temas metodológicos en el contexto
de la investigación real. Esta organización refleja nuestra creencia de que la mejor manera de
proporcionar a los estudiantes una comprensión de la metodología es integrarla en el contexto de
los problemas reales que ocurren al realizar una investigación. La metodología no existe en el
vacío, sino que se concibe para resolver problemas concretos de investigación. Esperamos que presen
59533_01_fm_pi-xxiv.indd xx 9533_01_fm_pi-xxiv.indd xx 3/6/08 /6/08

Los métodos en el contexto de temas de contenido importantes ayudarán a los estudiantes a ver la importancia
de considerar los métodos de investigación.
Formato del capítulo
Todos los capítulos de la segunda parte comparten un formato común. Esta estructura paralela debería ayudar a
orientar a los estudiantes hacia las características importantes del texto que facilitan el aprendizaje.
Apertura del capítulo Los capítulos comienzan con un bosquejo y una cita. Después de una breve orientación
sobre el área de contenido explorada en el capítulo, el estudiante se encontrará con el primero de varios insertos
en el recuadro, que los lectores de las ediciones anteriores han encontrado útiles y que, por lo tanto, se han
trasladado a la novena edición.
Introducción a las variables Esta función orienta rápidamente al estudiante hacia las variables independientes,
dependientes y de control que se usan comúnmente en áreas de investigación particulares.
Nuestra cobertura de estas variables no agota las posibilidades, pero incluye algunas de las más comunes.
Temas experimentales e ilustraciones de investigación Esta característica representa la parte principal del
capítulo, en la que se presentan dos o tres cuestiones metodológicas en el contexto de un problema de
investigación real. Así, por ejemplo, en el capítulo 10 discutimos la dificultad de los efectos techo y suelo en el
contexto de un experimento de memoria en el que realmente surgió este problema. Muchos de estos temas
experimentales se han presentado en la Parte Uno y se tratan con más detalle en la Parte Dos. Algunos temas
cruciales se tratan más de una vez en la segunda parte para garantizar una mejor comprensión. Los temas de
contenido se eligieron como buenos vehículos para discutir el punto metodológico particular bajo consideración.
Por lo tanto, los temas de contenido pueden no representar los temas más importantes del tema en discusión, ni
pretendemos que nuestros capítulos representen un resumen completo del trabajo contemporáneo en el área.
Nuestra intención es ilustrar cuestiones de métodos en el contexto de problemas reales de investigación que son
de interés. Otras dos características únicas aparecen hacia el final de cada capítulo en la Parte Dos.
Del problema al experimento: las tuercas y los tornillos En esta sección, presentamos la lógica detrás de las
decisiones de diseño experimental (cuántos sujetos deben usarse, por qué se selecciona la variable X en lugar
de la variable Y, etc.) cuando las hipótesis se toman de una base general. forma a las especificidades de un
experimento. Estas decisiones son los “elementos básicos” de la investigación experimental. Son una segunda
naturaleza para los experimentadores en ejercicio y, por lo tanto, rara vez se articulan en artículos de revistas,
pero pueden representar acertijos para quienes son nuevos en la investigación.
Psicología en acción Esta característica sugiere demostraciones experimentales seguras y sencillas que
requieren poco o ningún equipo y que se pueden usar dentro o fuera de clase. Por ejemplo, el Capítulo 7 incluye
una demostración del efecto Stroop y el Capítulo 14 presenta métodos para medir los efectos del ruido en la
memoria.
Características al final del capítulo Finalmente, cada capítulo contiene un resumen en el que se revisan los
puntos principales del capítulo, un conjunto de términos clave para revisión y estudio, y varias preguntas de
discusión.
59533_01_fm_pi-xxiv.indd xxi 9533_01_fm_pi-xxiv.indd xxi 3/6/08 /6/08

Secuencia de capítulos
Aunque a los estudiantes les resultará más útil leer la Parte Uno en el orden de serie correcto
(especialmente los primeros tres capítulos), aquellos profesores y estudiantes más interesados en la
metodología que en el contenido pueden ignorar los números de capítulo de la Parte Dos. La tabla que
cruza los números de los capítulos y los temas experimentales (que se encuentra después del Prefacio)
se puede usar para determinar el orden en que se asignan los capítulos en la Parte Dos. Así, el instructor
tiene la opción de seguir un orden más o menos tradicional o de crear un orden único más adecuado a
sus objetivos educativos. Dos capítulos menos utilizados que, sin embargo, pueden ser bastante
necesarios para algunos, se encuentran en los apéndices. El Apéndice A proporciona un breve bosquejo
de la historia de la psicología experimental, y el Apéndice B contiene una revisión de las estadísticas
básicas.
Accesorios
Los accesorios para esta edición incluyen lo siguiente:
El Manual del instructor con recursos del banco de pruebas para instructores incluye resúmenes de
capítulos, términos clave, respuestas a preguntas de debate, sugerencias para conferencias, sugerencias
para demostraciones y "dilemas experimentales". El banco de pruebas contiene preguntas de opción
múltiple, verdadero-falso y ensayo para cada capítulo. El banco de pruebas también está disponible
electrónicamente en el formato ExamView® para que los instructores creen sus propias pruebas/respuestas.
Transparencias electrónicas Muchas de las figuras del texto están disponibles como diapositivas de
Power Point® que se pueden descargar y usar en el salón de clases.
Sitio web de Book Companion academic.cengage.com/psychology/kantowitz El sitio web contiene

varias funciones útiles tanto para profesores como para estudiantes. Los instructores podrán encontrar
actividades de enseñanza, reseñas de capítulos y resúmenes de capítulos. Para ayudar a los estudiantes,
el sitio web contiene un glosario, tarjetas didácticas, crucigramas para ayudarlos a aprender términos
clave y enlaces web a talleres de métodos de investigación en línea de Wadsworth, así como otros enlaces
web útiles; sugerencias para usar Infotrac College Edition; y cuestionarios tutoriales de opción múltiple,
emparejamiento, relleno en blanco y ensayo que se pueden imprimir o enviar por correo electrónico
directamente a los instructores.
Cambios en la Novena Edición
Los usuarios de la edición anterior descubrirán muchos cambios en la edición actual. Las referencias web
se han actualizado para todos los capítulos; mientras estos estaban funcionando en enero de 2008,
algunos sin duda cambiarán durante la vida de esta edición. Estas referencias guían a los lectores a
discusiones relevantes en línea, incluido Wadsworth Online en The Wadsworth Psychology Study Center.
Además, los instructores en América del Norte que han especificado que InfoTrac College Edition se
empaquete con este texto han recibido 4 meses de acceso gratuito a esta extensa biblioteca virtual para
sus estudiantes.
Se ha agregado nueva cobertura y referencias más recientes en cada capítulo, y algunos capítulos
se han reconstruido para reflejar los hallazgos y temas más recientes.
59533_01_fm_pi-xxiv.indd xxii 9533_01_fm_pi-xxiv.indd xxii 3/6/08 /6/08

a pesar de que esto significó eliminar cantidades sustanciales de texto muy apreciado por los autores. El
Capítulo 1 agrega nuevas investigaciones sobre los peligros de usar un teléfono celular mientras se
conduce, y la sección sobre las relaciones entre la investigación aplicada y la básica se actualizó para
cubrir los desarrollos recientes en el esfuerzo por traducir los hallazgos básicos en aplicaciones en los
NIH. El Capítulo 2 contiene nuevos datos en la Tabla 2-1 y una nueva discusión de que la violencia en
los medios es una amenaza para la salud pública, y el capítulo ahora analiza las actitudes de los votantes
hacia la aparición de los candidatos presidenciales en los programas de comedia nocturnos.
El capítulo 3 tiene un ejemplo nuevo y más interesante, que relaciona la creencia en Dios con la agresión,
lo que ilustra la importancia de las interacciones. El Capítulo 4 tiene una descripción adicional del
proceso IRB y los problemas asociados con la injusticia percibida. El Capítulo 5 tiene un nuevo artículo
de revista de muestra y también hace referencia a una lista reciente de consejos para autores de artículos
de revistas. En el Capítulo 6, reemplazamos un ejemplo de apertura de capítulo de 1952 con un ejemplo
de 2007, aunque al autor realmente le gustó el ejemplo anterior. En el Capítulo 7, la discusión sobre la
defensa perceptual fue reemplazada por una discusión sobre la investigación de la conciencia explícita.
El Capítulo 8 tiene una nueva discusión sobre el control cognitivo. El capítulo 9 tiene una nueva discusión
sobre el diseño de criterio cambiante tal como se usa en la terapia. El capítulo 10 tiene nuevos ejemplos
de memoria flash y el método de ahorro. El capítulo 11 ahora incluye una mención de la investigación
reciente en neuroimagen. El capítulo 12 también agrega trabajos actuales sobre imágenes cerebrales,
así como trabajos recientes sobre motivación y rendimiento intelectual. El capítulo 13 incluye nuevas
investigaciones sobre el contagio social de la memoria, la obediencia y las actitudes y comportamientos imp
El Capítulo 14 agrega un nuevo trabajo que desafía el modelo animal clásico de hacinamiento y también
una investigación que mejora la medida de la densidad en un vagón de tren. El Capítulo 15 agrega un
nuevo estudio sobre la agudeza visual dinámica y una breve discusión sobre el uso de modelos para
explicar la carga de trabajo mental. Continúe informando a los autores cómo reaccionan usted y sus
alumnos ante estos cambios sustanciales.
ÿ AGRADECIMIENTOS
Se necesitan muchas más personas que autores para crear un texto que ha durado nueve ediciones, y
los autores se complacen en reconocer con gratitud la ayuda de muchos otros. Nuestra mayor deuda es
con los lectores de ediciones anteriores que continúan ofreciendo muchos comentarios útiles. Sin sus
útiles sugerencias, esta nueva edición no existiría.
Mila Sugovic brindó una excelente ayuda editorial, especialmente con el trabajo de arte en los
Capítulos 2, 7 y 9, y Keith Lyle y Jane McConnell brindaron una valiosa ayuda en la preparación y revisión
del manuscrito, entre otras cosas, y les agradecemos a todos. También agradecemos a Erik Evans,
Rebecca Rosenberg y Pat Waldo de Cengage y Carol O'Connell de Graphic World Publishing Services
por sus importantes esfuerzos para guiar nuestro libro a través del proceso de producción.
Nos gustaría agradecer a los siguientes revisores, quienes brindaron sus comentarios para
ayudarnos con esta revisión: Jeffrey M. Zacks, Universidad de Washington; Sandra Sego, Colegio
Internacional Americano; Hallie Stephens, Universidad Estatal del Sureste de Oklahoma; y Paul Thuras,
Universidad St. Mary de Minnesota.
59533_01_fm_pi-xxiv.indd xxiii 9533_01_fm_pi-xxiv.indd xxiii 3/6/08 /6/08

ORGANIZACIÓN
DEL LIBRO
Temas Experimentales 6 7 8 9 10 11 12 13 14 15
Elegir la variable dependiente X
confuso X
operaciones convergentes X
contrapeso X
Características de la demanda X
Cuestiones éticas X
controles experimentales/
variables extrañas X X
Tema de investigación X X
Generalización de resultados X X
Efectos de interacción X X
Escalas de medida X
Definición operacional X X
cuasi-experimentos X
Artefactos de regresión X
Fiabilidad de las medidas XX
Atenuación de escala X
Selección de variable dependiente X X X
Diseño de n pequeña X X X
Informe verbal X X
Diseños dentro y entre sujetos X
59533_01_fm_pi-xxiv.indd xxiv 9533_01_fm_pi-xxiv.indd xxiv 3/6/08 /6/08

PARTE 1
FUNDAMENTOS
DE INVESTIGACIÓN
UNA
Explicación en Psicología Científica
DOS
Técnicas de Investigación: Observación y Correlación
TRES
Técnicas de Investigación: Experimentos
CUATRO
Ética en la Investigación Psicológica
CINCO
Cómo leer y escribir informes de investigación
11
59533_02_ch01_p001-023.indd 1 9533_02_ch01_p001-023.indd 1 3/4/08 /4/08


CAPÍTULO 1
EXPLICACIÓN
EN CIENTÍFICO
PSICOLOGÍA
DANDO SENTIDO AL MUNDO

Social Loafi de
Curiosidad: la fuente de la ciencia
FUENTES DE CONOCIMIENTO
Fijación de la creencia
LA NATURALEZA DE LA EXPLICACIÓN CIENTÍFICA

¿Qué es una teoría?
Inducción y Deducción De
la Teoría a la Hipótesis
Evaluación de Teorías
Variables Intervinientes
Zorros y Erizos Deambulando por la Teoría Psicológica LA
CIENCIA DE LA PSICOLOGÍA
Psicología y el mundo real
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
59533_02_ch01_p001-023.indd 3 9533_02_ch01_p001-023.indd 3 3/4/08 /4/08

Pregúntele a cualquier científico qué concibe que es el método científico, y adoptará
una expresión que es a la vez solemne y socarrona; solemne, porque siente que
debe declarar una opinión, furtivo porque se pregunta cómo ocultar el hecho de
que no tiene una opinión que declarar. Si se burlara de él, probablemente
balbucearía algo sobre "inducción" y "establecimiento de las leyes de la naturaleza",
pero si alguien que trabaja en un laboratorio afirmara estar tratando de establecer
las leyes de la naturaleza por inducción, deberíamos comenzar a pensar que se le
hizo tarde para salir. . (PB MEDAWAR)
El objetivo de la psicología científi ca es comprender por qué las personas piensan y actúan
como lo hacen. A diferencia de los no científicos, que se basan en fuentes de conocimiento
informales y secundarias, los psicólogos utilizan una variedad de técnicas bien desarrolladas para
recopilar información y desarrollar explicaciones teóricas. Como un ejemplo de este enfoque
científi co de la comprensión, considere el siguiente estudio de caso del proceso de investigación.
ÿ DANDO SENTIDO AL MUNDO
Social Loafi de
Una observación común, una que probablemente hayas hecho tú mismo en muchas ocasiones:
es que las personas que trabajan en un grupo a menudo parecen "permitirse" en su esfuerzo.
Muchas personas en grupos parecen dispuestas a dejar que unos pocos hagan el trabajo. Bibb
Latané, psicólogo social, notó esta tendencia y decidió estudiarla experimentalmente. Inicialmente,
Latané examinó la literatura de investigación en busca de evidencia de este fenómeno de personas
que trabajan menos en grupos, al que denominó holgazanería social. Uno de los primeros
estudios sobre la holgazanería social fue realizado por un ingeniero agrónomo francés (Ringelmann,
1913; Kravitz y Martin, 1986) que pidió a la gente que tirara de una cuerda lo más fuerte que
pudiera. Los sujetos tiraban solos o con uno, dos o siete más. Se utilizó un indicador sensible para
medir la fuerza con la que tiraban de la cuerda. Si las personas ejercen la misma cantidad de
esfuerzo en grupos que cuando están solas, entonces el desempeño del grupo debe ser la suma
de los esfuerzos de todos los individuos. Ringelmann descubrió que los grupos de dos tiraban solo
al 95 por ciento de su capacidad, y los grupos de tres y ocho se hundían al 85 por ciento y al 49
por ciento, respectivamente. Entonces, probablemente no sea solo nuestra imaginación cuando
notamos que otros (¿y nosotros mismos?) parecen hacer menos esfuerzo cuando trabajan en
grupos: la investigación de Ringelmann nos brinda un buen ejemplo de holgazanería social.
Latané y sus colegas realizaron una serie sistemática de experimentos sobre el fenómeno de
la holgazanería social (Latané, 1981; Latané, Williams y Harkins, 1979). Primero demostraron que
el fenómeno podía obtenerse en otras situaciones experimentales además de la de tirar de la
cuerda. También demostraron que la holgazanería social ocurre en varias culturas diferentes
(Gabrenya, Latané y Wang, 1983) e incluso es válida para los niños pequeños. Por lo tanto, la
holgazanería social parece ser una característica generalizada del trabajo en grupo.
59533_02_ch01_p001-023.indd 4 9533_02_ch01_p001-023.indd 4 3/4/08 /4/08

Latané ha relacionado este trabajo con una teoría más general del comportamiento social humano
(Latané, 1981). La evidencia de los estudios experimentales apunta a la difusión de la responsabilidad
como una posible razón para la holgazanería social. Las personas que trabajan solas creen que son
responsables de completar la tarea; cuando trabajan en grupo, sin embargo, este sentimiento de
responsabilidad se difunde a los demás. La misma idea explica el comportamiento en otras situaciones
grupales: si uno de tus profesores hace una pregunta en una clase en la que solo hay otras dos
personas, probablemente te sientas responsable de tratar de responder. Sin embargo, si hubiera otras
doscientas personas en la clase, probablemente te sentirías mucho menos responsable de responder.
De manera similar, es más probable que las personas ayuden en una emergencia cuando sienten la
carga de la responsabilidad que cuando hay varias personas que podrían ayudar.
Un posible beneficio de tal investigación básica sobre un fenómeno es que los hallazgos pueden
aplicarse más adelante para resolver algún problema práctico. Un gran problema en la sociedad
estadounidense es la dificultad de mantener alta la productividad de los trabajadores. Aunque la
holgazanería social es, en el mejor de los casos, sólo un factor involucrado en este complicado asunto,
Marriott (1949) mostró que los trabajadores de fábricas que trabajan en grandes grupos producen
menos por individuo que los que trabajan en pequeños grupos. Por lo tanto, la investigación básica que
mostraría una forma de superar el problema de la holgazanería social puede ser de gran importancia
práctica. De hecho, Williams, Harkins y Latané (1981) encontraron condiciones que eliminaban el efecto
de la holgazanería social. Cuando el desempeño individual (en lugar del desempeño de todo el grupo)
podía ser monitoreado dentro de la situación del grupo, los individuos trabajaban tan duro como lo
hacían cuando trabajaban solos. Sin duda, se debe realizar más investigación, pero puede ser que
simplemente medir el desempeño individual en situaciones grupales podría ayudar a eliminar la
holgazanería social y aumentar la productividad. La solución propuesta puede parecer simple, pero en
muchos trabajos solo se mide el desempeño del grupo y se ignora el desempeño individual.
Hemos discutido los estudios de Latané sobre la holgazanería social como un ejemplo de
investigación psicológica para ilustrar cómo un problema interesante puede llevarse a un entorno de
laboratorio y estudiarse de manera controlada. Los experimentos realizados, cuando se realicen con
cuidado, promoverán una mejor comprensión del fenómeno de interés que la simple observación de
eventos y la reflexión sobre ellos. Este libro trata en gran parte sobre la realización adecuada de tales
estudios experimentales: cómo desarrollar hipótesis, organizar las condiciones experimentales para
probar las hipótesis, recopilar observaciones (datos) dentro de un experimento y luego analizar e
interpretar los datos recopilados. En resumen, en este libro tratamos de cubrir los fundamentos de la
investigación científica aplicada a la psicología.
Antes de examinar las especificidades de la investigación, discutiremos algunos temas generales
en el resto de este capítulo. La investigación sobre la holgazanería social se utiliza para ilustrar varios
aspectos de la ciencia psicológica: sus propósitos, sus fuentes y su naturaleza.
Curiosidad: la fuente de la ciencia

Un científico quiere descubrir cómo y por qué funcionan las cosas. En este deseo, él o ella no es
diferente de un niño o cualquier otra persona que sienta curiosidad por el mundo que habitamos. El
observador casual puede no sentirse terriblemente frustrado si alguna observación (por ejemplo, que el
agua siempre cae por el desagüe del fregadero en sentido contrario a las agujas del reloj o que el
esfuerzo individual en un grupo es bajo) no puede explicarse. Sin embargo, el científico profesional
tiene un fuerte deseo de proseguir con una observación hasta que tenga a mano una explicación o se resu
No es tanto que los científicos sean más curiosos que otras personas, sino que
59533_02_ch01_p001-023.indd 5 9533_02_ch01_p001-023.indd 5 3/4/08 /4/08

están dispuestos a hacer mucho más para satisfacer su curiosidad que los no científicos. Esta falta de
voluntad para tolerar preguntas sin respuesta y problemas sin resolver ha llevado a la ciencia a desarrollar
varias técnicas para aliviar la curiosidad. Es la aplicación cuidadosa de estas técnicas lo que distingue la
curiosidad científi ca de la curiosidad cotidiana.
El denominador común de muchas de estas técnicas científicas es el escepticismo.

El escepticismo es la creencia filosófica de que la verdad de todo conocimiento es cuestionable.
Por lo tanto, toda indagación debe ir acompañada de una duda razonable. Ningún hecho científi co puede
conocerse con 100 por ciento de certeza. Por ejemplo, la ingeniería de puentes es una disciplina práctica
derivada de una base científica en campos como la física y la metalurgia.
La mayoría de las personas, cuando conducen un automóvil a través de un puente, no consideran
activamente que el puente podría derrumbarse. Es un hecho conocido que los puentes bien mantenidos son
seguros. Sin embargo, en el verano de 2007, un puente en Minneapolis–St. Paul, Minnesota, colapsó. Este
evento conducirá a más investigaciones, para dar como resultado la construcción de puentes más seguros.
Muchas de las herramientas, como las estadísticas, discutidas en este texto permiten al científico escéptico
medir la duda razonable.
¿De qué sirve la curiosidad científi ca? ¿Para qué sirve? Hemos dicho que los psicólogos intentan
determinar por qué la gente piensa y actúa como lo hace. Exploremos lo que esto significa con más detalle.
ÿ FUENTES DE CONOCIMIENTO
Fijación de la creencia
El método científi co es una forma válida de adquirir conocimiento sobre el mundo que nos rodea.
¿Qué características del enfoque científi co lo convierten en una forma deseable de aprender y llegar a
creencias sobre la naturaleza de las cosas? Quizá la mejor forma de responder a esta pregunta sea
contrastar la ciencia con otros modos de fijar las creencias, ya que la ciencia es solo una de las formas en
que se forman las creencias.
Hace más de cien años, el filósofo estadounidense Charles Sanders Peirce (1877) comparó la forma
científica de conocer con otros tres métodos para desarrollar creencias. Llamó a éstos la autoridad, la
tenacidad y los métodos a priori .
Según Peirce, la forma más sencilla de fijar la creencia es confiar en la palabra de otra persona. Una
autoridad de confianza te dice lo que es verdad y lo que es falso. Los niños pequeños creen lo que sus
padres les dicen simplemente porque mamá y papá siempre tienen razón. A medida que los niños crecen,
pueden descubrir, por desgracia, que mamá y papá no siempre tienen razón cuando se trata de astrofísica,
macroeconomía, tecnología informática y otros campos especializados del conocimiento. Aunque esto puede
hacer que los niños duden de algunas de las proclamaciones anteriores de sus padres, puede que no resulte
en un rechazo total de este método de fijación de creencias. En cambio, se puede buscar alguna otra
autoridad.
Las creencias religiosas se forman por el método de la autoridad. Mucho después de que los niños
católicos hayan rechazado a sus padres como la fuente de todo conocimiento, particularmente sobre la
doctrina religiosa, es posible que todavía crean que el Papa es infalible. Creer las noticias que ves en la
televisión significa que aceptas a la CNN o a alguna otra red de noticias como una autoridad.
Puedes creer a tus profesores porque son autoridades. Dado que las personas carecen de los recursos para
investigar todo lo que aprenden, muchos conocimientos y muchas creencias se fijan mediante el método de
la autoridad. Siempre que no suceda nada que suscite dudas sobre la
59533_02_ch01_p001-023.indd 6 9533_02_ch01_p001-023.indd 6 3/4/08 /4/08

competencia de la autoridad que establece las creencias, este método ofrece las grandes ventajas del
mínimo esfuerzo y la seguridad sustancial. Es muy agradable en un mundo atribulado tener una fe
completa en las creencias que te han sido transmitidas.
Otro método para fijar la creencia es aquel en el que una persona se niega rotundamente a alterar
el conocimiento adquirido, independientemente de la evidencia de lo contrario. El método de la tenacidad
como lo denominó Peirce, se ve comúnmente en fanáticos raciales que se aferran rígidamente a un
estereotipo incluso en presencia de un buen contraejemplo. Aunque este método de mantener una
creencia puede no ser del todo racional, no podemos decir que carece por completo de valor. El método
de la tenacidad permite a las personas mantener una visión uniforme y constante de las cosas, por lo
que puede liberarlas de cierta cantidad de estrés y malestar psicológico.
El tercer método no científico discutido por Peirce fija la creencia a priori. En este contexto, el
término a priori se refiere a algo que se cree sin previo estudio o examen. Las proposiciones que parecen
razonables se creen. Esta es una extensión del método de autoridad. Sin embargo, no hay una autoridad
en particular que se siga ciegamente en este método. La perspectiva cultural general es lo que parece
fijar la creencia a priori.
La gente alguna vez creyó que el mundo era plano, y parecía razonable suponer que el sol giraba
alrededor de la tierra como lo hace la luna. De hecho, el mundo parece plano si no estás en una nave
espacial.
Los métodos de tenacidad y a priori son similares en el sentido de que minimizan la posibilidad de
ser influenciados por opiniones en conflicto. En el método de la tenacidad se descartan por completo
otros puntos de vista, aunque advertidos. Así, se conserva un estereotipo racial a pesar de otras
evidencias, como las buenas cualidades de una persona de diferente raza que vive en la casa de al lado.
En el método a priori , otros puntos de vista pasan desapercibidos. Por ejemplo, la vista de un barco que
desaparece de abajo hacia arriba, en lugar de todo a la vez, cuando sale del puerto puede parecer
irrelevante si ya sabes que el mundo es plano.
El último de los métodos de Peirce, el método científico, fija la creencia sobre la base de la
experiencia. La ciencia se basa en la suposición de que los eventos tienen causas y que podemos
descubrir esas causas a través de la observación controlada. Esta creencia de que las causas
observables determinan los eventos se conoce como determinismo. Si definimos la psicología científi
ca (así como la ciencia en general) como una tarea repetible que se corrige a sí misma y que busca
comprender los fenómenos sobre la base de la observación empírica, entonces podemos ver varias
ventajas del método científi co sobre los métodos que se acaban de describir. esbozado. Veamos qué
entendemos por empírico y autocorrectivo y examinemos las ventajas asociadas con esos aspectos
de la ciencia.
La primera ventaja del método científico es su énfasis en la observación empírica.
Ninguno de esos otros métodos se basa en datos (observaciones del mundo) obtenidos por observación
sistemática. En otras palabras, no existe una base empírica para fijar la creencia. La palabra empírico se
deriva de una antigua palabra griega que significa “experiencia”. Tener una base empírica para las
creencias significa que la experiencia, más que la fe, es la fuente del conocimiento. Tener las propias
creencias fijadas por la autoridad no garantiza que la autoridad haya obtenido datos antes de formarse
una opinión. Por definición, el método de la tenacidad se niega a considerar datos, como lo hace el
método a priori . Los hechos que se consideran en estos otros modos de fijar la creencia no se obtienen
ordinariamente por procedimientos sistemáticos. Por ejemplo, la observación casual fue el “método” que
condujo a las ideas de que el mundo era plano y que las ranas se generaban espontáneamente del barro
cada primavera, como creía Aristóteles.
La segunda ventaja de la ciencia es que ofrece procedimientos para establecer la superioridad de
una creencia sobre otra. Las personas que tienen diferentes creencias encontrarán difícil
59533_02_ch01_p001-023.indd 7 9533_02_ch01_p001-023.indd 7 3/4/08 /4/08

para conciliar sus opiniones. La ciencia supera este problema. En principio, cualquiera puede hacer
una observación empírica, lo que significa que los datos científi cos pueden ser públicos y pueden
obtenerse repetidamente. A través de las observaciones públicas, las nuevas creencias se comparan
con las viejas creencias, y las viejas creencias se descartan si no se ajustan a los hechos empíricos.
Esto no implica que todos y cada uno de los científicos abandonen instantáneamente creencias
anticuadas en favor de nuevas opiniones. Cambiar las creencias científicas suele ser un proceso lento,
pero eventualmente las ideas correctas se eliminan. Las observaciones empíricas y públicas son la
piedra angular del método científi co, porque hacen de la ciencia un esfuerzo de autocorrección .
ÿ LA NATURALEZA DE LA EXPLICACIÓN CIENTÍFICA
¿Qué es una teoría?

Una teoría puede definirse crudamente como un conjunto de enunciados relacionados que explican
una variedad de sucesos. Cuantas más ocurrencias y menos declaraciones, mejor es la teoría. La ley
de la gravedad explica las manzanas que caen, el comportamiento de las montañas rusas y la posición
de los cuerpos dentro del sistema solar. Con un pequeño número de declaraciones sobre la atracción
mutua de los cuerpos, explica una gran cantidad de eventos. Por lo tanto, es una teoría poderosa.
(Esto no significa necesariamente que sea una teoría correcta, ya que hay algunos eventos que no
puede explicar).
La teoría en psicología realiza dos funciones principales. Primero, proporciona un marco para la
presentación sistemática y ordenada de datos, es decir, sirve como una forma conveniente para que
el científico organice los datos. Incluso el científico inductivo más dedicado eventualmente tendrá
dificultad para recordar los resultados de docenas de experimentos. La teoría se puede utilizar como
una especie de sistema de archivo para ayudar a los experimentadores a organizar los resultados. En
segundo lugar, permite al científico generar predicciones para situaciones en las que no se han
obtenido datos. Cuanto mayor sea el grado de precisión de estas predicciones, mejor será la teoría.
Con la mejor de las intenciones, los científicos que afirman estar probando la misma teoría a menudo
derivan de la teoría diferentes predicciones sobre la misma situación. Esta desafortunada circunstancia
es relativamente más común en psicología, donde muchas teorías se expresan de manera verbal, que
en física, donde las teorías son más formales y mejor cuantificadas mediante el uso de las matemáticas.
Aunque los psicólogos se están equipando rápidamente para formular sus teorías con mayor precisión
a través de mecanismos formales como las matemáticas y las simulaciones por computadora, la teoría
psicológica típica todavía no es tan precisa como las teorías de las ciencias más antiguas y
establecidas.
Veamos cómo se compara la teoría ideada por Latané para dar cuenta de la holgazanería social
con respecto a la organización y la predicción. La teoría de la difusión de la responsabilidad organiza
una cantidad sustancial de datos sobre la holgazanería social. Más importante aún, la teoría parece
dar cuenta de una notable variedad de otras observaciones. Por ejemplo, Latané (1981) señala que el
tamaño de la propina que se deja en la mesa de un restaurante está inversamente relacionado con el
número de personas en la cena. Asimismo, proporcionalmente más personas se comprometieron con
Cristo en las cruzadas más pequeñas de Billy Graham que en las más grandes.
Finalmente, el trabajo de Latané y Darley (1970), que se analiza en detalle más adelante en este libro,
muestra que la disposición de las personas a ayudar en una crisis está inversamente relacionada con
el número de otros espectadores presentes. Todo el patrón de resultados puede subsumirse bajo la
noción de difusión de la responsabilidad, que afirma que las personas se sienten menos responsables
de sus propias acciones cuando están en un grupo que cuando están solas.
59533_02_ch01_p001-023.indd 8 9533_02_ch01_p001-023.indd 8 3/4/08 /4/08

es menos probable que ayuden en una emergencia, es menos probable que dejen una gran propina,
etc. La teoría de Latané también hace predicciones bastante precisas sobre el impacto de la presencia
de otras personas en las acciones de una persona. De hecho, una versión de la teoría (Latané, 1981)
presenta sus supuestos principales en términos de ecuaciones matemáticas.
Las teorías se diseñan para organizar conceptos y hechos en un patrón coherente y para predecir
observaciones adicionales. A veces, las dos funciones de la teoría —organización y predicción— se
denominan descripción y explicación, respectivamente. Desafortunadamente, formular los roles de
la teoría de esta manera a menudo conduce a una discusión sobre la superioridad relativa de los
enfoques deductivos o inductivos de la ciencia, una discusión que la siguiente sección concluye que es
infructuosa. Según el científico deductivo, el científico inductivo sólo se preocupa por la descripción. El
científico inductivo se defiende de esta acusación replicando que la descripción es explicación: si un
psicólogo pudiera predecir y controlar correctamente todo el comportamiento refiriéndose a conjuntos
de resultados debidamente organizados, entonces ese psicólogo también estaría explicando el
comportamiento. El argumento es inútil porque ambos puntos de vista son correctos.
Si todos los datos necesarios estuvieran debidamente organizados, podrían hacerse predicciones sin
recurrir a un cuerpo formal de enunciados teóricos. Dado que toda la información aún no está
debidamente organizada, y tal vez nunca lo esté, se requieren teorías para cerrar la brecha entre el
conocimiento y la ignorancia. Recuerde, sin embargo, que las teorías nunca estarán completas, porque
todos los datos nunca estarán disponibles. Por lo tanto, simplemente hemos reformulado el argumento
entre los puntos de vista inductivo y deductivo sobre qué enfoque conducirá más rápida y seguramente
a la verdad. En última instancia, la descripción y la explicación pueden ser equivalentes. Los dos
términos describen el camino tomado más que el resultado teórico final. Para evitar este escollo, nos
referiremos a las dos funciones principales de la teoría como organización y predicción más que
como descripción y explicación.
Inducción y Deducción
Ciertos elementos básicos son compartidos por todos los enfoques de la ciencia. Los más importantes
son los datos (observaciones empíricas) y la teoría (organización de conceptos que permiten la
predicción de datos). La ciencia necesita y usa tanto datos como teoría, y nuestro esquema de
investigación sobre holgazanería social indica que pueden estar interrelacionados de una manera
compleja. Sin embargo, en la historia de la ciencia, los científicos individuales han diferido sobre cuál
es más importante y cuál viene primero. Tratar de decidir esto es un poco como tratar de decidir si el
huevo o la gallina es lo primero. La ciencia intenta comprender por qué las cosas funcionan de la forma
en que lo hacen y, como argumentaremos, la comprensión implica tanto datos como teoría.
Aunque Bacon reconoció la importancia tanto de los datos como de la teoría, creía en la primacía
de las observaciones empíricas; los científicos modernos también enfatizan los datos y ven el progreso
en la ciencia como un trabajo de datos a teoría. Tal enfoque es un ejemplo de inducción, en el que el
razonamiento procede de datos particulares a una teoría general.
El enfoque inverso, que hace hincapié en la teoría que predice los datos, se denomina deducción;
aquí, el razonamiento procede de una teoría general a datos particulares (Figura 1.1). Debido a que
muchos científicos y filósofos de la ciencia han defendido la primacía de una forma de razonamiento
sobre la otra, examinaremos la inducción y la deducción con cierto detalle.
Debido a que las observaciones empíricas distinguen a la ciencia de otros modos de fijar creencias,
muchos han argumentado que la inducción debe ser la forma en que la ciencia debería funcionar.
Como lo afirma Harré (1983), “se dice que las observaciones y los resultados de los experimentos son
'datos', que proporcionan una base sólida y sólida para la erección del frágil edificio del pensamiento cien
59533_02_ch01_p001-023.indd 9 9533_02_ch01_p001-023.indd 9 3/4/08 /4/08

TEORÍA
Inducción Deducción
DATOS
ÿ FIGURA 1.1
Una teoría organiza y predice datos. Por medio de la deducción, se pueden predecir
observaciones particulares (datos). Por inducción, los datos sugieren principios organizadores
(teorías). Esta relación circular indica que las teorías son imágenes tentativas de cómo se
organizan los datos.
(pág. 6). En el caso de la holgazanería social, el argumento sería que los hechos de la holgazanería
social derivados de la experimentación produjeron la teoría de la difusión de la responsabilidad.
Un problema con un enfoque puramente inductivo tiene que ver con la finalidad de las observaciones
empíricas. Las observaciones científi cas están ligadas a las circunstancias en las que se realizan, lo
que significa que las leyes o teorías que se derivan de ellas también deben tener un alcance limitado.
Los experimentos subsiguientes en diferentes contextos pueden sugerir otra teoría o modificaciones a
una existente, por lo que nuestras teorías que se inducen sobre la base de observaciones particulares
pueden (y generalmente lo hacen) cambiar cuando se realizan otras observaciones. Esto, por supuesto,
es un problema solo si uno adopta una visión autoritaria de las ideas y cree en aferrarse tenazmente a
una teoría particular.
Por lo tanto, las teorías inducidas a partir de las observaciones son ideas tentativas, no verdades
definitivas, y los cambios teóricos que ocurren como resultado del trabajo empírico continuo ejemplifican
la naturaleza de autocorrección de la ciencia.
De acuerdo con la visión deductiva, que enfatiza la primacía de la teoría, el aspecto científico
importante de la investigación de la holgazanería social es la guía empírica provista por la teoría formal
de la holgazanería social. Además, la teoría más general, la difusión de la responsabilidad, proporciona
una comprensión de la holgazanería social. El enfoque deductivo tiene en alta estima las teorías bien
desarrolladas. Las observaciones casuales, las teorías informales y los datos ocupan un lugar
secundario frente a las teorías amplias que describen y predicen un número considerable de
observaciones.
Desde el punto de vista del enfoque deductivo, la comprensión científica significa, en parte, que
una teoría predecirá que deben ocurrir ciertos tipos de observaciones empíricas. En el caso de la
holgazanería social, la teoría de la difusión de la responsabilidad sugiere que monitorear el desempeño
individual en un grupo debería reducir la difusión de la responsabilidad, lo que a su vez reducirá la
cantidad de holgazanería social que se observa. Esta predicción, como hemos visto, resulta ser correcta.
Pero, ¿qué revelan las predicciones correctas? Si una teoría se verifica mediante los resultados
de los experimentos, un científico deductivo podría haber aumentado la confianza en la veracidad de la
teoría. Sin embargo, dado que las observaciones empíricas no son definitivas y pueden cambiar, algo
más que la verificación puede ser esencial para aceptar o rechazar una teoría. Corchete
59533_02_ch01_p001-023.indd 10 9533_02_ch01_p001-023.indd 10 3/4/08 /4/08

(1961), un filósofo de la ciencia, ha sugerido que las buenas teorías deben ser falibles; es decir, las
predicciones empíricas deben ser susceptibles de pruebas que puedan demostrar que son falsas.
Esta sugerencia de Popper se ha llamado el punto de vista de la capacidad de falsificación. Según
el punto de vista de la falsabilidad, la naturaleza temporal de la inducción hace que la evidencia
negativa sea más importante que el apoyo positivo. Si una predicción está respaldada por datos, no
se puede decir que la teoría es verdadera. Sin embargo, si una teoría conduce a una predicción que
no está respaldada por los datos, entonces Popper argumentaría que la teoría debe ser falsa y debe rec
Según Popper, una teoría nunca puede probarse; solo puede ser refutado.
La opinión de Popper sobre la dificultad de probar una teoría puede ilustrarse pensando en una
teoría específica; por ejemplo, ¿una bolsa de canicas contiene solo canicas negras? Una buena
manera de probar esta teoría sería meter la mano en la bolsa y sacar una canica. El mármol es negro.
¿Qué puedes concluir sobre la teoría de que todas las canicas son negras? Si bien el dato (una canica
negra) es consistente con la teoría, no la prueba. Todavía podría haber una canica blanca dentro de
la bolsa. Así que saca otra canica; de hecho, saca diez canicas más. Los diez son negros. ¿Está
ahora demostrada la teoría? No, todavía podría haber una sola canica blanca al acecho en la bolsa.
Tendrías que quitar todas las canicas para asegurarte de que no haya canicas blancas. Es fácil
demostrar que la teoría es incorrecta si se saca una canica blanca. Demostrar que la teoría es correcta
depende del tamaño de la bolsa. Si la bolsa es infinitamente grande, la teoría nunca podrá probarse
porque la próxima canica que examines podría ser blanca.
Proctor y Capaldi (2001) han señalado dos tipos de objeciones al enfoque de Popper. Primero,
hay un problema lógico (Salmon, 1988). Dado que una teoría siempre puede ser potencialmente
refutada por el próximo experimento, el número de experimentos realizados consistentes con la teoría
es irrelevante. Entonces, lógicamente, una teoría bien elaborada no es más valiosa y no necesariamente
hace mejores predicciones que una teoría que nunca ha sido probada. Esta visión lógica entra en
conflicto con la visión práctica de que los científicos tienden a sentirse más cómodos con teorías que
han pasado varias pruebas experimentales.
Esta visión práctica (Kuhn, 1970) es lo que Proctor y Capaldi (2001) ofrecen como la segunda
objeción empírica a la falsificación: las teorías tienden a ser aceptadas, al menos inicialmente, sobre
la base de su capacidad para explicar (organizar) fenómenos existentes más que en su capacidad
para predecir nuevos resultados.
Un problema con el enfoque deductivo tiene que ver con las propias teorías.
La mayoría de las teorías incluyen muchas suposiciones sobre el mundo que son difíciles de probar y
que pueden estar equivocadas. En el trabajo de Latané, una suposición que subyace a la teoría
general es que medir el comportamiento de una persona en un contexto experimental no cambia el
comportamiento en cuestión. Aunque a menudo esto es una suposición razonable, mostraremos más
adelante que las personas pueden reaccionar de manera inusual al ser observadas, lo que significa
que esta suposición a veces es incorrecta. Si las suposiciones no probadas son incorrectas, entonces
un experimento particular que falsea una teoría puede haberla falseado por las razones equivocadas.
Es decir, la prueba de la teoría puede no haber sido justa o apropiada. Se puede concluir, por tanto,
que el enfoque deductivo por sí solo no puede conducir a la comprensión científi ca.
En este punto, puede que te estés preguntando si la comprensión científi ca es posible si tanto la
inducción como la deducción no son infalibles. No se desesperen. La ciencia se corrige a sí misma y
puede proporcionar respuestas a los problemas, por muy temporales que sean esas respuestas. La
comprensión científica cambia a medida que los científicos ejercen su oficio. Tenemos una mejor
comprensión de la holgazanería social ahora que antes de que Latané y sus compañeros de trabajo
emprendieran su investigación. A través de una combinación de inducción y deducción (ver Figura
1.1), la ciencia avanza hacia una comprensión más profunda de sus problemas.
59533_02_ch01_p001-023.indd 11 9533_02_ch01_p001-023.indd 11 3/4/08 /4/08

A modo de conclusión de esta sección, reexaminaremos la holgazanería social. Inicialmente, los
resultados experimentales positivos reforzaron nuestra confianza en la noción general de holgazanería social.
Estos resultados, a su vez, sugirieron hipótesis sobre la naturaleza de la holgazanería social. ¿Es un
fenómeno general que influiría incluso en los individuos orientados al grupo? ¿Ocurre tanto en el lugar de
trabajo como en el laboratorio? Las respuestas positivas a estas preguntas son consistentes con una
interpretación de la holgazanería social basada en la difusión de la responsabilidad.
En la siguiente fase de la investigación, Latané y sus colegas intentaron eliminar otras explicaciones
de la holgazanería social falsificando las predicciones hechas por estas teorías alternativas. En su trabajo
anterior, Latané y sus colegas evaluaron el esfuerzo de una persona en particular tanto cuando estaba
sola como en grupo. Posteriormente, razonaron que, en estas condiciones, una persona podría descansar
durante la prueba grupal para poder asignar un mayor esfuerzo a la tarea cuando se le hiciera la prueba
solo. Para eliminar la posibilidad de que la asignación de esfuerzos en lugar de la difusión de
responsabilidades explicara la holgazanería social, realizaron experimentos adicionales en los que se
evaluó a una persona sola o en grupo, pero no en ambas situaciones. Contrariamente a la hipótesis de la
asignación de esfuerzos, los resultados indicaron que la holgazanería social ocurrió cuando una persona
fue evaluada en esa única condición de estar en un grupo (Harkins, Latané y Williams, 1980). Por lo tanto,
se concluyó que la difusión de la responsabilidad era una explicación más apropiada de la holgazanería
social que la asignación del esfuerzo.
Tenga en cuenta el curso de los acontecimientos aquí. Los experimentos sucesivos enfrentaron dos
posibles resultados entre sí con la esperanza de que una posibilidad fuera eliminada y otra respaldada
por el resultado de la investigación. Por supuesto, las pruebas posteriores de la teoría de la difusión de la
responsabilidad probablemente la contradirán o la complementarán de alguna manera.
Así, la teoría podría ser revisada o, con suficientes contradicciones, rechazada por una explicación
alternativa, apoyada por observaciones empíricas. En cualquier caso, nuestra posición ahora es que
hemos construido una visión razonable de lo que implica la holgazanería social y lo que parece causarla.
Es la mezcla de hipótesis inducidas a partir de datos y pruebas experimentales deducidas de la teoría lo
que dio como resultado la teoría de que la difusión de la responsabilidad conduce a la holgazanería social.
De la teoría a la hipótesis
Las teorías no se pueden probar directamente. No existe un solo experimento mágico que demuestre que
una teoría es correcta o incorrecta. En cambio, los científicos realizan experimentos para probar hipótesis
que se derivan de una teoría. Pero, ¿qué son exactamente las hipótesis científicas y de dónde vienen?
Es importante distinguir entre hipótesis y generalizaciones (Kluger & Tikochinsky, 2001). Una
hipótesis es una declaración comprobable muy específica que se puede evaluar a partir de datos
observables. Por ejemplo, podríamos plantear la hipótesis de que los conductores mayores de sesenta y
cinco años tendrían una mayor frecuencia de accidentes relacionados con giros a la izquierda en el tráfico
que se aproxima cuando conducen de noche que los conductores más jóvenes. Al observar los registros
policiales de datos de accidentes, pudimos determinar, con la ayuda de algunas estadísticas (consulte el
Apéndice B), si esta hipótesis es incorrecta. Una generalización es una declaración más amplia que no
se puede probar directamente. Por ejemplo, podríamos generalizar que los conductores mayores son
peligrosos a cualquier velocidad y deberían tener restricciones, como no poder conducir de noche, en su
licencia de conducir. Dado que "inseguro a cualquier velocidad" no está claramente definido, esta no es
una declaración comprobable. De manera similar, la generalización no defi ne un rango de edad para los
conductores mayores. Sin embargo, se puede utilizar para derivar varias hipótesis comprobables.
59533_02_ch01_p001-023.indd 12 9533_02_ch01_p001-023.indd 12 3/4/08 /4/08

La Figura 1.2 ilustra este proceso. Cada generalización puede producir más de una hipótesis. Solo se
ilustran dos en la figura para mantenerlo simple, pero una buena generalización puede producir una horda de
hipótesis. Por ejemplo, la generalización del conductor mayor podría producir muchas hipótesis sobre diferentes
tipos de accidentes y comportamientos que les suceden a los conductores mayores: chocar contra vehículos
detenidos, no hacer señales para girar, conducir en la acera, retroceder contra objetos, no mantenerse dentro de
su carril , y así.
Estas hipótesis podrían probarse haciendo observaciones en el tráfico, en pistas de prueba cerradas (más seguras
para el público conductor si la generalización es cierta) o en simuladores de conducción (más seguro para el
público conductor).
Ahora que hemos explicado que las hipótesis provienen de generalizaciones, podemos pasar a la siguiente
pregunta: ¿De dónde provienen las generalizaciones? La Figura 1.2 muestra que hay dos fuentes para las
generalizaciones. Pueden provenir de la teoría o de la experiencia.
Si bien en la figura 1.2 solo se muestran tres generalizaciones, una buena teoría producirá un montón de
generalizaciones. Puede pensar que la generalización del impulsor del envejecimiento proviene de la experiencia
y no de la teoría. Es posible que tenga experiencia de primera mano como pasajero en un automóvil conducido
por un abuelo, y esa experiencia puede haberlo llevado a estar de acuerdo con la generalización. Este es un
proceso inductivo (ver Figura 1.1) basado en datos, es decir, la observación casual del comportamiento de
conducción de los ciudadanos mayores. Las hipótesis derivadas de este proceso inductivo se denominan hipótesis
de sentido común. Si bien la prueba de hipótesis de sentido común alguna vez estuvo mal vista en la psicología
experimental por ser inferior a la prueba de hipótesis derivadas de la teoría, actualmente hay una nueva apreciación
del valor de las hipótesis de sentido común (Kluger & Tikochinsky, 2001).
Sin embargo, la mayoría de los psicólogos prefieren probar hipótesis basadas en la teoría. En este caso, la
generalización se forma deductivamente (ver Figura 1.1) a partir de la teoría. La generalización del impulsor del
envejecimiento también podría derivarse de las teorías de la atención, la percepción y la toma de decisiones
(Kantowitz, 2001). A medida que envejecemos, nuestra capacidad para atender múltiples tareas disminuye y
nuestra toma de decisiones se vuelve más conservadora, lo que a menudo requiere más tiempo para llevar a
cabo. Por lo tanto, un conductor de edad avanzada podría (a) tener problemas para ver el tráfico que se aproxima
por la noche, (b) tener problemas para prestar atención al tráfico que se aproxima mientras presta atención a la
radio o a un pasajero, y (c) tomar mucho tiempo para decidir si una izquierda. -girar con la mano a través del tráfico e
Teoría
Generalización Generalización Generalización
Hipótesis Hipótesis Hipótesis
Hipótesis Hipótesis Hipótesis
Experiencia cotidiana
ÿ FIGURA 1.2
Montones de generalizaciones producen hordas de hipótesis.
59533_02_ch01_p001-023.indd 13 9533_02_ch01_p001-023.indd 13 3/4/08 /4/08

que cuando finalmente da la vuelta es demasiado tarde y el tráfico que se aproxima no puede evitar un
accidente. La ventaja de una buena teoría es que produce muchas generalizaciones.
Las teorías de la atención no solo se ocupan de los conductores que envejecen, sino que hacen
generalizaciones sobre muchas otras situaciones prácticas, como operar aviones y plantas de energía
nuclear, por no hablar de predicciones más abstractas que se probarán en laboratorios. Por ejemplo,
muchas teorías de la atención predecirían que hablar por teléfono celular mientras conduce sería
peligroso y, de hecho, las investigaciones de laboratorio sugieren que lo es (Steayer & Drew, 2007). Sin
embargo, las generalizaciones de sentido común no son productivas porque, incluso si son correctas,
no crean nuevas generalizaciones. Por lo tanto, las teorías son más eficientes en el avance de la
investigación científica.
Si bien la prueba de hipótesis es la metodología dominante utilizada en la psicología experimental,
existen otros puntos de vista. La mayoría de las teorías en psicología son verbales y cualitativas, por lo
que las predicciones matemáticas son difíciles de obtener. Sin embargo, si un modelo formal puede
generarse matemáticamente o por simulación por computadora, entonces es posible estimar los
parámetros del modelo. La estimación de parámetros es superior a la prueba de hipótesis y al ajuste de
curvas (Kantowitz y Fujita, 1990) y, a medida que la psicología evoluciona como ciencia, la estimación
complementará, y quizás eventualmente reemplace, la prueba de hipótesis. De hecho, hay un nuevo
movimiento en la filosofía de la ciencia, llamado naturalismo, que critica las metodologías actuales como
la prueba de hipótesis, y sus tentáculos han llegado a las orillas de la ciencia psicológica (Proctor &
Capaldi, 2001). El naturalismo sugiere que los criterios metodológicos no son fijos para la eternidad
basados en premisas lógicas, sino que pueden cambiar y evolucionar (al igual que las teorías) sobre
bases pragmáticas.
Evaluación de teorías
El científico sofisticado no trata de determinar si una teoría en particular es verdadera o falsa en un
sentido absoluto. No existe un enfoque en blanco y negro para la evaluación de la teoría. Se puede
saber que una teoría es incorrecta en alguna parte y, sin embargo, continuar usándose. En la física
moderna, la luz se representa, según la teoría elegida, como partículas discretas llamadas cuantos o
como ondas continuas. Lógicamente, la luz no puede ser ambas cosas al mismo tiempo. Por lo tanto,
podría pensar que al menos uno de estos dos puntos de vista teóricos debe ser necesariamente falso.
El físico tolera esta ambigüedad (aunque quizás no del todo) y utiliza cualquier representación —
cuántica u onda— que sea más apropiada.
En lugar de afirmar rotundamente que una teoría es verdadera, es mucho más probable que el científico
afirme que está respaldada sustancialmente por datos, dejando así abierta la posibilidad de que los
nuevos datos no respalden la teoría. Aunque los científicos no afirman que una teoría es verdadera, a
menudo deben decidir cuál de varias teorías es la mejor. Como se señaló anteriormente, las
explicaciones son provisionales; sin embargo, el científico todavía necesita decidir qué teoría es la
mejor por ahora. Para hacerlo, se necesitan criterios explícitos para evaluar una teoría. Cuatro de estos
criterios son la parsimonia, la precisión, la comprobabilidad y la capacidad de ajustar los datos.
Un criterio importante se insinuó anteriormente cuando afirmamos que cuantos menos enunciados
hay en una teoría, mejor es la teoría. Este criterio se llama parsimonia, oa veces la navaja de Occam,
en honor a Guillermo de Occam. Si una teoría necesita un enunciado separado para cada resultado
que debe explicar, es evidente que la teoría no ha ganado ninguna economía. Las teorías ganan poder
cuando pueden explicar muchos resultados con pocos conceptos explicativos. Así, si dos teorías tienen
el mismo número de conceptos, la que puede
59533_02_ch01_p001-023.indd 14 9533_02_ch01_p001-023.indd 14 3/4/08 /4/08

explicar más resultados es una mejor teoría. Si dos teorías pueden explicar el mismo número de
resultados, se prefiere la que tenga menos conceptos explicativos.
La precisión es otro criterio importante, especialmente en psicología (donde a menudo falta).
Las teorías que involucran ecuaciones matemáticas o problemas de computadora son generalmente
más precisas, y por lo tanto mejores, que aquellas que usan enunciados verbales imprecisos (en
igualdad de condiciones, por supuesto). A menos que una teoría sea tan precisa que diferentes
investigadores puedan ponerse de acuerdo sobre sus predicciones, es inútil a todos los efectos.
La capacidad de prueba va más allá de la precisión. Una teoría puede ser muy precisa y, sin
embargo, no se puede probar. Por ejemplo, cuando Einstein propuso la equivalencia de la materia y
la energía (E mc El 2científico otorga nuclear
), la tecnología un valorno
muy altoprobar
pudo al criterio
estade comprobabilidad,
relación porque una
directamente.
teoría que no puede ser comprobada nunca puede ser refutada. Al principio, podría pensar que esto
sería un de buena calidad, ya que sería imposible demostrar que tal teoría era incorrecta. El científico
toma el punto de vista opuesto. Por ejemplo, considere la ESP (percepción extrasensorial). Algunos
creyentes en la ESP afirman que la presencia de un incrédulo es suficiente para prevenir una persona
dotada con ESP por actuar, porque el incrédulo emite "malas vibraciones" que interrumpen la ESP.
Esto significa que la ESP no se puede evaluar, porque solo los creyentes pueden estar presentes
cuando se demuestra. El científico tiene una visión negativa de esta lógica, y la mayoría de los
científicos, especialmente los psicólogos, son escépticos acerca de la percepción extrasensorial. La
creencia en una teoría aumenta a medida que sobrevive a las pruebas que podrían rechazarla. Dado
que es lógicamente posible que alguna prueba futura pueda encontrar una falla, la creencia en una
teoría nunca es absoluta. Si no es lógicamente posible probar una teoría, no puede evaluarse; por lo
tanto, es inútil para el científico. Si es lógicamente posible pero aún no es técnicamente factible, como
sucedió alguna vez con la teoría de Einstein, entonces se aplaza la evaluación de una teoría.
Finalmente, una teoría debe ajustarse a los datos que explica. Si bien la bondad de ajuste no
es un criterio sufi ciente para aceptar una teoría (Roberts y Pashler, 2000), tiene poco sentido seguir
una teoría que no se ajuste a los datos (Rodgers y Rowe, 2002).
Variables Intervinientes
Las teorías a menudo usan construcciones que resumen los efectos de varias variables. Las variables
se analizan con más detalle en el Capítulo 3. Por ahora, describiremos brevemente dos tipos
diferentes de variables. Las variables independientes son aquellas manipuladas por el experimentador.
Por ejemplo, no permitir que las ratas tomen agua durante varias horas crearía una variable
independiente llamada horas de privación. Las variables dependientes son las observadas por el
experimentador. Por ejemplo, se podría observar cuánta agua bebe una rata.
La ciencia trata de explicar el mundo relacionando variables independientes y dependientes.
Las variables intermedias son conceptos abstractos que vinculan variables independientes con
variables dependientes. La gravedad es una construcción familiar que logra este objetivo. Puede
relacionar una variable independiente, los pies de altura desde la que se deja caer un objeto, con una
variable dependiente, la velocidad del objeto cuando golpea el suelo. La gravedad también resume
los efectos de la altura sobre la velocidad para todo tipo de objetos. La gravedad explica la caída de
manzanas así como la caída de pelotas de béisbol. La ciencia progresa cuando una sola construcción,
como la gravedad, explica los resultados en muchos entornos diferentes.
Miller (1959) ha explicado cómo una sola variable interviniente, la sed, organiza eficientemente
los resultados experimentales. La figura 1.3 muestra una forma directa e indirecta de relacionar una
variable independiente, horas de privación, con una variable dependiente, tasa de barra
59533_02_ch01_p001-023.indd 15 9533_02_ch01_p001-023.indd 15 3/4/08 /4/08

Variable independiente Variable Interviniente Variable dependiente
Horas de privación Tasa de prensado de barras
Horas de privación Sed Tasa de prensado de barras
ÿ FIGURA 1.3
Un conjunto de variables.
prensado. La variable dependiente se obtiene colocando una rata en una pequeña cámara donde puede
presionar una barra para obtener agua potable. El experimentador observa la velocidad (cuántas pulsaciones
por minuto) a la que la rata presiona la barra para obtener agua. La relación directa usa solo una flecha para
vincular las horas de privación con la tasa de presión de la barra.
Después de hacer el experimento, podríamos construir una fórmula matemática que relacione directamente
las horas de privación con la tasa de presión de la barra. El método indirecto de la figura 1.3 utiliza dos
flechas. La primera flecha relaciona las horas de privación con la sed, una variable interviniente.
La segunda flecha relaciona la variable intermedia, la sed, con la tasa de presión de la barra.
Dado que el método indirecto es más complicado y requiere una flecha adicional, es de esperar que el
científico prefiera el método directo de explicación. De hecho, si el único objetivo científico fuera relacionar
las horas de privación con la tasa de presión de la barra, estaría en lo cierto porque la ciencia prefiere
explicaciones simples a explicaciones complejas. Sin embargo, como explicaremos, el objetivo científico es
más general.
La figura 1.4 relaciona dos variables independientes, las horas de privación y la alimentación con
alimentos secos, con dos variables dependientes, la tasa de presión de la barra y el volumen de agua bebido.
Nuevamente, se muestran explicaciones tanto directas como indirectas. En la figura 1.4, las explicaciones
directas e indirectas son igualmente complejas. Cada uno requiere cuatro flechas distintas.
Variables independientes Variable Interviniente Variables dependientes
Alimentación de alimentos secos Volumen de agua bebido
Sed
ÿ FIGURA 1.4
Dos conjuntos de variables.
59533_02_ch01_p001-023.indd 16 9533_02_ch01_p001-023.indd 16 3/4/08 /4/08

Variables independientes Variable Interviniente Variables dependientes
inyección de solución salina Quinina para dejar de beber
Sed Volumen de agua bebido

Alimentación de alimentos secos
inyección de solución salina Quinina para dejar de beber
ÿ FIGURA 1.5
Tres conjuntos de variables.
La figura 1.5 relaciona tres variables independientes, horas de privación, alimentación con alimento seco
e inyección de solución salina (darle agua salada a una rata a través de un tubo insertado en su estómago), con
tres variables dependientes, tasa de presión de la barra, volumen de agua bebido y cantidad de agua. quinina
necesaria para que la rata deje de beber. De nuevo, se muestran explicaciones tanto directas como indirectas.
Ahora, es obvio que el método indirecto es menos complicado.
Requiere seis flechas distintas, mientras que el método directo requiere nueve flechas. Así que a medida que la
ciencia trata de relacionar más variables independientes y dependientes, las variables intermedias se vuelven
más eficientes.
Hay otra ventaja más de las variables que intervienen. La sed, independientemente de cómo se produzca,
debería tener el mismo efecto en todas las variables dependientes. Esto se puede comprobar en experimentos.
Si no es cierto, podemos rechazar la idea de una sola variable interviniente.
Los capítulos posteriores analizan este problema bajo el tema de las operaciones convergentes.
Zorros y erizos vagando por la teoría psicológica

La investigación en psicología experimental tiende a organizarse por subcampos; de hecho, la segunda parte
de este libro de texto presenta capítulos para subcampos como la percepción, la memoria y la infl uencia social.
Este enfoque es el camino del zorro que conoce muchos caminos (Figura 1.6). Tal no fue siempre el caso en la
historia de la psicología. Había psicólogos (p. ej., James,
59533_02_ch01_p001-023.indd 17 9533_02_ch01_p001-023.indd 17 3/4/08 /4/08

"El zorro sabe muchas cosas,

pero el erizo sabe una gran cosa".
-Archilocus
ÿ FIGURA 1.6
Enfoques segmentados (zorro) y unificados (erizo) de la teoría psicológica.
1890) que intentó una explicación unificada de los fenómenos psicológicos. Este es el camino del erizo
que sabe una gran cosa (ver Figura 1.6).
Ambos enfoques enfrentan importantes desafíos. El enfoque dominante construye fuertes barreras
entre los campos. Los profesores son contratados dentro de un campo y tienden a tener oficinas
ubicadas por campo de especialización, para defenderse mejor de los ataques territoriales de otros
subcampos. Los estudiantes de posgrado se capacitan por campo, con los requisitos de cursos
apropiados, y esto perpetúa la división. Incluso los paneles que evalúan las propuestas de subvenciones
están organizados por especialidades. El nuevo doctorado. Quien acepta un trabajo en la industria está
mal preparado para la cooperación entre campos necesaria para resolver cualquier problema práctico import
Recientemente, ha crecido la simpatía por un enfoque más unificado (erizo) de la psicología
(Sternberg, Grigorenko y Kalmar, 2001). Estos teóricos tratan de entrelazar teorías en competencia,
enfatizando que el rol explicativo de la teoría es más crucial que el rol predictivo. El tejido teórico es un
objetivo digno si se puede lograr.
Sin embargo, el actual sistema dividido surgió porque las teorías integradas anteriores no pudieron
abarcar todos los subcampos de la psicología. ¿Los nuevos erizos tejerán mejor que los viejos?
ÿ LA CIENCIA DE LA PSICOLOGÍA
Algunos estudiantes encuentran difícil pensar en la psicología como una ciencia en el mismo sentido en
que la física y la química son ciencias. Creen que hay aspectos de la experiencia humana, como las
artes, la literatura y la religión, que desafían el análisis científico. ¿Cómo se puede reducir a frías
ecuaciones científicas la belleza de una litografía de Klee, una sonata de Beethoven o una fotografía de
Cartier-Bresson? ¿Cómo se pueden captar de la forma objetiva y desinteresada que exige la ciencia los
tiernos sentimientos de un primer romance, la emoción de conducir un coche deportivo a 100 millas por
hora o la agonía de un equipo de fútbol derrotado?
Algunos psicólogos, conocidos como humanistas, responderían negativamente a estas preguntas.
Estos humanistas, en su mayoría psicólogos clínicos y de asesoramiento, afirman que es imposible
evaluar y probar objetivamente gran parte de los sentimientos y la experiencia humana mediante
métodos científicos tradicionales. Incluso los duros psicólogos experimentales de "instrumentos de metal"
59533_02_ch01_p001-023.indd 18 9533_02_ch01_p001-023.indd 18 3/4/08 /4/08

Coincido en que el dominio de la ciencia es limitado. No podemos establecer o refutar la existencia de Dios
por medios científicos más de lo que podemos probar la gravedad por métodos teológicos.
La ciencia opera donde sus herramientas son apropiadas (ver Capítulo 14). Esto no implica que el conocimiento
no pueda obtenerse dondequiera que la ciencia tema pisar, es decir, por medios no científicos. Muchos campos
importantes del esfuerzo humano aún no se han beneficiado de un análisis científico extenso: la ética, la moral
y la ley, por nombrar solo algunos.
Sin embargo, la mayoría de los científicos mantendrían la esperanza de que el análisis científi co
finalmente podría aplicarse de manera útil a muchas de esas áreas. Mucha de la psicología contemporánea
fue considerada como propiedad exclusiva de la filosofía en algún momento. A medida que mejoraron las
técnicas psicológicas, estos aspectos de la experiencia y el comportamiento humanos pasaron al ámbito de la
ciencia. Y ahora la mayoría de los psicólogos creen que prácticamente todas las facetas de la experiencia
humana son presa fácil para la ciencia de la psicología. Burlarse del progreso científico en psicología, como lo
hizo un senador estadounidense que criticó a la Fundación Nacional de Ciencias por apoyar la investigación
sobre el amor romántico, no detendrá los esfuerzos por expandir el conocimiento psicológico. Aunque la
preocupación por el uso adecuado y ético de tales conocimientos es válida e importante, la ignorancia no es
la solución.
Psicología y el mundo real

Los científicos, en general, y los psicólogos, en particular, tienen muchas razones para ejercer su profesión.
Aunque pensamos que es bastante fácil demostrar que la investigación psicológica sirve a la humanidad, nos
gustaría enfatizar que no encontramos esta la única, o necesariamente la principal, justificación para una
carrera como psicólogo investigador. Muchos científicos investigan ciertos problemas simplemente porque los
encuentran interesantes. Simpatizamos completamente con un colega que podría afirmar que estudia a los
jerbos solo porque los jerbos provocan su curiosidad. Es cierto que ciertos estudios se realizan en animales
porque no son éticos o prácticos para realizarlos en humanos, por ejemplo, estudios de hacinamiento a largo
plazo, castigos, drogas, etc., pero es igualmente cierto que el comportamiento de los animales es interesante
por derecho propio.
La investigación científi ca a menudo se divide en dos categorías: básica y aplicada. La investigación

aplicada apunta a resolver un problema específico, como por ejemplo, cómo curar la incontinencia urinaria,
mientras que la investigación básica no tiene un objetivo práctico inmediato. La investigación básica establece
una reserva de datos, explicaciones teóricas y conceptos que pueden ser aprovechados por el investigador aplic
Sin esta fuente, la investigación aplicada pronto se secaría y se detendría, a menos que los investigadores
aplicados se convirtieran necesariamente en investigadores básicos. Toma bastante tiempo para que un
concepto desarrollado por la investigación básica encuentre alguna aplicación útil en la sociedad. Adams
(1972) rastreó cinco productos socialmente importantes para descubrir el impacto, si lo hubo, de la investigación
Aunque la investigación básica representó el 70 por ciento de los eventos significativos, la investigación ocurrió
veinte o treinta años antes del uso final del producto. Este largo tiempo de retraso oscurece el papel crucial de
la investigación básica, por lo que muchas personas creen incorrectamente que la investigación básica no es
muy útil para la sociedad. Es bastante difícil saber qué investigación básica que se realiza hoy tendrá un
impacto dentro de treinta años. Pero esta incapacidad para predecir no significa que debamos dejar de hacer
investigación básica.
Aunque la mayoría de los psicólogos experimentales se contentan con un modelo científico-profesional
en el que la investigación aplicada se basa en los frutos de la investigación básica, más recientemente se ha
impulsado un sistema de dos vías (Fishman & Neigher, 1982; Howell, 1994) en el que la investigación básica
y la investigación aplicada divergen. Desde una perspectiva histórica (Bevan, 1980) estos dos
59533_02_ch01_p001-023.indd 19 9533_02_ch01_p001-023.indd 19 3/4/08 /4/08

Los enfoques de la ciencia se remontan a René Descartes y Francis Bacon. En el modelo cartesiano, la
ciencia es un bien básico cuyo objetivo es comprender la naturaleza. El modelo baconiano promueve el
objetivo de la ciencia como la mejora del bienestar humano, que antepone los resultados útiles al aumento
del conocimiento. Sin embargo, un número de investigadores argumentan que el básico/
la dicotomía de la investigación aplicada se ha simplificado demasiado o representa una distinción falsa
(Pedhazur & Pedhazur Schmelkin, 1991). Por ejemplo, las definiciones de investigación básica y aplicada
difieren considerablemente entre los investigadores. Además, toda investigación científi ca se realiza con
el objetivo de obtener conocimiento. En este sentido, toda investigación puede considerarse básica hasta
cierto punto. Asimismo, la mayor parte de la investigación tiene algún valor práctico. Por ejemplo, el
European Journal of Cognitive Psychology (2007) dedicó recientemente un número especial completo a
la investigación sobre la memoria (ver el Capítulo 10) en contextos educativos relevantes. Parte de esta
investigación puede verse como básica, ya que prueba si los principios de la memoria descubiertos
usando materiales de laboratorio relativamente simples (por ejemplo, listas de palabras) son válidos para
materiales más complejos del tipo de aula, pero también puede verse como aplicada, en que los resultados
sugieren formas de maximizar el aprendizaje de los estudiantes. Por lo tanto, la distinción básico/aplicado
puede pensarse mejor en términos menos discretos, o como parte de un continuo.
La disminución de los fondos gubernamentales para la investigación que comenzó durante la
administración del presidente Reagan (Fishman & Neigher, 1982) y el recorte más reciente de los fondos
para la investigación industrial (Yeager, 1996) sugieren que la sociedad estadounidense se ha vuelto
hacia el modelo baconiano. Los científicos, que por supuesto se benefician de la financiación de la
investigación, han tratado de explicar las ventajas de la investigación tanto en el sector público como en
el privado. Por necesidad, los científicos del comportamiento se han vuelto más activos en la promoción
de la investigación gubernamental (National Advisory Mental Health Council Behavioral Science Task
Force, 1995). Yeager (1996) ha argumentado que, en el sector privado, mientras que la industria puede
calcular fácilmente los costos a corto plazo de la investigación, no ha apreciado completamente los
beneficios a largo plazo. La falta de investigación industrial puede paralizar industrias importantes.
Ejemplos bien conocidos son el declive de las industrias del automóvil y del acero de EE. UU. debido a
su incapacidad para competir con la tecnología avanzada japonesa en la década de 1980.
Los factores humanos (ver Capítulo 15) es un área aplicada que ha estado creciendo rápidamente.
La mayoría de los miembros de la Sociedad de Factores Humanos y Ergonomía se han formado como
psicólogos. Sin embargo, un antiguo editor de su revista, Human Factors, él mismo psicólogo, cree que la
disciplina de los factores humanos en 10 años será “más una profesión y menos una ciencia,
particularmente una ciencia psicológica . Continuará produciendo investigación, pero de una naturaleza
cada vez más específica de problemas. . . . Sin embargo,
lo que sigue preocupándome es cómo una disciplina cada vez más profesional va a cerrar la brecha entre
la ciencia y la práctica a medida que el alcance de la ciencia se vuelve más amplio y el número de
verdaderos científicos en esa disciplina se vuelve más pequeño” (Howell, 1994, p. pág. 5). En el campo
de la investigación médica, existe una preocupación similar por cerrar la brecha entre la investigación
básica y la aplicada. Por lo tanto, en 2006, los Institutos Nacionales de Salud lanzaron un nuevo programa
para promover la investigación destinada a traducir los descubrimientos básicos de laboratorio en
aplicaciones prácticas.
La elección entre los enfoques cartesiano y baconiano de la ciencia es algo que, en última instancia,
no será decidido por los científicos. Las decisiones de financiación que se tomen en los sectores público
y privado decidirán qué criterios son los más apropiados para evaluar el trabajo científico. Pero todos
nosotros, científicos y no científicos por igual, nos veremos profundamente afectados por esta elección.
Aunque la división de la investigación en categorías básicas y aplicadas es común, una distinción

mucho más importante es entre buena y mala investigación. Los principios y prácticas
59533_02_ch01_p001-023.indd 20 9533_02_ch01_p001-023.indd 20 3/4/08 /4/08

cubiertos en este texto se aplican con igual fuerza a la investigación básica y aplicada. Puede y debe usarlos
para evaluar toda la investigación psicológica que encuentre, ya sea como estudiante, psicólogo profesional
o persona educada que lee el diario.
¿Están los experimentos demasiado lejos de la vida real? Los estudiantes de psicología suelen
exigir un mayor nivel de relevancia en sus cursos de psicología de lo que esperan de otras ciencias. Los
estudiantes que no están en absoluto consternados porque su curso de introducción a la física no les
permitió reparar su automóvil, a menudo se sienten perturbados porque su curso de introducción a la
psicología no les dio una mejor comprensión de sus propias motivaciones, no curó sus neurosis y fracasó.
para mostrarles cómo obtener la felicidad eterna. Si no encontró tal información en la psicología introductoria,
dudamos que la encuentre en este texto tampoco. Si esto te parece injusto, sigue leyendo.
Los datos que recopilan los psicólogos pueden parecer al principio sin importancia, porque puede ser
difícil establecer una relación inmediata entre la investigación psicológica básica y los problemas sociales
o personales apremiantes. Entonces, es natural dudar de la importancia de ciertos tipos de investigación y
preguntarse por qué el gobierno federal, a través de varias agencias, está financiando investigadores para
observar ratas empujando barras o corriendo por laberintos.
La dificultad, sin embargo, no está en la investigación, sino en las expectativas sobre cómo debe
llevarse a cabo una investigación “útil”. Como señaló Sidman (1960), la gente espera que se produzca un
progreso mediante el establecimiento de situaciones de laboratorio que sean análogas a las situaciones de
la vida real: “Para estudiar la psicosis en animales, debemos aprender a volverlos psicóticos”. Esto está
fuera de lugar. El psicólogo trata de comprender los procesos subyacentes más que las situaciones físicas
que producen estos procesos.
Las situaciones físicas en el mundo real y el laboratorio no tienen por qué ser similares, siempre que ocurran
los mismos procesos.
Supongamos que nos gustaría saber por qué ocurren los accidentes de avión o, más específicamente,
es decir, cuál es la relación entre los accidentes aéreos y la falta de atención por parte del piloto y/o del
controlador de tránsito aéreo. Un investigador básico podría abordar este problema haciendo que los
estudiantes de segundo año de la universidad se sienten frente a varias luces que se encienden en rápida
sucesión. El estudiante de segundo año tiene que presionar una tecla a medida que se ilumina cada luz.
Esto probablemente parece algo alejado de las colisiones en el aire de aeronaves. Sin embargo, aunque
las situaciones físicas son muy diferentes, los procesos son similares. Presionar una tecla es un índice de
atención (ver Capítulo 8). Los psicólogos pueden sobrecargar al operador humano presentando luces que
parpadean más rápido de lo que él o ella puede responder. Así, esta simple situación física en un laboratorio
permite al psicólogo estudiar la falta de atención en un ambiente cuidadosamente controlado. Además de
los beneficios de seguridad obvios de estudiar la atención sin tener que estrellar aviones, existen muchas
ventajas científicas para el entorno de laboratorio (consulte el Capítulo 3). Debido a que las fallas de atención
son responsables de muchos tipos de accidentes industriales (DeGreene, 1970, capítulos 7 y 15), los
estudios de atención mediante el uso de luces y botones pueden conducir a mejoras fuera del laboratorio.
Del mismo modo, establecer situaciones físicas similares no garantiza la similitud de los procesos.
Uno puede entrenar fácilmente a una rata para que recoja monedas en su boca y las entierre en su jaula.
Pero esto no significa necesariamente que la rata “avaro” y el humano avaro que guarda monedas debajo
de su colchón lo hagan porque los mismos procesos psicológicos controlan sus comportamientos.
No sólo deberíamos preocuparnos por los procesos psicológicos que pueden generalizarse del
laboratorio a una aplicación, sino también ser conscientes de dos razones importantes para hacer
investigación, cuyo propósito (al menos inicialmente) puede no estar directamente relacionado.
59533_02_ch01_p001-023.indd 21 9533_02_ch01_p001-023.indd 21 3/4/08 /4/08

relacionados con asuntos prácticos (Mook, 1983). Una de las razones por las que la investigación básica
ayuda a comprender es que a menudo demuestra lo que puede suceder. Por lo tanto, bajo condiciones
controladas, los científicos pueden determinar si ocurre la holgazanería social. Además, el laboratorio
brinda la oportunidad de determinar las características de la holgazanería social más claramente que el
lugar de trabajo, donde una serie de factores no controlados, como el salario y la seguridad laboral,
podrían enmascarar o alterar los efectos de la holgazanería social (consulte el Capítulo 3). ).
Una segunda razón del valor de la investigación básica es que los hallazgos de un entorno de
laboratorio controlado pueden tener más fuerza que hallazgos similares obtenidos en un entorno de la
vida real. Mostrar que el operador humano puede estar sobrecargado en una tarea de laboratorio
relativamente poco estresante sugiere que los factores de atención son cruciales para el desempeño; las
personas podrían tener aún más probabilidades de estar sobrecargadas en las condiciones estresantes
de pilotar grandes aviones de pasajeros en espacios aéreos abarrotados.
Por supuesto, si un investigador quiere probar una predicción teórica o aplicar un resultado de
laboratorio en un entorno aplicado, entonces serán necesarias las pruebas de la vida real. Sería temerario
instalar una forma de evaluar el desempeño individual para reducir la holgazanería social en una situación
de fabricación grupal sin probar primero su aplicabilidad en ese entorno. La moraleja, entonces, es que el
investigador debe preocuparse por el objetivo de los experimentos. El investigador o el evaluador de una
investigación debe considerar bien ese objetivo.
Ni la práctica ni el uso de la ciencia es fácil. Los beneficios que se pueden derivar del conocimiento
y la comprensión científi cos dependen de ciudadanos y científicos críticos y bien informados. Su
participación en una carrera, una familia y los asuntos sociales estará determinada en parte por los
descubrimientos científicos. Debe estar en posición de evaluar esos hallazgos con precisión y aceptar
aquellos que parezcan más confiables y válidos. A menos que planee hibernar o abandonar la sociedad
de alguna otra manera, se verá afectado por la investigación psicológica. Como ciudadano, será un
consumidor de los resultados de la investigación psicológica, y esperamos que el material discutido en
este libro lo ayude a convertirse en un consumidor inteligente.
Algunos de ustedes, esperamos, se convertirán en científicos. También esperamos que algunos de

ustedes, científicos en ciernes, se centren en por qué la gente piensa y actúa como lo hace. Les deseamos
buena suerte a los futuros científicos. Su carrera científica será emocionante, y esperamos que sus
esfuerzos se vean influenciados positivamente por los principios de la investigación psicológica
presentados aquí.
ÿ Resumen
1. La psicología científi ca se ocupa de los métodos y técnicas 3. Los científicos utilizan el razonamiento tanto inductivo como
utilizados para comprender por qué las personas piensan y deductivo para llegar a explicaciones del pensamiento y la acción.
actúan como lo hacen. Esta curiosidad puede ser satisfecha 4. Montones de generalizaciones producen hordas de
con investigación básica o aplicada, que por lo general van de hipótesis
la mano para brindar comprensión. 5. Una teoría organiza conjuntos de datos y genera pre
dicciones para nuevas situaciones en las que los datos no han
2. Nuestras creencias a menudo se establecen por el método de la sido obtenido. Una buena teoría es parsimoniosa, precisa,
autoridad, el método de la tenacidad o el método a priori. El comprobable y se ajusta a los datos que explica.
método científi co ofrece ventajas sobre estos otros métodos 6. La investigación de laboratorio se ocupa de los procesos que
porque se basa en la observación sistemática y se corrige a sí gobiernan la conducta y de mostrar las condiciones bajo las
mismo. cuales pueden observarse ciertos procesos psicológicos.
59533_02_ch01_p001-023.indd 22 9533_02_ch01_p001-023.indd 22 3/4/08 /4/08

ÿ TÉRMINOS CLAVE
método a priori inducción

investigación aplicada variables intervinientes
autoridad método de autoridad
investigación básica método de tenacidad
datos observación
deducción organización
descripción parsimonia
determinismo precisión
difusión de la responsabilidad predicción
enfoque empírico método científico
experimentación autocorrección
explicación barra social de
vista de capacidad de falsificación tenacidad
generalización comprobabilidad
hipótesis teoría
ÿ PREGUNTAS DE DISCUSIÓN
1. Haz una lista de cinco afirmaciones que podrían considerarse 3. Discutir la investigación del ocio social desde el punto de vista de
verdaderas. Incluye algunas declaraciones controvertidas. la falsabilidad de la teoría.
(por ejemplo, los hombres tienen un coeficiente intelectual más 4. ¿Es necesario (o incluso deseable) que los psicólogos
bajo que las mujeres), así como algunas que está seguro de que experimentales justifiquen su investigación en términos de
son correctas. Encuesta a algunos de tus amigos preguntándoles beneficios aplicados a la sociedad?
si están de acuerdo con estas declaraciones. Luego, pídales que 5. Lea este artículo: Skinner, BF (1956). Una historia de caso en el
justifiquen sus opiniones. Clasifique sus justifi caciones en uno método científico. Psicólogo americano, 11, 221–233. Analice
de los métodos para fijar creencias discutidos en este capítulo. los puntos de vista de Skinner desde el punto de vista de los
2. Comparar y contrastar los enfoques inductivo y deductivo de la temas discutidos en este capítulo.
ciencia. Aclare sus respuestas refiriéndose a por lo menos una
rama de la ciencia fuera de la psicología experimental.
CONEXIONES WEB
Explore la presentación paso a paso de “¿Qué es la ciencia? Ways of Thinking about the World” sobre
las actividades del Centro de Recursos de Psicología de Wadsworth, Estadísticas y Métodos de Investigación
en: http://academic.cengage.com/psychology/workshops
Dos excelentes sitios web de propósito general son:

http://www.apa.org
http://www.cienciapsicológica.org
59533_02_ch01_p001-023.indd 23 9533_02_ch01_p001-023.indd 23 3/4/08 /4/08

CAPÍTULO 2
INVESTIGAR
TÉCNICAS:
OBSERVACIÓN
Y
CORRELACIÓN
OBSERVACIÓN NATURALISTA
¿Qué observamos?
Reactividad
El estudio de caso
Investigación de encuestas
Ventajas y desventajas de las observaciones naturalistas
EL ENFOQUE RELACIONAL
Investigación de contingencias
Investigación correlacional
El coeficiente de correlación
Procedimientos correlacionales complejos

Causa: una nota
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
59533_03_ch02_p024-050.indd 24 9533_03_ch02_p024-050.indd 24 3/4/08 /4/08

La observación científi ca no difiere de la observación cotidiana por ser infalible, aunque es
cuantitativamente menos falible que la observación ordinaria. Más bien, se diferencia de la observación
cotidiana en que el científico descubre gradualmente sus errores anteriores y los corrige. .
. . De hecho, la historia de la psicología
como ciencia ha sido el desarrollo de ayudas instrumentales y de procedimiento que eliminan o
corrigen gradualmente los sesgos y distorsiones al hacer observaciones. (RAY HYMAN)
La ciencia es quizás la única empresa intelectual que construye acumulativamente. Desde una
perspectiva científi ca, sabemos más sobre el mundo de hoy que lo que la gente ha sabido en
cualquier otro momento de la historia. Por otro lado, la literatura, el arte y la filosofía pueden ser
diferentes hoy de lo que eran en la antigua Grecia, pero probablemente no podemos decir que
estas disciplinas estén en un mejor estado o que representen con mayor precisión al mundo.
Una razón principal por la que la ciencia acumula es el hecho de que los científicos se
esfuerzan por lograr la observación más precisa posible del mundo. La ciencia se corrige a sí
misma en el sentido de que se presentan teorías e hipótesis que permiten predecir lo que debería
suceder en condiciones específicas, y luego estas ideas se prueban comparando las predicciones
con observaciones recopiladas cuidadosamente. Cuando los hechos difieren consistente y
drásticamente de las predicciones, es necesario modificar o abandonar nuestras concepciones
teóricas. Gran parte de la empresa científi ca se ocupa de la observación: la recopilación de
datos sobre algún aspecto particular del mundo.
En este capítulo, analizamos varios métodos no experimentales para recopilar datos
psicológicos. Uno de esos métodos es la observación naturalista, que es la forma más obvia y
quizás la más venerable de recopilar datos. Muchas personas, como los observadores de aves,
son naturalistas aficionados, pero los naturalistas científicos, como veremos, son más sistemáticos
en sus observaciones. Por ejemplo, los colibríes garganta azul machos tienen cantos que
consisten en notas organizadas en cinco unidades de canto; los machos en un área en particular
tienden a cantar las mismas unidades de canto (Ficken et al., 2000).
Otra forma de recopilar información es un estudio de caso, que generalmente implica el
examen detallado de un individuo, pero también puede implicar la comparación de un pequeño
número de individuos. Un caso reciente reveló que cuando KR, una madre de cuatro hijos de
treinta años, acudió a terapia, tenía varios rituales de conteo que obstaculizaban severamente
las actividades diarias (Oltmanns et al., 2006). Durante la compra de comestibles, por ejemplo,
KR creía que si seleccionaba uno de los cuatro artículos iniciales en un estante, uno de sus hijos
sufriría graves consecuencias. Ella creía que seleccionar la segunda caja de cereal resultaría en
un desastre para su segundo hijo, seleccionar la tercera caja dañaría a su tercer hijo, y así
sucesivamente.
Similar al estudio de caso es la encuesta. En lugar de un pequeño número de personas,
las encuestas recopilan información detallada y autoinformada de un gran número de personas.
Un ejemplo interesante de una muestra a gran escala es la Encuesta electoral nacional de
Annenberg de 2000 (Waldman, 2004), que se basa en entrevistas telefónicas detalladas de una
muestra aleatoria de 58.373 personas. En un análisis de una parte de los datos de la encuesta,
Moy, Xenos y Hess (2005) encontraron que la aparición de candidatos políticos en la televisión noc
59533_03_ch02_p024-050.indd 25 9533_03_ch02_p024-050.indd 25 3/4/08 /4/08

afectó las actitudes de los espectadores hacia los candidatos. Después de la aparición de George W.
Bush en el Late Show with David Letterman, por ejemplo, Moy y sus asociados encontraron que los
televidentes de Letterman tenían índices más altos de cuánto se preocupa Bush por “gente como yo” que
los no televidentes de la televisión nocturna. .
La información descriptiva reunida por los procedimientos que acabamos de esbozar se combina a
menudo de varias maneras para que sea posible hacer predicciones sobre las actividades de una persona.
Este intento de predicción es una técnica correlacional. Un ejemplo de ese procedimiento revela que la
confianza de una persona en su capacidad para identificar correctamente a un delincuente no predice
qué tan bien puede distinguir al delincuente de una rueda de reconocimiento policial (Cutler y Penrod,
1989).
Como indican los resultados anteriores, los métodos observacionales y correlacionales pueden
arrojar datos interesantes sobre fenómenos interesantes. Examinamos estos métodos con cierto detalle,
mostrando sus fortalezas y debilidades como formas de determinar por qué las personas y los animales
piensan y actúan como lo hacen.
ÿ OBSERVACIÓN NATURALISTA
Como todos sabemos, los observadores son falibles. Ver no debe ser creer, al menos no siempre. A
menudo, nuestras percepciones nos engañan, como se ve por la forma en que percibimos la ilusión óptica
en la Figura 2.1. Todos hemos visto a magos realizar hazañas aparentemente imposibles ante nuestros
ojos que sabíamos que se estaban logrando por medios naturales. tales trucos
(a)
(b)
1 2 3 4 5 6 7 8 9 10
ÿ FIGURA 2.1
Una Ilusión Visual. (a) La ilusión de Müller-Lyer. Las líneas verticales tienen la misma longitud
pero parecen desiguales debido a las diferentes direcciones de las aletas en los dos casos. (b) La
ilusión aparentemente distorsiona incluso un dispositivo de medición objetivo, la regla. Pero un
examen minucioso indica que la regla no está realmente distorsionada y que las líneas tienen la misma long
(Tomado de RL Gregory, 1970, págs. 80–81.)
59533_03_ch02_p024-050.indd 26 9533_03_ch02_p024-050.indd 26 3/4/08 /4/08

demuestran que las percepciones directas pueden ser inexactas si no tenemos cuidado, y algunas veces
incluso si lo somos.
Los científicos, siendo humanos, también cometen errores de observación. Esencialmente, las técnicas
de investigación empleadas por los científicos, incluida la lógica, el uso de aparatos complicados, las
condiciones controladas, etc., intentan protegerse contra los errores de percepción y garantizar que las
observaciones reflejen el estado de la naturaleza con la mayor precisión posible. Sin embargo, incluso con
nuestros mejores métodos y las técnicas de observación más cuidadosas, solo podemos aproximarnos a
este ideal. Sin embargo, la observación naturalista como método de investigación difiere de la observación
casual del mundo. El trabajo de Ginsburg y Miller (1982) sobre la toma de riesgos en niños y niñas muestra
cómo las observaciones cuidadosas y discretas prolongadas pueden dar sus frutos. La mayoría de la gente
estaría de acuerdo en que los niños pequeños parecen ser más atrevidos que las niñas.
¿Es esta una observación precisa, o los observadores casuales simplemente confirman estereotipos
generales? Ginsburg y Miller, naturalmente, observaron a casi quinientos niños de hasta once años en un
zoológico mientras alimentaban a los animales, los acariciaban, tenían la oportunidad de montar en elefante,
etc. Dos observadores independientes notaron la frecuencia con la que los niños y las niñas participaban
en estas actividades desafiantes ("riesgosas"). Los niños, especialmente los mayores, eran más propensos
a participar en actividades de riesgo que las niñas. Obtener conteos de frecuencia de comportamientos
específicos en situaciones específicas por parte de dos observadores refuerza la conclusión de la
observación casual de que los niños son más atrevidos que las niñas. Esta investigación, sin embargo, no
proporciona información sobre por qué este es el caso.
Miller (1977) enumeró varias funciones importantes que la observación naturalista puede desempeñar
en psicología. Miller sugiere que la observación proporciona una parte importante de la base de datos que
puede conducir a una investigación posterior más controlada. La observación naturalista describe los
pensamientos y comportamientos de los organismos, lo cual es un primer paso necesario para la
comprensión. Un ejemplo familiar es el trabajo de Harlow (1958) sobre el amor materno en los bebés, que
Blum (2002) describe en detalle. Antes de sus experimentos, Harlow necesitaba saber qué comportamientos
exhibían los monos bebés; también necesitaba saber algunas de las cosas que parecían gustarles a los
monos bebés (sus mantas suaves) y disgustarles (el piso de alambre de la jaula). Con esta información de
fondo, Harlow podría intentar explicar el comportamiento a través de la experimentación. Asimismo, Pytte,
Rusch y Ficken (2003) continuaron con sus observaciones anteriores del canto de los colibríes. Variaron el
ruido de fondo presente en el entorno de los colibríes garganta azul y los experimentos demostraron que el
volumen de los cantos de los pájaros aumenta con el volumen del fondo. Dado que tales experimentos
habrían sido improbables sin el trabajo previo de observación de Ficken y sus asociados, no deberíamos
ver la observación como algo secundario o subordinado a la experimentación porque carece de control.
Como ilustran los ejemplos anteriores, la observación puede proporcionar la base para la experimentación.
Al hacer observaciones científicas, nos enfrentamos a dos problemas básicos que amenazan la
validez o solidez de las observaciones. (Estos problemas también pueden afectar a la experimentación, que
examinaremos más adelante.) Un problema tiene que ver con la delimitación de la elección de los
comportamientos a observar. Los observadores humanos tienen una capacidad finita para percibir y pensar
sobre los eventos. Aunque la mayoría de nosotros puede caminar y masticar chicle al mismo tiempo, la
mayoría de nosotros no puede prestar atención y recordar veinte comportamientos diferentes que ocurren en
Por lo tanto, algún límite en el rango de comportamientos debe determinar lo que planeamos observar.
Debemos elegir los comportamientos críticos para el problema que estudiamos. El segundo problema se
refiere a la reacción del participante al ser observado. Este problema, llamado reactividad, presenta
problemas al realizar cualquier tipo de investigación psicológica.
59533_03_ch02_p024-050.indd 27 9533_03_ch02_p024-050.indd 27 3/4/08 /4/08

¿Qué observamos?
¿Cómo delimitamos el rango de conductas a estudiar? Parte de esta respuesta parece sencilla. Si
estamos interesados en la comunicación no verbal humana, observamos la comunicación no verbal
humana. Sin embargo, esto no es necesariamente fácil de hacer. En primer lugar, la comunicación
no verbal es muy compleja, lo que significa que los observadores nos enfrentamos al mismo
problema que intentamos evitar desde un principio: ¿Qué comportamientos no verbales observamos?
En segundo lugar, examinar las conductas no verbales presupone que ya conocemos algunas de
las conductas a observar. Evidentemente, no entramos en un proyecto de investigación desprovisto
de todo conocimiento, pero tampoco partimos de él con todas las respuestas. Por lo general,
comenzamos una serie de estudios de observación con algunos comportamientos en mente, y luego
los proyectos sucesivos se basan en datos previos para refinar y delimitar el campo de investigación.
Algunos ejemplos ilustrarán el procedimiento de refinamiento.
Un etograma La investigación naturalista de interés para los psicólogos parece más prevalente
en el área de la etología, el estudio del comportamiento natural (a menudo en la naturaleza).
La simple observación del comportamiento de animales o humanos permite una impresión global
de las características y el rango de comportamiento. Sin embargo, uno pronto puede desear una
observación más sistemática. Una forma en que los etólogos hacen observaciones más sistemáticas
es identificando diferentes categorías de experiencia para el organismo bajo estudio y luego
registrando la cantidad de veces que el organismo se involucra en cada comportamiento. Estos
comportamientos se pueden dividir en unidades grandes, como aparearse, arreglarse, dormir,
pelear, comer, etc., o en unidades mucho más pequeñas. Por ejemplo, en la Figura 2.2 se muestra
un etograma de los diversos comportamientos involucrados en el patrón de cortejo de un pez, el
cromuro naranja. (Un etograma es un inventario relativamente completo de los comportamientos
específicos realizados por una especie de animal). Al contar el número de veces que ocurre un
comportamiento específico, los etólogos pueden comenzar a tener una idea de la importancia del compo
Ficken y asociados (2000) caracterizaron los cantos de los colibríes garganta azul. También
desarrollaron un etograma de cuándo cantaban los colibríes. Claramente, los investigadores tenían
que poder grabar y analizar las canciones. Esta no es una empresa trivial.
Es difícil obtener registros precisos en un hábitat natural. Por ejemplo, la vigilancia continua
suele ser imposible, incluso con aparatos de registro automático. Además, tanto el aparato como
los observadores pueden dar lugar a reactividad, lo que estropearía las medidas. Estos son solo
algunos de los desafíos asociados con la observación naturalista de los animales.
Aplicar técnicas similares al comportamiento humano puede ser aún más difícil, porque la
gente no suele apreciar que un científico curioso anote cada una de sus acciones. Barker y sus
asociados (por ejemplo, Barker y Wright, 1951; Barker, 1968) fueron pioneros en la aplicación de la
observación naturalista a los humanos en varios escenarios, y el trabajo de Ginsburg y Miller (1982)
sobre la asunción de riesgos puede considerarse un ejemplo. ejemplo de etología humana. A
continuación se presentan ejemplos adicionales de observaciones naturalistas de humanos.
Cejas parpadeantes El famoso etólogo del comportamiento humano Eibl-Eibesfeldt (por

ejemplo, 1970, 1972) ha realizado una gran cantidad de investigaciones de campo sobre las
expresiones faciales humanas. Él y sus colegas viajaron por todo el mundo tomando fotografías de rostro
59533_03_ch02_p024-050.indd 28 9533_03_ch02_p024-050.indd 28 3/4/08 /4/08

Texto no disponible debido a restricciones de derechos de autor
expresiones en una variedad de contextos. Un examen cuidadoso de las expresiones indicó

que muchas son similares entre culturas y otras no. En el proceso de examinar las expresiones
faciales asociadas con las personas que se saludan, Eibl-Eibesfeldt descubrió que la mayoría
de los humanos parpadean brevemente las cejas. Luego pasó a examinar este fenómeno en
detalle.
El parpadeo de las cejas es un breve levantamiento de las cejas (un sexto de segundo),
acompañado de una leve sonrisa y un rápido movimiento de cabeza. El flash se ha observado
en personas de muchas culturas, incluidos bosquimanos, balineses y europeos, pero algunas
culturas difieren en la forma en que lo usan. Los japoneses no usan el flash, porque en Japón
se considera sugerente o indecente. Además, Eibl-Eibesfeldt descubrió que el destello se
produjo en otras circunstancias, como coquetear y reconocer un regalo o servicio (es decir,
como una especie de agradecimiento), además del saludo.
Podemos ver en su trabajo que las observaciones anteriores sugirieron otras adicionales
para Eibl-Eibesfeldt, y al delimitar su rango de investigación a las cejas parpadeantes, pudo
recopilar información sustancial sobre un comportamiento humano común.
59533_03_ch02_p024-050.indd 29 9533_03_ch02_p024-050.indd 29 3/4/08 /4/08

Reactividad
Hay dos métodos generales disponibles para tratar de evitar que las reacciones de los participantes
arruinen las observaciones: (1) observaciones no obstructivas y (2) medidas no obstructivas
(Webb et al., 1966). Consideramos estos a su vez.
Observaciones discretas Imagine que está caminando por una calle en su

ciudad natal.
De vez en cuando saludas a un amigo (quizás con un apretón de manos, quizás con un
destello de ceja). A medida que continúa su caminata, un hombre con una cámara grande se
acerca y procede a tomar una foto de usted en movimiento cada vez que saluda a uno de sus
amigos. ¿Cómo es probable que reaccione ante esta atención? Es muy probable que su forma de
saludar a la gente cambie drásticamente. (¿Ha notado alguna vez cómo se comportan los
espectadores en los eventos deportivos cuando saben que la cámara de televisión está sobre
ellos?) Eibl-Eibesfeldt se protegió contra la reactividad de los participantes en su investigación
usando una cámara con una lente lateral especial. Esta lente le permitió apuntar la cámara lejos
del sujeto 90 grados; presumiblemente, el sujeto pensaría que Eibl-Eibesfeldt estaba fotografiando
otra cosa. Así, el sujeto no reaccionaría anormalmente ante la presencia del observador y su
cámara; en cambio, el sujeto actuaría con naturalidad, que es lo que pretendía Eibl-Eibesfeldt. La
lente especial de la cámara permitió al investigador observar sin entrometerse en el tema.
Decimos que Eibl-Eibesfeldt utilizó una técnica de observación discreta.
En general, es probable que las observaciones discretas de los sujetos revelen un
comportamiento más natural que aquellas en las que los sujetos saben que están siendo
observados. Al estudiar animales, los investigadores utilizan observaciones discretas siempre que
sea posible. A veces, sin embargo, los sujetos mismos, el terreno o algún otro aspecto del proyecto
exige un contacto cercano. En estas situaciones, la observación participante a menudo
proporciona una solución. Como sugiere la frase, el observador se convierte en un participante
activo (e intrusivo) en la vida de los sujetos observados. Por ejemplo, Fossey (1972) pasó mucho
tiempo observando al gorila de montaña. El gorila de montaña vive en África central, y su hábitat
está amenazado por los seres humanos que se están desplazando hacia esa zona. El hábitat
natural del gorila de montaña es la selva tropical montañosa; esto hace que el espionaje discreto y
de largo alcance esté fuera de discusión. Fossey estaba especialmente preocupada por el
comportamiento de libertad de los gorilas, por lo que decidió convertirse en observadora participante.
Esto fue difícil, porque los gorilas no son mansos. Tuvo que actuar como un gorila frente a los
gorilas para que se acostumbraran a su presencia. Ella imitó aspectos del comportamiento del
animal, como comer, acicalarse y hacer vocalizaciones extrañas como las de un gorila. Como ella
dijo: “Uno se siente como un tonto golpeándose el pecho rítmicamente o sentado fingiendo masticar
un tallo de apio silvestre como si fuera el bocado más delicioso del mundo. Pero los gorilas han
respondido favorablemente” (p. 211). Fossey tardó varios meses en ganarse la confianza de los
gorilas y siguió viviendo con ellos y estudiándolos hasta su muerte en 1986. ¿Te gustaría actuar
como un gorila durante diez o quince años?
La reactividad no siempre resulta de la observación, porque no todas las formas de
observación parecen resultar en reactividad. Observaciones sustanciales de la interacción familiar
diaria por medio de grabadoras de audio indican que las familias responden de la misma manera,
ya sea que sepan o no que la grabadora de audio ha sido activada (Jacob et al., 1994). Sin
embargo, uno podría imaginar que un procedimiento de observación más intrusivo que combinara
la grabación de audio y video probablemente haría que las familias reaccionaran de manera poco natur
59533_03_ch02_p024-050.indd 30 9533_03_ch02_p024-050.indd 30 3/4/08 /4/08

Medidas discretas Las medidas discretas, en contraste con las observaciones discretas,
consisten en “observaciones” indirectas del comportamiento. Las medidas discretas son
indirectas porque lo que se estudia es el resultado del comportamiento, no el comportamiento
en sí. Por lo tanto, en lugar de observar el comportamiento directamente, lo examinamos
después del hecho observando lo que ha logrado el comportamiento. En lugar de observar las
actividades de estudio de un estudiante, examinamos su expediente académico. En lugar de
vivir con los gorilas, observamos su efecto sobre el medio ambiente. La diferencia crítica,
entonces, entre la observación discreta y las medidas discretas radica en si el sujeto y el
observador están en el mismo lugar al mismo tiempo. Cuando el investigador está presente,
él o ella intenta observar discretamente el comportamiento del sujeto. Cuando está ausente,
estudia el producto o resultado de la conducta.
Obviamente, las medidas discretas no son adecuadas para todas las preguntas que se
investigan (una medida discreta de un destello de cejas puede ser difícil), pero para algunos
problemas de investigación, estas medidas no son simplemente buenas, son las únicas que son
factibles. Considere la cuestión del graffiti en los baños públicos. ¿Quien lo hace? ¿Cuál es el
área temática habitual? Se plantearían una serie de preguntas éticas serias (la ética se analiza
en el Capítulo 4) si un investigador se quedara en los baños observando a los clientes.
Sin embargo, el grafiti en sí puede examinarse y puede proporcionar información sustancial.

Kinsey, Pomeroy y Martin (1953) descubrieron que el graffiti en los baños de hombres era más
erótico que el graffiti en los baños de mujeres. Además, encontraron más graffiti en los baños de
hombres que en los de mujeres.
El estudio de caso
Una de las formas más venerables de investigación en psicología es el estudio de casos. La
teoría psicoanalítica de Freud surgió de sus observaciones y reflexiones sobre casos individuales.
En general, un estudio de caso es la investigación intensiva de un solo caso de algún tipo, ya
sea un paciente neurótico, un médium espiritual o un grupo que espera el fin del mundo.
Festinger, Riecken y Schachter (1956) proporcionaron un interesante estudio de caso de este
último caso, quienes infiltraron a un pequeño grupo de personas que en realidad esperaban el
fin del mundo. Los miembros pensaron estar en contacto con seres de otro planeta, quienes le
habían comunicado a un miembro que la destrucción de la tierra estaba cerca. El grupo esperaba
ser rescatado por una nave espacial antes de la catástrofe. Festinger y sus compañeros estaban
especialmente interesados en las reacciones del grupo cuando no se producía la calamidad.
Observaron que para muchos de los miembros del grupo, la creencia en su sistema delirante en
realidad aumentó en lugar de disminuir después de que había pasado la fecha prevista de la
catástrofe.
El estudio de caso es un tipo de observación naturalista y está sujeto a las ventajas y
desventajas de ese método. Una desventaja principal es que los estudios de casos por lo general
no permiten hacer inferencias firmes sobre qué causa qué. Por lo general, todo lo que uno puede
hacer es describir el curso de los acontecimientos. A menudo, sin embargo, los estudios de
casos proporcionan comparaciones implícitas que permiten al investigador hacer algunas
conjeturas razonables sobre qué causa qué. El estudio de caso de KR, el contador compulsivo
que se describió anteriormente, reveló una educación excepcionalmente severa que involucró un
orden rígido y castigos severos por supuestos pecados y fechorías. La vida familiar actual de KR pa
59533_03_ch02_p024-050.indd 31 9533_03_ch02_p024-050.indd 31 3/4/08 /4/08

su control: sus hijos eran rebeldes y su esposo padecía una enfermedad incapacitante. El
terapeuta concluyó que sus rituales eran un intento de obtener el control y ser ordenada (Oltmanns
et al., 2006). Sin embargo, debemos ser cautelosos con la afirmación del terapeuta, porque no
sabemos en qué tipo de persona se habría convertido KR si hubiera tenido una infancia más
permisiva y una situación familiar menos estresante.
Un tipo de estudio de caso que mejor intenta minimizar las dificultades de hacer inferencias
es el análisis de casos desviados. Aquí, el investigador considera dos casos que tienen una serie
de similitudes y, sin embargo, difieren en el resultado. Por ejemplo, un hermano gemelo puede
volverse esquizofrénico y el otro no. El investigador intenta identificar, a través de una cuidadosa
comparación de los dos casos, los factores que son responsables de la diferencia en el resultado.
Por lo general, tales comparaciones no se pueden hacer porque los casos comparables que difieren
en un solo factor son raros. Además, cualquier conclusión, incluso a partir de este método, no
puede considerarse realmente firme o bien establecida porque el investigador nunca puede estar
seguro de haber identificado las causas críticas en los diferentes resultados.
A pesar de estas advertencias, consideremos un estudio de caso informado por Butters y
Cermak (1986) que ilustra cómo el uso juicioso del procedimiento puede proporcionar información
valiosa. El estudio trata sobre PZ, un científico de fama mundial que sufrió una grave pérdida de
memoria (amnesia) en 1981 después de que el abuso de alcohol a largo plazo provocara una
enfermedad llamada síndrome de Korsakoff. Tenía una dificultad extrema tanto para recordar
información nueva como para recordar eventos y personas del pasado. Este último déficit de
memoria fue fácil de determinar, porque dos años antes del inicio de la amnesia, PZ había escrito
su autobiografía. Cuando se le preguntó acerca de los nombres y eventos mencionados en su
autobiografía, mostró un drástico déficit de memoria. La memoria de PZ para estos eventos se
comparó con la retención de un colega de edad similar (la persona de comparación para el análisis
de casos desviados) que no tenía antecedentes de abuso de alcohol. Dado que el caso de
comparación no mostró un déficit de memoria tan grave como el de PZ, Butters y Cermak razonaron
que el abuso de alcohol a largo plazo era un factor causal importante en la amnesia de PZ.
Además, el déficit de memoria de PZ para nueva información era muy similar al que mostraban
otras personas con síndrome de Korsakoff. Esta última técnica de comparar el comportamiento del
caso con el de otros es esencialmente experimental y se ilustrará de nuevo en el capítulo 6.
Investigación de encuestas
Los estudios de casos generalmente involucran solo a unos pocos sujetos y, a menudo, estos
individuos no son en absoluto representativos de la población en general. PZ, por ejemplo, era a la
vez un científico brillante y un amnésico. A menudo, los investigadores desean obtener información
sobre una gran muestra aleatoria de personas en un área geográfica grande (como la encuesta
sobre ver televisión a altas horas de la noche al comienzo del capítulo), aunque la cantidad de
información obtenida de cualquier persona es necesariamente limitada. La investigación mediante
encuestas es mucho más común en algunas áreas de la psicología que en otras. Por ejemplo, esta
técnica se usa con bastante frecuencia en psicología industrial/organizacional, clínica y social, pero
casi nunca en psicología cognitiva. Una ventaja de la investigación por encuesta es que, dados los
procedimientos de muestreo precisos ahora disponibles, un investigador puede encuestar a un
número relativamente pequeño de personas para generalizar bien a la población en general.
Debido a que la encuesta conduce a resultados que generalmente son de naturaleza
descriptiva, esta técnica no es particularmente popular entre los psicólogos en áreas con una fuerte
59533_03_ch02_p024-050.indd 32 9533_03_ch02_p024-050.indd 32 3/4/08 /4/08

orientación experimental, como la psicología cognitiva o la psicofísica. Sin embargo, el uso inteligente del
método puede permitir contribuciones a casi todas las áreas de la psicología. Por ejemplo, Lovelace y Twohig
(1990) encuestaron a estadounidenses ancianos saludables y encontraron que el 68 por ciento afirmó que la
incapacidad para recordar nombres era un problema de memoria molesto. Sin embargo, la mayoría informó
que los problemas de memoria tienen poco efecto en su funcionamiento diario. Los encuestados informaron
que confiaban mucho en notas, listas y otras ayudas de memoria externas para ayudarlos a recordar hacer las
cosas.
Además, los encuestados de edad avanzada afirmaron no confiar en varios "trucos" de memoria, como los
dispositivos mnemotécnicos. Los resultados informados por Lovelace y Twohig concuerdan con otros datos de
encuestas (Moscovitch, 1982) que muestran que, en comparación con las personas más jóvenes, es mucho
más probable que los ancianos hagan listas y utilicen agendas y recurran menos a procedimientos de memoria
interna, como como recursos mnemotécnicos. Estos resultados son provocativos, porque sugieren que los
ancianos son conscientes de que pueden tener algunas limitaciones de memoria, que intentan minimizar
confiando en ayudas de memoria externas.
Dada la evidencia convergente de Lovelace y Twohig (1990) y Moscovitch (1982), esta parece una hipótesis
plausible. La información obtenida de estas encuestas puede proporcionar el marco para una investigación
más controlada para probar esta hipótesis.
Debido a que un investigador tiene que entrometerse en una persona para obtener los datos de la
encuesta, la posibilidad de reactividad por parte de los encuestados siempre está presente. Sussman y
asociados (1993) utilizaron la observación naturalista para estudiar el consumo de tabaco en los adolescentes.
Sus observaciones los llevaron a conclusiones diferentes de las que derivaron de los resultados de una encuesta
La encuesta indicó que el consumo de tabaco tiene lugar en grupos pequeños, y casi la mitad de los
encuestados informaron que los miembros del grupo les ofrecieron tabaco (Hahn et al., 1990).
Este tipo de descubrimientos llevaron a programas educativos que alientan a los adolescentes a “Simplemente
decir 'No'”. En la investigación de observación naturalista, que se llevó a cabo discretamente, Sussman y sus
asociados notaron que los adolescentes solicitaban cigarrillos con frecuencia, pero rara vez se los ofrecían.
Además, rara vez se ofrecían cigarrillos a los no consumidores que formaban parte de los grupos. Por lo tanto,
la posibilidad de que el consumo de tabaco resulte de la presión de los compañeros, como lo indican los
resultados de la encuesta, se contradice en este discreto estudio de observación. A partir de estos resultados,
Sussman y sus colegas sugirieron que deberían explorarse alternativas al programa “Simplemente diga 'No'”.
Finalmente, recuerde que el trabajo de encuesta realizado por Moy y sus asociados (2005) luego de la
aparición de George W. Bush en el Late Show con David Letterman encontró que los espectadores de
Letterman tenían calificaciones más altas de cuánto se preocupa Bush por "gente como yo" que hicieron los
no espectadores. Esta técnica de comparación es muy similar al trabajo de estudio de caso sobre la memoria
de PZ, y esta técnica de encuesta también proporciona una comparación similar a un experimento. Sin
embargo, no se asignó a las personas a ser espectadores o no espectadores, lo que significa que, como en el
caso de PZ, la comparación no es tan sólida como la utilizada en la experimentación (ver más abajo).
Ventajas y desventajas de las observaciones naturalistas

Como se señaló anteriormente, la observación naturalista es extremadamente útil en las primeras etapas de
la investigación, cuando uno simplemente desea obtener una idea de la amplitud y el alcance del problema de
interés (Miller, 1977). Sin embargo, es principalmente descriptivo y no permite inferir cómo se pueden relacionar
los factores. En algunos casos, no hay forma de emplear métodos de observación más controlados; por lo
tanto, solo los naturalistas están disponibles. Si usted
59533_03_ch02_p024-050.indd 33 9533_03_ch02_p024-050.indd 33 3/4/08 /4/08

quieres saber cómo se comportan los pingüinos en su hábitat natural, simplemente tienes que
observarlos allí. Aún así, para la mayoría de los problemas psicológicos, la observación naturalista es
útil principalmente para definir el área del problema y plantear preguntas interesantes para un estudio
más controlado por otros medios, especialmente experimentales. Por ejemplo, el trabajo descrito
anteriormente de Lovelace y Twohig (1990) y Moscovitch (1982) podría ser seguido por métodos de
investigación más controlados que comparen diferentes métodos de uso de ayudas de memoria
externa en sujetos de edad avanzada. ¿Qué ayudas funcionan mejor? Otro ejemplo es el estudio de
caso de Festinger y sus colegas del grupo que predijo el fin de la tierra.
Este estudio de caso ayudó a conducir a la teoría de la disonancia cognitiva del cambio de actitud de
Festinger (1957), que ha sido muy importante para guiar la investigación en psicología social.
El principal problema exclusivo de la observación naturalista es que es de naturaleza simplemente
descriptiva y no nos permite evaluar las relaciones entre los eventos. Un investigador podría notar
que el comportamiento de acicalamiento en monos en libertad ocurre en ciertos momentos, siguiendo
cinco condiciones diferentes (como comer). Si uno está interesado en averiguar qué condiciones
antecedentes son necesarias para producir acicalamiento, la observación naturalista no puede
proporcionar una respuesta, ya que no es posible manipular estas condiciones antecedentes. Para
esto, uno necesita un experimento.
La observación naturalista a veces produce datos que también son deficientes en otros aspectos.
Los datos científi cos deben ser fáciles de reproducir por otras personas utilizando procedimientos
estandarizados si estas personas dudan de las observaciones o están interesadas en repetirlas.
Muchos métodos naturalistas, como el estudio de casos, no permiten la reproducibilidad; por lo tanto,
están abiertos a ser cuestionados por otros investigadores.
Otro problema de los enfoques naturalistas es el de mantener lo más estrictamente posible un
nivel de observación más descriptivo que interpretativo. En el estudio de los animales, el problema es
a menudo antropomorfizar o atribuir características humanas a los animales. Cuando llegas a casa y
tu perro mueve la cola y se mueve emocionado, parece perfectamente natural decir que está feliz de
verte. Pero esto es antropomorfizar, y si uno se dedicara a la observación naturalista de la escena,
sería inapropiado. En su lugar, se deben registrar los comportamientos manifiestos del perro con la
menor atribución posible de motivos subyacentes, como felicidad, tristeza o hambre.
Por supuesto, los estudios de casos de Freud se basan enteramente en tales interpretaciones
de los hechos. Además de ser irreproducibles, los críticos acusan a tales casos de la posibilidad de
que si se nos permite (1) seleccionar nuestros datos de los estudios de casos y las respuestas que la
gente da a las preguntas que hacemos y luego (2) entretejer estos "hechos" en un sistema conceptual
de nuestra propia creación, los estudios de casos probablemente podrían usarse para “probar”
cualquier teoría. (Esto no es para desmerecer el talento creativo y el genio evidentes en el sistema de
Freud; sin embargo, ciertamente está abierto a la crítica en términos de la evidencia que usó como
base de su teoría).
Pavlov reporta otro ejemplo de este problema interpretativo que está más cerca de la psicología
científica en su investigación temprana sobre el reflejo condicionado (ver Capítulo 9). Cuando
comenzaron a estudiar los procesos psicológicos del perro, él y sus compañeros de trabajo descubrieron
que tenían un problema que no había sido aparente cuando anteriormente se preocupaban únicamente
por el sistema digestivo. El problema era grave, porque no podían ponerse de acuerdo sobre las
observaciones que estaban haciendo. Pavlov describe el problema de estudiar los reflejos condicionados:
Pero, ¿cómo se estudia esto? Tomando al perro cuando come deprisa, le arrebata
algo en la boca, mastica durante mucho tiempo, parece claro que en ese momento el
59533_03_ch02_p024-050.indd 34 9533_03_ch02_p024-050.indd 34 3/4/08 /4/08

el animal tiene un fuerte deseo de comer, por lo que se precipita hacia la comida, la agarra y se pone a comer.
Él anhela comer. . . . Cuando come, se ve sólo el trabajo de los músculos, esforzándose por todos los
medios para agarrar la comida en la boca, masticarla y tragarla. De todo esto podemos decir que obtiene
placer de ello. . . . Ahora, cuando procedimos a explicar y analizar
esto, rápidamente adoptamos este trillado punto de vista. Tuvimos que lidiar con los sentimientos, deseos,
concepciones, etc., de nuestro animal. Los resultados fueron asombrosos, extraordinarios; Uno de mis colegas
y yo llegamos a opiniones irreconciliables. No podíamos ponernos de acuerdo, no podíamos demostrarnos
uno al otro cuál tenía razón. . . . Después de esto tuvimos
que deliberar cuidadosamente. Parecía probable que no estuviéramos en el camino correcto. Cuanto más
pensábamos en el asunto, más crecía nuestra convicción de que era necesario elegir otra salida. Los primeros
pasos fueron muy difíciles, pero en el camino del pensamiento persistente, intenso y concentrado, finalmente
llegué al suelo firme de la pura objetividad. Nos prohibimos absolutamente (en el laboratorio se impuso una
multa real) el uso de expresiones psicológicas tales como el perro adivinó, quiso, deseó, etc.
(Pavlov, reimpreso en 1963, págs. 263–264)
Aquí se discute otro problema, aunque es relevante para todos los tipos de observación en
todos los tipos de investigación. Esta es la cuestión de hasta qué punto nuestros esquemas
conceptuales determinan y sesgan lo que “vemos” como hechos. La afirmación de Pavlov es un
testimonio elocuente de lo difícil que es establecer métodos objetivos para que todos podamos ver
los hechos de la misma manera. Inicialmente, le pareció "asombroso" y "extraordinario" que esto
fuera así y se sorprendió de las elaboradas precauciones necesarias para garantizar la objetividad.
Los filósofos de la ciencia han señalado que nuestras observaciones siempre están influenciadas
por nuestras concepciones del mundo, si no de otra manera, al menos por las observaciones
particulares que hacemos (ver, por ejemplo, Hanson, 1958, Capítulo 2). La “objetividad pura”, para
usar la frase de Pavlov, es bastante elusiva, si no imposible. Una ilustración que usa Hanson es la
de dos microbiólogos capacitados que observan un portaobjetos teñido y preparado a través de un
microscopio y “ven” cosas diferentes.
(Como es bien sabido, lo principal que un novato informa que ve en un microscopio es su propio
globo ocular). La observación objetiva y repetible en ciencia es un ideal aproximado, pero es posible
que nunca estemos completamente seguros de haberlo logrado. lo logro Ciertamente, sin embargo,
debemos dar todos los pasos posibles hacia este ideal, que es de lo que se ocupa gran parte de la
parafernalia técnica de la ciencia.
Sin embargo, el problema de las observaciones indebidamente influidas por las expectativas
no se resuelve automáticamente mediante el uso del equipo técnico de la ciencia pura, como es
evidente en una ilustración citada por Hyman (1964, p. 38). En 1902, poco después de que se
descubrieran los rayos X, el eminente físico francés RP Blondlot informó del descubrimiento de los
“rayos N”. Otros científicos franceses rápidamente repitieron y confirmaron el descubrimiento de
Blondlot; en 1904 aparecieron no menos de setenta y siete publicaciones sobre el tema. Sin
embargo, el descubrimiento se volvió polémico cuando los científicos estadounidenses, alemanes e
italianos no lograron replicar los hallazgos de Blondlot.
El físico estadounidense RW Wood, al no encontrar rayos N en su propio laboratorio en la
Universidad Johns Hopkins, visitó Blondlot. Blondlot mostró una tarjeta a Wood con círculos
luminosos pintados en ella. Luego apagó la luz de la habitación, fijó los rayos N en la tarjeta y le
indicó a Wood que los círculos aumentaban en luminosidad. Cuando Wood dijo que no podía ver
ningún cambio, Blondlot argumentó que esto debía deberse a que los ojos de Wood eran demasiado
insensibles. A continuación, Wood preguntó si podía realizar algunas pruebas sencillas, a lo que Blond
59533_03_ch02_p024-050.indd 35 9533_03_ch02_p024-050.indd 35 3/4/08 /4/08

consentido En un caso, Wood movió una pantalla de plomo repetidamente entre los rayos N y las tarjetas,
mientras que Blondlot informó los cambios correspondientes en la luminosidad de los círculos de la tarjeta.
(El escudo de plomo era para evitar el paso de los rayos N.) Blondlot se equivocaba constantemente y, a
menudo, informaba de un cambio en la luminosidad cuando la pantalla no se había movido. Esta y otras
pruebas indicaron claramente que no había evidencia de la existencia de rayos N, a pesar de su "confirmación"
por parte de otros científicos franceses.
Después de 1909 no hubo más publicaciones sobre rayos N. El error fue demasiado para Blondlot.
Nunca se recuperó y murió en desgracia algunos años después. Podemos ver en este dramático ejemplo
que incluso con el sofisticado aparato de los físicos, los errores de observación son posibles y deben evitarse.
ÿ EL ENFOQUE RELACIONAL
Los científicos describen, relacionan y experimentan. La investigación relacional intenta determinar cómo
dos (normalmente) o más variables se relacionan entre sí. Una variable es algo que se puede medir o
manipular. Por lo general, la investigación relacional no implica la manipulación de variables, por lo que los
datos relacionados se denominan datos ex post facto , que significa "después del hecho". Los datos que se
relacionan provienen de eventos que ocurren naturalmente y no resultan de la manipulación directa por parte
del investigador. El investigador categoriza o evalúa los datos y sondea las relaciones.
Investigación de contingencias
La investigación de contingencia es un tipo de investigación relacional en la que se comparan los datos

de dos variables para ver si los valores de una variable dependen de los valores de la otra. Suponga que
desea determinar la distribución de hombres y mujeres en varios programas principales en su universidad.
Para examinar esto, evalúe las frecuencias con las que las mujeres y los hombres declaran los principales
programas e ingrese el resultado de sus resultados en una tabla de contingencia. Una tabla de contingencia
es una presentación tabular de todas las combinaciones de categorías de dos variables, que permite
examinar las relaciones entre las dos. Un ejemplo del desarrollo de una tabla de contingencia aparece en la
Tabla 2.1.
El Panel A de la Tabla 2.1 muestra el número de mujeres que se especializan en varios departamentos.
Más mujeres se están especializando en periodismo que en cualquiera de los otros departamentos enumerados. Su tory
tiene la menor cantidad de mujeres mayores. El número de hombres que se especializan en los cinco departamentos
aparece en el panel B. Tenga en cuenta que hay más hombres que se especializan en historia que en cualquier otro departament
La psicología tiene la menor cantidad de hombres. El panel C ilustra toda la tabla de contingencia y agrega
información importante: la frecuencia relativa de carreras de hombres y mujeres.
Las frecuencias relativas de cada celda de la tabla muestran el porcentaje de hombres y mujeres en cada
programa principal. La tabla de contingencia ilustrada en el panel C se denomina tabla de contingencia 2 5
porque tiene dos filas y cinco columnas (sin incluir los totales). Las tablas de contingencia requieren al menos
dos filas y al menos dos columnas. La convención es presentar el número de filas y luego el número de
columnas en la descripción. Una combinación particular de fila y columna se llama celda; por ejemplo, la
entrada de la celda que indica el porcentaje de mujeres con especialización en psicología es 74,2 por ciento.
Los porcentajes en la tabla indican claramente que existe una relación entre el género de una persona
y su elección de especialización en esta universidad en particular: La historia ha
59533_03_ch02_p024-050.indd 36 9533_03_ch02_p024-050.indd 36 3/4/08 /4/08

ÿ TABLA 2.1
Elaboración de un cuadro de contingencia que indique algunos de los principales programas

Elegido por hombres y mujeres en una pequeña universidad de artes liberales
Panel A: Número de mujeres que se especializan en cinco departamentos
programa principal
Biología inglés Historia Periodismo Psicología
36 50 22 57 49
Panel B: Número de hombres que se especializan en cinco departamentos
programa principal
Biología inglés Historia Periodismo Psicología
29 18 66 23 17
Panel C: Tabla de Contingencia de Frecuencia y Frecuencia Relativa en Porcentaje de Mujeres y

Hombres con Carrera en los Cinco Departamentos
programa principal
Género Biología inglés Historia Periodismo Psicología Total
Mujeres 36 50 22 57 49 214
55,4% 73,5% 25,0% 71,3% 74,2% 58,3%

Hombres 29 18 66 23 17 153
44,6% 26,5% 75,0% 28,7% 25,8% 41,7%
Total sesenta y cinco 68 88 80 66 367
100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
proporcionalmente más hombres que mujeres en carreras, y lo contrario es cierto para los otros
programas principales. Este tipo de relación indica una falta de independencia entre el género y la
elección de carrera. Si quisiera analizar estadísticamente los datos de la tabla, probablemente usaría
2
una prueba de independencia, que sieslos
una
datos
prueba
de una
estadística
tabla deque
contingencia
se usa a menudo
son estadísticamente
para determinar
significativos.
El cálculo de esta estadística se ilustra en el Apéndice B.
La reactividad de los participantes puede ser un problema en la investigación de contingencias,
especialmente cuando los participantes han sido entrevistados o encuestados. Sin embargo, no todas
las investigaciones de contingencia están sujetas a reactividad. Los datos presentados en la Tabla 2.1
son completamente ex post facto, por lo que las personas que declararon una carrera en particular no
saben que han aparecido en una celda en particular de una tabla de contingencia. Al principio, esto
puede parecer un factor importante a favor de dicha investigación. Sin embargo, debe tener en cuenta
que se desconoce la reactividad de los participantes en este ejemplo en particular. El verdadero
problema es que podrían haber elegido una especialización en particular por razones reactivas ("Mamá
quiere que yo sea un estudiante de inglés"). No existe una forma sencilla de determinar ese tipo de reactiv
59533_03_ch02_p024-050.indd 37 9533_03_ch02_p024-050.indd 37 3/4/08 /4/08

datos de estadísticas preparadas por alguien que simplemente anota quién se especializa en un programa
en particular. Entonces, lo que ocurre a menudo en la investigación ex post facto es que hay una reactividad
de los participantes de una magnitud desconocida y una fuente desconocida. Cuando los investigadores
evalúan en lugar de manipular, a menudo permanecen en la oscuridad con respecto a posibles factores de
confusión como la reactividad de los participantes.
Investigación correlacional
El segundo tipo de investigación relacional que consideramos se denomina investigación correlacional,

que permite al investigador determinar simultáneamente el grado y la dirección de una relación con una sola
estadística. Como ocurre con la mayoría de las investigaciones de contingencia, la investigación correlacional
examina las variables ex post facto.
Un ejemplo típico del enfoque correlacional es la exploración de la relación entre fumar cigarrillos y el
cáncer de pulmón. Los estudios realizados en la década de 1950 y principios de la de 1960 encontraron
consistentemente una correlación positiva moderadamente alta entre fumar cigarrillos y el cáncer de pulmón:
cuanto mayor era la cantidad de cigarrillos que fumaba una persona, más probable era que esa persona
tuviera cáncer de pulmón. El conocimiento de esta relación permite hacer predicciones. A partir del
conocimiento de cuánto fuma alguien, podemos predecir (aunque no perfectamente) la probabilidad de que
esa persona contraiga cáncer y viceversa. El informe del Cirujano General de EE. UU. en 1964, que concluyó
que fumar era peligroso para la salud, se basó casi por completo en evidencia correlacional. Examinamos
algunos problemas en la interpretación de la evidencia correlacional; pero primero, consideremos las
propiedades del propio coeficiente de correlación.
El coeficiente de correlación
Un coeficiente de correlación mide el grado y la dirección de la relación entre dos variables. Hay varios
tipos diferentes de coeficientes de correlación, pero casi todos tienen en común la propiedad de que pueden
variar de 1,00 a 0,00 y hasta 1,00. Por lo general, no serán una de estas tres cifras, sino algo intermedio,
como .72 o .39. La magnitud del coeficiente de correlación indica el grado de relación (los números más
grandes reflejan mayores relaciones), y el signo indica la dirección de la relación, positiva o negativa. Es
importante poner el signo apropiado delante del coeficiente de correlación, de lo contrario no se puede saber
de qué manera se relacionan las dos variables, positiva o negativamente. Sin embargo, es una práctica
común omitir el signo más antes de las correlaciones positivas para que una correlación de .55 se interprete
como .55. Es una mejor práctica incluir siempre el signo. Un ejemplo de una correlación positiva es la
relación entre el cáncer de pulmón y el tabaquismo. A medida que aumenta una variable, también lo hace la
otra (aunque no perfectamente, es decir, el coeficiente de correlación es inferior a 1,00). También existe una
correlación negativa documentada entre fumar y otra variable, a saber, las calificaciones en la universidad.
Las personas que fuman mucho tienden a tener calificaciones más bajas que las que fuman menos (Huff,
1954, p. 87).
Como se mencionó, existen varios tipos diferentes de coeficientes de correlación, y el tipo que se utiliza
depende de las características de las variables que se correlacionan. Consideramos uno comúnmente
utilizado por los psicólogos: la correlación producto-momento de Pearson.
59533_03_ch02_p024-050.indd 38 9533_03_ch02_p024-050.indd 38 3/4/08 /4/08

coeficiente, o Pearson r. La fórmula de cálculo para Pearson r se presenta en el Apéndice B.
Recuerde que este es solo uno de varios métodos; si realmente necesita calcular una correlación en
algunos datos, consulte un texto de estadísticas (como Howell, 2008) para determinar qué método es
apropiado para su caso particular.
Imagine que estamos entre el grupo de psicólogos que dedican sus carreras al estudio de la
memoria humana. Uno de estos psicólogos da con una idea simple e intuitiva sobre el tamaño de la
cabeza y la memoria, que dice así. La información del mundo exterior ingresa a la cabeza a través de
los sentidos y se almacena allí. Se puede hacer una analogía entre la cabeza (donde se almacena la
información) y otros recipientes físicos, como cajas, donde se pueden almacenar todo tipo de cosas.
Sobre la base de este razonamiento analógico, que es común en la ciencia, el psicólogo hace la
siguiente predicción a partir de su conocimiento de las propiedades de los contenedores físicos: a
medida que aumenta el tamaño de la cabeza de una persona, también debe aumentar su memoria.
Se pueden almacenar más cosas en cajas más grandes que en las más pequeñas y, de manera
similar, se debe almacenar más información en las cabezas más grandes que en las más pequeñas.
Esta “teoría” propone una relación simple: que a medida que aumenta el tamaño de la cabeza,
también debería hacerlo la memoria. Se prevé una correlación positiva entre estas dos variables. Se
podría tomar una muestra aleatoria de la población local. Las personas elegidas podrían medirse en
dos dimensiones: el tamaño de la cabeza y la cantidad de palabras que pueden recordar de una lista
de treinta, que se les presenta una vez, a razón de una palabra cada tres segundos. En la Tabla 2.2
se presentan tres conjuntos hipotéticos de resultados de diez sujetos. Para cada individuo hay dos
medidas, una del tamaño de la cabeza y la otra del número de palabras recordadas. Además, los dos
tipos de medidas no necesitan ser similares de ninguna manera para estar correlacionados. No tienen
que estar en la misma escala. Así como se puede correlacionar el tamaño de la cabeza con el número
de palabras recordadas, también se puede correlacionar el coeficiente intelectual con el número de la
dirección o cualquier par de números.
Las representaciones gráficas de los datos en los tres paneles de la Tabla 2.2 se presentan en
los tres paneles de la Figura 2.3; el tamaño de la cabeza se traza a lo largo del eje X horizontal (las
abscisas) y el número de palabras recordadas se traza a lo largo del eje Y vertical (las abscisas).
ÿ TABLA 2.2
Tres ejemplos hipotéticos de datos tomados sobre el tamaño de la cabeza y el recuerdo. Los
ejemplos representan (a) una correlación positiva, (b) una correlación baja (casi cero) y (c) una
correlación negativa.
(adelante Recuerdo (b) Cabeza Recuerdo c) cabeza Recuerdo
Tema Tamaño (cm) (palabras) Tema Tamaño (cm) (palabras) Tema Tamaño (cm) (palabras)
1 50.8 17 1 50.8 23 1 50.8 12

2 63.5 21 2 63.5 12 2 63.5 9
3 45.7 dieciséis 3 45.7 13 3 45.7 13
4 25.4 11 4 25.4 21 4 25.4 23
5 29.2 9 5 29.2 9 5 29.2 21

6 49.5 15 6 49.5 14 6 49.5 dieciséis
7 38.1 13 7 38.1 dieciséis 7 38.1 14

8 30.5 12 8 30.5 15 8 30.5 17
9 35.6 14 9 35.6 11 9 35.6 15
10 58.4 23 10 58.4 dieciséis 10 58.4 11
r .93 r .07 r .89
59533_03_ch02_p024-050.indd 39 9533_03_ch02_p024-050.indd 39 3/4/08 /4/08

r = + .93 r = – 0,07 r = – .89
20
15
(palabras)
recordar
10
30 40 50 60 30 40 50 60 30 40 50 60
Tamaño de la cabeza Tamaño de la cabeza Tamaño de la cabeza (cm)
(cm) (a) (cm) (b) (C)

ÿ FIGURA 2.3
Representación gráfica de los datos de la tabla 2.2. Estos gráficos muestran el patrón
característico de (a) una correlación positiva alta, (b) una correlación esencialmente cero y (c)
una correlación negativa fuerte.
ordenada). La alta correlación positiva entre el tamaño de la cabeza y el número de palabras recordadas
en el panel (a) de la Tabla 2.2 se traduce en una representación visual que se inclina hacia arriba a la
derecha, mientras que la correlación negativa en (c) se representa con una pendiente hacia abajo. Correcto.
Así, puedes ver cómo conocer la puntuación de una persona en una variable ayuda a predecir (aunque no
perfectamente en estos casos) el nivel de desempeño en la otra. Entonces, conocer el tamaño de la cabeza
de una persona en los datos hipotéticos en (a) y (c) ayuda a predecir el recuerdo y viceversa. Esta es la
razón principal por la que las correlaciones son útiles: especifican la cantidad de relación y permiten hacer
predicciones. Esta última afirmación no se puede hacer sobre los datos en (b), donde hay esencialmente
una relación de correlación cero. Los puntos están dispersos y no hay una relación consistente, que es
justo lo que refleja una r de Pearson baja. Incluso en los casos en que el tamaño de la correlación sea
bastante grande, no será posible predecir perfectamente la puntuación de un individuo en una variable
dada su posición en la otra. Incluso con una alta correlación (0,93) entre el tamaño de la cabeza y el
número de palabras recordadas, es muy posible que una persona con un tamaño de cabeza grande
recuerde pocas palabras y viceversa. A menos que la correlación sea perfecta (1,00 o 1,00), la predicción
de una puntuación cuando se da la otra tampoco será perfecta.
¿Cuál crees que sería la correlación real entre el tamaño de la cabeza y el recuerdo para una muestra
aleatoria de la población en general? Aunque en realidad no hemos realizado un estudio de este tipo,
creemos que es bastante probable que sea positivo. Willerman y asociados (1991) realizaron una
investigación sobre un tema relacionado, la relación entre el tamaño del cerebro y la inteligencia, o CI.
Encontraron una correlación de 0,51 entre el tamaño del cerebro y el coeficiente intelectual en una muestra
de cuarenta estudiantes caucásicos diestros de introducción a la psicología. Los resultados de estudios
recientes sobre el volumen cerebral realizados por Haier y colaboradores (Haier, Jung, Yeo, Head & Alkire,
2004; Colom, Jung y Haier, 2006) demuestran que un mayor volumen de áreas cerebrales se correlaciona
positivamente con el coeficiente intelectual, y estas áreas se distribuyen por todo el cerebro. ¿Significan
los datos del tamaño del cerebro que el tamaño del cerebro provoca diferencias en la capacidad cognitiva?
En la siguiente sección, abordamos el tema de la correlación y la causalidad.
Interpretación de los coeficientes de correlación Siempre se da una advertencia importante

en cualquier discusión sobre la correlación: la existencia de incluso una correlación considerable
no implica nada acerca de la existencia de una relación causal entre las dos variables bajo análisis.
59533_03_ch02_p024-050.indd 40 9533_03_ch02_p024-050.indd 40 3/4/08 /4/08

consideración. La correlación no prueba la causalidad. Sobre la base de una sola correlación, no se
puede decir si el factor X causa el factor Y, el factor Y causa el factor X o algún tercer factor
subyacente causa ambos. Dejanos considerar algunos ejemplos. Supongamos que hemos
encontrado una correlación de 0,70 entre el tamaño de la cabeza y el recuerdo de palabras en los
niños. Esto está en general de acuerdo con nuestra teoría de que las cabezas más grandes
contienen más información, pero ciertamente hay otras interpretaciones de esta relación. Podría
argumentarse que la alta correlación positiva entre el tamaño de la cabeza y el recuerdo está
mediada o producida por algún tercer factor subyacente a ambos, como la edad. Sabemos que las
cabezas de los niños crecen a medida que envejecen y que la memoria también mejora con la edad.
Por lo tanto, la edad (o uno de sus correlatos) en realidad podría ser responsable de la gran
correlación positiva que hemos encontrado entre el tamaño de la cabeza y el número de palabras reco
En los estudios correlacionales, no podemos concluir que un factor produce o causa otro,
porque es probable que haya una serie de factores que varíen simultáneamente con el de interés.
En un experimento, intentamos evitar este problema manipulando directamente un factor mientras
mantenemos constantes todos los demás. Si logramos mantener constantes otros factores, lo cual
es muy difícil de hacer, entonces la infl uencia del factor manipulado en lo que sea que estemos
midiendo se puede atribuir directamente al factor de interés.
La confusión ocurre cuando dos (o más) factores varían al mismo tiempo, por lo que no podemos
saber si un factor, el otro factor o ambos, al operar juntos, producen algún efecto. La confusión es
inherente a la investigación correlacional y conduce a las dificultades de interpretación de dicha
investigación. En el ejemplo de la correlación entre el tamaño de la cabeza y el recuerdo, no
podemos decir que las variaciones en el tamaño de la cabeza produjeron o causaron diferencias en
el recuerdo, ya que el tamaño de la cabeza se confundió con al menos otro factor: la edad.
En otros casos, la relación entre dos factores puede parecer que permite una interpretación
causal, pero de nuevo esto no está estrictamente permitido. Algunos estudios han mostrado una
correlación positiva entre la cantidad de armas de fuego en un área geográfica y la cantidad de
asesinatos en esa área. Los defensores del control de armas podrían usar esta evidencia para
respaldar la afirmación de que un mayor número de armas conduce a (causa, produce) más
asesinatos, pero esta no es la única interpretación plausible. Las personas en vecindarios con un
alto índice de criminalidad podrían estar comprando pistolas para protegerse. Finalmente, un tercer
factor, como la clase socioeconómica, podría mediar en ambos. Podemos ver, por lo tanto, que
ninguna conclusión causal se justifica simplemente sobre la base de una correlación moderada o inclu
Debido a que las correlaciones se pueden calcular entre dos conjuntos de puntajes, incluso las
correlaciones muy altas pueden ser accidentales y no estar vinculadas entre sí en absoluto. Puede
haber una correlación muy alta entre la cantidad de predicadores y la cantidad de películas
pornográficas producidas cada año desde 1950, y ambas van en aumento. Se necesitaría una teoría
inusual para relacionar estos dos de una manera causal.
Se da mayor peso a un alto grado de correlación en los casos en los que las explicaciones
obvias que compiten entre sí (a partir de factores de confusión) parecen menos plausibles. Además,
se le da más peso a una alta correlación cuando hay evidencia convergente de varios estudios
independientes, se identifica un mecanismo subyacente y las consecuencias de la decisión son
grandes. La interpretación de la evidencia que vincula el tabaquismo con el cáncer de pulmón
proporciona un buen ejemplo de estos puntos. La evidencia temprana con respecto a este vínculo
fue correlacional; sin embargo, se llegó a la conclusión (a pesar de las protestas de los fabricantes
de cigarrillos) en el informe del Cirujano General de EE. UU. de 1964 de que era probable que los
cigarrillos produjeran o causaran cáncer. Esto finalmente condujo a advertencias en los paquetes
de cigarrillos y a la prohibición de anunciar cigarrillos en la televisión, entre otras cosas. La
correlación se tomó como indicativa de una relación causal, probablemente porque las hipótesis contra
59533_03_ch02_p024-050.indd 41 9533_03_ch02_p024-050.indd 41 3/4/08 /4/08

parecía inverosímil. Parece poco probable, por ejemplo, que tener cáncer de pulmón haga que uno
fume más cigarrillos (¿para calmar los pulmones?). Además, la correlación tabaquismo-cáncer se
demostró en una serie de estudios independientes (evidencia convergente), y las consecuencias
de declarar una relación causal entre los dos fueron grandes (prevención de muertes adicionales
por cáncer de pulmón). Finalmente, el mecanismo subyacente a la correlación entre fumar y el
cáncer era bastante obvio y sencillo (producción de células malignas a partir de la inhalación
prolongada de una sustancia nociva).
A pesar de todos estos argumentos, sigue existiendo la posibilidad de que algún tercer factor
subyacente (como la ansiedad) produzca la relación. De hecho, Eysenck y Eaves (1981) han
argumentado que la correlación entre el cáncer de pulmón y el tabaquismo en humanos se produce
por diferencias de personalidad. Ciertos tipos de personalidad, según Eysenck y Eaves, son más
propensos a fumar y también a desarrollar cáncer de pulmón. Por lo tanto, argumentan que la
correlación entre el tabaquismo y el cáncer no implica causalidad. Debido a que ahora se ha
establecido el vínculo entre fumar cigarrillos y el cáncer de pulmón mediante estudios experimentales
con animales no humanos, la mayoría de los científicos no están de acuerdo con la opinión de Eysenck
Como ejemplo final de las trampas del enfoque correlacional, considere la relación negativa
mencionada anteriormente entre fumar cigarrillos y las calificaciones. Fumar más se ha relacionado
con peores calificaciones. ¿Fumar causa peores calificaciones? Esto parece poco probable, y
ciertamente hay interpretaciones alternativas listas. Los estudiantes con malas notas pueden estar
más ansiosos y por lo tanto fumar más, o los estudiantes más sociables pueden fumar más y
estudiar menos, y así sucesivamente. Como ocurre con el método observacional, el método
correlacional es muy útil para sugerir posibles relaciones y dirigir investigaciones posteriores, pero
no es útil para establecer relaciones causales directas.
El método correlacional es superior al método de observación, porque el grado de relación
entre dos variables se puede establecer con precisión y, por lo tanto, se pueden hacer predicciones
sobre el valor (aproximado) de una variable si se conoce el valor de la otra.
Correlaciones bajas: una advertencia Si las correlaciones altas no pueden interpretarse

como evidencia de algún tipo de relación causal, uno podría pensar que al menos debería ser
posible descartar una relación causal entre dos variables si su correlación es muy baja, cercana a
cero. Si la correlación entre el tamaño de la cabeza y el recuerdo hubiera sido de 0,02, ¿habría
descartado nuestra teoría de que un mayor tamaño de la cabeza conduce a un mejor recuerdo? O
si la correlación entre el tabaquismo y el cáncer de pulmón hubiera sido de 0,08, ¿deberíamos
haber abandonado la idea de que están causalmente relacionados? La respuesta es a veces, bajo
ciertas condiciones. Otros factores pueden causar correlaciones bajas o nulas y pueden enmascarar
una relación real.
Un problema común es el de la restricción de rango. Para que se calcule un coeficiente de
correlación significativo, debe haber diferencias bastante grandes entre las puntuaciones de cada
una de las variables de interés; debe haber una cierta cantidad de dispersión o variabilidad en los
números. Si todos los tamaños de cabeza fueran iguales en los paneles de la Tabla 2.2 y las
puntuaciones de recuerdo variaran, la correlación entre los dos sería cero. (Puede resolverlo usted
mismo usando la Ecuación B.5 en el Apéndice B.) Si solo observáramos la correlación entre el
tamaño de la cabeza y el recuerdo en los estudiantes universitarios, podría ser bastante baja,
porque las diferencias en el tamaño de la cabeza y el recuerdo entre los estudiantes universitarios
podría no ser muy grande, en comparación con la población en general. Esto podría suceder
aunque podría haber una correlación positiva (o negativa) entre las dos variables si el tamaño de
la cabeza se muestreara en un rango más amplio. El problema del rango restringido puede producir
una baja correlación, incluso cuando existe una correlación real entre dos variables.
59533_03_ch02_p024-050.indd 42 9533_03_ch02_p024-050.indd 42 3/4/08 /4/08

El problema del rango restringido puede surgir en lugares inesperados. Considere el problema de predecir
el éxito en la universidad a partir de los puntajes del SAT I en una universidad con estándares de admisión
estrictos. Las puntuaciones de las subpruebas pueden oscilar entre 200 y 800, con un rendimiento medio
(promedio) ligeramente inferior a 500. Imagine que las puntuaciones medias en nuestra universidad hipotética
son 800 en cada subprueba. El oficial de admisiones calcula una correlación entre los puntajes combinados del
SAT y las calificaciones de los estudiantes de primer año y encuentra uno de .00. Su conclusión es que los
puntajes del SAT no deben usarse para predecir las calificaciones en la universidad. El problema, sin embargo,
es que los puntajes del SAT son de un rango muy restringido, específicamente todos iguales. Dado que las
personas con puntajes bajos no son admitidas en la universidad, el problema del rango restringido probablemente
sea un factor aquí, o en cualquier situación que involucre una muestra limitada de participantes con características
Este ejemplo, en el que todos los puntajes de una variable son iguales, es obviamente ficticio. Veamos un
ejemplo real. Bridgeman, McCamley-Jenkins y Ervin (2000) observaron la correlación entre los puntajes del SAT
I y las calificaciones de los estudiantes de primer año, tanto colectiva como individualmente, en veintitrés
universidades. Cuando ajustaron los puntajes para las restricciones en el rango, encontraron que los puntajes
promedio más altos del SAT I predijeron las calificaciones de los estudiantes de primer año algo mejor que los
puntajes promedio más bajos del SAT I. La razón de este resultado es difícil de determinar, pero podría deberse
al hecho de que las calificaciones reciben mayor énfasis en las escuelas más selectivas.
Debido a que los psicólogos a menudo usan poblaciones homogéneas, como estudiantes universitarios, los
problemas de rango restringido deben considerarse cuidadosamente al interpretar las correlaciones.
Un problema final en la interpretación de correlaciones bajas es que uno debe estar seguro de que se han
cumplido los supuestos subyacentes al uso de un coeficiente de correlación particular.
De lo contrario, su uso puede ser inapropiado y dar lugar a estimaciones de relación falsamente bajas. Estos no
se han discutido aquí, pero es imperativo verificar estos supuestos en un libro de estadística antes de emplear
Pearson r o cualquier otro coeficiente de correlación. Por ejemplo, una suposición que subyace en la r de
Pearson es que la relación entre las dos variables es lineal (se puede describir con una línea recta) en lugar de
curvilínea, como en la relación hipotética (pero plausible) de la figura 2.4 entre la edad y la memoria a largo
plazo. . A edades muy tempranas, la línea es plana; luego aumenta entre
ÿ FIGURA 2.4
18
Una figura hipotética que
dieciséis
representa una relación curvilínea
14 entre la memoria a largo plazo y la
edad. Aunque la memoria se
12 relaciona con la edad de forma
sistemática y se podría predecir el
10 recuerdo conociendo la edad, la r de
Pearson sería bastante baja, ya que la r
(recuerdo
palabras)
Memoria
de
10 20 30 40 50 60 70 80
Años de edad)
59533_03_ch02_p024-050.indd 43 9533_03_ch02_p024-050.indd 43 3/4/08 /4/08

a los tres y dieciséis años, donde vuelve a estabilizarse hasta la mediana edad, donde desciende
ligeramente, hasta la vejez, donde disminuye a un ritmo mayor (Howard & Wiggs, 1993).
Por lo tanto, se puede predecir bastante bien el recuerdo de palabras de la edad de una persona, pero
la r de Pearson será bastante baja, ya que la relación entre las dos variables no es lineal. Por supuesto,
esto siempre se puede verificar trazando un diagrama de dispersión, como en la figura 2.4. Entonces,
es posible que las correlaciones bajas no reflejen que no existe una relación, sino solo que no se han
cumplido los supuestos del coeficiente particular empleado.
Procedimientos correlacionales complejos
“La violencia mediática representa una amenaza para la salud pública en la medida en que conduce a
un aumento de la violencia y la agresión en el mundo real” (Huesmann & Taylor, 2006, p. 393). ¿Cómo
determinamos si ver medios violentos provoca un comportamiento agresivo? Eron y asociados (1972)
midieron las preferencias de los niños por los programas de televisión violentos y la agresividad de los
niños según la calificación de sus compañeros. Para estos alumnos de tercer grado, Eron y sus
compañeros de trabajo encontraron una correlación
niños que
positiva
eranmoderada,
más agresivos
r .21,tendían
lo que indica
a ver televisión
que los
más violenta (y los niños menos agresivos tendían a ver programas menos violentos). ¿Cómo debemos
interpretar esta correlación positiva? ¿Podemos decir que ver programas violentos provoca agresividad?
La respuesta es no. Para ver por qué este es el caso, todo lo que tenemos que hacer es dar la vuelta
a nuestra declaración causal y afirmar que ser agresivo provoca una preferencia por la televisión
violenta. No tenemos una forma razonable de decidir sobre la dirección de la causalidad, basándonos
en este único coeficiente de correlación. Las declaraciones causales son difíciles, si no imposibles, de
hacer sobre la base de un solo estudio correlacional. En cambio, los investigadores suelen ver la
evidencia correlacional como tentativa hasta que haya evidencia convergente de estudios independientes
y se identifique un mecanismo subyacente convincente.
El poder explicativo de la investigación correlacional puede mejorarse examinando patrones de
correlaciones. Una técnica es el llamado procedimiento de correlación de panel cruzado , y Eron y
sus colaboradores la usaron en un estudio de seguimiento de diez años de los mismos niños en el
"treceavo" grado, así como en un proyecto reciente que examinó la agresión en niños. adultos que
fueron entrevistados inicialmente a mediados de la década de 1970 (Huesmann et al., 2003).
Los diseños de los dos estudios se resumen en los dos paneles de la Figura 2.5.
La lógica del procedimiento cruzado es que las correlaciones a lo largo de las diagonales nos
ayudarán a comprender la dirección de causalidad entre las variables. ¿Las personas agresivas ven
televisión violenta o ver televisión violenta produce agresión? Si ver televisión violenta produce un
comportamiento agresivo, esperaríamos una relación pequeña o nula entre la agresión temprana y la
preferencia posterior por la televisión violenta (las diagonales punteadas) y una correlación positiva
entre una preferencia temprana por la televisión violenta y la agresión posterior (las líneas gruesas y
sólidas). diagonal). La suposición subyacente es que si una variable causa la otra, la primera (ver
programas de televisión violentos) debería estar más fuertemente relacionada con la segunda
(agresividad) más adelante en el tiempo que cuando la segunda variable (efecto) se mide al mismo
tiempo. como primera causa. Las correlaciones restantes son de interés y pueden permitir predicciones,
pero adolecen de la incapacidad para determinar la causalidad. En el proyecto de 1972 se estudiaron
211 machos. Tanto hombres (152) como mujeres (176) proporcionaron datos para el informe de 2003.
Para el estudio de 1972, la correlación entre la preferencia por la televisión violenta y la agresión fue
esencialmente cero (r -0,05) en el decimotercer grado. Asimismo, encontraron una relación insignificante
entre la preferencia por la TV violenta en tercero y decimotercer grado (r .05). Sí obtuvieron una relación
entre la agresividad en los dos grados.
59533_03_ch02_p024-050.indd 44 9533_03_ch02_p024-050.indd 44 3/4/08 /4/08

Preferencia por Preferencia por
Televisión violenta en TV violenta en el
el tercer grado decimotercer grado
r = +.21
agresión en agresión en el
el tercer grado decimotercer grado
(a)
Preferencia por Preferencia por

Televisión violenta en Televisión violenta en
Infancia Edad adulta
r = +.18 para hombres

r = +.28 para mujeres
agresión en agresión en
Infancia Edad adulta
(b)
ÿ FIGURA 2.5
(a) El diseño de correlación de panel cruzado utilizado por Eron et al. (1972), quienes examinaron las
correlaciones entre la preferencia por los programas de televisión violentos y la agresión calificada por
los compañeros. Las diagonales indican correlaciones cruzadas importantes. La correlación discontinua
debe ser pequeña, se espera que la sólida sea positiva y grande. (b) El diseño utilizado por Huesmann
et al. (2003). La preferencia por los programas de televisión violentos se correlacionó con la agresión.
Los participantes fueron examinados por primera vez entre los seis y los diez años y luego unos quince
años más tarde. La agresión de adultos se midió por incidentes autoinformados, calificaciones de otra
persona (incluidos los cónyuges) y registros de arrestos. La medida de la agresión es una medida
compuesta que incluye tanto la violencia física como la agresión verbal.
(r .38), indicando que es un rasgo algo estable. La correlación cruzada entre la

agresividad en el tercer grado y la preferencia por la televisión violenta en el
decimotercero fue muy pequeña
entre ver(rtelevisión
.01). Por violenta
otro lado,y la
agresión
correlación
en elcruzada
decimotercer
crucial
grado fue positiva y estadísticamente significativa, r .31. Resultados similares
aparecieron en el informe de 2003.
La importante correlación cruzada entre ver televisión violenta en la infancia y la
agresión adulta fue positiva y significativa tanto para hombres (r .21) como para mujeres.
59533_03_ch02_p024-050.indd 45 9533_03_ch02_p024-050.indd 45 3/4/08 /4/08

(r .19). La correlación cruzada entre la agresión infantil y la televisión para adultos
la visualización de violencia fue pequeña para .08) y hembras (r .10).
ambos hombres (r Las correlaciones de panel cruzado en estos estudios, junto con otros
análisis complejos, llevaron a Eron y sus colegas a concluir que la exposición infantil a la televisión
violenta aumenta la agresión posterior (ver también Eron, 1982; y Huesmann et al., 1973). Por
supuesto, muchos otros factores contribuyen a la agresividad; este es solo un ejemplo de cómo las
correlaciones de panel cruzado pueden ayudar a llegar a una explicación de la investigación
correlacional. Sin embargo, las declaraciones causales no pueden ser tan fuertes como los que
provienen de experimentos, porque las variables no han sido manipuladas por el investigador, sin
embargo, se pueden producir aumentos a corto plazo en el comportamiento agresivo viendo videos
violentos y jugando videojuegos violentos (para una revisión, ver Bushman & Huesmann, 2006 ).
Entonces, la estrategia general del procedimiento de retardo cruzado es obtener varias

correlaciones a lo largo del tiempo y, sobre la base del tamaño y la dirección de las rs, determinar
qué conduce a qué. La técnica cruzada tiene el inconveniente obvio de que el proyecto de
investigación puede llevar mucho tiempo. No obstante, este método para tratar de determinar la
causalidad se ha utilizado con cierto éxito en varias áreas problemáticas.
Considere el trabajo de Corrigan y asociados (1994) sobre el agotamiento de los miembros del
personal en un hospital psiquiátrico. En trabajos anteriores, habían mostrado una correlación positiva
significativa entre la ansiedad y el agotamiento, pero notaron correctamente que esta correlación no
indicaba la dirección de la relación: ¿los trabajadores ansiosos tienen más probabilidades de
agotarse o el agotamiento de los trabajadores conduce a la ansiedad? Para tratar de responder a
esto, utilizaron el procedimiento de retraso cruzado, obteniendo mediciones de ansiedad y varios
componentes de agotamiento con ocho meses de diferencia. Las correlaciones cruzadas indicaron
que el agotamiento resultó en que los trabajadores estuvieran más ansiosos, y no al revés. Para
estos mismos trabajadores, otras medidas sometidas al procedimiento cruzado indicaron que
algunos de los efectos del agotamiento podrían atribuirse a la falta de apoyo colegiado.
Además de las correlaciones de panel cruzado, se utilizan varios otros procedimientos
estadísticos para tratar de obtener una mejor comprensión de la causalidad en la investigación correlacio
Algunos de estos incluyen correlación parcial, análisis de regresión múltiple y análisis de ruta. Estas
otras técnicas también implican un examen de varias relaciones, no solo de una sola correlación, y
se describen en numerosos textos (ver especialmente Cook y Campbell, 1979).
Causa: una nota
Le hemos advertido repetidamente sobre la conclusión incorrecta de que una correlación significa
causalidad. La causalidad es un tema controvertido en la ciencia y la filosofía, y ahora consideraremos
algunos de los temas. Debido a la influencia de algunos filósofos de la ciencia, se ha vuelto impopular
entre los científicos contemporáneos usar el término causa, porque las implicaciones filosóficas se
vuelven terriblemente complicadas. Pensar demasiado en la causa de incluso un evento muy simple
conduce a una regresión infinita de las causas de ese evento.
Por esta y otras razones, el término causa ha dejado de usarse en algunos círculos. En este libro
nos equivocamos en el uso del término causa, ya que su significado es siempre limitado; los
experimentos conducen a inferencias causales porque un factor varía mientras que todos los demás,
en el caso ideal, se mantienen constantes. Por lo tanto, podemos decir que cualquier efecto que
ocurra en tales casos ha sido causado por el factor que varió.
59533_03_ch02_p024-050.indd 46 9533_03_ch02_p024-050.indd 46 3/4/08 /4/08

Un punto más interesante es que muchos factores que varían experimentalmente son en sí
mismos conjuntos bastante complicados de eventos independientes, cualquiera de los cuales podría
ser la causa de un efecto experimental. El tiempo es un buen ejemplo de tal variable. Si estamos
interesados en los efectos de la cantidad de tiempo que una persona estudia una comunicación
persuasiva sobre la cantidad de cambios de actitud de la persona hacia la comunicación, variamos la
cantidad de tiempo que la gente dedica a estudiar el mensaje. Supongamos que encontramos un
aumento en el cambio de actitud con aumentos en el tiempo de estudio cuando otros factores se
mantienen constantes. ¿Podemos decir que el tiempo ha provocado un incremento en el cambio de
actitud? En cierto sentido, esto es cierto, pero en un sentido más fundamental, no lo es.
Presumiblemente, es algún proceso psicológico, que actúa a lo largo del tiempo, lo que provoca el
cambio de actitud. Es algo relacionado con el tiempo pero no con el tiempo mismo, porque el tiempo
no es un agente causal. Si dejamos una bicicleta bajo la lluvia y se oxida, no decimos que el tiempo
causó la oxidación; los procesos químicos que actúan a lo largo del tiempo lo causaron.
Una variable manipulada generalmente se compone de varias partes complejas e interactivas,
cualquiera de las cuales o un conjunto de ellas puede causar algún efecto. Por esta razón, a veces se
dice que los experimentos son solo correlaciones controladas, ya que la variable manipulada en
realidad se compone de varias partes confundidas. Esta es ciertamente una caracterización precisa
en al menos algunos casos; aun así, estamos muy por delante de tener una correlación simple, porque
conocemos la dirección del efecto. Tome el ejemplo de cómo la cantidad de tiempo dedicado a
estudiar una comunicación persuasiva afecta el cambio de actitud. Podríamos simplemente dar el
mensaje a varias personas y dejar que lo leyeran todo el tiempo que quisieran. Podríamos cronometrar
esto para cada persona y luego ver cuánto cambió la actitud de la persona. Si encontramos una
correlación positiva, no sabríamos si el tiempo que las personas dedicaron a estudiar el pasaje
provocó un mayor cambio de actitud o si cuanto más las personas decidieron cambiar sus actitudes,
más estudiaron el pasaje para asegurarse de que conocían los hechos. También hay otras posibles
razones para la relación. Al menos en el experimento sobre el tiempo de estudio, nosotros, como
investigadores, podemos manipular la variable del tiempo de estudio (en lugar de dejarla a discreción
de nuestros sujetos) y mantener constantes otros factores; por lo tanto, podemos decir que más
tiempo de estudio conduce a (determina, produce, provoca) más cambio de actitud. Debido a la
naturaleza compleja de una variable como el tiempo de estudio, no podemos estar absolutamente
seguros de que el tiempo de estudio per se sea el factor causal. Por ejemplo, puede ser que las
personas a las que se les permitió más tiempo para estudiar la comunicación persuasiva se
involucraron más en el experimento, y es esta diferencia en la participación personal la que produce
el cambio de actitud.
Dado que el verdadero factor causal (participación personal) puede estar incrustado dentro de la
variable manipulada (tiempo de estudio), debemos considerar esa posibilidad cuidadosamente al
realizar experimentos. No obstante, la ventaja de los experimentos sobre los estudios correlacionales
reside en que conocemos la dirección de la relación entre dos variables. Los experimentos también
nos informan (lo que no hace una correlación) de que el factor causal está al menos incrustado en la
variable independiente y no en algún tercer factor extraño. Es en este sentido que los experimentos
nos hablan de las causas.
Antes de pasar al próximo capítulo, concluyamos esta discusión señalando que no existe una
sola técnica de investigación que sea generalmente superior a todas las demás. La clave para realizar
una buena investigación es elegir la técnica que mejor se adapte a la hipótesis que se está probando.
Si la hipótesis se centra en el comportamiento tal como ocurre de forma natural (ya sea la actividad
de acicalamiento de los primates en la jungla o el grafiti escrito por los humanos en los baños
públicos), entonces la observación naturalista sería más apropiada.
59533_03_ch02_p024-050.indd 47 9533_03_ch02_p024-050.indd 47 3/4/08 /4/08

que un experimento altamente controlado. Por el contrario, si la hipótesis puede
investigarse razonablemente realizando un estudio correlacional o un experimento, un
experimento proporcionaría una prueba más concluyente de la hipótesis por todas las
razones que hemos discutido en este capítulo. Pasamos a esta importante herramienta
científica, el experimento, en el próximo capítulo.
ÿ RESUMEN
1. Gran parte de la ciencia se preocupa por la observación cuidadosa. correlacionada con la distancia de ubicación desde el ecuador.
vación y estudio del mundo natural. Dos técnicas básicas Existen varias medidas de correlación, pero la más utilizada por
discutidas en este capítulo son la observación naturalista y el los psicólogos es el coeficiente de correlación producto-momento
enfoque correlacional. Ambos son métodos científi cos útiles, de Pearson:
pero no permiten declaraciones sobre qué factores causan qué. ciente, o Pearson r.
6. El enfoque correlacional permite establecer la cantidad de relación
efectos Son muy útiles en las primeras etapas de exploración de entre dos variables, lo cual es útil para la predicción. Sin embargo,
un tema y en el estudio de temas que no pueden ser estudiados su principal inconveniente es que no puede establecer la dirección
de manera práctica o ética por medios experimentales.
de relación Incluso si dos variables, X e Y, están fuertemente
2. Después de delimitar el rango de eventos que se van a estudiar, relacionadas, no podemos decir si la relación es accidental, X
la observación naturalista normalmente implica la observación causó Y, Y causó X, o algún tercer factor causó ambos.
discreta (no reactiva) o la medición discreta de los eventos que
ocurren naturalmente en el medio ambiente. De mayor utilidad 7. En los estudios correlacionales, una serie de factores suelen variar
para los psicólogos son dos variantes reactivas de la observación juntos, por lo que los resultados se confunden.
naturalista: caso Pero la investigación correlacional es bastante apropiada en
estudios y encuestas. Sin embargo, estos métodos de observación situaciones en las que es imposible realizar experimentos, por
tienen la desventaja de no permitir afirmaciones sobre cómo se ejemplo, en el estudio de condiciones relacionadas con disturbios
relacionan los factores entre sí. raciales.
otro. 8. Cuando los investigadores descubren que la correlación
3. La investigación relacional intenta mostrar cómo se relacionan las entre dos medidas es cercano a cero, a menudo concluirán que
variables entre sí. La investigación relacional es no hay relación entre la
normalmente ex post facto en el sentido de que las variables no medidas. Antes de llegar a tal conclusión, aunque a menudo sea
se manipulan, sino que se miden. correcta, los investigadores deben determinar si se han cumplido
4. La investigación de contingencia trata de determinar si el valor de los supuestos que subyacen al uso de la medida correlacional.
una variable depende del valor de otra. Una pregunta típica podría uno común
ser tratar de determinar si la elección de un programa principal el problema es la restricción del rango, o la falta de variación en
está relacionada con el género de una persona. Una prueba la distribución de un conjunto de puntajes. si todo el
estadística utilizada para determinar si dos variables son medidas de una variable son casi iguales, el coeficiente de
independientes es la prueba de independencia. correlación se aproximará a cero, incluso si existe una verdadera
relación entre las medidas cuando
5. El enfoque correlacional permite enunciados de relación, de qué se toma una muestra más amplia de puntajes.
va con qué. Las correlaciones pueden variar de 1,00 a 1,00, 9. Muchas investigaciones intentan introducir una medida de control
donde la magnitud del número reflejasigno
la fuerza
indica
delaladirección.
relación y el en los estudios correlacionales para determinar mejor
relaciones de causa y efecto. En algunos casos, las técnicas
estadísticas, como el procedimiento correlacional cruzado, se
Por ejemplo, la altura se correlaciona positivamente con el peso pueden utilizar para tratar de determinar las causas en los
y la temperatura media anual se correlaciona negativamente. estudios correlacionales.
59533_03_ch02_p024-050.indd 48 9533_03_ch02_p024-050.indd 48 3/4/08 /4/08

ÿ TÉRMINOS CLAVE
antropomorfizando observación naturalista

caso de estudio correlación negativa
causa observación del participante
confuso Coeficiente de correlación producto-momento de Pearson, o r de
investigación de contingencia Pearson
coeficiente de correlación correlacion positiva
investigacion correlacional reactividad
técnica correlacional investigacion relacional
procedimiento de correlación de panel cruzado restricción de rango
delimitando las observaciones encuesta
análisis de casos desviados medidas discretas
etograma observaciones discretas
etología variable
2
investigación ex post facto prueba de independencia
1. Imagina que eres un investigador que acaba de comenzar un se vería si uno estuviera allí. Dado que muy pocas mujeres
estudio sobre cómo las madres interactúan con sus bebés. fumaban en 1930, también parecía mejor relacionar las tasas
Quiere hacerse una idea de la frecuencia (1) de la realización de tabaquismo con las muertes de hombres. La tabla es una
por parte de la madre de algún acto con respecto al bebé que adaptación de los importantes resultados de Doll.
es relativamente independiente de las necesidades inmediatas (a) Examine los resultados. ¿Qué significan las dos columnas?
del bebé, (2) de las diversas formas en que el bebé actúa de números parecen mostrar?
cuando la madre no está presente. atendiendo a él, y (3) de las (b) Trace una gráfica que relacione las dos medidas, como la
acciones de la madre y el niño cuando están interactuando. Haz que se muestra en la figura 2.3. ¿Que muestra?
una lista de todos los comportamientos que crees que pueden
ocurrir con una frecuencia relativamente grande en las tres
categorías. Este sería un tipo de etograma, como se discutió en
este capítulo. Si observara a las madres y los bebés durante Resultados de la muñeca
cinco horas al día durante un período de semanas, ¿qué tipo de

conclusiones podría sacar? ¿Qué tipo de información le gustaría Cigarrillo de 1930 1950 Muertes
País Consumo por millón*
saber pero no podría obtener de este tipo?
Australia 480 180
Canada 500 150
de la observación naturalista? Dinamarca 380 170

Finlandia 1,100 350
2. Doll (1955) publicó una de las primeras pruebas que relacionaban
Gran Bretaña 1,100 460
el cáncer de pulmón con el tabaquismo. Tabuló el número medio Holanda 490 240
de cigarrillos consumidos por la población de once países en Islandia 230 60
1930 y el número de muertes por cáncer de pulmón entre los Noruega 250 90
hombres en 1950. La medida de las muertes se tomó veinte Suecia 300 110
Suiza 510 250
años después de la medida del consumo de cigarrillos, ya que
Unido 1,300 200
parece natural que tomaría años para una relación de causa y estados
efecto a
*De cáncer de pulmón.
59533_03_ch02_p024-050.indd 49 9533_03_ch02_p024-050.indd 49 3/4/08 /4/08

(c) Ahora calcule la relación exacta entre las dos relación y efecto? Si cree que estos datos no argumentan
variables usando la fórmula para Pearson r dada en que fumar causa cáncer de pulmón, ¿de qué otra manera
el Apéndice B. ¿Cuál es la magnitud exacta y el podría explicar los resultados?
signo del coeficiente de correlación que ha obtenido? 4. Haz una lista de pares de variables que crees que están
altamente correlacionadas (ya sea positiva o
3. ¿Los análisis que realizó en la Pregunta 2(c) permiten la negativamente) pero entre las cuales crees que hay
conclusión de que fumar causa cáncer de pulmón? Si el pocas posibilidades de una conexión causal. ¿Cómo
coeficiente de correlación fuera más alto, digamos, 0,95, podría determinar si la correlación indica una causa y
¿estaría más seguro de la causa? relación de efectos?
CONEXIONES WEB
Explore la presentación paso a paso de "Enfoques no experimentales para la investigación: el método de la
encuesta" en el Centro de recursos de psicología de Wadsworth,
Actividades de Estadística y Métodos de Investigación en:
http://academic.cengage.com/psychology/workshops
ÿ RECURSO DE LABORATORIO
Los capítulos 1 y 2 del manual de Langston analizan la observación naturalista y la investigación por sondeo,
respectivamente. La investigación de observación naturalista se refiere a los seres humanos que defienden los
espacios de estacionamiento, y la investigación de encuestas se enfoca en la inflación de calificaciones en la universidad.
El manual de Langston (2002) analiza la investigación relacional en el Capítulo 3. Los principales
La cuestión examinada por Langston es la relación entre la tenencia de mascotas y la salud.
Langston, W. (2002). manual de laboratorio de metodos de investigacion para psicologia. Pacífico
Grove, CA: Grupo Wadsworth.
59533_03_ch02_p024-050.indd 50 9533_03_ch02_p024-050.indd 50 3/4/08 /4/08

CAPÍTULO 3
INVESTIGAR
TÉCNICAS:
EXPERIMENTOS
¿QUÉ ES UN EXPERIMENTO?
Ventajas de los experimentos

Por qué se realizan los experimentos
VARIABLES Variables independientes
Variables dependientes Variables

de control Nombre de las variables
Más de una variable independiente
Más de una variable dependiente
DISEÑOS EXPERIMENTALES Diseños

entre sujetos Diseños dentro de los sujetos
Diseños de n pequeña Diseños mixtos
Condiciones de control Dificultades
Cuasi-Experimentos
DEL PROBLEMA AL EXPERIMENTO: LAS TUERCAS Y TORNILLOS

Realización de un experimento
DATOS
Obtención de datos
Análisis de datos
Informe de datos
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB 51
59533_04_ch03_p051-081.indd 51 9533_04_ch03_p051-081.indd 51 28/03/08 /28/08

Nadie cree en una hipótesis excepto su autor, pero todos creen en un
experimento excepto el experimentador. (BEBIDA WIB)
Imagina que eres un estudiante en una clase de psicología ambiental y has recibido la
siguiente tarea: ve a la biblioteca y “defiende” una mesa evitando que alguien más se siente
tanto tiempo como puedas. Debe usar solo medios no verbales y no violentos para lograr esto.
Para llevar a cabo esta tarea, puede esperar en la biblioteca abarrotada hasta que una mesa
esté vacía, sentarse rápidamente y proceder a esparcir sus libros, ropa y otras pertenencias por
toda la mesa con la esperanza de que este desorden pueda mantener alejados a los demás.
Después de algún tiempo, digamos, quince minutos más o menos, alguien finalmente se sienta
en su mesa y termina su tarea. ¿Has realizado un experimento?
Antes de responder a esta pregunta, esbocemos los principales criterios para un
experimento, que se discutieron brevemente en los capítulos anteriores. Un experimento ocurre
cuando el entorno se manipula sistemáticamente para que se pueda observar el efecto causal
de esta manipulación en algún comportamiento. Los aspectos del entorno que no son de interés
y, por lo tanto, no se manipulan, se mantienen constantes para no influir en el resultado del
experimento. Entonces podemos concluir que el comportamiento resultó de la manipulación.
Debemos explicar dos términos especiales que se introdujeron brevemente en el capítulo 1
(variables independientes y dependientes ) para describir cómo se manipula el entorno y cómo
se observa el comportamiento.
ÿ ¿QUÉ ES UN EXPERIMENTO?
Muchos estudiantes se sorprenden al descubrir que las acciones descritas en nuestro ejercicio
de la mesa de la biblioteca no constituyen un experimento. Todos los experimentos requieren al
menos estas dos características especiales, las variables independientes y dependientes que
acabamos de mencionar. La variable dependiente es la medida de respuesta de un experimento
que depende del sujeto. En este caso, el tiempo que transcurre hasta que alguien más se sienta
a la mesa es la variable dependiente o medida de respuesta. La variable independiente es
una manipulación del entorno controlada por el experimentador: en este caso, es el esparcimiento
de artículos sobre la mesa.
Pero un experimento debe tener al menos dos valores, o niveles, del entorno.
Estos niveles pueden diferir en un sentido cuantitativo (artículos esparcidos por solo una parte
de la mesa versus artículos esparcidos por toda la mesa), o los niveles pueden reflejar una
diferencia cualitativa (la persona que defiende la mesa asume una expresión amistosa e invitante
como opuesta a una expresión severa y amenazante). El punto es que al menos dos condiciones
deben compararse entre sí para determinar si la variable independiente (porción de la mesa
cubierta o expresión facial) produce un cambio en un comportamiento o resultado.
A veces, estos dos niveles pueden ser simplemente la presencia o ausencia de una
manipulación. El ejemplo de la biblioteca no cumple con este criterio, ya que involucra solo un
nivel de la variable independiente.
¿Cómo podríamos cambiar el procedimiento para obtener un experimento? La forma más
sencilla sería volver a sentarse, esta vez sin desparramar nada. Entonces nuestro independiente
59533_04_ch03_p051-081.indd 52 9533_04_ch03_p051-081.indd 52 28/03/08 /28/08

La variable tendría los dos niveles necesarios: la mesa con elementos esparcidos y la mesa desnuda
sin elementos esparcidos. Ahora tenemos algo para comparar con la primera condición.
Este experimento tiene tres resultados posibles: (1) Tirar artículos sobre la mesa da como
resultado un tiempo más largo antes de que otra persona invada la mesa; (2) el tiempo hasta la
invasión es el mismo, estén o no esparcidos los artículos; y (3) la dispersión de artículos da como
resultado un tiempo más corto hasta la invasión. Sin el segundo nivel de la variable independiente (la
tabla sin artículos esparcidos), estos tres resultados no pueden formularse. De hecho, es imposible
decir nada acerca de cuán efectivos son los artículos esparcidos para defender las tablas de la
biblioteca hasta que se prueban dos niveles de la variable independiente.
Cuando este experimento de biblioteca se realiza correctamente, se obtiene el primer resultado
posible. Una mesa puede estar mejor protegida por una persona más artículos variados que por una
persona sola.
Podemos ver, entonces, que los experimentos deben tener al menos variables independientes
y dependientes. Las técnicas de investigación discutidas en el capítulo anterior no permiten ni
requieren la manipulación del entorno; pero antes de que se pueda establecer un experimento , se
necesitan variables independientes con al menos dos niveles.
Ventajas de los experimentos

La principal ventaja de los experimentos sobre las técnicas discutidas en el Capítulo 2 es un mejor
control de la variación extraña. En el experimento ideal, no se permite que ningún factor (variable),
excepto el que se está estudiando, influya en el resultado; en la jerga de la psicología experimental,
decimos que estos otros factores están controlados. Si, como en el experimento ideal, todos los
factores excepto uno (el que está bajo investigación) se mantienen constantes, podemos concluir
lógicamente que cualquier diferencia en el resultado debe ser causada por la manipulación de esa
variable independiente. A medida que cambian los niveles de la variable independiente, las diferencias
resultantes en la variable dependiente pueden ocurrir solo porque la variable independiente ha
cambiado. En otras palabras, los cambios en la variable independiente provocan los cambios
observados en la variable dependiente. En el ejemplo de la biblioteca, podríamos querer manipular la
expresión facial de la persona que “defienda” la mesa. Para controlar la variación extraña, tendríamos
que considerar detenidamente otros factores que podrían comprometer nuestra capacidad para hacer
afirmaciones sobre la causalidad. En este caso, podríamos querer contratar a un solo asistente para
defender la mesa durante el tiempo que dure el experimento o bien establecer objetivamente que
nuestros asistentes son, por ejemplo, igualmente atractivos. También podríamos decidir controlar el
género ya sea incorporándolo como una variable independiente adicional o usando solo asistentes
de investigación femeninos (o masculinos).
Diseñar experimentos de modo que solo pueda haber una explicación de los resultados es el corazón
del método experimental. Mientras que las técnicas de investigación no experimentales se limitan a
afirmaciones sobre descripción y correlación, los experimentos permiten afirmaciones sobre
causalidad, es decir, la variable independiente A (expresión facial) hace que cambie la variable B
(tiempo transcurrido hasta que otra persona se sienta). En este experimento, esperaríamos que el
tiempo transcurrido fuera más corto cuando el asistente asume una expresión amistosa e invitante
que cuando la expresión del asistente es severa y amenazante.
Así, en principio, los experimentos conducen a afirmaciones sobre causalidad. En la práctica,
estas afirmaciones no siempre son ciertas. Ningún experimento tiene un 100 por ciento de éxito en
eliminar o mantener constantes todas las demás fuentes de variación excepto la que se está estudiando
59533_04_ch03_p051-081.indd 53 9533_04_ch03_p051-081.indd 53 28/03/08 /28/08

Sin embargo, los experimentos eliminan más variaciones extrañas que otras técnicas de investigación.
Más adelante en este capítulo, discutiremos formas específicas en las que los experimentos limitan la
variación extraña.
Otra ventaja de los experimentos es la economía. El uso de la técnica de la observación naturalista
requiere que el científico espere pacientemente hasta que ocurran las condiciones de interés. Si vivieras
en Trondheim, Noruega, cerca del Círculo Polar Ártico, y quisieras estudiar cómo el calor afecta la
agresión, depender del sol para producir altas temperaturas requeriría mucha paciencia y mucho tiempo.
El experimentador controla la situación creando las condiciones de interés (varios niveles de calor en
un entorno de laboratorio), obteniendo así datos de manera rápida y eficiente.
Por qué se realizan los experimentos
Las mismas razones generales que se aplican a la realización de cualquier investigación también
explican por qué los psicólogos realizan experimentos. En la investigación básica, los experimentos se
realizan para probar teorías y proporcionar una base de datos para explicaciones del comportamiento.
Este tipo de experimentos suelen estar bien planificados y el investigador tiene una idea clara del
resultado previsto. Los llamados experimentos críticos intentan enfrentar dos teorías que hacen
predicciones diferentes. Un resultado favorece la teoría A; la otra, la teoría B. Así, en principio, el
experimento determinará qué teoría rechazar y cuál mantener. En la práctica, estos experimentos
críticos no funcionan tan bien, porque los partidarios de la teoría rechazada son ingeniosos al idear
explicaciones para desacreditar la interpretación desfavorable del experimento. Un ejemplo de tal
explicación se encuentra en un estudio sobre cómo olvida la gente. Dos explicaciones principales del
olvido son que (1) los elementos se desvanecen o se desvanecen con el tiempo, de la misma manera
que una bombilla incandescente se desvanece cuando se apaga la electricidad (esta explicación se
llama "decaimiento de rastros") o que (2) los elementos nunca se desvanecen , pero debido a esto,
interfieren entre sí, causando confusión. Un experimento crítico simple variaría el tiempo entre la
introducción en la memoria de elementos sucesivos, manteniendo constante el número de elementos
(Waugh & Norman, 1965). La memoria debería ser peor con tiempos más largos, según los teóricos del
decaimiento de trazas, porque hay más tiempo para que los elementos se desvanezcan. Pero debido a
que la cantidad de elementos sigue siendo la misma independientemente del momento en que se
introduzcan, la teoría de la interferencia no predice diferencias en el olvido. Cuando se realiza este
experimento, no hay diferencia en la memoria; esto parecería anular la explicación de la descomposición
de las huellas. Sin embargo, la réplica de los teóricos del deterioro de las huellas es que el tiempo
adicional que se otorga entre los elementos permite a las personas ensayar, es decir, repetir el elemento
para sí mismos, lo que evita el olvido.
Con menos frecuencia, los investigadores realizan un experimento en ausencia de una teoría
convincente solo para ver qué sucede; podemos llamar a esto un experimento hipotético. Los
estudiantes suelen idear experimentos hipotéticos, ya que estos experimentos no requieren
conocimientos teóricos ni de la base de datos existente y pueden formularse sobre la base de la
experiencia personal y las observaciones. Algunos científicos desaprueban los experimentos hipotéticos;
la principal objeción a ellos es su ineficiencia. Si, como suele ser el caso, no ocurre gran cosa en un
experimento hipotético (por ejemplo, la variable independiente no tiene ningún efecto), no se gana nada
con el experimento. Por el contrario, si no sucede gran cosa en un experimento cuidadoso para el cual
una teoría predice que algo sucederá, el hallazgo de que no hay diferencia puede ser útil. Debemos
admitir que hemos intentado experimentos hipotéticos. La mayoría de ellos no funcionaron, pero fueron
divertidos. Nuestro consejo es que consulte con su instructor antes de intentar una prueba hipotética.
59533_04_ch03_p051-081.indd 54 9533_04_ch03_p051-081.indd 54 28/03/08 /28/08

experimento. Él o ella probablemente pueda darle una estimación de las probabilidades de que se le ocurra algo o
incluso puede conocer los resultados de un experimento similar que ya se haya realizado.
Esto nos lleva a la última razón importante para hacer experimentos en investigación básica, que es repetir o
replicar un hallazgo anterior. Un solo experimento por sí mismo es mucho menos convincente que una serie de
experimentos relacionados. La replicación más simple es la repetición directa de un experimento existente, sin
cambios en los procedimientos. Las réplicas directas son especialmente útiles cuando el experimento original era
bastante novedoso. Por lo general, sin embargo, una mejor manera de replicar es extender el procedimiento anterior
agregando algo nuevo y conservando algo antiguo. Así, parte de la replicación es una repetición literal, pero la parte
novedosa se suma al conocimiento científi co. Este tipo de repetición demuestra la generalidad de un resultado al
mostrar cómo se mantiene (o no) sobre diferentes variables independientes. El concepto de replicación y sus diversas
formas se analizan con más detalle en el Capítulo 11.
ÿ VARIABLES
Las variables son los engranajes y ruedas dentadas que hacen funcionar los experimentos. La selección y
manipulación eficaz de las variables marcan la diferencia entre un buen experimento y uno deficiente.
Esta sección cubre los tres tipos de variables que deben considerarse cuidadosamente antes de comenzar un
experimento: variables independientes, dependientes y de control. Concluimos discutiendo experimentos que tienen
más de una variable independiente o dependiente.
Variables independientes
En los experimentos verdaderos, las variables independientes son aquellas manipuladas por el experimentador.
El brillo de una luz, el volumen de un tono, la temperatura de una habitación, el número de gránulos de comida que
se dan a una rata, todas son variables independientes, ya que el experimentador determina su calidad y cantidad. Las
variables independientes se seleccionan porque un experimentador cree que provocarán cambios en el
comportamiento. Aumentar la intensidad de un tono debería aumentar la velocidad con la que las personas responden
al tono. Aumentar la cantidad de gránulos que se le da a una rata por presionar una barra debería aumentar la
cantidad de veces que se presiona la barra. Cuando un cambio en el nivel (cantidad) de una variable independiente
provoca un cambio en el comportamiento, decimos que el comportamiento está bajo el control de la variable
independiente.
El fracaso de una variable independiente para controlar el comportamiento, a menudo llamado resultados nulos,
puede tener más de una interpretación. Primero, el experimentador puede haber adivinado correctamente que la
variable independiente era importante: los resultados nulos pueden ser correctos.
La mayoría de los científicos aceptarán esta interpretación de mala gana, por lo que las siguientes explicaciones
alternativas de resultados nulos son comunes. Es posible que el experimentador no haya creado una manipulación
válida de la variable independiente. Supongamos que está realizando un experimento con niños de segundo grado y
su variable independiente es la cantidad de dulces pequeños (M&M, gominolas) que obtienen después de cada
respuesta correcta.
Algunos niños reciben solo uno, mientras que otros obtienen dos. No encuentras ninguna diferencia en el
comportamiento. Sin embargo, si su variable independiente hubiera involucrado un rango mayor, es decir, de una
golosina a diez golosinas, tal vez hubiera obtenido un
59533_04_ch03_p051-081.indd 55 9533_04_ch03_p051-081.indd 55 28/03/08 /28/08

diferencia. Su manipulación podría no haber sido suficiente para revelar un efecto de la variable
independiente. O tal vez, sin que usted lo sepa, los niños celebraron una fiesta de cumpleaños justo
antes de que comenzara el experimento y sus barriguitas se llenaron de helado y pastel. En este
caso, tal vez incluso diez dulces no mostrarían ningún efecto. Por eso, en los estudios de aprendizaje
animal con comida como recompensa, los animales son privados de comida antes de que comience
el experimento.
Podemos ver que los experimentadores deben tener cuidado de producir una fuerte
manipulación de la variable independiente. No hacerlo es una causa común de resultados nulos.
Debido a que no hay forma de determinar si la manipulación falló o si los resultados nulos son
correctos, los experimentadores no pueden llegar a ninguna conclusión sobre el efecto de la variable
independiente en la variable dependiente. Otras causas comunes de resultados nulos están
relacionadas con las variables dependientes y de control, a las que nos dirigimos ahora.
Variables dependientes
La variable dependiente es la medida de respuesta de un experimento que depende de la respuesta

del sujeto a nuestra manipulación del entorno. En otras palabras, el comportamiento del sujeto es
observado y registrado por el experimentador y depende de la variable independiente. El tiempo
transcurrido antes de que un sujeto se siente en una mesa defendida por un asistente de
investigación, la velocidad de un gusano que se arrastra por un laberinto, el número de veces que
una rata presiona una barra, todas son variables dependientes, porque dependen de la forma en
que el experimentador manipula el entorno. En el ejemplo de la biblioteca, podríamos predecir que
un sujeto sería más reacio a sentarse en una mesa defendida por un asistente que muestra una
expresión amenazadora que si el asistente adopta una expresión agradable. En este caso, el
comportamiento del sujeto depende de la expresión que le indiquemos al asistente que adopte. El
tiempo que transcurre hasta que el sujeto se sienta a la mesa es la variable dependiente de interés.
Un criterio para una buena variable dependiente es la estabilidad. Cuando un experimento se

repite exactamente (mismo sujeto, mismos niveles de variable independiente, etc.), la variable
dependiente debería arrojar la misma puntuación que antes. La inestabilidad puede ocurrir debido
a algún déficit en la forma en que medimos alguna variable dependiente. Supongamos que
deseamos medir el peso en gramos de un objeto, por ejemplo, una vela, antes y después de que se
encienda durante 15 minutos. Usamos una escala que funciona haciendo que un resorte mueva un
puntero. El resorte se contrae cuando hace frío y se expande cuando hace calor. Siempre que
nuestras medidas de peso se tomen a temperaturas constantes, serán confiables. Pero si la
temperatura varía mientras se pesan los objetos, el mismo objeto arrojará lecturas diferentes.
Nuestra variable dependiente carece de estabilidad.
Los resultados nulos a menudo pueden ser causados por insuficiencias en la variable
dependiente, incluso si es estable. La causa más común es un rango restringido o limitado de la
variable dependiente, de modo que se “atasca” en la parte superior o inferior de su escala. Imagine
que le está enseñando a un amigo bastante descoordinado a jugar a los bolos por primera vez.
Dado que usted sabe por psicología introductoria que la recompensa mejora el desempeño, le
ofrece invitar a su amigo a una cerveza cada vez que él o ella recibe una huelga. Tu amigo tiene
todas las bolas de canal, por lo que bebes la cerveza tú mismo. Por lo tanto, ya no puedes ofrecer
una recompensa; por lo tanto, espera una disminución en el rendimiento. Pero dado que es
imposible hacerlo peor que todas las bolas de canal, no se puede observar ningún decremento. Tu
amigo ya está en la parte inferior de la escala. Esto se llama efecto suelo. El problema opuesto, obtene
59533_04_ch03_p051-081.indd 56 9533_04_ch03_p051-081.indd 56 28/03/08 /28/08

llamado efecto techo. Los efectos techo y suelo (véase el Capítulo 10) impiden que la infl uencia de una
variable independiente se refleje con precisión en una variable dependiente.
Variables de control
Una variable de control es una variable independiente potencial que se mantiene constante durante un
experimento porque está controlada por el experimentador. Para cualquier experimento, la lista de variables
de control relevantes es bastante grande, mucho más grande de lo que se puede lograr en la práctica. Incluso
en un experimento relativamente simple, por ejemplo, que requiera que las personas memoricen sílabas de
tres letras, se deben controlar muchas variables. La hora del día cambia su eficiencia; idealmente, esto
debería ser controlado. La temperatura podría ser importante, porque podría quedarse dormido si la sala de
pruebas estuviera demasiado caliente. El tiempo transcurrido desde la última comida también podría afectar
el rendimiento de la memoria. La inteligencia también está relacionada. La lista podría ampliarse. En la
práctica, un experimentador trata de controlar tantas variables destacadas como sea posible, con la esperanza
de que el efecto de los factores no controlados sea pequeño en relación con el efecto de la variable
independiente. Aunque siempre es importante ejercer un control estricto sobre los factores extraños, es aún
más crítico cuando la variable independiente produce un efecto pequeño sobre la variable dependiente.
Mantener una variable constante no es la única forma de eliminar la variación extraña. Las técnicas
estadísticas (discutidas más adelante en el capítulo) también controlan variables extrañas. Sin embargo,
mantener una variable constante es la técnica experimental más directa para controlar factores extraños, por
lo que limitamos nuestra definición de variables de control solo a esta técnica. Los resultados nulos a menudo
ocurren en un experimento porque no hay suficiente control de estos otros factores, es decir, se ha dejado
que varíen sistemáticamente con la variable independiente. Dependiendo de la relación entre una variable
extraña y una variable independiente, esta variación no controlada puede oscurecer o inflar el efecto de la
variable independiente sobre la variable dependiente de interés. El problema de la variación extraña ocurre
más a menudo en estudios que se llevan a cabo fuera de los laboratorios, donde la capacidad de mantener
constantes las variables de control se reduce considerablemente.
La variable INDEPENDIENTE es MANIPULADA

La variable DEPENDIENTE se OBSERVA
La variable CONTROL se mantiene CONSTANTE
Nombra las variables
Debido a que comprender las variables independientes, dependientes y de control es tan importante, hemos
incluido algunos ejemplos para su uso al verificar su comprensión. Para cada situación, nombre los tres tipos
de variables. Las respuestas siguen los ejemplos.
¡Sin espiar!
1. Un fabricante de automóviles quiere saber qué tan brillantes deben ser las luces de freno para minimizar
el tiempo requerido para que el conductor de un automóvil que lo sigue se dé cuenta de que el automóvil de
adelante se está deteniendo. Se lleva a cabo un experimento para responder a esto. Nombra las variables.
59533_04_ch03_p051-081.indd 57 9533_04_ch03_p051-081.indd 57 28/03/08 /28/08

2. Una paloma está entrenada para picotear una llave si se enciende una luz verde, pero no si se enciende una
luz roja. Los picoteos correctos se recompensan con el acceso al grano. Nombra las variables.
3. Un terapeuta trata de mejorar la imagen que el paciente tiene de sí mismo. Cada vez que el paciente dice
algo positivo sobre sí mismo, el terapeuta lo recompensa asintiendo, sonriendo y siendo muy atento. Nombra
las variables.
4. Un psicólogo social hace un experimento para descubrir si los hombres o las mujeres dan calificaciones más
bajas de incomodidad cuando seis personas se amontonan en una cabina telefónica.
Nombra las variables.
RESPUESTAS
1. Variable independiente (manipulada): Intensidad (brillo) de las luces de freno
Variable dependiente (observada): Tiempo desde el inicio de las luces de freno

hasta que se pisa el pedal del freno por parte
del conductor que sigue
Variables de control (constantes): Color de las luces de freno, forma del pedal
de freno, fuerza necesaria para pisar el
pedal de freno, iluminación externa, etc.
2. Variable independiente: Variable Color de la luz (rojo o verde)

dependiente: Variables de Número de pulsaciones de teclas
control: Horas de privación de alimentos, tamaño de
llave, intensidad de luces rojas y verdes, etc.
3. Variable independiente: En realidad, esto no es un experimento,
porque solo hay un nivel de la variable
independiente. Para hacer de esto un
experimento, necesitamos otro nivel; por ejemplo,
recompensar las afirmaciones positivas sobre la
suegra del paciente e ignorar las negativas.
Entonces la variable independiente sería: Tipo de
declaración recompensada.
Variable dependiente: Número (o frecuencia) de declaraciones

Variables de control: Ambiente de oficina, terapeuta
4. Variable independiente: Variable Sexo del participante1
dependiente: Variables de Calificación de la incomodidad
control: Tamaño de la cabina telefónica, número de
personas (seis) hacinadas en la cabina, tamaño
de las personas, etc.
1 El género es un tipo especial de variable independiente llamada variable sujeto, que se analiza más adelante en este capítulo.
Más de una variable independiente

Es inusual encontrar un experimento informado en una revista psicológica en el que solo se
usa una variable independiente (manipulada); el experimento típico manipula de dos a cuatro
variables independientes simultáneamente. Este procedimiento tiene varias ventajas.
Primero, a menudo es más eficiente realizar un experimento con, digamos, tres
59533_04_ch03_p051-081.indd 58 9533_04_ch03_p051-081.indd 58 28/03/08 /28/08

variables que realizar tres experimentos separados. En segundo lugar, el control experimental suele ser
mejor, ya que con un solo experimento, es más probable que algunas variables de control (hora del día,
temperatura, humedad, etc.) se mantengan constantes que con tres experimentos separados. Tercero, y
más importante, es que los resultados generalizados, es decir, que se muestra que son válidos en varias
situaciones, en varias variables independientes son más valiosos que los datos que aún no se han
generalizado. Así como es importante establecer la generalidad de los resultados a través de diferentes
tipos de sujetos experimentales (ver el Capítulo 12), los experimentadores también necesitan descubrir si
algún resultado es válido a través de niveles de variables independientes. Cuarto, esto nos permite estudiar
interacciones, las relaciones entre variables independientes. Ilustramos estas ventajas con algunos
ejemplos.
Digamos que deseamos averiguar cuál de los dos tipos de recompensas facilita el aprendizaje de la
geometría por parte de los estudiantes de secundaria. La primera recompensa es un pago directo en
efectivo por los problemas resueltos correctamente; la segunda recompensa es la salida anticipada de la
clase, es decir, cada solución correcta da derecho al alumno a salir de la clase cinco minutos antes.
Suponga que los resultados de este experimento (hipotético) muestran que el despido temprano es la
mejor recompensa. Antes de convertir la salida temprana en una regla universal en la escuela secundaria,
primero debemos establecer su generalidad comparando los dos tipos de recompensa en otras clases,
como historia o biología. Aquí, la materia de la clase sería una segunda variable independiente. Sería mejor
poner estas dos variables en un solo experimento que realizar dos experimentos sucesivos.
Esto evitaría problemas de control, como que una clase sea evaluada la semana del gran partido de fútbol
(cuando ninguna recompensa mejorará el aprendizaje) y la otra clase será evaluada la semana después
de que se gane el partido (cuando los estudiantes se sientan mejor acerca del aprendizaje).
Cuando los efectos producidos por una variable independiente son diferentes en cada nivel de una
segunda variable independiente, tenemos una interacción. La búsqueda de interacciones es una de las
principales razones para utilizar más de una variable independiente por experimento. Esto se puede
demostrar mejor con un ejemplo.
En un informe de investigación titulado “When God Sanctions Killing”, Bushman, Ridge, Da, Key y
Busath (2007) describieron un estudio de laboratorio sobre la agresión. Los participantes leyeron un pasaje
violento que supuestamente provenía de la Biblia o de un pergamino antiguo. Después de eso, realizaron
una tarea adicional que les permitió presentar sonidos fuertes a otro sujeto en el experimento. Controlaron
la intensidad de este sonido, y se interpretó que las intensidades más altas revelaban una mayor agresión.
La variable dependiente fue el número de veces que los participantes seleccionaron los niveles de ruido
más altos en un conjunto de 25 ensayos. Por lo tanto, las puntuaciones de agresión pueden oscilar entre
un mínimo de 0 y un máximo de 25.
Había dos variables independientes. El primero fue la fuente del pasaje violento: la Biblia o un
pergamino antiguo. La segunda variable independiente fue si el sujeto creía o no en Dios; este es un tipo
especial de variable independiente, llamada variable sujeto, que se analiza más adelante en este capítulo.
Los resultados de este experimento se muestran en la Figura 3.1, con cada variable independiente
representada por sí misma. Leer un pasaje de la Biblia produjo mayor agresión.
Los sujetos que creían en Dios también actuaron de forma más agresiva.
La figura 3.2 muestra que esta simple interpretación de los resultados, aunque correcta, es incompleta.
Aquí ambas variables independientes se trazan en el mismo gráfico, lo que hace que algunas relaciones
sean más fáciles de ver. Si no se menciona a Dios porque el pasaje proviene de un pergamino antiguo, los
sujetos que creen en Dios y los sujetos que no creen en Dios exhibieron niveles similares de agresión.
Pero cuando Dios sancionó la violencia porque el pasaje provenía de la Biblia, los sujetos que creen en
Dios exhibieron mayores niveles de agresión.
59533_04_ch03_p051-081.indd 59 9533_04_ch03_p051-081.indd 59 28/03/08 /28/08

10 10
5 5
Agresión
0 0
Biblia Desplazarse Sí No
Fuente Creencia en Dios y la Biblia

ÿ FIGURA 3.1
Efectos de dos variables independientes sobre la agresión. (Datos de Bushman et al.,

2007. Reimpreso con permiso de Blackwell Publishing).
59533_04_ch03_p051-081.indd 60 9533_04_ch03_p051-081.indd 60 28/03/08 /28/08

Recuerde, una interacción entre dos variables independientes indica que los efectos
producidos por una variable independiente (creencia en Dios) no son los mismos en cada nivel
de una segunda variable independiente (fuente del pasaje). Cuando el pasaje no menciona a
Dios, la creencia en Dios no tiene efecto sobre la agresión. Pero cuando el pasaje proviene de la
Biblia, el aumento de la agresión es mayor para los sujetos que creen en Dios que para los
sujetos que no creen en Dios. Esta es una interacción.
La Figura 3.3 muestra datos hipotéticos que inventamos para ilustrar cómo se verían estos
resultados si no hubiera interacción. El efecto de una variable independiente es el mismo en cada
nivel de la otra variable independiente. Las líneas de puntos en la Figura 3.3 son paralelas, lo
cual es una manera fácil de detectar la falta de una interacción. Si se dibujaran líneas similares
en la figura 3.2., no serían paralelas porque esa figura muestra una interacción de dos variables
independientes.
Muchos experimentos incluyen dos o más variables independientes; esto significa que los
resultados pueden contener una interacción. Debido a la frecuencia con la que es probable que
encuentre interacciones, presentamos otro ejemplo de un experimento de dos variables para
ayudarlo a practicar la interpretación de los resultados de experimentos complejos.
En el experimento sobre holgazanería social (ver Capítulo 1) de Brickner, Harkins y Ostrom
(1986), los autores querían determinar el efecto de la participación personal en una tarea sobre
la cantidad de holgazanería social mostrada en esa tarea. Brickner y sus asociados notaron que
las tareas de baja participación, como aplaudir y generar usos para un cuchillo, se habían utilizado
en investigaciones anteriores sobre la holgazanería social. Los autores razonaron que el esfuerzo
dedicado a una tarea debe estar relacionado con la importancia intrínseca o significado personal
que la tarea tiene para el individuo. La alta participación personal en una tarea debería reducir la
holgazanería social, porque los individuos deberían esforzarse mucho en tales tareas,
independientemente de si se supervisa su desempeño individual. Entonces, los investigadores
variaron la participación de los sujetos en la tarea y también variaron la cantidad de esfuerzo
individual que se podía evaluar. Si su razonamiento era correcto, debería haber una interacción:
la baja participación debería conducir a la holgazanería social (esfuerzo reducido cuando el
esfuerzo del individuo no puede evaluarse), pero la alta participación debería conducir a
aproximadamente la misma cantidad de esfuerzo, ya sea esfuerzo individual o no. podría ser identif
Dios sancionó la violencia
10 Sin mención de Dios
Agresión
5
0
Sí No
Creer en dios
ÿ FIGURA 3.3
Datos hipotéticos sin interacción. Tenga en cuenta las líneas paralelas.
59533_04_ch03_p051-081.indd 61 9533_04_ch03_p051-081.indd 61 28/03/08 /28/08

Brickner y asociados hicieron que los estudiantes universitarios generaran tantas ideas como
pudieran en un período de 12 minutos sobre una propuesta para implementar los exámenes integrales
de último año, que un estudiante tendría que aprobar para poder graduarse. En la condición de alta
participación, se les hizo creer a los estudiantes que la propuesta sería instituida en su universidad
antes de su graduación.
Por lo tanto, la adición de exámenes integrales como requisito previo para la graduación debe
tener una gran relevancia personal. En la condición de baja participación personal, se hizo creer a los
estudiantes que los exámenes se instituirían más tarde, en otra universidad.
La posible identificación del esfuerzo individual también fue manipulada por instrucciones.
Los sujetos escribieron cada uno de sus pensamientos sobre comprensivos en una hoja de papel
individual. En la condición de baja identificabilidad, se les dijo a los sujetos que sus pensamientos se
recopilarían junto con los de otros sujetos, porque el comité que evaluó los pensamientos quería
evaluar el rango de opiniones del grupo como un todo. En la condición de alta identificabilidad, se les
dijo a los sujetos que sus opiniones serían consideradas por separado de las de los demás, porque el
comité a cargo quería evaluar las respuestas individuales.
En resumen, la variable dependiente fue el número de pensamientos generados en las cuatro

condiciones: baja identificabilidad y baja implicación; baja identificabilidad y alta implicación; alta
identificabilidad y baja implicación; y alta identificabilidad y alta implicación.
Los resultados se muestran en la Figura 3.4, que traza el número de pensamientos generados
contra la identificabilidad para las dos condiciones de participación. La investigación anterior de
holgazanería social se replica en la condición de baja participación: se generaron menos pensamientos cua
10
Alto envolvimiento
9
pensamientos
Número
medio
de
7
Baja participación
Bajo Alto
identificabilidad
ÿ FIGURA 3.4
Resultados del experimento de Brickner, Harkins y Ostrom (1986), mostrando una

interacción. La holgazanería social (un número bajo de pensamientos generados con una
capacidad de identificación baja en lugar de alta) ocurre con una tarea de baja participación pero
no con una de alta participación.
59533_04_ch03_p051-081.indd 62 9533_04_ch03_p051-081.indd 62 28/03/08 /28/08

los sujetos creían que su desempeño individual no estaba siendo evaluado. Ahora examine los
resultados cuando hubo una gran participación: el número de pensamientos fue aproximadamente el
mismo, independientemente de la capacidad de identificación. Así, las variables interactúan: los
efectos de la identificabilidad dependen del nivel de participación en la tarea. Dicho de otro modo, la
holgazanería social y, por lo tanto, la difusión de la responsabilidad, es menos probable que ocurra
cuando una persona se enfrenta a una tarea que le involucra personalmente que cuando la tarea no
tiene mucho interés intrínseco.
En resumen, se produce una interacción cuando los niveles de una variable independiente se
ven afectados de forma diferente por los niveles de otras variables independientes. Cuando existen
interacciones, no tiene sentido discutir los efectos de cada variable independiente por separado.
Debido a que los efectos de una variable también dependen de los niveles de las otras variables, nos
vemos obligados a discutir las variables que interactúan juntas.
Más de una variable dependiente

La variable dependiente (observada) se utiliza como índice de comportamiento. Indica qué tan bien
o mal se está desempeñando el sujeto. Permite al experimentador calificar el comportamiento. El
experimentador debe decidir qué aspectos del comportamiento son relevantes para el experimento
en cuestión. Aunque tradicionalmente se han utilizado algunas variables, esto no significa que sean
los únicos, ni siquiera los mejores, índices de comportamiento. Tomemos, por ejemplo, el
comportamiento de una rata presionando una barra o una paloma picoteando una tecla, respuestas
que se utilizan en estudios de aprendizaje animal. La variable dependiente más común es el número
de pulsaciones o picoteos observados. Pero la fuerza con la que se pulsa una tecla también puede
conducir a hallazgos interesantes (ver Neuringer 2002, p. 680; Notterman y Mintz, 1965), al igual que
la latencia (el tiempo que se tarda en responder).
Los investigadores generalmente pueden encontrar varias variables dependientes que pueden ser
apropiadas. Digamos que deseamos estudiar la legibilidad del tipo de letra que está leyendo ahora.
No podemos observar la "legibilidad", por supuesto. ¿Qué variables dependientes podríamos
observar? Estos son algunos que se han utilizado en el pasado: retención de información significativa
después de leer un texto, tiempo necesario para leer una cantidad fija de palabras, cantidad de
errores al reconocer letras individuales, velocidad al transcribir o volver a escribir texto, frecuencia
cardíaca durante la lectura , y tensión muscular durante la lectura, y esta lista está lejos de ser
exhaustiva.
Razones de economía abogan por obtener tantas medidas dependientes al mismo tiempo como
sea factible. A pesar de esto, el experimento típico usa solo una, o como mucho, dos variables
dependientes simultáneamente. Esto es desafortunado: así como la generalidad de un experimento
se expande al tener más de una variable independiente, también se expande con varias variables
dependientes. La razón por la que no se usan más variables dependientes es probablemente porque
es estadísticamente difícil analizar varias variables dependientes a la vez. Aunque las modernas
técnicas informáticas hacen que los cálculos sean bastante factibles, muchos psicólogos
experimentales no han sido bien entrenados en estos procedimientos estadísticos multivariados y,
por lo tanto, dudan en utilizarlos.
Se podrían realizar análisis separados para cada variable dependiente por sí misma, pero esto pierde
información de la misma manera que un análisis separado de las variables independientes ignora las
interacciones. El análisis multivariado es complejo; sin embargo, debe tener en cuenta que a menudo
es ventajoso usar más de una variable dependiente en un experimento.
59533_04_ch03_p051-081.indd 63 9533_04_ch03_p051-081.indd 63 28/03/08 /28/08

ÿ DISEÑOS EXPERIMENTALES
El propósito del diseño experimental es minimizar la variación extraña o no controlada, aumentando

así la probabilidad de que un experimento produzca resultados válidos y consistentes. Se han escrito
libros enteros sobre diseño experimental. Aquí, cubrimos una muestra de algunas técnicas comunes
utilizadas para mejorar el diseño de experimentos.
Una de las primeras decisiones de diseño que debe tomar un experimentador es cómo asignar
sujetos a los distintos niveles de variables independientes. Las dos posibilidades principales son
asignar solo algunas materias a cada nivel o asignar cada materia a todos los niveles. La primera
posibilidad se denomina diseño entre sujetos y la segunda, diseño intrasujetos. La diferencia se
puede mostrar con un ejemplo simple. Treinta estudiantes de introducción a la psicología se han
inscrito en un experimento que usted está realizando para evaluar la capacidad de recordar palabras
sin sentido. Tu variable independiente es el número de veces que dirás cada elemento: una vez o
cinco veces. Espera que un elemento presentado cinco veces se aprenda mejor que un elemento
presentado solo una vez. El diseño entre asignaturas requiere que divida sus asignaturas por la
mitad, es decir, en dos grupos de 15 estudiantes cada uno, con un grupo que recibe cinco
repeticiones y el otro, una repetición. (Cómo seleccionar qué sujetos poner en cada grupo se analiza
en breve). El diseño dentro de los sujetos tiene los 30 sujetos aprendiendo con ambos niveles de la
variable independiente, es decir, cada uno se prueba con una repetición y nuevamente con cinco
repeticiones. (Cómo determinar el orden en el que cada sujeto recibe estos dos tratamientos también
se analiza más adelante). ¿Qué diseño debe usar?
Diseños entre sujetos

El diseño entre sujetos (dos grupos) es conservador. No hay posibilidad de que un tratamiento
continúe contaminando al otro, porque cada persona recibe solo un tratamiento (una repetición o
cinco repeticiones, pero no ambas). Sin embargo, un inconveniente es que el diseño entre sujetos
debe tratar con diferencias entre personas, y esto disminuye su eficiencia, es decir, su capacidad
para detectar diferencias reales entre una y cinco repeticiones de los elementos de memoria.
En cualquier diseño entre sujetos, el experimentador debe tratar de minimizar las diferencias
entre los sujetos en los dos o más grupos de tratamiento. Claramente, si tomamos los cinco mejores
memorizadores y los colocamos deliberadamente en el grupo de una repetición, y colocamos a los
cinco peores en el grupo de cinco repeticiones, podríamos terminar sin diferencias en los resultados,
incluso, quizás, con el grupo de una repetición lo hizo mejor. Para evitar este resultado, el
experimentador debe asegurarse de que ambos grupos sean equivalentes al comienzo del experimento.
Grupos equivalentes Una forma de garantizar la equivalencia sería administrar una prueba
de memoria a los 30 sujetos antes de que comenzara el experimento regular, para obtener una
medida de referencia de la capacidad de los sujetos para memorizar palabras sin sentido. Las
puntuaciones de referencia de los sujetos podrían usarse para formar parejas de sujetos que tuvieran
puntuaciones iguales o muy similares. Un miembro de cada par se asignaría aleatoriamente a un
grupo y el otro miembro al segundo grupo. Esta técnica se llama coincidencia. Una dificultad con el
emparejamiento es que un experimentador no puede emparejar sujetos en todas las características
posibles. Así, siempre existe la posibilidad de que los grupos, aunque emparejados en
59533_04_ch03_p051-081.indd 64 9533_04_ch03_p051-081.indd 64 28/03/08 /28/08

alguna(s) característica(s), difiere(n) en alguna otra característica que puede ser relevante (la
concordancia se analiza con mayor detalle más adelante en este capítulo).
Una técnica más común utilizada para garantizar que se formen grupos equivalentes es la
aleatorización. La aleatorización significa que cada persona que participa en un experimento tiene las
mismas posibilidades de ser asignada a cualquier grupo en particular. En nuestro experimento de
repetición, una forma de formar dos grupos por aleatorización sería sacar nombres de un sombrero. O
podríamos pedirle a cada persona que dé un paso adelante y luego tire un dado. Los lanzamientos pares
se asignarían a un grupo y los lanzamientos impares al otro. Si no tuviéramos ningún dado, se podría
usar una tabla de números aleatorios para generar dígitos pares e impares. Este método de asignación
de sujetos a condiciones experimentales no tiene sesgos, ya que ignora todas las características de los
sujetos; esperamos que los grupos así creados sean equivalentes en todas y cada una de las dimensiones
relevantes. Sin embargo, la aleatorización no garantiza que los grupos sean siempre iguales. Por
casualidad, se podría asignar un mayor número de mejores memorizadores a uno de los grupos. Las
probabilidades de que esto ocurra pueden calcularse mediante los métodos de la teoría de la probabilidad
aplicados a las estadísticas (ver Apéndice B). Esta es una de las razones por las que los diseños
experimentales y las estadísticas a menudo se tratan como el mismo tema.
Sin embargo, el diseño se ocupa de la lógica de organizar los experimentos, mientras que la estadística
se ocupa del cálculo de posibilidades, probabilidades y otras cantidades matemáticas.
Si estamos seguros de que se han tratado todas las dimensiones relevantes, es preferible el
emparejamiento a la aleatorización. Pero como rara vez estamos seguros, la aleatorización se usa con
más frecuencia.
Diseños intrasujetos
Muchos psicólogos experimentales preferirían el diseño dentro de los sujetos (un grupo) en el que los 30
sujetos fueran evaluados con una repetición y nuevamente con cinco repeticiones (o viceversa). Es más
eficiente, ya que cada sujeto se compara consigo mismo. Cualquier diferencia resultante de una versus
cinco repeticiones no puede ser el resultado de diferencias entre las personas en los dos grupos, como
podría ser el caso del diseño entre sujetos.
Efectos de la práctica general Existe un riesgo, sin embargo, en el diseño más eficiente dentro
de los sujetos. Imagine que los 30 sujetos primero aprenden una gran cantidad de elementos con cinco
repeticiones y luego aprenden con una repetición. Cuando los sujetos comienzan el tratamiento de una
repetición, es posible que se hayan vuelto más competentes en el aprendizaje de palabras sin sentido,
o que experimenten algo de aburrimiento o fatiga con la tarea. Ambas posibilidades se denominan
efectos de la práctica general. Por lo general, se supone que estos efectos son los mismos para todas
las condiciones de tratamiento, por lo que no importa si los sujetos aprendieron con una repetición
seguida de cinco repeticiones o cinco seguidas de una repetición. Debido a que los efectos de la práctica
general son los mismos para todas las condiciones de tratamiento, se pueden controlar en gran medida
mediante el contrapeso. Con el contrapeso, el experimentador se enfrenta a la dificultad de determinar
el orden en que se deben dar los tratamientos a los sujetos. Nuevamente, una solución es utilizar la
aleatorización sacando los títulos de los tratamientos de un sombrero, usando una tabla de números
aleatorios o usando una computadora para ordenar las condiciones al azar. La lógica detrás de esto se
discutió anteriormente. Sin embargo, aunque los tratamientos de contrapeso a través de la aleatorización
producen órdenes equivalentes a largo plazo, es menos probable que sean adecuados cuando solo hay
una pequeña cantidad de tratamientos. En la mayoría
59533_04_ch03_p051-081.indd 65 9533_04_ch03_p051-081.indd 65 28/03/08 /28/08

En los experimentos, el número de sujetos excede el número de tratamientos, por lo que la
aleatorización es una buena técnica para asignar sujetos a los tratamientos.
El contrapeso completo asegura que se utilicen todas las órdenes de tratamiento posibles.
En el experimento de repetición, esto es fácil porque solo hay dos órdenes: una y cinco repeticiones,
cinco y una repeticiones. La mitad de los sujetos recibiría una repetición seguida de cinco repeticiones
y la otra mitad recibiría el orden inverso. A medida que aumenta el número de tratamientos, el número
de pedidos se vuelve realmente grande. Tres tratamientos tienen 6 órdenes diferentes; cuatro
tratamientos tienen 24 órdenes diferentes; cinco tratamientos tienen 120 órdenes diferentes; y así. A
medida que aumentan los niveles de una variable independiente, el contrapeso completo pronto se
vuelve poco práctico.
El contrapeso no elimina los efectos del orden. Permite a los experimentadores evaluar posibles
efectos de orden. Si tales efectos están presentes, y especialmente si forman interacciones con otras
variables independientes más importantes, se deben tomar medidas para corregir el diseño. El
experimentador puede decidir repetir el experimento, utilizando un diseño entre sujetos para evitar
efectos de orden. Alternativamente, el experimento original podría volver a analizarse como uno entre
sujetos, examinando el comportamiento solo en la condición inicial experimentada por cada sujeto.
Efectos diferenciales de arrastre Los efectos diferenciales de arrastre plantean un problema

más serio que los efectos de la práctica general. En el caso de efectos diferenciales de arrastre,
el efecto de la primera parte del experimento en la última parte del experimento varía según el
tratamiento que se realice primero. Imagine que los 30 sujetos primero aprenden elementos con
cinco repeticiones y luego aprenden con una repetición. Como resultado de su experiencia anterior
con cinco repeticiones, podrían decidir repetirse a sí mismos cuatro veces más el elemento que solo
se presentó una vez. Esto destruiría cualquier diferencia entre los dos niveles de la variable
independiente. Este es un ejemplo de un efecto de arrastre diferencial dado que el efecto del primer
tratamiento sobre el segundo tratamiento difiere según el tratamiento que se produjo primero. Este
no fue el caso con los efectos de la práctica general en los que los sujetos abordaron el segundo
tratamiento de la misma manera (es decir, con mayor habilidad, aburrimiento o fatiga),
independientemente del tratamiento que recibieron en la primera fase del experimento.
Los efectos de arrastre diferenciales se pueden disminuir un poco mediante el contrapeso, pero el
contrapeso no puede eliminar estos efectos por completo. Si hay razones para esperar efectos de
arrastre diferenciales, podemos hacer una de dos cosas además del contrapeso: usar el diseño entre
sujetos o construir un retraso de tiempo suficiente entre los dos tratamientos. Debido a que el diseño
entre sujetos es menos eficiente, requerirá que se prueben muchos más sujetos; pero esto es
preferible a realizar un experimento gravemente defectuoso. Si decidimos insertar un retraso de
tiempo entre los dos tratamientos, debemos identificar una duración de tiempo que sea suficiente
para eliminar la posibilidad de efectos de arrastre diferenciales.
Diseños de n pequeña
Antes de pasar a una discusión sobre diseños mixtos, nos gustaría mencionar una variante del
diseño tradicional dentro de los sujetos: el diseño de n pequeña . Los diseños de n pequeña
presentan los niveles de la variable independiente o los tratamientos a un pequeño número de
sujetos o a un solo sujeto. Debido a que se prueban pocos sujetos, se registra una cantidad sustancial
de observaciones para cada sujeto, lo que da como resultado un experimento muy económico y altamente
Los experimentos de n pequeña son comunes en el condicionamiento psicofísico, clínico y operante.
59533_04_ch03_p051-081.indd 66 9533_04_ch03_p051-081.indd 66 28/03/08 /28/08

investigar. Al igual que con el diseño dentro de los sujetos, el experimentador debe tener cuidado de
contrarrestar los tratamientos y anticipar cualquier problema asociado con la administración de múltiples
tratamientos a sujetos individuales. Los diseños de n pequeña se analizan en detalle en el Capítulo 9 de
este texto y en el Capítulo 9 de Elmes, Kantowitz y Roediger (2003).
Diseños mixtos
Los experimentos no necesitan ser exclusivamente de diseño dentro de los sujetos o entre sujetos.
A menudo es conveniente y prudente tratar algunas variables independientes como entre sujetos y otras
como dentro de los sujetos en el mismo experimento (suponiendo que el experimento tenga más de una
variable independiente, por supuesto). Si una variable, por ejemplo, la administración de un fármaco,
parece probable que afecte a otras, puede convertirse en una variable entre sujetos, mientras que el resto
de las variables varían dentro de los sujetos.
Cuando los ensayos o la práctica repetida en una tarea son de interés, es necesariamente una variable
dentro de los sujetos. Con frecuencia, se utiliza un diseño mixto, en el que se impone alguna variable
entre los sujetos para ver su efecto en una segunda variable dentro de los sujetos. Este tipo de diseño de
compromiso (diseño mixto) no es tan eficiente o económico como un diseño puro dentro de los sujetos,
pero a menudo es más seguro.
Condiciones de control
El experimentador debe variar (o manipular) las variables independientes. Esto implica que todas y cada
una de las variables independientes deben variar en cantidad (variación cuantitativa) o en tipo (variación
cualitativa) dentro del experimento. Por ejemplo, si la cantidad de recompensa otorgada a una rata es una
variable independiente, las cantidades elegidas por el experimentador podrían ser una y cuatro gránulos
de comida. Alternativamente, podríamos ofrecer diferentes tipos de recompensas, como comida y agua.
El término técnico para un solo tratamiento o condición de una variable independiente es nivel. Diríamos
que los niveles de la variable independiente son una y cuatro bolitas de comida en el primer ejemplo y
comida y agua en el segundo ejemplo.
Muchos experimentos contienen, además de las variables independientes, algún grupo de control
(diseño entre sujetos) o condición de control (diseño dentro de los sujetos). En su forma más simple, el
grupo de control no recibe los niveles de interés de la variable independiente. En el ejemplo de recompensa
que acabamos de describir, un grupo de control de ratas no recibiría ninguna recompensa. O digamos
que un experimentador está interesado en el efecto del ruido en el estudio. Utilizando un diseño entre
sujetos, el experimentador expondría a un grupo de sujetos a un ruido fuerte durante media hora mientras
estudiaban; este es el nivel de interés de la variable independiente. Un grupo de control estudiaría el
mismo material durante media hora en un ambiente tranquilo (un nivel muy bajo de ruido). Luego, ambos
grupos serían probados en el material. Cualquier diferencia obtenida en la prueba entre los dos grupos se
atribuiría al efecto del ruido.
La característica importante de una condición de control es el hecho de que proporciona una línea
de base contra la cual se puede comparar alguna variable de interés. A veces, la mejor línea de base es
ningún tratamiento, pero a menudo la mejor línea de base requiere algo de actividad. Un ejemplo frecuente
ocurre en la investigación de la memoria, donde se requiere que un grupo de sujetos aprenda dos listas
diferentes de palabras. El experimentador está interesado en cómo el aprendizaje de una lista interfiere con
59533_04_ch03_p051-081.indd 67 9533_04_ch03_p051-081.indd 67 28/03/08 /28/08

Grupo experimental Aprende la lista A Aprender Lista B Lista de prueba A
Grupo de control Aprende la lista A hacer aritmética Lista de prueba A
ÿ FIGURA 3.5
Ejemplos de Grupos Experimentales y de Control para el Aprendizaje de Listas.
aprendiendo del otro. El grupo experimental (que recibe el nivel de interés de la variable independiente)
primero aprende la lista A, luego aprende la lista B y luego se prueba nuevamente en la lista A.
Al experimentador le gustaría demostrar que aprender la lista B interfiere con la retención de la lista A.
Pero antes de que se pueda llegar a una conclusión de este tipo, se requiere una condición de control
de comparación. Simplemente comparar la prueba final de la lista A con la primera prueba es
insuficiente, porque los sujetos pueden obtener peores resultados en la última prueba de la lista A
simplemente porque están cansados, o pueden hacerlo mejor porque han tenido práctica adicional.
Una condición de control sin tratamiento haría que un grupo de control aprendiera la lista A, luego se
sentara durante el tiempo que le tomó al grupo experimental aprender la lista B, y luego se probaría
nuevamente en la lista A. Pero esta sería una condición de control deficiente, porque los sujetos
podrían practicar o ensayar la lista A mientras estaban sentados. Esto mejoraría su desempeño final
en la última prueba de la lista A y haría parecer incorrectamente que en el grupo experimental, la lista
B interfirió más de lo que realmente interfirió con la lista A. Una condición de referencia adecuada
ocuparía al grupo de control durante el tiempo que duró la prueba. el grupo estaba aprendiendo la lista
B; tal vez el experimentador les pediría que hicieran aritmética o algún otro "trabajo pesado" que evitaría el e
A veces, la condición de control está contenida implícitamente dentro del experimento.
Recuerde el experimento de memoria discutido anteriormente, en el que la variable independiente era
el número de repeticiones de un elemento: uno o cinco. Ningún experimentador se molestaría en incluir
un grupo de control o condición con cero repeticiones, ya que no podría ocurrir ningún aprendizaje bajo
esta extraña circunstancia. La condición de control está implícita, en el sentido de que cinco repeticiones
pueden compararse con una, y viceversa. Dado que el experimentador podría estar tan interesado en
los efectos de una sola repetición como en cinco repeticiones, probablemente no llamaríamos
explícitamente al nivel de una repetición una condición de control. Pero proporciona una línea de base
para la comparación, y lo mismo ocurre con la condición de cinco repeticiones, ya que los resultados
de una repetición se pueden comparar con ella.
Muchos tipos de experimentos requieren más de una línea base. En la investigación fisiológica y
de fármacos, por ejemplo, se necesita un control para traumatismos quirúrgicos o por inyección.
Entonces, un sujeto podría recibir una operación simulada o la inyección de una sustancia inerte (un
placebo) en la condición de control; también se compararían con otros controles que no recibieron
ninguna operación ni inyección.
Trampas
Desafortunadamente, es bastante fácil formular un diseño experimental inadecuado; la mayoría de los

psicólogos experimentales han escondido errores de este tipo en un archivador polvoriento. En esta
sección, analizamos solo una pequeña muestra de los errores de diseño, aquellos que son tan comunes
que debe tener en cuenta.
59533_04_ch03_p051-081.indd 68 9533_04_ch03_p051-081.indd 68 28/03/08 /28/08

Características de la demanda Los experimentos de laboratorio intentan capturar el
comportamiento tal como está realmente influenciado por la variable independiente. A veces, el entorno
del laboratorio en sí mismo o el conocimiento de que se está realizando un experimento pueden alterar
los patrones de comportamiento. Muchas veces, los participantes de la investigación formulan hipótesis
o suposiciones espontáneamente sobre el propósito del experimentador al realizar el experimento y
luego se comportan o responden de una manera que satisfará este "propósito". Pruebe esta sencilla
demostración para convencerse de que tales efectos se producen. Dile a cinco de tus amigos que estás
realizando un experimento para tu clase de psicología y que te gustaría su cooperación como sujetos.
Si están de acuerdo, pídales que sostenga tres cubitos de hielo en sus manos desnudas. Tenga en
cuenta cuántos sostienen los cubitos de hielo hasta que se derriten. Ahora pide a otros cinco amigos
que sostengan los cubitos de hielo, sin mencionar nada sobre un experimento. En lugar de retener los
cubitos de hielo hasta que se derritan, considerarán tu pedido algo extraño y pronto te lo informarán.
Hay algo inusual en la pronta sumisión de esos amigos que sabían que estaban participando en un
experimento: más de ellos estaban dispuestos a sostener los cubitos de hielo por un período más largo.
Los psicólogos llaman a las señales disponibles para los sujetos que les permiten determinar el propósito
del experimento, o lo que espera el experimentador, características de demanda. En la medida en
que el comportamiento de los participantes de la investigación esté controlado por las características
de la demanda en lugar de por variables independientes, los experimentos no son válidos y no pueden
generalizarse más allá de la situación de prueba.
Un ejemplo bien conocido de una característica de demanda es el efecto Hawthorne, llamado así
por la planta de Western Electric Company donde se observó por primera vez. La empresa estaba
interesada en mejorar la moral y la productividad de los trabajadores y llevó a cabo varios experimentos
(como mejorar la iluminación) para mejorar el entorno de los trabajadores. No importa qué manipulación
experimental se intentó, la productividad de los trabajadores mejoró. Los trabajadores sabían que
estaban en un grupo “especial”, por lo que intentaron hacerlo lo mejor posible en todo momento. (Ver
Bramel & Friend, 1981, y Parsons, 1974, para interpretaciones alternativas de estos resultados.) Las
características de la demanda fueron más importantes para determinar la productividad de los
trabajadores que las manipulaciones experimentales. Aunque el término efecto Hawthorne se usa
ampliamente para describir experimentos de campo donde la productividad aumentó debido a la
participación en el estudio, ha habido varias revisiones detalladas del experimento original de Hawthorne
que sugieren que la conclusión original se basó en evidencia débil (Brannigan & Zwerman, 2001). ;
Wickström y Bendix, 2000). Sin embargo, el término sigue siendo de uso amplio.
Las características de la demanda y el efecto Hawthorne deben evaluarse cuidadosamente. Un
estudio reciente (Fostervold, Buckmann y Lie, 2001) contenía condiciones de control especiales para
evaluar los efectos de los filtros de la unidad de presentación visual (VDU) en las pantallas de las
computadoras. En la primera parte del estudio, un grupo de participantes tenía filtros (grupo de filtros) y
otro grupo de control no. La comparación de los resultados de los dos grupos mostró varios beneficios
para el grupo del filtro. Sin embargo, los investigadores también incluyeron una segunda fase en la que
al grupo de control se le dio un filtro mientras que el grupo con filtro continuó con el mismo filtro. Solo
se observaron cambios menores para el grupo de control inicial. Además, los beneficios iniciales para
el grupo de filtros disminuyeron durante la segunda fase. Por lo tanto, los resultados en la primera fase
se debieron a las características de la demanda y no a los beneficios asociados con los fi ltros de VDU.
Si los experimentadores hubieran realizado solo la primera fase de su estudio, se podría haber afirmado
incorrectamente un beneficio falso de los filtros, en realidad debido a las características de la demanda.
Efectos del experimentador Un escollo estrechamente relacionado con las características de la

demanda es el efecto del experimentador, que infl uye en el resultado accidentalmente al proporcionar
a los participantes pistas leves sobre las expectativas del experimentador. Por ejemplo, un experimentado
59533_04_ch03_p051-081.indd 69 9533_04_ch03_p051-081.indd 69 28/03/08 /28/08

puede no darse cuenta de que él o ella asiente con aprobación cuando se da una respuesta correcta y
frunce el ceño después de los errores. El género, la raza y el origen étnico del experimentador también son
efectos potenciales del experimentador. Es más probable que las características del experimentador
sesguen los resultados de un experimento en una investigación que se centre en cuestiones relacionadas
con estas características, por ejemplo, la raza de un experimentador que realiza un experimento sobre el
efecto del color de la piel en las calificaciones de desempeño laboral.
Estos efectos no se limitan a los experimentos con humanos. El efecto del experimentador también
puede ocurrir en experimentos aparentemente objetivos con sujetos animales. Rosenthal y Fode (1963)
dijeron a los estudiantes de experimentación que las ratas que iban a probar en un laberinto eran de cepas
especiales: laberintos brillantes o laberintos apagados. En realidad, las ratas procedían de la misma
población. Sin embargo, las ratas que fueron etiquetadas como laberinto brillante tuvieron menos errores
que aquellas etiquetadas como laberinto aburrido, y esta diferencia fue estadísticamente confiable. Se
observó a los estudiantes experimentadores mientras probaban las ratas: no hicieron trampa ni hicieron
nada manifiesto para sesgar los resultados. Parece razonable que los afortunados estudiantes que
obtuvieron ratas supuestamente brillantes estuvieran más motivados para realizar el experimento que
aquellos desafortunados que tuvieron que enseñar a estúpidas ratas a atravesar el laberinto. De alguna
manera, esto afectó los resultados del experimento, tal vez porque los experimentadores manejaron los
dos grupos de ratas de manera diferente.
La mejor manera de eliminar este tipo de efecto del experimentador es ocultar la condición
experimental al experimentador bajo la premisa de que los experimentadores no pueden comunicar lo que
no saben. Este procedimiento se denomina experimento doble ciego.
porque ni el experimentador ni el participante de la investigación saben qué sujetos están en qué
condiciones de tratamiento. Este procedimiento se utilizó, por ejemplo, en un estudio sobre los efectos de
la contaminación del aire en el comportamiento. Los sujetos respiraron aire puro o aire extraído de una
carretera muy transitada. El aire estaba contenido en tanques; el experimentador no sabía qué tanque
contenía aire puro y qué tanque contenía aire contaminado. El peor desempeño de los sujetos en el aire
contaminado no puede atribuirse, entonces, a que el experimentador haya revelado inadvertidamente la
calidad del aire a los sujetos o los haya tratado de manera diferente.
Los efectos del experimentador no siempre son tan sutiles. Uno de los autores participó una vez en
un experimento sobre la respuesta de parpadeo de los ojos humanos. Varios experimentadores ayudaron
a realizar el mismo experimento, y pronto se notó que uno de ellos obtuvo resultados bastante diferentes
a los del resto de nosotros. Sus sujetos comenzaron las sesiones experimentales con ráfagas masivas de
parpadeo frenético. La causa de este extraño comportamiento se descubrió fácilmente. Para registrar los
parpadeos de los ojos, el experimentador debe sujetar una diminuta varilla de metal al párpado del sujeto
con una cinta especial, normalmente un procedimiento indoloro.
Sin embargo, el experimentador en cuestión tenía un pulgar muy pesado y no podía sujetar la varilla sin
irritar el ojo, lo que provocaba extrañas ráfagas de parpadeo.
Cuando un experimentador sospecha que algún aspecto de su apariencia o forma (p. ej., género,
raza, etnia) puede alterar el patrón de comportamiento de los sujetos, entonces una posible solución es
incorporar esto como una variable independiente adicional o variable de control en el diseño experimental.
Si un experimentador afroamericano está realizando una investigación sobre el color de la piel y las
calificaciones de desempeño laboral, podría pedirle a un colega o asistente de investigación blanco que
pruebe a la mitad de los sujetos y luego compare los efectos del color de la piel en las dos condiciones de
raza del experimentador.
Automatización de experimentos Los efectos del experimentador pueden eliminarse o reducirse

en gran medida haciendo que las computadoras u otros equipos realicen el experimento de modo que el
sujeto no sea tocado por manos humanas. En muchos laboratorios, un sujeto ingresa a una prueba
59533_04_ch03_p051-081.indd 70 9533_04_ch03_p051-081.indd 70 28/03/08 /28/08

cabina y ve un mensaje en una pantalla que le dice que presione un botón para comenzar.
Al presionar el botón, las instrucciones para el experimento aparecen en la pantalla. A
continuación, todo el experimento es realizado por una computadora. El experimentador aparece
al final de la recopilación de datos para informar al participante, dando los objetivos del estudio y
explicando cómo el tema ha ayudado al avance de la ciencia. Hasta entonces, el experimentador
simplemente monitorea el equipo y el sujeto para asegurarse de que el sujeto siga las
instrucciones y que no suceda nada adverso. Tal automatización obviamente reduce los peligros
del sesgo del experimentador.
Cuasi-Experimentos
Por una razón u otra, muchas variables no se pueden manipular directamente. Un impedimento
para la manipulación de variables en los experimentos son las consideraciones éticas que todos
los científicos deben tener (ver Capítulo 4). Es ético inspeccionar u observar de otro modo el uso
de drogas por parte de estudiantes universitarios, siempre que se obtenga el permiso. Sin
embargo, ni mucho menos sería ético crear un grupo de drogadictos y comparar sus actividades
con un grupo que no abusa que también creamos. Una segunda barrera a la manipulación es la
Madre Naturaleza. Algunas variables, como el sexo de nuestros sujetos, no pueden ser
modificadas por el experimentador (excepto en circunstancias muy raras y controvertidas); otras
variables, como los desastres naturales (tornados, huracanes) o no naturales (guerras, accidentes
aéreos), son tanto física como moralmente difíciles de implementar. ¿Podemos hacer
experimentos que se refieran a estos fenómenos? Después de todo, tales variables y otras
similares son fascinantes y pueden desempeñar un papel importante en la experiencia humana.
La respuesta a la pregunta (suponiendo que sea un científico ético) es esta: puede y no
puede. No estamos siendo tontos aquí; más bien, estamos enfatizando el hecho de que no se
pueden hacer experimentos reales sobre fenómenos como los que acabamos de enumerar. Sin
embargo, puede realizar cuasi-experimentos. La técnica aquí es similar al examen ex post
facto en la investigación correlacional, excepto que se examinan dos o más niveles de la variable
de interés en lugar de correlacionarlos. Esperamos que la Madre Naturaleza haga su trabajo y
luego comparamos los efectos de esa “variable independiente” con los efectos que ocurren
cuando esa variable no está presente o difiere de alguna manera. Si comparamos la capacidad
lectora de los hombres con la de las mujeres, o la de los lectores rápidos con la del adulto medio,
hemos realizado un cuasi-experimento.
Las ventajas de los cuasi-experimentos son obvias: utilizan variables independientes que
ocurren naturalmente, la mayoría de las cuales tienen un alto grado de interés intrínseco e
importantes implicaciones prácticas. En un cuasi-experimento, aprovechamos los procedimientos
de observación y correlación y los combinamos con el poder de la experimentación. El cuasi-
experimento típico tiene una variable sujeto como variable independiente. Si queremos averiguar
acerca de casi cualquier variable inherente del sujeto (edad, sexo, raza, grupo étnico), atributo
del sujeto socialmente causado (clase social, región de residencia) o atributo del sujeto
relacionado con enfermedades y enfermedades (pérdida de extremidades, enfermedad mental,
daño cerebral, efectos de desastres), vamos a tener que seleccionar en lugar de variar nuestras
variables independientes, a menos que sea posible hacer el experimento directamente en organism
Aunque los cuasi-experimentos son interesantes y pueden contribuir a una investigación muy
importante, debemos advertirle aquí que las ventajas de los cuasi-experimentos se obtienen a
expensas del control. Cuando el investigador tiene que tomar lo que se le da, lo que se le da
puede incluir varias variables de confusión importantes.
59533_04_ch03_p051-081.indd 71 9533_04_ch03_p051-081.indd 71 28/03/08 /28/08

Debido a que gran parte de la investigación en psicología se ocupa de las variables del sujeto y
debido a que es probable que se confundan los cuasi-experimentos que utilizan variables del sujeto,
ahora examinamos los problemas y las posibles soluciones.
Un experimentador no puede manipular la variable de un sujeto mientras mantiene constantes
otros factores; él o ella solo puede seleccionar sujetos que ya tienen la característica en algún grado
variable y luego compararlos en función del comportamiento de interés. Si los sujetos en los diferentes
grupos (digamos, CI alto, medio y bajo) difieren en el comportamiento, no podemos concluir que la
diferencia entre la variable sujeto haya producido o sea responsable de la diferencia en el
comportamiento. La razón es que otros factores pueden ser covariantes y confundirse con la variable
del sujeto. Si los sujetos con alto coeficiente intelectual realizan alguna tarea mejor que los sujetos con
bajo coeficiente intelectual, no podemos decir que el coeficiente intelectual produjo o causó la diferencia,
porque es probable que los diferentes grupos de sujetos varíen en otras dimensiones relevantes, como
la motivación, la educación, etc. . Cuando se investigan las variables del sujeto, no podemos atribuir
con seguridad diferencias de comportamiento a esta variable, como podemos hacerlo con las verdaderas
variables experimentales. Tales diseños, entonces, esencialmente producen correlaciones entre variables.
Podemos decir que las variables están relacionadas, pero no podemos decir que una variable produce
o provoca el efecto en la otra variable.
Este es un punto muy importante; consideremos un ejemplo. Supongamos que un investigador
está interesado en el funcionamiento intelectual (o la falta del mismo) de las personas que padecen
esquizofrenia. A las personas diagnosticadas como pertenecientes a este grupo se les realizan
numerosas pruebas destinadas a medir diversas habilidades mentales. El investigador también
administra estas pruebas a otro grupo de personas, los llamados normales. Él o ella descubre que a los
esquizofrénicos les va especialmente mal en comparación con los normales en las pruebas que
involucran aspectos semánticos del lenguaje, como las que involucran la comprensión del significado
de las palabras o la comprensión de pasajes en prosa. El investigador concluye que los esquizofrénicos
realizan peor estas pruebas porque son esquizofrénicos y que su incapacidad para usar bien el lenguaje
en la comunicación es una causa probable que contribuye a la esquizofrenia.
Estudios como este son comunes en algunas áreas de la psicología. A pesar de que conclusiones
similares a esta a menudo se extraen de tales estudios, son completamente injustificadas. Ambas
conclusiones se basan en correlaciones, y otros factores bien podrían ser los críticos. Los esquizofrénicos
pueden hacerlo peor que los normales por varias razones. Es posible que no sean tan inteligentes, tan
motivados, tan educados o tan sabios para tomar exámenes. Puede ser simplemente que hayan estado
institucionalizados durante mucho tiempo, con la consiguiente pobreza de las relaciones sociales e
intelectuales. Así que no podemos concluir que la razón por la que los dos grupos difieren en las
pruebas verbales es la esquizofrenia o su ausencia en los dos grupos. Incluso si pudiéramos concluir
esto, ciertamente no implicaría la otra conclusión, que los problemas de lenguaje están involucrados en
la causa de la esquizofrenia. Nuevamente, todo lo que tendríamos es una correlación entre estas dos
variables, sin tener idea de si las dos están relacionadas causalmente o de qué manera.
El uso de variables temáticas es muy común en toda la investigación psicológica, pero es

absolutamente crucial en áreas como la psicología clínica y del desarrollo. Por lo tanto, los problemas
de hacer inferencias a partir de dicha investigación deben ser considerados cuidadosamente. Una
variable principal en la psicología del desarrollo es la edad, una variable de sujeto; esto significa que
gran parte de la investigación en este campo es de naturaleza correlacional. En general, el problema de
las diferencias individuales entre los sujetos de psicología es uno que a menudo se ignora, aunque a
menudo se apela a considerar este problema como crucial (ver Underwood, 1975). Dedicamos un
capítulo más adelante en el libro a las diferencias individuales (Capítulo 12). Consideremos aquí una
forma de intentar inferencias más sólidas a partir de experimentos que emplean variables de sujeto.
59533_04_ch03_p051-081.indd 72 9533_04_ch03_p051-081.indd 72 28/03/08 /28/08

Emparejamiento de nuevo El problema básico en la investigación de las variables del
sujeto y en otras investigaciones ex post facto es el hecho de que cualquier diferencia que se
observe en el comportamiento puede deberse a sus variables de confusión. Una forma de tratar
de evitar este problema es emparejar sujetos en las otras variables relevantes. En la comparación
de sujetos esquizofrénicos y normales, notamos que los dos grupos también diferían probablemente
en otras características, tales como CI, educación, motivación, institucionalización y quizás incluso e
En lugar de comparar simplemente a los sujetos esquizofrénicos con los sujetos normales, podríamos
intentar compararlos con otro grupo más parecido en estas otras dimensiones, de modo que,
esperamos, la principal diferencia entre los grupos sea la presencia o ausencia de esquizofrenia. Por
ejemplo, podríamos usar un grupo de pacientes que, en promedio, son similares a los esquizofrénicos
en términos de edad, coeficiente intelectual, tiempo de institucionalización, género y alguna medida de
motivación. Cuando los dos grupos se han emparejado en todas estas características, entonces
podemos atribuir con mayor confianza cualquier diferencia en el rendimiento entre ellos al factor de
interés, a saber, la esquizofrenia. Al emparejar, los investigadores intentan introducir la característica
crucial de la experimentación (ser capaces de mantener constantes los factores extraños para evitar
confusiones) en lo que es esencialmente una observación correlacional. El deseo es permitir inferir
que la variable de interés (esquizofrenia) produce el efecto observado.
Varios problemas bastante graves están asociados con el emparejamiento. Por un lado, a
menudo requiere mucho esfuerzo, porque algunas de las variables relevantes pueden ser bastante
difíciles de medir. Incluso cuando uno se toma la molestia de tomar las medidas adicionales necesarias,
aún puede ser imposible emparejar los grupos, especialmente si hay pocos sujetos involucrados antes
de intentar el emparejamiento. Incluso cuando el emparejamiento es exitoso, a menudo reduce en
gran medida el tamaño de la muestra en la que se realizan las observaciones. Entonces tenemos
menos confianza en nuestras observaciones, porque pueden no ser estables y repetibles.
El emparejamiento es a menudo difícil porque las diferencias cruciales entre los sujetos pueden
tener efectos sutiles. Además, los efectos de una diferencia pueden interactuar con otra. Por lo tanto,
las interacciones sutiles entre las variables emparejadas pueden confundir los resultados. Para ilustrar
estas dificultades, consideremos parte del trabajo realizado por Lester y Brazelton (1982) sobre el
comportamiento neonatal.
El principal interés de Brazelton está en las diferencias culturales en el comportamiento neonatal,
medido por la Escala de Evaluación del Comportamiento Neonatal de Brazelton. La estrategia general
es comparar neonatos de varias culturas y grupos étnicos con neonatos de los Estados Unidos. En
estos cuasi-experimentos, la cultura o el grupo étnico, que es una variable del sujeto, es la variable
cuasi-independiente. Por lo general, se intenta emparejar a los bebés de diferentes culturas a lo largo
de varias dimensiones, como el peso al nacer, la longitud al nacer y el riesgo obstétrico (incluido si la
madre recibió medicamentos durante el parto, si el bebé fue prematuro, etc.). Lester y Brazelton
muestran que existe una relación sinérgica entre estos factores. Sinergismo en un contexto médico
significa que los efectos combinados de dos o más variables no son aditivos: el efecto combinado es
mayor que la suma de los componentes individuales. Esto significa que las variables interactúan.
La forma en que interactúan las características neonatales y el riesgo obstétrico es la siguiente.

Los estudios han demostrado que el comportamiento (medido por la escala de Brazelton) de los bebés
con un peso levemente bajo está más fuertemente influido (negativamente) por las pequeñas
cantidades de medicamentos que toma la madre que el comportamiento de los recién nacidos que
tienen un peso más cercano al promedio. Aunque los neonatos se seleccionan cuidadosamente, los
efectos sutiles e interactivos de las variables combinadas pueden influir en los resultados. Este es un
problema especialmente difícil en el trabajo de Brazelton, porque gran parte de su investigación ha exam
59533_04_ch03_p051-081.indd 73 9533_04_ch03_p051-081.indd 73 28/03/08 /28/08

recién nacidos de culturas empobrecidas, donde el peso al nacer es bajo y el riesgo obstétrico es muy
alto. En general, debe recordar que las variables emparejadas rara vez están bajo control directo, lo que
significa que la posibilidad de confusión siempre está presente.
Otro problema con el emparejamiento implica la introducción del temido artefacto de regresión.
Esto se discute en el Capítulo 12, pero lo explicamos brevemente aquí. Bajo ciertas condiciones en
muchos tipos de mediciones, ocurre un fenómeno estadístico conocido como regresión a la media. La
media de un grupo de puntajes es lo que la mayoría de la gente considera el promedio: el total de todas
las observaciones dividido por el número de observaciones. Por ejemplo, la estatura media en una
muestra de 60 personas es la suma de todas sus estaturas dividida por 60. Por lo general, si las personas
que recibieron puntuaciones extremas (es decir, muy altas o muy bajas) en alguna característica se
vuelven a evaluar, sus segundas puntuaciones serán más cerca de la media de todo el grupo que sus
puntuaciones originales. Considere un ejemplo.
Damos a 200 personas una prueba estándar de razonamiento matemático para la cual hay dos formas
equivalentes, o dos versiones de la prueba que sabemos que son equivalentes. El puntaje promedio
(media) en la prueba es 60 de 100 puntos posibles. Tomamos las 15 personas que obtienen la puntuación
más alta y las 15 que obtienen la puntuación más baja. La media de estos grupos es, digamos, 95 y 30,
respectivamente. Luego los probamos nuevamente en la otra versión de la prueba. Ahora podríamos
encontrar que las medias de los dos grupos son 87 y 35. En la segunda prueba, las puntuaciones de
estos dos grupos extremos retroceden hacia la media; el grupo de puntuación alta puntúa peor y el grupo
de puntuación baja lo hace un poco mejor. Básicamente, esto sucede para el grupo de puntaje alto porque
algunas personas cuyos "puntajes reales" son algo más bajos que los que realmente evaluaron tuvieron
suerte y obtuvieron puntajes más altos de lo que deberían en el examen. Cuando se vuelve a evaluar, las
personas con puntajes extremadamente altos tienden a obtener puntajes más bajos, cerca de su puntaje
real. La situación se invierte para el grupo de puntuación baja. Es decir, algunos de ellos puntuaron por
debajo de sus “puntajes reales” en la primera prueba; la repetición de la prueba conduce a una puntuación
más alta o más cercana a la puntuación real.
Esta regresión hacia la media siempre se observa en condiciones en las que existe una correlación
menos que perfecta entre las dos medidas. Cuanto más extrema sea la selección de puntuaciones, mayor
será la regresión hacia la media. También ocurre en todo tipo de situaciones de medición. Si los padres
anormalmente altos o bajos tienen un hijo, probablemente estará más cerca de la media de la población
que la altura de los padres. Como ocurre con la mayoría de los fenómenos estadísticos, la regresión a la
media se aplica a grupos de observaciones y es probabilística (es decir, es posible que no ocurra
siempre). Por ejemplo, algunos sujetos individuales pueden alejarse de la media en la segunda prueba
de razonamiento matemático, pero la tendencia del grupo será hacia la media.
¿Cómo afecta la regresión hacia la media a los cuasi-experimentos, en los que los sujetos han sido
emparejados en alguna variable? Nuevamente, considere un ejemplo. Esta, como muchas investigaciones
ex post facto realizadas sobre problemas sociales aplicados, tiene implicaciones importantes. Supongamos
que tenemos un programa educativo que creemos que será especialmente ventajoso para aumentar los
puntajes de lectura de los niños afroamericanos. Esto es especialmente importante porque los puntajes
de los niños afroamericanos suelen ser más bajos que los de los blancos, presumiblemente debido a los
diferentes entornos culturales. Tomamos dos grupos de niños, uno afroamericano y otro blanco, y los
emparejamos según varios criterios, incluidos la edad, el sexo y, lo que es más importante, el rendimiento
inicial en lectura. Damos a ambos grupos de niños el programa de mejoramiento de la lectura y luego
evaluamos sus puntajes de lectura después del programa. Encontramos, para nuestra sorpresa, que los
niños afroamericanos se desempeñan peor después del programa de lectura que antes, y los niños
blancos mejoran. Concluimos, por supuesto, que el programa
59533_04_ch03_p051-081.indd 74 9533_04_ch03_p051-081.indd 74 28/03/08 /28/08

ayudó a los niños blancos pero en realidad lastimó a los niños afroamericanos, a pesar de que fue
diseñado especialmente para estos últimos.
Esta conclusión, aunque pueda parecerle razonable, es casi seguramente errónea en este caso,
debido a los artefactos de regresión. Considere lo que sucedió cuando se emparejó a los niños
afroamericanos y blancos en los puntajes iniciales de lectura. Dado que las poblaciones diferían
inicialmente, con los afroamericanos con puntajes más bajos que los blancos, para emparejar dos
muestras fue necesario seleccionar a los estudiantes afroamericanos con puntajes más altos que la
media de su grupo y los estudiantes blancos con puntajes más bajos que su grupo. significar. Habiendo
escogido estos grupos extremos, podríamos predecir (debido a la regresión a la media) que cuando se
volvieran a evaluar, los niños afroamericanos tendrían puntajes más bajos y los niños blancos mejores,
en promedio, incluso si el programa de mejora de la lectura hubiera ningún efecto en absoluto! Los
niños afroamericanos con puntuaciones excepcionalmente altas tenderían a retroceder hacia la media
de su grupo, y los blancos con puntuaciones bajas retrocederían hacia la media de su grupo. Lo mismo
habría sucedido incluso si no hubiera habido un programa y los niños hubieran sido simplemente
reexaminados.
Es probable que se hubiera obtenido el mismo resultado si los niños hubieran sido emparejados
en CI en lugar de puntajes de lectura, ya que los dos probablemente están correlacionados
positivamente. Así que simplemente encontrar otra variable coincidente puede no ser una solución.
Una solución sería unir muestras muy grandes de niños afroamericanos y blancos y luego dividir cada
grupo, dando el programa de lectura a un subgrupo pero no al otro. Todos se volverían a probar al final
de la participación de un subgrupo en el programa. (La asignación de sujetos a los subgrupos de niños
afroamericanos y blancos debería, por supuesto, ser aleatoria.) Se esperaría una regresión a la media
en ambos subgrupos, pero el efecto del programa de lectura podría evaluarse contra el grupo que tenía
ningún programa
Tal vez los niños afroamericanos con el programa de lectura mostrarían una caída mucho menor
(regresión a la media) que los que no lo tenían, lo que indica que el programa realmente tuvo un efecto
positivo.
Debido a que la investigación cuasi-experimental con variables temáticas se lleva a cabo bastante
a menudo para evaluar programas educativos, sus practicantes deben ser conscientes de los muchos
problemas espinosos asociados con su uso. Es posible que uno no pueda decir mucho con respecto a
los resultados o sacar conclusiones importantes debido a las confusiones. El emparejamiento ayuda a
aliviar este problema en algunos casos donde su uso es posible, pero luego se introduce la posibilidad
de artefactos de regresión. Y muchos investigadores parecen no darse cuenta de este problema. En el
capítulo 12 se analiza un error famoso en este tipo de investigación evaluativa, muy similar al estudio
hipotético descrito aquí.
Cuando el emparejamiento es una posibilidad práctica y cuando se evalúan los artefactos de
regresión, podemos sentirnos un poco más seguros de las conclusiones de nuestros resultados. Pero
debemos recordar que lo que tenemos todavía es solo una correlación, aunque muy cuidadosamente
controlada. La combinación es a veces útil, pero no es una panacea. En nuestro ejemplo anterior
comparando sujetos esquizofrénicos con otros en el desempeño de la prueba mental, si los
esquizofrénicos todavía se desempeñaron peor que el nuevo grupo de control emparejado, ¿podríamos
entonces concluir que la esquizofrenia produjo inferioridad en el uso del lenguaje? No, no pudimos.
Todavía podría ser otra cosa, alguna otra diferencia entre los dos grupos. Nunca podemos estar
absolutamente seguros de haber coincidido con las variables relevantes.
El estudio del diseño experimental es complejo. En la mayoría de los capítulos, incluimos una
característica, Del problema al experimento, que explica cómo convertir un problema o pregunta en un
experimento real. A continuación describimos esta característica.
59533_04_ch03_p051-081.indd 75 9533_04_ch03_p051-081.indd 75 28/03/08 /28/08

DEL PROBLEMA AL EXPERIMENTO
LA TUERCAS Y PERNOS
Problema al realizar un experimento

Muchas de las decisiones que intervienen en la creación de un experimento no se explican
claramente en los informes de investigación de las revistas. Aunque parte de esta brevedad
puede atribuirse a la economía impuesta por los editores de revistas a los que les gustan los
artículos breves, una gran parte se basa en la suposición de que los psicólogos experimentales,
o de hecho los psicólogos que investigan cualquier especialidad, comparten un conocimiento
previo común. Esto es cierto en todas las ramas de la ciencia. Por ejemplo, un físico que
escribe en un diario asume que los lectores ya saben que una dina es una unidad de fuerza y
no se molestarán en explicar ese término. De manera similar, los psicólogos suelen suponer
que el lector sabe lo que significan los términos estímulo y respuesta, aunque estos pueden
definirse de todos modos. Uno de los propósitos de este texto es brindarle parte del vocabulario
necesario si desea leer o escribir sobre investigación psicológica.
Otro problema para el nuevo investigador está relacionado con la “tradición del laboratorio”.
“Todo el mundo” sabe que hay ciertas formas “obvias” de realizar ciertos tipos de investigación.
Estas formas difieren de un área a otra, pero son bien conocidas dentro de cada categoría.
Son tan conocidos que los investigadores rara vez se molestan en explicarlos y, de hecho, se
sorprenden bastante cuando los nuevos investigadores ignoran estos trucos y técnicas "obvios".
Los investigadores de animales a menudo privan a los animales de comida durante varias
horas antes del experimento o mantienen a sus palomas en un cierto porcentaje del peso que
alcanzarían si tuvieran comida disponible continuamente. Aunque las razones de esto son
obvias para el investigador, pueden no serlo para usted. ¿Cómo sabe un experimentador
cuántos elementos usar en un experimento de memoria? ¿Cuánto tiempo debe durar un
experimento? ¿Por qué se selecciona una variable dependiente de un conjunto de lo que
parecen ser variables dependientes igualmente válidas? ¿Cuántos sujetos se deben utilizar en
un experimento? Las secciones Del problema al experimento en los capítulos de la Parte dos
responderán preguntas tan "obvias" como estas.
Del problema al experimento

Toda investigación tiene como objetivo la solución de un problema. Este problema puede ser
abstracto y teórico o concreto y aplicado. El problema puede surgir de una observación hecha
más o menos casualmente, como que la gente parece ser más agresiva durante el verano.
Aquí, el problema se puede plantear como "¿Por qué el calor del verano causa agresión?" o
incluso más escéptico como "¿Las altas temperaturas causan agresión?" Un problema puede
surgir de un descubrimiento accidental en un laboratorio, como el hallazgo de moho en un trozo de
Resolver este problema (¿por qué crece el moho aquí?) condujo al descubrimiento del penicil
lin. Finalmente, un problema puede surgir directamente de un modelo teórico, por ejemplo,
cuando preguntamos: "¿Por qué el reforzamiento aumenta la probabilidad de que ocurra el
comportamiento que lo precedió?"
59533_04_ch03_p051-081.indd 76 9533_04_ch03_p051-081.indd 76 28/03/08 /28/08

El primer paso que debe dar el experimentador es traducir el problema en una hipótesis
comprobable. Luego, la hipótesis debe transformarse en un experimento con variables independientes,
dependientes y de control.
Del problema a la hipótesis Un problema es, más o menos, un enunciado vago que debe ser
verificado o una pregunta que debe ser respondida. A menos que se haga específico y preciso, no se
puede probar experimentalmente. Cualquier hipótesis es una predicción particular, derivada de un
problema, a menudo expresada de esta forma: si A, entonces B. La distinción crucial entre un
problema y una hipótesis es que una hipótesis es directamente comprobable, mientras que un
problema no lo es. Una prueba experimental debe ser capaz de refutar una hipótesis.
El propósito de cualquier experimento es probar hipótesis sobre los efectos de una(s) variable(s)
independiente(s) sobre la variable dependiente. Para ello, debemos recopilar datos. Una vez
obtenidos, estos datos deben ser analizados. Una vez analizados, los datos deben ser reportados.
Discutimos brevemente estos aspectos a su vez.
ÿ DATOS
Obtención de datos
Delinear un diseño experimental no establece todas las condiciones necesarias para la adquisición
de datos. Aunque el diseño le dice cómo asignar sujetos a los experimentos, no le dice cómo obtener
los sujetos. Sin sujetos, no hay datos.
Los psicólogos que investigan el comportamiento animal tienen mucho más control sobre la
selección de sujetos que los que estudian a los humanos. Aunque los psicólogos animales deben
asumir el gasto adicional de obtener vivienda y alimentar a sus sujetos, pueden seleccionar la
variedad que desean comprar y siempre tener sujetos disponibles, salvo alguna catástrofe.
La investigación con humanos utiliza con mayor frecuencia como sujetos a estudiantes
universitarios matriculados en psicología introductoria. Siempre que esta participación se utilice como
una experiencia de aprendizaje para el estudiante, se considera ético y adecuado (American
Psychological Association [APA], 1987). Si el experimento no se utiliza como una experiencia de
aprendizaje, el experimentador debe pagar sujetos. Dado que los estudiantes universitarios son una
población selecta, los experimentadores deben tener cuidado al generalizar los resultados a otras
poblaciones de sujetos. Por ejemplo, las técnicas de un sistema de aprendizaje programado diseñado
para enseñar química inorgánica podrían no tener éxito en la enseñanza de la plomería.
La selección aleatoria significa que cualquier miembro de una población tiene las mismas
posibilidades de ser seleccionado como participante. Además, cada selección es independiente de
otras selecciones, por lo que elegir a una persona no afecta las posibilidades de seleccionar a otra
persona. A veces, en un experimento típico de psicología, puede ser difícil especificar la población
que se está muestreando (Gigerenzer, 1993). Incluso si las materias pueden seleccionarse al azar,
¿qué población representa exactamente un grupo de materias universitarias? Ni siquiera está claro
si la población de estudiantes que toman los cursos de psicología requeridos es representativa de
todos los estudiantes universitarios. Dado que la población estudiantil ahora es tan diversa y
representa a personas con edades y antecedentes muy diferentes, los investigadores deben tener
cuidado al extrapolar los resultados de la muestra de prueba a otras poblaciones.
Asignación aleatoria significa que cada participante en el experimento es asignado
aleatoriamente a los tratamientos experimentales (Holland, 1993). Esta es una técnica prudente.
59533_04_ch03_p051-081.indd 77 9533_04_ch03_p051-081.indd 77 28/03/08 /28/08

porque aumenta nuestra capacidad de hacer inferencias causales a partir de los resultados experimentales.
Las implicaciones estadísticas del muestreo se discuten en el Apéndice B.
Después de seleccionar su muestra y fijar su diseño, queda una decisión importante. ¿Debe evaluar a
sus participantes uno por uno o en grupo? Ambos procedimientos tienen ventajas y desventajas. La mayor
ventaja de las pruebas grupales es la economía. Solo se necesita 1 hora para evaluar a 30 participantes
durante una hora como grupo, mientras que se necesitan 30 horas para evaluarlos individualmente.
Entonces, en igualdad de condiciones, es más rápido y, por lo tanto, mejor, evaluar a los participantes en
grupos. Pero hay muchos casos en los que todas las demás cosas están lejos de ser iguales. Por ejemplo,
tome un experimento de escucha en el que se presentan palabras separadas a los oídos izquierdo y
derecho. Una estudiante de doctorado apresurada decidió ahorrar tiempo y evaluar a sus participantes en
un grupo. Olvidó que a menos que los participantes estuvieran ubicados exactamente entre los dos
altavoces, un mensaje llegaría a un oído antes de que el otro mensaje llegara al otro oído. Esto invalidó la
variable independiente. Por supuesto, hubiera estado bien probar a los participantes en un grupo si cada
persona usara auriculares, evitando así esta dificultad. El otro problema en las pruebas grupales es la
posibilidad de que los participantes se influyan entre sí, influyendo así en los datos. Tal vez un participante
pueda engañar y copiar las respuestas de otro, o la composición sexual del grupo puede alterar la motivación.
A veces, estos problemas se pueden prevenir colocando a los participantes en cabinas individuales que
prohíben la interacción social.
Análisis de datos
El resultado inmediato de un experimento es una gran serie de números que representan el comportamiento
en diferentes condiciones. Como Sidman (1960) lo describe con humor, los científicos creen que todos los
datos están contaminados al nacer. Los datos pertenecen al azar oa la ciencia, pero nunca a ambos.
Antes de que el psicólogo pueda estar seguro de que los datos pertenecen a la Ciencia, el demonio Azar
debe ser exorcizado. Esto se hace mediante un ritual llamado análisis estadístico inferencial.
Una vez que el análisis estadístico le dice qué datos son confiables (no se produjeron por casualidad),
todavía tiene que decidir qué datos son importantes. Ningún cálculo matemático puede decir qué hipótesis
se están probando, qué predicen las teorías, etc.
Las estadísticas nunca sustituyen al pensamiento. El análisis estadístico es un procedimiento teóricamente
neutral que sirve para probar teorías e hipótesis. Excepto en el caso de un experimento hipotético, las
teorías y las hipótesis preceden a las estadísticas.
Debido a que es virtualmente imposible comprender el significado del gran conjunto de números que
produce un experimento, los datos generalmente se condensan mediante estadísticas descriptivas. Los más
comunes son la media y la desviación estándar. Como parte del análisis de datos, se calculan las medias
para cada nivel de cada variable independiente, así como para combinaciones de variables independientes
para mostrar interacciones.
Informe de datos
Los datos se presentan en tablas o figuras. Las figuras suelen ser más fáciles de entender.
La figura 3.2 es un ejemplo típico de cómo se informan los resultados de un experimento. La variable
dependiente se representa en la ordenada, la escala vertical. La variable independiente se grafica en la
abscisa, la escala horizontal. Más de un independiente
59533_04_ch03_p051-081.indd 78 9533_04_ch03_p051-081.indd 78 28/03/08 /28/08

variable se puede mostrar en el mismo gráfico usando líneas continuas y punteadas y/o símbolos de
formas diferentes para cada variable independiente.
Los datos sin procesar (no analizados) casi nunca se informan. En su lugar, se utiliza alguna
estadística descriptiva, como la media, para resumir los datos. Otras estadísticas a menudo acompañan a
los datos para informar al lector sobre la confiabilidad de estos datos.
Se pueden usar muchos estilos y formatos diferentes para reportar datos. Recomendamos el formato
dado en el Manual de publicación de la Asociación Americana de Psicología,
que se ha convertido en la referencia estándar en psicología y en muchos otros campos de las ciencias
sociales. Este libro le dirá más de lo que le gustaría saber sobre cada aspecto de la preparación del informe
de un experimento. Si no está en la biblioteca o librería, puede comprarlo a través del Departamento de
Orden, Asociación Americana de Psicología, PO
Box 2710, Hyattsville, Maryland 20784.
ÿ RESUMEN
1. Un experimento es un procedimiento controlado para investigar variación extraña. En un diseño entre sujetos,
los efectos de una o más variables independientes sobre una diferentes grupos de sujetos experimentan diferentes
o más variables dependientes. La variable independiente es tratamientos. En un diseño intra-sujetos, los mismos sujetos
manipulada por el experimentador, mientras que la variable pasan por todos los tratamientos. El diseño entre sujetos es
dependiente es observada y registrada. Los experimentos más seguro, pero el diseño dentro de los sujetos es más
ofrecen al investigador la mejor oportunidad de eliminar o eficiente. Los diseños mixtos tienen algunas variables
minimizar la variación extraña. Los experimentos se realizan dependientes que son entre sujetos y otras que son intra-
para probar teorías, para replicar y expandir hallazgos previos, sujetos. En los diseños entre sujetos, los grupos equivalentes
o para mostrar que no se puede confirmar la investigación se forman mediante emparejamiento y aleatorización. Efectos
previa. de la práctica general
Solo en raras ocasiones se realizan experimentos solo para y los efectos de arrastre diferenciales en los diseños dentro de
ver qué podría suceder. los sujetos se evalúan pero no se eliminan mediante el
2. Las variables independientes se eligen porque un experimentador contrapeso. Las condiciones de control proporcionan una línea
piensa que controlarán el comportamiento. Si no lo hacen, esto de base clara contra la cual se pueden comparar las condiciones
puede significar que la manipulación fue inadecuada o que el de interés.
experimentador se equivocó. Las variables dependientes deben 5. Hay muchas trampas en el diseño experimental.
ser estables, es decir, deben producir de manera consistente Las características de la demanda resultan del conocimiento
los mismos resultados bajo las mismas condiciones. Los del sujeto de que está participando en un experimento. Los
efectos techo y suelo resultan de un rango inadecuado para la efectos del experimentador son artefactos introducidos
variable dependiente. Las variables de control son posibles accidentalmente, cuando el experimentador (a través del
variables independientes que no se manipulan durante un comportamiento o las características individuales) proporciona
experimento. pistas sobre el propósito del experimento o influye en el sujeto
3. La mayoría de los experimentos prueban más de una variable sistemáticamente.
independiente a la vez. Además de proporcionar economía, Los efectos del experimentador se pueden minimizar mediante
esto permite que el experimentador obtenga información el uso de maquinaria para evitar diferencias sutiles en el
importante sobre las interacciones. Ocurren interacciones comportamiento del experimentador.
cuando los efectos de una variable independiente no son los 6. La selección de participantes de alguna población se denomina
mismos para diferentes niveles de otra variable independiente muestreo. El muestreo aleatorio significa que cada miembro
variable pendiente. Ocasionalmente, los experimentos usan de la población tiene la misma oportunidad de ser seleccionado.
más de una variable dependiente. Es más eficiente probar sujetos en grupos, pero se debe tener
4. El diseño experimental asigna sujetos a diferentes condiciones cuidado para evitar contaminar el experimento.
de manera que se espera que minimicen
59533_04_ch03_p051-081.indd 79 9533_04_ch03_p051-081.indd 79 28/03/08 /28/08

7. Los cuasi-experimentos en psicología a menudo emplean posible para asegurarse de que el color del cabello fuera el
variables de sujeto. Estas variables son medidas como la edad, único aspecto en el que diferían las personas en las
el coeficiente intelectual, la salud mental, la altura, el color del diversas condiciones. El emparejamiento suele ser una
cabello, el sexo y la miríada de otras características que herramienta útil para estos fines, pero se debe estar seguro
difieren de una persona a otra. Tales variables se determinan de que la posibilidad de artefactos de regresión no empaña
a posteriori, ya que muchas veces son disposiciones heredadas las conclusiones.
(o al menos, las personas llegan al estudio psicológico con la 9. La regresión a la media se refiere al hecho de que cuando
variable ya determinada). Debido a que no es posible asignar un subgrupo con puntuaciones extremas se toma de un
personas al azar a las condiciones de interés, los estudios que grupo más grande y se vuelve a evaluar, los miembros
usan variables de sujetos son inherentemente de naturaleza tenderán a obtener una puntuación más cercana a la media
correlacional. de todo el grupo en la segunda prueba. Si, al emparejar
dos grupos sobre la base de una primera prueba, el
8. Para intentar afirmaciones de causa y efecto a partir de la investigador está tomando puntajes altos de un grupo al
manipulación de las variables de los sujetos, los investigadores que generalmente le va mal y puntajes bajos de un grupo
de diez emparejan a los sujetos con otras variables. Por lo al que generalmente le va bien, incluso si los grupos no
tanto, si un investigador estuviera interesado en los efectos del cabello reciben un trato diferente en un experimento, el investigador
color en el desempeño en alguna tarea o en la reacción puede esperar que obtengan puntajes diferentes en una
de otros en alguna situación, él o ella intentaría controlar segunda prueba, simplemente debido a la regresión a la
tantas otras variables media. Este problema se conoce como artefacto de regresión.
ÿ TÉRMINOS CLAVE
abscisa
base Interacción
nivel
diseño entre sujetos
Efecto techo pareo
condición de control diseño mixto
resultados nulos
grupo de control
control variable ordenada
contrapeso cuasi-experimentos
experimento crítico asignación aleatoria
datos Selección aleatoria
características de la demanda aleatorización
variable dependiente artefacto de regresión

efectos diferenciales de arrastre regresión a la media
experimento doble ciego muestreo
experimento diseño de n pequeña
efectos del experimentador estabilidad

efecto de oreja a oreja sujeto variable
efectos de la práctica general sinergismo
Efecto Hawthorne experimento de qué pasaría si
variable independiente diseño dentro de los sujetos
59533_04_ch03_p051-081.indd 80 9533_04_ch03_p051-081.indd 80 28/03/08 /28/08

1. Diseña un experimento para descubrir por qué a los plomeros se les ilustrar la interacción y la falta de interacción. Etiqueta
paga más que a los profesores universitarios. Tome una muestra cuidadosamente sus gráficos.
aleatoria de plomeros y profesores. Haga que la mitad de cada 4. Explique la cita de Beveridge al comienzo de este capítulo.
grupo realice el trabajo de la otra ocupación, mientras que la otra
ocupación (a) observa en silencio o (b) ofrece consejos. Nombre 5. Supón que quisieras determinar si las personas con narices largas
las variables dependientes, independientes y de control que tienen mejor sentido del humor que las personas con narices más
seleccionaría para este experimento. ¿Cuáles son algunos de los cortas. La longitud de la nariz es, por supuesto, una variable del
problemas de diseño asociados con tal experimento? sujeto. Decides dar a dos grupos de personas con narices de
diferente tamaño una serie de 20 chistes (que los expertos han
2. Transforme cada uno de los siguientes problemas o enunciados en calificado como excelentes) para ver si les gustan más a las
al menos dos hipótesis comprobables: personas con narices largas que a las de narices cortas. ¿Qué
(a) No puedes enseñarle nuevos trucos a un perro viejo. pasos tomaría para asegurarse de que alguna otra variable no se
(b) Comer comida chatarra baja tu calificación confundiera con la longitud de la nariz en sus dos grupos de
promedio. personas? ¿Cómo haría para seleccionar a las personas para el
(c) Un centavo ahorrado es un centavo ganado. estudio, suponiendo que tuviera 200 personas para quienes tuviera
(d) La mejor manera de estudiar es abarrotar la noche medidas de la longitud de la nariz y muchas otras características?
antes de un examen.
3. Crea un experimento ficticio con dos variables independientes.

Dibujar resultados hipotéticos que
CONEXIONES WEB
Explore la presentación paso a paso de "Experimentos verdaderos" en las actividades del Centro
de Recursos de Psicología de Wadsworth, Estadísticas y Métodos de Investigación en:
Puede encontrar un curso completo de métodos de investigación con numerosos enlaces a una
variedad de temas importantes en psicología experimental en:
http://trochim.human.cornell.edu
Puede encontrar un conjunto de experimentos en línea galardonados en:
www.psychologie.unizh.ch/somi/ulf/lab/webexppsylab.html
59533_04_ch03_p051-081.indd 81 9533_04_ch03_p051-081.indd 81 28/03/08 /28/08

CAPÍTULO 4
ÉTICA EN
PSICOLÓGICO
INVESTIGAR
INVESTIGACIÓN CON PARTICIPANTES HUMANOS

Consentimiento informado y engaño
Libertad de retiro
Protección contra daños y debriefi ng
Eliminación de consecuencias dañinas
Confidencialidad
ÉTICA EN LA INVESTIGACIÓN CON ANIMALES

Argumentos en contra de la investigación con animales
Argumentos a favor de la investigación con animales

Directrices para el uso de animales en la investigación
FRAUDE CIENTÍFICO
MONITOREO DE PRÁCTICAS ÉTICAS
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
LECTURAS SUGERIDAS
PSICOLOGÍA EN ACCIÓN: COMPRENSIÓN
Y RECORDANDO LOS FORMULARIOS DE CONSENTIMIENTO
59533_05_ch04_p082-098.indd 82 9533_05_ch04_p082-098.indd 82 28/03/08 /28/08

La potencialidad de doble filo del conocimiento científi co plantea problemas éticos
para todos los científicos. En la medida en que la investigación psicológica aborde
problemas importantes y métodos potentes, los psicólogos deben reconocer y alertar
a otros sobre el hecho de que el potencial de mal uso de la investigación aumenta su
potencial de aplicación constructiva. (ASOCIACIÓN PSICOLÓGICA AMERICANA, 1982
ÿ INVESTIGACIÓN CON PARTICIPANTES HUMANOS
La cita que introduce este capítulo está tomada de una publicación de la Asociación Americana de
Psicología (APA). Proviene de un preámbulo de una larga discusión sobre los principios éticos que cubren
todos los aspectos de la psicología y se presenta aquí de forma abreviada para enfatizar las obligaciones
éticas de los investigadores en todas las áreas de la ciencia. Estas obligaciones son sencillas en principio
pero difíciles de implementar. Examinamos tanto los principios éticos como los problemas asociados con su
puesta en práctica en psicología. Los psicólogos se preocupan por la ética de la investigación en la que
participan tanto seres humanos como animales. Aunque parte de esta preocupación es egoísta, debido al
temor a la restricción de los fondos de investigación y la pérdida de acceso a las poblaciones de sujetos, la
mayoría de los psicólogos son personas éticas que no desean causar daño a nadie.
Un experimentador no puede ser completamente imparcial y objetivo al juzgar las cuestiones éticas
relacionadas con su propia investigación, por lo que la mayoría de las universidades e instituciones de
investigación tienen comités de pares que juzgan la ética de la investigación propuesta. De hecho, dicho
comité debe aprobar cualquier investigación financiada con fondos federales antes de que se otorguen los fon
Varias cuestiones éticas se vuelven obvias en el contexto de un proyecto de investigación real.
Imagine que es un psicólogo interesado en determinar hasta qué punto los sentimientos depresivos influyen
en la forma en que las personas recuerdan. Una razón muy importante por la que desea estudiar este tema
es que la depresión es un problema emocional bastante común entre los estudiantes universitarios y le
gustaría determinar cómo este problema podría afectar el rendimiento académico. Decides hacer un
experimento de laboratorio estrictamente controlado para determinar los efectos de la depresión en la
memoria. Desea inducir la depresión en algunos de sus participantes y luego comparar su memoria con la
de otros que no fueron inducidos a estar deprimidos. Usted induce depresión en sus participantes mediante
un procedimiento ideado por Velten (1968). En este procedimiento, las personas leen en voz alta 60
declaraciones autorreferentes asociadas con el estado de ánimo en cuestión. En este caso, el participante
lee afirmaciones que se supone inducen a la depresión, comenzando con unas relativamente leves, como
“Hoy no es ni mejor ni peor que cualquier otro día”, y progresando a otras más extremas, como “Me siento
tan malo que quisiera irme a dormir y nunca despertar.” El procedimiento de Velten induce una depresión
temporal leve; los participantes informan sentirse deprimidos y su comportamiento se resiente en una
variedad de tareas.
No se han especificado muchos detalles de este experimento, pero debería ser obvio que el bienestar
de los participantes de la investigación en este estudio podría estar en peligro (para obtener detalles
completos de este experimento, consulte Elmes, Chapman y Selig, 1984). Inducir un estado de ánimo
negativo (como la depresión) en estudiantes universitarios podría tener efectos desastrosos en su
funcionamiento social e intelectual. ¿Cómo puede usted, como investigador ético, tratar de preservar y
proteger los derechos humanos fundamentales de sus participantes? ¿Qué haría para proteger su bienestar
y al mismo tiempo realizar un experimento válido internamente?
59533_05_ch04_p082-098.indd 83 9533_05_ch04_p082-098.indd 83 28/03/08 /28/08

En una revisión de la investigación sobre el estado de ánimo y la memoria, Blaney (1986) enumeró una
serie de estudios en los que se inducía la depresión en estudiantes universitarios. En algunos experimentos,
se indujo un estado de ánimo feliz en los sujetos. ¿Dependen las consideraciones éticas del tipo de estado
de ánimo, feliz o triste, que se induce en una persona? Además, los investigadores han utilizado varios
procedimientos diferentes de inducción del estado de ánimo en sus experimentos. Además del procedimiento
de Velten (1968) descrito anteriormente, la hipnosis y la música se han utilizado para inducir un estado de
ánimo deprimido o feliz. ¿Las consideraciones éticas dependen de la técnica de inducción del estado de
ánimo? Estas preguntas relacionadas con la investigación sobre la inducción del estado de ánimo ilustran
cómo las cuestiones éticas asociadas con la investigación psicológica pueden variar de un estudio a otro.
La APA (2002) proporciona pautas éticas para los investigadores. La asociación esbozó los principios
generales que rigen la realización de las prácticas de investigación y publicación. Más adelante en este
capítulo consideraremos la ética en la investigación con animales y el fraude científico.
Ahora examinamos los principios relacionados principalmente con los participantes humanos. Para considerar
cómo se protegió el bienestar de los estudiantes en los estudios de inducción del estado de ánimo, se
describen los ocho principios que guían la investigación con participantes humanos. Lea y comprenda estos
principios éticos antes de realizar un proyecto de investigación.
8.01 Aprobación institucional Cuando 8.03 Consentimiento informado para grabar voces e imágenes
se requiere la aprobación institucional, los psicólogos brindan información precisa en la investigación Los psicólogos obtienen el consentimiento
sobre sus propuestas de investigación y obtienen la aprobación antes de realizar informado de los participantes de la investigación antes de grabar sus voces o
la investigación. Llevan a cabo la investigación de acuerdo con el protocolo de imágenes para la recopilación de datos a menos que (1) la investigación consista
investigación aprobado. únicamente en observaciones naturales en lugares públicos, y no se prevé que
la la grabación se usará de una manera que podría causar identificación personal
8.02 Consentimiento informado para la investigación o daño, o (2) el diseño de la investigación incluye engaño, y el consentimiento
(a) Al obtener el consentimiento informado como se requiere en el para el uso de la grabación se obtiene durante el interrogatorio. (Consulte también
Estándar 3.10, Consentimiento informado, los psicólogos informan a el Estándar 8.07, Engaño en la investigación).
los participantes sobre (1) el propósito de la investigación, la duración

esperada y los procedimientos; (2) su derecho a negarse a participar 8.04 Participantes de investigación de clientes/pacientes, estudiantes y
ya retirarse de la investigación una vez iniciada la participación; (3) las subordinados (a) Cuando los psicólogos realizan investigaciones con clientes/
consecuencias previsibles de rechazar o retirar; (4) factores pacientes, estudiantes o subordinados como participantes, los psicólogos toman
razonablemente previsibles que pueden influir en su voluntad de medidas para proteger a los posibles participantes de las consecuencias
participar, como riesgos potenciales, incomodidad o efectos adversos; adversas de rechazar o retirarse de la participación. (b) Cuando la participación
(5) cualquier beneficio prospectivo de la investigación; (6) límites de en la investigación es un requisito del curso o una oportunidad para obtener
confidencialidad; (7) incentivos para la participación; y (8) a quién créditos adicionales, se le da al posible participante la opción de actividades
contactar si tiene preguntas sobre la investigación y los derechos de alternativas equitativas.
los participantes de la investigación. Brindan la oportunidad a los
posibles participantes de hacer preguntas y recibir respuestas. (Ver
8.05 Prescindir del consentimiento informado para la
también Estándares 8.03, Consentimiento informado para grabar voces investigación
e imágenes en investigación; 8.05, Prescindir del consentimiento Los psicólogos pueden prescindir del consentimiento informado
informado para investigación; y 8.07, Engaño en investigación). solo (1) cuando no se suponga razonablemente que la
investigación genere angustia o daño e involucre (a) el estudio de
(b) Los psicólogos que realizan investigaciones de intervención que prácticas educativas normales, planes de estudio o métodos de
implican el uso de tratamientos experimentales aclaran a los participantes gestión del aula realizados en entornos educativos; (b) solo se
al inicio de la investigación (1) la naturaleza experimental del tratamiento; protegen los cuestionarios anónimos, las observaciones naturalistas
(2) los servicios que estarán o no estarán disponibles para el(los) o la investigación de archivo para los cuales la divulgación de las
grupo(s) de control, si corresponde; (3) los medios por los cuales se respuestas no pondría a los participantes en riesgo de responsabilidad
realizará la asignación a los grupos de tratamiento y control; (4) penal o civil ni dañaría su posición financiera, empleabilidad o
alternativas de tratamiento disponibles si una persona no desea reputación, y la confidencialidad; o (c) el estudio de factores
participar en la investigación o desea retirarse una vez que ha comenzado relacionados con la efectividad del trabajo o de la organización
el estudio; y (5) compensación por los costos monetarios de la realizado en entornos organizacionales en los que no hay riesgo para
participación, incluido, si corresponde, si se buscará el reembolso del la empleabilidad de los participantes y la confidencialidad está
participante o de un tercero pagador. (Consulte también el Estándar protegida o (2) donde lo permita la ley o las reglamentaciones
8.02a, Consentimiento informado para la investigación). federales o institucionales.
59533_05_ch04_p082-098.indd 84 9533_05_ch04_p082-098.indd 84 28/03/08 /28/08

8.06 Ofrecimiento de incentivos para la participación en la participación, pero no más tarde de la conclusión de la recopilación de
investigación (a) Los psicólogos hacen esfuerzos razonables para evitar datos, y permitir que los participantes retiren sus datos.
ofrecer incentivos financieros o de otro tipo excesivos o inapropiados para (Ver también Estándar 8.08, Resumen de.)
la participación en la investigación cuando es probable que dichos 8.08 Informe (a) Los
incentivos coaccionen la participación. psicólogos brindan una oportunidad rápida para que los participantes
(b) Al ofrecer servicios profesionales como incentivo para la participación obtengan información adecuada sobre la naturaleza, los resultados y las
en la investigación, los psicólogos aclaran la naturaleza de los servicios, conclusiones de la investigación, y toman medidas razonables para corregir
así como los riesgos, obligaciones y limitaciones. (Ver también Estándar cualquier concepto erróneo que los participantes puedan tener y del cual
6.05, Trueque con Clientes/Pacientes.) los psicólogos estén al tanto.
8.07 Engaño en la investigación (a) (b) Si los valores científicos o humanos justifican retrasar o retener esta
Los psicólogos no realizan un estudio que involucre engaño a menos información, los psicólogos toman medidas razonables para reducir el riesgo
que hayan determinado que el uso de técnicas engañosas está justificado de daño.
por el valor científico, educativo o aplicado prospectivo significativo del
(c) Cuando los psicólogos se dan cuenta de que los procedimientos de
estudio y que los procedimientos alternativos efectivos no engañosos son
investigación han dañado a un participante, toman medidas razonables para
necesarios. no factible. minimizar el daño.1
(b) Los psicólogos no engañan a los posibles participantes acerca de

1
investigaciones de las que se espera razonablemente que causen dolor Fuente: De “Principios éticos de los psicólogos y código de
físico o angustia emocional grave. Código de Ética APA 2002 Página 12 conducta”, (2002). American Psychologist, 57, 1060–1073 (también
en línea en www.apa.org/ethics/code2002.html); Pequeño extracto de
c) Los psicólogos explican cualquier engaño que sea una característica
“Pautas para una conducta ética en el cuidado y uso de animales” (1996)
integral del diseño y la realización de un experimento a los participantes tan (de www.apa.org/science/aguide.html). Copyright © 2002, 1996 por la
pronto como sea posible, preferiblemente al final de su Asociación Americana de Psicología. Reproducido con autorización.
Consentimiento informado y engaño

El investigador ético informa a los participantes, antes de la participación, de todos los aspectos
de la investigación que razonablemente podrían influir en la voluntad de participar y explica todos
los demás aspectos de la investigación sobre los cuales preguntan los participantes. Esto significa
que los participantes deben ser advertidos sobre aquellos aspectos de la investigación que pueden
tener efectos perjudiciales. En la mayoría de las investigaciones psicológicas, los participantes
reciben información completa sobre lo que se les pedirá que hagan durante el proyecto de
investigación para que puedan dar su consentimiento informado sobre su comprensión de los
posibles problemas asociados con la participación. Los participantes rara vez son engañados en
cuanto a la naturaleza de las experiencias que tendrán durante el experimento. Además, un
experimentador generalmente establece el propósito del procedimiento experimental con veracidad.
No obstante, los experimentadores a veces engañan a los participantes sobre el verdadero
propósito de un experimento. Esta descripción falsa a menudo se denomina "historia de portada".
Este tipo de engaño se suele hacer para controlar la reactividad del sujeto. Por ejemplo, un
investigador interesado en saber si las personas se comportan de manera más asertiva en grupos
del mismo género que en grupos mixtos les dice a las personas que trabajarán en problemas que
requieren la cooperación del grupo. También se les dice que el propósito del experimento es evaluar
Al investigador le preocupaba que el comportamiento de los participantes pudiera cambiar si
conocían el propósito real del experimento. En este caso, la información sobre la hipótesis bajo
prueba probablemente no cambiará la decisión de participar de nadie, pero esta información
podría cambiar el desempeño en la tarea. El engaño de este tipo, aunque por lo general es
inofensivo, se debe considerar cuidadosamente porque el consentimiento del participante no está
completamente informado. Una persona puede optar por no participar en un experimento en
particular porque no aprueba el propósito del experimento.
Aún más raro que el engaño sobre el propósito de un experimento es el engaño sobre las
experiencias que el participante tendrá durante el experimento.
59533_05_ch04_p082-098.indd 85 9533_05_ch04_p082-098.indd 85 28/03/08 /28/08

Desafortunadamente, tal engaño es necesario para responder algunas preguntas de investigación. Por
ejemplo, si un investigador quiere ver qué tan bien las personas recuerdan información que no están
tratando de recordar activamente, es posible que no informe a los participantes que el experimento
requiere una prueba de memoria. Obviamente, la omisión de información impide que los participantes
den su consentimiento plenamente informado.
Así, cada vez que una pregunta de investigación requiere engaño, el investigador ético se enfrenta
a un dilema. Se debe advertir a las personas si el procedimiento las pondrá en peligro grave de daño
físico o psicológico. El engaño en tales casos es claramente poco ético. Cuando un procedimiento
implica solo riesgos menores, por otro lado, la decisión sobre la divulgación completa a los participantes
es más difícil. En todos los casos, los beneficios potenciales de la investigación deben sopesarse frente
a los costos reales y potenciales para el participante. Sin embargo, los participantes siempre deben
recibir la mayor cantidad de información posible y deben saber que pueden finalizar su participación en
cualquier momento sin consecuencias negativas.
Reexaminemos el experimento de depresión y memoria que discutimos anteriormente,
centrándonos en la cuestión del consentimiento informado. A las personas que se inscribieron para
participar se les dijo que algunas de las cosas que iban a hacer en el experimento podrían hacer que
se sintieran infelices y se les dio la oportunidad de negarse a participar. La naturaleza específica de la
manipulación, como la técnica de Velten y quién iba a servir en el grupo experimental, no se reveló con
anticipación. Las personas pueden haber reaccionado de manera inusual si supieran todos los detalles.
Como se sabía que los efectos de la inducción del estado de ánimo eran temporales, los investigadores
creyeron que la información parcial era suficiente para permitir el consentimiento informado. Aquí,
aunque se omitió alguna información, no se engañó a los participantes sobre qué esperar del
experimento.
Los problemas relacionados con el consentimiento informado y el engaño a menudo requieren
una reflexión y una deliberación considerables para llegar a soluciones éticas. Cada institución de
investigación en este país debe tener un comité permanente que debe aprobar cualquier procedimiento
experimental que involucre sujetos humanos. Estos comités tratan de asegurar el trato ético de los
participantes experimentales. Discutiremos estos comités con más detalle más adelante.
En resumen, el consentimiento plenamente informado es la norma en la mayoría de las áreas de
la psicología. Ocasionalmente, se oculta alguna información o se engaña a los participantes para evitar
la reactividad del sujeto. En tales casos, los experimentadores, así como los miembros de las juntas de
revisión institucional, tienen mucho cuidado al decidir si los beneficios del procedimiento superan los
riesgos para los participantes.
Libertad de retiro
Como se mencionó brevemente en la sección anterior, los participantes deben poder negarse a
participar o retirarse en cualquier momento. Además, pocas personas negarían que las personas que
no están contentas con participar deberían tener la libertad de retirarse.
¿Dónde, entonces, está el dilema ético? El principal problema gira en torno a la definición de un
participante voluntario dispuesto. Considere el grupo de sujetos para el experimento de depresión y
memoria: estudiantes universitarios (en su mayoría estudiantes de primer y segundo año) que toman
psicología introductoria. Se registran para participar en experimentos y, por lo general, reciben algún
tipo de crédito de curso por su servicio. ¿Se ofrecen como voluntarios cuando se inscriben o están bajo
algún tipo de coerción que han inferido de la situación? Si los estudiantes realmente reciben crédito
adicional, es probable que actúen por su propia voluntad. Si deben participar como parte de un requisito
del curso, entonces el
59533_05_ch04_p082-098.indd 86 9533_05_ch04_p082-098.indd 86 28/03/08 /28/08

la libertad de participar o no es menos obvia. Cuando se requiere que los estudiantes participen,
deben tener alguna forma opcional de cumplir con el requisito, como escribir un artículo o asistir a
una conferencia especial.
Generalmente, cuando el grupo de participantes potenciales es una audiencia cautiva, como
estudiantes, prisioneros, reclutas militares y empleados del experimentador, el investigador ético
considera la libertad del individuo para retirarse o participar. En el experimento de depresión y
memoria, se reclutaron estudiantes voluntarios con el atractivo de obtener créditos adicionales (la
participación no era obligatoria). Cuando se inscribieron, se les advirtió sobre la posibilidad de
infelicidad (pueden aceptar participar o no). Las instrucciones al principio del experimento les
informaban que tenían la opción de dejarlo en cualquier momento y que aún recibirían el crédito
extra completo (eran libres de retirarse).
Protección contra daños y debriefi ng

La APA sugiere una salvaguarda adicional para brindar a los participantes de la investigación
protección contra daños. Los sujetos deben tener una forma de contactar al investigador luego
de su participación en la investigación. Incluso el proyecto más escrupulosamente ético del tipo de
riesgo mínimo puede tener efectos secundarios no deseados. Por lo tanto, el participante debe
poder recibir ayuda o consejo del investigador si surgen problemas. Hemos tenido participantes
llorando (de frustración y vergüenza) durante lo que se suponía que era un experimento de memoria
estándar e inocuo. Esos participantes pueden haberse llevado del experimento una imagen negativa
de sí mismos o fuertes sentimientos de resentimiento hacia el experimentador en particular o la
investigación en general.
Debido a tales efectos no deseados, el investigador prudente brinda un informe detallado, lo
que significa que el investigador explica los propósitos generales de la investigación.
Además, el investigador describe completamente las manipulaciones para eliminar cualquier

duda o malentendido.
Apliquemos los principios de debriefi ng y protección del daño al experimento de la depresión
y la memoria. Al final de ese proyecto, a los participantes se les dio una lista de números de teléfono
de personas a las que se podía contactar en el improbable caso de que los sujetos se sintieran
deprimidos después del experimento. La lista de contactos incluía al investigador principal, un
consejero y el decano de asuntos estudiantiles y su asistente.
Además, el día después de la participación, uno de los experimentadores, que trató de determinar
si el participante estaba teniendo algún efecto secundario negativo, llamó por teléfono a cada sujeto
que había leído las declaraciones inductoras de depresión.
Los participantes recibieron un informe exhaustivo. Se les informó sobre el procedimiento de
inducción del estado de ánimo y cómo sus efectos eran temporales. El experimentador respondió a
las preguntas de los participantes.
Eliminación de consecuencias dañinas

Informar a los participantes y darles números de teléfono puede no ser suficiente en un proyecto
arriesgado. Si un participante pudiera sufrir consecuencias a largo plazo como resultado de
participar en un proyecto de investigación, el investigador tiene la responsabilidad de eliminar las
consecuencias dañinas.
59533_05_ch04_p082-098.indd 87 9533_05_ch04_p082-098.indd 87 28/03/08 /28/08

Los sentimientos de las personas resentidas pueden ser difíciles de revertir, porque el resentimiento
puede ser involuntario y no detectado. Sin embargo, el investigador ético debe tomar medidas para
minimizar los riesgos conocidos.
Antes del informe en el experimento de depresión y memoria, los participantes leyeron una serie
de declaraciones autorreferenciales diseñadas para inducir la euforia. Se suponía que este ejercicio
contrarrestaría los efectos del estado de ánimo negativo inducido anteriormente. Luego se les preguntó
a los participantes sobre sus sentimientos actuales y también se les pidió que firmaran una declaración
que decía que no se sentían peor que cuando comenzaron el experimento. Todos los participantes
firmaron la declaración, pero si no lo hubieran hecho, un plan contingente era mantenerlos en el
laboratorio bajo la supervisión de uno de los experimentadores hasta que se sintieran mejor.
Confidencialidad
Lo que hace una persona en un experimento debe ser confidencial a menos que se acuerde lo contrario.
Un investigador ético no anda diciendo cosas como “Bobby Freshman es estúpido; lo hizo peor
que nadie en mi experimento”. Además, la información personal sobre participantes particulares, como
sus actitudes hacia el sexo prematrimonial o los ingresos familiares, no debe revelarse sin su permiso.
El principio de confidencialidad parece sencillo, pero un investigador puede enfrentarse a un dilema
ético cuando trata de mantener la confidencialidad.
Este dilema surgió en el experimento de la depresión y la memoria. El experimentador se enfrentó

a un problema ético porque creía que era necesario violar el principio de confidencialidad para defender
el principio de protección contra daños. ¿Cómo se desarrolló este dilema? Una de las primeras tareas
de los participantes fue responder algunas preguntas sobre su salud mental. Indicaron si actualmente
buscaban ayuda profesional para un problema personal. Si lo eran, proporcionaron algunos detalles
sobre el problema y el procedimiento terapéutico. Se aseguró a los participantes que sus respuestas
eran confidenciales. Luego completaron una prueba clínica que evaluó su nivel actual de depresión. Si
un participante indicaba que estaba siendo tratado por depresión y obtenía una puntuación alta en la
prueba, el experimento se interrumpía en ese momento. Los investigadores querían minimizar el daño y
maximizar las respuestas francas y abiertas asegurando a los estudiantes la naturaleza confidencial de
sus respuestas y usando la prueba de depresión para evitar que una persona deprimida se deprimiera
aún más por el procedimiento de inducción del estado de ánimo. Sin embargo, surgió un dilema ético.
En el transcurso del experimento, dos estudiantes obtuvieron puntajes muy altos en la prueba de
depresión y uno de ellos no estaba en terapia. Debido a que se sabía que la prueba era un predictor
confiable y válido de depresión clínicamente grave, el investigador principal creyó que era necesario
advertir a uno de los consejeros de la universidad sobre los dos estudiantes que parecían tener niveles
muy altos de depresión. Luego, bajo la apariencia de una entrevista de rutina, el consejero habló con
estos estudiantes.
Este tipo de dilema se presenta con frecuencia en la investigación. Para adherirse a un principio
ético puede ser necesario violar otro. Las opciones fáciles se desvanecen cuando esto sucede.
En el caso que mencionamos, si los estudiantes muy deprimidos hubieran sospechado que el
investigador había traicionado su confianza, se podría haber producido un resentimiento y una
desconfianza permanentes.
59533_05_ch04_p082-098.indd 88 9533_05_ch04_p082-098.indd 88 28/03/08 /28/08

Por otro lado, el investigador no podía ignorar el hecho de que estos estudiantes, en particular el
que no estaba en terapia, estaban muy angustiados. En ese momento, asegurar que los estudiantes
recibieran ayuda parecía mucho más importante que defender su derecho a la confidencialidad.
Como ilustra nuestro ejemplo, las decisiones éticas a veces deben tomarse sobre la base de
preocupaciones pragmáticas. En otras palabras, las personas involucradas en la toma de decisiones
sobre un proyecto de investigación deben concentrarse en cómo proteger mejor a los participantes y, al
mismo tiempo, realizar un proyecto significativo y válido. La responsabilidad de la práctica ética recae
en el investigador, las juntas de revisión y los editores de revistas que revisan la investigación para su pub
En casos limitados, un investigador podría justificar el engaño, el ocultamiento y la violación de la
confidencialidad. Sin embargo, tales prácticas éticas cuestionables deben evitarse en la medida de lo
posible. Las violaciones éticas no son requisitos previos de una buena investigación.
ÿ ÉTICA EN LA INVESTIGACIÓN CON ANIMALES
Aunque la mayor parte de la investigación en psicología contemporánea se centra en los seres humanos,
un número apreciable de estudios se centran en los animales (Miller, 1985). Los animales a menudo se
utilizan para responder preguntas que serían imposibles o poco prácticas de responder utilizando seres
humanos. Algunas personas creen, sin embargo, que los animales no deben usarse en varios tipos de
investigación (Bowd, 1980). Por ejemplo, Rollin (1985) ha argumentado que si el concepto de derechos
legales y morales se puede aplicar a la investigación humana, también se puede aplicar de la misma
manera a la investigación animal. Sugirió que el estatus de la investigación con animales debe elevarse
al de sujetos humanos, con muchas de las mismas reglas que rigen la investigación humana aplicadas
a los animales. Los informes en los medios han discutido el supuesto maltrato de los animales de
laboratorio y los intentos de los defensores de los derechos de los animales de limitar el uso de animales
en la investigación. Por lo tanto, es importante considerar por qué se utilizan animales en la investigación
y es necesario comprender las salvaguardias éticas para los animales.
Los animales también son objeto de investigación porque son interesantes y porque forman una
parte importante del mundo natural. El número de observadores de aves y otros naturalistas aficionados,
así como los numerosos psicólogos comparativos y etólogos, dan fe del interés. Sin embargo, más
importante en términos de preocupaciones éticas es que los animales sirven como modelos convenientes
y altamente controlados para los humanos y otros animales. La APA (2003b) proporciona información
adicional sobre el uso de animales en la investigación psicológica.
Argumentos en contra de la investigación con animales
La ética prohíbe el daño cerebral inducido experimentalmente en seres humanos, excluye la separación
deliberada de un bebé humano de sus padres, prohíbe probar drogas desconocidas en seres humanos
y, en general, excluye manipulaciones peligrosas e irreversibles en seres humanos. Los defensores de
los derechos de los animales creen que la investigación con animales debería tener las mismas
prohibiciones. Según los defensores de los derechos de los animales, los investigadores deben defender
los derechos tanto de los seres humanos como de los animales porque, por ejemplo, creen que la
destrucción experimental del cerebro de un mono es tan éticamente reprobable como la destrucción del
cerebro de un ser humano. Tres puntos resumen los derechos de los animales
59533_05_ch04_p082-098.indd 89 9533_05_ch04_p082-098.indd 89 28/03/08 /28/08

la posición de los defensores: (1) Los animales sienten dolor y sus vidas pueden ser destruidas, como ocurre
con los humanos (Roberts, 1971); (2) destruir o dañar cualquier ser vivo es deshumanizar al científico humano
(Roberts, 1971); y (3) las afirmaciones acerca de que el progreso científi co está siendo ayudado por la
investigación con animales son una forma de racismo y, al igual que la intolerancia interracial, son
completamente injustificadas y poco éticas. El descuido de los derechos e intereses de otras especies ha
sido llamado especismo por Singer (1995). La mayoría de los psicólogos tienen reservas sobre estos puntos,
que consideraremos a continuación.
Argumentos a favor de la investigación con animales
El primer punto es que los animales sienten dolor y sufrimiento. Ciertamente, esto es cierto, pero existen
estándares éticos en todas las disciplinas científi cas que utilizan animales como sujetos de investigación.
Una parte importante de estos principios se refiere a la proscripción del dolor indebido y el trato inhumano.
Ningún psicólogo ético infligiría deliberadamente un daño indebido a un animal.
Cuando se inflige dolor y sufrimiento a un animal, es solo después de una deliberación considerable por
parte del científico y las juntas de revisión de ética correspondientes. Tales deliberaciones sopesan el
sufrimiento del animal contra los beneficios potenciales del experimento. Sólo cuando los beneficios superan
con creces los daños se aprueba y se lleva a cabo el experimento.
Finalmente, un punto importante a destacar sobre la investigación del comportamiento en animales es que
gran parte de ella no implica dolor o daño físico para ellos.
El segundo punto de la plataforma de los derechos de los animales es que la destrucción de cualquier
ser vivo deshumaniza al científico humano. Presumiblemente, las plantas no deben incluirse aquí, ya que,
como seres humanos, debemos destruir las plantas, si no los animales, para sobrevivir. Incluso si esta
prohibición de matar seres vivos se limita a los animales, tiene una serie de implicaciones graves más allá de
la eliminación de la investigación con animales. Si uno usa este argumento en contra de la investigación con
animales, entonces no debe comer carne de ningún tipo. Asimismo, no se debe utilizar ningún producto
derivado de la destrucción de animales (p. ej., cuero).
Finalmente, si la destrucción de animales es deshumanizante, ¿no es también deshumanizador beneficiarse
de la destrucción de animales? Si es así, entonces un verdadero creyente en los derechos de los animales
debería abandonar la mayoría de las maravillas de la medicina moderna porque prácticamente todas se
beneficiaron de la investigación con animales. Sin embargo, la adhesión constante a una creencia en los
derechos de los animales suele ser difícil. La dificultad quedó ilustrada en los resultados de una encuesta de
activistas que asistieron a una gran manifestación en apoyo de los derechos de los animales (Plous, 1991).
Plous informa que un porcentaje sustancialmente mayor de activistas afirma ser vegetariano o vegano
(personas que no comen productos de origen animal, incluidos la leche y los huevos) que la gente en general.
Muchos activistas dicen que no usan artículos de cuero. Sin embargo, la mayoría de los activistas por los
derechos de los animales (53 por ciento) informan que compran artículos de cuero, ingieren carne de animales o a
Finalmente, existe la acusación de que el progreso científico a expensas de los animales es simplemente
especismo, la creencia de que el sacrificio de miembros de otras especies está justificado si nuestra especie
se beneficia. Como crítica contra la investigación con animales, este argumento ignora el hecho de que una
cantidad significativa de la investigación con animales beneficia el bienestar de los animales. Por ejemplo,
Miller (1985) señala que la investigación sobre la aversión al gusto aprendida en ratas ha llevado a nuevos
medios no letales para mantener a los coyotes alejados de las ovejas y a los cuervos de los cultivos. De
manera similar, la investigación sobre la impronta de los patos recién nacidos a los cuidadores humanos
condujo a una mejor preparación de los polluelos de cóndor incubados artificialmente para la naturaleza.
En cualquier caso, incluso si utilizar animales en beneficio de los seres humanos es una forma de
especismo, es dudoso que muchas personas renuncien a los beneficios ya logrados o
59533_05_ch04_p082-098.indd 90 9533_05_ch04_p082-098.indd 90 28/03/08 /28/08

incluso renunciar a los posibles beneficios futuros derivados de la investigación con animales. Considere
esta cita de Robert J. White, un eminente neurocientífico y neurocirujano, quien realizó una investigación
en monos que implicaba extirpar el cerebro del animal:
Mientras escribo este artículo, revivo mis vívidas experiencias de ayer cuando extirpé en la operación
un gran tumor del cerebelo y el tronco encefálico de un niño pequeño. Esta fue una empresa quirúrgica
que habría sido imposible hace unas décadas, muy peligrosa hace unos años, pero hoy en día,
gracias a la extensa experimentación en los cerebros de animales inferiores, se lleva a cabo
rutinariamente con un alto grado de seguridad. (1971, pág. 504)
Además de los beneficios de la neurocirugía experimental, se derivan numerosos beneficios de la

investigación del comportamiento con animales. Miller (1985) señala que los experimentos psicológicos
con animales han producido beneficios directos en el tratamiento de problemas psicológicos tan diversos
como mojar la cama, fobias, trastornos compulsivos como la anorexia nerviosa y la depresión. Además,
los experimentos con animales han dado lugar a tecnologías conductuales como la biorretroalimentación
que se han utilizado para ayudar a las personas con trastornos neuromusculares a recuperar el control
de sus cuerpos. La investigación psicológica con animales también ha demostrado experimentalmente el
vínculo entre el estrés psicológico y la salud física. Otros estudios han demostrado que los efectos
perjudiciales de separar físicamente a un bebé de sus padres, como es necesario cuando un recién
nacido debe ser colocado en una incubadora para mantener su vida, pueden revertirse en gran medida
simplemente acariciando al bebé durante tres períodos de 15 minutos durante El dia. Miller señala los
beneficios sustanciales de la investigación psicológica en animales, contrariamente a lo que afirman
algunos activistas por los derechos de los animales (Plous, 1991).
Gallup y Suarez (1985) revisaron la justificación, el alcance y el uso de animales en la investigación

psicológica. Consideraron las posibles alternativas y concluyeron que, en muchos casos, no existe una
alternativa viable al uso de animales en la investigación psicológica. El apoyo profesional para el uso de
animales tanto en la investigación como en la docencia se ha mantenido alto incluso cuando el uso de
animales en la investigación ha disminuido con el tiempo (Rowan y Lowe, 1995). El ochenta por ciento de
los encuestados en una encuesta de miembros de la APA indicaron un apoyo general a la investigación
con animales (Plous, 1996a). Se obtuvieron resultados similares de una muestra de licenciaturas en
psicología (Plous, 1996b). Los psicólogos no apoyaron uniformemente todas las investigaciones con
animales. Muchos desaprobaron los estudios relacionados con el dolor o la muerte, y la mayoría apoyó la
protección federal de ratas, ratones y pájaros equivalente a la prevista para los primates (Plous, 1996a).
Directrices para el uso de animales en la investigación
Los psicólogos se han centrado en el trato humano y ético de los animales utilizados en la investigación
durante mucho tiempo (Greenough, 1992). Por ejemplo, una de las primeras declaraciones sobre el trato
humanitario (Young, 1928) afirmaba que los animales utilizados como sujetos de investigación tratados
“. . . serán
amablemente, alimentados adecuadamente y sus alrededores mantenidos en las mejores condiciones
sanitarias posibles” (p. 487). Esta preocupación se refleja en las modernas directrices de la APA (2003a)
que rigen la investigación con animales, que establecen como principio general lo siguiente:
La psicología abarca una amplia gama de áreas de investigación y esfuerzos aplicados.

Partes importantes de estos esfuerzos son la enseñanza y la investigación sobre el comportamiento
de los animales no humanos, que contribuyen a la comprensión de los principios básicos subyacentes.
59533_05_ch04_p082-098.indd 91 9533_05_ch04_p082-098.indd 91 28/03/08 /28/08

comportamiento y al avance del bienestar de los animales humanos y no humanos. Claramente,
los psicólogos deben realizar su enseñanza e investigación de manera acorde con las leyes y
reglamentos pertinentes. Además, las preocupaciones éticas exigen que los psicólogos
consideren los costos y beneficios de los procedimientos que involucran animales antes de
continuar con la investigación. (pág. 1)
Como en prácticamente cualquier empresa humana, a veces se producen abusos del trato humano
en el uso de animales en la investigación. Sin embargo, estos abusos van en contra de la práctica
estándar de los investigadores de animales. Los investigadores éticos tratan a los animales con
humanidad. Cuando se descubre un trato poco ético a los animales, los investigadores en cuestión deben
ser sancionados. No se debe concluir que debido a que ocurren abusos, se debe prohibir la investigación con
La visión típica de los activistas por los derechos de los animales (Plous, 1991) se basa en una posición
filosófica, y esta posición prohíbe el uso de animales para beneficio humano como regla general, no solo
para investigación. Debe decidir por sí mismo qué actitud tomar hacia la investigación con animales, pero
la importancia del tema requiere que considere críticamente cada lado del debate y sus implicaciones.
El siguiente principio describe las consideraciones principales para los investigadores que utilizan
animales como se especifica en el código de ética de la APA (2002). Una especificación más detallada
de estos principios se encuentra en las Pautas para la conducta ética en el cuidado y uso de animales de
la APA (2003a).
8.09 Cuidado humanitario y uso de animales en la investigación (a) (e) Los psicólogos usan un procedimiento que somete a los animales a
Los psicólogos adquieren, cuidan, usan y disponen de animales de dolor, estrés o privación solo cuando no se dispone de un procedimiento
conformidad con las leyes y reglamentos federales, estatales y locales alternativo y el objetivo está justificado por su valor científico, educativo o
vigentes, y con los estándares profesionales. aplicado prospectivo.
(b) Psicólogos capacitados en métodos de investigación y con experiencia (f) Los psicólogos realizan procedimientos quirúrgicos bajo la anestesia
en el cuidado de animales de laboratorio supervisan todos los procedimientos adecuada y siguen técnicas para evitar infecciones y minimizar el dolor
que involucran a los animales y son responsables de garantizar la durante y después de la cirugía.
consideración adecuada de su comodidad, salud y trato humanitario. (g) Cuando sea apropiado que se termine con la vida de un animal, los
(c) Los psicólogos se asegurarán de que todas las personas bajo su psicólogos procederán rápidamente, con un esfuerzo por minimizar el dolor
supervisión que utilicen animales hayan recibido instrucción en métodos de y de acuerdo con los procedimientos aceptados.1
investigación y en el cuidado, mantenimiento y manejo de las especies
utilizadas, en la medida adecuada a su función. (Consulte también la Norma
2.05, Delegación del trabajo a terceros).
1
Fuente: Asociación Americana de Psicología. (2002). Principios éticos
(d) Los psicólogos hacen esfuerzos razonables para minimizar la de los psicólogos y código de conducta, 2002. Copyright © 2002 de la
incomodidad, la infección, la enfermedad y el dolor de los sujetos animales. Asociación Americana de Psicología. Reimpreso con permiso.
ÿ FRAUDE CIENTÍFICO
En el Capítulo 13 analizamos el sesgo involuntario del investigador, en el cual el comportamiento del

científico contamina accidentalmente los resultados de un proyecto de investigación. Aquí, en el contexto
de la ética, consideramos el sesgo deliberado de los científicos: el fraude. Cuando los científicos se
dedican a la investigación, dedican mucho tiempo y esfuerzo, y su prestigio y avance profesional a
menudo dependen del éxito de su trabajo. Bajo estas presiones, algunos científicos no son completamente
honestos en el tratamiento de sus experimentos y datos. Los casos de falsificación deliberada pueden
variar desde "falsificar" o "cocinar" datos, en los que los resultados se manipulan para que se vean mejor,
hasta "falsificar" datos, en los que
59533_05_ch04_p082-098.indd 92 9533_05_ch04_p082-098.indd 92 28/03/08 /28/08

se reportan observaciones que de hecho nunca se hicieron (Kohn, 1986). Una encuesta de doctorandos y
profesores de ciencias indica que este tipo de prácticas fraudulentas ocurren con suficiente frecuencia como
para merecer cierta preocupación sobre el estado ético de la ciencia (Swazey, Anderson y Lewis, 1993).
Un ejemplo de engaño citado con frecuencia es el caso de Sir Cyril Burt. Era un psicólogo muy
respetado que estudió el papel de la herencia en la inteligencia. Publicó varios artículos que informan datos
recopilados sobre gemelos idénticos, algunos criados juntos, otros separados. Los datos se recopilaron en
el período de 1913 a 1932. En tres artículos, informó una correlación en las puntuaciones de CI de 0,944
para los gemelos criados juntos y de 0,771 para los gemelos criados por separado. Aunque las correlaciones
fueron idénticas para los tres artículos, cada uno informó un número apreciablemente diferente de sujetos.
Que las correlaciones permanecieran sin cambios a pesar de la adición de nuevos sujetos es extremadamente
improbable. Esta evidencia, junto con otros hechos sospechosos, llevó a algunos científicos e historiadores
a concluir que los datos de Burt no eran completamente honestos (Broad & Wade, 1982; Kohn, 1986).
Hay varios ejemplos de falsificación de datos. Un caso famoso es el del hombre de Piltdown descubierto
en Inglaterra en 1912. El hombre de Piltdown consistía en un cráneo de apariencia humanoide y una
mandíbula simiesca. Los huesos supuestamente representaban el "eslabón perdido" entre los simios y los
humanos. El hallazgo fue ampliamente aceptado, aunque no universalmente, durante 57 años hasta que los
científicos desconfiados utilizaron una variedad de métodos de datación para mostrar que la mandíbula era
de origen moderno, mientras que el cráneo era sustancialmente más antiguo.
Los científicos descubrieron que la mandíbula era idéntica a la de un orangután. Piltdown Man fue un
engaño, pero no se sabe quién ideó el engaño.
El sesgo deliberado del investigador puede ser más sutil que falsificar o incluso falsificar datos. Un
investigador puede optar por no reportar resultados que sean incompatibles con una teoría personal o
incluso con sus creencias políticas o sociales. De manera similar, un científico parcial puede diseñar
proyectos de tal manera que los resultados negativos o ideológicamente malos sean poco probables.
¿Cómo detectamos el fraude? La ciencia se corrige a sí misma. La verdad ganará. Cuando se publica
un hallazgo importante, la comunidad científica lo toma en serio y busca las implicaciones de los datos
informados. Cuando otros científicos intenten repetir el experimento fraudulento, no obtendrán los resultados
informados, y tales fallas eventualmente llevarán a los científicos a concluir que los hallazgos no fueron
reales. Por lo tanto, la repetición de experimentos es importante para detectar el fraude científico (Barber,
1976). Las repeticiones directas y específi cas se llaman replicaciones. Sin embargo, pueden pasar muchas
replicaciones fallidas y años de esfuerzo antes de que toda la comunidad científica esté de acuerdo en que
los resultados fraudulentos deben descartarse, un hecho que ilustra las graves consecuencias del fraude
científico.
Un problema relacionado es el plagio, o atribuirse el mérito de las ideas, datos o palabras de otra
persona. Aunque puede ser obvio para usted que no debe usar los datos de otra persona como propios, el
plagio puede ser mucho menos obvio en otros casos. Si está usando las palabras de otra persona, está
obligado a usar comillas con una cita apropiada. Modificar ligeramente la redacción de la escritura de otra
persona también es inapropiado, especialmente sin la cita adecuada. Para evitar el plagio en este caso,
puede escribir sin mirar directamente la fuente que está describiendo. El caso más complicado puede ser el
del plagio de ideas. Si la idea vino de otra persona, debe darle crédito a esa persona incluso si no la cita
directamente. Un problema potencial es que las personas pueden perder accidentalmente la noción de quién
generó qué ideas, especialmente porque las ideas a menudo se generan en discusiones verbales sobre la
marcha entre colegas. Una forma de evitar este problema es acordar la autoría al comienzo de un proyecto,
dependiendo del progreso del trabajo según lo asignado.
59533_05_ch04_p082-098.indd 93 9533_05_ch04_p082-098.indd 93 28/03/08 /28/08

Resumimos aquí el resto de los principios éticos (8.10–8.15) de la APA (2002). Estos tienen que
ver con la honestidad en la presentación de datos y en las prácticas de publicación.
Los psicólogos ni plagian ni fabrican datos. El crédito de autoría se toma solo por contribuciones
sustanciales al trabajo realmente realizado. El estado no confiere automáticamente crédito de autoría,
y el trabajo de disertación normalmente tiene al estudiante como autor principal.
Los investigadores divulgan adecuadamente la republicación de datos y deben compartir los datos de
investigación con otros profesionales. Finalmente, los revisores de trabajos, subvenciones y propuestas
mantienen la confidencialidad de la información que han revisado.
La mayoría de las juntas de revisión ética, que se analizan en la siguiente sección, monitorean
las prácticas científicas que podrían conducir al fraude científico. Además, las personas garantizan a
las agencias de subvenciones federales que no se han involucrado en prácticas fraudulentas. Al
descubrir el fraude, las agencias otorgantes suspenden la subvención y pueden intentar recuperar los
fondos que se han gastado. Los investigadores culpables de fraude no recibirán subvenciones
adicionales. Por lo tanto, las instituciones y las agencias de subvenciones también juegan un papel en
la contención del fraude.
ÿ MONITOREO DE PRÁCTICAS ÉTICAS
Como ya sabrá, la APA proporciona pautas éticas para la investigación psicológica. La aceptación de
la afiliación a la asociación compromete al miembro a adherirse a estos principios. Los principios
también están destinados a personas que no son miembros, incluidos los estudiantes de psicología y
otras personas que trabajan para un psicólogo.
La APA estableció un Comité de Ética que cumple una serie de propósitos.
A través de publicaciones, reuniones educativas y actividades de convenciones, el Comité de Ética
educa a los psicólogos y al público sobre cuestiones éticas relacionadas con la investigación
psicológica. El comité también investiga y adjudica quejas sobre prácticas de investigación poco éticas.
Se pueden encontrar ejemplos de estos casos en una publicación de APA (1987) titulada Casebook
on Ethical Issues. El Comité de Ética también publica un informe anual en American Psychologist. Los
Principios Éticos de la APA que describimos en este capítulo fueron aprobados en 2002 y entraron en
vigor en junio de 2003.
Una cantidad sustancial de la investigación psicológica está financiada por uno de los brazos del
Servicio de Salud Pública (PHS), que forma parte del Departamento de Salud y Servicios Humanos de
los Estados Unidos. El PHS tiene una división llamada Office of Research In tegrity, que tiene como
deber proteger la integridad de los programas de investigación del PHS. Este es un gran esfuerzo.
Cada año, el PHS proporciona varios miles de millones de dólares para apoyar más de 30 000 becas
de investigación en varias disciplinas, incluida la psicología. La Oficina de Integridad de la Investigación
y la APA se combinan para considerar la prevención del fraude y la protección de los participantes.
Además, cualquier institución que reciba dinero del gobierno federal, lo que significa prácticamente
todas las instituciones estadounidenses que se dedican a la investigación,
debe tener una junta de revisión institucional (IRB) que supervise la protección de los participantes
humanos y un comité institucional de cuidado y uso de animales (IACUC) que supervise la
protección de los sujetos animales. Un investigador envía un protocolo detallado al IRB (o IACUC).
Presuntamente, el protocolo trata de tener en cuenta los principios éticos pertinentes, y los miembros
del comité luego juzgan la ética del proyecto.
Todos los experimentos deben ser aprobados por los miembros de estos comités. Las reglamentaciones
federales requieren que cada IRB tenga al menos cinco miembros que estén calificados para revisar
el tipo de investigación que normalmente se lleva a cabo dentro de la institución. Además, si un IRB
59533_05_ch04_p082-098.indd 94 9533_05_ch04_p082-098.indd 94 28/03/08 /28/08

revisa periódicamente las investigaciones que involucran a personas vulnerables (p. ej., niños,
reclusos, discapacitados mentales), el comité debe incluir al menos un miembro cuyo área de
especialización trate con dichas personas. Debe haber al menos un miembro cuya principal
preocupación sea un área científica y un miembro cuya principal preocupación sea un área no
científica. También debe haber alguien en el comité, generalmente un abogado, que pueda
determinar si la investigación propuesta viola alguna ley o reglamento federal.
Finalmente, las regulaciones requieren que al menos un miembro del comité esté libre de
afiliación a la institución. Esta diversidad de miembros ayuda a garantizar que se protejan los
derechos de las personas que participan en la investigación.
¿Cómo toma una IRB su decisión con respecto a la ética de un proyecto de investigación
en particular? Primero, evalúa el nivel de riesgo involucrado en el procedimiento. Muchos
experimentos psicológicos se clasifican como de riesgo mínimo. Riesgo mínimo significa que
los procedimientos experimentales no implican un riesgo mayor que el asociado con las
actividades diarias. Si el presidente del IRB cree que la investigación tiene un riesgo mínimo, no
es necesario que todos los miembros del IRB revisen la investigación.
Si se considera necesario un riesgo mayor que el mínimo para fines de investigación, esto
generalmente requiere la atención total de todos los miembros del IRB. El IRB debe decidir si
estos riesgos son razonables en relación con los beneficios que se obtendrían de la investigación.
El IRB también se asegura de que los participantes reciban información completa antes del
experimento, y asegura que los procedimientos de investigación brinden seguridad y
confidencialidad. Las deliberaciones del IRB pueden ser extensas y sus recomendaciones
pueden parecer onerosas para algunos investigadores, aunque la intención del IRB es
claramente garantizar el tratamiento ético de los participantes. Un informe reciente (Keith-Spiegel
& Koocher, 2005) argumenta que algunos atajos éticos surgen de la percepción de algunos
investigadores de que el IRB es injusto. Keith-Spiegel y Koocher sugieren que “Aplicado a los
IRB ya los científicos investigadores, la lucha por la equidad por parte de los IRB debería mejorar
las percepciones de equidad. El resultado debería fomentar un comportamiento responsable
por parte de los investigadores que, a su vez, serviría como una protección preventiva de los
participantes humanos de la investigación” (p. 347).
Un conocimiento del proceso de revisión institucional debería ayudarlo a asegurarse de
que la investigación ética en psicología y en otras ciencias es la regla, no la excepción.
Debido a las salvaguardas integradas en la estructura de los comités de IRB e IACUC, los
científicos no pueden confiar únicamente en su propio juicio para proteger a los humanos y
animales que participan en sus experimentos. Además, las juntas ayudan a enfatizar la
honestidad en la investigación, lo que ayuda a reducir las prácticas fraudulentas.
ÿ RESUMEN
1. Un investigador ético protege el bienestar de los 3. El participante tiene derecho a negarse a participar en un
participantes en la investigación siguiendo las normas experimento oa retirarse de un experimento en cualquier
éticas de la APA. momento.
2. Informar al participante sobre el experimento antes de la 4. En una investigación ética, el participante está protegido
participación y un uso mínimo del engaño por parte del contra daños físicos y mentales.
investigador permite que el participante haga un juicio 5. Después de recopilar los datos, se debe informar
razonado sobre si participar. cuidadosamente a los participantes para eliminar
cualquier concepto erróneo que pueda haber surgido.
59533_05_ch04_p082-098.indd 95 9533_05_ch04_p082-098.indd 95 28/03/08 /28/08

6. El investigador debe eliminar cualquier consecuencia dañina 10. Los científicos éticos son honestos. No participan en
que resulte de un experimento. actividades que tergiversen la conducta y el resultado de la
7. A menos que el participante acuerde lo contrario, la investigación.
información relacionada con su participación es confi - 11. El fraude científi co se puede detectar mediante réplicas de
dencial investigaciones, y las juntas institucionales y las agencias de
8. Los intentos de defender los principios éticos a veces subvenciones (como la Oficina de Integridad de la Investigación)
conducen a un dilema en el sentido de que la adhesión a un supervisan la investigación para prevenir o detener el fraude.
principio puede violar otro. 12. Los IRB y los IACUC ayudan a controlar las prácticas éticas
9. Cuando se utilizan sujetos animales, se debe tener cuidado en la investigación y garantizan el tratamiento ético de los
para minimizar su dolor e incomodidad. participantes humanos y los sujetos animales.
ÿ TÉRMINOS CLAVE
confidencialidad junta de revisión institucional (IRB)

informe de plagio
engaño protección contra daños
fraude eliminando las consecuencias dañinas
libertad de retiro replicación
consentimiento informado especismo
comité institucional de cuidado y uso de animales (IACUC)
1. Reconsidere los principios éticos presentados en este capítulo principios éticos involucrados en el caso. Describa por qué
y lea la lista de principios éticos presentada por la APA está de acuerdo o en desacuerdo con la decisión del Comité
(1987, 2002). de Ética.
2. Lea selecciones del Libro de casos sobre ética 3. Lea dos de los artículos enumerados en la siguiente sección
Números publicados por la APA (1987), que probablemente de Lecturas sugeridas. Estos artículos describen las
esté disponible en su biblioteca. Este libro describe los cuestiones éticas asociadas con diferentes tipos de
antecedentes de diferentes denuncias éticas, cómo se investigación psicológica. Considere los principios éticos
enviaron las denuncias al Comité de Ética y cómo se generales que se aplican en ambos casos. Describa cómo
adjudicaron los casos. Seleccione dos casos y considere el difieren las cuestiones éticas entre los dos tipos de
investigación discutidos en los artículos.
CONEXIONES WEB
Además del tratamiento de la ética por parte de la APA en http://www.apa.org, hay un buen sitio que
contiene dilemas éticos y ejercicios relacionados con esos dilemas:
http://onlineethics.org/reseth/psychindex.html
Otro buen sitio relacionado con el fraude, los valores y otras cuestiones éticas, incluida la investigación
responsable, se puede encontrar en:
http://www.nap.edu/readingroom/books/obas/
59533_05_ch04_p082-098.indd 96 9533_05_ch04_p082-098.indd 96 28/03/08 /28/08

ÿ LECTURAS SUGERIDAS
Bowd, AD (1980). Reservas éticas sobre la investigación psicológica con animales.
Registro psicológico, 30, 201–210.
Devenport, LD y Devenport, JA (1990). El dilema del animal de laboratorio: una solución en nuestros
patios traseros. Ciencia Psicológica, 1, 215–216.
Goodyear, RK, Crego, CA y Johnston, MW (2003). Cuestiones éticas en la supervisión de la investigación
estudiantil: un estudio de incidentes críticos. En DN Bersoff (Ed.), Conflictos éticos en psicología (3.ª ed.,
págs. 429–435). Washington, DC: Asociación Americana de Psicología. (Reimpreso de Professional
Psychology: Research and Practice, 23, 203–210.)
Hoff, C. (1980). Usos inmorales y morales de los animales. Revista de Medicina de Nueva Inglaterra,
302, 115–118.
Imber, SD, Glanz, LM, Elkin, I., Sotsky, SM, Boyer, JL y Leber, WR (1986).
Cuestiones éticas en la investigación en psicoterapia: problemas en un estudio clínico colaborativo.
Psicólogo estadounidense, 41, 137–146.
Melton, G. y Gray, J. (1988). Dilemas éticos en la investigación del SIDA: privacidad individual y salud
pública. Psicólogo estadounidense, 43, 60–64.
Milgram, S. (1977). Cuestiones éticas en el estudio de la obediencia. En S. Milgram (Ed.), El individuo en
un mundo social (págs. 188–199). Reading, MA: Addison-Wesley.
Miller, NE (1985). El valor de la investigación del comportamiento en animales. Psicólogo estadounidense,
40, 423–440.
Cicatriz, S. (1988). Raza y género como variables psicológicas: Cuestiones sociales y éticas.
Psicólogo estadounidense, 43, 56–59.
Sieber, JE y Stanley, B. (1988). Dimensiones éticas y profesionales de la investigación socialmente
sensible. Psicólogo estadounidense, 43, 49–55.
Smith, CP (1983). Cuestiones éticas: investigación sobre engaño, consentimiento informado y debriefing.
En L. Wheeler & P. Shaver (Eds.), Revisión de la personalidad y la psicología social
(Vol. 4, págs. 297–328). Beverly Hills, CA: Sabio.
PSICOLOGÍA EN ACCIÓN
Entender y recordar
Formularios de consentimiento
Según la APA (2002), los experimentos psicológicos requieren el consentimiento informado del sujeto
antes de su participación. Sin embargo, ¿cuán significativa es la firma de un sujeto en un formulario de
consentimiento si él o ella no entendió y no recuerda la información del formulario de consentimiento?
Mann (1994) hizo que las personas leyeran un formulario de consentimiento o una hoja de
información sobre un experimento hipotético de escaneo cerebral con imágenes de resonancia magnética
funcional (IRMf). La hoja de información era igual que el formulario de consentimiento, excepto que no
requería una firma. Luego, los sujetos respondieron preguntas sobre el presunto próximo
59533_05_ch04_p082-098.indd 97 9533_05_ch04_p082-098.indd 97 28/03/08 /28/08

procedimiento. A pesar de que acababan de leer el formulario de consentimiento/hoja de información,
solo una minoría de los sujetos de Mann pudo responder correctamente las siguientes preguntas:
ÿ ¿Qué tipo de dispositivo usaremos para estudiar tu cerebro? (38 por ciento correcto)
ÿ ¿Cómo funciona este dispositivo? (47 por ciento)
ÿ ¿Existen riesgos en este procedimiento? (48 por ciento)
ÿ ¿Qué puedes hacer si te molesta el sonido de la máquina? (45 por ciento)
ÿ ¿Qué puede hacer si tiene una queja sobre el estudio? (39 por ciento)
ÿ ¿Qué harán los investigadores por usted si se lastima? (47 por ciento)
ÿ Nombre dos de las cuatro cosas que significa su firma en el formulario de consentimiento. (20 por ciento)
Además, el 62 por ciento de los sujetos que firmaron el formulario de consentimiento pensaron que
habían perdido su derecho a demandar al experimentador, en comparación con solo el 16 por ciento
de los que simplemente leyeron la hoja de información.
Si está planeando un estudio propio, habrá creado un formulario de consentimiento que puede
usar en esta demostración. Si no, pídele uno a tu maestro. Diseñe una serie de preguntas que
evaluarán la comprensión y la memoria de las personas para el formulario de consentimiento.
Pida a sus amigos que lean el formulario de consentimiento y luego pídales que respondan (de
memoria) sus preguntas. ¿Cuánto recuerdan tus amigos de lo que acaban de leer?
¿Conocen los riesgos y beneficios asociados con el estudio? Si no, ¿realmente han dado su
consentimiento informado a pesar de haber firmado los formularios? ÿ
59533_05_ch04_p082-098.indd 98 9533_05_ch04_p082-098.indd 98 28/03/08 /28/08

CAPÍTULO 5
CÓMO LEER
Y ESCRIBE
INVESTIGAR
INFORMES
CÓMO HACER UNA BÚSQUEDA LITERATURA
LAS PARTES DE UN ARTÍCULO
Título y Autor(es)
Resumen
Introducción
Método
Resultados
Discusión
Referencias
LISTA DE VERIFICACIÓN PARA EL LECTOR CRÍTICO

Introducción
Método
Resultados
Discusión
Resumen de la lista de verificación
UN ARTÍCULO DE MUESTRA DE DIARIO

ESCRIBIR UN INFORME DE INVESTIGACIÓN
Formato
Manuscrito de muestra
Estilo
Publicar un artículo
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
RECURSO DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: UNA BÚSQUEDA LITERATURA
99
59533_06_ch05_p099-150.indd 99 9533_06_ch05_p099-150.indd 99 28/03/08 /28/08

“No podía permitirme aprenderlo”, dijo la Falsa Tortuga con un suspiro. “Solo tomé el
curso regular”. "¿Qué fue eso?" inquirió Alicia. Tambaleándose y retorciéndose, por
supuesto. (LEWIS CARROLL)
Tratar de leer un artículo de una revista de psicología por primera vez puede ser una experiencia
desafiante. Los investigadores escriben artículos para otros investigadores, por lo que utilizan la jerga
y un estilo de escritura conciso. Estas características ayudan a la comunicación entre los académicos
de un campo en particular, quienes pueden leer informes breves y comprenderlos. Pero tal escritura
puede ser difícil de comprender para los estudiantes que comienzan a estudiar un campo. Este
capítulo está diseñado para prepararlo para su primer encuentro con la literatura de la psicología experime
Debido a que la psicología es una ciencia, el progreso se mide por la acumulación de conocimientos
en los diversos campos. Los investigadores pasan gran parte de su tiempo leyendo y escribiendo
artículos de revistas en un esfuerzo por contribuir a este cuerpo de conocimiento. Incluso si su carrera
en psicología no se extiende más allá de este curso, descubrirá que el pensamiento crítico y las
habilidades de escritura son invaluables para vivir en un mundo que gira en torno a la información.
Para ayudarlo a adquirir fluidez en el arte de leer y escribir informes de investigación, en este capítulo
describimos el formato y el estilo que se usan con más frecuencia en los artículos de revistas. Se
proporcionan sugerencias para ayudarlo a convertirse en un lector crítico, hábil para evaluar
objetivamente un artículo. Con un poco de práctica, superará con creces a la Falsa Tortuga y no
tendrá que "bambolear y retorcerse" en cada artículo de psicología que lea. El capítulo termina con
algunas recomendaciones para escribir un informe de investigación.
ÿ CÓMO HACER UNA BÚSQUEDA LITERATURA
Una vez que se le ha ocurrido una idea de investigación, el siguiente paso suele ser realizar una
búsqueda bibliográfica. El propósito de una búsqueda bibliográfica es averiguar lo que otros
investigadores han descubierto previamente sobre un tema en particular. Esto se hace rastreando
artículos publicados en los que los investigadores han informado sobre sus hallazgos científicos.
La forma más fácil de realizar una búsqueda bibliográfica es por computadora. Muchas
bibliotecas le permiten acceder a bases de datos electrónicas que contienen resúmenes de artículos
de revistas que publican investigaciones psicológicas. Se hablará más sobre los resúmenes más
adelante en este capítulo, pero por lo general son resúmenes breves (180 palabras o menos) de los
experimentos del artículo. Una de las bases de datos electrónicas más importantes es PsycINFO,
que actualmente contiene más de 2 millones de registros. Con una base de datos electrónica,
proporciona un tema y la computadora busca resúmenes relacionados con ese tema. Algunas bases
de datos también le permiten buscar documentos gubernamentales e informes técnicos que a menudo
no tienen resúmenes. Otra forma popular de realizar una búsqueda bibliográfica computarizada es
utilizar el motor de búsqueda de Internet Google Scholar (http://scholar.google.com/), que analiza la
literatura académica en muchas disciplinas, incluida la psicología. (Consulte la sección Psicología en
acción al final de este capítulo para ver un ejemplo de cómo realizar una búsqueda electrónica).
Un excelente recurso electrónico para conocer los últimos hallazgos de investigación es el Social
Science Citation Index. Al ingresar información sobre un artículo clave que usted
59533_06_ch05_p099-150.indd 100 9533_06_ch05_p099-150.indd 100 28/03/08 /28/08

ya lo ha encontrado, puede obtener una lista de los artículos más recientes que han citado su
artículo y ver sus resúmenes. Debido a que estos artículos contienen una discusión de su artículo
clave, es muy probable que estén directamente relacionados con su tema de interés. Esta es una
forma extremadamente eficiente de actualizarse en algún área de contenido específica.
Una vez que haya encontrado un resumen de su interés, puede encontrar el artículo completo
en su biblioteca o enviar una nota al autor solicitando una reimpresión del artículo o información
adicional. Muchas bibliotecas ahora brindan acceso a versiones electrónicas de revistas de
investigación, por lo que es posible que pueda descargar el artículo directamente desde una computa
Una vez que haya realizado su búsqueda bibliográfica y obtenido los artículos relevantes para
su interés de investigación, el siguiente paso es leer los artículos.
ÿ LAS PARTES DE UN ARTÍCULO
El artículo de psicología básica consta de siete partes: título y autor(es), resumen, introducción,
método, resultados, discusión y referencias. Cada parte tiene una función importante y es un
componente necesario del artículo.
Título y Autor(es)
El título le da una idea del contenido de un artículo. Debido a que los títulos deben ser breves (de
10 a 12 palabras), el tipo de título más común establece solo las variables dependientes e
independientes, por ejemplo, "Tasa de presión de la barra en función de la calidad y cantidad de la
recompensa de comida". Aunque este título no es particularmente atractivo, transmite información
importante. El título y el(los) autor(es) de cada artículo suelen ocupar un lugar destacado en un
número determinado de la revista, como el interior de la portada, la contraportada o la primera página
A medida que continúe adquiriendo conocimientos en un área de contenido en particular, se
familiarizará con muchos investigadores. Puede comenzar a prestar atención a los autores primero
y luego mirar los títulos. Después de haber leído varios artículos publicados por el mismo autor,
comprenderá los puntos de vista de ese escritor y en qué se diferencian de los de otros
investigadores.
Cada mes se publican tantos artículos de psicología que nadie tiene tiempo para leerlos
todos. La tabla de contenido es un primer paso para seleccionar aquellos artículos relevantes para
sus propios intereses. Pero se puede tomar una decisión aún mejor consultando el resumen y las
referencias de un artículo.
Resumen
El resumen es un párrafo breve (que no debe exceder las 180 palabras) que resume los puntos
clave de un artículo. Según el Manual de publicación de la Asociación Americana de Psicología
(APA, 2001), debería ser “. . . un resumen breve y completo del contenido del artículo; permite a
los lectores examinar rápidamente el contenido de un artículo” (p. 12). El resumen es la mejor
manera de descubrir rápidamente de qué trata un artículo. Un resumen de revista bien escrito
transmitirá el problema que se investiga, el procedimiento utilizado para explorar el problema, los
resultados, las conclusiones y las implicaciones o aplicaciones de los hallazgos de la investigación.
Esta información proporcionada en breve le permite
59533_06_ch05_p099-150.indd 101 9533_06_ch05_p099-150.indd 101 28/03/08 /28/08

descubra rápidamente si un artículo en particular merece más lectura. A medida que adquiera
experiencia y se familiarice con los autores en el campo, también querrá consultar las referencias
antes de tomar esta decisión.
Introducción
La introducción especifica el problema a estudiar y explica por qué es importante. El autor también
revisa la literatura de investigación relevante sobre el tema. Una buena introducción también
especifica las hipótesis que se probarán y da la razón detrás de las predicciones.
Método
La sección del método describe en detalle las operaciones realizadas por el experimentador.
Por lo general, se imprime en letra más pequeña para ahorrar espacio, pero esto no significa que
no sea una parte importante del artículo que se deba hojear rápidamente. La sección del método
debe contener suficiente información para que otro experimentador pueda replicar el estudio.
Se acostumbra dividir la sección de método en subsecciones que cubren a los participantes
(o sujetos), aparatos o materiales y procedimiento. los participantes
La sección (o sujetos) dice cuántos sujetos había, cómo fueron seleccionados (al azar, al azar, solo
los familiares del investigador, etc.) y quiénes eran (estudiantes universitarios que toman psicología
introductoria, voluntarios pagados obtenidos por un anuncio en un periódico, una cepa particular de
ratas compradas en una casa de suministros).
La sección de aparatos describe cualquier equipo utilizado para evaluar a los sujetos. Esta sección
puede incluir detalles como el número de modelo de una computadora o el tamaño de una cámara
de acondicionamiento. Esta sección se denomina sección de materiales cuando se utilizan
cuestionarios, bocetos escritos o grabados en video y otros medios similares para evaluar a los
sujetos. Si son largos, se pueden colocar materiales especiales en una sección de apéndice,
generalmente en letra más pequeña. La sección de procedimiento explica lo que les sucedió a los
sujetos e incluye instrucciones (para sujetos humanos), características de diseño estadístico, etc. Si
se utilizó una técnica estadística poco común, es decir, una que no se puede buscar directamente
en un texto de estadísticas avanzadas y citar, un diseño adicional
a menudo se incluye una subsección. A veces, incluso una técnica estadística estándar se describe
en una subsección de diseño.
Resultados
La sección de resultados cuenta lo que sucedió en el experimento. Es inusual encontrar datos sin
procesar o puntajes individuales informados en un artículo de revista; en cambio, se presentan
estadísticas descriptivas que resumen los datos. Las estadísticas inferenciales presentan la
probabilidad de que las diferencias observadas entre las diversas condiciones experimentales hayan
sido producidas por factores aleatorios o fortuitos. Esta información ayuda tanto al investigador
como al lector a determinar qué tan seguro debe estar de que la(s) variable(s) independiente(s)
produjo(n) un cambio en la variable dependiente. (Consulte el Apéndice B para una explicación y
revisión más detalladas). Ambos tipos de estadísticas son importantes y ayudan a los psicólogos a
comprender el resultado de un experimento.
59533_06_ch05_p099-150.indd 102 9533_06_ch05_p099-150.indd 102 28/03/08 /28/08

Se pueden usar tablas o gráficos para describir y resumir los datos. A menudo es útil dibujar un
gráfico para usted mismo a partir de los datos tabulares. Si un artículo contiene varias figuras, verifique
que las escalas sean comparables, de modo que los efectos puedan compararse fácilmente entre
diferentes figuras. La forma en que se dibuja un gráfico puede ser engañosa, como lo ilustra el siguiente
ejemplo.
Imagine que un psicólogo está interesado en cómo las personas perciben las palabras escritas en
inglés. Ya sea una palabra o una no palabra, letras que siguen el patrón del inglés escrito pero que no
forman una palabra real (p. ej., nale), se presentan visualmente. Los participantes deben presionar un
botón si es una palabra o presionar un botón diferente si es una no palabra. A esto se le llama decisión
léxica. En otra condición, el participante deberá pronunciar la palabra o no palabra cuando se presente.
Esto se llama nombrar. Frost, Katz y Bentin (1987) realizaron un experimento para comparar decisiones
de denominación y léxico. Sus resultados mostraron cuánto tiempo les tomó a las personas responder a
las palabras en inglés de alta frecuencia y a las no palabras.
Hemos vuelto a representar sus datos en la figura 5.1. A primera vista, los dos paneles parecen
bastante diferentes. Examinando el panel (a), podríamos concluir que las decisiones de denominación y
léxico son bastante similares. Pero del panel (b) podemos concluir no sólo que nombrar es más rápido
sino también que la diferencia entre palabras y no palabras es mayor para las decisiones léxicas que
para nombrar. ¿Qué figura es la correcta?
En realidad, los mismos datos se presentan en ambos paneles. El truco es que las escalas
verticales se trazan de manera diferente. Un panel tiene el tiempo de reacción (el tiempo entre la
presentación visual y la respuesta) medido en segundos, mientras que el otro muestra el tiempo de
reacción en milisegundos. Dado que un milisegundo es una milésima de segundo, los dos gráficos
parecen ser diferentes. Además, la escala está "rota" en el panel (b), por lo que las medidas comienzan
en 520 milisegundos, lo que dramatiza aún más la diferencia. Claramente, la forma en que se dibuja un
gráfico puede enfatizar u ocultar los resultados. (Consulte el Apéndice B para ver un ejemplo adicional
de este punto).
Pero, ¿qué forma de graficar los resultados es la correcta? En cierto sentido, ambos lo son, porque
se puede argumentar que ambos representan las cosas con precisión. Sin embargo, si las pruebas
estadísticas han demostrado que existe una diferencia entre las dos medidas, entonces el gráfico en el
panel (b) captura con mayor precisión la relación entre las medidas. Esta fue la escala utilizada por Frost,
Katz y Bentin (1987) para representar sus resultados.
Las estadísticas inferenciales permiten evaluar si las diferencias que aparecen en los resultados,
como en el panel (b), son reales y no se deben a factores aleatorios. Las estadísticas inferenciales sobre
los datos aparecen en declaraciones como "F (4, 60) 2.03, p .05".
probabilidades
Todo esto significa
de obtenerquepor
lascasualidad
un estadístico F al menos tan grande como 2,03 serían inferiores al 5 por ciento si se repitiera el
experimento. Es decir, si el experimento se realizara 100 veces, los resultados serían similares en al
menos 95 de las 100 repeticiones.
No existe una regla fija para establecer un nivel apropiado de significancia: 05, o 5 en 100, en lugar
de .001, o 1 en 1,000, por ejemplo. Depende del investigador decidir si las probabilidades son correctas,
demasiado altas o demasiado bajas. Dependiendo de la importancia de sus conclusiones, puede requerir
más (p. ej., 0,001 o 1 en 1000) o menos certeza (p. ej., 0,10 o 10 en 100) de que lo que sucedió no
sucedió por casualidad.
Imagine el problema de un oficial de admisiones de estudiantes graduados al que le han dicho que
los recursos en la universidad son extremadamente limitados. Se ha sugerido que discrimine a las
mujeres al aceptar estudiantes en el programa, ya que se cree que es menos probable que terminen. A
ella le gustaría poner fin a esas nociones sin fundamento y, por lo tanto, encarga un análisis estadístico
para probar esta hipótesis. Aquí, las probabilidades de 5 en 100 para rechazar la hipótesis nula de que
las mujeres tienen menos probabilidades que los hombres de terminar son
59533_06_ch05_p099-150.indd 103 9533_06_ch05_p099-150.indd 103 28/03/08 /28/08

ÿ FIGURA 5.1 (a) Decisión léxica
7 Nosotros
Escalas exageradas. Exactamente
los mismos datos se presentan en
los dos paneles de la Figura 5.1, 6
pero la escala en el panel (a) está
en segundos y la del panel (b) está
en milisegundos (con un corte de 5
escala indicado también).

Así, las diferencias parecen 4
muy pequeñas en (a) y muy (segundos)
reacción
Tiempo
de
grandes en (b).
3
0
Palabras no-palabras
(b)
760
720
680
640
(milisegundos)
reacción
Tiempo
de
600
560
520
Palabras no-palabras
demasiado alto, porque la importación es muy grande. Un nivel de significación de 1 en 1000 sería más
apropiado.
O tomemos el caso de una compañía de cereales para el desayuno que desea incluir un “premio”
dentro de la caja. Realiza un análisis estadístico para decidir cuál de los cinco premios potenciales, todos
los cuales cuestan lo mismo, es el preferido por los consumidores. Si hay alguna diferencia entre los
premios, la empresa quiere asegurarse de encontrar el mejor. Si la empresa se equivoca y selecciona
incorrectamente uno, cuando en realidad todos son igualmente atractivos, no se hace mayor daño, ya que
cada premio cuesta lo mismo. Aquí, las probabilidades de 5 en 100 son demasiado bajas. Un nivel de significaci
59533_06_ch05_p099-150.indd 104 9533_06_ch05_p099-150.indd 104 28/03/08 /28/08

100 podría ser más apropiado. La situación determina cuál debe ser el nivel de significación. Se
puede encontrar una discusión adicional de las estadísticas inferenciales y el nivel de significación en
el Apéndice B.
En la sección de resultados, la elección específica de palabras del autor es importante. Tenga
cuidado con afirmaciones como esta: “Aunque los datos apenas alcanzaron el nivel de significancia
propuesto, parece que sí ocurrió una tendencia en la dirección prevista”. Este tipo de declaración
debe abordarse con cautela por varias razones. En primer lugar, la palabra tendencia es un término
técnico: la existencia de una tendencia solo puede determinarse mediante una prueba estadística
adecuada. En segundo lugar, implica que los resultados que son significativos
no pueden ir más allá de una tendencia, es decir, son verdaderas y absolutamente confiables, y que
el hecho de no alcanzar un nivel prescrito significa solo que la "verdad" es latente en lugar de explícita.
Esta implicación es falsa: incluso los resultados significativos son confiables solo en un sentido
probabilístico, por ejemplo, 95 veces en 100.
Discusión
La discusión es la parte más creativa de un artículo. Aquí, un autor puede reafirmar lo que muestran
los datos (si así lo desea) y sacar conclusiones teóricas.
La mayoría de los editores tienen estándares firmes para las secciones de métodos y resultados, pero
al autor se le da mayor libertad en la discusión. En palabras del Manual de publicación de la Asociación
Americana de Psicología (APA, 2001): “Eres libre de examinar, interpretar y calificar los resultados,
así como de sacar inferencias de ellos” (p. 26). Tenga en cuenta que los resultados de la investigación
no son verdades indiscutibles y que los hallazgos experimentales son relativos al contexto en el que
se encuentran. La libertad del autor requiere prudencia por parte de los lectores.
Referencias
Las referencias se encuentran al final del artículo. A diferencia de las revistas de otras disciplinas,
las revistas de psicología enumeran los títulos completos de los artículos a los que se hace referencia.
Esta práctica ayuda a decirle al lector de qué trata el artículo. Además, las referencias son valiosas
como guía para obtener información relacionada. También se pueden utilizar como índice del mérito
del artículo. Los artículos deben hacer referencia a los trabajos publicados más recientemente en el
área, así como a las publicaciones anteriores más importantes.
Además, solo los artículos citados en el texto deben incluirse en la sección de referencia.
Esto es diferente de una bibliografía, que incluye tantas citas relevantes como sea posible.
ÿ LISTA DE VERIFICACIÓN PARA EL LECTOR CRÍTICO
En esta sección, ofrecemos algunos consejos que nos han ayudado a convertirnos en mejores
consumidores de la información presentada en las revistas psicológicas. Nuestra sugerencia principal
es evitar apresurarse a leer un artículo. En su lugar, puede detenerse deliberadamente después de
cada sección y escribir las respuestas a las preguntas que enumeraremos aquí. Esto puede ser difícil
al principio, pero con la práctica, este proceso se vuelve automático y requiere poco tiempo extra.
59533_06_ch05_p099-150.indd 105 9533_06_ch05_p099-150.indd 105 28/03/08 /28/08

Introducción
1. ¿Cuál es el objetivo del autor? La introducción explica las razones detrás de la
investigación y revisa la literatura previa sobre los fenómenos de interés. Si una o más
teorías están relacionadas con la investigación, la introducción da las predicciones que
hacen las teorías. Al igual que con los científicos en otras áreas, los psicólogos no
necesariamente están de acuerdo en cuanto a los mecanismos subyacentes y las
interpretaciones teóricas del comportamiento. El autor puede presentar una teoría particular
que, en su opinión, proporciona una explicación útil del comportamiento. Si bien el autor
puede presentar más de una teoría en la introducción, más adelante procederá a demostrar
que no todas ayudan por igual a predecir y explicar los resultados obtenidos. Trate de
averiguar cuál de las varias teorías cree el autor y cuáles están programadas para su posterior
2. ¿Qué hipótesis se probarán en el experimento? La respuesta a esto debería
ser obvio y declarado directamente dentro de la sección de introducción.
3. Si tuviera que diseñar un experimento para probar esta hipótesis, ¿qué haría? Esta es la
pregunta clave para la introducción. Debe intentar responder esto antes de continuar con la sección
de método del artículo. Muchos experimentos se realizan dentro del contexto de una investigación
sistemática del comportamiento para probar y respaldar un marco teórico particular desarrollado por
el autor. Si el autor tiene alguna habilidad como artífice de las palabras, una vez que haya terminado
la siguiente sección, es probable que esté de acuerdo con el método que el autor ha defendido en el
artículo. Un autor inteligente plantará las semillas de esta respuesta en la propia introducción; esta
práctica hace que le resulte más difícil enunciar un método de forma independiente. Escriba las
ideas principales de su método para probar la hipótesis.
Método
Compare su respuesta a la Pregunta 3 con la del autor del artículo. Probablemente diferirán, si no
los has mirado. Ahora responda las preguntas 4(a–c).
4(a). ¿Es mi método propuesto mejor que el del autor? Independientemente de quién tenga
el mejor método, tú o el autor, esta comparación forzada te hará pensar críticamente en la
sección del método, en lugar de aceptarla pasivamente.
4(b). ¿El método del autor realmente prueba la hipótesis? La hipótesis es a veces la
primera víctima, desapareciendo entre las secciones de introducción y método. Verifique
siempre que el método utilizado sea adecuado y relevante para la hipótesis en cuestión.
4(c). ¿Cuáles son las variables independientes, dependientes y de control? Esta es una
pregunta obvia y se puede responder rápidamente. Enumerar las variables le ayuda a
evitar la lectura pasiva de la sección de métodos. Una vez que haya resuelto las diferencias
entre su método propuesto y el del autor, responda la siguiente pregunta.
5. Utilizando los sujetos, aparatos o materiales y procedimientos descritos por el autor,
¿qué resultados puedo predecir para este experimento? Debe responder esto por su
cuenta antes de leer la sección de resultados. Para ayudarte, revisa las hipótesis y las
variables independientes y dependientes. Puede que le resulte imposible predecir un solo
resultado. Esto no es realmente un problema, ya que el autor probablemente también tenía
originalmente más de una predicción. Es posible que haya realizado algunas investigaciones
preliminares para reducir los posibles resultados; alternativamente, él o ella puede haber sido
59533_06_ch05_p099-150.indd 106 9533_06_ch05_p099-150.indd 106 28/03/08 /28/08

sorprendido por los resultados y tuvo que repensar la introducción una vez que los resultados estuvieron disponibles.
Dibuje un bosquejo aproximado que ilustre los resultados más probables que ha pronosticado.
Resultados
Compare los resultados con sus predicciones. Si son iguales, pase a las Preguntas 7(a), 7(b) y 7(c). Si no, responda
la pregunta 6.
6. ¿Obtuvo el autor resultados inesperados? Después de pensar un poco, llegará a una de dos
conclusiones: o su predicción fue incorrecta o los resultados son difíciles de creer.
Tal vez el método que seleccionó el autor fue inapropiado y no probó adecuadamente las hipótesis establecidas o
introdujo fuentes de varianza no controlada. O tal vez estos resultados no se volverían a obtener si se repitiera el
experimento. Incluso podría intentar su propio experimento. Vea si puede replicar los resultados informados.
7(a). ¿Cómo interpretaría estos resultados?

7(b). ¿Qué aplicaciones e implicaciones sacaría de mi interpretación de los resultados? Trate de
responder esta pregunta y la Pregunta 7(a) por su cuenta, antes de leer la discusión.
7(c). ¿Se me ocurre otra explicación para estos resultados? Incluso cuando los datos son los
previstos, puede haber más de una razón por la que los resultados se produjeron como se produjero
A menudo encontrará artículos de experimentos múltiples en los que los autores hacen un seguimiento de su primer
experimento haciendo experimentos adicionales para eliminar explicaciones alternativas.
Es posible que desee intentar pensar en un nuevo experimento para probar una hipótesis alternativa.
Discusión
Como se mencionó anteriormente, la sección de discusión incluye la interpretación del autor de los datos en forma
de conclusiones. Una buena sección de discusión completa el círculo del lector, ya que brinda una respuesta
narrativa a la pregunta planteada en la introducción. Además, el autor amplía sus conclusiones al ofrecer información
sobre las aplicaciones e implicaciones de los resultados experimentales.
Como lector crítico, ha construido su propia interpretación de los resultados.

Compare los méritos de su interpretación con los méritos del autor. ¿Cuál prefieres? Responda las preguntas 8(a) y
8(b) para ayudarlo a evaluar críticamente su interpretación y la del autor de los resultados. Responda las preguntas
8(c) y 8(d) para ayudarlo a pensar críticamente sobre posibles direcciones futuras.
8(a). ¿Mi interpretación o la del autor representan mejor los datos? Debido a que los autores
tienen más libertad en la sección de discusión que en otras secciones de un informe, es posible
encontrar que un autor ha sacado conclusiones que pueden no estar justificadas por los datos. En
otros casos, los autores extraen conclusiones que son en gran medida apropiadas y luego
proceden a ampliar estas conclusiones más allá de lo que los datos pueden respaldar. La última
situación suele ocurrir cuando un investigador no reconoce las limitaciones de la variable
dependiente.
8(b). ¿Ofrezco yo o el autor la discusión más convincente de las aplicaciones e implicaciones de
los resultados? Esta pregunta es secundaria a la pregunta planteada en 8(a).
No obstante, puede obtener información valiosa sobre la integridad general de la investigación.
59533_06_ch05_p099-150.indd 107 9533_06_ch05_p099-150.indd 107 28/03/08 /28/08

al considerar esta pregunta. Las responsabilidades de un investigador van más allá de llevar a
cabo un experimento estrictamente controlado; él o ella también debe considerar la lógica y la
teoría que subyacen a la investigación. La medida en que un autor demuestra sabiduría al
identificar aplicaciones e implicaciones de los resultados proporciona una buena indicación de
la integridad general de la investigación.
8(c). ¿Qué preguntas quedan sin respuesta? Ningún estudio responde a todas las preguntas. Puede ser que
te quedes con preguntas generales sobre la literatura, o tal vez te haya desconcertado algún dato específico
ignorado por los autores. 8(d). ¿Qué estudios adicionales podría hacer? Puede ser que sienta que todavía
hay explicaciones alternativas para los resultados, o que quiera responder una de las preguntas planteadas
en 8(c). Vuelve a la Pregunta 3: “Si tuviera que diseñar un experimento para probar esta hipótesis, ¿qué
haría?” El proceso de investigación nunca termina.
Resumen de la lista de verificación
Mientras lee atentamente su primer artículo, trate de escribir las respuestas a las ocho
preguntas. Es un trabajo duro las primeras veces, así que no te desanimes. En la siguiente
sección, analizamos un artículo psicológico típico de acuerdo con la lista de verificación
resumida en la Tabla 5.1.
ÿ TABLA 5.1
Preguntas para lectores críticos
Introducción
1. ¿Cuál es el objetivo del autor?

2. ¿Qué hipótesis se probará en el experimento?
3. Si tuviera que diseñar un experimento para probar esta hipótesis, ¿qué haría?
Método
4(a). ¿Es mi método propuesto mejor que el del autor?

4(b). ¿El método del autor realmente prueba la hipótesis?
4(c). ¿Cuáles son las variables independientes, dependientes y de control?
5. Utilizando los sujetos, aparatos o materiales y procedimientos descritos por el autor,
¿Qué resultados pronosticaría para este experimento?
Resultados
6. ¿Obtuvo el autor resultados inesperados?

7(a). ¿Cómo interpretaría estos resultados?
7(b). ¿Qué aplicaciones e implicaciones sacaría de mi interpretación de los resultados?
7(c). ¿Existe una explicación alternativa para los resultados?
Discusión
8(a). ¿Mi interpretación o la del autor representan mejor los datos?

8(b). ¿Ofrezco yo o el autor la discusión más convincente de las aplicaciones e implicaciones de los resultados?
8(c). ¿Qué preguntas quedan sin respuesta?
8(d). ¿Qué estudios adicionales podría hacer?
59533_06_ch05_p099-150.indd 108 9533_06_ch05_p099-150.indd 108 28/03/08 /28/08

ÿ UN ARTÍCULO DE MUESTRA DE REVISTA
En esta sección, hemos reimpreso un breve artículo de Psychological Science, con ejemplos de
respuestas a las preguntas de la lista de verificación.1 El artículo trata sobre el efecto de imaginarse
a uno mismo votando en el comportamiento electoral real posterior.
La mayoría de los artículos están escritos para expertos en un área en particular, por lo que los
autores de un informe asumen que sus lectores tienen algún conocimiento del tema que se investiga.
Además, la mayoría de las revistas establecen límites de páginas para los artículos, lo que significa
que puede faltar cierta información o presentarse de manera muy breve. Las suposiciones hechas
por los autores y la brevedad de muchos artículos plantean un problema para el lector novato. Es
posible que el novato tenga que leer otros artículos o libros de texto para comprender un informe en
particular. El siguiente informe fue elegido para ser bastante fácil de entender; sin embargo, puede
encontrar partes confusas. No te desanimes. Para ayudarlo, hemos colocado elementos de la lista de
verificación en varios lugares estratégicos a lo largo del artículo.
59533_06_ch05_p099-150.indd 109 9533_06_ch05_p099-150.indd 109 28/03/08 /28/08

59533_06_ch05_p099-150.indd 110 9533_06_ch05_p099-150.indd 110 28/03/08 /28/08

1. ¿Cuáles son los objetivos de los autores? Los autores buscan probar si la probabilidad de votar en
una elección presidencial depende de la perspectiva visual, en primera o tercera persona, desde la cual
las personas se imaginan votando. Investigaciones anteriores han examinado cómo la perspectiva
visual afecta una variedad de otros fenómenos psicológicos (p. ej., cómo las personas explican su
propio comportamiento pasado), pero los autores querían ser los primeros en estudiar si afecta la
probabilidad de seguir adelante con el comportamiento futuro.
2. ¿Qué hipótesis se probarán en el experimento? Los autores tienen la intención de probar dos
hipótesis relacionadas, las cuales están claramente establecidas en el párrafo final de la introducción.
Una hipótesis es que imaginarse votando desde la perspectiva de la tercera persona hace que las
personas se atribuyan más sentimientos favorables al voto. Es decir, si las personas se “ven” a sí
mismas votando en su imaginación mental, llegan a creer que personalmente tienen pensamientos y
sentimientos más positivos acerca de votar. La segunda hipótesis es que imaginarse votando desde la
perspectiva de la tercera persona hace que sea más probable que las personas voten.
3. Si tuviera que diseñar un experimento para probar estas hipótesis, ¿qué haría? Idealmente, debe
tratar de responder a esta pregunta antes de leer sobre el método de los autores para probar las hipótesis.
Sin embargo, en este documento, los autores han resumido brevemente su método en las últimas tres
oraciones de la introducción. De hecho, no es inusual que los autores proporcionen una descripción general
de su método en la introducción antes de presentar los detalles en la sección del método en sí. Esta práctica
ayuda al lector a obtener el “panorama general” antes de obtener todos los detalles. Sin embargo, vale la
pena pensar en cómo diseñaría un experimento propio para probar las hipótesis antes de sumergirse en la
sección del método. En este caso, es obvio que, en cualquier experimento que pueda diseñar, necesitaría
asignar a algunos sujetos a una condición en la que se imaginaran votando desde la perspectiva de primera
persona y a otros sujetos a una condición en la que hicieran lo mismo. Lo mismo desde la perspectiva de la
tercera persona. Una posibilidad sería llevar estudiantes universitarios a un laboratorio de psicología antes
de una elección del gobierno estudiantil y asignarles a la mitad que se imaginen votando en la elección
desde la perspectiva de primera persona y la otra mitad desde la perspectiva de tercera persona.
Luego, puede enviar un correo electrónico a los estudiantes después de la elección y determinar cuántos de
ellos en la condición de tercera persona votaron versus cuántos en la condición de primera persona.
Una pregunta más difícil es cómo determinar si los estudiantes en la condición de tercera persona se
atribuyeron más sentimientos de pro-voto que los estudiantes en la condición de primera persona. ¿Cómo
mediría los pensamientos y sentimientos de los estudiantes acerca de votar? Una posibilidad sería pedirles
a los estudiantes que califiquen su actitud hacia la votación en una escala que va de “muy negativa” a “muy
positiva”.
Método
Sujetos Doscientos cincuenta y seis estudiantes universitarios (163 mujeres) de la Universidad
Estatal de Ohio completaron el cuestionario preelectoral en línea para recibir créditos del curso.
Sujetos que ya habían votado (n = 95), que no estaban registrados para votar (n = 1), que no
indicaron si estaban registrados (n = 1), o que no indicaron si ya habían votado (n = 6) fueron
excluidos de los análisis. Siete sujetos (4 en la condición de tercera persona) fueron excluidos por
fallar el control de manipulación (descrito más adelante).
59533_06_ch05_p099-150.indd 111 9533_06_ch05_p099-150.indd 111 28/03/08 /28/08

La muestra final preelectoral estuvo compuesta por 146 sujetos (94 mujeres), 69 en la condición de
primera persona y 77 en la condición de tercera persona. Su edad media fue de 19,3 años (DE = 3,02 años).
De esta muestra, el 53,4% indicó que votaría por George W. Bush, el 45,2% indicó que votaría por John Kerry
y el 1,4% indicó que estaba indeciso.
La asignación de condiciones fue independiente de la preferencia del candidato, y la exclusión del análisis
fue independiente de la preferencia de la condición y el candidato (s < 2,90,2 ps > 0,30).
Noventa y cinco sujetos de la muestra preelectoral (65 %) respondieron al cuestionario de seguimiento
postelectoral a cambio de crédito del curso o la oportunidad de ganar un Amazon de $50.
certificado de regalo com. No hubo diferencias significativas en la tasa de respuesta según la condición o la
2
preferencia del candidato (s < 0,74, ps > 0,50).
Materiales y Procedimiento
Los sujetos preelectorales fueron reclutados para un estudio en línea de la imaginación. Si bien se
especificó que los sujetos deben ser votantes registrados para participar, no se mencionó ninguna otra
conexión con la votación o la elección en el reclutamiento. A las 6:30 pm del 1 de noviembre de 2004, los
sujetos recibieron un correo electrónico con un enlace a una de las dos versiones del cuestionario. Los sujetos
fueron asignados aleatoriamente a estas versiones, que diferían solo en las instrucciones para la perspectiva
de las imágenes a tomar. Los sujetos completaron el cuestionario en sus propias computadoras en cualquier
momento hasta que se abrieron las urnas el 2 de noviembre de 2004 a las 6:30 a. m.
Después de proporcionar información demográfica, los sujetos leyeron que se les pediría que se
imaginaran a sí mismos participando en una acción particular en el futuro y que deberían seguir las
instrucciones sobre cómo visualizar la imagen. Recibieron instrucciones de visualización en primera o tercera
persona (redacción en tercera persona entre paréntesis):
Debes imaginarte haciendo la acción desde una perspectiva visual en primera persona [tercera persona].
Con la perspectiva visual en primera persona [tercera persona], usted ve el evento desde la perspectiva
visual que tendría [un observador] si el evento realmente estuviera ocurriendo. Es decir, estás mirando tu
entorno a través de tus propios ojos [te ves a ti mismo en la imagen, así como a tu entorno].
Luego se instruyó a los sujetos para que cerraran los ojos y usaran la perspectiva especificada para imaginarse
a sí mismos “votando en las próximas elecciones presidenciales”. Cuando tuvieran la imagen en mente,
debían sostenerla allí y responder "sí" o "no" a la siguiente pregunta, que variaba según la condición y servía
como control de manipulación (redacción en tercera persona entre paréntesis):
Mientras lo imagina ahora, ¿se ve [a sí mismo en] la escena desde la perspectiva visual que tendría [un
observador] si el evento realmente estuviera ocurriendo?
Una respuesta de “no” constituyó falla en el control de manipulación.

A continuación, los sujetos utilizaron escalas que iban desde nada (1) hasta completamente (7) para
calificar qué tan bien describían su imagen cinco frases: “influyendo en la elección”, “marcando una boleta”,
“cumpliendo con mi deber como ciudadano”. ”, “hacer oír mis opiniones” y “seleccionar el nombre de mi candidato”.
Los sujetos pasaron a completar las principales medidas dependientes preelectorales, que fueron
diseñadas para evaluar sus autopercepciones como votantes. Mientras continuaban usando la perspectiva
específica para imaginarse a sí mismos votando, los sujetos usaron una escala de 7 puntos, que iba desde
extremadamente bueno (+3) hasta extremadamente malo (ÿ3) para indicar qué tan bueno o malo era votar en
las próximas elecciones. elección. Luego utilizaron escalas de 5 puntos que iban desde nada (1) hasta extremadam
o mucho (5) para indicar qué tan importante personalmente fue votar en las elecciones, qué tan probable era
que votaran, cuánto su voto marcaría una diferencia, qué tan
59533_06_ch05_p099-150.indd 112 9533_06_ch05_p099-150.indd 112 28/03/08 /28/08

cuánto pesar sentirían si no votaran y su candidato perdiera, y cuán satisfechos estarían si votaran y su
candidato ganara. A continuación, se explicó que a veces las personas planean votar pero encuentran
problemas. Los sujetos consideraron tres posibles disuasivos que podrían enfrentar el día de las elecciones:
(a) “Hay una fila de espera de 20 minutos para poder votar”, (b) “El candidato que usted apoya definitivamente
va a ganar en su estado, ” y (c) “No puede encontrar a nadie que lo acompañe al lugar de votación”. Los
sujetos utilizaron una escala de 5 puntos que va desde nada (1) hasta extremadamente (5) para indicar qué
tan probable sería que votaran si encontraran cada impedimento.
Finalmente, los sujetos utilizaron escalas de 7 puntos que iban desde nada (1) hasta extremadamente
(7) para indicar hasta qué punto se sentían emocionados, asustados, aburridos, felices, nerviosos,
determinados, inspirados, tristes, desmotivados y esperanzados. .
La página final del cuestionario agradeció a los sujetos por su tiempo y presentó
enlaces a información sobre los derechos de los votantes, el registro de votantes y los lugares de votación.
Postelectoral El 22 de noviembre de 2004, todos los sujetos recibieron un correo electrónico invitándolos
a responder una encuesta en línea dentro de los siguientes 4 días. El cuestionario comenzaba con el
siguiente ítem, inspirado en los utilizados para evaluar el comportamiento electoral en la Encuesta de
Población Actual de la Oficina del Censo de EE. UU. y en los Estudios Electorales Nacionales Estadounidense
Al hablar con la gente sobre las elecciones, a menudo encontramos que muchas personas no
pudieron votar porque no estaban registradas, estaban enfermas o simplemente no tenían tiempo.
¿Y usted, votó en las elecciones presidenciales más recientes?
Los sujetos respondieron eligiendo “No, no voté” o “Sí, voté”.1
4a. ¿Es mi método propuesto mejor que el de los autores? El método de los autores tiene tres ventajas
principales sobre el que propusimos. Primero, al hacer que los estudiantes completen el cuestionario preelectoral
(incluida la tarea de visualización) en línea, los autores se ahorraron la molestia de tener que llevar a los
estudiantes al laboratorio como sugerimos. No podemos decirlo con certeza, pero al realizar el experimento en
línea, los autores pueden haber podido recopilar datos de más sujetos que si hubieran realizado los sujetos en
el laboratorio, porque no tenían que encontrar el tiempo para reunirse con los sujetos en el laboratorio. persona
y porque los estudiantes que deseaban participar podían hacerlo a su conveniencia.
En segundo lugar, los autores estudiaron la votación en una elección presidencial, a diferencia
de una elección de gobierno estudiantil, y esto, naturalmente, parece más importante. Si la perspectiva
visual afecta la votación en una elección presidencial, el hallazgo probablemente será más interesante
para la gente que si afecta la votación en una elección del gobierno estudiantil.
En tercer lugar, los autores hicieron una variedad de preguntas para medir la actitud de los sujetos
sobre el voto, en lugar de solo una como propusimos. Pidieron a los sujetos que calificaran en general
qué tan bueno o malo fue votar en las elecciones, lo cual es similar a nuestra calificación propuesta,
pero también pidieron varias otras calificaciones, como qué tan importante personalmente fue votar,
qué tan satisfechos estarían. sienten si votaron y su candidato ganó, y cuán probable sería que votaran
incluso si tuvieran problemas el día de las elecciones. Como veremos, los autores combinaron las
respuestas de los sujetos a todas estas preguntas en una sola medida de los sentimientos a favor del
voto. Debido a que esta medida evalúa los pensamientos de los sujetos
1El uso de encuestas autoadministradas (por ejemplo, cuestionarios de Internet) en lugar de entrevistadores humanos significa:
reduce considerablemente las presiones de deseabilidad social en los autoinformes conductuales (votación: Holbrook y
Krosnick, 2006; otros comportamientos: Tourangeau y Smith, 1996).
59533_06_ch05_p099-150.indd 113 9533_06_ch05_p099-150.indd 113 28/03/08 /28/08

y sentimientos acerca de la votación desde una variedad de ángulos, debería capturar la verdadera
actitud de los sujetos mejor que cualquier pregunta por sí sola.
4b. ¿El método de los autores realmente prueba las hipótesis? En este estudio, el método de los autores es
muy adecuado para probar las dos hipótesis principales. El método incluye una manipulación de la perspectiva
visual, una medida de los sentimientos a favor del voto y una medida del comportamiento electoral real. Por lo
tanto, los autores pueden probar si los sujetos que se imaginan votando desde la perspectiva de la tercera
persona frente a la perspectiva de la primera persona se atribuyen más sentimientos favorables al voto y es
más probable que realmente voten.
4c. ¿Cuáles son las variables independientes, dependientes y de control? La variable independiente es la
perspectiva visual (primera o tercera persona). Las variables dependientes son los sentimientos a favor del
voto medidos por las diversas calificaciones que hicieron los sujetos y el comportamiento de voto real (votó o
no votó). No hay variables de control de las que hablar en este experimento.
5. Utilizando los sujetos, aparatos o materiales y procedimientos descritos por los autores, ¿qué resultados
pronosticaría para este experimento? Antes de leer este artículo, probablemente nunca consideró si la
perspectiva visual en las imágenes mentales afecta las actitudes de las personas sobre la actividad imaginada
o si afecta la probabilidad de que las personas realmente participen en la actividad. ¡Es posible que nunca
hayas pensado en la diferencia entre la perspectiva en tercera y primera persona! A pesar de lo que han
argumentado los autores, es posible que no crea que algo tan aparentemente trivial como la perspectiva visual
pueda afectar algo tan importante como la votación, por lo que puede resultarle difícil predecir que la perspectiva
en tercera persona en realidad provocará que más personas voten. hace la perspectiva en primera persona. Si
continúa leyendo artículos en el campo de la psicología, probablemente esta no sea la última vez que se
encuentre con una predicción difícil de creer. La investigación psicológica a menudo produce resultados que
pocas personas podrían predecir de antemano.
Resultados
Sobre la base del hallazgo de que imaginar las propias acciones desde la perspectiva de la tercera
persona conduce a una interpretación más disposicional del comportamiento visualizado que imaginar las
propias acciones desde la perspectiva de la primera persona, predijimos que los sujetos que imaginaban
votar desde la tercera persona La perspectiva personal adoptaría una mentalidad más fuerte correspondiente
al comportamiento electoral y, por lo tanto, sería más probable que votaran en las elecciones que los
sujetos que imaginaron votar desde la perspectiva de la primera persona.
Mentalidad de pro-votación Para evaluar el efecto de la perspectiva en las autopercepciones de los
sujetos como votantes, creamos un índice compuesto de pro-votación al estandarizar y promediar las
respuestas sobre las principales medidas dependientes previas a las elecciones (actitud, importancia,
probabilidad, impacto del voto). , arrepentimiento, satisfacción y respuestas a los tres escenarios del problema =
Como se predijo, imaginar la votación desde la perspectiva de la tercera persona hizo que los sujetos
adoptaran una mentalidad de pro-votación más fuerte (M = .10, SD = .58) que imaginar la votación desde
la perspectiva de la primera persona (M = ÿ.11). , DE = .69), t(144) = 2.07, p < .05, = .93, d = 0.33.
reps p
Comportamiento electoral La siguiente pregunta era si el efecto de la perspectiva sobre la mentalidad

de voto pro en la víspera de las elecciones se trasladaría al comportamiento el día de las elecciones. De
hecho, lo hizo. Representar la votación desde la perspectiva de la tercera persona hizo que los sujetos
fueran más propensos a votar, como lo indican sus respuestas al cuestionario postelectoral. Votó el 90%
de los encuestados en la condición de tercera persona, en comparación con el 72% de los que estaban en
2
la condición de primera persona, = .94.
(1, N = 95) Análisis
= 5.04, p < posteriores
.03, p (MacKinnon
reps mentalidad
& Dwyer,
favorable
1993)
al sugirieron
voto mediaba
queella
efecto de la perspectiva en el comportamiento electoral (ver Fig. 1).
59533_06_ch05_p099-150.indd 114 9533_06_ch05_p099-150.indd 114 28/03/08 /28/08

Pro-Votación
Mentalidad
.25* .67*
.33*
Imágenes Votación
Perspectiva Comportamiento
(.13ns)
Fig. 1 Análisis de mediación que relaciona la perspectiva de las imágenes y la mentalidad de promoción
con el comportamiento electoral, Sobel z = 1.85,reps
p <de.07,
regresión
p = .90.estandarizados.
Los números enLalasperspectiva
rutas son coeficientes
de las
imágenes se codificó ÿ1 para primera persona y +1 para tercera persona. El comportamiento de voto se
codificó 0 para no votar y 1 para votar. Los asteriscos indican coeficientes significativamente diferentes de
cero, *p < .05, Prep > .93. El número entre paréntesis es el coeficiente de regresión estandarizado para la
perspectiva de las imágenes cuando se incluyó en la ecuación la mentalidad a favor del voto.
6. ¿Los autores obtuvieron resultados inesperados? Los autores encontraron, como predijeron, que la
perspectiva en tercera persona hizo que los sujetos tuvieran una mentalidad más fuerte a favor del voto y que
fueran más propensos a votar. Estos resultados no fueron inesperados para los autores, pero pueden ser
sorprendentes para usted.
Otro resultado importante se menciona en una sola oración bajo el título Comportamiento electoral,
pero se ilustra en la Figura 1. Un procedimiento estadístico conocido como análisis de mediación mostró
que la mentalidad favorable al voto “mediaba” el efecto de la perspectiva en el comportamiento electoral.
Lo que esto significa es que la perspectiva en tercera persona no provocó directamente que los sujetos
tuvieran más probabilidades de votar. Más bien, la perspectiva hizo que las personas tuvieran una
mentalidad más fuerte a favor del voto, y esta mentalidad hizo que las personas fueran más propensas
a votar. En otras palabras, el análisis estableció una cadena causal que vincula la perspectiva de la
tercera persona con la mentalidad favorable al voto y la mentalidad favorable al voto con la votación.
7a. ¿Cómo interpretaría estos resultados? Los resultados son sencillos y la interpretación es clara: imaginarse
votando desde la perspectiva de la tercera persona frente a la perspectiva de la primera persona puede hacer
que las personas sientan que votar es más importante personalmente para ellas y este sentimiento puede
llevar a las personas a votar.
7b. ¿Qué aplicaciones e implicaciones sacaría de mi interpretación de los resultados? Una implicación
importante de estos resultados es que puede ser posible aumentar la participación electoral alentando a los
votantes potenciales a imaginarse votando desde la perspectiva de una tercera persona. Por ejemplo, tal vez
los organizadores de mítines políticos deberían guiar a la multitud en una breve tarea de visualización en
tercera persona como la que realizaron los sujetos de este experimento.
7c. ¿Se me ocurre otra explicación para estos resultados? Dada la simplicidad del método de los
autores y la claridad de sus resultados, es difícil pensar en una explicación alternativa que no sea que
la perspectiva en tercera persona aumentó los sentimientos a favor del voto y estos sentimientos
llevaron a la gente a votar. Sin embargo, si puede pensar en otra explicación, también debe pensar en
cómo diseñaría un experimento para probar su explicación.
Discusión
El simple hecho de variar la perspectiva visual que los individuos usaban para imaginarse a sí mismos
participando en un comportamiento futuro deseable afectó sus autopercepciones y su probabilidad de lograrlo
59533_06_ch05_p099-150.indd 115 9533_06_ch05_p099-150.indd 115 28/03/08 /28/08

seguir adelante con ese comportamiento: los votantes registrados a los que se les indicó que se imaginaran
votando desde la perspectiva de la tercera persona adoptaron posteriormente una mentalidad de pro-votación
más fuerte que aquellos a los que se les indicó que se imaginaran votando desde la perspectiva de la primera
persona y, en consecuencia, tenían más probabilidades de votar . Estos resultados sugieren una implicación
importante del hecho de que las acciones se perciben más como una función del carácter del actor cuando se
ven desde la perspectiva de un observador que cuando se ven desde la perspectiva del actor (Storms, 1973).
Verse a sí mismo como el tipo de persona que se involucraría en un comportamiento deseado aumenta la
probabilidad de participar en ese comportamiento.
Los presentes hallazgos son particularmente dignos de mención dado que el experimento se llevó a
cabo en Ohio durante las elecciones presidenciales de 2004. Esa campaña se centró en temas volátiles como
la guerra, el terrorismo y el matrimonio entre personas del mismo sexo e implicó esfuerzos sin precedentes
para movilizar la participación electoral en Ohio, un estado clave crucial (Dao, 2004). El hecho de que nuestra
manipulación afectara la participación electoral incluso en este complejo campo de fuerzas motivacionales
demuestra el poder potencial de las imágenes centradas en uno mismo. El éxito de esta manipulación
probablemente se debió a que dio dirección a un proceso, la imaginación visual, que las personas usan
naturalmente para planificar acciones futuras. De hecho, las imágenes visuales de situaciones próximas son
bastante comunes en la vida cotidiana (Singer & McCraven, 1961). Los presentes hallazgos demuestran que
con cierta orientación, estas imágenes se pueden aprovechar para alterar las autopercepciones y el comportamient
Específicamente, descubrimos que es más probable que las personas ajusten sus autoconceptos para
que coincidan con un comportamiento deseado si ese comportamiento se imagina desde la perspectiva de un
observador en tercera persona en lugar de la perspectiva de un experimentador en primera persona. Los
sujetos que imaginaron votar desde la perspectiva de la tercera persona se vieron a sí mismos como más
propensos a votar y más motivados para superar los obstáculos para votar en comparación con aquellos que
usaron imágenes en primera persona. Las imágenes en tercera persona también llevaron a los sujetos a
anticipar sentimientos de arrepentimiento y satisfacción consistentes con internalizar el voto como norma
personal (Kahneman y Miller, 1986). Y los sujetos que imaginaron desde la perspectiva de la tercera persona
informaron creencias sobre la importancia y el impacto de votar que eran consistentes con una autoidentificación
más fuerte como votantes. Acumulativamente, estos efectos sobre las autopercepciones obligaron a las
personas en la condición de visualización en tercera persona a presentarse en mayor número el día de las
elecciones que las personas en la condición de primera persona. Estos hallazgos sugieren que las imágenes
centradas en uno mismo pueden afectar los comportamientos significativos al alterar las autopercepciones.
Por lo tanto, el mandato de “imaginarse a sí mismo” realizando un comportamiento deseado puede, de hecho,
ser una estrategia eficaz para traducir las buenas intenciones en acciones prácticas.
Expresiones de gratitud
Este artículo está dedicado a la memoria de Jon Slemmer, cuya experiencia fue fundamental para llevar a
cabo esta investigación.
Referencias
Baldwin, MW y Holmes, JG (1987). Audiencias privadas destacadas y conciencia de sí mismo.
Revista de personalidad y psicología social, 52, 1087–1098.
Barresi, J. y Moore, C. (1996). Relaciones intencionales y comprensión social. Comportamiento y
Ciencia del cerebro, 19, 107–154.
Bartlett, FC (1932). Recordando: un estudio en psicología experimental y social. Nueva York:
Prensa de la Universidad de Cambridge.
Batson, CD, Early, S. y Salvarani, G. (1997). Toma de perspectiva: imaginar cómo se siente otro versus imaginar
cómo te sentirías tú. Boletín de Personalidad y Psicología Social, 23, 751–758.
59533_06_ch05_p099-150.indd 116 9533_06_ch05_p099-150.indd 116 28/03/08 /28/08

Bem, DJ (1972). Teoría de la autopercepción. En L. Berkowitz (Ed.), Advances in experimental
psicología social (Vol. 6, págs. 1–62). Nueva York: Prensa Académica.
Clark, DM y Wells, A. (1995). Un modelo cognitivo de la fobia social. En RG Heimberg, MR Liebowitz, DA Hope y FR
Schneier (Eds.), Fobia social: diagnóstico, evaluación y tratamiento (págs. 69–93). Nueva York: Guilford Press.
Conway, MA, Meares, K. y Standart, S. (2004). Imágenes y goles. Memoria, 12, 525–531.
Dao, J. (2004, 1 de noviembre). Para llevar a los votantes de Ohio a las urnas, los voluntarios tocan, hablan y engatusan.
The New York Times, pág. 17A.
D'Argembeau, A. y Van der Linden, M. (2004). Características fenomenales asociadas con la proyección de uno mismo
hacia el pasado y hacia el futuro: Infl uencia de la valencia y la distancia temporal. Conciencia y cognición: una
revista internacional, 13, 844–858.
Decety, J. y Grezes, J. (2006). El poder de la simulación: Imaginar el comportamiento propio y ajeno. Investigación del
cerebro, 1079, 4–14.
Frank, MG y Gilovich, T. (1989). Efecto de la perspectiva de la memoria sobre las atribuciones causales retrospectivas.
Revista de Personalidad y Psicología Social, 57, 399–403.
Gregory, WL, Cialdini, RB y Carpenter, KM (1982). Escenarios auto-relevantes como mediadores de estimaciones de
probabilidad y cumplimiento: ¿la imaginación lo hace así? Revista de Personalidad y Psicología Social, 43, 89–99.
Holbrook, AL y Krosnick. JA (2006). Sesgo de deseabilidad social en los informes de participación electoral: Pruebas
utilizando técnicas de conteo de ítems y respuesta aleatoria. Manuscrito presentado para su publicación.
Jones, EE y Nisbett, RE (1971). El actor y el observador: percepciones divergentes de las causas de la conducta. En EE
Jones, DE Kanouse, HH Kelley, RE Nishett, S. Valins y B. Weiner (Eds.), Atribución: Percibir las causas del
comportamiento (págs. 79–94). Nueva York: Prensa de aprendizaje general.
Kahneman, D. y Miller, DT (1986). Teoría de la norma: comparación de la realidad con sus alternativas. psi
Revisión psicológica, 93, 136–153.
Levine, B., Black, SE, Cabeza, R., Sinden, M., Mcintosh, AR, Toth, JP, Tulving, E. y Struss, DT (1998). Memoria episódica
y el yo en un caso de amnesia retrógrada aislada.
Cerebro, 121, 1951–1973.
Libby, LK, Eibach, RP y Gilovich, T. (2005). Aquí me miras: el efecto de la perspectiva de la memoria en las evaluaciones
del cambio personal. Revista de Personalidad y Psicología Social, 88, 50–62.
MacKinnon, DP y Dwyer, JH (1993). Estimación de efectos mediados en estudios de prevención.

Revisión de evaluación, 17, 144–158.
McIsaac, HK y Eich, E. (2002). Punto de vista en la memoria episódica. Psychonomic Bulletin & Review, 9, 146–150.
Moore, BS, Sherrod, DR, Liu, TJ y Underwood, B. (1979). El cambio disposicional en la atribución a lo largo del tiempo.
Revista de Psicología Social Experimental, 15, 553–569.
Nigro, G. y Neisser, U. (1983). Punto de vista en recuerdos personales. Psicología Cognitiva, 15,
467–482.
Piaget, J. (1932). El juicio moral del niño. Londres: Kegan Paul, Trench y Trubner.
Prencipe, A., & Zelazo, PD (2005). Desarrollo de la toma de decisiones afectivas para uno mismo y para los demás.
Ciencia Psicológica, 16, 501–505.
Pronin, E. y Ross, L. (2006). Diferencias temporales en la autoadscripción de rasgos: Cuando el yo es visto como otro.
Revista de Personalidad y Psicología Social, 90, 197–209.
Robinson, JA y Swanson, KL (1993). Modos de recordar de campo y de observador. memoria, 1,
169–184.
Shaw, GB (1921). Volviendo a Matusalén: Un Pentateuco Metabiológico. Nueva York: Brentano's.
59533_06_ch05_p099-150.indd 117 9533_06_ch05_p099-150.indd 117 28/03/08 /28/08

Sheeran, P. (2002). Relaciones intención-comportamiento: una revisión conceptual y empírica. En W. Stroebe &
M. Hewstone (Eds.), Revista europea de psicología social (Vol. 12, pp, 1–36). Chichester, Inglaterra: Wiley.
Singer, JL y McCraven, VG (1961). Algunas características de la ensoñación adulta. Revista de Psicología, 51,
151–164.
Tormentas, MD (1973). La cinta de video y el proceso de atribución: Invertir los puntos de vista de los actores y
los observadores. Revista de Personalidad y Psicología Social, 27, 65–175.
Tourangeau, R. y Smith, TW (1996). Hacer preguntas delicadas: el impacto del modo de recopilación de datos,
el formato de la pregunta y el contexto de la pregunta. Opinión pública trimestral, 60, 275–304.
(RECIBIDO EL 17/05/06; REVISIÓN ACEPTADA EL 31/07/06;

MATERIALES FINALES RECIBIDOS EL 14/09/06)
8a. ¿Mi interpretación o la de los autores representa mejor los datos? En este caso, nuestra interpretación
es la misma que la de los autores. Sin duda, ese no siempre será el caso, especialmente al leer estudios
más largos y complejos.
8b. ¿Ofrezco yo o los autores la discusión más convincente de las aplicaciones e implicaciones de los
resultados? Los autores tienen una buena discusión, que incluye el punto interesante de que la
manipulación de la perspectiva visual afectó la participación electoral incluso en el contexto de una
campaña presidencial muy disputada en la que hubo muchos factores que potencialmente afectaron el
comportamiento electoral. Por lo tanto, los autores concluyen que las imágenes visuales deben tener una
influencia relativamente fuerte en el comportamiento. También señalan, como lo hicimos nosotros, que el
poder de las imágenes visuales podría usarse con un propósito para influir en el comportamiento. Sin
embargo, aunque nos enfocamos en la idea de que los organizadores políticos podrían usar imágenes
visuales para afectar el comportamiento de otras personas, los autores sugieren además que las personas
podrían usarlas por sí mismas para aumentar las posibilidades de que lleven a cabo sus propias buenas inten
8c. ¿Qué preguntas quedan sin respuesta? Para comprender mejor el poder de la perspectiva visual
para influir en el comportamiento, creemos que es importante comparar la votación con perspectiva en
tercera persona con la votación sin ninguna imagen visual. Los autores descubrieron que la perspectiva
en tercera persona aumentaba la votación en relación con la perspectiva en primera persona, pero ¿qué
tan probable habría sido que las personas votaran si no hubieran pasado por una tarea de visualización
en absoluto, sino que simplemente hubieran completado un cuestionario en línea en que se les hizo
preguntas sobre su actitud hacia la votación? Presumiblemente, los autores predecirían que la
visualización en tercera persona causaría un gran aumento en la votación en relación con la no
visualización, pero este estudio no habla directamente de esa posibilidad porque no incluye una condición
de no visualización.
8d. ¿Qué estudios adicionales podría hacer? Sería sencillo replicar las condiciones del
estudio actual y agregar una condición de no visualización en la que los sujetos sean
tratados exactamente igual que en las condiciones descritas aquí, excepto que no reciben
las instrucciones de visualización y no responden ninguna pregunta. preguntas sobre su
imagen. Por supuesto, un problema es que, si quisiera volver a estudiar cómo votar en
una elección presidencial, ¡podría tener que esperar hasta 4 años para hacerlo!
ÿ ESCRIBIR UN INFORME DE INVESTIGACIÓN
Obtuvo una idea, revisó la literatura pertinente, diseñó un procedimiento, recopiló sus
datos y analizó los resultados. Su curso puede requerir un registro escrito de su
investigación. Incluso si no es así, usted está obligado a publicar los resultados de un análisis c
59533_06_ch05_p099-150.indd 118 9533_06_ch05_p099-150.indd 118 28/03/08 /28/08

proyecto hecho. Creemos que para mantener la naturaleza de autocorrección de la ciencia,
es importante publicar buenos datos. Sin embargo, esto no significa que las revistas deban
estar repletas de información derivada de cada proyecto de pregrado. Si su investigación es
prometedora, recibirá el estímulo de su instructor.
En esta sección, revisaremos el formato de un informe típico y analizaremos algunas de
las consideraciones estilísticas que conforman un documento comprensible. Si sigue nuestras
sugerencias para leer artículos, tendrá una idea bastante buena sobre el formato de un informe
de investigación y probablemente tendrá una buena idea del estilo de redacción técnica.
Algunos aspectos de la escritura técnica no son obvios, por lo que los discutiremos aquí. Lo
que presentamos son pautas generales. Si necesita información adicional, examine el libro de
RJ Sternberg de 1993, The Psychologist's Companion, y el artículo de 1992, “How to Win
Acceptances by Psychology Journals: 21 Tips for Better Writing”; el capítulo de DJ Bem de
2004, “Writing the Empirical Journal Article”, que se publica en The Compleat Academic, una
guía para una carrera en psicología; y el artículo de HL Roediger de 2007, “Doce consejos
para autores”. La versión de 2001 del Manual de publicación de la Asociación Estadounidense
de Psicología (quinta edición) también ayudará, porque es el árbitro oficial de estilo para casi
todas las revistas de psicología y educación.
Formato
El esquema de un informe típico en la Figura 5.2 enfatiza la secuencia de páginas que tendrá
que armar en su manuscrito de estilo APA. Esta versión del artículo se conoce como copia
manuscrita y se ensambla de manera particular para facilitar los procesos editoriales y de
publicación. Un recorrido por esa secuencia le dará una idea de lo que se supone que debe
incluir.
Su portada contiene el título de su proyecto, su nombre, su afiliación (su institución o
lugar de negocios) y su cabecera. El título abreviado que aparece en la parte superior de cada
página del manuscrito copia consta de las primeras palabras del título y se utiliza para
identificar el manuscrito únicamente durante el proceso editorial. El encabezado que aparecerá
en la parte superior de cada página de la publicación
El artículo se llama encabezado, y se escribe en letras mayúsculas en la portada de la copia
del manuscrito. El título abreviado y el encabezado no deben confundirse. Debe colocar doble
espacio en las líneas de la portada y cada dos páginas del manuscrito de la copia.
La página siguiente, la página dos, contiene el título “Resumen” y el resumen mismo.

En esta página, y en todas las siguientes (excepto las figuras), el título abreviado y el número
de página deben colocarse en la esquina superior derecha de la página.
En la parte superior de la página tres está el título completo, seguido de la introducción.
Por lo general, no tendrá un encabezado para la introducción. Una vez finalizada la
introducción, comienza la sección del método. Generalmente, para escribir un experimento,
escribirá el título "Método" en el centro de una línea para comenzar la sección. Debe comenzar
la sección del método inmediatamente después de la introducción; aquí no se utiliza un salto
de página. Tenga en cuenta el formato que se muestra para los encabezados en la página
cuatro en la Figura 5.2. Los encabezados laterales, como "Temas" y "Aparatos" (o "Materiales")
ayudan a guiar al lector hacia la información pertinente. La sección de resultados sigue
inmediatamente al método. No incluya figuras y tablas en el cuerpo de esta sección; vienen
al final del informe. Luego viene la discusión, que finaliza la mayor parte textual de su informe.
59533_06_ch05_p099-150.indd 119 9533_06_ch05_p099-150.indd 119 28/03/08 /28/08

Título corto 1 Título corto 2 Título corto 3 Título corto 4
CABEZA CORRIENTE: Método
Título Resumen Asignaturas

Título
Nombres (Introducción, sin título)
afiliaciones
Aparato
Procedimiento
Título corto 5 Título corto 6 Título corto 7 Título corto 8
Resultados Discusión Referencias Notas del autor
Título corto 9 Título corto 10 Título corto 11
notas al pie tabla 1 Pies de figura (Las cifras están al final

Título de la tabla
páginas con uno por
1. Figura 1. página.)
2. Figura 2.
(Tablas sucesivas
están separados
páginas.)
ÿ FIGURA 5.2
Secuencia de páginas para un informe en formato APA.
Las referencias comienzan en una página separada. El formato para presentar las referencias es
complejo y debe tener cuidado al prepararlas. Consulte la Tabla 5.2 para ver las pautas de las fuentes
comúnmente citadas. También debe consultar el artículo reimpreso en este capítulo, que contiene la
mayoría de los diferentes estilos de referencias que deberá documentar. Mírelos cuidadosamente; si tiene
alguna pregunta, pregunte a su instructor. También puede estudiar el Manual de publicaciones de la APA
y artículos de revistas recientes. Las notas del autor y las notas al pie aparecen en páginas separadas
después de las referencias. Para la mayoría de los informes de laboratorio de la universidad, las notas al
pie no son necesarias.
Cuando prepara algo para su publicación, puede reconocer el apoyo financiero e intelectual, que debe
aparecer en la página de notas del autor. Los reconocimientos generales no están numerados. Otra
información, tal vez periférica, debe aparecer como notas al pie numeradas en una página de notas al pie
separada, pero tales notas al pie generalmente se desaconsejan.
Después de las notas al pie están las tablas de datos que se mencionan en la sección de resultados.
Cada tabla debe estar en una página separada y numerada correlativamente, de acuerdo con su aparición
en la sección de resultados. Haga que los títulos de sus tablas sean breves pero comunicativos.
Las leyendas de sus figuras están numeradas consecutivamente y aparecen en una página separada
59533_06_ch05_p099-150.indd 120 9533_06_ch05_p099-150.indd 120 28/03/08 /28/08

ÿ TABLA 5.2
Formularios generales para la lista de referencia
Tipo de Fuente Formato
Periódico (p. ej., diario) Autor, AA, Autor, BB y Autor, CC (1999). Título del artículo. Título de la publicación periódica, xx,
xxx–xxx.
No periódico (p. ej., libro) Autor, AA, Autor, BB, & Autor, CC (2004). Título de la obra. Lugar: Editorial.
Parte de una publicación no Autor, AA, Autor, BB y Autor, CC (2001). Título del capítulo. En A. Editor, B. Editor, &
periódica (p. ej., capítulo de un libro) C. Editor (Eds.), Título del libro (págs. xxx–xxx). Lugar: Editorial.
Documento en línea Autor, AA (2001). Título de la obra. Obtenido mes día, año, de la fuente.
siguiendo las tablas de datos. Finalmente, inserta sus cifras, cada una en una página separada. Las
tablas y figuras están separadas del texto, una por página, para facilitar el proceso de composición tipográfic
Como se mencionó antes, las copias de los manuscritos se organizan de esta manera para adaptarse
al editor. Sin embargo, debe tener en cuenta que hay una sección especial en el Manual de publicación
de la APA sobre el formato aceptado para los trabajos de los estudiantes presentados como requisito de
un curso, pero no para su publicación. Por ejemplo, en trabajos de estudiantes, se pueden intercalar
tablas y figuras en el texto. Debe consultar con su profesor o departamento sobre el formato preferido
para los proyectos de clase. Sin embargo, recomendamos aprender el formato de publicación APA porque
proporciona una buena práctica para preparar sus futuras publicaciones.
Manuscrito de muestra
Un manuscrito de muestra aparece en las siguientes páginas. La investigación que condujo a este
manuscrito fue realizada por el primer autor (David Gallo) y el segundo autor (Meredith Roberts) mientras
eran estudiantes universitarios en la Universidad de Wesleyan y trabajaban con el tercer autor (Dr. John
Seamon). La investigación comenzó como un proyecto en un curso de metodología en el que estaba
matriculado David Gallo, uno como el curso en el que están matriculados la mayoría de los estudiantes
que leen este texto. Estos estudiantes wesleyanos, con la ayuda de su profesor, convirtieron un proyecto
estudiantil en un artículo publicable que contribuyó a la literatura psicológica sobre la memoria humana.
Debe tener en cuenta la secuencia de páginas, dónde comienza a escribir en una nueva página y qué
información se proporciona en cada sección. Un aspecto que falta en este manuscrito y que puede
aparecer en uno de los suyos es una nota al pie de página separada. Además, puede optar por incluir
figuras que representen datos en forma gráfica además de (o en lugar de) tablas. Note cuidadosamente
cómo se citan las referencias en la sección de referencias. Un aspecto de este manuscrito que es diferente
del formato APA estándar es el uso del término sujetos en lugar de participantes. Aunque el formato APA
actual requiere el uso del término participantes para seres humanos que participan en la investigación,
algunas revistas no afiliadas a la Asociación Estadounidense de Psicología (como la que publicó el
siguiente artículo de investigación) permiten el uso de participantes o sujetos. Por lo tanto, el término
sujetos
se utilizó en este artículo a discreción de los autores.
La cita completa del siguiente artículo es: Gallo, DA, Roberts, MJ y Seamon, JG (1997). Recordar
palabras no presentadas en listas: ¿Podemos evitar crear falsos recuerdos? Psychonomic Bulletin &
Review, 4, 271–276. (Copyright 1997 por Psycho nomic Society Inc. Reimpreso con permiso de los
autores y el editor).
El texto continúa en la pág. 143
59533_06_ch05_p099-150.indd 121 9533_06_ch05_p099-150.indd 121 28/03/08 /28/08

Recordando palabras 1
Cabeza de carrera: FALSO RECONOCIMIENTO
Recordar palabras no presentadas en listas: ¿podemos evitar crear falsos recuerdos?
David A. Gallo, Meredith J. Roberts y John G. Seamon
Universidad Wesleyana
59533_06_ch05_p099-150.indd 122 9533_06_ch05_p099-150.indd 122 28/03/08 /28/08

Resumen
¿Pueden los sujetos evitar crear recuerdos falsos en Roediger y McDermott (1995) falso
paradigma de reconocimiento si se les advierte sobre esta ilusión de la memoria? Nosotros pre
sujetos enviados con listas de palabras relacionadas semánticamente, seguido de una prueba de reconocimiento.
La prueba estuvo compuesta por palabras estudiadas, palabras no estudiadas relacionadas semánticamente (crit
señuelos ical), y palabras no estudiadas no relacionadas. Un grupo de sujetos no estaba informado
sobre el efecto de reconocimiento falso, se instó a un segundo grupo a minimizar todos los falsos
alarmas, y un tercer grupo fue advertido sobre el reconocimiento falso de señuelos críticos.
En comparación con los sujetos desinformados y cautelosos, los sujetos advertidos redujeron su tasa de falsas
alarmas para los señuelos críticos, y emitieron juicios de recordar y saber.
con la misma frecuencia para palabras estudiadas reconocidas y señuelos críticos. Pero la advertencia no
eliminar el efecto de reconocimiento falso, ya que estos sujetos y los de los otros grupos
hizo numerosos reconocimientos falsos en esta tarea.
59533_06_ch05_p099-150.indd 123 9533_06_ch05_p099-150.indd 123 28/03/08 /28/08

Recordando palabras no presentadas en listas:
¿Podemos evitar crear recuerdos falsos?
En un número especial del Journal of Memory and Language dedicado a la investigación
sobre las ilusiones de la memoria, Roediger (1996) proporcionó una descripción histórica de los errores en
percepción y memoria. Definió una ilusión de memoria como una instancia en la que un
el informe de una persona sobre un evento pasado se desvía seriamente del evento real. uno llamativo
ejemplo ofrecido como evidencia de una ilusión de la memoria fue el hallazgo de Deese (1959) de falso
recordar en un paradigma de aprendizaje de lista. Deese presentó sujetos con listas de semántica como
se asocia a palabras críticas no presentadas. Por ejemplo, para la palabra crítica "aguja",
la lista presentada constaba de hilo, alfiler, ojo, costura, afilado, punta, pinchado, dedal,
pajar, dolor, herida e inyección. Cuando a los sujetos se les dio una prueba de recuerdo libre
después de la presentación de cada lista, la palabra crítica no presentada a menudo se
recuerda con más frecuencia que las palabras no presentadas pero no relacionadas. Este procedimiento
indujo a los sujetos a recordar palabras específicas que nunca se presentaron en las listas. Empezar
ning con Roediger y McDermott (1995), ha habido un resurgimiento del interés en este
paradigma para estudiar este efecto de memoria falsa (p. ej., McDermott, 1996; Payne, Elie,
Blackwell y Neuschatz, 1996; Lectura, 1996; Schacter, Verfaille y Pradere, 1996).
Roediger y McDermott (1995) reportaron dos experimentos que replicaron y
resultado extendido de Deese. En su primer experimento, a los sujetos se les leyeron seis de
Listas de Deese que provocaron la mayor frecuencia de recuerdo falso. Después de que cada lista fue pre
enviado, a los sujetos se les dio una prueba de recuerdo libre, seguida de una prueba de reconocimiento después
todas las listas fueron retiradas. La prueba de reconocimiento estuvo compuesta por palabras estudiadas,
palabras críticas no estudiadas (en lo sucesivo denominadas señuelos críticos), y palabras no estudiadas
palabras no relacionadas. Roediger y McDermott encontraron que los señuelos críticos eran falsamente
recordadas y reconocidas con más frecuencia que otras palabras no estudiadas.
En su segundo experimento, Roediger y McDermott modificaron su procedimiento.
La mitad de los sujetos recibieron una prueba de recuerdo libre después de cada presentación de la lista de estudio, y
la mitad realizó problemas matemáticos no relacionados en su lugar. En la prueba de reconocimiento posterior,
59533_06_ch05_p099-150.indd 124 9533_06_ch05_p099-150.indd 124 28/03/08 /28/08

los investigadores hicieron uso de la tarea de juicio recordar versus saber de Tulving (1985). Para cualquier palabra
reconocida, los sujetos tenían que indicar si recordaban específicamente la aparición de la palabra en el estudio (un
juicio de recuerdo) o simplemente sabían
la palabra que había sido presentada en ausencia de cualquier recuerdo específico (un saber
juicio). Roediger y McDermott encontraron que la condición de estudio y recuerdo condujo a
más reconocimientos falsos de señuelos críticos que el estudio y la condición matemática. Cómo
nunca, los sujetos en ambas condiciones produjeron falsas alarmas a los señuelos críticos a tasas
que eran comparables a las tasas de aciertos correspondientes a las palabras estudiadas. Además, el
Los resultados mostraron que los señuelos críticos reconocidos a menudo se caracterizaban como recordados.
en la tarea de juicio recordar versus saber, especialmente en las condiciones de estudio y recuerdo
ción Estas observaciones llevaron a Roediger y McDermott a describir el reconocimiento falso
efecto de ción como una “poderosa ilusión de la memoria” (p. 803). Una ilusión que es tanto más
sorprendente, dijeron, porque se observó en condiciones de aprendizaje intencional,
con intervalos de retención cortos, en un procedimiento de laboratorio de aprendizaje de listas que normalmente
produce pocos errores, y con memorizadores profesionales (estudiantes universitarios) como sujetos.
El propósito principal de la presente investigación fue determinar si los sujetos
podría evitar crear recuerdos falsos en el reconocimiento falso de Roediger y McDermott
paradigma si estuvieran advertidos sobre esta ilusión de la memoria. Hasta donde sabemos, no
uno ha determinado específi camente si este efecto de memoria falsa podría ser disminuido o
eliminado por el conocimiento de los sujetos, pero investigaciones previas han preguntado si diferentes
las condiciones experimentales podrían infl uir en este efecto. Por ejemplo, McDermott (1996,
Experimento 2) dio a los sujetos múltiples pruebas de estudio y recuerdo con las mismas listas de palabras
presentado de manera bloqueada o aleatoria. Encontró esa presentación aleatoria
produjo menos recuerdo falso que la presentación bloqueada, pero ambas formas de presentación
todavía produjo recuerdos falsos después de múltiples ensayos de prueba de estudio o una prueba de recuerdo final dada 24 h
luego. Payne et al. (1996) observaron un efecto similar al mostrar que el reconocimiento de
los señuelos críticos no disminuyeron durante un intervalo de retención de 24 h. Finalmente, Read (1996) ma
instrucciones de codificación anuladas haciendo que los sujetos memoricen el orden de las palabras o participen
59533_06_ch05_p099-150.indd 125 9533_06_ch05_p099-150.indd 125 28/03/08 /28/08

en el ensayo de elaboración o de mantenimiento durante la presentación de la lista. Encontró que todo
tres condiciones de codificación produjeron altos niveles de recuerdo falso para palabras críticas, pero el
los recuerdos falsos fueron más bajos para los sujetos que se centraron en el orden de las palabras. Estos estudios
indican que este efecto de memoria falsa persiste a través de múltiples estudios y ensayos de prueba
(McDermott, 1996), un retraso de 24 horas entre el estudio y la prueba (McDermott, 1966; Payne et al., 1996) y un
ensayo de elaboración o mantenimiento durante la codificación (Read, 1996).
Pero la memoria falsa para las palabras críticas disminuye cuando las palabras se asignan al azar.
sobre listas (McDermott, 1996) o los sujetos intentan memorizar el orden de las palabras en el estudio
(Leer, 1996).
A raíz de esos estudios, la presente investigación buscó determinar si la falsa rec
El reconocimiento de señuelos críticos podría atenuarse o eliminarse mediante el uso de advertencias previas.
instrucciones. Curiosamente, no encontramos investigaciones publicadas sobre los efectos del conocimiento previo.
ventaja sobre las ilusiones perceptivas o de la memoria. Para las ilusiones perceptivas, tal investigación puede
han sido innecesarios ya que Gregory (1987) señala que estas ilusiones ocurren incluso cuando
la gente sabe que está percibiendo una ilusión. Por ejemplo, podemos saber que
las líneas en la ilusión de Muller-Lyer tienen la misma longitud, pero una línea todavía parece ser
más largo que el otro. Las ilusiones perceptivas nos engañan porque los procesos perceptivos funcionan
extremadamente rápido y no tener en cuenta todo lo que sabemos en el pro
proceso de formar un precepto (Gregory, 1987). Las ilusiones de la memoria también nos engañan, pero lo hacen
por lo tanto, durante un marco de tiempo más prolongado que incluye condiciones de estudio y prueba. Memoria
Las ilusiones pueden, por lo tanto, brindar una mayor oportunidad que las ilusiones perceptivas para ser influenciadas.
por el conocimiento del sujeto. En la medida en que se pueda utilizar el conocimiento previo
durante la codificación o recuperación para idear estrategias cognitivas compensatorias, una ilusión
puede ser disminuida o eliminada.
Las únicas declaraciones que encontramos sobre los efectos del conocimiento previo en falso
memoria están ubicados en dos lugares en la investigación de Roediger y McDermott (1995). Una
La declaración sugiere que la advertencia previa podría ser efectiva para minimizar el reconocimiento falso.
ción de señuelos críticos, mientras que la otra declaración sugiere poco efecto de advertencia.
59533_06_ch05_p099-150.indd 126 9533_06_ch05_p099-150.indd 126 28/03/08 /28/08

Por ejemplo, los autores notaron que eliminaron el único tema de su análisis
hermana que no tenía recuerdos falsos de las palabras críticas porque al final del Experimento
2 cuando se preguntó a los sujetos si "sabían de qué se trataba el experimento", esto
sujeto informó que “notó que las listas parecían diseñadas para hacerla pensar
de una palabra no presentada” (p. 808) Este sujeto puede haber adoptado una estrategia que
le permitió superar la ilusión de la memoria. Sin embargo, Roediger y McDermott
también informó que "experimentos de demostración informales con grupos de sophisti
sujetos seleccionados, como estudiantes graduados astutos que sabían que estábamos tratando de inducir
falsos recuerdos” todavía producía un fuerte efecto de falso recuerdo (p. 812). En la medida
que estos sujetos estaban completamente informados sobre la ilusión de la memoria antes del estudio, esto
La observación sugiere que la advertencia previa tendrá un efecto mínimo en el reconocimiento falso.
ción de palabras críticas.
La presente investigación probó sistemáticamente estas alternativas de conocimiento previo
comparar grupos de sujetos con diferentes conjuntos de instrucción en una versión modificada
del paradigma de Roediger y McDermott (1996, Experimento 2). En la medida en que
este efecto de memoria falsa es una ilusión de memoria que funciona como una ilusión perceptual,
el conocimiento previo del efecto puede tener poco o ningún efecto en el reconocimiento de críticas
llamar señuelos. Pero si esta ilusión de la memoria difiere de las ilusiones perceptivas en que permite
mayor oportunidad para que el rendimiento se vea influido por la codificación o la estrategia de recuperación
gies, el conocimiento previo de la ilusión debería atenuar el efecto en la medida en que la gente
pueden idear estrategias compensatorias efectivas. Presentamos sujetos con bloqueo
listas de palabras relacionadas semánticamente para estudiar, seguidas de una prueba de reconocimiento después de todo
se presentaron listas. Un grupo de sujetos no estaba informado sobre el falso reconocimiento
ción, se instó a un segundo grupo a ser cautos a la hora del reconocimiento
prueba para minimizar todas las falsas alarmas, y un tercer grupo fue advertido de la específi c
ilusión por una demostración e instrucciones antes del estudio. Basado en Roediger
y los hallazgos de McDermott, planteamos la hipótesis de que los sujetos en el grupo desinformado
dicha condición produciría un fuerte efecto de falso reconocimiento. Sujetos en el cauteloso y
59533_06_ch05_p099-150.indd 127 9533_06_ch05_p099-150.indd 127 28/03/08 /28/08

grupos advertidos proporcionan nuevas condiciones de prueba y, en comparación con los desinformados
condición, deberían producir un efecto comparable o disminuido.
Método
Asignaturas
Los sujetos fueron 48 estudiantes universitarios de Wesleyan University que sirvieron como
voluntarios Ninguno había participado en ninguna investigación relacionada con la memoria.
Materiales
Usamos 16 de las 24 listas de palabras de Roediger y McDermott para el estudio y las palabras de prueba
(ver su apéndice). Cada lista estaba compuesta por 15 asociados a una crítica no presentada.
palabra cal (es decir, un señuelo crítico). Dentro de una lista, el orden de las palabras era constante y
los asociados más fuertes al señuelo crítico normalmente ocurrían primero. por ejemplo, el
La lista asociada con el señuelo crítico del sueño constaba de las siguientes palabras: cama, descanso,
despierto, cansado, soñar, despertar, dormitar, manta, dormitar, dormir, roncar, siesta, paz, bostezar y somnoliento.
Para fines de contrapeso, las 16 listas se dividieron en dos conjuntos de 8 listas, etiquetados A y B. La mitad de los
sujetos en cada condición recibieron el Conjunto A para
estudio y la otra mitad recibió el Juego B. El juego que no se usó durante el estudio proporcionó elementos de distracción para
la prueba de reconocimiento.
Procedimiento
Durante el estudio, a los sujetos se les presentó una cinta auditiva que contenía ocho
listas de 15 palabras presentadas en bloques. Las palabras fueron pronunciadas por un hombre.
voz a razón de 1,5 s por palabra, y un tono separaba cada lista. Los sujetos, que
fueron evaluados en grupos de hasta 6, se les dijo que recordaran las palabras para un reconocimiento
prueba de memoria que seguiría.
Después de escuchar las 120 palabras del estudio, los sujetos recibieron un reconocimiento visual
prueba de memoria que consta de 64 palabras. Siguiendo la prueba profesional de Roediger y McDermott
procedimiento, esta prueba contenía tres ítems de cada lista estudiada (posiciones de serie 1, 8,
y 10), el señuelo crítico no presentado de cada lista estudiada, tres ítems de cada
59533_06_ch05_p099-150.indd 128 9533_06_ch05_p099-150.indd 128 28/03/08 /28/08

lista no estudiada (posiciones de serie 1, 8 y 10), y el señuelo crítico de cada no semental
lista ied, todos enumerados en un orden aleatorio. Cada palabra iba acompañada de un signo más (1) y
signo menos (2) y las letras R y K (para recordar y saber).
Los sujetos fueron instruidos para examinar las palabras en orden secuencial en un auto
tasa de ritmo y tomar una decisión para cada palabra en la lista. Se les dijo que circularan
el signo más para cualquier palabra que reconocieron de la cinta de estudio o el signo menos
firmar por cualquier palabra que no reconocieron. Además, siguiendo a Tulving (1985), la
Se instruyó a los sujetos para que hicieran un juicio de recuerdo o conocimiento para cada
palabra marcando con un círculo R o K en sus hojas de respuestas. Se les dijo a los sujetos que encerraran en un círculo la R si
tenían un recuerdo consciente de la palabra de las listas de estudio, como la forma
se presentó la palabra o lo que estaban pensando en ese momento, o K si
estaban seguros de que se presentó la palabra, pero no pudieron recordar su aparición real
o cualquier detalle relacionado. Estas instrucciones para los juicios de recordar y saber fueron
similares a los utilizados por Rajaram (1993) y Roediger y McDermott (1995). Después
la prueba de reconocimiento, los sujetos completaron un cuestionario que evaluó su conciencia
ness de la organización de las listas de palabras en el estudio y pidió una descripción de cualquier
estrategias que se utilizaron para reducir los falsos reconocimientos.
La variable de interés principal en este experimento fue el efecto del conocimiento previo
sobre el efecto de la falsa memoria. En consecuencia, tres grupos de 16 sujetos recibidos difieren
instrucciones ent en estudio o prueba. En la condición desinformada, los sujetos no estaban
habló sobre el efecto de reconocimiento falso. En su lugar, se les dieron instrucciones estándar
para tratar de recordar tantas palabras como sea posible para una prueba de reconocimiento posterior. Este
condición es similar al procedimiento general utilizado por Roediger y McDermott (1995,
Experimento 2).
En la condición de cautela, los sujetos también estaban desinformados sobre la falsa rec
efecto de cognición durante el estudio, pero se les pidió que tuvieran cuidado en el reconocimiento
prueba para minimizar sus falsos reconocimientos a todas las palabras. Esta condición fue
diseñado para determinar si el mero hecho de pedir a los sujetos que fueran cautelosos era suficiente para
59533_06_ch05_p099-150.indd 129 9533_06_ch05_p099-150.indd 129 28/03/08 /28/08

minimizar el efecto de reconocimiento falso para señuelos críticos. A diferencia de los sujetos en el unin
condición formada que no recibió información sobre las palabras utilizadas en el reconocimiento
prueba de ción, a estos sujetos se les dijo que algunas palabras en la prueba eran similares a palabras
escuchados en el estudio, pero en realidad no fueron presentados. No se proporcionó ninguna otra información.
En la condición prevenida, los sujetos recibieron información detallada
y ejemplos del efecto de falso reconocimiento previo a la presentación del estudio
liza. Debido a que a los sujetos se les dijo específi camente que las listas de estudio estaban diseñadas para
tratar de hacerles reconocer falsamente palabras relacionadas pero no presentadas, esta condición al
sujetos reducidos la oportunidad de idear estrategias para reducir o eliminar el falso reconocimiento
efecto de nición. Como parte del procedimiento de preaviso, los sujetos participaron en una falsa
demostración de reconocimiento antes de que se dieran las instrucciones para el experimento real.
A los sujetos se les leyó una lista de muestra de palabras y se les dijo que se les daría una
practicar la prueba de reconocimiento para familiarizarse con el procedimiento. la lista era
obtenido de Roediger y McDermott y no utilizado en ninguna otra parte de este experimento.
Después de la presentación de la lista de muestra, los sujetos recibieron un rec de ocho palabras
Prueba de reconocimiento, construida de la misma manera que nuestra prueba real. tres de las palabras
eran de la lista de muestra (posiciones de serie 1, 8 y 10), una palabra era la nonpre
envió un señuelo crítico, y cuatro palabras fueron distractores no relacionados tomados de otro
La lista de Roediger y McDermott no se volvió a utilizar en este experimento. Después de las materias
completó la prueba de reconocimiento de muestras, se identificó el señuelo crítico y el falso
se describió el efecto de reconocimiento.
A estos sujetos se les informó además que investigaciones previas habían demostrado que
presentar listas de palabras que se asociaron semánticamente a palabras no presentadas
condujo a altos niveles de falso reconocimiento de los señuelos críticos. Esta discusión fue fol
seguido de una lectura de otra lista de muestra de 15 palabras relacionadas, junto con su crítica
señuelo de otra lista de Roediger y McDermott que no se volvió a utilizar en este experimento
mento A los sujetos se les dijo que las listas que escucharían en el estudio estaban
estructurado de la misma manera que las listas de muestra. Su tarea era minimizar las falsas
59533_06_ch05_p099-150.indd 130 9533_06_ch05_p099-150.indd 130 28/03/08 /28/08

reconocimiento de señuelos críticos sin sacrificar su reconocimiento de palabras presentadas en
estudiar. Se tuvo cuidado de asegurar que los sujetos entendieran la manera en que
se construyeron las listas de estudio, la naturaleza del efecto de reconocimiento falso y el objetivo de
minimizando el falso reconocimiento de señuelos críticos. Antes de la prueba de reconocimiento, el sub
Se recordaba a los sujetos su tarea. Juntos, estos procedimientos proporcionan una fuerte prueba de
cualquier posible efecto de la advertencia.
Resultados
Los datos primarios consistieron en las respuestas a la prueba de reconocimiento para sujetos en
las condiciones desinformadas, cautelosas y prevenidas y el recuerdo vs. saber
juicios para todas las palabras que fueron reconocidas. Estos resultados se muestran en
Tabla 1 para cada condición y medida de respuesta.
La Tabla 1 indica que la tasa de aciertos de las palabras estudiadas varió entre los grupos, y esto
observación fue apoyada por los resultados de un análisis de varianza, F (2, 42) = 4.62,
M Se = .02, p < .02. La tasa de aciertos para el grupo desinformado (.76) fue mayor que la
para el grupo cauteloso (.65), t(30) = 2.33, SEM = .05, p < .05, y los prevenidos
(.63), t(30) = 3.01, SEM = 04, p < .01, mientras que las tasas de acierto para los cautelosos y
los grupos preavisados no variaron, t < 1. También hubo un efecto de los grupos sobre los falsos
tasa de reconocimiento para señuelos críticos, F(2, 42) = 11.05, MSe = .05, p < .001, como la tasa para
el grupo advertido (.46) fue menor que el del grupo no informado (.81),
t(30) = 4.84, SEM = .07, p < .001, y el grupo cauteloso (.74), t(30) = 3.36,
SEM = .08, p < .01. Las tasas de falsa alarma para señuelos críticos para los desinformados y cau
varios grupos no variaron, t < 1, y no hubo un efecto general de los grupos sobre el falso
tasas de alarma para palabras no estudiadas o señuelos críticos no relacionados, ambas F < 1.
Además de producir la tasa de aciertos más alta, el grupo desinformado también produjo
un fuerte efecto de memoria falsa al reconocer falsamente los señuelos críticos no presentados
(.81) al menos con la misma frecuencia que las palabras estudiadas (.76), t(15) = 1.25, SEM < .04,
p > .10. En la tarea de juicio recordar versus saber, estos sujetos seleccionaron
recuerda las respuestas con más frecuencia que las respuestas conocidas para los estudios estudiados reconocidos
59533_06_ch05_p099-150.indd 131 9533_06_ch05_p099-150.indd 131 28/03/08 /28/08

palabras, t(15) = 4.43, SEM = .06, p < .001, y señuelos críticos reconocidos falsamente, t(15) = 2.40, SEM
< .11, p < .05. Sus tasas de falsas alarmas para palabras no estudiadas y
los señuelos críticos no relacionados eran los mismos (.15), y la mayoría de estas falsas alarmas eran
juzgados como respuestas conocidas. Estos resultados replican de cerca los resultados de Roediger y McDermott.
(Experimento 2, Tabla 2) resultados e indican que cuando los sujetos no están informados sobre
esta ilusión de la memoria, no pueden diferenciar los elementos de la lista de los relacionados semánticamente, pero
artículos no presentados.
El hallazgo de que los sujetos en el grupo cauteloso tuvieron un resultado general significativamente más bajo
tasa de aciertos y tasas de falsas alarmas no significativamente más bajas que los sujetos en el desinformado
El grupo sugiere que las instrucciones para ser cauteloso infl uyeron en el reconocimiento realizado.
mance Pero a pesar de que estos sujetos ejercieron cautela, todavía demostraron
un efecto de memoria falsa al reconocer señuelos críticos (0,74) al menos con la misma frecuencia que las
palabras estudiadas (0,65), t(15) = 1,8, SEM < 0,05, p > 0,05. Sin embargo, estos sujetos, que seleccionaron respuestas
de recordar sobre respuestas de saber para palabras estudiadas reconocidas, t (15) = 2.67, SEM < .06, p < .05, no
diferenciaron estas respuestas para palabras críticas falsamente reconocidas.
señuelos, t < 1. Sus tasas de falsas alarmas fueron las mismas para palabras no estudiadas y palabras no relacionadas.
señuelos críticos (.12), y la mayoría de estas falsas alarmas fueron juzgadas como respuestas conocidas.
Estos resultados indican que instruir a los sujetos para que sean cautelosos puede reducir la tasa de aciertos para
palabras estudiadas y reducir la probabilidad de que los señuelos críticos reconocidos falsamente sean
juzgado como recordado de las listas anteriores. Pero tales instrucciones no disminuyen la
Efecto de falso reconocimiento. Simplemente pedirle a la gente que tenga cuidado con sus falsas alarmas
tiene poco efecto sobre esta ilusión de la memoria.
Lo que es más importante, los sujetos del grupo advertido tenían una tasa de aciertos general más baja.
y una tasa de falsas alarmas más baja para los señuelos críticos que los sujetos del grupo no informado.
Al mismo tiempo, tenían una tasa de aciertos comparable y un falso señuelo crítico más bajo.
tasa de alarma que los sujetos en el grupo cauteloso. Estos temas aún se hicieron más falsos
reconocimientos de señuelos críticos (0,46) que señuelos críticos no relacionados (0,14), t(15) = 5,39, SEM =
0,06, p < 0,001, lo que demuestra la persistencia del efecto de memoria falsa.
59533_06_ch05_p099-150.indd 132 9533_06_ch05_p099-150.indd 132 28/03/08 /28/08

Pero su tasa más baja de reconocimiento falso de señuelos críticos, en relación con esa tasa para cualquiera
los grupos desinformados (.81) o cautelosos (.74), y su menor tasa de reconocimiento falso
ción de señuelos críticos en relación con su tasa de éxito, t (15) = 3.2, SEM = .05, p < .01, indica
que las instrucciones de advertencia disminuyeron el efecto de falso reconocimiento. Además, a diferencia de
los sujetos desinformados, estos sujetos no diferenciaron entre recordar y
saber juicios para cualquiera de las palabras estudiadas reconocidas, t (15) = 1.0, SEM = .05,
p > .10, o señuelos críticos, t(15) = 1.3, SEM = .08, p > .10. Como en las condiciones anteriores,
las tasas de falsas alarmas para palabras no estudiadas y señuelos críticos no relacionados fueron las mismas
(.14), con la mayoría de estas falsas alarmas juzgadas como respuestas conocidas. Estos resultados
demostrar que las instrucciones de advertencia pueden reducir la magnitud de las falsas notificaciones
efecto de cognición al reducir la proporción de señuelos críticos falsamente reconocidos y el
proporción de esos falsos reconocimientos juzgados como recordados del estudio.
El Cuestionario Posterior al Experimento
Se entregó un cuestionario abierto a todos los sujetos al final de la experiencia.
mento Fue diseñado para proporcionar información sobre el conocimiento de los sujetos de la lista de estudio.
organización y los tipos de estrategias que se utilizaron para maximizar el desempeño en
la prueba de reconocimiento. Para los sujetos en el grupo cauteloso, estábamos interesados en disuadir
minar cómo podrían reducir sus falsas alarmas a todas las palabras no estudiadas, mientras que para
sujetos en el grupo advertido, queríamos saber cómo intentaron mini
micen su susceptibilidad para reconocer señuelos críticos. Declaración escrita de cada sujeto.
se clasificó en una de cuatro categorías según la estrategia específica que se
escrito. Esas categorías consistían en lo siguiente: ninguna estrategia indicada (estas sub
temas no reportaron ninguna estrategia), ensayo de mantenimiento (estos temas se enfocaban
en el sonido de cada palabra de la lista o las repitió en silencio durante el estudio), elaborativo
ensayo (estas asignaturas se centraron en temas de lista al vincular palabras de estudio por semántica
asociaciones o formar imágenes visuales de las palabras), y determinar señuelos críticos
59533_06_ch05_p099-150.indd 133 9533_06_ch05_p099-150.indd 133 28/03/08 /28/08

(además de centrarse en el tema de cada lista, estos sujetos intentaron determinar y
recuerde el señuelo crítico de cada lista). La tabla 2 muestra el número de sujetos en cada
categoría de cada grupo, junto con la tasa de acierto promedio correspondiente para el estudio
palabras y tasa de falsas alarmas para señuelos críticos. Tasas de falsas alarmas para palabras no estudiadas
y los señuelos críticos no relacionados no se incluyeron porque estas tasas eran bajas en cada
condición y no difirió entre los grupos.
Los resultados que se muestran en la Tabla 2 indican que los sujetos en el desinformado y cau
Varios grupos produjeron un patrón similar de Resultados. Estos sujetos eran más aptos para
Informar que usaron el Ensayo elaborativo como su medio principal para recordar
lista de palabras (17 de 32 o .53) que ensayo de mantenimiento (3 de 32 o .09) o un
estrategia dirigida a determinar los señuelos críticos (5 de 32 o .16). Aunque estos sub
Los sujetos utilizaron espontáneamente procesos de elaboración que suelen ser más efectivos.
que los procesos de mantenimiento para recordar las palabras de estudio (p. ej., Craik & Watkins,
1973), la mayoría de ellos no eran conscientes de la naturaleza de este experimento y lo hicieron
No trate de determinar los señuelos críticos por su cuenta. Esto fue cierto incluso después de que los sujetos
en el grupo cauteloso se les dijo que algunas palabras de prueba no presentadas serían similares
para estudiar palabras. En la Tabla 2 se observa un patrón de resultados muy diferente para los sujetos en
el grupo advertido. La estrategia informada con mayor frecuencia para estos sujetos fue
para determinar los señuelos críticos. Los ensayos elaborados o de mantenimiento se realizaban con poca frecuencia.
informó, y el número de sujetos que no informó ninguna estrategia fue comparable a
los otros grupos.
Los resultados en la Tabla 2 hacen dos puntos importantes. El primer punto es que el en
Las instrucciones dadas a los sujetos en esta tarea infl uyeron en el tipo de estrategia que se
usó. Cuando a los sujetos simplemente se les dijo que serían evaluados en listas de palabras
(grupo desinformado) o instado a ser cauteloso para una prueba (grupo cauteloso), la mayoría
de ellos adoptaron sabiamente procesos de ensayo elaborados para maximizar su memoria
actuación. Sin embargo, cuando se les dijo de antemano sobre la ilusión de la memoria
(grupo prevenido), muchos de estos sujetos trataron de determinar el punto crítico específi co
señuelos que pueden aparecer en la prueba de reconocimiento. El segundo y más importante punto
59533_06_ch05_p099-150.indd 134 9533_06_ch05_p099-150.indd 134 28/03/08 /28/08

es que los sujetos en todas las condiciones eran susceptibles al efecto de reconocimiento falso, re
independientemente de la estrategia autoinformada. Si examinamos sólo aquellas categorías en la Tabla 2 con
la mayoría de los sujetos, el falso reconocimiento de señuelos críticos fue mayor para los sujetos en el
grupos desinformados (.89) y cautelosos (.82) que usaron ensayo elaborativo que sub
jects en el grupo advertido (.45) que trató de determinar los señuelos críticos. Pero ten en cuenta que
incluso aquellos sujetos en el grupo advertido que trataron de encontrar señuelos críticos falsamente
reconoció a casi la mitad de ellos. Esos sujetos entendieron las instrucciones de advertencia.
ciones y trató de minimizar el efecto de reconocimiento falso, sin embargo, todavía estaban infl uenciados
por la ilusión de la memoria que estaban tratando activamente de resistir. Claramente, la advertencia en
Las instrucciones disminuyeron pero no eliminaron el efecto de falso reconocimiento.
Una demostración en clase
Como parte de una reunión regular de la clase del tercer autor (Psicología 221, Human
Memory), 25 estudiantes de Wesleyan University participaron en una demostración en clase
sobre el efecto de la advertencia. Antes de la demostración, los estudiantes recibieron una
descripción detallada del experimento de Roediger y McDermott, junto con una lista de muestra
y señuelo crítico. El instructor luego les informó que se les leerían 8 listas de
palabras, y su trabajo consista en idear una estrategia para minimizar el falso reconocimiento de crti
llamar señuelos. Las listas de estudio y la prueba de reconocimiento se construyeron de la misma manera que
el presente experimento. Las listas se leyeron a una velocidad de aproximadamente 1,5 s por palabra,
y recordar y saber que los juicios no se hicieron en la prueba. Los resultados estrechamente paralelos
lideraron a los del grupo advertido en el presente experimento para la tasa de aciertos (.67),
falsas alarmas para señuelos críticos (.49) y falsas alarmas para palabras no estudiadas (.19) y
señuelos críticos no relacionados (.22). A pesar de que los estudiantes de memoria todavía reconocían falsamente
señuelos críticos mayores que señuelos críticos no relacionados, t(24) = 7.57, SEM = .04, p < .001,
su nivel de reconocimiento falso de señuelos críticos fue menor que su tasa de aciertos para los señuelos estudiados
palabras, t(24) = 3.40, SEM = .05, p < .01. Estos hallazgos indican que la memoria
los estudiantes eran susceptibles a esta ilusión de la memoria, aunque a un nivel atenuado.
59533_06_ch05_p099-150.indd 135 9533_06_ch05_p099-150.indd 135 28/03/08 /28/08

Por lo tanto, tanto en un entorno de laboratorio formal como en un entorno de aula menos formal,
Las instrucciones de advertencia sirvieron para disminuir pero no eliminar el efecto de esta
ilusión de la memoria.
Discusión
El estudio demostró varios puntos importantes. Primero, cuando los sujetos no estaban
informados sobre la ilusión de la memoria, demostraron un fuerte reconocimiento falso
efecto. Estos sujetos reconocieron falsamente señuelos críticos a un ritmo comparable
a su tasa de aciertos para las palabras estudiadas, y era más probable que indicaran que
recordaba específi camente esas palabras del estudio que simplemente sabía que eran
presentado. En segundo lugar, cuando se instó a los sujetos a ser cautelosos con las falsas alarmas para
en pocas palabras, todavía demostraron un fuerte efecto de reconocimiento falso como su falsa alarma
la tasa de señuelos críticos fue comparable a su tasa de aciertos para las palabras estudiadas. Sin embargo,
Las instrucciones para ser cauteloso disminuyeron la probabilidad de que los críticos reconocieran falsamente
los señuelos serían recordados del estudio. En tercer lugar, cuando los sujetos fueron advertidos acerca de
la ilusión de la memoria, demostraron un efecto de falso reconocimiento disminuido. Estas
sujetos redujeron su tasa de falsas alarmas para señuelos críticos, y les hicieron recordar y
conoce juicios con la misma frecuencia para palabras estudiadas reconocidas y señuelos críticos. Cuatro,
un cuestionario posterior al experimento indicó que la mayoría de los sujetos en el
grupos desinformados y cautelosos usaron ensayos elaborados para tratar de recordar el
palabras de estudio, mientras que muchos sujetos en el grupo advertido trataron de determinar el
señuelos críticos. Los sujetos del grupo advertido que buscaban los señuelos críticos eran
aún susceptible a la ilusión de la memoria. Finalmente, los efectos de la advertencia sobre las falsas
Se demostró que el reconocimiento era confiable por los resultados de una demostración en clase.
Nuestro hallazgo de que las instrucciones de advertencia disminuyeron pero no eliminaron las falsas
El efecto de reconocimiento proporciona un vínculo empírico entre la percepción y la memoria.
siones. Anteriormente, Roediger y McDermott (1995) sugirieron que el efecto de memoria falsa
funciona como una ilusión perceptiva cuando afirmaron que "así como las ilusiones perceptivas
puede ser convincente incluso cuando las personas son conscientes de los factores que dan lugar a la
59533_06_ch05_p099-150.indd 136 9533_06_ch05_p099-150.indd 136 28/03/08 /28/08

ilusión, sospechamos que lo mismo es cierto en nuestro caso de recordar eventos que nunca
sucedió." (pág. 812). Nuestros resultados no están en desacuerdo; tanto informados como desinformados
sujetos falsamente reconocidos señuelos críticos. Los procedimientos actuales permitieron prevenido
sujetos la oportunidad de idear estrategias para reducir su susceptibilidad a los señuelos críticos.
Sin embargo, aunque muchos sujetos de este grupo trataron de determinar esos señuelos críticos,
Todavía reconoció falsamente a casi la mitad de ellos. Esta ilusión de la memoria, puede ser infl uenciada por una
conocimiento del sujeto porque los procedimientos utilizados en esta tarea dan tiempo para ese conocimiento
borde a utilizar. Pero incluso cuando los sujetos estaban armados con este conocimiento, las falsas recomendaciones
Todavía ocurrieron reconocimientos. Dados los extensos procedimientos de entrenamiento usados en los prevenidos
condición, no es obvio cómo podríamos haber informado mejor a nuestros sujetos sobre este
ilusión, ni está claro que exista una mejor estrategia para conjurar su efecto que tratar de disuadir
mina los señuelos críticos. Esta estrategia no fue del todo efectiva, y su efectividad
se espera que disminuya a medida que el número de listas de estudio crece más que el espacio de memoria.
Claramente, incluso los sujetos informados cometen errores de memoria en esta tarea.
Para explicar esta ilusión de la memoria, algunos investigadores han adoptado el método de Underwood.
(1965) hipótesis de respuesta de activación implícita que sugiere que cuando los sujetos codifican
palabras, piensan en asociados semánticos a esas palabras en el estudio (por ejemplo, Roediger &
McDermott, 1995; Schacter et al., 1996). En el presente experimento, escuchar listas
de palabras relacionadas semánticamente puede activar representaciones para señuelos críticos porque
son los asociados semánticos más altos de los elementos de la lista. En el reconocimiento posterior
prueba de ción, los sujetos pueden reconocer falsamente esas palabras sobre la base de un estímulo implícito
familiaridad o recuperación explícita del contexto de estudio. Si las representaciones para el criti
los señuelos de llamadas no se activan conscientemente en el estudio, los sujetos pueden reconocer falsamente esos
palabras en la prueba, pero pueden ser más aptos para decir que saben que esos elementos fueron
presentado que decir que recuerdan específi camente su presentación. si esos
representaciones se activaron conscientemente en el estudio, los sujetos pueden no solo reconocer falsamente
reconocer esos artículos, también pueden decir que recuerdan su presentación. En ambos
instancias, los sujetos estarían cometiendo un error de monitoreo de fuente sobre los señuelos críticos.
Los sujetos advertidos en el presente experimento pueden haber reducido tanto su falsa
tasa de alarma y su frecuencia de recordar juicios a señuelos críticos al rechazar
59533_06_ch05_p099-150.indd 137 9533_06_ch05_p099-150.indd 137 28/03/08 /28/08

cualquier señuelo en la prueba que se activó conscientemente en el estudio y se identificó como relacionado, pero
palabras no estudiadas. Sin embargo, estos sujetos seguirían siendo propensos a falsos reconocimientos,
aunque a una tasa más baja y con una menor frecuencia de juicios de recuerdo que el otro
condiciones, porque todavía podrían ser engañados por señuelos críticos que fueron inconscientemente
se activaron en el estudio o se activaron conscientemente, pero no se identificaron como palabras no estudiadas.
Finalmente, los psicólogos saben desde hace mucho tiempo que los errores de memoria ocurren en situaciones que no son de laboratorio.
(p. ej., Bartlett, 1932; Munsterberg, 1908) y actualmente existe un gran control
versy sobre la posibilidad de recuerdos recuperados/falsos de abuso infantil (Loftus,
1993). No pretendemos que el presente paradigma ofrezca un método general para estudiar
la memoria falsa o que los hallazgos actuales pueden generalizarse a los recuerdos del niño
abuso (ver Freyd & Gleaves, 1996, y Roediger & McDermott, 1996, para comentarios
sobre estos temas). Más bien, creemos que la presente investigación de reconocimiento falso tiene práctica.
valor tico en la comprensin del grado en que el conocimiento se puede utilizar para inocular
una persona contra un efecto de memoria falsa. ¿Son los errores de memoria siempre propensos a plagar
nosotros porque recordar es fundamentalmente de naturaleza constructiva, como Roediger y
McDermott (1995), o podríamos superar estos errores entendiendo la
condiciones bajo las cuales es probable que ocurran? Nuestros hallazgos sugieren que la inoculación
por el conocimiento puede lograr sólo un éxito limitado ya que las personas bien informadas sólo pueden
controlar parcialmente su susceptibilidad a recordar eventos que nunca ocurrieron.
Referencias
Bartlett, FC (1932). Recordando: un estudio en psicología experimental y social.
Cambridge: Prensa de la Universidad de Cambridge.
Craik, FIM y Watkins, MJ (1973). El papel del ensayo en la memoria a corto plazo.
Revista de aprendizaje verbal y comportamiento verbal, 12, 599–607.
Deese, J. (1959). Sobre la predicción de ocurrencia de intrusiones verbales particulares en im
recuerdo mediador. Revista de Psicología Experimental, 58, 17–22.
Freyd, JJ y Gleaves, DH (1996). “Recordando” palabras no presentadas en las listas:
Relevancia para la controversia actual sobre memoria recuperada/falsa. Diario de experiencia
Psicología mental: aprendizaje, memoria y cognición, 22, 811–813.
59533_06_ch05_p099-150.indd 138 9533_06_ch05_p099-150.indd 138 28/03/08 /28/08

Gregorio, RL (1987). Ilusiones. En RL Gregory (Ed.), El compañero de Oxford de la
mente. Nueva York: Oxford University Press.
Loftus, EF (1993). La realidad de los recuerdos reprimidos. Psicólogo estadounidense, 48,
518–537.
McDermott, KB (1996). La persistencia de falsos recuerdos en el recuerdo de listas. Diario de
Memoria y lenguaje, 35, 212–230.
Münsterberg, H. (1908). En el estrado de los testigos: Ensayos sobre psicología y crimen. Nuevo
York: Clark, Boardman, Doubleday.
Payne, DG, Elie, CJ, Blackwell, JM y Neuschatz, JS (1996). Ilusiones de la memoria:
Recordar, reconocer y recordar hechos que nunca ocurrieron. Diario de
Memoria y lenguaje, 35, 261–285.
Rajaram, S. (1993). Recordar y conocer: dos medios de acceso a lo personal
pasado. Memoria y cognición, 21, 89–102.
Leer, JD (1996). De un pensamiento pasajero a un falso recuerdo en 2 minutos: Confuso
eventos reales e ilusorios. Psychonomic Bulletin & Review, 3, 105–111.
Roediger, HL III (1996). Ilusiones de la memoria. Revista de Memoria y Lenguaje, 35,

76–100.
Roediger, HL III y McDermott, KB (1995). Creando falsos recuerdos: Recuerda
ing palabras que no se presentan en las listas. Revista de Psicología Experimental: Aprendizaje,
Memoria y cognición, 21, 803–814.
Roediger, HL III y McDermott, KB (1996). Falsas percepciones de falsos recuerdos.
Revista de psicología experimental: aprendizaje, memoria y cognición, 22,

814–816.
Schacter, DL, Verfaellie, M. y Pradere, D. (1996). La neuropsicología de la memoria.
ilusiones: falso recuerdo y reconocimiento en pacientes amnésicos. Diario de la Memoria y
Idioma, 35, 319–334.
Tulving, E. (1985). Memoria y conciencia. Psicólogo canadiense, 26, 1–12.
Underwood, BJ (1965). Falso reconocimiento producido por respuestas verbales implícitas.
Revista de Psicología Experimental, 70, 122–129.
59533_06_ch05_p099-150.indd 139 9533_06_ch05_p099-150.indd 139 28/03/08 /28/08

Nota del autor
Se expresa agradecimiento a Chun Luo por sus útiles comentarios sobre un borrador anterior de
este papel. Esta investigación fue apoyada por una Beca Wesleyana en Apoyo de Scholar
envío hecho a JGS Correspondencia debe ser dirigida a él en el Departamento
de Psicología, Wesleyan University, Middletown, CT 06459-0408 (correo electrónico: jseamon@
wesleyan.edu).
59533_06_ch05_p099-150.indd 140 9533_06_ch05_p099-150.indd 140 28/03/08 /28/08

tabla 1
Reconocimiento medio de palabras estudiadas y no estudiadas y señuelos críticos relacionados y no relacionados
Proporción de palabras reconocidas
Tipo de artículo General R k
Condición desinformada
Lista de palabras
Estudió .76 .52 .24
no estudiado .15 .03 .12
Señuelos críticos
Relacionado .81 .55 .27
No relacionado .15 .06 .10
Condición cautelosa
Lista de palabras
Estudió .sesenta y cinco .41 .24
Señuelos críticos
Grupo Prevenido
Lista de palabras
Estudió .63 .34 .28
Señuelos críticos
Nota: R = Juicio Recordar; K = Saber juzgar. Instancias donde recordar y saber
las proporciones no suman la proporción general y reflejan el redondeo a dos decimales.
59533_06_ch05_p099-150.indd 141 9533_06_ch05_p099-150.indd 141 28/03/08 /28/08

Tabla 2
Aciertos por palabras estudiadas y falsas alarmas por señuelos críticos según estrategias autoinformadas
Estrategia autoinformada
Ninguna Mantenimiento elaborativo Determinar
Grupo Indicado Ensayo Ensayo Señuelos críticos
No informado
norte 3 2 8 3
Golpes .71 .71 .81 .74
FA .83 .81 .89 .58
Precavido
norte 4 1 9 2
Golpes .56 .83 .66 .71
FA .59 .88 .82 .63
advertido
norte 4 2 3 7
Golpes .49 .sesenta y cinco .sesenta y cinco .68
FA .28 .69 .58 .45
Nota: N representa el número de sujetos; los aciertos y las falsas alarmas son proporciones.
59533_06_ch05_p099-150.indd 142 9533_06_ch05_p099-150.indd 142 28/03/08 /28/08

Estilo
Ahora que tiene una idea del formato, consideremos el estilo. Después de sufrir por algún artículo oscuro
escrito, sin duda reconocerá la ventaja de una escritura clara y sin ambigüedades. El formato APA ayuda a
estandarizar el orden y el contenido general. Sin embargo, asegurarse de que el lector entienda lo que está
diciendo depende de usted. Hemos leído muchos informes de investigación preparados para nuestras clases
y hemos encontrado que el mayor problema es la transición, o flujo, de una sección a la siguiente. Muchos
estudiantes escriben como si estuvieran componiendo una historia corta con un final sorprendente, aunque
su informe debe ser lo más sencillo posible. La información para cada sección descrita aquí se resume en la
Tabla 5.3.
Su título debe ser corto (10 a 12 palabras) y conciso. Por lo general, el título establece las variables
independientes y las variables dependientes.
Su resumen debe incluir sus variables (independientes, dependientes y variables de control
importantes), número y tipo de sujetos, resultados principales y conclusiones importantes. Debido a que el
resumen no debe exceder las 180 palabras, indique solo el aspecto más esencial del artículo. El cuerpo de
su informe debe ampliar el resumen.
(Esta es la razón por la que la mayoría de los resúmenes se escriben al final, aunque el informe podría ser
más claro si el resumen se escribiera primero, como un resumen de la parte principal del trabajo).
En la introducción, debe indicar por qué está interesado en un tema en particular, qué han encontrado
otros investigadores y qué variables examinará. Debe comenzar expresando una perspectiva amplia sobre el
tema, luego limitarse rápidamente a la pregunta específica que le interese. Debe guiar al lector a través de la
investigación relevante, siempre teniendo en cuenta que está configurando su propia pregunta de
investigación. Por lo tanto, evite la discusión de cuestiones tangenciales. Hacia el final de la introducción,
brinde al lector una descripción general de su experimento, especificando sus hipótesis explícitamente y
describiendo cualquier predicción derivada de las teorías que ha discutido. Al final de la introducción, el lector
debería ver que su experimento llena un vacío importante en nuestro conocimiento.
En la sección de método, indique cómo examinó las variables que describió al final de la introducción.
Aquí, es importante ser claro y completo. Por
ÿ TABLA 5.3
Un resumen de la información en cada sección de un informe de investigación
Sección Información
Título Experimentos: Estado de variables independientes y dependientes: “Los efectos de X sobre Y”.
Otros estudios: Indique las relaciones examinadas: “La relación entre X e Y”.
Resumen En 180 palabras o menos, indique qué se hizo a quién y resuma los resultados más importantes.
Introducción Indique lo que planea hacer y por qué (es posible que tenga que revisar los resultados de investigaciones relacionadas).
Los resultados previstos pueden ser apropiados.

Método Presente suficiente información para permitir que otra persona repita su estudio exactamente como lo hizo. Para
claridad use subtítulos (Participantes, Aparatos, etc.) y asegúrese de que dependiente, independiente,
Se especifican las variables sujeto y de control.

Resultados Resuma los resultados importantes en tablas o figuras. Dirija al lector a los datos que le parezcan más relevantes para
el propósito de la investigación.
Discusión Indique cómo se relacionan los resultados con las hipótesis o predicciones establecidas en la introducción. Inferencias y
las declaraciones teóricas son apropiadas.

Referencias En formato APA, enumere solo las referencias que se citaron en su informe.
59533_06_ch05_p099-150.indd 143 9533_06_ch05_p099-150.indd 143 28/03/08 /28/08

En el momento en que escribe la sección del método, está bastante familiarizado con los detalles y las
complejidades de su experimento. Esta familiaridad hace que sea difícil darse cuenta de que el lector de su
informe está conociendo estos detalles por primera vez. Mientras escribe, intente decirle al lector todo lo que
necesitaría saber para poder repetir su experimento, pero no incluya ninguna variable extraña. A menudo, las
personas dividen su sección de métodos en tres subsecciones: sujetos (o participantes), materiales (o aparatos)
y procedimiento. La sección de materias especifica el número de sujetos que participan en el estudio, la
población de la que fueron extraídos (p. ej., la clase de introducción a la psicología en su universidad) y su
incentivo para participar (p. ej., crédito del curso). Si algún sujeto fue descartado por algún motivo, debe
mencionarse en esta sección. La sección de materiales (o aparatos) debe describir todos los aspectos
relevantes de los materiales utilizados en el experimento. La siguiente sección, la sección de procedimiento, a
menudo comienza con una descripción del diseño experimental, establece las instrucciones dadas a los sujetos
(si son humanos) y, en general, guía al lector a través de las diversas fases del experimento.
En la sección de resultados, indica qué sucedió cuando examinaste las variables.

La claridad es importante aquí. Evite simplemente enumerar sus análisis estadísticos con un mínimo de
comentarios. En su lugar, establezca primero cada hallazgo en un lenguaje sencillo y luego apóyelo con estadística
Su sección de resultados debe terminar con un resumen del propósito y los resultados de su experimento. En
su discusión, indique qué significan los efectos de las variables para el tema en cuestión. El mayor peligro en
esta sección del documento es la falta de organización.
Antes de comenzar a escribir, debe conocer los puntos que desea presentar. Hágalos concisos y fáciles de
entender. La discusión debe dar seguimiento a los temas señalados en la introducción. Además, como en la
introducción, evite desviarse por la tangente. Cuando el lector haya completado su informe, debe ser capaz de
exponer las principales conclusiones en una oración o dos. Tenga cuidado, sin embargo, en las conclusiones
que saque; evitar declaraciones grandilocuentes. La ciencia avanza a pequeños pasos; su experimento no
necesita ser trascendental para ser científicamente importante.
A menudo, un trabajo de investigación no se escribe en el orden en que aparece en la revista.

Puede considerar escribir las secciones de método y resultados primero y las secciones de introducción y
discusión después (el resumen al final). Aunque inicialmente no lo parezca, las secciones de método y
resultados son menos difíciles de generar porque están escritas de manera convencional. En otras palabras,
hay tantas formas de describir el número de participantes en un estudio o los resultados de un análisis
estadístico particular. Por otro lado, las secciones de introducción y discusión suelen ser las más difíciles de
escribir y, por lo tanto, se guardan para el final. Por lo general, estas secciones son más largas y requieren
habilidades de escritura, organización y perspicacia. Por ejemplo, la sección de discusión puede ser difícil
porque se requiere una explicación de los datos y, a menudo, los datos se pueden interpretar de más de una
manera. Tenga en cuenta que no todos los escritores usan esta estrategia, y debe elegir el enfoque que más
le convenga.
El Manual de publicación de APA describe las consideraciones de estilo de escritura de la siguiente

manera: Expresión ordenada de ideas, fluidez de expresión, economía de expresión, precisión y claridad.
También ofrece estrategias para mejorar el estilo de escritura. Estas pautas justifican un poco de discusión,
por lo que ahora consideraremos aspectos del estilo de escritura.
La escritura científi ca exige claridad, por lo que cada palabra debe elegirse con cuidado. Considere
estas oraciones que aparecen regularmente en los informes de investigación de pregrado: "Examiné los temas
individualmente". “La rata albina blanca fue introducida en la caja de Skinner”. En realidad, ninguno de los
sujetos del estudio del que se extrajo la primera oración hizo nada.
59533_06_ch05_p099-150.indd 144 9533_06_ch05_p099-150.indd 144 28/03/08 /28/08

funcionando durante el transcurso del proyecto. Lo que el autor quiso decir fue: "Probé a los sujetos
individualmente". Al leer acerca de las ratas introducidas en las cajas de Skinner, podría concluir que
el investigador tenía ratas muy inteligentes. La rata no le dio la mano a una caja; todo lo que sucedió
fue que la rata fue puesta en las cámaras de condicionamiento operante. Además, "albino blanco" es
redundante. Todas las ratas albinas son blancas. La lección aquí es que en la escritura científi ca,
debe tener cuidado de elegir la palabra o frase correcta y evitar la ambigüedad. Además, tenga cuidado
al usar pronombres como cuál, este, ese, estos y aquellos. Muchos estudiantes encuentran irresistible
comenzar un párrafo con uno de estos pronombres, y la mayoría de las veces el referente del
pronombre no es fácil de determinar. Por lo general, puede evitar cualquier ambigüedad al incluir el
referente del pronombre cada vez que se usa.
Una vez que haya decidido sus palabras y frases, júntelas con cuidado. Un problema común entre
algunos escritores es cambiar abruptamente los tiempos verbales. En general, use el tiempo pasado
en la revisión de otros estudios en su introducción (Smith encontró) y en su método (los sujetos fueron).
Cuando está describiendo y discutiendo sus datos, el tiempo presente suele ser apropiado (Los datos
muestran que . . . , lo que significa eso).
Asegúrese de que los sustantivos colectivos y plurales concuerden con sus verbos y pronombres.
Las palabras en plural que terminan en a son problemáticas, como datos, criterios y fenómenos.
Cada uno de estos sustantivos es plural, por lo que requieren verbos y pronombres en plural. “Estos
datos son” es correcto, pero “este fenómeno es” es incorrecto. Las formas singulares de estos
sustantivos son: dato, criterio y fenómeno (este fenómeno es).
Muchos escritores científi cos abusan de la voz pasiva en sus informes. Considere esta
declaración: “Se piensa que el olvido es causado por la interferencia”. Aunque esta oración es bastante
concisa (y es precisa), también es sofocante y menos directa que "Creemos que la interferencia causa
el olvido", que es realmente lo que quiso decir el escritor. Tenga cuidado con el uso excesivo de la voz
activa o pasiva. Si abusa de la voz pasiva, su informe suena sofocante. Si abusa de la voz activa,
puede desviar el interés de lo que hizo y poner demasiado énfasis en sí mismo (creo, lo hice, etc.). Si
desea enfatizar qué se hizo y no quién lo hizo y por qué, use la construcción pasiva. Por otro lado, si
crees que el agente de la actividad también es importante, o si el motivo de la acción es importante,
usa la voz activa.
El escritor cuidadoso evita el lenguaje sexista. La APA recomienda que se evite el uso de él (y su
y él) como pronombre genérico cambiando a una construcción plural o usando él y ella. En general, el
escritor debe esforzarse por lograr una comunicación precisa e imparcial. El Manual de publicaciones
de la APA contiene una sección dedicada a la reducción del sesgo lingüístico.
La escritura científi ca requiere el uso de terminología consistente; si asigna etiquetas a las cosas
(p. ej., etiquetando grupos de sujetos: informados y no informados), use estas etiquetas en todo el
documento. Es posible que en las clases de inglés te hayan enseñado a tratar de variar las
descripciones de cosas repetitivas para evitar aburrir al lector. Sin embargo, en la escritura científi ca,
cambiar la terminología solo agrega confusión. Es importante que el lector sepa que cuando introduce
un nuevo término, se refiere a un concepto diferente a los discutidos anteriormente.
Escribir un artículo de investigación convincente y bien organizado es una habilidad que requiere
un esfuerzo y una práctica considerables. Se trata de algo más que simplemente asignar información
a las secciones correctas. Hay muchos puntos finos de estilo, uso y exposición que distinguen los
artículos lúcidos y bien escritos de los oscuros y tortuosos. Mientras escribe su informe, debe hacer
uso frecuente de referencias estándar para puntos de estilo y gramática.
59533_06_ch05_p099-150.indd 145 9533_06_ch05_p099-150.indd 145 28/03/08 /28/08

Además, consulte el Manual de publicaciones de la APA sobre aspectos de la redacción
técnica que son particularmente relevantes para los artículos de revistas de psicología, incluida
la organización y contenido de cada sección, la economía y precisión en la expresión de ideas,
la presentación de datos y estadísticas, etc. adelante. Recomendamos enfáticamente el libro
mencionado anteriormente de Sternberg (1993), los artículos de Sternberg (1992) y Roediger
(2007) y el capítulo de Bem (2004) por sus excelentes consejos y ejemplos específicos de
estilo, fraseo y estilo buenos y malos. Organización en artículos de psicología. Finalmente, y
quizás lo más importante, debe asignar tiempo para revisar y reescribir su manuscrito, teniendo
en cuenta los comentarios de estilo antes mencionados. Nadie puede escribir un manuscrito
publicable en el primer intento; La revisión es una parte crucial del proceso de escritura.
Publicar un artículo
Suponga que su artículo ha sido escrito, revisado y corregido, y que la última página acaba de
salir de su impresora. ¿Ahora que? Aunque es poco probable que el primer esfuerzo de su
estudiante produzca un artículo de calidad profesional, puede encontrar interesante descubrir
qué sucede cuando un psicólogo profesional envía un artículo a una revista.
El primer paso es enviar copias del manuscrito (el término técnico para un trabajo inédito)
a un pequeño número de asociados de confianza que pueden revisarlo para asegurarse de
que no tenga fallas obvias o elementales y que esté escrito. claramente. Una vez que regresan
los comentarios, se hacen las correcciones indicadas y, con cierta inquietud, el autor envía el
manuscrito al correo, dirigido al editor de la revista más apropiada. Después de este paso, es
necesario tener mucha paciencia durante los próximos meses. El proceso de revisión es lento.
(El editor que recibe el manuscrito generalmente está extremadamente ocupado haciendo
malabarismos con muchas responsabilidades: enseñar, realizar su propia investigación,
supervisar a estudiantes de pregrado y posgrado, etc.). Dos o tres semanas después de enviar
el artículo, el autor recibe una carta modelo agradeciéndole su interés en la revista y acusando
recibo del manuscrito. El manuscrito recibe un número (como 04-145), y si se ha asignado un
editor asociado para que lo maneje, se le indica al autor que dirija toda la correspondencia
futura a ese editor.
El editor envía copias del manuscrito a dos o tres revisores. Algunas revistas permiten
que el autor tenga una revisión anónima (o ciega), donde se oculta la identidad del autor. Esto
es para aquellos que no creen en la imparcialidad de los revisores. El revisor, que también
puede revisar para varias otras revistas, coloca el manuscrito en la pila sobre su escritorio. Un
revisor concienzudo puede tardar uno o dos días en leer y evaluar cuidadosamente un
manuscrito. Luego, el revisor envía una declaración resumida al editor. Cuando los revisores
están de acuerdo, la decisión del editor es fácil. Si los revisores no están de acuerdo, el editor
debe leer detenidamente el manuscrito y, en ocasiones, puede solicitar otra opinión. Finalmente,
se llega a una decisión editorial y el autor recibe una carta que indica (1) por qué no se puede
publicar el manuscrito, (2) qué tipo de revisiones se necesitan para que el manuscrito sea
aceptable o (3) que la revista publicará el artículo. . Debido a que las tasas de rechazo de
manuscritos son bastante altas en la mayoría de las revistas (más del 70 por ciento), los
editores dedican mucho tiempo a diseñar cartas de rechazo con tacto.
Ya sea que el artículo haya sido aceptado o no, los comentarios de los revisores son muy
valiosos. Los mejores psicólogos del área han brindado, de manera gratuita, su esmerada
59533_06_ch05_p099-150.indd 146 9533_06_ch05_p099-150.indd 146 28/03/08 /28/08

opiniones sobre la investigación. Por supuesto, los revisores también pueden cometer errores. Cualquier autor
que no esté de acuerdo con una reseña tiene el privilegio de escribir al editor. Aunque esta acción generalmente
no resultará en la aceptación del artículo, es importante que los autores rechazados tengan derecho a apelar
o protestar. De todos modos, siempre hay otras revistas.
Si el artículo fue aceptado para su publicación, el autor aún no está terminado. Es posible que se
requiera alguna revisión del manuscrito. Los derechos de autor del artículo se ceden al editor. Algunos meses
más tarde, el autor recibe galeradas o pruebas de página del editor. Estos deben revisarse cuidadosamente
para asegurarse de que las palabras y las tablas escritas por el impresor coincidan con las del manuscrito
original. Después de hacer las correcciones, el autor devuelve el artículo al editor. Varios meses después, el
artículo finalmente aparece en la revista. Todo el proceso, desde la presentación del manuscrito hasta la
publicación final, lleva un año o más. A los autores no se les paga por los artículos de las revistas, pero
tampoco se les cobra por el privilegio de aparecer impresos.
Como es de esperar, es muy emocionante ver su nombre impreso, especialmente la primera vez. Sin
embargo, una emoción aún mayor es el conocimiento de que puede haber agregado una pequeña cantidad a
nuestra comprensión de por qué las personas y los animales piensan y actúan como lo hacen.
ÿ RESUMEN
1. Cuando lea un informe de investigación, debe hacerlo de 3. También debe considerar estas preguntas cuando escriba
manera activa y crítica, para que pueda obtener el máximo su propio informe. El formato APA proporciona un marco
beneficio de la investigación de otras personas. para su informe, pero depende de usted escribir con
2. La lista de verificación para lectores críticos está diseñada claridad. Se proporcionan varias sugerencias que ayudan
para que adquiera el hábito de hacer preguntas a producir un estilo claro e inequívoco de redacción de
activamente sobre los informes que lee: ¿Qué hipótesis informes.
se están probando? ¿Cómo se están probando? ¿El 4. El capítulo concluye con una breve descripción del proceso
método prueba las hipótesis? ¿Los resultados se aplican de publicación. Para que la ciencia psicológica progrese,
a las hipótesis? ¿Cómo relaciona el autor los resultados los informes deben publicarse y los consumidores
con los propósitos de la investigación? ¿Qué informados deben leerlos críticamente.
interpretaciones e inferencias hace el autor?
ÿ TÉRMINOS CLAVE
resumen método
QUE formato Participantes
aparato procedimiento
autor referencias
diseño resultados
discusión Cabeza corriente

cifras sujeto (participante)
Introducción mesas
busqueda de literatura título
materiales
59533_06_ch05_p099-150.indd 147 9533_06_ch05_p099-150.indd 147 28/03/08 /28/08

CONEXIONES WEB
El siguiente sitio tiene enlaces a presentaciones paso a paso sobre “Estilo APA” y “Obtención de
ideas para un estudio”:
http://academic.cengage.com/psychology/workshops.html
Para obtener una excelente guía sobre el estilo APA, consulte esta página recientemente actualizada:
http://www.docstyles.com/apacrib.htm
Cómo hacer una búsqueda bibliográfica se puede encontrar en:
http://apa.org/science/lib.html
Puede encontrar una interesante revista en línea, Psycoloquy, patrocinada por la Asociación
Estadounidense de Psicología, en:
http://www.cogsci.ecs.soton.ac.uk/psycoloquy/
Mientras que el Capítulo 10 del Manual de Laboratorio de Métodos de Investigación para Psicología
de Langston (2002) trata un tema diferente (detección de obstáculos por parte de los ciegos) que los
tratados en profundidad en este capítulo (factores que infl uyen en la votación y la memoria falsa de
palabras), el Los objetivos son los mismos: (a) desarrollar hipótesis, (b) probar entre hipótesis, (c) y
repetir el proceso hasta que haya precisado la respuesta.
Una búsqueda de literatura
Suponga que se interesa por los efectos de la hipnosis en la memoria. Muchas personas creen que
la hipnosis es una forma viable de recordar eventos que de otro modo no se recuperarían, pero
muchos tribunales no permiten que las personas que han sido hipnotizadas testifiquen como testigos.
¿Por qué es esto? ¿Nuestros recuerdos son susceptibles de cambiar cuando estamos bajo hipnosis?
¿O la hipnosis ayuda a la memoria? Estos son los tipos de preguntas que le interesan.
Para obtener respuestas a estas preguntas, realizará una búsqueda bibliográfica. Debido a que
usted no es un experto en esta área, no conoce los nombres de ningún investigador que haya
realizado trabajos sobre los efectos de la hipnosis en la memoria. Por lo tanto, el mejor lugar para
comenzar es probablemente PsycINFO. No es necesario ser bibliotecario o experto en informática
para utilizar bases de datos electrónicas como PsycINFO. Las pantallas de ayuda están disponibles,
así como las instrucciones impresas; además, el personal de referencia de su biblioteca puede
responder preguntas y ayudarlo a planificar su estrategia de búsqueda.
Para conocer los efectos de la hipnosis en la memoria, puede comenzar buscando una "palabra
clave"; para hacer esto, simplemente escriba una palabra que capte el tema que le interesa (por
ejemplo, hipnosis). Sin embargo, una búsqueda reciente arrojó 10.261 artículos de revistas escritos
sobre el tema de la hipnosis; Claramente, esto es demasiado para trabajar. Una búsqueda en la
memoria arroja aún más artículos: ¡84.630! En esta situación, querrá combinar palabras clave para
reducir los números. porque te interesa
59533_06_ch05_p099-150.indd 148 9533_06_ch05_p099-150.indd 148 28/03/08 /28/08

en la susceptibilidad de la memoria a la hipnosis, puede combinar búsquedas separadas de
susceptibilidad, memoria e hipnosis; el resultado es una lista de todos los artículos que contienen
información sobre los tres conceptos. Ahora ha reducido el campo a una lista más manejable de 113
referencias, cada una acompañada de un breve resumen. Le echas un vistazo a los títulos y resúmenes
y determinas qué artículos parecen especialmente interesantes; probablemente querrá ir a las revistas
después de este paso y leer los artículos que le parezcan más relevantes para sus intereses. Los
artículos de revisión son especialmente útiles en esta etapa porque resumen y evalúan muchos artículos
empíricos.
Ahora suponga que ha encontrado un artículo que contiene una teoría sobre la hipnosis y la
memoria que es particularmente interesante para usted; le gustaría saber acerca de las implicaciones
de esta teoría y si generalmente se ha mantenido bajo el escrutinio experimental. Una forma de hacerlo
sería averiguar qué artículos más recientes han citado este artículo. Para hacer esto, usaría el Índice
de Citas de Ciencias Sociales (SSCI). SSCI
le permite ingresar la referencia de un artículo y averiguar quién ha citado el artículo. De esa manera,
puede averiguar los desarrollos recientes en esa área.
La mayoría de las bibliotecas tienen impresoras que le permiten imprimir cualquier referencia
interesante que pueda descubrir al utilizar búsquedas electrónicas. Además, a veces puede descargar
las referencias en su propio dispositivo de almacenamiento. Pregúntele a su bibliotecario de referencia
qué tipos de opciones tiene en su biblioteca. ÿ
59533_06_ch05_p099-150.indd 149 9533_06_ch05_p099-150.indd 149 28/03/08 /28/08


PARTE 2
PRINCIPIOS Y
PRÁCTICAS DE
EXPERIMENTAL
PSICOLOGÍA
SEIS
Psicofísica
SIETE
Percepción
OCHO
Atención y tiempo de reacción
NUEVE
Condicionamiento y aprendizaje
DIEZ
Recordando y Olvidando
ONCE
Pensamiento y resolución de problemas
DOCE
Diferencias individuales y desarrollo
TRECE
Psicología Social
CATORCE
Psicología Ambiental
QUINCE
Factores humanos 151
59533_07_ch06_p151-179.indd 151 9533_07_ch06_p151-179.indd 151 3/5/08 /5/08


CAPÍTULO 6
PSICOFÍSICA
MEDICIÓN DE SENSACIONES 6.1

TEMAS EXPERIMENTALES E INVESTIGACIÓN
ILUSTRACIONES
Definición Operacional: Umbrales
PRESENTACIÓN DE LAS VARIABLES 6.2
TEMAS EXPERIMENTALES E INVESTIGACIÓN
ILUSTRACIONES
Escalas de Medida: Ley
de Fechner y Ley de
Stevens 6.3 TEMAS
EXPERIMENTALES E INVESTIGACIÓN
ILUSTRACIONES
Diseño de n pequeña : métodos psicofísicos
¿Las palomas tienen umbrales de visión?
¿Cómo podemos medir el umbral visual de una paloma?
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: LEY DE WEBER
153
59533_07_ch06_p151-179.indd 153 9533_07_ch06_p151-179.indd 153 3/5/08 /5/08

La observación es una ciencia pasiva, la experimentación una ciencia activa.
(CLAUDE BERNARD)
Suponga que usted es dentista (o paciente de un dentista) y desea encontrar una manera de
hacer que el dolor sea más tolerable sin administrar medicamentos. La medición del dolor es un
problema psicofísico, ya que el grado de dolor debe inferirse del comportamiento del paciente en
el sillón del dentista. Este capítulo analiza varias técnicas psicofísicas sofisticadas para medir
sensaciones como el dolor.
Probablemente no se le ocurriría a usted, ni como dentista ni como paciente, que el olor
podría aumentar la tolerancia al dolor de una persona. Pero un estudio psicofísico reciente
(Prescott y Wilkie, 2007) demostró que un olor dulce puede hacer que el dolor sea más tolerable.
El dolor se estudió mediante la infame prueba del frío, que requiere que los sujetos sumerjan la
mano dominante y el antebrazo en agua fría (5 °C) durante un máximo de 4 minutos. Se les dijo
a los sujetos que dejaran la mano en el agua todo el tiempo que pudieran tolerar el dolor.
Los sujetos que respiraron un olor dulce mantuvieron su mano en el agua fría casi tres veces
más que los sujetos en una condición de control donde no había olor presente.
Por lo tanto, uno de los autores de este texto que debe someterse a un procedimiento dental de
endodoncia le lleva una copia del artículo de investigación a su dentista: otro ejemplo más de los
beneficios prácticos de la investigación psicofísica.
ÿ MEDICIÓN DE SENSACIONES
Este resultado inesperado se debe a varios factores, algunos de los cuales se abordan en este
capítulo. Examinaremos estos temas en el contexto de un área venerable de investigación en
psicología científica llamada psicofísica. La psicofísica involucra la determinación de la reacción
psicológica a los eventos que se encuentran a lo largo de una dimensión física. Edwin G. Boring
(1950), el eminente historiador de la psicología experimental, afirma que la introducción de
técnicas para medir la relación entre las impresiones internas (el psico de la psicofísica) y el
mundo externo (la física) marcó el inicio de la psicología científica.
Boring marcó a la psicofísica como el comienzo de la psicología científica principalmente

porque los científicos que utilizaron técnicas psicofísicas fueron capaces de formular las primeras
leyes matemáticas de los fenómenos psicológicos. Aunque las características de estas leyes son
de interés en sí mismas, su desarrollo tiene otras implicaciones importantes. Primero, medir las
sensaciones es muy difícil, porque no están abiertas a la medición pública como lo está la
intensidad de la luz o el peso de una piedra. En segundo lugar, los juicios internos no son
idénticos a la cantidad de energía física que influye en el aparato sensorial. Examinamos ahora
cada uno de estos legados de la psicofísica y los ampliamos a lo largo de este capítulo.
Gustav Fechner formalizó los métodos psicofísicos, que miden los atributos del mundo en
términos de sus valores psicológicos (1860/1966). Sus métodos, que se detallan más adelante
en el capítulo, mostraron que los juicios psicológicos variaban de formas particulares según la
intensidad del estímulo y la modalidad sensorial particular de
59533_07_ch06_p151-179.indd 154 9533_07_ch06_p151-179.indd 154 3/5/08 /5/08

Intensidad visual física Brillo psicológico
Intensidad auditiva física Sonoridad psicológica
Medida Física de Peso Pesadez psicológica
Intensidad eléctrica física Dolor psicológico
ÿ FIGURA 6.1
Algunas relaciones entre estímulos físicos y juicios psicológicos.
el estímulo (es decir, los juicios de estímulos visuales diferían de los juicios de estímulos auditivos,
que diferían de los juicios de estímulos gustativos, y así sucesivamente). Dado que estas relaciones
se mantuvieron, al menos aproximadamente, para muchas personas diferentes, Fechner y otros
investigadores concluyeron que los juicios internos privados se habían medido con precisión. Como
se muestra en la figura 6.1, los psicofísicos podían medir los atributos psicológicos de brillo,
volumen, pesadez y dolor del mismo modo que los físicos midieron los atributos físicos
correspondientes de intensidad luminosa, intensidad auditiva, etc.
Tanto en la década de 1800 como en la actualidad, un uso destacado de la psicofísica es
medir sensaciones aparentemente simples como el brillo, lo que probablemente parezca innecesario.
Puede pensar que es sencillo decidir el volumen o el dolor de los estímulos. Sin embargo, resulta
que rara vez existe una relación directa de uno a uno entre los valores físicos y los valores
psicológicos. Si una banda de rock encendiera sus amplificadores para producir el doble de energía
de la que había producido antes (una duplicación de las unidades físicas), este doble aumento de
energía no daría como resultado que los oyentes experimentaran un sonido dos veces más fuerte
que antes. Para que un oyente juzgue que el sonido es el doble de fuerte, el nivel de energía tendría
que aumentar aproximadamente 10 veces. Tales descubrimientos derivados de los métodos
psicofísicos tienen importantes aplicaciones prácticas. Por ejemplo, el amplificador o el dial de la
radio que gira para aumentar el volumen (es decir, el volumen percibido) no puede soportar una
relación uno a uno entre los movimientos del dial y los aumentos de energía. Más bien, el dial debe
calibrarse para que sus movimientos aumenten la intensidad proporcionalmente a los incrementos
en el volumen. Por lo tanto, duplicar el nivel de volumen en el dial tiene que aumentar la energía
física unas 10 veces para producir un aumento del doble en el volumen. Los teléfonos también
están diseñados para que sus micrófonos y amplificadores funcionen de acuerdo con esta relación
psicofísica entre la intensidad auditiva y el volumen percibido.
La relación psicofísica entre estímulo y juicio depende de la modalidad sensorial particular que
se estimula. Los juicios de dolor en respuesta a los aumentos en la intensidad eléctrica de las
descargas aplicadas a la piel crecen mucho más rápidamente que los juicios de volumen en
respuesta a los aumentos en la energía del sonido. Para que una descarga se considere el doble
de dolorosa que otra, la intensidad de la descarga debe haber aumentado en aproximadamente un
tercio. Podemos ver, entonces, que la mera medición de cambios en unidades físicas no siempre
nos ayuda a determinar con precisión los cambios en unidades psicológicas.
En este capítulo, se utilizan métodos psicofísicos para ilustrar tres temas científicos.
Las defi niciones operativas describen los procedimientos utilizados para producir un concepto y
nos permiten comunicar con éxito los conceptos que estamos estudiando. ¿Qué significa cuando un
sujeto informa que detecta un estímulo doloroso? Una definición operativa de detección y otra de
dolor ayudarán a garantizar que los científicos utilicen términos técnicos de manera similar.
Un tema relacionado tiene que ver con las escalas de medida, la asignación de números o
nombres a los objetos y sus atributos. ¿Cómo determinamos si una intensidad de luz
59533_07_ch06_p151-179.indd 155 9533_07_ch06_p151-179.indd 155 3/5/08 /5/08

aparece el doble de brillante que otro? No todas las técnicas psicofísicas permiten afirmaciones
precisas sobre la proporción de una sensación a otra.
Finalmente, discutiremos los diseños de n pequeños , o aquellos basados en un pequeño
número de sujetos. En este contexto, explicamos por qué a menudo es apropiado formular leyes
psicofísicas que se basan en un gran número de observaciones pero que se toman de un pequeño
número de observadores (la n pequeña). Esta técnica difiere de la que se utiliza a menudo en los
experimentos de psicología en los que se utiliza un gran número de sujetos, pero se toman pocas
observaciones de cada persona.
6.1 TEMAS EXPERIMENTALES E ILUSTRACIONES DE INVESTIGACIÓN
Tema Definición operativa

Ilustración Umbrales
Ninguna discusión seria, científica o de otro tipo, puede progresar mucho a menos que los
participantes acuerden definir los términos que están usando. Imagina que tú y tu cita están
discutiendo amistosamente sobre quién es el mejor atleta del año. ¿Cómo defi ne atleta? Ambos
pueden estar de acuerdo en deportes tan comunes como el tenis, la natación y la gimnasia, pero ¿qué
pasa con los deportes más esotéricos, como el lanzamiento de Frisbee, el ala delta y los saltos a
campo traviesa en un saltador? ¿Deberían los practicantes de estas actividades ser considerados
para su premio al atleta del año? Hasta que se responda esta pregunta de definición, su discusión
puede dar vueltas en círculos.
Problemas similares pueden surgir en discusiones científicas. Una forma de describir los
resultados analgésicos inusuales informados por Prescott & Wilkie es que los observadores no
entrenados se vuelven menos sensibles al dolor después de inhalar un olor dulce. Para una
conversación ordinaria, esta podría ser una forma perfectamente adecuada de dar sentido a la situación.
Sin embargo, el uso común y el uso técnico tienen requisitos diferentes: en el discurso técnico, la
precisión es necesaria para que no se produzcan argumentos innecesarios sobre el significado de los
resultados científi cos. Técnicamente, una disminución de la sensibilidad implicaría que los receptores
del dolor del cuerpo se vuelven menos agudos después de oler olores dulces. Esta posibilidad
improbable tendría implicaciones importantes para las compañías farmacéuticas, los médicos y las
personas que sufren de dolor de cabeza.
Lo que el científico necesita saber son las operaciones utilizadas para producir el resultado.
El científico entonces puede decidir si el concepto así definido es una forma sensata de pensar sobre
el resultado. En este caso, se suponía que el procedimiento utilizado por Hardy (descrito en detalle en
la siguiente sección) mediría la sensibilidad; sin embargo, su técnica no permitió evaluar una
interpretación alternativa, a saber, que la aspirina alteraba la disposición de los observadores a decir
que un estímulo era doloroso. Podemos ver que es crucial conocer los procedimientos y las
operaciones que usan los científicos para estudiar los procesos que dicen que están estudiando.
Palabras y frases como dolor, sensibilidad y disposición a responder tienen significados amplios y
cotidianos que deben limitarse con precisión cuando se usan en un contexto técnico y científi co.
La forma más común de proporcionar un significado técnico es mediante una definición operativa.
Una definición operativa es una fórmula para construir una construcción de tal manera que otros
científicos puedan duplicarla, especificando las operaciones utilizadas para producirla y medirla.
“Tomar el ojo de un tritón, la pata de una rana, tres conchas de ostra y agitar dos veces” es una defi
nición operativa, aunque no está del todo claro qué se está defi nindo. Sin embargo,
59533_07_ch06_p151-179.indd 156 9533_07_ch06_p151-179.indd 156 3/5/08 /5/08

PRESENTACIÓN DE LAS VARIABLES
requieren que los observadores comparen varios

alimentos (espinacas versus nabos) o los estilos de
A los observadores de los estudios psicofísicos se les diferentes cantantes (Madonna versus Tammy Wynette).
pide que emitan uno de dos tipos de juicios sobre los
estímulos que se les han presentado. Si solo se ha Variables de control
presentado un estímulo en un ensayo particular, se
requiere un juicio absoluto. Los juicios absolutos Lo principal a controlar en un experimento psicofísico
pueden ser simples afirmaciones sobre la presencia o es la voluntad del observador para dar una respuesta
ausencia de una señal (“Sí, lo vi” o “No, no lo vi”) o particular. Esta actitud debe permanecer constante de
estimaciones directas sobre alguna propiedad del prueba en prueba. Un observador que esté muy
estímulo (responder) (“Cuántos gramos ¿Esto pesa?).” dispuesto a emitir un juicio positivo ("Sí, lo vi") debería
Si se deben comparar dos estímulos en un ensayo mantener esta misma disposición durante el transcurso
particular, se requiere un juicio relativo. Nuevamente, del experimento. Si los criterios para dar una respuesta
se pueden hacer afirmaciones simples, como “El varían, se obtiene una imagen inexacta de las
estímulo A es mayor que (o menor que) el estímulo B”; sensibilidades. La psicofísica clásica o tradicional
o se pueden dar estimaciones directas, como "El asumía que los observadores podían lograr esta
estímulo A es dos veces más grande que el estímulo constancia sin demasiada dificultad. Una vez que se
B". entrenaba a un observador, se suponía que se
controlaba la actitud. Las teorías psicofísicas modernas,
como la teoría de la detección de señales (que se
discutirá más adelante), no aceptan esta suposición.
Las principales variables independientes manipuladas Suponen que el observador da una respuesta basada
en los estudios psicofísicos son la magnitud y la calidad en una decisión que depende tanto del estímulo como
de los estímulos. Cambiar la intensidad (el correlato de los factores psicológicos involucrados, como los
físico del volumen) de un tono sería una manipulación costos y beneficios relativos de la decisión. Entonces,
de la magnitud del estímulo, como lo sería cambiar el como se detallará más adelante, los métodos
peso de un objeto o la concentración de un olor. La psicofísicos modernos incorporan técnicas especiales
frecuencia, el correlato físico del tono, de un tono se para garantizar (o al menos probar) la suposición de
manipularía para producir un cambio cualitativo en el que el observador mantiene una estrategia constante.
estímulo. Otros juicios cualitativos podrían
esta receta se puede duplicar, por lo que cumple con el criterio principal para una definición operativa.
Puede deducir de este ejemplo que una definición operativa no tiene que ser del todo sensata, siempre
que sea clara y se pueda copiar. Por ejemplo, podríamos definir operativamente una construcción
llamada centigramos como el producto de su altura en centímetros y su peso en gramos. Dado que
cualquier científico puede determinar fácilmente la puntuación en centigramos, esta es una definición
operativa válida. Por supuesto, probablemente no podría usarse para ningún propósito científico
importante, pero la utilidad potencial de una definición operativa es un tema aparte de su validez. Por
lo general, sin embargo, los constructos definidos operativamente están vinculados a una teoría o un
cuerpo de literatura de investigación, por lo que tienen sentido y cierta validez.
En las siguientes secciones, discutimos la definición operativa de una construcción teórica
llamada umbral. Primero, damos el significado del lenguaje común de este término; vemos entonces
cómo los intentos de aumentar la precisión de la definición han conducido a técnicas metodológicas
bastante sofisticadas para mejorar las definiciones operativas de un umbral.
59533_07_ch06_p151-179.indd 157 9533_07_ch06_p151-179.indd 157 3/5/08 /5/08

Umbrales: Psicofísica Clásica
En lenguaje común, un umbral es la parte de una puerta por la que se pasa para entrar a una
habitación. Los psicofísicos clásicos creían que los estímulos tenían que cruzar esa barrera
(hipotética) para entrar en el cerebro o la mente. Si un estímulo fuera fuerte, fácilmente podría
saltar el umbral. Una analogía cruda que puede ser útil es pensar en el estímulo como un saltador
de pértiga. La barra corresponde al umbral. Un buen salto lo colocará sobre la barra (cruzando
el umbral), mientras que un salto débil no lo hará. La pregunta, entonces, es qué tan fuerte debe
ser un estímulo para que una señal cruce el umbral.
Responder a esta pregunta fue de gran preocupación para los psicofísicos clásicos.
Al principio, la respuesta puede parecer obvia. Todo lo que tenemos que hacer es aumentar
lentamente la intensidad de un estímulo, como un tono o una luz tenue, hasta que el observador
responda: "Sí, ahí está". Desafortunadamente, cuando tratamos de repetir este proceso, el punto
en el que un observador detecta repentinamente el estímulo cambia de un ensayo a otro. Para
lidiar con esta variabilidad, los psicofísicos clásicos desarrollaron métodos estadísticos para
estimar el mejor valor para el umbral. Discutiremos solo uno de los métodos, desarrollado por
Fechner y conocido como el método de los límites.
Si realizáramos un experimento utilizando el método de los límites para determinar el umbral
de un tono, los resultados se verían como los que se muestran en la Tabla 6.1. Cada columna
representa datos de un bloque de ensayos. El primer bloque comienza con un tono claramente
audible, al que el observador responde “sí”. La intensidad del tono se reduce en pasos sucesivos
hasta que el observador informa "no", finalizando así ese bloque de prueba. El siguiente bloque
de pruebas comienza con una intensidad tan baja que el observador no puede escuchar el tono
y responde "no". En intentos sucesivos, la intensidad se va aumentando gradualmente, hasta que el
ÿ TABLA 6.1
Uso del método de los límites para

determinar un umbral absoluto.
Intensidad del estímulo Respuesta
ÿ ÿ
200 Sí
180 Sí Sí
160 Sí Sí
140 Sí Sí Sí
120 Sí No No Sí
100 Sí No No
80 No No No
60 No No
40 No ÿ
20 No
ÿ
Significar
Límite 90 130 130 110 115
Nota: En la primera serie de ensayos, el experimentador comienza con un fuerte estímulo y disminuye su intensidad hasta
el observador ya no puede detectarlo. El umbral es la media de las intensidades de estímulo que producen el primer
respuesta “no” y la última respuesta “sí”. En la siguiente serie de ensayos, se aumenta la intensidad de un estímulo débil
hasta que se detecta. Se acostumbra comenzar cada serie con una intensidad de estímulo diferente para que sea menos probable que
las respuestas del observador estarán influenciadas por la longitud de una serie. Los estímulos están en unidades arbitrarias, es decir, el
las intensidades que van desde 20 a 200 podrían representar peso o cualquier otra cosa que pueda variar en intensidad.
59533_07_ch06_p151-179.indd 158 9533_07_ch06_p151-179.indd 158 3/5/08 /5/08

el observador informa haber escuchado el tono. Este proceso de alternancia de bloques de prueba continúa
hasta que se completa la Tabla 6.1. Cada bloque se inicia con una intensidad diferente para evitar pistas
adicionales que puedan confundir al observador.
Si el observador fuera un perfecto detector de estímulos, el punto en el que las respuestas cambiarían
de “sí” a “no” (o viceversa) sería siempre el mismo. Este punto ideal sería el umbral. Los estímulos inferiores
a este valor nunca se detectarían, y los estímulos superiores o iguales a este umbral ideal siempre se
detectarían.
Desafortunadamente, los datos reales de personas reales no tienen esta característica ideal; en cambio, se
parecen a los datos de la tabla 6.1.
Los observadores se ven influenciados por sus expectativas acerca de cuándo creen que es el
momento de cambiar su respuesta de “sí” a “no” o viceversa. Por ejemplo, si una serie requiere varias
respuestas “sí” antes de alcanzar el umbral, algunos observadores pueden decidir que están dando
demasiadas respuestas “sí” y responder “no” prematuramente. Otros observadores pueden ser muy
cautelosos acerca de cambiar sus respuestas y pueden demorarse demasiado. De hecho, el mismo
observador en momentos diferentes puede cometer ambos tipos de errores. Por lo tanto, el umbral se define
operativamente como la media (promedio) de los puntos en cada bloque de prueba en los que el observador
cambia de "sí" a "no" (o de "no" a "sí").
Esta definición operativa es estadística. Un umbral definido de esta manera, basado en la capacidad de un
observador para detectar una señal, se denomina umbral absoluto, ya que los juicios de sí o no no se
basan en una comparación de dos estímulos, sino que son juicios absolutos sobre un solo estímulo.
La psicofísica clásica asume que el estímulo físico produce una distribución normal de eventos
mentales (Figura 6.2). Así, el valor mental real producido por el mismo estímulo físico varía de una prueba
a otra. El umbral es un concepto estadístico que corresponde a la media de esta distribución normal. Dado
que una distribución normal es simétrica, el umbral es el valor de estímulo que se puede detectar el 50 por
ciento del tiempo.
Frecuencia
mental
valor
del
Límite
Valor de estímulo
ÿ FIGURA 6.2
El Mismo Estímulo Físico Produce una Gama de Valores Mentales.
59533_07_ch06_p151-179.indd 159 9533_07_ch06_p151-179.indd 159 3/5/08 /5/08

Dado que el umbral absoluto es un concepto estadístico, al igual que el “contribuyente
promedio”, tiene otras propiedades estadísticas además de la media. Estos ahora se ilustran
calculando un umbral de diferencia en la Tabla 6.2. Los umbrales de diferencia se basan en
juicios relativos, en los que un estímulo de comparación constante e invariable se juzga en relación
con una serie de estímulos cambiantes. La pregunta que hace el experimentador es la siguiente:
"¿Qué tan diferentes deben ser dos estímulos antes de que puedan distinguirse de manera confiable?"
El ejemplo tradicional de un umbral de diferencia requiere que el observador levante pares de
pesos (un peso siempre permanece igual) y juzgue si el nuevo peso es más pesado, más liviano o
igual al peso estándar. Se dan varias series de pruebas ascendentes y descendentes. El umbral
superior es el punto promedio en el que el observador cambia de respuestas "más pesadas" a
respuestas "iguales". El umbral inferior es el punto en el que las respuestas "iguales" dan paso a
respuestas "más ligeras". La diferencia entre estos dos valores se denomina intervalo de
incertidumbre. El umbral de diferencia se define operativamente como la mitad del intervalo de
incertidumbre. En la Tabla 6.2, esto equivale a 10 gramos. La media de los umbrales superior e
inferior se denomina punto de igualdad subjetiva (300 gramos en la Tabla 6.2).
Ernst Heinrich Weber, cuyo trabajo pionero en psicofísica precedió al de Fechner en unos 20
años, descubrió algunas propiedades importantes del umbral de diferencia.
Una propiedad que determinó Weber fue que la magnitud del umbral de diferencia aumenta con
los aumentos en la magnitud del estímulo estándar. Encontró que 10 gramos es el umbral de
diferencia cuando 300 gramos es el estándar, y el valor correspondiente para un estímulo estándar
de 600 gramos es un umbral de diferencia de 20 gramos.
Un ejemplo familiar ilustrará este hallazgo psicofísico. En una habitación iluminada por un solo
ÿ TABLA 6.2
Uso del método de los límites para determinar un umbral de diferencia.
Comparación
Estímulo
(gramos) Respuesta
ÿ ÿ
350 más pesado
340 más pesado más pesado
330 más pesado más pesado
320 más pesado más pesado más pesado más pesado
310 Igual Igual más pesado Igual

Estímulo estándar 300 Igual Igual más pesado Encendedor
290 Igual Encendedor Igual Encendedor
280 Encendedor Encendedor Igual Encendedor
270 Encendedor Encendedor Encendedor
260 Encendedor
ÿ Significar
Umbral superior 315 315 295 315 310

Umbral inferior 285 295 275 305 290
Intervalo de Incertidumbre 310 290 20 gramos
Nota: Para series descendentes, el umbral superior es la media de los estímulos que conducen a la última respuesta "más pesada" y la primera respuesta "igual".
El umbral inferior es la media de los estímulos que producen la última respuesta "igual" y la primera respuesta "más ligera". El estímulo estándar es siempre
300 gramos El umbral de diferencia es la mitad del intervalo de incertidumbre (10 gramos, en este ejemplo).
59533_07_ch06_p151-179.indd 160 9533_07_ch06_p151-179.indd 160 3/5/08 /5/08

vela, la adición de otra vela encendida hará que la habitación sea notablemente más brillante. Sin
embargo, en una habitación iluminada por varias lámparas intensas, agregar una sola vela
encendida no aumentará notablemente el brillo de la habitación.
Weber es famoso por determinar una segunda propiedad del umbral de diferencia: para una
modalidad sensorial particular, el tamaño del umbral de diferencia en relación con el estímulo
estándar es constante. Volviendo a nuestro ejemplo anterior, la proporción de 10 gramos a 300
gramos es la misma que la proporción de 20 gramos a 600 gramos, 1/30 en este caso. Según el
descubrimiento de Weber, esto significa que el umbral de diferencia para un estímulo estándar de
900 gramos debe ser de 30 gramos y de 40 gramos para un estándar de 1200 gramos. ¿Cuál
debería ser el umbral de diferencia para un estímulo estándar de 50 gramos?
Fechner llamó a la constancia relativa del umbral de la diferencia la ley de Weber. Esta ley
generalmente se escribe como I/ I K, donde I se refiere a la magnitud del estímulo estándar, I es el
umbral de diferencia y K es el símbolo de constancia.
La ley de Weber, o la fracción de Weber, como se le llama a veces, varía en tamaño para
diferentes sentidos. Por ejemplo, es algo más grande para el brillo que para la pesadez.
Una cantidad sustancial de investigación ha demostrado que la ley de Weber es válida para más del
90 por ciento del rango de estímulos estándar probados en una modalidad sensorial particular.
No se cumple para estímulos muy débiles, de modo que la fracción de Weber para estímulos
estándar muy ligeros es mucho mayor que 1/30, que es lo que se encuentra en el rango medio.
Puede pensar que el método de los límites es bastante ineficaz, ya que cada columna contiene
muchas respuestas sucesivas (en la tabla 6.1, "sí" o "no") que no cambian. Una versión más nueva
del método de los límites, llamada método de la escalera .
(Cornsweet, 1962), concentra las respuestas alrededor del umbral. Para el primer intento, es similar
al método de los límites. Sin embargo, una vez obtenida una estimación del umbral, el método de la
escalera nunca presenta estímulos que se alejen de esta estimación.
Esto se muestra en la Tabla 6.3. Tan pronto como se cruza la estimación del umbral, la dirección de
la intensidad del estímulo se invierte. Esto mejora la eficiencia del método al mantener los estímulos
mucho más cerca del umbral que en el caso del método de los límites. El umbral se define
operativamente como el valor medio de todos los estímulos presentados, comenzando con la
segunda prueba (columna 2 en la Tabla 6.3).
La versión en escalera del método de los límites se usó para determinar si los expertos en
vinos tienen una sensibilidad más aguda a los olores que los novatos (Parr, Heatherbell,
ÿ TABLA 6.3
Uso del método de la escalera para determinar un umbral absoluto.
Intensidad del estímulo Respuesta
ÿ
180 Sí
160 Sí
140 Sí Sí ÿ Sí
120 Sí No No ÿ
100 Sí No
80 No ÿ
Umbral 124
59533_07_ch06_p151-179.indd 161 9533_07_ch06_p151-179.indd 161 3/5/08 /5/08

y Blanco, 2002). Principiantes y expertos tuvieron que diferenciar el olor de varias concentraciones de
butanol, que tiene un olor afrutado, del agua destilada. Parr y asociados encontraron que los expertos en
vino y los novatos en vino tenían umbrales de diferencia casi idénticos.
Usando otros procedimientos, por otro lado, los investigadores encontraron que los expertos podían
reconocer los olores relacionados con el vino mejor que los novatos.
Sin umbrales: la teoría de la detección de señales

De acuerdo con la teoría de detección de señales, nuestra percepción en general está controlada por
pruebas y procesos de decisión. Una señal o estímulo crea una evidencia (hipotética) que depende de la
intensidad de la señal y la agudeza del observador, lo que determina en parte una respuesta afirmativa.
Hay otros determinantes de la decisión de decir “sí, hay un estímulo presente”, incluidos los factores que
infl uyen en la disposición del observador a decir que hay una señal presente. Estas influencias de sesgo
de respuesta incluyen la recompensa por ser preciso, la frecuencia de la señal, etc. La Figura 6.3 muestra
que el proceso de decisión está influenciado tanto por la evidencia como por los sesgos de respuesta
(Pastore, Crawley, Berens y Skelly, 2003).
Cualquier decisión que tome depende de los costos y beneficios asociados con ella. Imagínese que
un amigo ha organizado una cita a ciegas para usted. Los costos (una noche desperdiciada) son
probablemente menores que los posibles beneficios (una noche emocionante ahora y noches más
emocionantes en el futuro); muchos de nosotros aceptaríamos una cita a ciegas, aunque no supiéramos
nada acerca de la persona con la que saldríamos. Por lo tanto, es probable que responda "sí".
Esta decisión estaría basada mayormente en costos y beneficios, ya que le faltaría información sobre el
estímulo (la persona que es su cita).
Ahora imaginemos una situación en la que los costos son altos: aceptar u ofrecer una propuesta de
matrimonio. Incluso aquellos de nosotros que estamos ansiosos por aceptar una cita a ciegas no
Pagos
Motivación
Vigilancia
Módulo sensorial Frecuencia
Sistemas sensoriales
en el cerebro
Evidencia
Valores X
Módulo de decisión
en el cerebro
Respuestas
ÿ FIGURA 6.3
Una mirada teórica a lo que sucede en la detección de señales. El análisis sensorial envía
valores de evidencia (X) al módulo de decisión. Los valores de X son una función de la intensidad
de la señal y la agudeza del observador. Los procesos de pagos, motivación y atención envían
información de sesgo de respuesta al módulo de decisión. Juntos, los componentes sensoriales
y de sesgo determinan la respuesta del observador. Los valores de evidencia X están en la
abscisa de las Figuras 6.4 y 6.5. Los pagos, etc., determinan la posición del criterio.
59533_07_ch06_p151-179.indd 162 9533_07_ch06_p151-179.indd 162 3/5/08 /5/08

casarnos si solo nos ofrecieran la información necesaria para ayudarnos a decidir si ir a una cita a
ciegas. Los costos de un matrimonio insatisfactorio son mucho mayores que los de una cita a ciegas
que no funciona. En términos de la teoría de la decisión, la mayoría de nosotros tomamos decisiones
conservadoras cuando consideramos el matrimonio, pero tomamos decisiones liberales cuando
consideramos una cita a ciegas. Este sesgo de respuesta no depende del estímulo —de hecho, la
misma persona podría estar involucrada en ambos casos— sino solo de los costos y beneficios de la
decisión.
Ahora, podemos volver al final sensorial (principio) de la detección de señales. El proceso
sensorial transmite un valor al proceso de decisión. Si este valor es alto, es más probable que el proceso
de decisión produzca una respuesta afirmativa una vez que se hayan considerado los costos y los
beneficios. Si este valor es bajo, es más probable que el proceso de decisión produzca una respuesta
negativa, incluso si los costos y beneficios favorecen una decisión afirmativa. ¿Qué determina el valor
enviado por el proceso sensorial?
La teoría de detección de señales asume que el ruido, una perturbación que puede confundirse
con señales, siempre está presente cuando un ser humano intenta detectar señales. Esta perturbación
de fondo se debe a cambios ambientales, cambios de equipo, actividad neuronal espontánea y
manipulaciones experimentales directas. Solo para asegurarse de que la suposición de que el ruido
está presente durante los intentos de detección, un experimento típico de detección de señal presentará
ruido blanco, un sonido sibilante como el que se escucha cuando sintoniza su televisor en un canal
desocupado, junto con la señal. El ruido puede ser auditivo o visual o puede ocurrir en cualquier
modalidad; consideramos sólo el sistema auditivo por ahora.
Para ilustrar la detección de señales enviadas por el proceso sensorial, examinaremos un

experimento típico de detección de señales. Imagina que estás sentado en una cabina insonorizada,
usando audífonos. En cada uno de varios cientos de intentos, debe decidir si escucha un tono débil
combinado con el ruido blanco o solo el ruido blanco. Una prueba puede comenzar con la presentación
de una luz intermitente que le indica que se prepare para el estímulo de prueba. Luego escuchará una
ráfaga de ruido blanco, que puede contener o no la señal de tono débil. Usted dice "sí" si cree que hubo
una señal de tono y "no" si cree que solo hubo ruido. La teoría de detección de señales asume que
cualquier estímulo, incluso el ruido, produce distribución de evidencia. La evidencia en cada ensayo es
solo un punto, y las distribuciones se construyen a partir de muchos ensayos, cada uno de los cuales
ocurre en un momento diferente (ver la discusión de las distribuciones en el Apéndice B). Dado que la
evidencia no se puede observar directamente, las distribuciones para las pruebas de estímulo y las
pruebas de ruido son hipotéticas. La evidencia que surge de un ensayo en el que solo se produjo ruido
tenderá a ser pequeña, de modo que, a lo largo de muchos ensayos, se establecerá una distribución
(hipotética) con una media pequeña. Cuando se presenta una señal más ruido, la evidencia será mayor,
de modo que se formará una distribución con una media mayor a lo largo de muchos ensayos.
Los ensayos repetidos generan dos distribuciones, una solo para el ruido y otra para la señal más
el ruido, como se muestra en la Figura 6.4. Dado que las dos distribuciones se superponen en el medio,
algunos valores de evidencia son ambiguos, porque podrían haber ocurrido como resultado del ruido o
de la señal. Por supuesto, si las dos distribuciones estuvieran lo suficientemente separadas, este
problema se minimizaría, pero incluso en el laboratorio, la vida no suele ser tan sencilla.
Se debe establecer un criterio, que se muestra como una línea vertical en la figura 6.5, para
determinar si una respuesta será "sí" o "no". La posición de este criterio la establece el proceso de
decisión. Si los costos y los beneficios favorecen una política de decisión liberal, el criterio se establecerá
muy a la izquierda, por lo que la mayoría de las respuestas serán “sí”. Si se utiliza una política
conservadora, el criterio se mueve hacia la derecha, por lo que la mayoría de las respuestas serán “no”. E
59533_07_ch06_p151-179.indd 163 9533_07_ch06_p151-179.indd 163 3/5/08 /5/08

Ruido Señal más ruido

Distribución Distribución
impresiones
Frecuencia
de
Débil d' Fuerte

Magnitud de la evidencia
ÿ FIGURA 6.4
Distribuciones hipotéticas de la evidencia resultante del ruido y señal más ruido. La

frecuencia de las impresiones es el eje Y y la magnitud de la evidencia es el eje X. La fuerza
de la señal y la agudeza sensorial del observador determinan la cantidad de superposición de
las dos distribuciones. Una señal más fuerte o un observador más sensible movería la
distribución de señal más ruido hacia la derecha (hacia el extremo fuerte del eje X). Las líneas
verticales discontinuas son la media (promedio) de cada distribución, y la distancia entre las
dos medias se llama d'.
criterio
Sin respuestas Sí Respuestas
Ruido Señal más ruido

Distribución Distribución
impresiones
Frecuencia
de
Débil Fuerte
Magnitud de la evidencia
ÿ FIGURA 6.5
Distribuciones hipotéticas de respuestas “sí” o “no” en función del criterio y la

magnitud de la evidencia. El criterio de decisión ( ) determina si se dará una respuesta
de “sí” o “no”. La evidencia sólida a la derecha del criterio dará lugar a respuestas de "sí", y la
evidencia débil a la izquierda dará lugar a respuestas de "no". La detección correcta de la
señal (respuestas "sí" en el área rayada horizontalmente) se denomina aciertos. Las
respuestas correctas de “no” cuando se produce ruido (la parte rayada verticalmente) se
denominan rechazos correctos. Los fallos ocurren cuando se produce una respuesta "no" a
las señales débiles a la izquierda del criterio (la parte punteada de la distribución de señal
más ruido). Las falsas alarmas son respuestas incorrectas de "sí" al ruido que está a la
derecha del criterio (la parte negra de la distribución de ruido).
59533_07_ch06_p151-179.indd 164 9533_07_ch06_p151-179.indd 164 3/5/08 /5/08

se cometerán algunos errores. Como se muestra en la figura 6.5, la detección correcta de una señal cuando se
presenta se denomina acierto. Responder incorrectamente "sí" cuando solo se presenta ruido se denomina
falsa alarma. Con una estrategia de decisión liberal—criterio puesto a la izquierda—el número de aciertos será
alto; pero como hay numerosas respuestas afirmativas, el número de falsas alarmas también será elevado. (Si
alguien dijera “sí” en cada intento, tanto la tasa de aciertos como la tasa de falsas alarmas serían del 100 por
ciento). Con una estrategia de decisión conservadora, las falsas alarmas serán bajas, pero también lo serán los
aciertos. (Si alguien dijera “no” en cada prueba, la tasa de falsas alarmas sería del 0 por ciento, al igual que la
tasa de aciertos).
Si graficamos los aciertos en función de las falsas alarmas, ya que el criterio se mueve de conservación
tivo a liberal, obtenemos la representación representada en la Figura 6.6.
Esta figura se llama función de característica operativa del receptor (o ROC). Tanto los aciertos como
las falsas alarmas son poco frecuentes (criterio conservador) en la parte inferior izquierda de la curva.
A medida que el criterio se vuelve más liberal, tanto los aciertos como las falsas alarmas se vuelven más
probables y la curva ROC se mueve hacia arriba a la derecha. La pendiente de la función ROC nos dice el
criterio. Las pendientes planas revelan un criterio de decisión liberal (generalmente, la parte superior derecha
de la curva) y las pendientes pronunciadas un criterio conservador (generalmente, la parte inferior izquierda de la
Funciones de la República de China
100
Liberal
d'
d'
Porcentaje
aciertos
de
50 Criterios de decisión
Conservador
0
0 50 100
Porcentaje de falsas alarmas

ÿ FIGURA 6.6
Funciones de la República de China. La distancia de la diagonal al centro de la curva es proporcional

a d'. La diagonal representa el desempeño al azar, con el observador adivinando sobre la presencia o
ausencia de una señal. Por lo tanto, el porcentaje de aciertos es igual al porcentaje de falsas alarmas
a lo largo de esta diagonal de "adivinanza". La función ROC pesada está más alejada de la diagonal
que la función ROC más ligera, lo que significa que d' es mayor para la curva pesada que para la
ligera. Una d' más grande puede resultar de una señal más fuerte o de un observador más agudo.
59533_07_ch06_p151-179.indd 165 9533_07_ch06_p151-179.indd 165 3/5/08 /5/08

La pendiente de curvas como la función ROC está determinada por la pendiente de una línea que se
dibuja tangente a un punto particular de la función y se cruza con uno de los ejes del gráfico. Hay tablas,
como la Tabla A del Apéndice C, que contienen valores del criterio. La distancia desde la diagonal hasta la
curva ROC nos dice qué tan separadas están las distribuciones de ruido y señal más ruido de la figura 6.4.
Cuando las dos distribuciones están muy separadas, lo que indica una señal más perceptible o un observador
más agudo, la curva ROC se mueve hacia arriba a la izquierda, alejándose de la diagonal, como lo muestra
la función ROC pesada en la Figura 6.6. Cuando la señal es menos detectable o cuando el observador es
menos agudo y las dos distribuciones están juntas, la curva ROC se acerca a la diagonal. Por lo tanto, la
función ROC nos informa sobre el proceso sensorial (d', distancia entre las distribuciones de señal más ruido
y solo ruido) y el proceso de decisión (la pendiente). Dado que una sola condición experimental genera solo
un punto en la curva ROC, se necesitan muchas condiciones para alterar las tasas de aciertos y falsas
, ellas
alarmas. Por lo general, las tasas de aciertos y falsas
(consulte
alarmasla se
figura
manipulan
6.10 más
alterando
adelanteelen
pago
esteasociado
capítulo).
con
(Si un golpe valiera 2 dólares y una falsa alarma te penalizara con 50 centavos, ¿serías más liberal o más
conservador que si un golpe valiera 50 centavos y una falsa alarma te penalizara con 2 dólares?)
Otra forma de manipular la tasa de aciertos y falsas alarmas es variar la frecuencia con la que se
produce la señal (consulte la Figura 6.10 más adelante). Si, durante una serie de intentos, se hubiera
producido una señal el 90 por ciento de las veces, sería más probable que dijera "sí" en cualquier intento
que cuando la señal se hubiera producido con muy poca frecuencia en los intentos anteriores.
A estas alturas, es posible que se pregunte qué tiene que ver todo esto con los umbrales. En ninguna
parte la curva ROC tiene una etiqueta que diga "umbral". Que un observador responda “sí” o “no” depende
de la evidencia y del criterio de decisión. La intensidad de la señal se puede mantener constante, pero dado
que hay pagos variables por aciertos y falsas alarmas, puede generar una curva ROC que muestre
d' (sensibilidad) y la pendiente de la curva en varios puntos. No existe una definición operativa de un umbral.
En su lugar, se definen operativamente dos cantidades. La sensibilidad del observador se denomina d' y se
define como la distancia entre las distribuciones de señal y ruido en la Figura 6.4 o como la distancia máxima
entre la curva ROC y la diagonal en la Figura 6.6. El criterio de los procesos de decisión se denomina beta
( ) y es la pendiente de la función ROC en el punto de interés, por ejemplo, una tasa de aciertos del 55 por
ciento.
Entonces, ¿qué es un umbral? Como se muestra en la figura 6.4, la teoría de detección de señales
supone que la evidencia de un estímulo es una distribución continua que toma un valor cero solo cuando la
intensidad del estímulo mismo es cero. No tenemos un umbral que divida la dimensión del estímulo en
componentes detectables e indetectables, como nos haría creer la psicofísica clásica. Más bien, un estímulo
debe producir una sensación que exceda el criterio de decisión ( ) para que una persona informe haber
detectado un estímulo débil (Figura 6.5). En cierto sentido, entonces, la noción de un umbral absoluto
determinado por un estímulo de una intensidad particular ha sido negada por la teoría de detección de
señales. Lo que nos queda, como sugiere D'Amato (1970), es un umbral de respuesta o decisión. Sólo
cuando un estímulo arroja evidencias que superan el umbral de decisión, lo que venimos llamando o el
criterio, tenemos detección correcta de la señal. Por supuesto, d' determina la detectabilidad de la señal,
pero no necesariamente lo que informa el sujeto.
Esto significa que la detección y el informe de la presencia de una señal están determinados por d' y ;
Juntas, estas dos cantidades determinan lo que un psicofísico clásico llamaría un umbral.
59533_07_ch06_p151-179.indd 166 9533_07_ch06_p151-179.indd 166 3/5/08 /5/08

ÿ FIGURA 6.7
Ruido Cálculo de d' sobre la base de
falsas alarmas (área azul bajo la
0.21 curva de distribución de ruido) y
Área bajo la curva
aciertos (área rayada
horizontalmente bajo la curva de
distribución de señal más ruido).
0 b
criterio
Señal más ruido
0.875
Área bajo la curva
d'
Cálculo de d'. Dado un conjunto de datos, podemos calcular fácilmente d' usando tablas
basadas en el área bajo la curva normal (ver Tabla A en el Apéndice C). Suponga que sabe
que la tasa de aciertos es 0,875 y la tasa de falsas alarmas es 0,21. ¿Qué es d'? Primero,
dibuje la distribución del ruido, como en la Figura 6.7. Dado que la tasa de falsas alarmas
representa el área bajo la curva desde el criterio hasta más infinito a la derecha, es igual a
0,21. Dado que la curva normal es simétrica, la mitad de su área (0,5) se encuentra entre cero y
Por lo tanto, el área entre cero y el criterio debe ser 0,52 0,21, que es igual a 0,29. Ahora
busque 0.29 en la Tabla A del Apéndice C. Encontrará que z = 0.8. Esta es la distancia
normalizada del criterio desde cero.
En segundo lugar, repita este proceso para la distribución de señales que se muestra en
la parte inferior de la Figura 6.7. Dado que la tasa de aciertos es 0,875, esta es el área bajo la
curva desde el criterio hasta más infinito. Nuevamente, debido a la simetría, la mitad del área
bajo la curva (0.5) está entre d' y más infinito. Por lo tanto, el área entre el criterio y d' es 0,875
0,5, lo que equivale a 0,375. Consultando la Tabla A del Apéndice C, encontramos que un
área de 0.375 corresponde a una z de alrededor de 1.15.
Ahora podemos poner estos dos valores z juntos para encontrar d' (Figura 6.8). Como a
la media de la distribución del ruido se le da el valor de cero, d' es la suma de los dos valores
de z : 0,8 1,15 1,95. Nuestro cálculo de d' ahora está completo. Obviamente, entonces, cuanto
mayor sea d', mayor será la distancia entre las medias de las dos distribuciones.
Por lo tanto, una d' grande indica una señal fuerte o un observador agudo.
Ventaja de los métodos de detección de señales. Una gran ventaja de los métodos de
detección de señales sobre un procedimiento psicofísico clásico, como el método de los
límites, es la capacidad de medir tanto la sensibilidad como el sesgo de respuesta. En muchas
áreas de la psicología aplicada, la capacidad de distinguir entre estos dos procesos es muy
importante. Volvamos al problema de medir la eficacia de los analgésicos.
En un gran número de experimentos, Hardy, Wolff y Goodell (1952) examinaron las
reacciones de las personas al calor radiante presentado en sus antebrazos por un equipo.
59533_07_ch06_p151-179.indd 167 9533_07_ch06_p151-179.indd 167 3/5/08 /5/08

Ruido Señal
0 d'
0.8 1.15
ÿ FIGURA 6.8
Cálculo de d': la suma de los dos valores z da como resultado d'. d' = 0,8 + 1,15 = 1,95.
similar a un secador de pelo, llamado dolorímetro. Se presentó un pequeño punto de estimulación

a varias intensidades (generalmente definidas en términos de calorías por unidad de área
estimulada, en lugar de una escala de temperatura). El enfoque de los investigadores fue
determinar la intensidad del calor necesaria para que una persona informara dolor, primero sin un
analgésico como la aspirina y luego cuando se había tomado aspirina antes de la presentación
del calor. Un aumento en la intensidad necesaria para provocar el dolor después de que los
sujetos hubieran tomado aspirina indicaría que la aspirina tenía propiedades analgésicas. De
hecho, esto es lo que encontraron Hardy y asociados. O, al menos, eso es lo que observaron
cuando utilizaron sujetos altamente experimentados (ellos mismos) en el experimento. Para su
sorpresa, cuando probaron sujetos ingenuos (ochenta reclutas militares, en este caso), encontraron
que para más de la mitad de sus sujetos, la intensidad del calor requerida para provocar dolor en
realidad disminuyó después de la ingestión de aspirina.
Hardy y asociados (1952) utilizaron el método de los límites para determinar el umbral
absoluto del dolor y los cambios en dichos umbrales como resultado de un supuesto analgésico,
como la aspirina. Entre otras cosas, encontraron que la aspirina elevaba los umbrales del dolor
de manera más consistente en los observadores entrenados que en los ingenuos, y notaron que
varios tipos de sugerencias alterarían los umbrales del dolor. Por ejemplo, los umbrales se
elevaron más cuando las personas creían que habían tomado un analgésico que cuando no lo
creían. Además, Hardy y sus asociados demostraron que esta sugerencia elevaba los umbrales
tanto cuando las personas tomaban un analgésico real (por ejemplo, aspirina) como cuando
tomaban una píldora placebo (inerte) (consulte el Capítulo 13 para una discusión sobre el efecto
placebo). ¿Este resultado se debe a un cambio en la sensibilidad (d'), o hay un cambio en el
criterio de decisión ( )?
Para determinar cómo funcionaban los analgésicos, Clark y colaboradores (Clark, 1969;
Clark y Yang, 1974) realizaron una serie de experimentos sobre la analgesia del dolor. En lugar
de utilizar el método de los límites, Clark utilizó un procedimiento de detección de señales para
poder evaluar tanto los cambios en la sensibilidad como los procesos de decisión. En estos
experimentos se utilizó un dolorímetro para provocar el dolor mediante estimulación térmica.
59533_07_ch06_p151-179.indd 168 9533_07_ch06_p151-179.indd 168 3/5/08 /5/08

Inicialmente, Clark descubrió que los analgésicos como la aspirina reducían d', lo que significa
que la droga disminuía la agudeza del sistema sensorial con el resultado de que la aspirina
reducía la capacidad de las personas para distinguir entre estímulos dolorosos y no dolorosos.
Luego, Clark investigó si los placebos y la acupuntura (un procedimiento médico chino de
inserción de agujas en la piel, que a veces se usa para reducir el dolor inducido quirúrgicamente
y tiene otros usos médicos) alteraban la d' (sensibilidad reducida) o si los placebos y la acupuntura
cambiaban la disposición. de los sujetos para informar dolor. En ambos experimentos, Clark
descubrió que los placebos y la acupuntura reducían los informes de dolor y la cantidad de veces
que los sujetos intentaban retirarse de los estímulos dolorosos. ¿Estos procedimientos indujeron
analgesia para el dolor? No; en ambos experimentos, d' no se vio afectado por la manipulación.
Lo que sucedió fue que la acupuntura y los placebos elevaron el criterio de decisión de los sujetos,
de modo que se requirieron estímulos más fuertes que antes para provocar una respuesta de
detección. Esto no significa que los placebos y la acupuntura no funcionen; después de un
tratamiento de acupuntura o la ingestión de un placebo, las personas reportan menos dolor. Lo
que muestran los resultados de Clark es la forma en que estos procedimientos funcionan para
aliviar el dolor. No amortiguan los sistemas sensoriales; más bien, cambian el umbral de decisión
para informar que se ha experimentado dolor.
Volvamos brevemente al trabajo de Hardy y asociados (1952). Usando el método de los

límites, encontraron que la sugestión alteraba el umbral absoluto. Dados los resultados de
detección de señales encontrados por Clark, es razonable suponer que la sugestión cambió el
umbral absoluto determinado por el método de los límites al alterar el criterio de decisión de los
sujetos. ¿Cómo vamos a explicar el hecho de que los observadores entrenados, pero no los
ingenuos, tengan umbrales de dolor más altos después de la ingestión de aspirina? ¿Por qué la
mayoría de los observadores ingenuos tienen un umbral de dolor más bajo? Podríamos suponer
que esto también es un cambio de criterio, debido al hecho de que los observadores entrenados
saben todo sobre el experimento y los supuestos efectos de la aspirina, mientras que los sujetos
ingenuos están nerviosos después de tomar un medicamento y es más probable que informen
sobre el dolor. Sin embargo, en ausencia de un análisis de detección de señales, solo podemos esp
Un enigma en la literatura sobre el alivio del dolor podría aclararse con un experimento de
detección de señales realizado adecuadamente.
Escalas de medición del tema

Ilustración Ley de Fechner y Ley de Stevens
Es un dicho en psicofísica que todo lo que existe, ya sea la intensidad de los sentimientos
dolorosos o tu actitud hacia las espinacas, existe en alguna cantidad. Todo lo que existe en cierta
cantidad se puede medir. La medición es una forma sistemática de asignar números o nombres
a objetos y sus atributos. Cuando asignamos nombres o números a objetos y sus atributos,
necesitamos una escala de medición, que resulta de diferentes operaciones de medición. Cuando
medimos la temperatura, por ejemplo, generalmente usamos la escala Fahrenheit o la escala
centígrada. Estas dos escalas de temperatura son inapropiadas para medir el peso, que puede
medirse en libras o kilogramos.
Como veremos, las diferentes operaciones de medición producen escalas que difieren en la
información que proporcionan.
59533_07_ch06_p151-179.indd 169 9533_07_ch06_p151-179.indd 169 3/5/08 /5/08

Propiedades de las escalas de medida
Las escalas de medición pueden tener cuatro propiedades (McCall, 1990), y la combinación de estas
propiedades determina lo que se mide. Todas las escalas de medida tienen instancias que son
diferentes entre sí. Esta propiedad fundamental, la diferencia, significa que algunas temperaturas son
más frías (o más cálidas) que otras, algunas personas son hombres y otras mujeres, y así
sucesivamente. Las otras propiedades de escala no son universales. Algunas escalas pueden
determinar la magnitud de los atributos, lo que significa que la escala puede mostrar que un atributo
es mayor, menor o igual que otra instancia de ese atributo. Otra propiedad de los atributos que pueden
determinar algunas escalas es si existen intervalos iguales entre magnitudes.
Una diferencia de 1 libra entre dos pesos es la misma cuando se consideran 1 contra 2 libras y 70
contra 71 libras. Una propiedad final de algunas escalas de medición es un verdadero punto cero en
la escala, lo que significa que el cero en la escala indica que no existe nada del atributo que se mide.
No puede tener un peso inferior a cero, tiene un verdadero punto cero de ningún peso, pero puede
tener menos de cero grados centígrados.
Tipos de escalas de medida

Los psicólogos utilizan cuatro escalas de medición: nominal, ordinal, de intervalo y de razón. Estas
escalas se definen por cuál de las cuatro propiedades de las escalas de medición poseen.
Las escalas nominales miden solo la propiedad de la diferencia y nada más. Las escalas ordinales
miden diferencias y magnitudes. Las escalas de intervalo poseen las propiedades de diferencia,
magnitud e intervalos iguales. Las escalas de razón tienen las cuatro propiedades de las escalas de
medición (diferencia, magnitud, intervalo igual y un cero significativo).
Las escalas nominales incluyen códigos postales, género (masculino y femenino) y programas
principales de pregrado. Cada una de estas escalas clasifica a las personas de alguna manera, pero
no miden magnitudes de manera obvia. Por lo tanto, las estadísticas útiles, como el promedio aritmético,
no se pueden utilizar para caracterizar las medidas nominales. Incluso la asignación de números
arbitrarios a los programas principales (negocios = 1, psicología = 2, etc.) no legitimaría la carrera
"promedio" en una institución. Sin embargo, podría determinar el número total de personas que se
especializan en cada programa.
Las escalas ordinales incluyen una variedad de medidas clasificadas, como qué tan nerviosas
están las personas en una escala de 10 puntos (desde 1 = nada nervioso hasta 10 = extremadamente
nervioso), la ubicación en un concurso de belleza o el orden final en un caballo. la raza. El lugar donde
terminas en un concurso de belleza dice la magnitud de la belleza, pero revela poco sobre los intervalos
entre las filas. Los dos primeros clasificados pueden estar muy cerca uno del otro, pero el quinto y el
sexto pueden estar muy separados el uno del otro. Promediar números con intervalos desiguales no es
legítimo. Los números nominales y ordinales tienen estadísticas especiales (estadísticas no
paramétricas, descritas en el apéndice estadístico) que deben usarse con ellos.
Las escalas de intervalo y razón le permiten realizar la mayoría de las operaciones matemáticas
en ellas, y las estadísticas inferenciales ordinarias (consulte el apéndice para estadísticas paramétricas)
se pueden usar en atributos medidos en estos niveles. La mayoría de las medidas de CI y las
puntuaciones del SAT son ejemplos de escalas de intervalo, porque los valores adyacentes tienen
intervalos iguales en toda la escala. Se supone que las 10 unidades de diferencia entre un CI de 90 y
un CI de 100 son las mismas que las 10 unidades de diferencia que separan las puntuaciones de CI de
110 y 120. Ni el CI ni el SAT tienen un verdadero punto cero, por lo que son no escalas de razón. Las
medidas como la velocidad de respuesta y el porcentaje correcto son medidas de proporción, porque
puede exhibir una velocidad cero o respuestas no correctas.
Debe tener en cuenta que la escala de medición se deriva del procedimiento de medición, no
necesariamente de la naturaleza de los atributos que se miden. La temperatura
59533_07_ch06_p151-179.indd 170 9533_07_ch06_p151-179.indd 170 3/5/08 /5/08

medido por la escala Kelvin tiene un cero verdadero y es una medida de razón. Las escalas
Fahrenheit y centígrados, sin embargo, no tienen un verdadero cero (estas escalas no tienen
sentido por la ausencia de temperatura), por lo que son escalas de intervalo. Si simplemente
decimos que una cosa está más caliente que otra, estamos midiendo en el nivel ordinal. Finalmente,
llamar a una cosa “caliente” y a otra “fría” es medir la temperatura en el nivel nominal.
Importancia de las escalas de medida

Los datos de comportamiento derivados de diferentes escalas nos dicen cosas diferentes, y los
tipos de conclusiones que podemos sacar dependen, en parte, de la escala que usamos. Debido a
que una escala de razón tiene cuatro propiedades de medición y las escalas nominales solo una,
tenemos más información sobre algo, digamos depresión, si se mide en el nivel de razón que si se
mide en el nivel nominal. La información proporcionada por la escala permite cierto tipo de
conclusiones. Si el dolor se evaluara en una escala ordinal, sería impropio decir que una persona
con una puntuación de dolor de 8 en la escala percibe el doble de dolor que alguien con una
puntuación de dolor de 4. Para hacer tal afirmación, tendríamos para medir el dolor en una escala
que tiene un punto cero significativo e intervalos iguales entre valores de puntuación adyacentes (una
El tipo de escala de medición puede determinar la cantidad de información que se tiene sobre un
atributo, y el tipo de escala determina, en parte, las conclusiones que podemos sacar.
Ahora examinamos dos enfoques hacia la medición de la sensación. Ambos enfoques tienen
el objetivo de diseñar una escala de razón de una dimensión psicológica interna.
El primer enfoque es el de Fechner e implicó confiar en los resultados de los métodos psicofísicos
clásicos para proporcionar los datos para la escala psicofísica. El segundo enfoque es más moderno
y fue desarrollado por SS Stevens.
Ley de Fechner
Fechner se basó en la investigación psicofísica realizada por Weber para tratar de desarrollar una
escala de medición de las sensaciones. Según la ley de Weber, el umbral de diferencia guarda una
relación constante con el estímulo estándar: I/ I = K. Fechner asumió que la ley de Weber era
correcta y, con dos suposiciones adicionales, desarrolló su propia ley de medición de sensaciones.
Fechner supuso primero que el umbral absoluto indica el punto de sensación cero. Luego asumió
que la diferencia apenas perceptible (JND), que es la sensación interna evocada por dos estímulos
que difieren en un umbral de diferencia, es la unidad que define los intervalos de una escala
psicológica interna. Debido a que se supuso que la ley de Weber era precisa, Fechner creía que
todos los JND producían incrementos iguales en la sensación, como se muestra en la figura 6.9.
Cada paso de JND en la escala psicológica corresponde al estímulo físico que es un umbral de
diferencia mayor que el estímulo anterior. La primera unidad más allá del punto cero corresponde al
estímulo físico que está un JND por encima del umbral absoluto. El siguiente punto será un JND por
encima de eso, o dos JND por encima del umbral absoluto.
Este proceso se puede continuar para construir una escala psicológica. Una vez hecho esto,
existe una relación matemática fija entre el valor de la escala física correspondiente a algún punto
de la escala psicológica y el valor físico correspondiente al punto anterior de la escala psicológica
interna. Para encontrar el valor de la escala física que corresponde a un valor psicológico particular,
primero tomamos el valor físico del paso anterior en la escala externa (por ejemplo, X en la figura
6.9) y lo multiplicamos por la fracción de Weber. Luego sumamos este producto a nuestro valor
original, de modo que Y = X + el producto de X por la fracción de Weber en la figura 6.9 (del mismo
modo, Z = Y + el producto de Y por la fracción de Weber). Sumar de esta manera produce valores
físicos sucesivos que corresponden a JND sucesivos en la escala psicológica interna. Cuando esto
59533_07_ch06_p151-179.indd 171 9533_07_ch06_p151-179.indd 171 3/5/08 /5/08

Presunta Escala Psicológica Interna ()
0 12 3
JND 1 JND 2 JND 3
Absoluto
Thr es equipo
Dif. jue. 1 Dif. jue. 2 Dif. jue. 3
S
0 X Y DE
Valores del Estímulo Físico (S)

ÿ FIGURA 6.9
Ley de Fechner. Unidades iguales en una escala psicológica interna corresponden a unidades
progresivamente mayores en una escala física externa (los umbrales de diferencia): = K log (S).
la relación se expande y se resuelve matemáticamente, encontramos que el valor de la escala psicológica

( ) es proporcional al logaritmo del valor del estímulo físico. Esta ecuación ( = K log Estímulo) se llama
ley de Fechner.
De acuerdo con la ley de Fechner, todos los JND producen incrementos equivalentes en la
sensación; por tanto, parece que tenemos una escala de razón (D'Amato, 1970). La sensación
correspondiente a seis JND debe ser el doble de la sensación de tres JND. Dos factores que ya hemos
discutido deberían llevarlo a preguntarse si Fechner realmente ha ideado una escala de sensación de
razón. Primero, el punto cero de Fechner es más arbitrario que absoluto. El umbral absoluto se defi ne
estadísticamente e incluye muchas sensaciones que no exceden el criterio de decisión (ver la discusión
sobre umbrales y detección de señales). En segundo lugar, sabemos que la ley de Weber es sólo
aproximadamente cierta; esto podría resultar en unidades psicológicas y físicas de diferentes tamaños.
Hay una dificultad adicional con la formulación de Fechner. Fechner asumió que cada JND era
psicológicamente igual, pero si se le pregunta a la gente sobre la magnitud de los efectos sensoriales
producidos por estímulos de diferentes JND por encima del umbral, existe poca correspondencia entre
los dos (D'Amato, 1970). Así, el trabajo de Fechner no es ni una escala de razón ni una escala de
intervalo.
En el mejor de los casos, es una escala ordinal que indica que las sensaciones se ordenan de una
manera particular con respecto a los estímulos físicos que las producen.
Ley de potencia de Stevens
SS Stevens (1961) intentó desarrollar una escala interna de sensación más directamente que Fechner.
Fechner utilizó un método de escalado indirecto , en el que la escala psicológica se construía poniendo
JND sucesivos en una fila. Los observadores no juzgaron las magnitudes de los JND directamente, por
lo que los valores de la escala psicológica se derivan de medidas de discriminación; por lo tanto, son
indirectos. Stevens usó varias técnicas de escalado directo , en las que el observador respondía en
unidades de escala psicológica en primer lugar.
59533_07_ch06_p151-179.indd 172 9533_07_ch06_p151-179.indd 172 3/5/08 /5/08

El principal procedimiento de escalado directo utilizado por Stevens fue el método de estimación de
la magnitud, que requiere que el observador indique un número que represente su sensación de la
intensidad del estímulo. Al primer estímulo que presenta el experimentador se le asigna arbitrariamente
algún número conveniente, digamos, 100. Luego, a otros estímulos se les asignan números con signo,
dependiendo de qué tan cerca esté la intensidad percibida del primer estímulo. Por ejemplo, el
experimentador podría presentar un tono de intensidad moderada y decirle que tiene un valor de 100. Luego
podría presentar un tono más débil, por lo que le daría un número más bajo, digamos, 87. Estos números
informados por el observador representan valores psicológicos percibidos directamente. Cuando los datos
se recopilan de esta manera, la ecuación que relaciona el valor psicológico con el valor físico difiere de la
relación logarítmica de la ley de Fechner. En cambio, la ecuación obtenida por Stevens (1961) es = K
(Estímulo)n, donde n es un exponente. Esta ecuación se llama ley de Stevens.
El método de estimación de magnitudes no se limita a escalas psicológicas que tienen un correlato

físico. Los exámenes de ensayo a menudo se califican con este método. De manera similar, las sanciones
legales, la gravedad de los delitos, las obras de arte, etc., se pueden escalar por estimación de magnitud.
Si asumimos que un estímulo de intensidad cero siempre produce sensación cero (es decir, no hay
falsas alarmas), entonces podemos aceptar la ley de Stevens como una escala psicológica de razón. Con
un cero verdadero y con proporciones de estímulo iguales que producen proporciones de sensaciones
iguales (una relación de poder), hemos satisfecho los criterios para una escala de proporciones. Si este es
el caso, entonces parece razonable aceptar = K Sn como la forma en que nuestras sensaciones internas
se relacionan con el mundo externo.
La ley de Stevens no ha escapado a las críticas. ¿Es la ley sobre las sensaciones o sobre los
números? Diferentes personas usan los números de manera diferente. Algunos observadores siempre
producen exponentes muy grandes para la ley de Stevens y Marks (1974) encontró que la ley varía con el
rango de números usados por los observadores. Bartoshuk (2000) mostró que el uso de un pequeño rango
de números restringe una escala psicofísica. Esta constricción enmascara las diferencias en los juicios,
especialmente en valores de estímulo muy altos (esta atenuación de escala es equivalente al efecto techo
descrito en el Capítulo 10).
Para minimizar las diferencias idiosincrásicas en el rango de números utilizados en las tareas
psicofísicas y también para prevenir la constricción, Bartoshuk y otros psicólogos sensoriales utilizan un
procedimiento de escala de proporción de 100 puntos. Green, Shaffer y Gilmore (1993) idearon la escala
de magnitud etiquetada, que empareja números delimitados por 0 y 100 con etiquetas verbales. Comienza
en un valor cero, que se etiqueta como nada, y progresa a través de etiquetas numeradas de moderada,
fuerte, muy fuerte, y en la parte superior de la escala (100 unidades) está la etiqueta sensación imaginable
más fuerte. Así, todos los observadores tienen el mismo vocabulario y el mismo rango de unidades para
describir sus sensaciones. Usando esta escala, Bartoshuk (2000) pudo identificar a los supercatadores,
cuya anatomía gustativa los lleva a tener sensaciones gustativas extremadamente intensas. Por ejemplo,
los superdegustadores sienten mucho más calor de los pimientos picantes y también reaccionan más a la
cremosidad de los alimentos que los degustadores ordinarios.
Otra preocupación con la estimación de la magnitud se relaciona con las definiciones operativas.
Muchos estudios revelan que una escala sensorial particular, como el brillo, tiene más de una escala que la
caracteriza. Marks (1974) señala que puede describir con precisión una función de potencia para el brillo
solo si especifica todas las variables relevantes para la percepción del brillo: el color y la duración de la luz,
la adaptación sensorial del observador, etc. La variación de estos últimos factores cambia el valor del
exponente en la ley de Stevens. Por lo tanto, debemos definir operativamente la función psicofísica o
arriesgarnos a tergiversar la relación entre sensación y estímulo.
59533_07_ch06_p151-179.indd 173 9533_07_ch06_p151-179.indd 173 3/5/08 /5/08

Tema Diseño de n pequeña

Ilustración Métodos Psicofísicos
El experimento típico en psicología mide el comportamiento de un gran número de participantes. Una de

las razones de esta configuración es que los participantes de la investigación difieren sustancialmente
entre sí en varias características psicológicas complejas, como la personalidad y el coeficiente intelectual.
Además, el entorno en el que se miden estos comportamientos complejos puede estar mal controlado.
Ambos problemas pueden manejarse mediante la asignación aleatoria de un gran número de participantes
a las condiciones. Esto puede reducir la posibilidad de que la variación no controlada en las personas y el
entorno se asocie con un tratamiento en particular, lo que permitiría observar los efectos de la variable
independiente. Dado que la mayoría de los experimentos psicofísicos involucran procesos psicológicos
algo menos complejos que se estudian en entornos bien controlados, a menudo se utilizan menos sujetos.
La investigación psicofísica a menudo se basa en diseños de n pequeña, en los que se realiza una gran
cantidad de observaciones estrictamente controladas en una pequeña cantidad de observadores. Otras
áreas de la psicología, en particular el aprendizaje, también usan diseños de n pequeña por razones
similares (ver el Capítulo 9).
En los dos paneles de la figura 6.10 se muestra un ejemplo de investigación de n pequeño , donde
un solo observador generó ambas funciones ROC. Los datos en el panel A se obtuvieron variando la
probabilidad de la señal de baja a alta en relación con la ocurrencia de ensayos de solo ruido. El servidor
observador es conservador cuando la probabilidad de la señal es baja, pero a medida que aumenta la
probabilidad de la señal, el observador se vuelve más liberal con respuestas de "sí". Este cambio en el
criterio de decisión barre la función ROC comenzando desde la parte inferior izquierda (conservadora) y
moviéndose a lo largo de la curva hacia la parte superior derecha (liberal). En el panel B, el experimentador
mantuvo constante la probabilidad de la señal y varió el pago. Cuando el costo de las falsas alarmas es relativa
1.0
A B
observador 1 observador 1
probabilidades valores
Proporción
aciertos
de
.50 variable variable
0.85 0.85
.10
0 .10 .50 1.0 .10 .50 1.0
Proporción de falsas alarmas Proporción de falsas alarmas

ÿ FIGURA 6.10
Gráficos ROC del mismo observador. En el panel (a) se varió la probabilidad de que ocurriera
una señal, y en el panel (b) variaron los pagos por aciertos y los costos de falsas alarmas.
El inserto muestra el ruido hipotético y las distribuciones de signo más ruido. Las curvas se
ajustaron a los puntos de datos de círculo abierto con d' 0,85. Observe el ajuste a los puntos de
datos y la similitud en la forma de las dos curvas. (Datos de Green and Swets, 1966.)
59533_07_ch06_p151-179.indd 174 9533_07_ch06_p151-179.indd 174 3/5/08 /5/08

al pago por aciertos (en la parte inferior izquierda), el observador es conservador. A medida que
aumenta el pago relativo de los aciertos (moviéndose hacia la parte superior derecha), el observador
adopta un criterio de decisión liberal y está más dispuesto a decir "sí", hay una señal.
Ambas curvas ROC están bien ajustadas por un d' = 0,85 (ver el inserto en cada panel). Un ajuste
tan cercano a los puntos de datos (los círculos abiertos) es muy impresionante, porque las dos
funciones se generaron variando el criterio de decisión de diferentes maneras. La extrema similitud de
las dos curvas ilustra un alto grado de control experimental sobre el comportamiento de un solo
observador que participó en miles de ensayos. Como veremos, los resultados altamente confiables de
los experimentos de detección de señales nos ayudan a comprender varios fenómenos psicológicos
importantes.
Hay otra razón importante para usar diseños de n pequeña. Muchos experimentos requieren
participantes especiales, como especialistas en radiología (interpretación de rayos X), que son escasos
en relación con la gran cantidad de estudiantes universitarios que normalmente se utilizan en los
experimentos. Por lo tanto, un experimento psicofísico sobre qué datos utilizan los expertos para
detectar el cáncer de mama podría incluir a seis especialistas en mamografía (p. ej., Swets, Dawes y
Monahan, 2000). La curva ROC etiquetada como “Estándar” en la Figura 6.11 (adaptada de Swets et
al., 2000) fue producida por el comportamiento de cinco radiólogos generales que interpretaron en su
forma habitual 118 mamografías, la mitad de las cuales contenían tumores malignos. Cada radiografía
se calificó en una escala de calificación para la probabilidad de contener cáncer, lo que generó los
puntos de datos (círculos) en la figura. Las estimaciones de baja probabilidad de malignidad se
representan en la esquina inferior izquierda y las estimaciones altas en la esquina superior derecha.
Con poca probabilidad de cáncer, hubo pocas falsas alarmas, porque el radiólogo es conservador.
Tanto los aciertos como las falsas alarmas aumentan a medida que los radiólogos dicen "sí" con más
frecuencia a la creciente evidencia de que hay cáncer. La curva ROC superior (“Mejorada”) se generó
en las mismas mamografías meses después cuando los radiólogos tenían a su disposición una lista de
verificación de características que habían desarrollado los especialistas en mamografía. Tenga en
cuenta que la curva mejorada está más alejada de la diagonal, lo que indica una mayor sensibilidad, y
los datos indican un aumento del 13 % en los aciertos y una disminución del 12 % en las falsas alarmas.
1.0 ÿ FIGURA 6.11

Mejorado
.9 Gráfico ROC de la lectura
de mamogramas que no
.8
Estándar contenían neoplasias
.13
.7 malignas por radiólogos generale
La curva ROC inferior es la
.6 línea de base y la curva superior
.12 se generó cuando los radiólogos
Proporción
aciertos
de
.5 utilizaron una lista de verificación

de características desarrollada por
.4
expertos en mamografía. La figura
es una adaptación de Swets,
.3
Dawes y Monahan (2000), y se usa
.2 con permiso de Blackwell Publishing,
Ltd.
.1
.0
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1.0
Proporción de falsas alarmas
59533_07_ch06_p151-179.indd 175 9533_07_ch06_p151-179.indd 175 3/5/08 /5/08

La regularidad de los datos psicofísicos y su mejora muestra la utilidad de tales métodos en el entorno
aplicado.
El uso de expertos para ayudar a mejorar la detección del cáncer por parte de los radiólogos
generales es un ejemplo del uso de reglas de predicción estadística para aumentar la precisión de
las decisiones. Las reglas de predicción estadística se basan en variables predictoras e información
de diagnóstico que se puede consultar durante las decisiones de detección de varios tipos. Swets y
asociados (2000) informan sobre estudios que utilizan reglas de predicción para ayudar en la detección
en una variedad de situaciones en las que las bajas tasas de aciertos pueden ser peligrosas o fatales.
Estos incluyen el diagnóstico de cáncer de próstata, la predicción de la violencia en los presos
liberados y la mejora de la detección de grietas en las alas de los aviones.

LA TUERCAS Y PERNOS
Problema ¿Las palomas tienen umbrales visuales?

Problema ¿Cómo podemos medir el umbral visual de una paloma?
Dado que este problema se basa más en la metodología que en el contenido, no necesitamos mucho
en cuanto a una hipótesis formal. Los problemas de contenido surgirían cuando se estableciera por
primera vez la viabilidad de medir el umbral visual de una paloma. Principalmente en aras de la
exhaustividad, ofrecemos la siguiente hipótesis.
Hipótesis Las palomas son sensibles a diferentes intensidades de luz, y sus

umbrales absolutos se verán influenciados por variables que influyen en los
umbrales humanos, como la longitud de onda (color) de la luz y ciertas drogas.
El primer problema que debemos superar es el hecho de que las palomas no pueden hablar. Por
tanto, los introduciremos en una cámara de acondicionamiento con dos claves de respuesta a picotear:
una para “Sí, veo la luz” y otra para “No, no la veo”. Nuestra variable dependiente es el umbral absoluto
medido por los picoteos de teclas diferenciales (consulte la discusión posterior). Nuestras variables
independientes son la intensidad de la luz, el color de la luz y la presencia o ausencia de una droga.
Las variables de control incluirán la cámara de acondicionamiento y los programas de recompensa
utilizados para mantener el picoteo. Queremos que la paloma pique la tecla Sí cuando la luz sea
visible y la tecla No cuando no lo sea, pero no tenemos forma de determinar con solo mirar la luz si es
visible para la paloma.
Blough (1958, 1961) desarrolló una forma de hacer que la paloma indique la visibilidad de la luz.
Utiliza una variante del método de la escalera para determinar el umbral absoluto. Los picotazos en la
tecla Sí reducen gradualmente la intensidad de la luz y los picotazos en la tecla No la aumentan
gradualmente. Ocasionalmente, los picotazos en la tecla Sí apagan completamente la luz, y los
siguientes picotazos en la tecla No son recompensados con comida. Como señala Blough, este
procedimiento puede describirse antropomórficamente como si la paloma picoteara la tecla Sí para
apagar la luz y la tecla No para obtener la recompensa de comida. (Debe tener en cuenta que estas
luces nunca fueron lo suficientemente intensas como para ser aversivas para la paloma). Lo que
sucede es que cuando la luz es demasiado tenue para que la paloma la vea, cambia de la tecla Sí a
la tecla No para recibir el mensaje. premio. Cuando la luz es visible, cambia de la tecla No a la tecla
Sí para atenuar la luz.
59533_07_ch06_p151-179.indd 176 9533_07_ch06_p151-179.indd 176 3/5/08 /5/08

Dado que el ave se mueve de un tono a otro en respuesta a los cambios de intensidad, podemos
determinar el umbral absoluto tomando el promedio de las intensidades justo antes del cambio de un tono
a otro. Esto es lo que se hace para determinar el umbral absoluto de un ser humano con el método de la
escalera. Blough informa que cuando se varía el color de la luz, el umbral absoluto de la paloma cambia, al
igual que cambia el umbral absoluto humano.
Además, las dosis diminutas de LSD elevan el umbral absoluto de luz, tanto para las palomas como para
los humanos.
ÿ RESUMEN
1. Las definiciones operativas que especifican cómo se producen 7. En orden creciente de informatividad, las escalas de
y miden los conceptos son necesarias en la ciencia, tanto medición utilizadas en psicología son nominal, ordinal, de
para hacer que los experimentos sean más públicos como intervalo y de razón.
para aumentar la precisión de los términos técnicos más allá 8. La ley de Fechner probablemente produce una escala ordinal
de su uso en la conversación ordinaria. de juicios psicológicos. La ley de Stevens produce una
2. El método de los límites, ideado por Fechner, proporciona una escala de razón.
definición operativa de los conceptos de umbral absoluto y 9. La escala de magnitud etiquetada es una escala de 0 a 100
umbral diferencial. con etiquetas verbales para muchos números. La escala
3. La psicofísica clásica se dirige principalmente a la evaluación minimiza los efectos de techo y minimiza los rangos
de umbrales. La teoría más moderna de detección de idiosincrásicos de números usados por diferentes observadore
señales reemplaza el concepto de umbral con otros dos 10. Debido al estricto control y la relativa falta de complejidad del
conceptos definidos operativamente: d' y . comportamiento, muchos experimentos psicofísicos usan
4. Los procesos sensoriales se miden por d' y los procesos de diseños de n pequeña que emplean pocos sujetos. Los
decisión se miden por . Tanto d' como pueden calcularse a diseños de n pequeña también se utilizan debido a la
partir de funciones ROC (receiver-operating character istic) escasez de tipos especiales de observadores, como los
que trazan aciertos contra falsas alarmas. radiólogos.
5. Las escalas de medida resultan cuando se asignan 11. La capacidad de tomar decisiones de detección precisas se
sistemáticamente números o nombres a objetos oa sus puede mejorar mediante el uso de reglas de predicción
atributos. estadística que involucren variables predictoras e información
6. Las escalas de medición brindan información en la medida en de diagnóstico.
que miden diferencias, magnitudes e intervalos iguales y
tienen un punto cero verdadero.
ÿ TÉRMINOS CLAVE
umbral absoluto escalado directo

beta ( ) intervalos iguales
prueba de presión en frío alerta falsa
criterio Ley de Fechner ( = K log(S))
d' pegar
umbral de decisión escalado indirecto

diferencia intervalo de incertidumbre
umbral de diferencia escala de intervalo
59533_07_ch06_p151-179.indd 177 9533_07_ch06_p151-179.indd 177 3/5/08 /5/08

diferencia apenas perceptible (JND) métodos psicofísicos
escala de magnitud etiquetada psicofísica
magnitud escala de proporción
estimación de magnitud característica operativa del receptor (ROC)

medición diseños de n pequeña
escalas de medida método de la escalera
método de límites reglas de predicción estadística
ruido Ley de Stevens ( = K Sn)
escala nominal teoría de la detección de señales
definiciones operacionales límite
Escala ordinal verdadero cero
placebo Ley de Weber ( I/I = K)

punto de igualdad subjetiva
1. Aunque es posible que el método de los límites no proporcione la el concepto de un umbral, ¿o son los dos métodos equivalentes
mejor definición de umbrales sensoriales, tiene muchos usos en lo que se refiere a la definición operativa?
prácticos, especialmente para la determinación de umbrales de
diferencia. Los efectos sensoriales de los aromatizantes 3. Calcule d' para los siguientes pares de tasas de aciertos y falsas
alimentarios suelen determinarse de esta manera. Vea si puede alarmas: (0,90, 0,10), (0,90, 0,25), (0,90, 0,50), (0,90, 0,90).
pensar en usos prácticos adicionales del método de los límites.
Una breve búsqueda bibliográfica en un 4. ¿Cuál es la diferencia entre una trilla absoluta
revista como Ergonomics puede ser de utilidad. edad y un umbral de decisión?

2. ¿El método de los límites o el método de la escalera 5. Da dos ejemplos de cada tipo de medida .
ofrecen una mejor definición operativa de escala.
CONEXIONES WEB
Los escritos originales de Fechner se pueden encontrar en:
http://www.yorku.ca/dept/psych/classics/index.htm
Los enlaces a los recursos psicofísicos están en:

http://www.psy.ulaval.ca/~ispp/Library/links.html
Ley de Weber
Este proyecto examina la ley de Weber utilizando una variante del método de los límites para calcular el
umbral de diferencia para la pesadez. Para este proyecto, su aparato y materiales serán recipientes, algunas
pesas para colocar en los recipientes y una balanza. Los recipientes pueden ser vasos para beber, latas de
aluminio o cartones de leche. Puede usar monedas, arena o un material similar para el peso. Para pesar tus
materiales, una báscula postal o una báscula de cocina
59533_07_ch06_p151-179.indd 178 9533_07_ch06_p151-179.indd 178 3/5/08 /5/08

debe ser satisfactoria. Use un rango moderado de pesos, digamos, desde alrededor de 5 onzas hasta
alrededor de 24 onzas.
A continuación se sugiere un procedimiento. Llene un recipiente hasta un octavo de su capacidad
y agregue un poco más a otro. Pídele a un amigo que los levante y te diga cuál pesa más. Al principio,
su sujeto le dirá que tienen el mismo peso. Sigue agregando material al contenedor más pesado hasta
que tu amigo pueda decir cuál es más pesado. No dejes que tu amigo te vea llenando el contenedor
más pesado, que no siempre se debe levantar con la misma mano.
Una vez que se determina el contenedor más pesado, se convierte en el nuevo estímulo estándar
y debe hacer una nueva comparación ligeramente más pesada. Agregue material a un nuevo
contenedor después de cada juicio de peso de su amigo hasta que sea perceptiblemente más pesado
que el contenedor estándar. Siga repitiendo este procedimiento con nuevos recipientes de comparación
hasta que el último recipiente esté casi completamente lleno. Ahora, pesa cada uno de los contenedores
y observa las diferencias de peso entre los contenedores adyacentes.
Debe encontrar que agregar una cantidad constante de material no es suficiente para producir
una diferencia notable. Aunque la cantidad x es suficiente para distinguir los dos primeros contenedores,
se requieren cantidades mayores que x para diferenciar los contenedores más adelante en la serie.
Debe encontrar que se requiere un porcentaje constante del peso de un contenedor antes de que el
próximo contenedor parezca más pesado. Este porcentaje se llama fracción de Weber.
La ley de Weber establece: El umbral de diferencia dividido por la magnitud del estímulo es igual
a una constante ( I/I = K). La ley de Weber por lo general no se cumple para valores extremos de la
magnitud del estímulo. Por lo tanto, si repitiera su experimento con ladrillos o una pequeña cantidad
de sujetapapeles en lugar de objetos que pesaran varias onzas, no obtendría resultados que siguieran
la ley de Weber. La fracción de Weber también difiere para diferentes individuos y para diferentes
tareas, como juzgar la longitud de la línea en lugar del peso. Podría intentar verificar estas
características de la ley de Weber. ÿ
59533_07_ch06_p151-179.indd 179 9533_07_ch06_p151-179.indd 179 3/5/08 /5/08

CAPÍTULO 7
PERCEPCIÓN
PROBLEMAS DE PERCEPCIÓN
Percepción Directa e Indirecta
Conciencia y percepción
Variables de control
7.1 TEMAS EXPERIMENTALES E INVESTIGACIÓN

ILUSTRACIONES
Informe Verbal: Percepción sin Conciencia
ILUSTRACIONES
Operaciones Convergentes: Percepción sin Conciencia y
Percepción con Conciencia Explícita
La ilusión del color y la distancia
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
RECURSO DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: EL EFECTO STROOP
59533_08_ch07_p180-206.indd 180 9533_08_ch07_p180-206.indd 180 3/5/08 /5/08

El descubrimiento consiste en ver lo que todos han visto y pensar lo que nadie ha
pensado. (ALBERT SZENT-GYÖRGY)
Imagine que en realidad está viendo la ciudad de Ålesund, Noruega, desde el ángulo de la
cámara que produjo la Figura 7.1 en la página 182. En la forma estándar de conceptualizar el
proceso receptivo visual de tal escena, primero detecta la presencia de objetos; entonces, esta
sensación proporciona los elementos necesarios para tu percepción del pueblo. De acuerdo
con este enfoque, la percepción es la interpretación y el reconocimiento de los objetos y eventos
que percibimos. Esta sencilla e intuitivamente atractiva teoría de la percepción proporciona los
antecedentes para la mayoría de los problemas teóricos y metodológicos a los que se enfrentan
los psicólogos interesados en estudiar la percepción. (Para obtener detalles adicionales sobre
los problemas, consulte Coren, Ward y Enns, 1994).
ÿ PROBLEMAS DE PERCEPCIÓN
Un conjunto de problemas tiene que ver con la forma en que el observador usa la información
sensorial para hacer interpretaciones perceptivas. Observe de nuevo la figura 7.1. Si realmente
estuviera viendo Ålesund, percibiría las montañas más lejos que los edificios en primer plano.
Esta percepción natural e inequívoca es el resultado de varias señales que brindan información
sobre la distancia y la profundidad de los objetos en la escena. ¿Cómo entran en la percepción?
Percepción Directa e Indirecta

El enfoque directo de la percepción (Gibson, 1979) argumenta que las señales generalmente
confiables en el conjunto óptico de una escena brindan información directa sobre la profundidad
y la distancia. La visión directa supone que el perceptor recoge la información que le proporciona
el entorno de forma natural y sin reflexionar sobre él, lo que ha llevado a muchos a llamar a
este enfoque ecológico (Norman, 2002). Por el contrario, el enfoque indirecto de la percepción
argumenta que nuestros juicios de profundidad se hacen sobre la base de nuestra experiencia
pasada con las claves de profundidad (Gregory, 1970).
Según el enfoque indirecto, construimos la escena para producir una percepción de
profundidad y distancia. Estos procesos de percepción han llevado a algunos a llamarlo enfoque
constructivista (Norman, 2002). Los puntos de vista directos e indirectos de la percepción se
han debatido al menos desde mediados del siglo XIX, cuando von Helmholtz (ver von Helmholtz,
1962, para una traducción moderna) defendió una teoría empírica de la percepción. Pensó que
todo nuestro conocimiento de la percepción visual era el resultado de nuestras experiencias
visuales pasadas. Cuando nos enfrentamos a una nueva escena visual, como la de la figura
7.1, la interpretamos infiriendo que las señales de perspectiva que percibimos significan
profundidad.
Estas inferencias inconscientes, como las llamó von Helmholtz, ocurren rápidamente y
sin pensamiento consciente: las inferencias son un hábito visual. La teoría empírica a menudo
se contrasta con una versión de la percepción directa llamada teoría nativista. De acuerdo a
59533_08_ch07_p180-206.indd 181 9533_08_ch07_p180-206.indd 181 3/5/08 /5/08

Kantowitz,
Barry
texto
1983
ojo
©de
ÿ FIGURA 7.1
Una vista de la ciudad de Ålesund, Noruega.
para la visión nativista, la naturaleza del sistema visual (el ojo y el cerebro) determina la percepción
visual. Un ejemplo de un enfoque nativista de la percepción es la teoría de la Gestalt, que se
analiza en el Apéndice A.
En la psicología cognitiva contemporánea, la controversia directo/indirecto se describe a
menudo como un contraste entre el procesamiento perceptivo de abajo hacia arriba y de arriba
hacia abajo. La vista de abajo hacia arriba enfatiza el papel de los datos sensoriales en la
determinación de la percepción, y el enfoque de arriba hacia abajo enfatiza el papel de los
conceptos previamente establecidos en la determinación de las percepciones. Debido a estos
contrastes, también verá los dos aspectos de la percepción etiquetados como una distinción entre
el procesamiento basado en datos (el énfasis de abajo hacia arriba) y el procesamiento
basado en conceptos (el énfasis de arriba hacia abajo). Con respecto a la fotografía de Ålesund
(Figura 7.1), el análisis ascendente se centra en el gradiente de textura que parece retroceder en
la distancia hacia las montañas del fondo. Dado que esta textura que retrocede es un componente
de la profundidad y la distancia en nuestro mundo tridimensional, vemos directamente que la
imagen contiene profundidad. El enfoque indirecto o de arriba hacia abajo proporciona una
interpretación alternativa de su percepción de Ålesund. La interpretación desde la posición de
arriba hacia abajo afirma que su percepción de profundidad y distancia en una fotografía es una ilusión
Una ilusión es una percepción equivocada o distorsionada. ¿Por qué su percepción de estas
cualidades en la fotografía de Ålesund es una ilusión? Los pequeños edificios cerca de la parte
superior de la fotografía podrían ser edificios en miniatura, o podrían estar más lejos que los
grandes edificios en la parte inferior. Sin embargo, en la fotografía, ambos conjuntos de edificios
están a la misma distancia de usted (suponiendo que sus ojos y el plano de la imagen sean paralelos).
Sobre la base de su experiencia pasada con pequeños edificios distantes de usted, confiere
señales de profundidad ilusorias a la representación fotográfica bidimensional de Ålesund. Esta
interpretación de la profundidad conduce a una percepción tridimensional. Como no hay
profundidad real en la fotografía bidimensional, la profundidad y la distancia que
59533_08_ch07_p180-206.indd 182 9533_08_ch07_p180-206.indd 182 3/5/08 /5/08

percibir se puede atribuir a un proceso indirecto resultante de nuestra interpretación de las señales
(ilusorias) de la escena.
La mayoría de las percepciones involucran una interacción compleja entre factores directos e
indirectos (o procesos ascendentes y descendentes), y muchas teorías contemporáneas enfatizan esa
interacción. Por ejemplo, Norman (2002) sugiere que en lugar de asumir que representan tipos de
percepción completamente diferentes, puede tener sentido considerar que los procesos directos e indirectos
trabajan juntos para dar como resultado una experiencia perceptiva.
Más adelante veremos un ejemplo particular de cómo puede funcionar esto.
Conciencia y Percepción
Si el perceptor agrega significado e interpretación a las sensaciones, surge la pregunta de si estas
adiciones resultan de una deliberación consciente. El tema controvertido de la percepción que destacamos
en este capítulo se refiere al papel de la conciencia en la percepción. La esencia del problema de la
conciencia es esta pregunta: ¿Se pueden aplicar significados e interpretaciones a los datos de los sentidos
automáticamente, sin que seamos verbalmente conscientes de ellos, o es la conciencia verbal una parte
necesaria de la percepción? Von Helmholtz, recordará, argumentó que nuestras inferencias y conclusiones
son inconscientes.
Sin embargo, la percepción tiene que ver con la experiencia personal de un evento, y muchas
investigaciones sobre la percepción han intentado comprender la naturaleza de esta experiencia fenoménica
(Kaufman, 1974). Después de todo, continúa el argumento, si la percepción incluye una experiencia o un
sentimiento de “algo”, entonces debemos ser conscientes de ese “algo”. Se está llevando a cabo una
cantidad sustancial de investigación para determinar la relación entre la conciencia y la percepción. Como
era de esperar, el estudio de un proceso privado como la conciencia (ver Apéndice A) está plagado de
numerosos problemas metodológicos. Examinamos algunos de estos problemas en este capítulo. Para
preparar el escenario para nuestro examen, primero consideramos un estudio de caso neuropsicológico
notable, el paciente DB
Blindsight: Detección sin conciencia DB es un inglés de unos 50 años.

Excepto por el problema neuropsicológico particular que tiene, la vida de DB (médica, social y
psicológicamente) puede describirse como ordinaria o típica. Lo que sigue es un resumen de un estudio
de caso detallado resultante de un examen intensivo de DB durante un período de 13 años (Weiskrantz,
1986). El estudio se reinició recientemente (Weiskrantz, 2002).
Cuando DB tenía alrededor de 14 años, comenzó a experimentar violentos dolores de cabeza cada 6
semanas, acompañados de un óvalo temporal de ceguera en la parte izquierda de su campo visual.
Cuando tenía poco más de 20 años, los ataques aumentaron en frecuencia y una ceguera parcial
permaneció de forma permanente después de uno de los ataques de dolor de cabeza. Un angiograma,
que es una imagen de rayos X de la cabeza tomada después de inyectar una sustancia opaca en el torrente
sanguíneo, reveló una masa de vasos sanguíneos agrandados en la punta de la corteza visual en el lado
derecho del cerebro. Esta parte visual del cerebro y los vasos sanguíneos distorsionados se extirparon
quirúrgicamente. Inmediatamente, sus ataques de dolor de cabeza cesaron y DB pudo llevar una vida
razonablemente normal y productiva. Sin embargo, después de la operación, DB quedó ciego en la mitad
izquierda de su campo visual.
La razón por la que DB estaba ciego en la mitad izquierda de su campo visual se puede determinar a
partir de la figura 7.2. La corteza visual derecha contiene la información en el campo visual izquierdo,
59533_08_ch07_p180-206.indd 183 9533_08_ch07_p180-206.indd 183 3/5/08 /5/08

ÿ FIGURA 7.2 Punto de fijación
Una vista superior simplificada de

Campo visual izquierdo Campo visual derecho
los ojos y el cerebro que muestra
cómo se representan los campos
visuales derecho e izquierdo en la
corteza visual en la parte posterior
del cerebro. El campo visual
izquierdo está representado en la
corteza visual derecha, y el campo
visual derecho está representado en
la corteza visual izquierda. Debido a
que el sitio de la operación de DB
estaba en la corteza visual derecha,
estaba ciego en el campo visual izquierdo.
Izquierda
Derecha
Hemisferio Hemisferio
Corteza visual izquierda Corteza visual derecha

(Campo visual derecho) Sitio de DB (Campo visual izquierdo)
Operación
y la corteza visual izquierda contiene la información en el campo visual derecho. Dado que a DB le
extirparon quirúrgicamente una gran parte de su corteza visual derecha para eliminar los dolores
de cabeza, el campo visual izquierdo no tenía la misma representación en el cerebro que el campo
visual derecho.
La ceguera de DB se determinó mediante un procedimiento llamado perimetría dinámica,
que es la forma estándar de evaluar los defectos del campo visual después de un accidente o una
cirugía. El procedimiento es una variante del método ascendente de ensayos de límites (ver Capítulo 6).
Con la cabeza del paciente inmóvil, se mueve lentamente un punto de luz a través del campo visual
de un ojo, comenzando en el perímetro. Cuando el paciente ve la luz, se la devuelve al perímetro y
se la lleva de nuevo a través del campo desde un ángulo diferente.
Este procedimiento se repite varias veces y da como resultado un mapa de áreas sensibles y
ciegas en el campo visual. Luego se repite la perimetría en el otro ojo. La parte ciega del campo
visual se llama escotoma; DB tenía un escotoma en la mitad izquierda del campo visual de cada
ojo.
Hasta ahora, esta ceguera, aunque desafortunada, era la esperada, dado que se había
extirpado tejido cerebral de la corteza visual derecha. Sin embargo, algunas observaciones
informales parecían mostrar que DB podía localizar objetos en su campo ciego. Por ejemplo, podía
alcanzar con precisión la mano extendida de una persona, aunque no pudiera verla.
59533_08_ch07_p180-206.indd 184 9533_08_ch07_p180-206.indd 184 3/5/08 /5/08

Además, pudo adivinar correctamente la orientación (horizontal o vertical) de un palo que, según él,
no podía ver. De hecho, DB negó vehementemente haber visto algo en una parte de su campo
visual izquierdo y atribuyó su éxito en estas tareas informales a conjeturas afortunadas.
Suponga que usted fuera Weiskrantz, el psicólogo que observó este extraño comportamiento.
¿Qué concluirías? Por un lado, DB estaba ciego. No informó haber visto estímulos en su campo
visual izquierdo. Por otro lado, el comportamiento de DB indicaba que podía detectar y localizar
estímulos en la misma zona. Weiskrantz y sus asociados creyeron en el informe verbal de DB de
que no podía ver objetos en su campo visual izquierdo, por lo que llevaron a cabo una serie de
experimentos controlados para determinar la capacidad visual del escotoma de DB.
Dado que DB no podía ver objetos en el campo ciego, se le pidió que hiciera conjeturas de
elección forzada sobre la ubicación y la presencia o ausencia de pequeños parches de luz. Otras
pruebas requerían que adivinara la orientación de líneas muy pequeñas. Todas las pruebas se
realizaron en condiciones de iluminación controlada y la cabeza y la dirección de la mirada de DB
se mantuvieron fijas. A veces, los estímulos visuales se presentaban tan brevemente en el área
ciega que DB no podía mover los ojos lo suficientemente rápido como para cambiar su enfoque
hacia el buen campo visual. Los estímulos de líneas y puntos eran pequeños y no muy intensos,
pero su tamaño e intensidad pueden haber infl uido tanto en los buenos como en los malos campos
visuales simultáneamente. Por lo tanto, la detección de estos objetivos en el campo visual ciego se
comparó con la detección en el campo bueno y en el punto ciego.
Todo el mundo tiene un punto ciego en cada ojo. Es la parte de la retina donde los nervios
salen del globo ocular y por lo tanto es insensible a la luz. Si DB pudiera detectar un objetivo en su
punto ciego, significaría que el objetivo era tan intenso o tan grande que se "filtró" a áreas sensibles
del ojo. Dado que el punto ciego era mucho más pequeño que el campo de ceguera de DB y dado
que no podía detectar objetivos en su punto ciego, Weiskrantz había elegido estímulos objetivo con
características apropiadas para probar en el campo ciego.
Weiskrantz luego le presentó a DB puntos y líneas de orientación horizontal o vertical. Los
resultados de las pruebas controladas fueron muy interesantes. La localización, detección y
adivinación de la orientación de los objetivos presentados al campo ciego fueron mucho mejores de
lo que podría esperarse por casualidad. En muchos casos, el rendimiento visual del campo ciego
fue casi tan bueno como el del campo visual bueno. D.
B. no pudo identificar los objetos presentados a su campo ciego, y durante la prueba afirmó no ver
los objetivos para los que se le pidió que hiciera juicios de elección forzada. La reacción de DB a su
éxito en las pruebas de elección forzada fue de incredulidad. Atribuyó su éxito a conjeturas
afortunadas, porque simplemente no podía ver los estímulos objetivo.
Blindsight es el nombre que Weiskrantz usó para describir la capacidad visual en un escotoma
(el campo ciego) cuando no hay una conciencia reconocida de percepción. Esto parece un fenómeno
muy extraño, pero Weiskrantz y sus asociados (p. ej., Weiskrantz, 1997; Weiskrantz, Cowey y
LeMare, 1998) informan sobre otro paciente con visión ciega, GY, similar en etiología y
comportamiento a DB. Además, la generalidad de la disociación entre la conciencia verbal y la
capacidad de percepción no son el problema, porque otros estudios neuropsicológicos han
demostrado que diferentes tipos de daño cerebral pueden provocar trastornos similares a la vista
ciega. Por ejemplo, Paillard y asociados (1983) informan del caso de una mujer con lesión cerebral
que no era sensible al tacto en el lado derecho de su cuerpo; sin embargo, cuando se le pidió que
localizara dónde había sido tocada en su lado insensible, pudo hacerlo con considerable precisión.
ella también podría
59533_08_ch07_p180-206.indd 185 9533_08_ch07_p180-206.indd 185 3/5/08 /5/08

adivinar correctamente la dirección del movimiento en su piel, aunque no podía sentir el
estímulo en movimiento. Además, como pronto veremos, se puede inducir a las personas
sin daño cerebral a mostrar una disociación similar entre la conciencia y el comportamiento
perceptivo en condiciones de laboratorio controladas. El problema, entonces, es tratar de
comprender la relación entre los informes verbales de conciencia y percepción.
La investigación actual sobre la visión sugiere que hay dos tipos de sistemas visuales
en el cerebro: uno es importante para identificar objetos y el otro sistema tiene que ver con
la detección y el movimiento. Aparentemente, el problema que sufrió DB fue que el sistema
relacionado con la identificación fue destruido durante la operación realizada para curar sus
dolores de cabeza.
Variables dependientes dividiremos las variables dependientes en aquellas que

pueden ser verificadas inmediatamente (juzgadas como
La variable dependiente más simple es la descripción verbal correctas o incorrectas) por el experimentador y aquellas que
dada por un observador. Aunque esta es la medida más fácil no.
de obtener, a menudo tiene varias desventajas. Un observador
no entrenado rara vez es capaz de dar un informe preciso. Variables independientes
Aunque esto se puede corregir con un entrenamiento
adecuado, siempre existe la posibilidad de que el Como era de esperar, las variables independientes que son
entrenamiento, más que el estímulo, esté controlando el más comunes en los estudios de percepción son aquellas
informe del observador. que alteran las características físicas de los estímulos. Los
Volveremos a las propiedades de los informes psicólogos cambian el tamaño, la forma, los fondos, la
subjetivos en la siguiente sección. Las medidas de perspectiva y el ángulo de visión de los estímulos visuales.
percepción más objetivas incluyen el tiempo de reacción y Los estímulos auditivos se pueden variar según la frecuencia
los informes que pueden ser verificados directamente por el (tono), la intensidad (sonoridad), la forma de onda (timbre) y
experimentador. Por ejemplo, si se presenta una cadena de la complejidad (número de formas de onda separadas y su
seis letras en un taquistoscopio (un dispositivo para relación entre sí). El curso temporal de la percepción se
controlar la iluminación y la duración de los estímulos) estudia presentando partes de un estímulo separadas por
durante 50 milisegundos (ms) y se le pide al observador que breves intervalos de tiempo o limitando el tiempo de
informe las letras, el experimentador puede determinar presentación de todo el estímulo a decenas o cientos de
fácilmente si esto informe es correcto. A menudo se pide a milisegundos.
los observadores que califiquen su confianza en que su
informe es correcto.
Tales medidas de calificación, aunque no son objetivas, Otra clase de variables independientes perceptivas es
pueden proporcionar operaciones convergentes cuando se más cualitativa que cuantitativa. Los animales y las personas
usan con otras medidas objetivas, como el tiempo de reacción. han sido colocados en circunstancias anormales en las que
las entradas perceptivas habituales están ausentes o muy
Como puede ver, la dimensión principal para clasificar distorsionadas. Algunos ejemplos de este tipo de manipulación
las variables dependientes en la percepción es la serían criar animales en la oscuridad, hacer que las personas
verificabilidad. Por supuesto, todas las variables dependientes usen gafas especiales que distorsionan su visión, permitiendo
deben ser verificables y consistentes. Sin embargo, algunas la percepción normal pero impidiendo los movimientos
variables dependientes se pueden verificar directamente, motores, y tener un campo visual uniforme sin
mientras que otras requieren métodos estadísticos sutiles,
como el escalamiento, antes de que se pueda lograr la verificación. Asi que
59533_08_ch07_p180-206.indd 186 9533_08_ch07_p180-206.indd 186 3/5/08 /5/08

patrones o líneas. Muchos de estos estudios intentan objetos relacionados con la comida con más frecuencia que
determinar si la percepción se aprende como cualquier otra las personas que han comido recientemente. Aunque estos
conducta o si es innata. En un momento, la distinción entre fenómenos son interesantes por derecho propio, cuando nos
percepción innata y aprendida fue una gran controversia en enfocamos en el estímulo como el determinante más
psicología. Ahora, como se señaló anteriormente, la mayoría importante de la percepción, estos otros efectos se convierten
de los psicólogos admiten que hay componentes innatos y en artefactos y deben ser controlados. En términos de la
aprendidos en la percepción. teoría de la detección de señales (ver Capítulo 6), los aspectos
de decisión de la percepción deben mantenerse constantes.
Informar sobre una palabra tabú requiere una mayor duración
Variables de control de la visualización no porque la palabra sea más difícil de
percibir, sino porque los observadores son más reacios a
Este capítulo se ocupa de lo que podría denominarse los decir una palabra tabú al experimentador y, por lo tanto,
aspectos intelectuales de la percepción; sin embargo, la alterar su criterio de decisión (Zajonc, 1962).
percepción tiene aspectos emocionales y motivacionales, que
también discutiremos. También se deben controlar los aspectos físicos del
Por lo tanto, cuando se les pide a las personas que informen estímulo que no se están investigando.
sobre palabras tabú de cuatro letras, estas palabras requieren Las características más importantes que deben mantenerse
una mayor duración de visualización que las palabras de constantes cuando no son variables independientes incluyen
control inocentes. De manera similar, cuando las personas la duración del estímulo, la intensidad, la iluminación, el
contraste y similares.
hambrientas observan una imagen desenfocada, informan haber visto
Informe verbal del tema

Ilustración Percepción sin conciencia
Un aspecto convincente de la investigación sobre la percepción es que las variables dependientes
parecen proporcionar una idea de la experiencia fenomenológica del observador, que es la
conciencia interna del mundo externo. Esta intuición parece especialmente fuerte cuando se
obtiene un informe verbal de un observador. Parece evidente que el informe verbal, o lo que el
observador dice que se percibe, debe estar correlacionado con su conocimiento de la experiencia.
Sin embargo, cuando se obtiene un informe verbal, el psicólogo debe determinar si el informe
verbal es una variable dependiente útil que proporcione un indicador fiable y válido de la
experiencia del observador.
Reconsidere la discusión de la psicofísica en el capítulo anterior. Una forma de ver la
dificultad de establecer un verdadero umbral por el método de los límites es que lo que el sujeto
informa no está únicamente en función de lo que percibe. La evidencia y la disposición a
responder del sujeto se combinan para determinar el umbral de decisión; esta es la razón por la
que se desarrollaron métodos de detección de señales.
Es probable que los psicólogos acepten la mayoría de los informes de la investigación
psicofísica como indicadores válidos de la experiencia fenomenológica por dos razones. En
primer lugar, d' y puede determinarse en condiciones apropiadas. En segundo lugar, la mayoría
de las personas reportan aproximadamente las mismas fluctuaciones en la experiencia cuando
varían los estímulos externos. La generalidad y regularidad de los resultados aumentan nuestra
confianza en la utilidad de los informes verbales que se dan en tales experimentos.
59533_08_ch07_p180-206.indd 187 9533_08_ch07_p180-206.indd 187 3/5/08 /5/08

Por esta última razón, se aceptan los informes verbales que se producen durante la estimación
de la magnitud (ver Capítulo 6). Si una banda de rock aumenta su amplificación por un factor de 10 y
usted informa que luego suena el doble de fuerte, el psicólogo no tiene control directo sobre su
experiencia fenomenológica. Sin embargo, el hecho de que la mayoría de los observadores respondan
de manera similar a los cambios en la energía del estímulo sugiere que el informe verbal tiene cierta
generalidad y, por lo tanto, representa una forma válida de evaluar la experiencia perceptiva del observado
A veces es muy difícil decidir sobre la utilidad de un informe verbal. Imagina que te enfrentas a
una mujer que afirma ver personitas verdes de Marte. ¿De verdad ve a las personitas verdes? Dado
que usted y varios otros no ven a estas personas, y dado que es muy improbable que haya vida
similar a la humana (de cualquier color) en Marte, es probable que asuma que la mujer está demente,
está alucinando. Una alucinación es el informe de una experiencia sin ningún estímulo aparente
correspondiente.
Suponiendo que la mujer no está mintiendo, ¿qué vamos a hacer con su informe verbal de que
ve personitas verdes de Marte? A diferencia de la situación en un experimento psicológico, en este
caso hay una discrepancia dramática entre el estímulo (ninguno o uno irrelevante) y el informe verbal
de la experiencia (personas verdes). Un psicólogo interesado en la percepción podría no creer que su
informe verbal coincide con una experiencia perceptiva. Esto no niega que la mujer esté realmente
experimentando a las personitas verdes. Pero es poco probable que su experiencia sea producto de
la percepción; más bien, probablemente resulta de una patología mental o de la infl uencia de las
drogas.
Ahora, reconsidere el caso de DB. ¿Qué debemos concluir de su informe verbal, "No puedo ver
los objetos"? Su informe verbal no coincidía con su comportamiento ante la presencia de algunos
tipos de estímulos. ¿Tenía DB una especie de alucinación negativa (no ver algo que realmente estaba
allí y era detectable), o su informe verbal era un reflejo exacto de su experiencia perceptiva? ¿Cómo
decidimos sobre la utilidad de un informe? El informe verbal de DB fue problemático para la
comprensión de sus percepciones, porque desde el punto de vista del experimentador, había una
discrepancia obvia entre la presencia o ausencia de un estímulo y el informe de DB sobre su
experiencia perceptiva (Weiskrantz, 1986). Esta discrepancia parece ser diferente de la falta de
verificación directa que se observa en los experimentos de escalado, porque no identificar un objeto
mientras se localiza con precisión representa una paradoja.
¿Cómo sabe el psicólogo cuándo la respuesta del observador califica como una variable
dependiente útil? La respuesta es engañosamente simple: califica solo cuando se puede inferir
directamente una relación verificable entre la respuesta y un evento perceptivo anterior. Natsoulas
(1967) definió un informe como una relación supuesta o confirmada entre algún evento precedente o
sincrónico (ei) y la respuesta. Esta relación debe ser tal que haga posible inferencias directas a partir
del conocimiento de la respuesta a ei (p. 250).
Esta definición es deliberadamente abstracta y tendrá más sentido una vez que hayamos
examinado otro ejemplo concreto.
En el capítulo anterior, discutimos cómo se podría entrenar a una paloma para que nos diga su
umbral visual absoluto (Blough, 1958). Recordarás que la paloma picoteó una tecla cuando vio el
estímulo y otra tecla cuando no lo vio. Las contingencias de refuerzo apropiadas aseguraron que el
comportamiento de la paloma fuera controlado por el estímulo. De acuerdo con la definición que
acabamos de dar, ¿las respuestas de picoteo de la paloma califican como informes?
En este caso, el evento precedente (ei) es el estímulo, con particular referencia a su intensidad.
Un picotazo en una tecla indica que el estímulo está por debajo del umbral,
59533_08_ch07_p180-206.indd 188 9533_08_ch07_p180-206.indd 188 3/5/08 /5/08

mientras que un picotazo en el otro muestra que la paloma puede ver el estímulo. Esta relación
es la inferencia directa requerida en la definición. Conocer la respuesta, es decir, qué tecla se
pulsa, permite una inferencia directa sobre si la paloma puede ver el estímulo. Debemos concluir,
por lo tanto, que las respuestas de picoteo sí califican como informes.
La característica esencial de un informe adecuado de una percepción es la relación entre

ésta y el evento perceptivo precedente. En la medida en que se pueden proponer relaciones
alternas o inferencias, el informe se debilita. Por ejemplo, si Blough no hubiera tenido cuidado de
eliminar la posibilidad de que la paloma aprendiera a cambiar de tecla solo después de una larga
serie de picotazos en una sola tecla, esta relación alternativa también podría haber explicado el
comportamiento de picoteo. En ese caso, el picoteo no se podría haber interpretado correctamente
como un informe perceptivo.
El ejemplo del picoteo también ilustra la falta de importancia de la naturaleza cualitativa del
informe. Una pulsación de tecla es tan buena como una declaración verbal de que el estímulo se
ve o no. Las declaraciones verbales pueden ser respuestas a estímulos, en lugar de no verificadas.
informes capaces. Es sólo la relación entre el evento anterior y el informe lo que debe considerarse
para establecer si una respuesta es una variable dependiente adecuada. El hecho de que una
declaración sea verbal no garantiza que también sea un informe.
Ahora podemos considerar el caso de DB de una manera ligeramente diferente. Sus dos
clases de informes perceptuales, el verbal y el de detección/localización, están en conflicto. La
dificultad para comprender este conflicto surge por dos razones. Primero, los humanos tienden a
poner mucho énfasis en los informes verbales como indicadores de la experiencia fenomenológica.
Así, el informe verbal debe ser el “correcto”, a pesar de los casos de la mujer demente y las
palomas de Blough. En segundo lugar, la gente supone incorrectamente que todos los informes
perceptivos tendrán el mismo evento sincrónico precedente. Es lógicamente posible (y
empíricamente probable, como pronto descubriremos) que la ei de un informe verbal sea diferente
de la ei asociada con otros indicadores de la experiencia perceptiva. Un informe puede indicar
una experiencia perceptual y otro puede no hacerlo.
El trabajo más reciente de Weiskrantz (2002) con DB apunta de manera importante a la ie

enfoque para comprender la percepción. Un comentario improvisado de DB a Weiskrantz condujo
a un descubrimiento notable. Después de demostrar que no podía detectar rejillas (líneas
paralelas) pero podía adivinar su orientación correctamente, DB comentó que podía ver las rejillas
después de cerrar los ojos. ¿Fue esto una alucinación? No, fue una imagen secundaria. Una
imagen residual surge después de mirar un estímulo visual, generalmente durante varios
segundos. Después de que se elimina el estímulo, inicialmente hay una imagen posterior
positiva que es similar en brillo y color al estímulo original (Woodworth y Schlosberg, 1954).
Después de un breve período, la imagen residual positiva generalmente se convierte en una
imagen residual negativa, que es opuesta en brillo y complementaria en color (un estímulo rojo
aparece verde en la imagen residual negativa). Lo que DB afirmó fue que percibió una imagen
secundaria negativa de las líneas negras de las rejillas que no podía ver. Esta posibilidad
fascinante es simplemente un informe verbal hasta que podamos verificar la posible ei. Las
pruebas sistemáticas proporcionaron la información necesaria para concluir que la imagen residual
de DB era un fenómeno real.
DB demostró imágenes secundarias de colores complementarios e imágenes secundarias
de rejilla con orientaciones apropiadas. Aunque no podía distinguir visualmente un círculo de un
cuadrado, DB fue perfecto para distinguir esos objetos en sus imágenes secundarias.
59533_08_ch07_p180-206.indd 189 9533_08_ch07_p180-206.indd 189 3/5/08 /5/08

El tamaño de las imágenes posteriores de DB variaba directamente con la distancia desde la superficie en la
que se veían las imágenes, lo cual es cierto para las imágenes posteriores de personas con visión normal,
incluido DB en su campo visual (Weiskrantz, 2002). La proporcionalidad del tamaño de la imagen residual y la
distancia de visualización se denomina ley de Emmert. ¿Entonces, qué significa todo esto?
DB tuvo efectos secundarios conscientes a las percepciones no conscientes de los estímulos externos.
Las imágenes posteriores fueron confiables y se comportaron de manera legal, por lo que pueden considerarse
eventos sincrónicos (Natsoulas, 1967). Weiskrantz llama a las inusuales imágenes secundarias de DB vista
principal para distinguirlas de la vista ciega. Ambas "visiones" pueden forzar la credulidad, pero son
percepciones de acuerdo con nuestro análisis de eventos sincrónicos.
¿Son estas meras curiosidades de la percepción con poca relevancia para la percepción "real"?
No lo creemos, porque ahora examinaremos cómo se puede estudiar la percepción sin conciencia verbal en
participantes de investigación ordinarios. Lo que debe hacerse es determinar los indicadores de la experiencia
perceptual en ausencia de informes verbales de esa experiencia.
Falta de conciencia verbal

El tema de la percepción sin conciencia ha tenido una larga y controvertida historia (Eriksen, 1960). Marcel
(1983) revivió la controversia cuando informó los resultados de una serie de experimentos que parecían mostrar
la percepción del significado en ausencia de conciencia verbal. Los estudiantes universitarios normales que
participaron en la investigación de Marcel se comportaron de manera muy parecida a DB. Afirmaron que no
podían percibir una palabra, pero su comportamiento indicaba que eran sensibles al significado de la palabra
no percibida.
En uno de sus experimentos, Marcel combinó varias técnicas de investigación diferentes.
Su tarea básica era una variante del efecto Stroop, llamado así por Stroop (1935), quien fue el primero en
informar sobre el fenómeno. Una tarea Stroop estándar funciona de la siguiente manera. El participante ve una
lista de palabras y se supone que debe nombrar rápidamente el color de tinta de cada palabra. En comparación
con nombrar el color de la tinta de una palabra neutra que no está relacionada con el color (como casa en tinta
roja), la denominación del color es más lenta cuando la palabra y el color de la tinta entran en conflicto (rojo
impreso en tinta azul) y más rápida cuando la palabra y la tinta están en conflicto. color son congruentes (verde
en tinta verde). La denominación de color más lenta o más rápida en condiciones de confl icto palabra/color o
congruencia defi ne el efecto Stroop.
Marcel modificó el procedimiento de Stroop utilizando una forma de cebado. El cebado ocurre cuando
una palabra u otro evento perceptivo sesga al observador para percibir un evento posterior de una manera
particular. Ver la palabra rojo impresa en tinta negra podría hacer que pienses en el color rojo, al igual que el
viejo chiste "No pienses en un elefante" te hace pensar en un elefante. Por lo tanto, si la palabra rojo lo había
preparado para pensar en el color rojo, un color posterior, como el verde, podría ser inesperado y se produciría
un conflicto similar al de Stroop. En el experimento de Marcel, se presentaba una palabra básica (por ejemplo,
rojo) justo antes de una mancha de color (por ejemplo, verde), y el sujeto debía indicar rápidamente el color de
la mancha de color (el observador debería decir "verde" ). Si la imprimación funciona para producir un efecto
Stroop, entonces, en comparación con una prima de palabra neutra como casa, una prima de palabra congruente
(verde) debería acelerar la denominación de color de un parche de color verde, y una prima de palabra de color
incongruente (rojo) debería ralentizar la denominación de color de verde. Eso es lo que encontró Marcel.
En la prueba de preparación de Stroop, Marcel empleó una técnica inteligente para manipular la conciencia
de los observadores sobre la palabra de preparación. Impidió la percepción de la palabra primaria en algunos
ensayos mediante un procedimiento llamado enmascaramiento. El enmascaramiento, en este contexto, implica
59533_08_ch07_p180-206.indd 190 9533_08_ch07_p180-206.indd 190 3/5/08 /5/08

presentando un patrón desordenado de letras inmediatamente después del inicio de una palabra primaria.
La máscara impedirá la detección e identificación de la palabra cuando sigue inmediatamente a la palabra;
a medida que aumenta el intervalo entre la palabra y la máscara, también aumentan la detección y la
identificación precisa de la palabra. Un primo efectivamente enmascarado no debe ser notificado por el
observador, porque él o ella no puede detectar o identificar el primo. Marcel razonó que si la percepción
puede ocurrir sin conciencia, entonces una máscara efectiva no debería eliminar el efecto Stroop inducido
por el cebador. Independientemente de si los sujetos son conscientes del primo, su denominación de
colores debe ser sensible a él, si la percepción del significado no depende de la conciencia verbal.
Alternativamente, si la conciencia es necesaria para la percepción del significado, enmascarar el primer
debería eliminar el efecto Stroop.
El procedimiento de Marcel para parte de uno de sus experimentos se describe en la figura 7.3. Para
presentar los estímulos utilizó un taquistoscopio, que es un aparato que permite presentaciones muy
breves. El tiempo entre el inicio y el parche de color fue de 400 ms, que son cuatro décimas de segundo.
La conciencia del primigenio se determinó por cuánto tiempo después la máscara siguió al primigenio. En
pruebas conscientes, la máscara se presentó al mismo tiempo que el parche de color (400 ms después
de la preparación). Este intervalo es lo suficientemente largo para que se detecte e identifique el primo.
En los ensayos desprevenidos, el intervalo entre el inicio de la máscara y el inicio del inicio fue muy
corto. Antes del inicio de la prueba Stroop, el intervalo exacto
1. Primera palabra
ROJO
(rojo, verde, amarillo o azul)
LBZSF
400ms VMQHK 2. Máscara
JTACP
3. Parche de color
(rojo, verde, amarillo o azul)
RGYB 4. Botones de respuesta

ÿ FIGURA 7.3
Una ilustración del procedimiento de Marcel (1983) (parte de su experimento 3). Apareció un
parche de color (rojo, verde, amarillo o azul) 400 ms después de una palabra principal (sin palabra,
rojo, verde, amarillo, azul o una palabra sin color). La máscara en los ensayos conscientes se
produjo con el parche de color. En pruebas inconscientes, la máscara se presentó justo después de
la primera. El tiempo entre el inicio del inicio y el inicio de la máscara en los ensayos inconscientes
se determinó por separado para cada sujeto, de modo que el sujeto pudiera determinar la presencia
del inicio no más del 60 por ciento del tiempo (la probabilidad de detección habría sido del 50 por
ciento: "sí" o “no” el primo estaba presente). Cuando aparecía el parche de color, el sujeto indicaba
el color presionando un botón correspondiente a rojo, verde, amarillo o azul.
59533_08_ch07_p180-206.indd 191 9533_08_ch07_p180-206.indd 191 3/5/08 /5/08

entre cebado y máscara se determinó individualmente para cada sujeto. Las palabras de color iban
seguidas de una máscara, y el observador debía detectar la presencia del primo. El umbral de detección
se determinó mediante el método de los límites y se definió como el intervalo principal-máscara que
arrojó detección en menos del 60 por ciento de las veces, siendo el 50 por ciento un rendimiento
aleatorio para detectar la presencia del principal. Durante la prueba de Stroop, se usó un intervalo de 5
ms más corto que el intervalo de detección en pruebas inconscientes.
En algunos ensayos de Stroop, no se presentó un número primo. El resto de ensayos se definieron

por la relación entre el primo y el parche de color: neutro, congruente o incongruente. Los materiales
incluían cuatro colores (rojo, verde, amarillo y azul), cuatro palabras de colores (rojo, verde, amarillo y
azul) y tres palabras neutras (tos, bondad y agua). Después de que apareció el parche de color, los
observadores presionaron uno de los cuatro botones para indicar el color del parche de color. El tiempo
de reacción para presionar el botón correcto fue la principal variable dependiente.
Los resultados fueron sencillos. Tanto en los ensayos conscientes como inconscientes, se obtuvo
un efecto Stroop típico. En comparación con los números primos neutros y sin ningún tipo de primo, la
identificación del color (por ejemplo, amarillo) fue más lenta después de números primos incongruentes
(por ejemplo, la palabra azul) y más rápida después de números primos congruentes (amarillo),
independientemente de si los sujetos eran conscientes de ello. los primos Con base en estos resultados
y los resultados de otros experimentos que realizó, Marcel concluyó que las personas pueden percibir
el significado sin ser conscientes.
En el experimento de Marcel, el comportamiento de los observadores en la prueba de Stroop
mostró que se había registrado el significado, aunque sus informes verbales indicaban que no se habían
percibido los estímulos primarios. Cheesman y Merikle (1984) cuestionaron la interpretación consciente
de los resultados. Señalaron que el umbral de detección de Marcel del 60 por ciento permitió la
posibilidad de una detección verdadera en algunos ensayos (consulte el Capítulo 6 sobre la distribución
de la respuesta en la detección de señales). Además, Cheesman y Merikle razonaron que los informes
verbales de conciencia pueden tener un umbral más alto que la respuesta diferencial al significado de
las palabras. Si este es el caso, entonces quizás Marcel haya determinado inadvertidamente el umbral
incorrecto cuando ajustó el intervalo de máscara principal para obtener menos del 60 por ciento de
detección. El procedimiento de Marcel puede haber resultado en un umbral que estaba por debajo del
umbral de los observadores para hacer un informe verbal pero por encima de su umbral de detección.
Cheesman y Merikle probaron la idea de que el umbral inapropiado se había determinado

replicando el experimento Stroop de Marcel con algunos cambios importantes.
En primer lugar, alteraron la forma en que se determinaba el umbral de detección del primo. En lugar
de que el observador juzgara la presencia o ausencia de la prima, como en el trabajo de Marcel,
Cheesman y Merikle obligaron a los sujetos a informar qué palabra de color se había presentado. Esto
se hizo para minimizar el sesgo de respuesta al informar la presencia de un primo. En el procedimiento
de elección forzada, cada primo se presenta con la misma frecuencia, seguido de una máscara. Durante
una extensa serie de ensayos, los observadores respondieron con la misma frecuencia con cada una
de las opciones disponibles (las mismas palabras de cuatro colores que usó Marcel: rojo, verde, amarillo
y azul). Así, el criterio de los observadores para decir un color en particular fue el mismo para todos los
números primos.
El segundo cambio importante que introdujeron Cheesman y Merikle fue el cálculo de varios
umbrales de detección principal para cada sujeto. Usando el método de los límites, variaron el intervalo
entre el primo y la máscara de modo que la detección de elección forzada del primo fuera del 25 por
ciento, 55 por ciento o 90 por ciento. Nivel de probabilidad de detección
59533_08_ch07_p180-206.indd 192 9533_08_ch07_p180-206.indd 192 3/5/08 /5/08

la prima al elegir entre cuatro alternativas es del 25 por ciento. Por lo tanto, el umbral más
bajo que calcularon fue la detección al azar. El nivel de respuesta del 55 por ciento fue
aproximadamente igual al umbral utilizado por Marcel. El umbral del 90 por ciento produce un
rendimiento casi perfecto. En todos los niveles de detección, la máscara solía ser efectiva
para eliminar la conciencia verbal del primo. Es decir, aunque los sujetos podían detectar de
manera diferente las palabras de color, según el intervalo de máscara principal, afirmaban no
ser conscientes de cuáles eran las palabras, afirmaban estar adivinando.
En la parte Stroop del experimento, Cheesman y Merikle siguieron el procedimiento de
Marcel (ver Figura 7.3), excepto que tenían cuatro condiciones en lugar de dos. Las cuatro
condiciones fueron los tres intervalos de máscara principal, que produjeron una detección del
25 %, 55 % y 90 %, así como una condición sin máscara. Como en el experimento de Marcel,
el primo tenía una relación neutra, congruente o incongruente con el parche de color.
Los resultados del experimento de Cheesman y Merikle se muestran en la figura 7.4. El
efecto Stroop estándar se obtuvo en cada condición, excepto cuando el primo se detectó en
un nivel de probabilidad. A pesar de que los observadores afirmaron no ser conscientes de la
Primer/parche congruente
(la palabra rojo y un parche rojo)
Primer/parche incongruente
(la palabra verde y un parche rojo)
+ 100
+ 80
+ 60 base
línea
lento
Más
que
de
la
+ 40
+ 20
reacción
Cambio
relativo
tiempo
de
en
el
- 20
- 40 rápido
base
línea
Más
que
de
la
- 60
- 80
-100
25% 55% 90% No
Mascarilla
Nivel de detección principal
Condición
ÿ FIGURA 7.4
Resultados de Cheesman y Merikle (1984), que muestran los tiempos de reacción de los primos
congruentes e incongruentes en relación con los primos neutros en cada una de las cuatro condiciones.
El efecto Stroop se ve en todas las condiciones excepto en la condición de detección principal del 25 por ciento.
59533_08_ch07_p180-206.indd 193 9533_08_ch07_p180-206.indd 193 3/5/08 /5/08

números primos en las condiciones de 55 y 90 por ciento, su comportamiento mostró que eran sensibles
a los significados de los números primos. En un intervalo muy corto entre la máscara y los números
primos que conduce a la detección casual (la condición del 25 por ciento), los sujetos no eran sensibles
al significado de los números primos.
Si tomamos el umbral de detección casual como el que indica que no hay conciencia del primo,
entonces podemos interpretar los resultados de Cheesman y Merikle como que no proporcionan
evidencia de percepción de significado sin conciencia. Por otro lado, el comportamiento en los niveles
de detección primaria del 55 y el 90 por ciento (donde los sujetos dicen que no son conscientes de la
detección primaria) muestra que hay percepción de significado. Cheesman y Merikle (1984, 1986)
teorizaron que sus datos son congruentes con la idea de que hay dos umbrales. Uno es un umbral
objetivo, donde el nivel de respuesta discriminativa está en un nivel de desempeño aleatorio. El otro es
un umbral subjetivo, donde el nivel de respuesta discriminatoria está por encima del nivel de
probabilidad, pero los observadores afirman que no pueden detectar o reconocer la información
perceptiva. Por lo tanto, plantean la hipótesis de que los umbrales de respuesta discriminativa requieren
un evento sincrónico (ei) más débil que los umbrales de respuesta verbal.
Para probar esta teoría directamente, Cheesman y Merikle (1984) realizaron un segundo
experimento en el que variaron la intensidad (nivel de energía) del cebador para determinar los dos
umbrales. En el umbral objetivo, los observadores detectaron al azar y verbalmente desconocían las
palabras. En el umbral subjetivo, los observadores detectaron las palabras el 66 por ciento de las veces,
pero afirmaron no poder identificarlas. Luego se repitió la prueba de Stroop y se encontró el efecto de
Stroop para primos presentados en el umbral subjetivo, pero no para primos presentados en el umbral
objetivo.
La teoría de los dos umbrales se ilustra en la figura 7.5. Entre los dos umbrales, las personas
hacen informes verbales de que no son conscientes de los números primos, pero sus respuestas a los
estímulos indican que son sensibles al significado. Por debajo del umbral objetivo, la conciencia no se
puede determinar, porque los sujetos responden en un nivel de oportunidad y son verbalmente
inconscientes. De acuerdo con esta forma de ver el efecto Stroop enmascarado-primo, Marcel había
determinado en sus experimentos el umbral subjetivo, no objetivo.
La teoría derivada del trabajo de Cheesman y Merikle tiene algunas implicaciones importantes para
comprender el papel de los informes verbales en la investigación perceptiva. En primer lugar, se ha
proporcionado una forma coherente de pensar sobre la diferencia entre los informes verbales que se
cree que indican conciencia y otras respuestas perceptivas. Para sujetos normales, ahora tenemos
formas de determinar cuándo deben ocurrir tales discrepancias, y para pacientes como DB, ahora
tenemos una forma sensata de pensar sobre un comportamiento aparentemente extraño. Weiskrantz
informa que estímulos muy fuertes presentados al campo ciego de DB produjeron algunos sentimientos
de conciencia, pero no de visión ordinaria.
Podemos concluir que una consecuencia del daño a la parte visual del cerebro es una marcada elevación
del umbral subjetivo (como se indica más adelante, también hay factores adicionales).
Una segunda implicación de la teoría de los dos umbrales es que no hay necesariamente nada
especial en un informe verbal. En cada nivel de umbral en la investigación de Cheesman y Merikle, el
informe verbal proporcionó poca información más allá de la proporcionada por las respuestas
discriminatorias de elección forzada. Esto sugiere que tales índices de percepción son perfectamente
adecuados, y que la prima que la gente otorga a la veracidad y la necesidad de los informes verbales de
conciencia puede estar fuera de lugar. En muchos casos, todo eso
59533_08_ch07_p180-206.indd 194 9533_08_ch07_p180-206.indd 194 3/5/08 /5/08

FUERTE ÿ FIGURA 7.5
La teoría de los dos umbrales

desarrollada por Cheesman y Merikle
Procesamiento Consciente
(1984, 1986). Entre los umbrales
verbalmente consciente de
subjetivo y objetivo, las personas
un estímulo, y el comportamiento
afirman no ser conscientes del estímulo,
indica respuesta
pero su comportamiento demuestra lo
al significado del estímulo
contrario. Por debajo del umbral
objetivo, las personas no son
UMBRAL SUBJETIVO
conscientes y su comportamiento se
encuentra en un nivel de probabilidad.
Pr inconsciente en proceso
ESTÍMULO
ENERGÍA
NIVEL
DEL
DE
Por encima del umbral subjetivo, las
no verbalmente consciente de personas son verbalmente conscientes
significado, pero el comportamiento
del estímulo y su comportamiento es sensib
muestra mejor que la casualidad
nivel de respuesta al significado
UMBRAL OBJETIVO
Imposible de Determinar
Nivel de conciencia
nivel de probabilidad de respuesta
al significado; no
verbalmente consciente del significado
DÉBIL
se necesita para entender que una percepción es un indicador de respuesta; las declaraciones de conciencia
no son esenciales.
Sin embargo, se mantiene el fuerte componente fenomenológico de la percepción, y las personas son
conscientes de unas cosas y de otras no. El umbral de la conciencia no puede ser el umbral objetivo.
Entonces Cheesman y Merikle (1986) concluyen:
Dado que el conocimiento perceptivo o la conciencia es un estado subjetivo, proponemos que el

umbral subjetivo, o el umbral para el conocimiento declarado , captura mejor la distinción
fenomenológica entre experiencias perceptivas conscientes e inconscientes y que el umbral
subjetivo, por lo tanto, proporciona una mejor definición de la frontera entre los procesos conscientes
e inconscientes que la proporcionada por el umbral objetivo. (p. 344, énfasis en el original)
Cheesman y Merikle han ofrecido una definición operativa de conciencia (véanse las discusiones
sobre definiciones operativas en los Capítulos 6 y 12). La simple definición de conciencia no nos permite
distinguir los procesos conscientes de los inconscientes y determinar la validez de un informe verbal. A
primera vista, Cheesman y Merikle simplemente permiten que cada sujeto utilice su propia confianza
subjetiva para establecer el umbral de conciencia. Señalan que este es un problema serio, porque la
confianza subjetiva no se puede distinguir del sesgo de respuesta. Si solo tenemos el umbral subjetivo
como medida del umbral de conciencia, entonces estamos casi de vuelta donde comenzamos: tenemos un
informe no verificable. Para resolver este problema adecuadamente, necesitamos usar operaciones
convergentes, un tema al que nos dirigimos ahora.
59533_08_ch07_p180-206.indd 195 9533_08_ch07_p180-206.indd 195 3/5/08 /5/08

Tema Operaciones convergentes

Ilustraciones Percepción sin conciencia y percepción con
conciencia explícita
La distinción entre la experiencia de percibir y responder a los estímulos, discutida en la sección anterior,
fue un gran impulso para la idea de que se necesita un conjunto de dos o más definiciones operativas
para definir el concepto psicológico de percepción. En un artículo clásico titulado “Operationism and the
Concept of Perception”, Garner, Hake y Eriksen (1956) demostraron que la percepción era más que una
simple respuesta. Esto puede parecerte una obviedad después de leer el apartado anterior, por lo que
debemos dar un paso atrás en el tiempo.
Hace unos cincuenta años, la psicología experimental apenas comenzaba a recuperarse de la
agonía de un marco rígidamente aplicado del conductismo watsoniano. Los observadores dieron
respuestas que discriminaron un patrón de estímulo de otro; para muchos psicólogos, tales respuestas
eran equivalentes a la percepción. Ahora nos damos cuenta, en gran parte gracias a Garner, Hake y
Eriksen, de que un concepto tan limitado de percepción surge de una interpretación muy literal e
incompleta del operacionismo. Según el operacionismo, los conceptos se definen por las operaciones
utilizadas para medirlos y producirlos. Si el peso se defi ne como el movimiento de un metro ubicado en
una pequeña caja rectangular en el piso de su baño, entonces la respuesta indicada en el dial de la
báscula cuando se sube a la báscula definiría el peso. Si la percepción se definiera como un observador
que dice que un estímulo se ve diferente de otro, entonces esa respuesta sería percepción.
Garner y asociados señalaron que esto era solo una parte del operacionismo. Igualmente importante
fue la necesidad de un conjunto de operaciones para defi nir cada concepto. Citaron al físico Bridgman
(1945) para enfatizar este aspecto descuidado:
Las definiciones operativas, a pesar de su precisión, se aplican sin significación.

cance a menos que las situaciones a las que se aplican estén lo suficientemente desarrolladas
como para que se conozcan al menos dos métodos para llegar al final. La definición de un
fenómeno por las operaciones que lo produjeron, tomadas al desnudo y sin más calificación,
tiene una precisión enteramente engañosa, porque es una descripción de un solo evento
aislado. (p. 248, énfasis añadido)
Definición operativa de la percepción como una respuesta de discriminación, es decir, una respuesta
de A o B—no es suficiente. Se requieren al menos dos operaciones.
Cuando se utiliza una sola operación, es imposible distinguir entre las limitaciones del sistema de
percepción y las del sistema de respuesta. Dado que los sistemas de percepción y de respuesta son hasta
cierto punto independientes, se requieren dos o más operaciones para separar las limitaciones de cada
sistema.
Las operaciones convergentes son un conjunto de dos o más operaciones que eliminan conceptos
alternativos que podrían explicar un conjunto de resultados experimentales. Esta definición abstracta se
comprende mejor a través de varios ejemplos. Comenzamos con una discusión del trabajo adicional
realizado por Cheesman y Merikle.
Percepción sin conciencia

En los experimentos de Cheesman y Merikle (1984), las afirmaciones fenomenológicas de inconsciencia
ante los estímulos que ocurren por debajo del umbral subjetivo no pueden distinguirse de un sesgo de
respuesta para ocultar un informe verbal de consciencia. Reafirmar
59533_08_ch07_p180-206.indd 196 9533_08_ch07_p180-206.indd 196 3/5/08 /5/08

nuestra confianza en la distinción entre percepción con conciencia y percepción sin conciencia, se
necesita una operación convergente para mostrar que el procesamiento perceptivo bajo los dos niveles
de conciencia es cualitativamente diferente. De lo contrario, todo lo que podemos decir sobre los
resultados es que el efecto Stroop a veces va acompañado de informes de conciencia del primo y, a
veces, no va acompañado de conciencia. Experimentos posteriores de Cheesman y Merikle (1986)
proporcionaron las operaciones convergentes al mostrar que una variable independiente (la frecuencia
con la que ocurrieron pruebas de parches de colores primarios congruentes) tuvo un efecto
cualitativamente diferente en el procesamiento perceptivo inconsciente que en el procesamiento
perceptivo consciente. . Además del umbral subjetivo, otra variable distinguió entre percepción
consciente e inconsciente.
Cheesman y Merikle (1986) decidieron variar la frecuencia con la que ocurrían combinaciones
congruentes de parches de colores primarios. Investigaciones anteriores que utilizaron diferentes
formas de la prueba de Stroop habían demostrado que la facilitación e inhibición del tiempo de reacción
en pruebas congruentes e incongruentes (ver la condición sin máscara de la Figura 7.4) aumentaba
con el aumento en la frecuencia de las pruebas congruentes (Glaser & Glaser, 1982). ). Las pruebas
congruentes (la palabra roja y la tinta roja) ocurrieron con el doble de frecuencia que las discrepancias
entre la palabra y el color de la tinta. Los observadores tenían una fuerte tendencia a decir el color
mencionado por la palabra, y esta anticipación aceleró el tiempo de respuesta en los ensayos
congruentes. Dado que esta anticipación daría lugar a una respuesta incorrecta en los intentos
incongruentes, el tiempo de reacción fue muy lento en los intentos que no coincidían entre la palabra
y el color (por ejemplo, la palabra amarilla y el color de tinta azul). Los efectos de frecuencia como este
representan una estrategia voluntaria por parte de los observadores (Lowe & Mitterer, 1982). Cuando
los ensayos congruentes ocurren con alta frecuencia, los sujetos se ven predispuestos a dar la
respuesta más frecuente, con base en su identificación de la frecuencia relativa de varios tipos de
ensayos. Esto da como resultado una facilitación del tiempo de reacción en la mayoría de los intentos
(los congruentes) y una interrupción del tiempo de reacción en solo un pequeño subconjunto de intentos
Dado que los primos congruentes, incongruentes y neutros ocurrieron cada uno en un tercio de
las pruebas en su trabajo anterior, Cheesman y Merikle razonaron que los efectos de aumentar la
frecuencia de las pruebas de primos congruentes (a dos tercios de las pruebas) dependerían sobre si
los números primos estaban por encima o por debajo del umbral subjetivo. Argumentaron que si el
efecto de frecuencia resultaba de la identificación del tipo de ensayo más frecuente por parte de los
observadores, entonces cuando los primos se presentaban por debajo del umbral subjetivo y no podían
identificarse conscientemente, el efecto de frecuencia no ocurriría. Si los primos estuvieran por encima
del umbral subjetivo y pudieran identificarse conscientemente, entonces se observaría el efecto de
frecuencia.
Después de demostrar que los primos congruentes presentados en dos tercios de los ensayos
sin máscara aumentaron el efecto Stroop, Cheesman y Merikle variaron la frecuencia de los ensayos
de primos congruentes: ocurrieron en un tercio o dos tercios de los ensayos. También tenían números
primos por debajo del umbral subjetivo o muy por encima.
Los resultados de este experimento se muestran en la Figura 7.6. Como en su trabajo anterior
(ver Figura 7.4), el efecto Stroop no dependía de si los números primos estaban por encima o por
debajo del umbral subjetivo. Sin embargo, la frecuencia de ensayos congruentes tuvo un efecto solo
cuando los primos estaban por encima del umbral subjetivo y se identificaron conscientemente. Los
observadores pueden usar estrategias solo cuando son conscientes de los estímulos definidos por el
umbral subjetivo. Por lo tanto, las operaciones convergentes indican que los métodos de procesamiento
perceptivo consciente e inconsciente son cualitativamente diferentes, y la distinción fenomenológica
entre diferentes niveles de conciencia en la percepción se encuentra en un terreno experimental firme.
Estas conclusiones requerían dos conjuntos
59533_08_ch07_p180-206.indd 197 9533_08_ch07_p180-206.indd 197 3/5/08 /5/08

+ 120
incongruente
primos
+ 100
+ 80
+ 60 Primos a continuación primos arriba

Umbral Subjetivo Umbral Subjetivo
+ 40
incongruente
primos
+ 20
reacción
relativo
Tiempo
de
la
a neutra
base
(ms)
línea
de
- 20
Congruente
- 40 primos
Congruente
- 60 primos
- 80
33 66 33 66
Porcentaje de ensayos congruentes

ÿ FIGURA 7.6
Resultados de Cheesman y Merikle (1986), que muestran una mejora del efecto Stroop para primos por
encima del umbral subjetivo cuando aumenta la frecuencia de pruebas congruentes.
La magnitud del efecto Stroop para números primos inconscientes no está influenciada por la frecuencia de
los ensayos congruentes.
de observaciones: la determinación de diferentes umbrales de conciencia y la demostración

del efecto diferencial de la frecuencia de prueba congruente a través de los niveles de conciencia.
Ambos conjuntos de observaciones convergen en la adecuación de la distinción entre
percepción con conciencia y percepción sin ella (Merikle y Cheesman, 1987, informe de
resultados de apoyo).
La mayoría de los psicólogos experimentales están de acuerdo en que el fenómeno de la
percepción sin conciencia descansa sobre terreno firme (Kihlstrom, Barnhardt y Tataryn, 1992).
La confianza resulta en parte de las diferencias cualitativas que tienen las variables
independientes cuando las personas afirman ser conscientes de la percepción que cuando no
lo son (Merikle y Reingold, 1992; Merikle, Smilek y Eastwood, 2001). La evidencia convergente
que acabamos de describir proporciona un ejemplo importante. La confianza en la generalidad
de la idea de percepción sin conciencia también se deriva de la amplia variedad de circunstancias
experimentales en las que se han obtenido efectos inconscientes (Greenwald, 1992; Loftus y
Klinger, 1992; Sergent y Dehaene, 2004). Las operaciones convergentes brindan precisión en
la definición, y las réplicas de resultados entre tareas apuntan a un fenómeno general.
59533_08_ch07_p180-206.indd 198 9533_08_ch07_p180-206.indd 198 3/5/08 /5/08

Vista ciega revisada
Nuestro análisis de la percepción de DB está incompleto. Se necesitan operaciones convergentes para verificar
la afirmación de que no podía ver objetos en su campo ciego, a pesar de su capacidad para detectarlos y
localizarlos con precisión. Para proporcionar operaciones convergentes para mostrar que la percepción de DB
de los objetos en su campo ciego era cualitativamente diferente de la de su campo bueno, Weiskrantz utilizó
una táctica similar a la utilizada por Cheesman y Merikle.
El procedimiento utilizado por Weiskrantz para proporcionar operaciones convergentes se denomina doble
disociación de funciones (Weiskrantz, 1997). En este procedimiento, los comportamientos opuestos son
provocados por dos tareas diferentes de diferentes áreas de funcionamiento. Específicamente, Weiskrantz
quería encontrar un conjunto de condiciones bajo las cuales la detección y la localización fueran más pobres en
el campo bueno que en el ciego, mientras que al mismo tiempo demostraba que el reconocimiento y la
identificación todavía estaban ausentes en el campo ciego. y presente en el bueno.
Si hubiera déficit perceptuales opuestos en los dos campos bajo estas condiciones, entonces Weiskrantz podría
estar seguro de que el tipo de visión en el campo ciego era cualitativamente diferente al del campo bueno y que
la ceguera no era solo un problema. versión más pobre de la visión normal.
Weiskrantz presentó una x o un triángulo en la periferia del campo bueno; para presentaciones breves y
tenues, la detección allí fue más pobre que la detección en la parte central del campo ciego. A pesar de la mala
detección en el buen campo, DB aún podía decir si se había presentado una x o un triángulo en estos ensayos.
Al igual que en otros experimentos, la detección precisa en campo ciego estuvo acompañada de ceguera para
la identificación de los estímulos. Es decir, DB podía decir cuándo se presentaron los objetivos al campo ciego,
pero no pudo decir si habían sido una x o un triángulo. A partir de sus experimentos con DB, Weiskrantz concluyó
que la disociación es consistente con la idea de que hay dos sistemas visuales. Como se mencionó anteriormente,
uno es un sistema de “qué” que se refiere a la identificación y el reconocimiento. El otro es un sistema de “dónde”
que se ocupa de la detección y la localización. En ausencia de daño cerebral, estos sistemas funcionan juntos,
de modo que la detección va acompañada del reconocimiento y, en humanos adultos, de la conciencia verbal.
Otros tipos de investigación indican una doble disociación entre los sistemas visuales qué y dónde. La
investigación fisiológica (Cowey, 1995) ha demostrado disociaciones en monos cuando partes de sus sistemas
visuales han sido alteradas quirúrgicamente. Las lesiones en una parte del sistema visual provocan un
reconocimiento desordenado de lo que hay allí, pero la localización está intacta; las lesiones en otras partes del
sistema visual dan como resultado una ausencia de capacidad espacial, pero el reconocimiento de objetos está
intacto. Tipos similares de resultados han sido reportados en la literatura neuropsicológica. Farah (1990) analiza
dos tipos diferentes de personas con daño cerebral.
Con daño en una parte de su sistema visual, las personas no pueden ver ni imaginar objetos, pero pueden
descubrir e imaginar dónde se encuentran los objetos. Por el contrario, las personas con daños en otras áreas
del cerebro pueden ubicar objetos e imaginar su ubicación, pero estas personas no pueden reconocer o imaginar
los objetos en sí mismos. Entonces, dos combinaciones adicionales de resultados proporcionan más evidencia
convergente de un sistema visual compuesto por dos sistemas funcionales. Los datos conductuales, fisiológicos
y neuropsicológicos dan como resultado un patrón impresionante de evidencia convergente, que respalda
firmemente la teoría de Norman (2002) de que tanto los procesos directos como los indirectos están involucrados
en la visión normal.
Percepción con conciencia explícita

Hasta ahora hemos dividido la percepción de varias maneras: directa/indirecta, de arriba hacia abajo/de abajo
hacia arriba, qué/dónde e inconsciente/consciente. Recuerde que en el trabajo original de visión ciega, los
informes de ceguera de objetos de DB no se correspondían con su capacidad para localizar un objeto. El foco ento
59533_08_ch07_p180-206.indd 199 9533_08_ch07_p180-206.indd 199 3/5/08 /5/08

y en el trabajo de Merikle fue mejorar nuestra comprensión de la falta de conciencia sobre la percepción.
Todavía tenemos que analizar el papel de las operaciones convergentes para apoyar el efecto de la
conciencia explícita sobre la percepción, lo que hacemos aquí. La investigación revela claramente el valor
de las operaciones convergentes para reforzar nuestra comprensión.
La mayor parte del trabajo sobre la conciencia explícita es de Proffi tt y asociados, y Proffi tt (2006)
proporciona una revisión de la mayor parte de esa investigación. La reseña de Proffitt perfila su agenda
señalando que los procesos visuales implicados en la percepción del entorno inmediato, por ejemplo,
aquellos en la observación del grado de inclinación de una colina, son inmutables excepto por las condiciones
del diseño espacial. La conciencia explícita, por otro lado, varía tanto con el conjunto óptico como con los
costos emocionales y físicos de intentar hacer cosas en ese entorno. Como discutiremos, usar una mochila
pesada mientras observa una colina, en lugar de una mochila liviana, parece hacer que la colina parezca
más empinada. Por lo tanto, Proffi tt (2006) argumenta que “la percepción del diseño espacial combina la
geometría del mundo con objetivos de comportamiento y los costos para lograr esos objetivos” (p. 110).
Examinemos algunas de las investigaciones que llevan a esa conclusión.
La primera serie de estudios que consideramos examinó la percepción de la inclinación de las colinas
(Proffi tt, Bhalla, Gossweiller y Midgett, 1995). Los observadores hicieron tres juicios sobre la inclinación de
la colina en un orden contrabalanceado: un juicio verbal de conciencia explícita en grados, una estimación
visual de conciencia explícita hecha moviendo un semicírculo para revelar una sección transversal
esquemática de la colina, y una evaluación háptica (táctil) hecha moviendo una tabla con la palma de la
mano, tratando de hacer coincidir la sensación de la tabla con la inclinación de la colina mientras mira la
colina. Proffi tt y asociados asumieron que la condición háptica era una tarea oculomotora implícita guiada
visualmente. Los observadores sobrestimaron drásticamente la inclinación de la colina al hacer las
estimaciones de conciencia explícitas, pero fueron más conservadores y precisos con la tarea háptica. A
continuación, los corredores experimentados realizaron los tres tipos de juicios de inclinación de la colina
dos veces: justo antes de una carrera de 1 hora y justo después de la carrera. Los corredores estimaron las
inclinaciones de dos colinas diferentes, y los investigadores equilibraron estas colinas en las condiciones
previas y posteriores a la carrera (consulte los Capítulos 2 y 9) para dos grupos de corredores. Los juicios
hápticos guiados visualmente fueron razonablemente precisos y no se vieron influidos por correr durante una
hora. En general, los corredores exageraron el sesgo en sus juicios explícitos de conciencia, y emitieron
juicios explícitos mucho más pronunciados después de la carrera que antes. Por lo tanto, el esfuerzo de
correr aumentó la pendiente de las colinas estimada explícitamente.
En una segunda serie de estudios, Bhalla y Proffi tt (1999) examinaron el costo físico de los
observadores de tres maneras diferentes mientras realizaban la conciencia explícita y estimaciones guiadas
visualmente. Primero, encontraron que llevar una mochila pesada aumentaba las estimaciones explícitas de
inclinación pero no influía en los juicios hápticos. En segundo lugar, evaluaron la condición física de atletas
universitarios y estudiantes universitarios en general mediante una prueba de esfuerzo y luego les pidieron
que juzgaran la inclinación de cuatro colinas. Los juicios explícitos de conciencia de la inclinación se
correlacionaron negativamente (ver el Capítulo 2 sobre la correlación) con la condición física; es decir,
encontraron que cuanto menos apto era el participante, mayores eran las estimaciones de inclinación visual
y verbal. Las estimaciones guiadas visualmente no variaron con la forma física. En tercer lugar, las personas
mayores hicieron estimaciones de la inclinación de las colinas. Los juicios explícitos, pero no los visualmente
guiados, variaron positivamente con la edad. Las personas mayores hicieron estimaciones sesgadas más
altas. Bhalla y Proffitt también encontraron que la mala salud autoinformada influía en el efecto de la edad:
cuanto peor era la salud, mayores eran los juicios explícitos de inclinación. La salubridad no influyó en los juicios g
La metodología empleada en estos estudios por Proffi tt y colaboradores incluye experimentos (mochila
pesada o no, antes y después de una carrera) y cuasi-experimentos con variables del sujeto (edad y
condición física). Los experimentos por sí solos permiten afirmaciones causales, pero no son tan interesantes
como los efectos asociados con las variables del sujeto.
59533_08_ch07_p180-206.indd 200 9533_08_ch07_p180-206.indd 200 3/5/08 /5/08

Estos últimos, por supuesto, no permiten un análisis causal (véanse los capítulos 2, 3 y 12). El
paquete de investigación es convincente al demostrar la conclusión de que los procesos no visuales
pueden influir en la percepción visual de nuestro mundo.
El trabajo de Proffi tt ha dado lugar a interesantes estudios adicionales relacionados con el
rendimiento atlético, que muestran que el promedio de bateo en los jugadores de softbol se
correlaciona positivamente con el tamaño estimado de la pelota (Witt & Proffi tt, 2005) y el tamaño
de un tablero de dardos. se correlaciona positivamente con la competencia en el lanzamiento de
dardos (Wesp, Cichello, Gracia y Davis, 2004). Aparentemente, la capacidad de tener éxito en una
empresa tiene influencia en la percepción. Concluimos esta sección revisando el punto señalado
por Proffi tt (2006) al comienzo de la sección: Percibir el mundo combina el análisis visual con la
conciencia explícita de las metas y los costos que implican.

LA TUERCAS Y PERNOS
Problema La Ilusión Color-Distancia
Es bien conocido en las artes visuales que los colores cálidos (amarillo, naranja, rojo y las
transiciones entre estos colores) dan la apariencia de moverse hacia el espectador, mientras que
los colores fríos (azul, verde) parecen alejarse del espectador.
Se puede hacer que una imagen bidimensional parezca tridimensional mediante recursos artísticos
tales como fondos azules y primeros planos de colores cálidos.
Esta ilusión puede ser bastante convincente. Uno de nosotros recuerda haber visto una exposición
de vitrales en la que una obra de arte tenía varios paneles de vidrio de color azul oscuro que
rodeaban un círculo rojo. La ilusión de las tres dimensiones era tan fuerte que el círculo parecía
flotar unos 10 centímetros frente al fondo azul. El autor tuvo que subir y tocar el vidrio para
convencerse de que los pedazos de vidrio rojo y azul estaban en el mismo plano. Imagine que un
psicólogo experimental desea investigar esta ilusión de colores cálidos y fríos.
Podemos plantear el problema de la siguiente manera:
Problema ¿Por qué los colores cálidos parecen avanzar y los colores fríos
retroceder?
Antes de intentar responder a esta pregunta en detalle, un psicólogo experimental cuidadoso
primero intentaría demostrar el fenómeno en circunstancias controladas de laboratorio. Él o ella
querría descartar la posibilidad de que la ilusión ocurra debido a otros recursos artísticos, como la
perspectiva o las variaciones en el brillo, los cuales pueden crear una apariencia de distancia.
Por lo tanto, primero se presentaría una hipótesis general de que el color sirve como señal de
profundidad. Como siempre es cierto, podemos formular varias versiones comprobables más
específicas de esta hipótesis general.
Hipótesis Cuando se presentan pares de parches de color en el mismo plano, la

persona que observa estos estímulos con un ojo (monocularmente) juzgará más
de cerca el color más cálido.
La principal variable independiente es, por supuesto, el color (o, más técnicamente, el matiz) de los
parches de prueba visual. Otra variable independiente que
59533_08_ch07_p180-206.indd 201 9533_08_ch07_p180-206.indd 201 3/5/08 /5/08

probablemente ser manipulado al mismo tiempo es la distancia entre el ojo y los estímulos.
Esta variable se incluiría porque el experimentador no tendría ninguna razón previa para
seleccionar una distancia de visualización particular. Dado que no hay nada especial en la
distancia de visualización, podría pensar que esta variable independiente es innecesaria.
Cualquier distancia seleccionada al azar serviría.
Aunque este razonamiento es correcto si la suposición de que la distancia no importa es

cierta, esta es solo la mejor suposición del experimentador. Dado que es fácil y económico
usar tres o cuatro distancias de visualización en lugar de solo una, la mayoría de los
experimentadores seguirían adelante y manipularían la distancia. Los datos que muestran
que la distancia de visualización no tiene efecto sobre la clave de profundidad del color,
aunque son un hallazgo nulo, siguen siendo interesantes, ya que permitirían descartar
ciertas explicaciones de la ilusión. Finalmente, la suposición del experimentador podría ser
incorrecta y las dos variables independientes (tono y distancia de visualización) podrían interactu
¿Cuántos tonos se deben probar en este experimento? Si se presentan al observador
todos los pares posibles de matices, encontramos que el número de estímulos (un estímulo
es un par de parches de color) aumenta dramáticamente con el número de matices a probar.
El experimento mínimo tendría tres tonos: uno cálido, uno frío y un gris neutro. Esto requeriría
un total de tres estímulos para presentar todos los pares posibles. Aunque este total es más
razonable en términos de demanda de esfuerzo experimental, tres estímulos (y sólo dos
colores reales) son demasiado pocos para establecer la generalidad del efecto. Podríamos
usar cinco tonos: dos colores cálidos, dos colores fríos y un gris. Esto requeriría 10 estímulos.
Siete colores requerirían 21 estímulos y nueve colores 36 estímulos. Para evitar que la
sesión experimental sea demasiado larga, podríamos seleccionar cinco colores y cuatro
distancias de visualización.
La variable dependiente es un juicio de elección forzada, en el que se requiere que el

observador indique cuál de los dos parches de color aparece más cerca.
(En realidad, ambos están a la misma distancia del observador). Esto se calificaría creando
una matriz, con todos los tonos enumerados en las columnas y también en las filas. Cada
celda de la matriz especifica una combinación de dos colores. La diagonal principal no
tendría entradas, ya que el mismo color no se presentaría dos veces dentro de un estímulo.
Las entradas de celda serían el número de veces (o los porcentajes) que se consideró que
el color X estaba más cerca que el color Y.
Al igual que con cualquier experimento de percepción, es necesario considerar muchas

variables de control. Lo que la gente de la calle llama color en realidad se compone de tres
atributos independientes: matiz, saturación y brillo. El matiz es la frecuencia de la luz y
corresponde al matiz del color: rojo, verde, etc.
La saturación corresponde a la fuerza del color, es decir, si es pálido y desteñido o
profundo y fuerte. El brillo se refiere a la cantidad de luz reflejada en una superficie. Dado
que nuestro experimento tiene el tono como su principal variable independiente, tanto la
saturación como el brillo deben controlarse.
El brillo, en especial, es una indicación importante de la profundidad, ya que los objetos
más brillantes se perciben más cerca del espectador, en igualdad de condiciones. Así que
debemos estar extremadamente seguros de que todos nuestros estímulos son de igual
brillo. Ya se ha dado otra variable de control en la hipótesis, que especifica las condiciones
de visión monocular (de un ojo).
59533_08_ch07_p180-206.indd 202 9533_08_ch07_p180-206.indd 202 3/5/08 /5/08

Debido a que cada ojo ve objetos externos desde una ubicación ligeramente diferente, la
visión binocular (ambos ojos) es una señal importante para la percepción de profundidad. Dado
que lo que nos interesa principalmente es el color como posible indicador de profundidad, todos
los demás indicadores de distancia deben eliminarse del experimento.
No sabemos cuáles serían los resultados de este experimento. Sin embargo, a los efectos de
una discusión más detallada, supongamos que los colores cálidos se consideraron más cercanos.
Luego formularíamos otra hipótesis, tratando de proporcionar una operación convergente para
reforzar los resultados y la interpretación de este primer experimento.
Hipótesis Cuando se le pide a un observador que mueva un estímulo de

color ajustable para que aparezca en el mismo plano que un estímulo de color
fijo, el observador colocará el estímulo ajustable más cerca si es un color frío
y el estímulo fijo es un color cálido , y viceversa.
Esta hipótesis es más complicada que la primera, por lo que la explicaremos con más detalle.
Imagina dos círculos de colores frente a ti, con uno de ellos sentado en una polea para que pueda
moverse hacia adelante y hacia atrás. El otro círculo no se puede mover. Tu tarea es ajustar esta
polea hasta que ambos estímulos aparezcan a la misma distancia de ti. La hipótesis predice que,
dado que los colores cálidos aparecerán más cerca de ti, un color frío (que aparece más lejos)
colocado en la polea debe acercarse para que aparezca parejo con el color cálido fijo. De manera
similar, si el color fijo es frío, aparecerá más lejos, por lo que un color cálido (que aparecerá más
cerca) en la polea debe alejarse más de usted que el color fijo.
Las variables independientes y de control son como antes. La variable dependiente es ahora
la distancia entre el observador y el estímulo ajustable.
Sin embargo, al anotar esta distancia, probablemente tomaríamos la posición del estímulo fijo
como cero y registraríamos un número negativo si el estímulo ajustable está más cerca del
espectador y un número positivo si está más lejos.
Mientras que el primer experimento arrojó una evaluación cualitativa de la cálida-
genial ilusión, este experimento da un número basado en la distancia percibida.
Por lo tanto, proporciona una indicación de cuán fuerte o débil puede ser la ilusión para
diferentes combinaciones de colores. Si fuéramos lo suficientemente audaces, esta hipótesis
podría concretarse aún más prediciendo que el tamaño de la ilusión dependería de la diferencia
de frecuencia entre los matices de cada par de estímulos. A medida que los estímulos estuvieran
más separados en el espectro visual, se obtendrían ajustes de mayor distancia.
Hasta ahora, nuestros dos experimentos se han dirigido más a establecer la replicabilidad y
confiabilidad del hallazgo (hipotético) de que los colores cálidos avanzan y los colores fríos
retroceden que a explicar por qué sucede esto.
Las operaciones convergentes proporcionadas por los dos experimentos son débiles, ya que son
bastante similares y difieren solo en la precisión con la que se mide la variable dependiente. En
particular, los juicios realizados por el espectador son juicios relativos relativos a dos colores
vistos simultáneamente. El próximo paso para explicar nuestro resultado (hipotético) sería
proporcionar una operación convergente más fuerte al requerir un juicio absoluto sobre un solo
estímulo.
59533_08_ch07_p180-206.indd 203 9533_08_ch07_p180-206.indd 203 3/5/08 /5/08

Hipótesis Cuando se requiere que un observador, usando ambos ojos, calcule la
distancia de un chip de estímulo de un solo color, los colores cálidos se considerarán
más cercanos que los colores fríos.
Nuestra variable independiente no cambia, al igual que las variables de control. La

variable dependiente es una estimación directa de la distancia. Hay varias técnicas de
escala que se pueden utilizar, pero en aras de la simplicidad, dejaremos que nuestro
observador juzgue en unidades de distancia que le son familiares, como pulgadas o
centímetros. Por supuesto, es poco probable que, incluso para un estímulo gris neutro,
dichas estimaciones sean muy precisas, pero ese no es el problema que deseamos
investigar. Todo lo que nos importa en este experimento son los valores relativos de
las estimaciones de distancia para colores cálidos versus colores fríos. Si los resultados
concuerdan con los supuestos de los dos primeros experimentos, hemos aprendido
que existe una propiedad absoluta del color que sirve como indicación de la distancia.
Si no se encuentran diferencias, es decir, si las estimaciones de distancia son las
mismas para todos los colores, quedan dos posibilidades. Probablemente habrá notado
que la hipótesis establece que se debía evaluar la visión binocular normal (ambos
ojos). Esta es otra operación convergente.
Si los resultados fueran negativos, un experimentador cuidadoso replicaría este
tercer experimento, utilizando la visión monocular como antes. Si los resultados
siguieran siendo negativos con la visión monocular, entonces nos veríamos obligados
a concluir que la ilusión de distancia cálido-frío era una propiedad de los juicios relativos
y que era necesario un contraste entre dos estímulos para producirla. Este sería un
paso importante en la explicación del efecto, pero todavía es solo un comienzo. Los
pasos restantes se dejan como ejercicios para futuros experimentadores. (Si desea
obtener más información sobre esto, consulte la aberración cromática en un texto
sobre percepción, como Coren et al., 1994).
ÿ RESUMEN
1. La percepción a menudo se describe como la interpretación de 3. En el efecto Stroop, el trabajo de Cheesman y Merikle indica
la sensación. Los problemas en el estudio de la percepción que existe una diferencia en la conciencia verbal para los
incluyen el papel de los enfoques directos e indirectos de la elementos que se presentan por encima de un umbral subjetivo
percepción (a menudo denominados procesos de abajo hacia y para los que se presentan por debajo del umbral subjetivo y
arriba y de arriba hacia abajo), las formas en que los factores por encima del umbral objetivo.
nativos y experienciales influyen en la percepción, y el papel
que desempeña la conciencia. 4. Las operaciones convergentes permiten inferencias sobre
2. Los informes verbales permiten al psicólogo estudiar las operaciones perceptuales que son más fuertes que las
experiencias perceptivas y fenomenológicas de otra persona. inferencias de un solo experimento o condición experimental.
Sin embargo, se necesita cuidado para asegurarse de que los Las operaciones convergentes han permitido a los psicólogos
informes verbales sean variables dependientes adecuadas. comprender mejor la visión ciega, la percepción sin conciencia
Ejemplos de problemas de percepción que han sido estudiados y la percepción con conciencia explícita.
mediante informes verbales son la visión ciega y la percepción
sin conciencia.
59533_08_ch07_p180-206.indd 204 9533_08_ch07_p180-206.indd 204 3/5/08 /5/08

ÿ TÉRMINOS CLAVE
imagen remanente imagen remanente negativa

conciencia umbral objetivo
vista ciega operacionismo
procesamiento de abajo hacia arriba percepción
procesamiento impulsado conceptualmente experiencia fenomenológica
operaciones convergentes imagen residual positiva
procesamiento basado en datos cebado
acercamiento directo a la percepción primera vista
doble disociación de función escotoma
perimetría dinámica sensación
ley de emmert Efecto Stroop
teoría empírica umbral subjetivo
alucinación taquistoscopio
espejismo procesamiento de arriba hacia abajo
enfoque indirecto de la percepción inferencia inconsciente

enmascaramiento informe oral
teoría nativista
1. Si alguna vez ha tomado medicamentos recetados para 3. Diseña tu propio experimento para investigar más a fondo
aliviar el dolor quirúrgico o dental, es posible que haya la ilusión de distancia de color cálido-frío.
experimentado una disociación entre la sensación o el 4. Consulte un texto de percepción (como el de Coren et al.,
dolor (el dolor) y su capacidad para localizar la fuente del 1994) y discuta ejemplos adicionales de ilusiones e
informes fenomenológicos.
dolor. Relacione esto con la vista ciega y la percepción sin conciencia.
2. Consulte a Garner (1974) y discuta cómo se usan las
operaciones convergentes para reforzar los conceptos de
integralidad dimensional y separabilidad.
CONEXIONES WEB
Un análisis de la percepción de olores y sabores se puede encontrar en:

http://www.hhmi.org/senses/
Puede encontrar un tratamiento fascinante de las ilusiones visuales y auditivas en:
http://www.ilusionworks.com/
En el Capítulo 6 del manual de Langston (2002) se considera un experimento interesante sobre la percepción.
Este experimento examina cómo el color de la habitación influye en el estado de ánimo de una persona.
59533_08_ch07_p180-206.indd 205 9533_08_ch07_p180-206.indd 205 3/5/08 /5/08

El efecto Stroop
Puedes probar fácilmente la prueba de Stroop por ti mismo. Todo lo que necesita son algunas
fichas, marcadores de colores y un reloj con segundero o, mejor aún, un cronómetro.
Tome dieciséis fichas y, usando sus marcadores, escriba el nombre del color en su color,
es decir, con un marcador verde, escriba VERDE, y así sucesivamente. Si tiene ocho marcadores,
cada color se repetirá dos veces. Si solo tiene cuatro marcadores, repita cada color cuatro veces.
Tome otras dieciséis fichas y escriba nombres de colores que no correspondan con la tinta, es
decir, con un marcador verde, escriba ROJO, y así sucesivamente. Tus estímulos ahora están
completos.
Elige uno de los dos mazos; para cada tarjeta, nombre el color de la tinta. Calcule el tiempo
que le toma pasar por las dieciséis cartas. Haz lo mismo con el otro mazo. ¿Fuiste más rápido
con la plataforma que tenía nombres de colores y tintas compatibles? Sería mejor probar a varias
personas para obtener resultados más confiables que solo probarse uno mismo.
Otra forma de estudiar el efecto Stroop es usar estímulos numéricos. Determine qué tan
rápido sus participantes pueden leer una columna larga de un solo dígito en la que los números
del 1 al 4 se repiten varias veces. Luego determine cuánto tiempo les toma contar el número de
símbolos arbitrarios en una columna. La columna debe ser tan larga como la primera, y debe
usar un símbolo como un signo de dólar de tal manera que haya uno, dos, tres o cuatro de ellos
en una línea. Ahora, está listo para probar la condición de conflicto de Stroop. Elabora una
columna tan larga como las dos anteriores en la que tengas estímulos como 2 2 2 2, 1 1, 3 y 4 4
4. La tarea de los participantes es nombrar el número de dígitos; es decir, deben decir “cuatro”
cuando vean 2 2 2 2, y así sucesivamente.
Una adición interesante a cualquiera de los experimentos anteriores sería que un grupo separado
de participantes leyera todos los estímulos cuando las listas se presentan al revés.
Esto dificultará la lectura y el conteo y disminuirá la velocidad de respuesta.
¿Qué sucede con la magnitud del efecto Stroop? ¿Por qué? ÿ
59533_08_ch07_p180-206.indd 206 9533_08_ch07_p180-206.indd 206 3/5/08 /5/08

CAPÍTULO 8
ATENCIÓN Y
TIEMPO DE REACCIÓN
EL ABC DEL TIEMPO DE REACCIÓN

ILUSTRACIONES
Confusión: inserción pura

ILUSTRACIONES
Selección de la Variable Dependiente:
Compensación entre velocidad y precisión

ILUSTRACIONES
Efectos de interacción: control cognitivo

Medición de la atención
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: VELOCIDAD-EXACTITUD
COMPENSACIÓN
207
59533_09_ch08_p207-226.indd 207 9533_09_ch08_p207-226.indd 207 28/03/08 /28/08

La gran tragedia de la ciencia: el asesinato de una hermosa hipótesis por un
hecho feo. (TH HUXLEY)
En este capítulo, examinamos dos procesos cognitivos básicos: la atención y el tiempo necesario
para responder a los estímulos. Nos centramos en los aspectos de la atención relacionados con cómo
las personas cambian sus recursos cognitivos de una tarea a otra. Con respecto al segundo tema,
consideramos tanto el comportamiento manifiesto (el tiempo de reacción para responder) como la
naturaleza y el momento de las ondas cerebrales que ocurren durante la actividad cognitiva. Las
cuestiones metodológicas examinadas son la confusión, la selección de la variable dependiente y las interac
ÿ EL ABC DEL TIEMPO DE REACCIÓN
El interés por el tiempo de reacción comenzó en el siglo XVIII, cuando un asistente del Observatorio
Real de Inglaterra fue despedido porque sus tiempos de reacción no concordaban con los tiempos de
reacción de su empleador. Los astrónomos de aquellos días registraban la hora y la posición de los
eventos astrales al observar cuando un cuerpo celeste cruzaba una línea en el ocular de su telescopio.
Un reloj cercano marcaba cada segundo, y se esperaba que el observador anotara el tiempo de cruce
con una precisión de décima de segundo. Cuando los tiempos de cruce de Kinnebrook, el desafortunado
asistente, eran revisados por su jefe, siempre eran demasiado largos. Kinnebrook fue advertido pero
no pudo acortar sus tiempos de observación, por lo que fue despedido.
Un astrónomo alemán, Bessel, se enteró del disparo de Kinnebrook y se preguntó si la diferencia
entre los tiempos de cruce de Kinnebrook y su jefe se debía a algo más que a la incompetencia. Bessel
sospechó que las personas podrían observar el cruce con tiempos de reacción ligeramente diferentes.
Cuando Bessel y otros astrónomos compararon sus tiempos de cruce, encontraron diferencias
sistemáticas consistentemente. Algunos astrónomos siempre hicieron estimaciones más rápidas que
otros. Esta diferencia entre los astrónomos al reaccionar a los tiempos de cruce de los cuerpos celestes
se denominó ecuación personal, un nombre que destaca el hecho de que las personas difieren en
sus tiempos de reacción y, por lo tanto, tienen su propia ecuación para estimar los tiempos de cruce.
La ecuación personal siguió siendo solo un problema para los astrónomos hasta que Donders, un
fisiólogo holandés, se dio cuenta de que podía usar los tiempos de reacción de las personas para
calibrar el tiempo requerido para varias operaciones mentales. Donders desarrolló tres tipos de tareas
de tiempo de reacción que todavía se conocen como reacciones de Donders A, B y C (ilustradas en la
figura 8.1).
En la reacción A, que a menudo se denomina reacción simple , se enciende un solo estímulo,
por ejemplo, una luz, y el observador responde presionando rápidamente una tecla o un botón.
Sólo hay un estímulo y una respuesta. Cuando apaga su despertador en respuesta a su fuerte señal,
el tiempo entre el inicio del sonido y la pulsación del botón de alarma es su tiempo de reacción simple.
Donders creía que la reacción A, o simple, proporcionaba una línea de base de las operaciones
cognitivas involucradas en reacciones más complicadas. Una reacción más compleja requerirá lo que
sucede en una reacción simple, que incluye procesos sensoriales, tiempo de conducción nerviosa,
tiempo de movimiento motor, etc., pero también tendrá operaciones cognitivas adicionales.
59533_09_ch08_p207-226.indd 208 9533_09_ch08_p207-226.indd 208 28/03/08 /28/08

S1 R1 jueves A
S1 R1
jueves b
S2 R2
S1 R1
jueves C
S2
ÿ FIGURA 8.1
En la parte superior está la tarea de reacción de Donders A. En este sencillo procedimiento de tiempo de reacción,
un estímulo está vinculado a una respuesta. En el medio está la tarea de reacción de Donders B. En este
procedimiento de tiempo de reacción, dos estímulos están vinculados a dos respuestas. En la parte inferior está la
tarea de reacción de Donders C, en la que hay dos estímulos pero solo uno está vinculado a una respuesta.
Las reacciones más complicadas, B y C, también se ilustran en la figura 8.1. En una reacción
B, que también se conoce como tiempo de reacción de elección, hay más de un estímulo y
más de una respuesta. Cada estímulo tiene su propia respuesta única.
Como se muestra en la figura 8.1, se supone que el observador hace R1 cuando ocurre S1 y R2
cuando ocurre S2 . Cuando su automóvil está en un semáforo, se enfrenta a una reacción B (o
de elección). Si el semáforo está en verde, pisas el acelerador; si es rojo, pisas el pedal del freno.
¿Qué operaciones cognitivas, además de las básicas, son necesarias para una reacción de
elección? Primero, debes identificar la luz como roja o verde. Luego debes seleccionar el pedal
que debes pisar. Por lo tanto, una reacción de elección incluye las operaciones básicas que
ocurren en una reacción simple, así como las operaciones cognitivas de identificación de
estímulos y selección de respuestas.
Para estimar el tiempo requerido para la identificación y selección, necesitamos determinar
un tercer tipo de reacción: la reacción de Donders C, que es la última en la Figura 8.1.
Aquí, como en la reacción B, hay más de un estímulo, pero sólo un estímulo está relacionado con
una respuesta. Si ocurre S1 , se supone que el observador hace R1; si ocurre cualquier otro
estímulo (S2), el comportamiento correcto es abstenerse de responder y no hacer nada.
Esperar en la fila en un restaurante de comida para llevar sería un ejemplo de una reacción C:
hasta que llamen a su número, no debe responder. ¿Qué operaciones cognitivas se necesitan
para realizar una reacción C? Al igual que en la reacción B, debe identificar su número cuando lo
llamen. Sin embargo, una vez que se logra esto, no hay necesidad de seleccionar una respuesta,
ya que solo una respuesta es apropiada. Entonces, la reacción C agrega selección de estímulo a
las operaciones de línea de base pero no incluye selección de respuesta.
Ahora podemos estimar el tiempo requerido para las operaciones cognitivas de identificación
y selección restando los pares apropiados de tiempos de reacción. La reacción C mide la
identificación más una variedad de tiempos de referencia. Por lo tanto, restar el tiempo de reacción
A (RT) del C RT nos dice cuánto tiempo toma la identificación. De manera similar, al restar el C
RT del B se estima el tiempo de selección del estímulo, ya que la reacción B incluye los tiempos
de identificación, selección y línea base, pero la reacción C incluye solo los tiempos de
identificación y línea base. Este procedimiento de estimar el tiempo que lleva realizar varias
operaciones cognitivas se llama método sustractivo. El método sustractivo que utiliza las
reacciones de Donders A, B y C se ilustra en la figura 8.2.
Al principio de la historia de la psicología, Wundt (ver Apéndice A) y sus estudiantes
dedicaron mucho esfuerzo a estudiar el tiempo de reacción usando el método de resta. Sin
embargo, el método pronto fue atacado por psicólogos que confiaban en la introspección como
59533_09_ch08_p207-226.indd 209 9533_09_ch08_p207-226.indd 209 28/03/08 /28/08

Un tiempo de reacción
Tiempo de reacción C
C menos A
B Tiempo de reacción
Tiempo de reacción C
B menos C
Tiempo de referencia
Tiempo de identificación
Tiempo de selección
ÿ FIGURA 8.2
Ilustración del método sustractivo de Donders.
un método de recopilación de datos. Como se señaló en el Apéndice A, la introspección era una

forma sistemática de examinar la propia conciencia, que fue muy utilizada por Titchener, el
psicólogo estructural estadounidense y sus alumnos. Cuando los introspeccionistas capacitados
realizaron las reacciones de Donders, notaron que una reacción C no se sentía como una reacción
A más algo más, ni una reacción B se sentía como una reacción C más algo más. En cambio, las
tres reacciones se sintieron completamente diferentes. Debido a que muchos psicólogos de la
época pensaban que la introspección era una poderosa herramienta para comprender los
procesos cognitivos, el método sustractivo de Donders quedó desacreditado. Hoy en día, los
psicólogos experimentales confían menos en los datos introspectivos, y los métodos de Donders
proporcionan la base para una gran cantidad de investigaciones y teorías importantes, algunas
de las cuales se examinan más adelante en este capítulo.
Confusión de temas
Ilustración Pura Inserción
El estudio contemporáneo de los procesos mentales complejos, como la atención, trata de dividir
un proceso complejo en un conjunto de componentes o módulos. ¿Cómo podemos identificar
estos módulos componentes? Un criterio importante es la modificabilidad separada (Sternberg,
2001). Esta es una forma de independencia que ocurre cuando se puede cambiar un módulo de
componente sin cambiar el otro. Si el módulo A, por ejemplo, la ejecución de la respuesta, puede
cambiarse sin alterar el funcionamiento mental del módulo B, por ejemplo, la percepción, y el
módulo B puede cambiarse sin alterar el módulo A, entonces los dos procesos mentales son
modificables por separado.
59533_09_ch08_p207-226.indd 210 9533_09_ch08_p207-226.indd 210 28/03/08 /28/08

Variables dependientes alguna tarea es aumentar su complejidad; por lo tanto,

una versión simple de una tarea puede requerir nombrar
En los estudios de atención, el rango de variables un dígito presentado visualmente, mientras que una
dependientes es considerablemente más restringido que decisión más compleja puede requerir restar el dígito de nueve.
el de las variables independientes. El tiempo de reacción El punto clave en la manipulación de la atención es
es, con mucho, la variable preferida y se usa ampliamente. aumentar gradualmente las demandas de las tareas hasta
También se utiliza el porcentaje de respuestas correctas, que la persona se sienta en apuros para seguirlas.
especialmente en estudios de atención en los que la El uso de la sobrecarga como dispositivo de diagnóstico
memoria juega un papel. Cuando un experimento se ha sido tomado de la ingeniería, donde es bastante
enmarca dentro del contexto de un modelo particular, común. Por ejemplo, la resistencia de los materiales se
como la teoría de la detección de señales (ver Capítulo prueba colocándolos en una prensa hidráulica y
6), las estadísticas derivadas como d' y también se usan como aumentando gradualmente la presión hasta que el material
variables dependientes. Otra estadística común es la falla. Esto le da al ingeniero metalúrgico información sobre
cantidad de información en bits, donde un bit es la el material que no podría obtenerse fácilmente de la
información presente en el lanzamiento de una moneda estructura intacta. Aunque se requiere un método mucho
justa que puede salir cara o cruz. Estas estadísticas más suave para imponer una sobrecarga para el estudio
derivadas pueden combinarse con el tiempo de reacción de la atención humana, las metas y técnicas subyacentes
para producir medidas de la tasa de rendimiento, como son similares a las del ingeniero.
bits/seg o d'/seg.
Las variables dependientes en electroencefalografía Al descubrir cómo reacciona el sistema humano a las
(EEG) y estudios de potencial relacionado con eventos sobrecargas de información, el psicólogo obtiene
(ERP) se centran en la ubicación del cambio de voltaje, información sobre el desempeño humano y el
su patrón a lo largo del tiempo y la dirección y el momento procesamiento de la información con cargas de atención
del cambio después del inicio del estímulo. Los recientes más razonables.
avances tecnológicos han permitido a los investigadores
examinar los cambios en los patrones de actividad Variables de control
eléctrica de todo el cerebro a lo largo del tiempo. Las
imágenes resultantes de la actividad cerebral arrojan La investigación sobre la atención y el tiempo de reacción
información similar a la que se observa en varios tipos de suele controlarse con mucho cuidado. Los factores de
percepción, como la intensidad y la duración de los
escáneres cerebrales, como las tomografías computarizadas (TC).
estímulos, a menudo están bajo el control de una
Variables independientes computadora u otro equipo automatizado que realiza el
experimento. Incluso los sonidos del habla se pueden
Aunque los estudios de atención y tiempo de reacción presentar exactamente de la misma manera prueba tras
han utilizado una variedad impresionante de variables prueba usando una “computadora parlante”. Este control
independientes, estas variables se centran en la necesidad preciso es necesario si los psicólogos han de interpretar
del ser humano de tomar decisiones y la velocidad a la pequeños cambios en el tiempo de reacción del orden de
que se pueden tomar tales decisiones. Por lo tanto, variar decenas de milisegundos (1 milisegundo es igual a una
el número de alternativas en una tarea de reacción de milésima de segundo).
elección aumenta el número de decisiones que deben Asimismo, para registrar cambios eléctricos en
tomarse para identificar el estímulo correcto y seleccionar microvoltios, se necesita un control preciso en
su respuesta asociada. Variar la tasa de presentación de investigaciones que utilizan EEG y ERP como variables
una serie de estímulos limita la cantidad de atención que dependientes. Se utiliza un equipo de registro sofisticado
se puede dedicar al procesamiento de cada estímulo y es que puede filtrar la actividad eléctrica extraña junto con
una técnica común utilizada para estudiar los límites amplificadores y computadoras que permiten una
superiores de la atención. Otra forma de incrementar la especificación precisa de los cambios eléctricos que son
atención demandada por de interés.
59533_09_ch08_p207-226.indd 211 9533_09_ch08_p207-226.indd 211 28/03/08 /28/08

Por lo tanto, los tres componentes de una reacción de Donders B (Figura 8.2) son módulos (o
etapas) distintos y separados de procesamiento de información. Esta es una declaración teórica y
necesita ser confirmada por experimentos apropiados. Si Donders estaba en lo correcto, entonces
esperaríamos que las tres etapas fueran modificables por separado. Para probar este modelo teórico de
procesamiento de información, debemos encontrar alguna medida (variable dependiente) que esté
influenciada por todas las etapas o módulos de procesamiento. Como muestra la figura 8.2, el tiempo
de reacción es una medida de este tipo. Pero todavía no podemos probar la modificabilidad separada
hasta que primero especifiquemos cómo cada etapa de procesamiento contribuye a la medida. Una
regla de combinación simple es que el tiempo de reacción total es la suma de los tiempos de reacción de las
Debido a que esta regla establece que debemos sumar los tiempos de las etapas individuales, este
método de análisis se denomina método del factor aditivo (Sternberg, 2001).
Cuando los procesos mentales son modificables por separado, la adición (o supresión) de un
proceso no afecta a los otros procesos. El método de factores aditivos incluye la suposición de que la
duración de una etapa (tiempo de procesamiento de la etapa) no depende de la duración de otras
etapas. Así, cuando se añade o elimina algún otro proceso mental, nada sucede con la duración de la
etapa original. Esto se llama el supuesto de inserción pura: un módulo mental puede agregarse o
eliminarse sin alterar la duración de otros módulos.
Es importante darse cuenta de que, si bien el modelo de etapas de Donders predice un orden de
los tiempos de reacción A, B y C, no prueba directamente la suposición de inserción pura. En términos
matemáticos, hay tres ecuaciones y tres incógnitas que se estiman mediante estas ecuaciones. Dado
que el número de ecuaciones e incógnitas es igual, no es matemáticamente posible probar la validez
del supuesto de inserción pura. (En otras palabras, la suposición se usó para generar los resultados y
no quedan grados de libertad para validar la suposición). Mientras que los primeros investigadores
rechazaron la suposición de inserción pura basada en informes introspectivos (Kulpe, 1893), los
investigadores contemporáneos prefieren pruebas de comportamiento más objetivas.
Por lo tanto, podría resultar útil agregar otra medida además del tiempo de reacción.
Se ha demostrado que la fuerza de respuesta, la cantidad de presión ejercida sobre una tecla de
respuesta, es una medida adicional útil en estudios de procesamiento de información humana. Por
ejemplo, la fuerza de respuesta aumenta a medida que aumenta la intensidad del estímulo (Miller, Franz
y Ulrich, 1999) e incluso se puede observar y relacionar con variables independientes cuando no se
exige una respuesta abierta y no se puede medir el tiempo de reacción (Kantowitz, 1972).
Ulrich, Mattes y Miller (1999) realizaron una serie de cinco experimentos que midieron tanto el
tiempo de reacción (RT) como las variables dependientes de la fuerza para las reacciones A, B y C. Su
primer experimento presentó un estímulo visual (LED verde) a la izquierda oa la derecha de un punto
de fijación central. Para la reacción A, los participantes respondieron a cualquiera de las luces con la
misma mano. Para la reacción B, respondieron a la luz de la izquierda con la mano izquierda o a la luz
de la derecha con la mano derecha. La Figura 8.3 muestra sus resultados.
B RT fue significativamente mayor que A RT, como era de esperar. Sin embargo, la fuerza integrada (el
área bajo una curva que muestra la fuerza en función del tiempo) no difirió en las dos reacciones. Este
resultado es consistente con la hipótesis de inserción pura, porque la fuerza de respuesta es la misma
independientemente del tipo de reacción.
Sin embargo, hay algunos problemas potenciales con este experimento. confuso
ocurre cuando se varía simultáneamente más de una variable independiente, de modo que no podemos
estar completamente seguros de qué variable es responsable del resultado. En un experimento estándar
de reacción A de Donders, generalmente solo se asigna un estímulo a la respuesta.
En este experimento, dos estímulos (LED izquierdo y derecho) se asignaron a la respuesta.
59533_09_ch08_p207-226.indd 212 9533_09_ch08_p207-226.indd 212 28/03/08 /28/08

RT ÿ FIGURA 8.3
Fuerza
RT y Fuerza Integrada para Reacciones A y
298
B. (Datos de Ulrich et al., 1999, experimento 1.)
261
(ms)
TR
Fuerza
(cN)
111 110
A B
Tarea
Por lo tanto, existe la posibilidad de que tener que dividir la atención entre dos luces, en lugar
de tener que enfocarse solo en una sola luz, podría cambiar la forma en que se realiza esta
reacción modificada de Donders A. Además, la RT también es proporcional a la intensidad de
un estímulo visual (Ulrich y Mattes, 1996), de modo que los estímulos más brillantes producen
una RT más rápida. Esto se vuelve especialmente importante para las reacciones C donde el
participante solo necesita mirar la luz que está asignada a la respuesta. A los autores les
preocupaba que el brillo aparente se confundiera en la reacción C e hicieron un experimento
especial (experimento 5) para verificar posibles confusiones. Llegaremos a ese experimento en
breve, pero primero debemos discutir sus experimentos que compararon las reacciones B y C.
La figura 8.4 muestra los resultados de un experimento que midió la fuerza y RT para las
reacciones B y C. En la reacción C, los participantes debían responder solo al LED en un lado
del punto de fi jación; no se requirió respuesta para el otro LED. Una vez más, no hubo diferencia
en la fuerza integrada. Sin embargo, ¡tampoco hubo diferencia entre los RT B y C! Esto no es
en absoluto lo que deberíamos esperar: la reacción B debería
RT ÿ FIGURA 8.4
Fuerza
RT y Fuerza Integrada para Reacciones B y
295 291 C. (Datos de Ulrich et al., 1999, experimento 3).
(ms)
TR
Fuerza
(cN)
116 120
B C
59533_09_ch08_p207-226.indd 213 9533_09_ch08_p207-226.indd 213 28/03/08 /28/08

tomar más tiempo que la reacción C. Si bien los autores intentan explicar este resultado, no son
convincentes. Estrictamente hablando, los RT iguales argumentan en contra del modelo presentado en
la Figura 8.2. Por lo tanto, los autores de su libro de texto (especialmente el que escribe este capítulo) se
muestran escépticos acerca de los resultados y la interpretación de este experimento de la serie.
La figura 8.5 muestra los resultados de un experimento que midió la fuerza y RT para las reacciones
A y C. En este experimento, tanto la RT como la fuerza fueron significativamente diferentes para las
reacciones A y C. La diferencia de RT es lo que esperaríamos de la figura 8.2. Sin embargo, la mayor
fuerza de la reacción C no es consistente con la hipótesis de inserción pura.
Los autores realizaron otro experimento debido a la posible confusión de la intensidad aparente del
estímulo en la reacción C, donde los participantes podían enfocar su visión por completo en uno de los
dos estímulos. En este experimento, los LED fueron reemplazados por las letras X y S en la pantalla de
una computadora. Dado que las letras siempre se presentaban en el centro de la pantalla, los participantes
no podían concentrarse en un solo lado para la reacción C.
La Figura 8.6 muestra los resultados. Estos resultados son muy satisfactorios. Primero, la reacción B
toma más tiempo que la reacción C, como se esperaba. Segundo, la fuerza es la misma para ambas
reacciones, lo cual es consistente con la inserción pura.
ÿ FIGURA 8.5 RT
Fuerza
RT y Fuerza Integrada para Reacciones A y
C. (Datos de Ulrich et al., 1999, experimento 4). 292
262
(ms)
TR
Fuerza
(cN)
137
126
A C
ÿ FIGURA 8.6 RT
Fuerza
RT y Fuerza Integrada para Reacciones B y
C. (Datos de Ulrich et al., 1999, experimento 5). 412
339
(ms)
TR
Fuerza
(cN)
100 100
B C
59533_09_ch08_p207-226.indd 214 9533_09_ch08_p207-226.indd 214 28/03/08 /28/08

¿Cómo podríamos resumir los resultados y conclusiones de estos experimentos? Los resultados
son más difíciles de comparar porque cada experimento probó solo dos tipos de reacciones de
Donders. Los experimentadores hicieron esto intencionalmente para minimizar la transferencia
negativa entre reacciones. En los diseños dentro del sujeto, existe la posibilidad de que la exposición
a una condición cambie el desempeño en una condición posterior. Sin embargo, la mejor manera de
evitar la transferencia negativa es utilizar un diseño entre sujetos en el que cada participante esté
expuesto a un solo tipo de reacción de Donders. Si no se anticipa una transferencia negativa, los
diseños dentro del sujeto donde cada participante experimenta las tres reacciones de Donders son
más eficientes. Los experimentadores eligieron un compromiso débil al incluir solo dos reacciones de
Donders. Si estuvieran realmente preocupados por la transferencia negativa, habría sido preferible un
diseño entre sujetos. Si no estuvieran muy preocupados por la transferencia negativa, tendría más
sentido probar las tres reacciones de Donders en el mismo experimento.
Los resultados del experimento que se muestra en la Figura 8.4 son problemáticos. Sería una
buena idea replicar este experimento incluyendo las tres reacciones de Donders en el mismo
experimento. Sin embargo, con base en los otros experimentos de la serie, parece razonable concluir
que el modelo propuesto por Donders (Figura 8.2) es correcto y que la suposición de inserción pura
es válida. Sin embargo, los experimentadores aceptan esta conclusión solo para las reacciones de
Donders A y B y argumentan que los datos de fuerza rechazan la inserción pura para la reacción C.
Su argumento depende, en parte, de discusiones sobre la mejor manera de calificar la fuerza de
respuesta que son demasiado detalladas para este libro de texto. Está claro que incluso cinco
experimentos no son suficientes para evaluar la inserción pura, y aunque ha pasado más de un siglo
desde que Donders (1868) introdujo el método de la lógica sustractiva, los investigadores modernos
continuarán estudiando y ponderando sus ideas.
Tema Selección de la variable dependiente

Intercambio entre velocidad de ilustración y precisión
Como se discutió en el Capítulo 3, el experimentador selecciona una o más variables dependientes

del gran número que es posible. En ese capítulo, sugerimos que a menudo es muy importante tener
más de una variable dependiente en un experimento.
Ilustraremos cuán importante es tener más de una variable dependiente en esta sección.
Una variable dependiente muy popular utilizada en la investigación sobre la atención y el

procesamiento de la información es RT. De hecho, esta variable es tan popular que el estudio del
tiempo de reacción se ha convertido virtualmente en un área de contenido en sí misma. Cuando los
psicólogos experimentales se reúnen, es bastante común que algunos de ellos identifiquen sus
intereses de investigación diciendo: "Estoy en tiempo de reacción". Esto puede sonar extraño para
usted, ya que un psicólogo que estudia la memoria no diría: "Tengo un porcentaje correcto", pero
indica que una variable dependiente puede volverse tan importante que no es solo un medio para
investigar áreas de contenido específicas. pero también un objeto de estudio por derecho propio.
Al principio, uno podría pensar que RT sería un tema pobre para ilustrar la selección de una
variable dependiente, ya que al nombrar el tiempo de reacción ya hemos hecho la selección. Es cierto
que algunos psicólogos miden rutinariamente RT sin pensar en
59533_09_ch08_p207-226.indd 215 9533_09_ch08_p207-226.indd 215 28/03/08 /28/08

las implicaciones de esta decisión de selección. Ahora mismo, RT está de moda. La velocidad con la que
se puede realizar una tarea a menudo se toma como una indicación de los requisitos de atención de la
tarea. Las cosas que se pueden hacer rápidamente se interpretan como que tienen pequeños requisitos
de atención. Esta lógica no siempre es correcta, ya que la atención se puede definir operativamente de
manera que no es necesario que implique tiempo de reacción.
Existe una relación inversa entre la velocidad y la precisión de la ejecución.
Cuando intentas hacer algo muy rápido, cometes más errores que si lo haces lentamente. Por el contrario,
si trata de hacer algo, como escribir un trabajo final, con mucha precisión, debe hacerlo más despacio
para lograr la precisión deseada. Los psicólogos llaman a esta relación la compensación entre
velocidad y precisión. Tiene implicaciones importantes para los estudios que miden RT como la variable
dependiente.
Esto puede ilustrarse con un experimento realizado por Theios (1973), en el que la tarea del
participante era bastante simple. Un dígito se presentó visualmente; el participante solo necesitaba
nombrar el dígito. La variable independiente era la probabilidad (frecuencia relativa) de los dígitos, que
variaba de 0,2 (un dígito en particular se presentaba el 20 por ciento de las veces) a 0,8. Los datos de
RT de este experimento se muestran en la Figura 8.7. Theios concluyó que la probabilidad de estímulo
no tenía efecto sobre el tiempo de reacción.
Esta conclusión parece bastante razonable cuando se ignoran los errores. Pero cuando se
consideran los datos de error que también se muestran en la figura 8.7, surge otra interpretación
(Pachella, 1974). La tasa de error promedio del 3 por ciento puede no parecerle muy alta, pero deténgase
y piense en lo simple que fue la tarea. Todo lo que se requería era nombrar un dígito, una tarea
difícilmente devastadora para los estudiantes universitarios. Peor aún, la tasa de error varió
ÿ FIGURA 8.7 360
RT y Tasa de Error en Función RT

(milisegundo)
350
de la Probabilidad del Estímulo. RT
Aunque el tiempo de reacción es 340
bastante constante, la tasa de error
disminuye a medida que aumenta
330
la probabilidad de estímulo.
(Datos de Theios, 1973 y
Pachella, 1974).
6
4
Tasas de error
Porcentaje
error
de 3
.2 .3 .4 .5 .6 .7 .8
Probabilidad de estímulo
59533_09_ch08_p207-226.indd 216 9533_09_ch08_p207-226.indd 216 28/03/08 /28/08

sistemáticamente de acuerdo con la probabilidad de estímulo, la variable independiente. La tasa de error
más alta (6 por ciento) ocurrió con la probabilidad de estímulo más baja; a medida que aumentaba la
probabilidad, disminuía la tasa de error. ¿Cuáles habrían sido los RT si las tasas de error fueran iguales
para todos los niveles de probabilidad de estímulo? De acuerdo con el equilibrio entre velocidad y
precisión, los tiempos de reacción en las condiciones de baja probabilidad de estímulo tendrían que
aumentar para disminuir la tasa de error. Pachella (1974) ha sugerido que para reducir las tasas de error
al 2 por ciento, la RT en la condición de probabilidad de estímulo de 0,2 podría aumentar hasta 100
milisegundos. Entonces, la conclusión de que la probabilidad del estímulo no afecta el RT debe
cuestionarse una vez que se consideran las tasas de error.
El problema básico aquí radica en la selección de RT como la única variable dependiente
importante. Dado que el tiempo de reacción depende, en parte, de la tasa de error, debemos considerar
tanto la velocidad como la precisión como variables dependientes. En resumen, RT no es una variable
dependiente univariante sino una variable multivariante. Puede reducirse a una sola variable dependiente
en algunos casos donde la tasa de error es constante en todos los niveles de las variables independientes;
pero en general, dos variables dependientes—RT y tasa de error—deben ser consideradas conjuntamente.
Este punto se enfatizará con referencia a los experimentos de atención dividida realizados por
Pashler (1989). Estos experimentos también ilustran que examinar más de una variable dependiente
puede ser crucial para comprender los procesos psicológicos involucrados en la tarea experimental. En
una serie de seis experimentos, Pashler usó una modificación de la tarea Donders B (tiempo de reacción
de elección) (ver Figura 8.1). La modificación importante fue que S1 y S2 no se presentaron
simultáneamente. Más bien, hubo un breve retraso entre los dos estímulos. Un intervalo entre S1 y S2
se denomina asincronía de inicio de estímulo (SOA), y el procedimiento se muestra en la figura 8.8.
Pashler estaba interesado en observar los efectos de variar SOA entre S1 y S2

porque desde hace tiempo se sabía que a medida que SOA se acortaba, el tiempo de reacción a S2 se
alargaba (p. ej., Herman y Kantowitz, 1970). Por lo tanto, existe una relación inversa entre la longitud de
SOA y la velocidad de creación de R2. Este fenómeno se ha denominado período refractario
psicológico, un período en el que las actividades cognitivas adicionales son difíciles de manejar.
Aparentemente, debe haber un retraso bastante largo entre los estímulos para que las actividades
necesarias para hacer que R2 no interfieran en el período refractario.
Si vuelve a examinar la figura 8.2, verá que hay varias razones posibles por las que un período más
corto entre estímulos conduciría a una ralentización de la segunda respuesta. Podría haber problemas
para identificar S2, seleccionar R2 o ejecutar R2. Pashler esperaba determinar cuál de estos era
responsable del período refractario.
En la figura 8.9 se ilustra un ejemplo del período refractario psicológico. El tiempo de reacción de
R2 se muestra con la línea continua. A medida que se acorta la longitud de la SOA (el intervalo entre los
dos estímulos), el tiempo para hacer R2 se alarga. Note, también, que
Tiempo
S1 R1
ÿ
ÿ
ÿ S2 R2
SOA
ÿ FIGURA 8.8
El paradigma de los dos estímulos para el estudio del período refractario

psicológico. El intervalo entre S1 y S2 es la asincronía de inicio de estímulo (SOA).
59533_09_ch08_p207-226.indd 217 9533_09_ch08_p207-226.indd 217 28/03/08 /28/08

1000 10.00
errores
925
850
errores
R2
en
de
% 9.25
8.50
RT
reacción
Tiempo
(ms)
R2
de
775 7.75
700 7.00
50 150 650
Intervalo S1–S2 (ms)

ÿ FIGURA 8.9
RT y errores para R2 en función de SOA entre S1 y S2. El aumento de errores con

disminuciones en RT es un ejemplo del equilibrio entre velocidad y precisión. El RT lento
asociado con el SOA más corto es un ejemplo del período refractario psicológico.
(Adaptado de Cognitive Psychology, Vol. 21, 1989, 459–514, “Disociation and dependies
between speed and precision: Evidence for a two-component Theory of Divided Attention in
Simple Tasks”, por H. Pashler en el experimento 4. Derechos de autor © 1989, con
autorización de Elsevier.)
los errores aumentaron a medida que disminuyó el tiempo de reacción. Este es un claro ejemplo de una compensación
entre velocidad y precisión. Aunque el aumento de errores en las SOA es pequeño (alrededor del 1,5 por ciento), es
un aumento estadísticamente significativo.
Los resultados que se muestran en la figura 8.9 provienen de un experimento (Pashler, 1989, experimento 4)
en el que S1–R1 eran tonos que conducían a presionar teclas con la mano izquierda y S2–R2.
eran una pantalla de dígitos y una respuesta vocal: el observador decía el nombre del dígito más alto en una pantalla
de ocho dígitos. Esta tarea no es muy exigente, especialmente porque R1 y R2 son marcadamente diferentes, pero
tenga en cuenta que alargar la SOA en 100 ms (una décima de segundo) condujo a una aceleración en el tiempo de
reacción de aproximadamente 75 ms. Al alargar la SOA de 150 milisegundos a 650 milisegundos, se redujo aún más
el tiempo para hacer R2 en unos 140 ms. Así, incluso con comportamientos más bien elementales, el período refractario
psicológico impone severas limitaciones a nuestra capacidad de responder rápidamente a un segundo estímulo. La
compensación entre velocidad y precisión en este experimento es interesante, porque en un experimento por lo demás
idéntico, Pashler demostró que la precisión de R2 no estaba relacionada con SOA cuando no se requería que los
sujetos respondieran rápidamente a S2. Por lo tanto, la precisión de R2 sufre solo cuando debe hacerse rápidamente.
Si Pashler hubiera examinado la precisión de R2, habría observado lo contrario de un período refractario psicológico.
Esto ilustra la importancia de tener múltiples medidas de comportamiento.
¿Cuáles son las causas del efecto del período refractario que se ve en la figura 8.9? Una posibilidad sostiene
que cuanto más cerca en el tiempo están los dos estímulos, más difícil es ejecutar dos respuestas. Esto parece poco
probable, dado que las dos respuestas fueron muy diferentes:
uno manual, el otro vocal. De hecho, dar respuestas vocales y manuales en tareas cotidianas, como conducir, parece
trivialmente fácil. ¿Es una dificultad de selección de estímulos? Esto también parece poco probable, porque los
estímulos son muy diferentes entre sí. en experimentos
59533_09_ch08_p207-226.indd 218 9533_09_ch08_p207-226.indd 218 28/03/08 /28/08

en el que S1 y S2 son muy similares, Pashler descubrió que la tasa de error en R2 es más alta para las
SOA muy cortas. Esto es lo contrario de lo que se ve en la Figura 8.9. El efecto de selección en SOA
cortos probablemente surge debido a la superposición de procesos de percepción similares cuando los
dos estímulos son muy similares. Los problemas de selección de estímulos no pueden explicar el
período refractario psicológico cuando los estímulos son diferentes.
Pashler argumentó que el efecto de las SOA cortas en la ralentización de R2 es el resultado de
las dificultades de selección de respuestas y, para aclarar esa posición, analizó otra variable
dependiente. Examinó el tiempo para hacer R2 después de tiempos de R1 rápidos y no tan rápidos .
Esperaba que R2 ocurriera más rápidamente después de las respuestas rápidas de R1 que después
de las lentas, porque si R1 se apartaba rápidamente, permitiría una selección más rápida de R2. En
varios experimentos, descubrió que cuanto más rápido se ejecuta R1 , más rápido es R2, especialmente
cuando SOA es muy corto. Esto parece indicar que el observador debe posponer la selección de la
segunda respuesta hasta que seleccione la primera. El hecho de que el efecto del período refractario
sea casi el mismo independientemente de la similitud entre R1
y R2 también es consistente con la idea de que las SOA abreviadas conducen a un aplazamiento en la
selección de la segunda respuesta y no a dificultades en la identificación del estímulo.
El trabajo de Pashler es especialmente claro al ilustrar la utilidad de seleccionar cuidadosamente
las variables dependientes en un experimento. Pudo aumentar nuestra comprensión del período
refractario psicológico mediante una selección juiciosa de varias variables dependientes.
Explicaciones Teóricas del Período Refractario Psicológico

Como se explicó en el Capítulo 1, la ciencia requiere datos y teoría. El paradigma del período
refractario psicológico ha sido bastante productivo en la generación de modelos para explicar cómo las
personas procesan tareas superpuestas. El primer modelo (Telford, 1931) se basó en una analogía
con el período refractario de una sola neurona: cuando una neurona se excita, no puede dispararse
nuevamente dentro de un período corto después de la excitación original. Esta explicación de la
superposición de tareas sostenía que todo el cerebro era refractario y que el procesamiento del primer
estímulo impedía, por un breve tiempo, cualquier procesamiento posterior de los estímulos. Si bien este
modelo ha sido rechazado por muchas razones (Herman & Kantowitz, 1970), el título descriptivo
incorrecto “período refractario psicológico” permanece como una especie de apéndice vermiforme
histórico.
Los modelos teóricos actuales se dividen en dos clases: cuello de botella central y capacidad
compartida central. Los modelos de cuello de botella central (Navon y Miller, 2002; Pashler, 1994)
establecen que ambas tareas requieren una etapa común de procesamiento interno, por lo que el
procesamiento de la segunda tarea debe posponerse hasta que la etapa que está ocupada procesando
la primera tarea esté disponible. . Los modelos de intercambio de capacidad central (Broadbent, 1971;
Kantowitz & Knight, 1976; Tombu & Joliceur, 2003) postulan un recurso teórico llamado capacidad, en
muchos aspectos similar a la capacidad de procesamiento de información de un sistema informático
que debe compartirse entre tareas. Si bien se pueden procesar dos tareas simultáneamente, esto se
logrará con menor eficiencia que si el sistema tuviera solo una tarea para procesar.
La figura 8.10 muestra cómo los modelos de cuello de botella explican un RT más prolongado para el segundo
estímulo a medida que disminuye la SOA. El cuello de botella del procesamiento es la barra sombreada. En las SOA
cortas, el procesamiento de la tarea 2 debe esperar hasta que se elimine el cuello de botella de la tarea 1. En SOA
largos no hay superposición en el procesamiento de cuello de botella, por lo que el RT al segundo estímulo no se
retrasa. En los SOA intermedios hay una superposición parcial, de modo que la RT al segundo estímulo se retrasa parcialm
Los modelos de capacidad central hacen la misma predicción pero por una razón diferente. En las
SOA cortas, cada etapa está operando a una eficiencia inferior a la total, ya que la capacidad debe ser
59533_09_ch08_p207-226.indd 219 9533_09_ch08_p207-226.indd 219 28/03/08 /28/08

ÿ FIGURA 8.10 SOA corto
Explicación del cuello de botella del S1 - R1

efecto del período refractario
psicológico.
S2 - R2
RT2
(a)
SOA intermedio
S1 - R1
S2 - R2
RT2
(b)
SOA largo
S1 - R1
S2 - R2
RT2
(C)
ÿ FIGURA 8.11 SOA corto
Capacidad compartida Explicación S1 - R1
del efecto del período refractario

psicológico.
S2 - R2
RT2
compartidos durante la superposición de tareas, como lo indica la parte central sombreada de la Figura 8.11.
Por lo tanto, RT aumenta.
Dado que ambas clases de modelos predicen el efecto del período refractario psicológico, ¿cómo podemos
determinar cuál es el correcto? Una forma es examinar RT al primer estímulo.
En SOA cortos, esto también se retrasa (Herman & Kantowitz, 1970). Los modelos de cuello de botella no
predicen demoras en RT porque el procesamiento de la tarea 2 no comienza hasta que se completa el
procesamiento de la tarea 1. Los modelos de capacidad compartida predicen un retraso porque la capacidad de
procesamiento de la tarea 1 disminuye tan pronto como comienza el procesamiento de la tarea 2.
Tombu y Joliceur (2003) revisaron cuidadosamente ambos tipos de modelos y llegaron a la conclusión
de que los modelos de capacidad compartida son preferibles, en gran parte debido al retraso del RT al primer
estímulo. Sus conclusiones se basan en datos y teorías publicadas hace más de 30 años, así como en
experimentos recientes. En ciencia, los buenos datos y modelos son eternos. A diferencia de la moda, la última
publicación no es automáticamente la mejor. El valor de las ideas y resultados anteriores no necesariamente se
desvanece con el tiempo. Esta es una de las razones por las que los científicos otorgan un gran valor a la
publicación de los resultados: es posible que nuestro trabajo siga siendo útil mucho después de que ya no
seamos investigadores activos.
59533_09_ch08_p207-226.indd 220 9533_09_ch08_p207-226.indd 220 28/03/08 /28/08

Efectos de la interacción del tema

Ilustración Control Cognitivo
Una interacción ocurre cuando los efectos de una variable independiente no son idénticos en
diferentes niveles de otras variables independientes. Como mencionamos en el Capítulo 3, la búsqueda
de interacciones es una de las principales razones para incluir más de una variable independiente en
un experimento. Puede detectar interacciones en los resultados graficados buscando líneas que no
sean paralelas. La comprensión de los efectos de la interacción a menudo plantea cierta dificultad
para el nuevo investigador, por lo que los discutimos aquí y otra vez en el Capítulo 10.
La capacidad de cambiar dinámicamente su foco de atención de un aspecto de un estímulo a
un aspecto diferente se denomina control cognitivo y es un tema principal en el estudio de la atención
que ha sido de interés para los psicólogos durante muchos años. Imagine un experimento en el que
debe responder lo más rápido posible a uno de los cuatro estímulos: un cuadrado rojo, un círculo rojo,
un cuadrado azul y un círculo azul. Si no tiene información anticipada antes de que se presenten los
estímulos, esta es una tarea de tiempo de reacción de Donders B de cuatro opciones.
Pero si tuviera información anticipada parcial que limitara el conjunto de alternativas posibles a solo
dos estímulos, por ejemplo, si supiera de antemano que se presentaría un cuadrado, su tiempo de
reacción será más rápido que un RT de cuatro opciones. Si el tiempo entre la señal que presenta
información de avance parcial y el estímulo es lo suficientemente largo, la TR al estímulo indicado será
igual a la TR de dos opciones (p. ej., Kantowitz y Sanders, 1972).
El tiempo entre la señal y el estímulo se denomina intervalo señal-estímulo; a menudo está en el rango
de 100 a 1000 ms.
Estrés y Control Cognitivo

Es interesante preguntarse cómo el estrés podría afectar el control cognitivo. Hay dos posibilidades
principales. En primer lugar, manejar el estrés podría requerir capacidad o atención, lo que disminuiría
el rendimiento porque los recursos dedicados al estrés ya no están disponibles para procesar los
estímulos (Broadbent, 1971). En segundo lugar, las personas pueden adaptarse a los recursos
agotados seleccionando una estrategia de procesamiento más eficiente para lidiar con los estímulos
perceptivos, de modo que una mayor selectividad mejore el desempeño (Steinhauser, Maier y Hubner,
2007). (Existen, por supuesto, incluso más posibilidades, como la creación de estrés para una nueva
capacidad adicional, que no consideraremos aquí).
Para responder a esta pregunta, ¿el estrés mejora el control cognitivo? Steinhauser y asociados
(2007) realizaron un experimento sencillo. Crearon dos niveles de estrés, Alto y Bajo, presentando
preguntas de opción múltiple que eran fáciles o difíciles: De hecho, algunas de las preguntas de alto
estrés eran insolubles. Después de completar esta prueba de CI, presentaron estímulos que consistían
en un dígito y una letra (por ejemplo, 6M).
Indicaciones específicas de que los sujetos deben responder al dígito oa la letra. Para la tarea de la
letra, los sujetos tenían que decidir si la letra era una consonante o una vocal. Para la tarea de dígitos,
los sujetos tenían que decidir si el dígito era par o impar. Los sujetos respondieron presionando uno
de los dos botones y se registró RT. El intervalo señal-estímulo fue Corto (200 mseg) o Largo (1000
mseg). Se alternaron bloques de intervalos de estímulo de señal cortos y largos, y el bloque de inicio
se equilibró entre los sujetos (véanse los Capítulos 3 y 9 para ver las discusiones sobre el contrapeso).
En intentos sucesivos dentro de un bloque de 48 intentos, las tareas pueden repetirse (p. ej., dígito
seguido de dígito) o cambiarse (p. ej., dígito seguido de letra).
59533_09_ch08_p207-226.indd 221 9533_09_ch08_p207-226.indd 221 28/03/08 /28/08

Los resultados de este experimento se muestran en la Figura 8.12. Para la condición de

bajo estrés, hubo una interacción entre el intervalo de estímulo-cue y el cambio de tarea-
repetición. Esta interacción desapareció para la condición de Alto Estrés. Aunque el RT medio
fue similar para ambos grupos, los patrones de control cognitivo fueron diferentes. Bajo estrés
bajo hubo un costo relativamente mayor para cambiar tareas en el intervalo corto de señal-
estímulo. En otras palabras, la diferencia entre los dos RT para el intervalo Corto fue mayor
que la diferencia para el intervalo Largo cuando el estrés fue Bajo. Pero bajo estrés alto, el
costo de cambiar tareas fue el mismo para intervalos de estímulo de señal cortos y largos.
Este resultado es consistente con la segunda predicción dada al comienzo de esta sección: la
introducción del estrés provoca un cambio en la estrategia cognitiva.

LA TUERCAS Y PERNOS
Problema para medir la atención

Algunas de las cosas que hacemos parecen proceder de manera bastante automática, y otras
parecen requerir una gran concentración. Las habilidades motrices, como caminar, no requieren
mucho esfuerzo mental, mientras que hacer cálculos mentales puede ser bastante agotador.
Para estudiar los requisitos de atención de varias tareas, debemos tener alguna forma de
medirlo.
59533_09_ch08_p207-226.indd 222 9533_09_ch08_p207-226.indd 222 28/03/08 /28/08

Problema ¿Cómo podemos determinar la cantidad de atención o esfuerzo mental
que podría requerir cualquier tarea arbitraria?
Como suele ser el caso, este problema debe refinarse aún más; se deben formular
algunas hipótesis antes de que se pueda intentar cualquier solución significativa.
Hipótesis El aumento de las demandas de atención irá acompañado de un

aumento del estrés, que se manifestará como un cambio en alguna medida
fisiológica de la función corporal.
Esta hipótesis es un poco vaga, porque no especifica con precisión la variable
dependiente. Hay muchos correlatos fisiológicos del comportamiento, y no queda claro
a partir de la hipótesis si el experimentador debe registrar la frecuencia cardíaca, la
respuesta galvánica de la piel, las ondas cerebrales o realizar un análisis químico de las
exhalaciones respiratorias. Esta dificultad podría sortearse decidiendo registrar cada
medida fisiológica que pudiera instrumentarse convenientemente. De hecho, el uso de
varias medidas dependientes es bastante común en los estudios que investigan los
correlatos fisiológicos de la atención, y este enfoque, aunque no muy eficiente, parecería
razonable a algunos psicólogos. Aunque algunas de las variables dependientes podrían
resultar inútiles, presumiblemente podrían desecharse y conservarse sólo las medidas
fisiológicas “buenas”.
Seleccionemos arbitrariamente tres variables dependientes: frecuencia cardíaca,

ondas cerebrales y diámetro de la pupila (una parte del ojo, no un estudiante).
Esperamos que uno o más de estos se correlacionen con la atención. Ahora debemos
elegir una variable independiente. Para hacer esto, primero debemos seleccionar una
tarea para la cual estamos bastante seguros de que (1) se requiere atención y (2) la
cantidad de atención requerida se puede variar cambiando la dificultad de la tarea. Esto
no es tan fácil como parece al principio; para hacer esto correctamente, debemos buscar
en la literatura disponible para encontrar operaciones convergentes (ver Capítulo 7 o
14), donde la misma tarea se ha utilizado en diferentes situaciones. Sin entrar en
detalles sobre cómo se puede lograr esto (ver Miller y Ulrich, 1998), supongamos que
una tarea que cumple con este requisito es el período refractario psicológico discutido
anteriormente en este capítulo. Supondremos además que los requisitos de atención
pueden controlarse variando SOA. Entonces nuestra variable independiente será SOA.
¿Cuántas SOA diferentes se deben utilizar? Claramente, al menos dos, ya que no
podemos manipular la atención requerida con una sola SOA. El número real seleccionado
sería un compromiso entre tener tantas SOA diferentes como sea posible y las
limitaciones de tiempo, dinero, etc. Digamos que se utilizarán cuatro SOA: 50, 100, 200
y 400 milisegundos.
Las variables de control incluyen la modalidad y la intensidad de los estímulos. El
factor más importante a controlar es la presencia de la segunda tarea. Por lo tanto, es
esencial incluir una condición de control de tarea única (no una variable de control) que
sea solo S1–R1. También necesitaremos controlar las variables que probablemente
influyan en la frecuencia cardíaca, las ondas cerebrales y el diámetro de la pupila. Esta
lista de variables es bastante extensa, y nuestra presente discusión ilustrará el control
de sólo dos variables dependientes. Se sabe que la frecuencia cardíaca cambia con la
frecuencia respiratoria. Es difícil controlar la frecuencia respiratoria de una persona sin
recurrir a desagradables tratamientos químicos y mecánicos. La mayoría de los experimen
59533_09_ch08_p207-226.indd 223 9533_09_ch08_p207-226.indd 223 28/03/08 /28/08

no tomaría este tipo de riesgo y simplemente monitorearía la frecuencia respiratoria.
Técnicamente, este tipo de control agrega otra variable dependiente. El control logrado es
más estadístico que experimental, en este caso, la correlación de las frecuencias cardíaca
y respiratoria. El diámetro de la pupila es muy sensible a la cantidad de iluminación, ya
que la luz brillante hace que la pupila se contraiga, por lo que el experimentador debe
tener cuidado de mantener constante el nivel de iluminación durante todo el estudio. El
control sería entonces más experimental que estadístico, a diferencia del control de la
frecuencia cardíaca.
Si realmente hiciéramos este tipo de experimento, podríamos esperar que solo ERP
esté relacionado con la atención. Sin embargo, hay datos (ver Kahneman, 1973) que
sugieren que las tres variables dependientes están relacionadas con la atención y la
cantidad de esfuerzo mental. A menudo es importante tener más de una variable
dependiente porque algunas variables dependientes pueden ser más sensibles a la
manipulación que otras.
Hipótesis La cantidad de atención requerida para conducir se puede medir

por el tiempo de reacción para una tarea de reacción Donders B simultánea.
Aquí, la variable dependiente se especifica con precisión. Es el tiempo de reacción de
elección. La lógica detrás de esta hipótesis es que la tarea de reacción de elección requiere
atención, por lo que la atención dedicada a la otra tarea (generalmente llamada tarea
principal) debe desviarse de la tarea de reacción, lo que lleva a un mayor tiempo de
reacción. Otra suposición es que tanto la tarea principal como la tarea de reacción de
elección se basan en una fuente común de atención o capacidad.
La tarea principal sería conducir un vehículo. Por razones de seguridad, este tipo de
investigación se lleva a cabo a menudo en un simulador de conducción. Nuestras variables
independientes podrían ser el tipo de entorno vial definido por la densidad del tráfico (alta
o baja) y la curvatura de la vía (recta, curva pronunciada, curva poco profunda). Algunas
hipótesis específicas podrían ser que la alta densidad de tráfico requiere una mayor
atención y también que negociar curvas pronunciadas requiere una mayor atención. El
desempeño en la tarea de conducción podría medirse por las desviaciones en la posición
del carril desde el centro del carril.
La tarea secundaria sería una reacción de Donders B presentada durante la
conducción. Por ejemplo, el conductor podía escuchar un tono de alta o baja frecuencia y
podía responder presionando uno de los dos botones en el volante.
Las variables de control serían la intensidad de los tonos y las características de manejo
del vehículo. También usaríamos condiciones de control de tarea única (estas no son
variables de control) de conducción sin tarea secundaria y la reacción de Donders B sin
conducción. A menos que el rendimiento de conducción fuera el mismo en condiciones
experimentales y de control, no pudimos llegar a ninguna conclusión sobre las demandas
de atención de la conducción. Por ejemplo, si a los conductores les fue mucho mejor
cuando no se requería ninguna tarea de reacción, esto podría indicar un cambio de
atención de la conducción a la reacción de Donders B cuando se realizaban juntos. La
lógica detrás del uso de tareas secundarias para evaluar la atención exige que siempre se
dedique la misma cantidad de atención a la tarea principal.
59533_09_ch08_p207-226.indd 224 9533_09_ch08_p207-226.indd 224 28/03/08 /28/08

ÿ RESUMEN
1. El interés en el tiempo de reacción comenzó con la ecuación también debe registrar la tasa de error, porque los errores tienden
personal, una diferencia sistemática en los RT encontrada entre a ser mayores cuando una tarea se completa rápidamente. Esto
los astrónomos del siglo XVIII. Este fenómeno llevó a Donders a conduce a un compromiso entre velocidad y precisión.
formular su método sustractivo. 5. Cuando el tiempo de respuesta entre dos señales es muy corto, la
2. Si se resta el Donders A RT del C RT, se obtiene una estimación respuesta al segundo estímulo se ralentiza. Este período
del tiempo de identificación del estímulo. refractario psicológico se comprende mejor ahora que los
Donders B RT menos C RT produce una estimación del tiempo investigadores han medido varios
de selección. variables dependientes generales en el mismo experimento.
3. La confusión ocurre cuando un factor que es covariante con una 6. Las interacciones ocurren cuando el efecto de un inde
variable independiente puede explicar los cambios observados variable dependiente difiere a través de los niveles de otras
en el comportamiento. variables dependientes manipuladas en el mismo experimento.
4. Las variables dependientes deben seleccionarse cuidadosamente, Una interacción entre el nivel de estrés y el intervalo señal-
y el investigador prudente obtiene tantas medidas de estímulo mostró que el estrés altera la estrategia cognitiva.
comportamiento como sea posible. Estudios que miden RT
ÿ TÉRMINOS CLAVE
cuello de botella central introspección

intercambio de capacidad central ecuación personal
elección-tiempo de reacción período refractario psicológico
control cognitivo inserción pura
confuso capacidad de modificación separada
intervalo de señal-estímulo reacción sencilla
Donders una reacción equilibrio entre velocidad y precisión
Reacción de Donders B asincronía de inicio de estímulo (SOA)
Reacción de Donders C Nivel de estrés
Interacción método sustractivo
1. ¿Qué argumentos podría haber usado Kinnebrook para mantener variable dependiente sería útil para comprender su ejemplo.
su trabajo en el Observatorio Real?
2. Discuta los factores de confusión que pueden limitar la utilidad del 4. ¿Cuál es la importancia de la interacción entre el nivel de estrés y
supuesto de inserción pura. el intervalo señal-estímulo? ¿Puedes pensar en algunos ejemplos?
3. Enumere cinco ejemplos de la compensación entre velocidad y
precisión que ocurren en la vida cotidiana fuera del laboratorio. 5. Discutir la posible interacción entre la densidad del tráfico y la
Seleccione uno de sus ejemplos y diseñe un experimento de curvatura de la carretera cuando se utiliza una tarea secundaria
laboratorio que medirá la compensación. para medir las demandas de atención de la conducción.
Vea si puede determinar si un adicional
59533_09_ch08_p207-226.indd 225 9533_09_ch08_p207-226.indd 225 28/03/08 /28/08

CONEXIONES WEB
Explore la presentación paso a paso de "Confundidos: Amenazas a la validez" en:
http://psychology.wadsworth.com/workshops/workshops.html
Puede ponerse a prueba en varios experimentos relacionados con la atención y el tiempo de
reacción en:
http://coglab.psych.purdue.edu/coglab/
Puede encontrar una discusión informativa sobre el trastorno por déficit de atención con hiperactividad en:
http://faculty.washington.edu/chudler/adhd.html
Compensación entre velocidad y precisión
La siguiente demostración requiere un lápiz, un periódico y un reloj con segundero. Ayuda si

tienes un amigo que te cronometre, pero en su lugar se puede usar un cronómetro con un
zumbador. Configure su temporizador (o su amigo) a 30 segundos. Ahora, yendo a una velocidad
cómoda, avance a través de un artículo de periódico, tachando cada letra e que aparece.
Deténgase después de 30 segundos y cuente el número de líneas que ha completado. Esta es
su cifra de referencia. (Ingréselo en la Tabla 8.1). Luego, mantenga el tiempo constante en 30
segundos, pero intente aumentar el número de líneas que tienen la letra e tachada en un 10 por
ciento. En tercer lugar, repita este proceso con un 10 por ciento menos de líneas que su línea de
base, es decir, vaya más lento esta vez.
Repita con un 15 por ciento más de líneas (vaya más rápido); finalmente, con un 15 por
ciento menos. Ahora tómate un merecido descanso. Cuando se haya recuperado, vuelva a
revisar cada uno de los cinco pasajes que ha tachado y cuente el número de letras e que debería
haber tachado y el número que realmente tachó. Dividir el número tachado por el número total te
da tu tasa o porcentaje de error. ¿Cometió sistemáticamente más errores al tratar de ir más
rápido e incluir más líneas, revelando así una compensación entre velocidad y precisión? ÿ
ÿ TABLA 8.1
Determinación empírica del equilibrio entre velocidad y precisión.
número e
Número Tachado número e E's
de Líneas correctamente (1) perdido (2) totales (1) (2) Porcentaje (2) [(1) (2)]
Línea base (B) _____ _____ _____ _____ _____

b 10% _____ _____ _____ _____ _____
b 10% _____ _____ _____ _____ _____
b 15% _____ _____ _____ _____ _____
b 15% _____ _____ _____ _____ _____
59533_09_ch08_p207-226.indd 226 9533_09_ch08_p207-226.indd 226 28/03/08 /28/08

CAPÍTULO 9
ACONDICIONAMIENTO
Y APRENDIENDO
TIPOS DE ACONDICIONAMIENTO
Condicionamiento clásico: ¿Te suena el nombre de Pavlov?
Condicionamiento instrumental (operante)
ILUSTRACIONES
Diseños dentro y entre sujetos: intensidad del estímulo
ILUSTRACIONES
Contrapeso: contraste simultáneo
9.3 TEMAS EXPERIMENTALES Y APLICACIONES DE
INVESTIGACIÓN
Diseños con n pequeña : problemas de comportamiento en niños

El efecto de extinción de refuerzo parcial
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: CONOCIMIENTO DE RESULTADOS COMO
REFORZAMIENTO
227
59533_10_ch09_p227-260.indd 227 9533_10_ch09_p227-260.indd 227 3/5/08 /5/08

Deberíamos tener cuidado de sacar de una experiencia solo la sabiduría que hay en ella, y
detenernos allí; para que no seamos como el gato que se sienta sobre la tapa de una
estufa caliente. Nunca volverá a sentarse sobre la tapa de una estufa caliente, y eso está
bien; pero también nunca más se sentará en una fría. (MARK TWAIN)
La cita anterior de Mark Twain describe una experiencia de aprendizaje que comparte muchas
características con un tipo de condicionamiento llamado condicionamiento clásico. En el
condicionamiento clásico, la experiencia, como indica Twain, no suele estar bajo el control del
organismo.
El gato no busca la tapa de una estufa caliente para sentarse; más bien, la estufa está caliente
cuando ella se sienta en ella; no hay nada que ella pueda hacer al respecto. Twain también señala
que los efectos del acondicionamiento pueden ser de gran alcance: el gato no volverá a elegir
sentarse en la tapa de una estufa, independientemente de si la tapa está caliente. Este tipo de
condicionamiento es una parte importante de nuestras vidas. Ader y sus asociados han estudiado
algunos de los ejemplos más importantes de condicionamiento clásico.
Siguiendo el trabajo de Herrnstein (1962), Ader y Cohen (1982) querían ver si un placebo
condicionado (ver Capítulo 6) podía influir en la respuesta inmune del cuerpo.
Herrnstein demostró que cuando una solución salina se combinó con un fármaco que puede ralentizar
el comportamiento (escopolamina), la solución salina por sí sola resultó en una ralentización del
comportamiento. Así como el gato de Twain asoció el calor con las tapas de las estufas, incluso las
tapas frías de las estufas, la asociación de la solución salada con la escopolamina condujo a su
comportamiento de producción similar al comportamiento producido por la escopolamina. Ader y
Cohen combinaron el sabor de un líquido novedoso con un fármaco que inhibe el sistema inmunitario.
Después de varios emparejamientos, el nuevo estímulo se convirtió en un placebo, porque también
podía suprimir el sistema inmunitario. A su vez, la supresión inmunológica del placebo evitó el
desarrollo de problemas renales letales en ratones que eran susceptibles a la enfermedad renal.
Tales hallazgos ayudaron a conducir al desarrollo de la psiconeuroinmunología, que es un estudio
interdisciplinario de las interrelaciones entre los procesos conductuales, neurales, endocrinos e
inmunológicos (Irwin & Miller, 2007). Un enfoque principal de este nuevo campo es comprender cómo
el condicionamiento puede modular las respuestas inmunitarias.
No todo condicionamiento involucra eventos que simplemente le suceden al organismo. En el
condicionamiento instrumental, la conducta del organismo es fundamental para producir
consecuencias, a menudo denominadas recompensas y castigos, que alteran el ritmo de las
conductas que han producido las consecuencias. Examinemos un ejemplo de condicionamiento
instrumental en un infante.
El comportamiento de los bebés de entre 2 y 6 meses no es muy complicado, pero sí muestran
movimientos corporales excitados ante estímulos interesantes. Rovee-Collier (1993) aprovechó este
entusiasmo para observar el aprendizaje y la retención en los bebés. Enseñó a los bebés una
respuesta de patada instrumental, siguiendo una patada con el movimiento de un móvil que estaba
suspendido sobre el bebé en su cuna. Una cinta atada a la pierna del bebé y al móvil permite que la
patada del bebé active el móvil. La tasa de patadas cuando está conectado al móvil se compara con
la tasa de patadas en una fase de referencia (ver Capítulo 3) cuando la cinta no conecta al bebé con
el móvil.
Patear es la respuesta instrumental, y Rovee-Collier observó aumentos en las patadas.
59533_10_ch09_p227-260.indd 228 9533_10_ch09_p227-260.indd 228 3/5/08 /5/08

por encima del valor inicial en lactantes de 2, 3 y 6 meses. Los bebés aprendieron una respuesta
instrumental, patadas, para activar el móvil.
El condicionamiento clásico permite que un organismo represente su mundo mediante el
aprendizaje de relaciones entre eventos (Rescorla, 1988): un sabor novedoso predice una respuesta inm
El condicionamiento instrumental, por otro lado, conduce principalmente a que un organismo aprenda
las relaciones entre el comportamiento y los resultados que produce: una patada activa un móvil.
Estos dos tipos fundamentales de aprendizaje proporcionarán los antecedentes para ilustrar varias
cuestiones metodológicas. Antes de discutir estos temas, describimos las características básicas de
estos dos tipos de condicionamiento.
ÿ TIPOS DE ACONDICIONAMIENTO
Condicionamiento clásico: ¿Te suena el nombre de Pavlov?

A principios de este siglo, Ivan P. Pavlov (1849-1936) hizo algunos descubrimientos psicológicos
fundamentales. El descubrimiento básico que hizo, que ahora se llama pavloviano, respondedor o
condicionamiento clásico, es bien conocido hoy, incluso por aquellos fuera de la psicología, pero la
fascinante historia de cómo surgió no lo es. Pavlov no se formó como psicólogo (no había psicólogos
en Rusia ni en ningún otro lugar cuando recibió su educación), sino como fisiólogo. Hizo grandes
contribuciones a la fisiología relacionada con la medición y el análisis de las secreciones estomacales
que acompañan al proceso digestivo. Midió cuidadosamente los fluidos producidos por diferentes tipos
de alimentos, y consideró la secreción de estos jugos estomacales como un reflejo fisiológico. Por
este importante trabajo sobre los jugos gástricos involucrados en la digestión, Pavlov recibió el Premio
Nobel de medicina en 1904.
Después de ganar el Premio Nobel, Pavlov recurrió a algunos descubrimientos más o menos
incidentales que había hecho en el curso de su trabajo. Su fama en la psicología experimental actual
surge del trabajo sistemático que realizó sobre estos descubrimientos incidentales, especialmente los
relacionados con la salivación. En un tipo de experimento fisiológico, Pavlov cortó el esófago de un
perro para que ya no llevara comida al estómago (Figura 9.1). Pero descubrió que cuando colocaba
comida en la boca del perro, el estómago secretaba casi tanto jugo gástrico como cuando la comida
iba al estómago. Por supuesto, la comida en la boca producía salivación reflexiva, pero la acción
reflexiva del estómago parecía depender de estímulos ubicados en otros lugares además de los que
estaban en contacto directo con el revestimiento del estómago. Sin embargo, Pavlov hizo un
descubrimiento aún más notable. Encontró que ni siquiera era necesario poner los alimentos en
contacto con la boca para obtener secreciones salivales y gástricas. La mera vista de la comida
produciría las secreciones, o incluso la vista del plato de comida sin la comida, ¡o incluso la vista de la
persona que normalmente alimentaba al animal! Obviamente, entonces, la secreción de jugos gástricos
y saliva debe ser causada por algo más que un reflejo fisiológico automático que se produce cuando
una sustancia entra en contacto directo con el animal. Un reflejo fisiológico es el que muestran todos
los animales físicamente normales de una determinada especie; está “conectado” al sistema nervioso.
Pavlov había descubierto un nuevo tipo de reflejo, al que a veces llamaba reflejo psíquico ya veces
reflejo condicionado. En la figura 9.2 aparece un esquema del paradigma estándar para estudiar el
condicionamiento pavloviano en el laboratorio.
59533_10_ch09_p227-260.indd 229 9533_10_ch09_p227-260.indd 229 3/5/08 /5/08

Bettmann/
Corbis
©
ÿ FIGURA 9.1
Ivan Pavlov y su personal se muestran aquí con uno de los perros utilizados en sus experimentos.
El perro estaba enganchado al marco de madera que se muestra en la imagen. La saliva se conducía
mediante un tubo a un dispositivo de medición que podía registrar la tasa y la cantidad de salivación.
Estímulo Neutro
(Campana o tono)
Fase 1
Estímulo incondicionado Respuesta incondicionada
(alimento en polvo) (Salivación)
Estimulo condicionado
(Campana o tono)
Fase 2
Estímulo incondicionado Respuesta incondicionada
(alimento en polvo) (Salivación)
Fase 3 Estimulo condicionado Respuesta condicionada

(Campana o tono) (Salivación)
ÿ FIGURA 9.2
Un esquema de las etapas en el condicionamiento clásico. Un estímulo neutro, como una campana,
que no provoca salivación cuando se presenta por sí solo, se entrega al organismo un poco antes que
un estímulo incondicionado, como un alimento en polvo, que produce una respuesta incondicionada, la
salivación. Si el estímulo neutral predice el estímulo incondicionado, luego de varios emparejamientos
(como en la fase 1), el estímulo neutral se asocia con la respuesta incondicionada, indicada por la línea
discontinua en la fase 2. El estímulo neutral ahora se llama estímulo condicionado. . Eventualmente (fase
3), el estímulo condicionado provocará salivación en ausencia del estímulo incondicionado, y esta
salivación se denomina respuesta condicionada (CR). Si el estímulo condicionado se presenta
repetidamente sin el estímulo incondicionado, el CR se debilitará y eventualmente se extinguirá.
59533_10_ch09_p227-260.indd 230 9533_10_ch09_p227-260.indd 230 3/5/08 /5/08

El descubrimiento muy importante de Pavlov demuestra que casi cualquier estímulo que
normalmente no provoca una respuesta particular puede llegar a controlar esa respuesta al
combinarse con otro estímulo que produce una reacción de manera confiable. Por ejemplo, si una
persona está sujeta a un evento estresante en una situación particular (digamos, su oficina o
habitación), entonces el cuerpo responderá con reacciones defensivas: el corazón puede acelerarse,
la presión arterial aumenta, la adrenalina fluye , y así. Estas respuestas pueden condicionarse a la
situación, de modo que incluso sin un evento estresante, una persona puede mostrar todos estos
cambios fisiológicos en la situación. Algunos investigadores en el campo de la medicina del
comportamiento han argumentado que muchos trastornos tan prevalentes en la actualidad
(hipertensión, úlceras gástricas, dolores de cabeza) son causados en parte por reacciones
condicionadas que ocurren cuando las personas se encuentran en situaciones en las que han
experimentado estrés repetidamente. Como lo indica el caso en el que un sabor novedoso produjo
supresión inmunológica, el condicionamiento pavloviano también parece desempeñar un papel en el
desarrollo de otros comportamientos humanos importantes, incluidas las fobias (miedos irracionales) y
El condicionamiento pavloviano, sin embargo, no indica que esté completamente a merced de
eventos emparejados arbitrariamente. La investigación ha demostrado que, aunque el emparejamiento
contiguo de eventos (por ejemplo, una oficina y el estrés) puede ser necesario para que ocurra el
condicionamiento clásico, dicho emparejamiento puede no ser suficiente. Hace varios años, Kamin
(1969) demostró que es importante que el estímulo condicionado (CS) prediga el estímulo
incondicionado (EE) y no solo coincida con él. Kamin demostró por primera vez que las ratas podían
aprender fácilmente a asociar CS que eran una luz, un ruido o una combinación de luz y ruido con
una descarga eléctrica leve (EE. UU.). Luego demostró que si una rata aprendiera primero que un
CS estaba asociado con el shock (digamos, el ruido), la rata no aprendería mucho sobre la relación
luz-US cuando la luz se presentara posteriormente con el ruido CS en combinación. con el choque
Kamin razonó que la rata primero aprendió que el ruido predecía el shock. Luego, cuando el ruido y
la luz aparecieron juntos, la luz era redundante con el ruido y el animal no aprendió a asociarla con
el choque.
Tal bloqueo del aprendizaje ante estímulos redundantes combinados con el CS original también
aparece en experimentos con humanos (Mitchell & Lovibond, 2002). Según estos resultados, una
persona que mostrara una reacción de estrés en su oficina no aprendería a asociar el estrés con un
nuevo mueble de oficina porque la propia oficina sería un buen predictor de estrés. Cuando un evento
predice otro, se dice que existe una relación contingente (o una contingencia) entre los dos eventos.
Condicionamiento instrumental (operante)
Los primeros ejemplos del segundo tipo de condicionamiento fueron los experimentos de EL
Thorndike en la Universidad de Columbia, quien colocó a los gatos en cajas de rompecabezas de las
que se suponía que debían escapar. Estos experimentos se realizaron casi al mismo tiempo que los
de Pavlov. Se describen en detalle en el Capítulo 11; Brevemente, el experimento se refería a
aprender de las consecuencias de alguna acción. Los gatos de Thorndike realizaron alguna respuesta
que les permitió escapar de la caja del rompecabezas; luego, cuando se volvían a colocar en la caja,
tendían a realizar la misma respuesta. Las consecuencias de una conducta afectaron la forma en
que se aprendió. Dado que el comportamiento fue fundamental para producir la consecuencia (la
recompensa), esta forma de aprendizaje se denominó condicionamiento instrumental. Se consideraba
que obedecía a principios diferentes de los del condicionamiento pavloviano y también se consideraba
un tipo de aprendizaje más general.
59533_10_ch09_p227-260.indd 231 9533_10_ch09_p227-260.indd 231 3/5/08 /5/08

A lo largo de los años, un gran número de psicólogos se han esforzado mucho en comprender
el condicionamiento instrumental. El investigador y divulgador más famoso del estudio de este tipo
de condicionamiento es BF Skinner. Llamó a este tipo de condicionamiento condicionamiento
operante, porque la respuesta opera en el entorno. Esto se distingue de lo que Skinner llamó
condicionamiento respondiente, el condicionamiento clásico estudiado por los pavlovianos, en
el que el organismo simplemente responde a la estimulación ambiental. El dato principal de interés
en el estudio del condicionamiento operante es la velocidad a la que se produce alguna respuesta.
Las respuestas primarias que se han estudiado son la presión de palanca por parte de ratas y el
picoteo de llaves por parte de palomas en aparatos de condicionamiento operante (o, más
coloquialmente, en cajas de Skinner). Una caja Skinner es simplemente una caja pequeña y bien
iluminada con una palanca o llave que se puede presionar y un lugar para dispensar alimentos (Figura
En el condicionamiento operante, el experimentador espera hasta que el animal dé la
respuesta deseada; él o ella luego lo recompensa, digamos, con comida. Si no se realiza la
respuesta completa, el experimentador debe reforzar aproximaciones sucesivas hasta que se
produzca la respuesta deseada. Por ejemplo, si quiere enseñarle a una paloma a caminar en
forma de ocho, primero debe recompensar los giros de un cuarto de círculo, luego los medios
giros, y así sucesivamente. Este procedimiento de reforzar aproximaciones cada vez mayores a la
conducta deseada se denomina dar forma a la conducta; en principio, es similar al juego de
“calentarse” que juegan los niños. El condicionamiento operante funciona con la ley del efecto
(consulte el Capítulo 11 para obtener detalles adicionales): si se realiza una respuesta operante y
le sigue un estímulo de refuerzo, la probabilidad de que la respuesta ocurra nuevamente aumenta.
Lo que servirá como estímulo de refuerzo no se especifica de antemano, sino que debe descubrirse
para cada situación. Utilizando este sencillo principio, Skinner y muchos otros han llevado a cabo
el análisis experimental de numerosos comportamientos.
Investigadores
fotográficos
Omikron/
©
ÿ FIGURA 9.3
Una caja típica de Skinner equipada con una palanca de respuesta y una taza de comida debajo. Una presión
de palanca por parte del animal hace que una bolita de comida caiga en la taza. Toda esta maquinaria está
controlada por un equipo de programación que permite al experimentador establecer diferentes tareas para el animal.
59533_10_ch09_p227-260.indd 232 9533_10_ch09_p227-260.indd 232 3/5/08 /5/08

Un estímulo reforzante es aquel que fortalece la respuesta que sigue. Generalmente, se
identifican dos clases diferentes de estímulos reforzantes: estímulo reforzante positivo y estímulo
reforzante negativo. Los reforzadores positivos son las recompensas familiares que se dan después
de una respuesta particular: bolitas de comida en la caja de Skinner, una estrella dorada en una
buena prueba de ortografía, un móvil en movimiento en una cuna, etc. Los comportamientos que
producen refuerzos positivos aumentan en probabilidad. Los reforzadores negativos son eventos
aversivos y las respuestas que los eliminan o evitan se fortalecen. Por ejemplo, una rata puede
aprender a presionar una barra en una caja de Skinner para terminar una descarga o posponerla. De
manera similar, recibe un refuerzo en un día muy frío poniéndose un abrigo cálido para evitar sentir
un frío incómodo.
No confundas el refuerzo negativo con el castigo. Se dice que se castigan las conductas que
producen sucesos aversivos. Las conductas castigadas disminuyen en frecuencia. Si una rata ha
sido reforzada positivamente con comida por presionar una palanca y ahora es castigada por cada
presión de la palanca con una leve descarga eléctrica, la tasa de presión de la palanca disminuirá.
El papel de los estímulos distintos del estímulo reforzante también es importante en el estudio
del condicionamiento operante. Un estímulo discriminativo (SD) señala cuando un comportamiento
será seguido por una recompensa. Por ejemplo, una paloma puede ser entrenada para picotear un
botón para comer solo en presencia de una luz roja. Si alguna otra luz está encendida, el picoteo no
será seguido por la comida. Los animales aprenden tales contingencias entre estímulos y respuestas
con bastante facilidad. Se puede decir que un estímulo discriminativo “prepara el escenario” o “brinda
la ocasión” para alguna respuesta. Una de las tareas principales del condicionamiento operante es
traer alguna respuesta "bajo el control del estímulo". Se dice que un organismo está bajo control de
estímulos cuando responde correcta y consistentemente en presencia de un estímulo discriminativo
y no en su ausencia. Los bebés de Rovee-Collier estaban bajo control de estímulos cuando respondían
al móvil que resultaba en refuerzo.
Recuérdese que los EC efectivos en el condicionamiento clásico son aquellos que están
relacionados contingentemente con el EE. UU. (el CS predice el EE. UU.). El condicionamiento
operante también tiene importantes relaciones contingentes: a saber, la relación entre la respuesta
y el estímulo reforzante. En el condicionamiento operante, los organismos pueden aprender que
existe una contingencia positiva entre el comportamiento y el refuerzo, que es el arreglo estándar de la
Los organismos también pueden aprender que existe una contingencia negativa entre el
comportamiento y el refuerzo, de modo que si responden, no se producirá el refuerzo. Una forma de
examinar esta contingencia es usar un procedimiento llamado extinción experimental,
en el que se retiene el refuerzo después de que un organismo ha aprendido a dar una respuesta
particular. Después de varias veces que el refuerzo no sigue la respuesta, el organismo deja de dar
la respuesta. (Vea la sección “Del problema al experimento” al final de este capítulo para una
discusión adicional sobre la extinción).
Finalmente, los organismos pueden aprender que existe una contingencia nula entre su
comportamiento y el refuerzo. Una contingencia nula es aquella en la que el reforzador es
independiente de la conducta: a veces, una conducta conduce al refuerzo y, a veces, el refuerzo se
produce en ausencia de una conducta particular. Cuando los organismos aprenden que no importa lo
que hagan, ocurrirán eventos aversivos, aprenden a estar indefensos y muestran diversos signos de
depresión (LoLordo, 2001). Asimismo, algunas investigaciones muestran que cuando los eventos
positivos ocurren independientemente del comportamiento, los organismos tienden a volverse
perezosos (Welker, 1976). Es tentador generalizar el último efecto a los "mocosos malcriados" que
reciben un número sustancial de reforzadores positivos no contingentes y luego no se esfuerzan por
conseguirlos cuando es necesario hacerlo.
59533_10_ch09_p227-260.indd 233 9533_10_ch09_p227-260.indd 233 3/5/08 /5/08

Variables dependientes Los experimentadores también pueden variar el

programa mediante el cual se administra el refuerzo,
Una variable dependiente importante en la investigación así como la demora después de la respuesta, antes de
del aprendizaje animal es la tasa de respuesta, a presentar el estímulo de refuerzo al sujeto.
menudo representada en el tiempo. Otra variable (Por lo general, los retrasos más largos producen menos aprendizaje).
dependiente importante que se usa comúnmente en el Otra variable popular es la motivación del animal. Esto
condicionamiento clásico es la amplitud de la respuesta. se puede manipular variando la cantidad de tiempo que
En lugar de limitarnos a observar si un perro saliva o el organismo ha estado privado del estímulo de refuerzo
no ante un estímulo condicionado, podemos medir la (p. ej., comida o agua) antes del experimento. Estas
amplitud de la respuesta viendo cuánta saliva se son, por supuesto, solo algunas de las posibles
produce. Otra característica de las respuestas variables independientes.
comúnmente medida es su latencia, o el tiempo que
tarda el animal en lograr la respuesta. Esta medida se
usa ampliamente en experimentos de aprendizaje de Variables de control
laberintos, donde se registra el tiempo que le toma a
un animal completar el laberinto. A menudo, los El control de la variación extraña suele ser bastante
resultados se representan en términos de velocidad en sofisticado en la investigación básica del aprendizaje
animal,
lugar de latencia, siendo la velocidad el recíproco de la latencia pero incluso en este caso existen problemas sutiles.
(1/latencia).
Una medida derivada del aprendizaje es la Uno de ellos es el problema del pseudocondicionamiento
resistencia a la extinción. Una vez que se ha aprendido en los experimentos de condicionamiento clásico.
una respuesta, si el experimentador ya no aplica El pseudocondicionamiento se refiere a una elevación
refuerzos cuando el animal ejecuta la respuesta, la temporal en la amplitud de la respuesta condicionada
respuesta se debilita gradualmente o se extingue. La (RC) que no es causada por la asociación entre el CS
resistencia a la extinción, entonces, puede usarse como y el US. Por lo tanto, no es un verdadero
un índice de qué tan bien se aprendió la respuesta en condicionamiento, sino que solo imita el condicionamiento.
primer lugar. Se considera una medida derivada, más Se reconoce por ser relativamente efímero y variable y
que básica, porque lo que por lo general es causado por la excitación general de
todavía se está midiendo la frecuencia, la amplitud o la la situación experimental para el animal, incluyendo la
velocidad de respuesta. Todos estos declinan durante presentación del CS y US. El control apropiado para el
la extinción, pero pueden declinar a diferentes ritmos pseudocondicionamiento es tener un grupo de animales
después de diferentes manipulaciones de la variable en el experimento expuesto al mismo número de
independiente. Así, la resistencia a la extinción es una presentaciones de CS y US que los animales en el
medida derivada de la eficacia de alguna variable grupo de condicionamiento, pero tener las presentaciones
independiente sobre el aprendizaje. sin emparejar y presentadas al azar. Tanto el grupo de
control experimental como el de pseudocondicionamiento
Variables independientes deberían verse afectados por la excitación general
inducida por la situación experimental; cualquier
Se pueden manipular muchas variables independientes diferencia entre los dos grupos debería deberse al
en estudios de aprendizaje y condicionamiento animal. aprendizaje producido por los binomios CS-US en el
Muchos tienen que ver con la naturaleza del refuerzo. caso del grupo experimental (Rescorla, 1967).
Los experimentadores pueden variar la magnitud del
refuerzo en el condicionamiento pavloviano e
instrumental.
59533_10_ch09_p227-260.indd 234 9533_10_ch09_p227-260.indd 234 3/5/08 /5/08

Diseños temáticos dentro y entre sujetos

Ilustración Estímulo Intensidad
Una pregunta fundamental sobre el condicionamiento clásico es cómo la intensidad de un estímulo
neutral afecta el proceso de condicionamiento. Por ejemplo, si un tono se combina con la comida que
se le da a los perros, ¿la intensidad del tono afectará la rapidez con la que el perro se condiciona, de
modo que el tono solo (ahora llamado estímulo condicionado) produzca salivación? Una hipótesis
razonable es que cuanto más fuerte sea el estímulo, más rápidamente se producirá el condicionamiento.
Los animales deben ser muy sensibles a los estímulos más destacados y, por lo tanto, es más probable
que los asocien con estímulos no condicionados. Podríamos predecir que cuanto más fuerte sea el
estímulo condicionado, más rápido y más fuerte ocurrirá el condicionamiento.
Muchos investigadores han investigado esta cuestión a lo largo de los años; el hallazgo
sorprendente de la mayoría de las primeras investigaciones fue que la intensidad del estímulo no
parecía tener mucho efecto sobre el condicionamiento pavloviano. Los estímulos relativamente débiles
parecían producir un condicionamiento tan bueno como los estímulos fuertes (Carter, 1941; Grant y Schn
Dado que la mayoría de las teorías de la época predijeron que el condicionamiento debería verse
afectado por la intensidad del estímulo (Hull, 1943), el hecho de no encontrar el efecto constituía una
especie de enigma. Los investigadores que realizaron estos experimentos sobre los efectos de la
intensidad del estímulo en el condicionamiento generalmente utilizaron diseños entre sujetos, de modo
que diferentes grupos de sujetos recibieron diferentes intensidades de estímulo. Antes de discutir la
razón por la que hacen esto, consideremos algunas de las ventajas y desventajas generales de los
diseños experimentales entre sujetos y dentro de los sujetos.
Diseños entre sujetos versus dentro de los sujetos

Considere el tipo más simple de diseño experimental en el que hay dos condiciones, experimental y de
control, con diferentes grupos de participantes asignados a cada una. En un diseño entre sujetos, un
grupo diferente de participantes generalmente recibe solo un nivel de cada variable independiente. Un
problema potencial que puede surgir del uso de un diseño entre sujetos es que una diferencia obtenida
en la variable dependiente puede deberse al hecho de que se utilizan diferentes grupos de participantes
en las dos condiciones.
Esto significa que en el diseño estándar entre sujetos, los participantes se confunden con los niveles
de la variable independiente. Los experimentadores intentan superar este problema asignando
aleatoriamente sujetos a los niveles de la variable independiente en diseños entre sujetos. Así, en
promedio, los grupos deberían tener características similares en todas las condiciones. Entonces, en
todos los diseños entre sujetos, los participantes deben ser asignados al azar a las diferentes
condiciones para asegurar que los grupos sean equivalentes antes de la manipulación de la variable
independiente. Debemos tratar de tener grupos equivalentes, porque de lo contrario, cualquier diferencia
observada entre los grupos en la variable dependiente podría deberse simplemente a que los
participantes en los diferentes grupos diferían en habilidad. Si tenemos un gran número de sujetos y
los asignamos aleatoriamente a grupos, entonces podemos minimizar la posibilidad de este tipo de
confusión y estar más seguros de que cualquier diferencia que encontremos en la variable dependiente
en realidad resulte de la manipulación de la variable independiente. Cuando los sujetos se asignan
aleatoriamente a condiciones en un diseño entre sujetos, esto se denomina diseño de grupos
aleatorios.
Hay dos inconvenientes principales en los diseños entre sujetos o de grupos aleatorios.
Uno es el hecho de que son un desperdicio en términos del número de materias requeridas.
59533_10_ch09_p227-260.indd 235 9533_10_ch09_p227-260.indd 235 3/5/08 /5/08

Cuando se asigna un grupo diferente de sujetos a cada condición, el número total de participantes
necesarios para un experimento puede volverse bastante grande rápidamente, especialmente si el
diseño experimental es complejo. Por lo tanto, los diseños entre sujetos no son prácticos cuando,
como suele ser el caso, hay escasez de participantes disponibles para un experimento.
El segundo problema es más serio; tiene que ver con la variabilidad introducida al utilizar
diferentes grupos de participantes. Un hecho básico de toda la investigación psicológica es que los
sujetos difieren mucho en sus habilidades para realizar casi cualquier tarea (en casi cualquier
variable dependiente). Cuando se utilizan numerosos participantes en diseños entre sujetos, algunas
de las diferencias de comportamiento en las condiciones experimentales resultarán de diferencias
entre los participantes. Esto puede tener el desafortunado efecto de hacer difícil determinar si las
diferencias de los sujetos o la variable independiente determinaron los resultados. En resumen, los
participantes se confunden con los grupos, y en los diseños entre sujetos, esta variabilidad causada
por las diferencias entre sujetos no se puede estimar estadísticamente ni tener en cuenta.
Ambos problemas con los diseños entre sujetos se pueden reducir utilizando diseños dentro
de los sujetos, en los que todos los participantes reciben todos los niveles de la variable.
Los diseños dentro de los sujetos generalmente requieren menos sujetos que los diseños entre
sujetos, porque cada participante sirve en todas las condiciones. Además, las técnicas estadísticas
pueden tener en cuenta la varianza producida por las diferencias entre sujetos. Esto es posible
porque cada uno sirve como su propio control, otra forma de decir que los participantes no se
confunden con grupos, como en un experimento entre sujetos.
Un diseño dentro de los sujetos suele ser más eficaz que un diseño entre sujetos para detectar
diferencias entre las condiciones de la variable dependiente, porque esta varianza debida a las
diferencias de los participantes puede estimarse estadísticamente y tenerse en cuenta. Las técnicas
estadísticas exactas para analizar experimentos dentro de sujetos no se discuten aquí. En general,
el diseño intra-sujetos es más poderoso, es más probable que permita la detección de una diferencia
entre las condiciones, si es que realmente existe una, que el diseño entre sujetos. Esta ventaja hace
que muchos investigadores prefieran el diseño intra-sujetos siempre que sea posible utilizarlo.
Aunque existen ventajas en el uso de diseños intra-sujetos, estos introducen nuevos problemas.
Desafortunadamente, los diseños intra-sujetos simplemente no se pueden usar para investigar
algunos tipos de problemas experimentales, e incluso cuando se pueden usar, tienen requisitos que
los diseños entre sujetos no tienen. Los diseños intra-sujetos no se pueden utilizar en casos en los
que es probable que el rendimiento en una condición cambie por completo el rendimiento en otra
condición. Este problema suele denominarse transferencia asimétrica o efecto de arrastre. Si
queremos saber en qué se diferencian las ratas a la hora de aprender un laberinto con y sin sus
hipocampos (una parte del cerebro relacionada con el aprendizaje y la memoria), no podemos usar
un diseño dentro de los sujetos, ya que no podemos reemplazar un hipocampo una vez que se
retira. . El mismo problema ocurre cada vez que la variable independiente puede proporcionar un
cambio en el comportamiento que se mantendrá hasta que el sujeto sea evaluado bajo la otra
condición.
Si queremos evaluar a las personas en una tarea con o sin capacitación específica, no podemos
evaluarlas primero con capacitación y luego sin capacitación. Y no siempre podemos probarlos en el
orden inverso (sin entrenamiento y luego entrenamiento), porque entonces hemos confundido las
condiciones con la práctica en la tarea. Por ejemplo, si queremos ver si un programa específico de
entrenamiento de la memoria es efectivo, no podemos enseñarle a la gente el programa (la fase de
entrenamiento), probarlos y luego volver a probarlos sin entrenamiento. Una vez que una persona tiene
59533_10_ch09_p227-260.indd 236 9533_10_ch09_p227-260.indd 236 3/5/08 /5/08

tenido el entrenamiento, no podemos quitárnoslo; se transferirá a la siguiente parte del experimento. Tampoco
podemos evaluar a las personas en la otra dirección, con una prueba de memoria, una fase de entrenamiento y
luego una segunda prueba de memoria. La razón es que si las personas mejoraran en la segunda prueba, no
sabríamos si la mejora fue el resultado del entrenamiento o simplemente de la práctica de realizar pruebas de
memoria. En otras palabras, el entrenamiento y la práctica se confundirían. Un diseño entre sujetos es apropiado
en este caso. A un grupo de personas se les evaluaría la memoria sin entrenamiento; el otro grupo sería evaluado
después de recibir el programa de entrenamiento de la memoria.
Los diseños dentro de los sujetos también son inapropiados cuando los participantes pueden averiguar qué
se espera de ellos en el experimento y luego tratar de cooperar con el experimentador para producir los resultados
deseados. Esto es más probable que suceda con diseños dentro de los sujetos que entre sujetos, porque en el
primer caso, las personas participan en cada condición. Este problema hace que los diseños dentro de los sujetos
sean casi inexistentes en ciertos tipos de investigación en psicología social.
Incluso cuando estos problemas no eliminan la posibilidad de utilizar un diseño intrasujeto en algunas
situaciones, existen problemas adicionales que deben considerarse. En los diseños intrasujetos, los sujetos
siempre se evalúan en dos o más puntos en el tiempo; por lo tanto, el experimentador debe estar atento a los
factores relacionados con el tiempo que afectarían los resultados experimentales. Los dos factores principales
que deben considerarse son los efectos de la práctica y los efectos de la fatiga, que tienden a compensarse
entre sí. Los efectos de la práctica se refieren a un mejor desempeño en la tarea experimental simplemente
debido a la práctica, y no a la manipulación de la variable independiente (como en el experimento de la memoria
que acabamos de analizar). Los efectos de fatiga se refieren a disminuciones en el rendimiento durante el
transcurso del experimento, especialmente si la tarea experimental es larga, difícil o aburrida. Los efectos de la
práctica y la fatiga pueden tenerse en cuenta y minimizarse organizando sistemáticamente el orden en que se
presentan las condiciones experimentales a los sujetos.
Esta técnica se conoce como contrapeso de condiciones y se analiza más adelante en el capítulo.
Como hemos dicho, cuando es apropiado, los diseños intra-sujetos son generalmente preferidos a los
diseños entre sujetos, a pesar de que implican una serie de consideraciones adicionales. La principal ventaja,
una vez más, es el hecho de que los diseños dentro de los sujetos suelen ser más potentes o más sensibles,
porque la posibilidad de error resultante de la variabilidad del sujeto se reduce en relación con los diseños entre
sujetos.
Un tercer diseño, el diseño de grupos emparejados, trata de introducir algunas de las ventajas de un
diseño dentro de los sujetos en una comparación entre sujetos. El diseño de grupos emparejados intenta reducir
la variabilidad de los participantes entre los grupos al emparejarlos en los diferentes grupos en otras variables.
Por lo tanto, en un experimento de memoria humana, las personas podrían emparejarse sobre la base del
coeficiente intelectual antes de asignarles aleatoriamente las condiciones. (Cada subgrupo de personas
emparejadas por CI se asigna aleatoriamente a un grupo en particular). La combinación de variables relevantes
puede ayudar a reducir la variabilidad causada por la simple asignación aleatoria de participantes a cada grupo
(el diseño de grupos aleatorios). Además, es muy importante que la asignación a las condiciones siga siendo
aleatoria dentro de conjuntos de personas coincidentes; de lo contrario, existe la posibilidad de confusión y otros
problemas, especialmente artefactos de regresión (véanse los capítulos 2 y 12). En muchas situaciones, el
emparejamiento tiende a implicar mucho trabajo, ya que los participantes deben medirse por separado en la
variable de emparejamiento.
Una técnica de emparejamiento utilizada en la investigación con animales es la técnica de camada dividida.
Esto implica tomar animales de la misma camada y luego asignarlos aleatoriamente a
59533_10_ch09_p227-260.indd 237 9533_10_ch09_p227-260.indd 237 3/5/08 /5/08

grupos Dado que los animales en los diferentes grupos son genéticamente similares, esto ayuda a reducir la
variabilidad resultante de las diferencias de sujetos que se producen en los diseños de grupos aleatorios.
Intensidad del estímulo en el condicionamiento clásico

Volvamos ahora al problema que consideramos antes. ¿Cómo afecta la intensidad del estímulo condicionado
a la adquisición de una respuesta condicionada? El sentido común, así como algunas teorías, llevaron a la
predicción de que los estímulos más intensos deberían conducir a un condicionamiento más rápido que los
estímulos menos intensos. Sin embargo, como se mencionó anteriormente, las primeras investigaciones
sobre este tema no lograron encontrar tales efectos. Por ejemplo, Grant y Schneider (1948) variaron la
intensidad de una luz como estímulo condicionado en un experimento de acondicionamiento de párpados. En
tales experimentos, las personas están conectadas a un aparato que envía bocanadas de aire al ojo y registra
las respuestas (parpadeos). El estímulo incondicionado es la bocanada de aire, la respuesta incondicionada
(UR) es el parpadeo y el estímulo condicionado es una luz que precede a la bocanada de aire. Originalmente,
la luz no hace que una persona parpadee; pero después de que se empareja repetidamente con el soplo de
aire, eventualmente la luz por sí misma provoca el parpadeo, que entonces es la respuesta condicionada.
Grant y Schneider simplemente preguntaron si luces más intensas provocarían un acondicionamiento más
rápido. ¿Una luz brillante haría que las personas desarrollaran una respuesta condicionada más rápido que
una luz tenue? Probaron diferentes grupos en los dos casos, uno con cada intensidad de luz, y descubrieron
que, contrariamente a las expectativas, el condicionamiento fue tan rápido en la condición con luz tenue como
en la condición con luz brillante. Otros investigadores obtuvieron resultados similares cuando examinaron los
efectos de la intensidad del estímulo sobre el condicionamiento en diseños entre sujetos, incluso cuando
utilizaron diferentes estímulos (como tonos en lugar de luces).
La elección de un diseño entre sujetos o dentro de los sujetos suele estar determinada por la naturaleza
del problema estudiado, las variables independientes manipuladas, el número de participantes disponibles
para el investigador y otras consideraciones descritas en la sección anterior. Rara vez los investigadores
consideran la posibilidad de que el resultado mismo de su investigación pueda depender del tipo de diseño
que elijan. Sin embargo, este es exactamente el caso en el tema de los efectos de la intensidad del estímulo
sobre el condicionamiento, como se descubrió después de la investigación de Grant y Schneider (1948).
Años más tarde, Beck (1963) volvió a plantearse la cuestión de si la intensidad del estímulo afectaba al
condicionamiento palpebral. También estaba interesada en otras variables, incluida la intensidad del estímulo
incondicionado (el soplo de aire) y el nivel de ansiedad de sus participantes. Para nuestros propósitos,
consideraremos solo el efecto del nivel de intensidad del estímulo condicionado, que varió dentro de los
sujetos como un factor en un diseño experimental complejo. Beck usó dos niveles de intensidad y los presentó
en un orden irregular en 100 pruebas de acondicionamiento en su experimento. Encontró un efecto grande y
estadísticamente significativo de la intensidad del estímulo en el desarrollo de la respuesta condicionada, al
contrario de lo que habían encontrado otros investigadores.
Grice y Hunter (1964) notaron el efecto de Beck y se preguntaron si ella había encontrado un efecto
donde otros no lo habían encontrado porque ella había usado un diseño dentro de los sujetos, mientras que
la mayoría había usado diseños entre sujetos. Para descubrir esto, probaron tres grupos de personas: en dos
grupos, la variable de intensidad del estímulo condicionado se varió entre sujetos, y para el grupo restante, se
varió dentro de los sujetos. Usaron un tono suave (50 decibelios) o un tono fuerte (100 decibelios) como
estímulos condicionados en un experimento de acondicionamiento de párpados. Las personas de cada grupo
participaron en 100 ensayos. En cada ensayo, los participantes escucharon un zumbador que les alertó de
que un
59533_10_ch09_p227-260.indd 238 9533_10_ch09_p227-260.indd 238 3/5/08 /5/08

comenzaba el juicio. Dos segundos después, escucharon un tono (suave o alto) que duró medio
segundo y luego, después de otro medio segundo, recibieron una bocanada de aire en el ojo. El
tono fue el estímulo condicionado, el soplo de aire el estímulo incondicionado. El grupo ruidoso
recibió el tono de 100 decibelios en las 100 pruebas, mientras que el grupo suave recibió el tono de
50 decibelios en las 100 pruebas. Estos dos grupos representan una comparación entre sujetos del
nivel de intensidad del estímulo en el acondicionamiento de los párpados. Las personas del tercer
grupo (el grupo alto/suave) recibieron 50 intentos con el tono alto (L) y 50 intentos con el tono suave
(S). Los juicios ocurrieron en uno de dos órdenes irregulares, de modo que un orden era la imagen
especular del otro. En otras palabras, si el orden de los primeros 10 intentos fue L, S, S, L, S, L, L,
L, S, L, el otro orden sería S, L, L, S, L, S , S, S, L, S. En el grupo fuerte/suave, la mitad de las
personas recibieron cada pedido.1
Los resultados se muestran en la Figura 9.4, donde puede ver el porcentaje de los últimos 60
intentos en los que los participantes mostraron una respuesta condicionada, es decir, parpadeo, a la
1
Es posible que haya notado que existe una confusión en el diseño del experimento de Grice y Hunter.
Las personas recibieron 100 intentos con una CS suave o fuerte en el caso entre sujetos, pero los sujetos recibieron la
mitad de cada CS en el caso dentro de los sujetos. Más ensayos deberían producir un mejor condicionamiento para cada
CS para el caso entre sujetos, pero como se muestra en la Figura 9.4, no fue así: en voz alta condujo a un mejor
aprendizaje en el caso dentro de los sujetos, y suave condujo a un mejor aprendizaje en el caso entre sujetos. caso.
59533_10_ch09_p227-260.indd 239 9533_10_ch09_p227-260.indd 239 3/5/08 /5/08

tono antes de que llegara la bocanada de aire. Una línea representa la comparación entre
sujetos, en la que cada sujeto tuvo experiencia solo con el estímulo fuerte o el estímulo suave.
Tenga en cuenta que el porcentaje de ensayos en los que los participantes respondieron no
varió en función de la intensidad del estímulo en el caso de un estímulo entre sujetos. (La ligera
diferencia observada no es estadísticamente confiable). Por otro lado, cuando se varió la
intensidad del estímulo dentro de los sujetos del grupo alto/bajo, se encontró un gran efecto de
la intensidad del estímulo. Las personas respondieron un poco más del 20 por ciento del tiempo
al estímulo suave, pero casi el 70 por ciento del tiempo al estímulo fuerte, una diferencia significativa
Los resultados del experimento de Grice y Hunter muestran que la elección de un diseño
entre sujetos o dentro de los sujetos puede tener efectos de largo alcance. En este caso, el
resultado real de los experimentos diseñados para examinar los efectos de la intensidad del
estímulo estuvo determinado por la elección del diseño. Cuando las personas experimentaron
ambos estímulos, reaccionaron ante ellos de manera diferente; pero cuando experimentaban
sólo uno u otro estímulo, no mostraban diferencia en su respuesta. Grice (1966) informa de otras
situaciones en las que se produce un patrón similar de resultados. En muchas situaciones
experimentales, los investigadores no pueden decir si sus hallazgos cambiarían al cambiar de
un diseño entre sujetos a uno dentro de los sujetos (o viceversa), porque es imposible hacer la
pregunta experimental con el otro diseño, porque razones discutidas anteriormente. Sin embargo,
la investigación de Grice y Hunter (1964) nos recuerda que la elección de un diseño experimental
puede tener ramificaciones más allá de las consideraciones mundanas del número de sujetos
utilizados y similares. El resultado real de la investigación puede verse afectado.
Considere una forma alternativa de interpretar estos resultados. Tal vez los diseños entre
sujetos y dentro de los sujetos produzcan efectos diferentes porque el diseño dentro de los
sujetos produce automáticamente un efecto de arrastre al permitir que los participantes en el
experimento experimenten todos los valores de los estímulos relevantes. En comparación con
las personas en la versión entre sujetos, las personas en el diseño dentro de los sujetos pueden
haber percibido el estímulo fuerte como más fuerte y el estímulo suave como más suave porque
tuvieron la oportunidad de experimentar ambas intensidades en ensayos sucesivos y, por lo
tanto, pudieron comparar un estímulo con otro. Las personas que percibieron solo un valor del
estímulo no pudieron hacer tal comparación. Asimismo, Kawai e Imada (1996) han encontrado
que la mayor aversión de una descarga eléctrica más larga que una más corta es más probable
que se note en un diseño intra-sujetos que en uno entre sujetos. Más adelante, en la sección
“Del problema al experimento” en la página 253, verá que la elección del diseño puede
determinar el curso de la extinción en el condicionamiento instrumental para humanos (Svartdal,
2000) y animales no humanos (Papini, Thomas y McVicar, 2002). En la siguiente sección
examinamos otro tipo de contraste que puede ocurrir en el condicionamiento, y también sugiere
que ser capaz de comparar eventos en virtud del diseño experimental da como resultado
diferentes tipos de comportamiento.
Contrapeso de temas
Ilustración Contraste Simultáneo
Siempre que se utilice un diseño dentro de los sujetos, es necesario decidir con cuidado el orden
en el que se deben presentar las condiciones a los sujetos. El arreglo debe ser tal que, en
promedio, las condiciones se presenten en la misma etapa de práctica,
59533_10_ch09_p227-260.indd 240 9533_10_ch09_p227-260.indd 240 3/5/08 /5/08

de modo que no pueda haber confusión entre las condiciones experimentales y la etapa de la práctica.
El contrapeso también es necesario para minimizar el efecto de otras variables además del tiempo que
podrían afectar el experimento. A menudo, el experimentador debe contrarrestar el equilibrio entre
variables en las que tiene poco interés, incluso en diseños entre sujetos, para que estas variables
extrañas no afecten las condiciones de interés. Un ejemplo de este problema debería aclararlo.
Al aprender una respuesta instrumental, la magnitud particular de la recompensa influye mucho

en el desempeño. Por lo general, el rendimiento mejora a medida que aumenta la magnitud de la
recompensa. Sin embargo, la magnitud particular de la recompensa utilizada no tiene un efecto
invariable sobre el desempeño, sino que depende de la experiencia que el organismo haya tenido con
otras condiciones de refuerzo. Un ejemplo de este efecto lo proporciona un experimento realizado por
Bower (1961) sobre el contraste simultáneo, en el que algunos sujetos experimentaron dos magnitudes
de recompensa contrastantes.
El experimento de Bower consistió en tres grupos de 10 ratas, cada uno de los cuales recibió
cuatro ensayos al día en un laberinto de callejones rectos durante 32 días, para un total de 128 ensayos.
La variable independiente fue la magnitud de la recompensa utilizada. Un grupo de ratas recibió ocho
gránulos de comida en la caja objetivo en sus cuatro ensayos. Dado que recibieron ocho gránulos
constantes en cada ensayo, esta condición se denomina Constante 8. Otro grupo recibió solo un
gránulo después de cada ensayo (Constante 1). Estos dos grupos se pueden considerar como controles
para el tercer grupo (Contraste). Los sujetos de este grupo recibieron dos ensayos cada día, en dos
callejones rectos diferentes. Los dos callejones eran bastante discriminables, uno era negro y el otro
era blanco. En un callejón, las ratas siempre recibían una recompensa de una bolita; en el otro callejón
siempre recibían ocho perdigones. Bower quería ver cómo la exposición a ambos niveles de refuerzo
afectaría la velocidad de carrera, en comparación con la exposición a un solo nivel todo el tiempo. ¿Las
ratas correrían a una velocidad diferente por una recompensa de una pastilla (u ocho pastillas) si
hubieran experimentado otro nivel de recompensa, en lugar de haber tenido un entrenamiento constante
en un nivel en particular?
Antes de examinar los resultados, considere algunas características de diseño que Bower tuvo
que enfrentar para las ratas de contraste. Dado que la magnitud de la recompensa varió dentro de los
sujetos en esta condición, hubo dos problemas a considerar. Primero, tenía que asegurarse de que no
todos los sujetos recibieran mayor o menor refuerzo en el callejón negro o en el blanco, porque el color
del callejón entonces se confundiría con la magnitud de la recompensa, y las ratas simplemente podrían
haber corrido más rápido en los callejones negros que en los blancos (o en los blancos). viceversa).
Esto se logró fácilmente haciendo que la mitad de los animales recibieran ocho gránulos en el callejón
negro y un gránulo en el callejón blanco y haciendo que la otra mitad de los animales recibiera el arreglo
inverso. Para los animales de control que recibieron solo una magnitud de recompensa, la mitad recibió
la recompensa en un callejón blanco y la otra mitad en un callejón negro. Todo esto puede sonar
bastante complicado, por lo que delineamos el esquema de diseño en la Figura 9.5.
El segundo problema se refiere al orden en que las ratas del grupo de contraste deben recibir las
dos condiciones en los cuatro ensayos cada día. Obviamente, no se les debe dar primero las dos
pruebas de recompensa grande seguidas de las dos pruebas de recompensa pequeña (o viceversa),
ya que el tiempo de prueba se confundiría con la magnitud de la recompensa.
Tal vez podría usarse un orden aleatorio para los 128 ensayos. Pero los órdenes aleatorios no se
prefieren en tales casos, ya que puede haber, incluso en órdenes aleatorios, series largas en las que
aparece la misma ocurrencia. Por lo tanto, no sería sorprendente encontrar casos en los que hubiera
dos intentos seguidos del mismo tipo (gran o pequeña magnitud de recompensa), aunque en todos los
temas no habría confusión con la práctica. Una forma preferible de manejar este problema consiste en
equilibrar las condiciones en lugar de
59533_10_ch09_p227-260.indd 241 9533_10_ch09_p227-260.indd 241 3/5/08 /5/08

Número de
Número de Callejón Ensayos Número de
Grupo Ratas Color (por día) Pellets
5 Negro 4 8
8 constante
5 Blanco 4 8
5 Negro 4 1
constante 1
5 Blanco 4 1
Negro 2 8
5
Blanco 2 1
Contraste
Negro 2 1
5
Blanco 2 8
ÿ FIGURA 9.5
Un esquema del diseño del experimento de Bower que muestra algunas de las características
utilizadas para minimizar la confusión. El color del callejón no se confunde con el grupo o la magnitud de
la recompensa (número de perdigones). Para el grupo de contraste, se necesita un contrapeso adicional
para equilibrar el orden de las pruebas de uno versus ocho gránulos dentro de la sesión diaria (ver texto).
variando al azar. Como recordará, el contrapeso se refiere a cualquier técnica utilizada para variar
sistemáticamente el orden de las condiciones en un experimento para distribuir los efectos del tiempo de
prueba (como la práctica y la fatiga), de modo que no se confundan con las condiciones.
Cuando se prueban dos condiciones en bloques de cuatro ensayos, hay seis órdenes posibles en los
que las condiciones pueden ocurrir dentro de los ensayos. En el presente caso, si S representa una
recompensa pequeña (una pastilla) y L una recompensa grande (ocho pastillas), entonces las seis órdenes
son SSLL, SLSL, SLLS, LLSS, LSLS, LSSL. Bower resolvió el problema del contrapeso utilizando cada
una de estas órdenes con la misma frecuencia. En un día particular de prueba, elegiría un orden para las
pruebas para la mitad de las ratas (por ejemplo, LSSL) y luego simplemente probaría la otra mitad usando
el orden opuesto (SLLS). Al día siguiente, tomaba otro pedido para la mitad de las ratas, mientras que las
demás recibían el orden inverso, y así sucesivamente. Esto condujo a que no hubiera confusión entre
orden y condiciones, y todas las órdenes se usaron con la misma frecuencia, de modo que el experimento
no dependió de una sola orden. Volveremos sobre este punto en un momento.
Los resultados de Bower se presentan en la figura 9.6, donde la velocidad media de carrera para
cada una de las cuatro condiciones se representa en bloques de 2 días (ocho intentos). Para las ratas que
recibieron una recompensa constante, las que recibieron ocho gránulos se desempeñaron mejor después
de los primeros días que las que recibieron una. Por supuesto, no era exactamente una gran noticia que
las ratas corrieran más rápido por más, en lugar de menos, comida. El verdadero interés estaba en qué tan
rápido corrían las ratas en las condiciones de contraste para obtener recompensas grandes y pequeñas.
Aunque no hubo un efecto estadísticamente confiable entre las velocidades de las condiciones de
Constante 8 y Contraste 8 en la Figura 9.6, las ratas de Contraste 1 corrieron confiablemente más
lentamente por la recompensa que las ratas de Constante 1, al menos hacia el final del entrenamiento.
Esto se denomina efecto de contraste negativo, ya que los sujetos de contraste corrieron más lentamente
por la pequeña recompensa que las ratas que siempre recibieron la pequeña recompensa.
59533_10_ch09_p227-260.indd 242 9533_10_ch09_p227-260.indd 242 3/5/08 /5/08

8 constante
100
90 contraste 8
80
70
constante 1
60
50
Velocidad
carrera
grupo
media
del
de
Contraste 1
40
30
20
10
0
1-2 5-6 9-10 13-14 17-18 21-22 25-26 29-30
Bloques de prueba de dos días

ÿ FIGURA 9.6
Estas son las velocidades de carrera medias del grupo para las condiciones del experimento de Bower,
promediadas en bloques de ocho ensayos (2 días). Las ratas que recibieron pruebas de una pastilla y de
ocho pastillas corrieron más lentamente por la recompensa de una pastilla que las ratas que siempre
recibieron una pastilla. Esto se llama efecto de contraste negativo. Fuente: Bower, G. (1961). "Un efecto
de contraste en el aprendizaje diferencial", Journal of Experimental Psychology, 62, Figura 1.
Una interpretación de este fenómeno considera estados emocionales inducidos en

las ratas de contraste debido a su experiencia en la situación. Dado que las ratas de
contraste estaban familiarizadas con ambos niveles de recompensa, cuando se colocaron
en el callejón distintivo que les decía que recibirían una pequeña recompensa, se
enfadaron o frustraron por tener que correr por el callejón solo por una bolita de mala
calidad. Estos resultados plantean una pregunta interesante sobre por qué Bower no
encontró un efecto de contraste positivo, o una carrera más rápida para los sujetos de
Contrast 8 en relación con los sujetos de Constant 8. ¿No deberían las ratas Contrast 8
estar felices o eufóricas al saber, cuando se colocan en el callejón distintivo que indica
una gran recompensa, que obtendrán ocho gránulos en lugar de solo uno? Una posibilidad
es que estuvieran más eufóricos, pero que un efecto techo impidió que esto se reflejara
en sus velocidades de carrera. Quizás el rendimiento ya era muy bueno en la condición
de Constant 8. Debido a la gran recompensa, no había margen de mejora en la condición
de Contraste 8. Las ratas en la condición de control (Constante 8) ya corrían tan rápido
como sus patitas les permitían, por lo que no importaba cuánto más eufóricas pudieran
estar las ratas de contraste, esto no podía reflejarse en su desempeño. Aunque esta
interpretación de efecto techo de los datos actuales se ve reforzada en parte por otros
informes de efectos de contraste positivos (Padilla, 1971), los efectos de contraste
negativos parecen obtenerse más fácilmente que los positivos. Discutimos el problema de
los efectos techo en el análisis de datos con más detalle en el Capítulo 10.
59533_10_ch09_p227-260.indd 243 9533_10_ch09_p227-260.indd 243 3/5/08 /5/08

Los resultados del experimento de Bower deberían recordarle la lección de la sección anterior que
contrasta los diseños entre y dentro de los sujetos. Al igual que en los experimentos de Grice y Hunter sobre
los efectos de la intensidad del estímulo, Bower descubrió que el efecto de una recompensa de una
determinada magnitud dependía del tipo de diseño utilizado. En un diseño dentro de los sujetos, en el que
los animales tenían experiencia con ambas magnitudes de recompensa, el efecto sobre el comportamiento
fue mayor que en la comparación entre sujetos, en la que un grupo diferente de animales recibió recompensas
constantes durante la serie de pruebas. Una vez más, la naturaleza del diseño puede afectar la conclusión
del experimentador sobre qué tan fuerte es el efecto producido por la variable independiente.
Consideraciones adicionales en el contrapeso

Se puede utilizar una gran variedad de esquemas de compensación en diversas situaciones. Algunos de
estos se vuelven muy complejos. Aquí, analizamos solo algunos de los diseños de contrapeso más simples
para brindarle algunos trucos del oficio.
El caso representado por el grupo de contraste de Bower (1961) es, en muchos sentidos, típico del
problema del contrapeso tal como suele presentarse. Se iban a probar dos condiciones dentro de los sujetos;
por lo tanto, tenían que ser contrarrestados para no confundirlos con la etapa de la práctica. Una solución a
este problema, y la que elegirían la mayoría de los psicólogos, sería usar un diseño ABBA , donde A
representa una condición y B representa la otra. Esto eliminaría la confusión de condiciones particulares con
el tiempo de la prueba, ya que cada condición se probaría al mismo tiempo en promedio (1 4 5 para A y 2 3 5
para B, donde los números se refieren al orden de la prueba). Pero tal vez el orden específico de las pruebas
también sea importante. Por ejemplo, supongamos que hay un efecto de práctica muy grande en la variable
dependiente pero que ocurre muy temprano en el entrenamiento, en la primera prueba. Entonces contribuiría
a la condición A pero no a la condición B , de modo que el diseño de ABBA no eliminaría la confusión de las
condiciones con la práctica.
Se pueden sugerir dos soluciones a este problema de los grandes efectos de la práctica al principio del
entrenamiento. Una es dar una serie de ensayos de práctica en la situación experimental antes de que
comience el experimento propiamente dicho. Por lo tanto, los sujetos practican y se permite que el desempeño
en la variable dependiente se estabilice antes de que se introduzcan las condiciones experimentales de
interés. Otra solución es emplear más de un esquema de compensación. Por ejemplo, la mitad de los sujetos
pueden obtener el esquema inverso que recibe la otra mitad. Entonces, la mitad de los sujetos obtendrían
ABBA y la otra mitad obtendría BAAB. La solución de Bower al problema del contrapeso fue la extensión ideal
de esta lógica, ya que utilizó todos los esquemas de contrapeso posibles con la misma frecuencia. Pero
cuando están involucradas más de dos condiciones, esto se vuelve difícil de manejar. En la mayoría de las
situaciones, una solución adecuada al problema de los efectos de la práctica al comienzo de una sesión de
prueba sería dar práctica a los sujetos y luego usar dos esquemas de contrapeso, uno de los cuales es el
inverso del otro.
Grice y Hunter (1964), en el experimento sobre la intensidad del estímulo descrito anteriormente, hicieron
precisamente esto.
Para situaciones en las que hay más de dos condiciones, recomendaríamos un esquema particular
para el contrapeso como generalmente deseable. Este es el diseño de cuadrado latino equilibrado.
Supongamos que hubiera seis condiciones en un orden contrabalanceado de modo que los efectos de la
práctica no confundieran los resultados. Por ejemplo, en un experimento de contraste simultáneo como el de
Bower, se podrían usar seis magnitudes de recompensa diferentes en lugar de solo dos. Un diseño de
cuadrado latino equilibrado aseguraría
59533_10_ch09_p227-260.indd 244 9533_10_ch09_p227-260.indd 244 3/5/08 /5/08

ÿ TABLA 9.1
Cuadrado latino balanceado para seis condiciones

experimentales (1–6) presentadas a cada sujeto.
Las filas indican el orden en que los sujetos a a f
reciben las condiciones experimentales.
Orden de las condiciones de prueba
Asignaturas 1º 2do 3ro 4to 5to 6to
a 1 2 6354
b 2 3 1465
C 3 4 2516
d 4 5 3621
y 5 6 4132
F 6 1 5243
que cuando se probara cada condición, sería precedida y seguida por igual de diez por
cualquier otra condición. Esta última característica es muy útil para minimizar los efectos de
arrastre entre las condiciones y hace que el cuadrado latino equilibrado sea preferido a otros
esquemas de contrapeso. Construir un cuadrado latino balanceado es fácil, especialmente si el
experimento tiene un número par de condiciones. Numeremos las seis condiciones de un
experimento del uno al seis. Se puede pensar en un cuadrado latino equilibrado como una
matriz bidimensional en la que las columnas (que se extienden verticalmente) representan las
condiciones probadas y las filas representan los sujetos. En la Tabla 9.1 se presenta un
cuadrado latino balanceado para seis condiciones. Los sujetos están etiquetados de la a a la f,
y el orden en que reciben las condiciones se indica leyendo a través de la fila. Entonces el
sujeto a recibe las condiciones en el orden 1, 2, 6, 3, 5, 4. La fórmula general para construir la
primera fila de un cuadrado latino balanceado es 1, 2, n, 3, n 1 4, n 2 y así sucesivamente, ,
donde n representa
, lugar, simplemente
el número total
numere
de condiciones.
las columnasDespués
con números
de que
más
la primera
altos, comenzando
fila esté en su
de
nuevo cuando llegue a n (como en la Tabla 9.1). Cuando se usa un cuadrado latino balanceado,
los sujetos deben ser evaluados en múltiplos de n, en este caso seis, a fin de contrarrestar
adecuadamente las condiciones con la práctica.
Cuando un diseño experimental tiene un número impar de condiciones, se vuelve un poco

más complicado usar un cuadrado latino balanceado. De hecho, se deben usar dos cuadrados,
el segundo de los cuales es el reverso del primero, como se ve en la Tabla 9.2, donde una vez
más las letras indican los sujetos y los números representan las condiciones del experimento.
Cuando se usa un cuadrado latino balanceado con un número desigual de condiciones, cada
sujeto debe ser probado en cada condición dos veces. El caso representado en la Tabla 9.2 es
para cinco condiciones. En general, el primer cuadrado se construye exactamente de la misma
manera que cuando hay un número par de condiciones, y luego el segundo cuadrado es una
inversión exacta del primero.
El cuadrado latino equilibrado es un sistema de contrapeso óptimo para muchos propósitos,
ya que cada condición ocurre, en promedio, en la misma etapa de la práctica y cada condición
precede y sigue a las demás con la misma frecuencia. Esta última característica no se aplica a
otros esquemas de contrapeso y, por lo tanto, existe más preocupación de que la prueba en
una condición pueda afectar la prueba en otra condición.
59533_10_ch09_p227-260.indd 245 9533_10_ch09_p227-260.indd 245 3/5/08 /5/08

ÿ TABLA 9.2
Cuadrado latino equilibrado para las cinco condiciones experimentales (1–5)

presentadas a cada sujeto. Las filas indican el orden en que los sujetos a a e
Recibir las Condiciones Experimentales. Cuando el número de condiciones
es impar, cada condición debe darse dos veces a cada sujeto para un
cuadrado latino equilibrado.
Cuadrado 1 Cuadrado 2
Orden de prueba
Asignaturas 1º 2do 3ro 4to 5to 1º 2do 3ro 4to 5to
a 1 2 534 4 3 521
b 2 3 145 5 4 132
C 3 4 251 1 5 243
d 4 5 312 2 1 354
y 5 1 423 3 2 415
9.3 TEMAS EXPERIMENTALES Y APLICACIONES DE INVESTIGACIÓN
Diseños Small-n del tema

Problemas de comportamiento de ilustración en niños
En el caso más simple, un experimento involucra una comparación entre el control y las
condiciones experimentales. Tanto los diseños entre sujetos como los intrasujetos suelen
incluir un gran número de sujetos, aunque el número suele ser menor en el caso intrasujetos.
Se requiere un gran número de sujetos para que un participante inusual no distorsione los
resultados. Estos diseños se denominan diseños de n grande y se han convertido en la norma
en la investigación psicológica; poderosas técnicas estadísticas (ver Apéndice B) permiten al
investigador determinar si vale la pena preocuparse por las diferencias entre las condiciones.
Un enfoque alternativo a tales diseños es el diseño de n pequeña , en el que se analizan
intensamente muy pocos temas. Dos áreas dentro de la psicología experimental a menudo
usan diseños de n pequeña. Tal vez recuerde del capítulo 6 que la psicofísica a menudo usa
diseños de n pequeña. El control experimental es el sello distintivo de la segunda área de
investigación que utiliza diseños de n pequeña: el análisis experimental del comportamiento en
términos de condicionamiento operante. Skinner (1959) instó al uso de diseños de n pequeña
en la investigación operante, porque quería enfatizar la importancia del control experimental
sobre el comportamiento y restar importancia a la importancia del análisis estadístico. Skinner
creía que el análisis estadístico a menudo se convierte en un fin en sí mismo, en lugar de una
herramienta para ayudar al investigador a tomar decisiones sobre los resultados experimentales.
El control experimental que generalmente se logra en la investigación tradicional con un gran
número de sujetos y la inferencia estadística se busca en la investigación de n pequeño
controlando muy cuidadosamente el entorno experimental y tomando numerosas y continuas
medidas de la variable dependiente. La metodología de n pequeña es especialmente apropiada
para la aplicación clínica de técnicas operantes para modificar la conducta. Por lo general, un
terapeuta trata con un solo cliente a la vez, que es el caso límite de un diseño de n pequeña.
Aunque un terapeuta puede tratar a más de un paciente a la vez con métodos similares, los número
59533_10_ch09_p227-260.indd 246 9533_10_ch09_p227-260.indd 246 3/5/08 /5/08

visto en la mayoría de las investigaciones de n grande. Examinamos el diseño de n pequeña en el contexto de los
problemas de conducta en los niños.
Considere el siguiente escenario: Los padres preocupados buscan ayuda psicológica para su hijo
porque tiene rabietas varias veces al día. Estas rabietas son ruidosas, con muchos gritos y llantos, y
son violentas; a menudo patea cosas y se golpea la cabeza contra el suelo. Cuando el terapeuta, que
se especializa en la modificación de la conducta utilizando técnicas de condicionamiento operante, ve
por primera vez al niño, ¿qué conclusiones puede sacar? ¿Qué causa este comportamiento? ¿Qué
puede hacer el terapeuta para eliminarlo y devolver al niño a una existencia más normal? Un terapeuta
conductual busca descubrir qué en la historia de aprendizaje del niño ha producido tal comportamiento
problemático, enfocándose en las contingencias de refuerzo que producen y mantienen el llanto, las
patadas y los golpes en la cabeza del niño. Quizás los padres solo prestaron mucha atención a la niña
cuando hizo una rabieta, recompensando sin darse cuenta su comportamiento de rabieta. La terapia
propuesta trata de cambiar las contingencias de refuerzo, de forma que el niño reciba recompensas
por conductas adecuadas y no desadaptativas.
El diseño AB
Antes de examinar diseños válidos de n pequeña , analizamos una forma común pero inválida de
evaluar la eficacia de una terapia. La investigación sobre la eficacia de una terapia debe incorporarse
al tratamiento siempre que sea posible. Esto parece un asunto bastante simple: Mida la frecuencia del
comportamiento que necesita ser cambiado, luego instituya la terapia y vea si el comportamiento
cambia. Podemos llamar a esto un diseño AB , donde A representa la condición inicial antes de la
terapia y B representa la condición después de la terapia (la variable independiente) que se introduce.
Este diseño se usa con frecuencia en investigaciones médicas, educativas y otras aplicadas, donde se
instituye una terapia o un procedimiento de entrenamiento para determinar sus efectos sobre el
problema de interés. Sin embargo, el diseño AB (Campbell & Stanley, 1966) falla por completo como
un diseño experimental válido y debe evitarse. Falla porque los cambios que ocurren durante el
tratamiento en la fase B pueden ser causados por otros factores que se confunden con el factor de
interés.
El tratamiento podría producir el cambio en el comportamiento, pero también podrían hacerlo otras
fuentes de las que el investigador no es consciente o no ha podido controlar. No podemos establecer
de manera concluyente que el cambio resultó de la terapia debido a la falta de comparaciones de
control. Una variable de confusión podría haber producido el cambio en ausencia de una variable indepen
Recuerde, la confusión ocurre cuando otras variables se modifican inadvertidamente con el principal
factor de interés, en el caso de la niña, la terapia. Es crucial controlar cuidadosamente las posibles
variables de confusión, de modo que la primaria produzca el efecto. Esto es imposible en el diseño
AB , ya que es posible que el terapeuta-investigador ni siquiera sea consciente de las otras variables.
Una solución estándar al problema involucra un diseño de n grande. Tenemos dos grupos a los
que los sujetos han sido asignados aleatoriamente. Uno, el experimental, recibe el tratamiento; el otro,
el control, no. Si la condición experimental mejora con la terapia y el control no, podemos concluir que
el tratamiento y no algún factor extraño produjo el resultado. En el caso de la terapia en un individuo,
como el caso de la niña que hace berrinches, generalmente no hay un grupo de control potencial y solo
un sujeto en el "grupo" experimental.
Dado que un diseño de n grande depende de tener un número sustancial de sujetos en las condiciones
experimentales y de control, es inapropiado para su uso en la evaluación de muchas situaciones
terapéuticas.
59533_10_ch09_p227-260.indd 247 9533_10_ch09_p227-260.indd 247 3/5/08 /5/08

El ABA o Diseño Inverso
Como alternativa al diseño AB defectuoso , el experimentador puede invertir las condiciones
después de la fase para producir un diseño ABA , que también se denomina diseño inverso.
La segunda fase A del diseño ABA sirve para descartar la posibilidad de que algún factor de
confusión haya influido en el comportamiento observado en la fase B. Devolver las condiciones del
experimento a su nivel de referencia original, sin aplicar la variable independiente, permite al
experimentador determinar si el comportamiento vuelve al nivel de referencia durante la segunda
fase. Si es así, entonces el investigador puede concluir que la variable independiente efectuó
cambios durante la fase B. Esta generalización no se aplicaría si una variable de confusión estuviera
perfectamente correlacionada con la variable independiente. Tal situación es poco probable. Aquí
consideramos un ejemplo de un diseño de inversión.
Hart, Allen, Buell, Harris y Wolf (1964) investigaron el llanto excesivo de un alumno de jardín
de infancia de 4 años, Bill, que por lo demás parecía bastante sano y normal.
El llanto a menudo venía en respuesta a frustraciones leves que otros niños enfrentaban de manera
más efectiva. En lugar de atribuir su llanto a variables internas, como el miedo, la falta de confianza
o la regresión a un comportamiento de una edad anterior, los investigadores observaron el entorno
de aprendizaje social para ver qué contingencias de refuerzo podrían producir tal comportamiento.
Decidieron, con un razonamiento similar al ya discutido en el caso de nuestra hijita hipotética, que
la atención de los adultos reforzaba el comportamiento de llanto de Bill. Los investigadores se
propusieron probar esta suposición con un diseño ABA ( en realidad, ABAB) .
Primero, necesitaban una buena medida de la variable dependiente, el llanto. La maestra

llevaba un contador de bolsillo y presionaba la palanca cada vez que había un episodio de llanto.
“Un episodio de llanto se definió como un llanto (a) lo suficientemente fuerte como para ser
escuchado a una distancia de al menos 50 pies y (b) de 5 segundos o más de duración”. Al final de
cada día de escuela infantil, la maestra sumaba el número de episodios de llanto. Quizá podríamos
objetar a esta definición operativa de un episodio de llanto (¿el maestro se alejó 50 pies cada vez
para escuchar?), pero supongamos que es válida y confiable.
En la línea de base inicial de la fase A, Bill recibió la atención normal del maestro a su llanto.
Durante los 10 días del primer período de línea de base, el número de episodios de llanto fue de 5
a 10 por día, como se muestra en el panel de la izquierda de la figura 9.7, donde la frecuencia de
los episodios de llanto en la ordenada se representa frente a los días en la figura 9.7. abscisa.
Durante los siguientes 10 días (la primera fase B ), la maestra intentó extinguir los episodios de
llanto ignorándolos, mientras recompensaba a Bill con atención cada vez que respondía a
calamidades menores (como caídas o empujones) de una manera más apropiada. Como se
muestra en la Figura 9.7, el número de episodios de llanto cayó precipitadamente, de modo que
hubo entre cero y dos durante los últimos 6 días de la primera fase B.
Esto completa la fase AB del diseño; una vez más, no podemos estar seguros de que las
contingencias de refuerzo fueran responsables de la mejora del comportamiento de Bill. Quizás se
llevaba mejor con sus compañeros de clase, o sus padres lo trataban mejor en casa. Cualquiera de
estas cosas (u otras) podría haber mejorado su disposición.
Para obtener mejor evidencia de que las contingencias de refuerzo cambiaron el
comportamiento de Bill, los investigadores volvieron a la línea de base: Bill fue nuevamente reforzado po
Al principio, fue recompensado con atención por las aproximaciones al llanto (lloriqueos y mal
humor); una vez que se restableció el llanto, se mantuvo con atención a cada episodio de llanto.
Como muestra el tercer panel de la figura 9.7, solo tomó 4 días para que empezara a llorar. Esto
llevó a la conclusión de que las contingencias de refuerzo, y no
59533_10_ch09_p227-260.indd 248 9533_10_ch09_p227-260.indd 248 3/5/08 /5/08

Condiciones ÿ FIGURA 9.7
A B A B
Base Extinción Base Extinción El número de episodios de llanto
exhibidos por Bill, un estudiante
de jardín de infancia, durante las
cuatro fases de un diseño ABAB
iniciado para controlar su problema
de llanto. Lobo, MM, y Risley, TR
10
(1971). Refuerzo: Investigación
aplicada. En R. Glaser (Ed.), La
episodios
Número
llanto
de
Naturaleza del Refuerzo (p. 316).

Nueva York: Prensa Académica.
5
0
Días
cualquier número de otros factores, fueron responsables de la terminación del llanto en la primera
fase B. Finalmente, como se trataba de una situación terapéutica, los investigadores instituyeron una
segunda fase B similar a la primera, en la que el llanto de Bill se extinguió nuevamente.
En esta investigación no se empleó estadística inferencial para justificar las conclusiones
extraídas. Más bien, con un buen control de la variable independiente y medidas repetidas de la
variable dependiente, las diferencias entre las condiciones en este experimento fueron lo
suficientemente notables como para disminuir la necesidad de estadísticas inferenciales. El uso de
diseños ABA de n pequeña puede permitir poderosas inferencias experimentales.
Diseño de tratamientos alternos

Al igual que en los experimentos estándar dentro de los sujetos, los experimentos de n pequeña a
menudo incluyen efectos de arrastre que prohíben el uso del diseño inverso. Si el tratamiento
introducido en la fase B tiene efectos a largo plazo sobre la variable dependiente, la reversión no es prá
Además, el experimentador puede querer obtener varias muestras del comportamiento de los sujetos
bajo la misma variable independiente o bajo varias variables independientes.
Hay varias formas de resolver estos problemas, pero consideramos solo dos.
Rose (1978) usó lo que podría llamarse un diseño ACABCBCB , donde las fases A se refieren
a las condiciones de referencia y las fases B y C representan diferentes niveles de la(s) variable(s)
independiente(s). Cuando se alterna la presentación de diferentes niveles de la variable independiente
tenemos un diseño de tratamientos alternos. Rose quería determinar los efectos de los colorantes
alimentarios artificiales sobre la hiperactividad en los niños. Dos niñas hiperactivas de 8 años fueron
sujetos. Habían estado siguiendo una dieta estricta, la dieta Kaiser-Permanente (KP) (Feingold,
1975), que no permite alimentos que contengan sabores y colores artificiales y alimentos que
contengan salicilatos naturales (muchas frutas y carnes). Sobre la base de estudios de casos no
controlados (diseños AB ), Feingold informó que la dieta KP redujo la hiperactividad.
La fase A de Rose contó el comportamiento de las dos niñas bajo la dieta KP ordinaria.
La fase B examinó otro tipo de línea de base. Se trataba de la introducción de una galleta de avena
que no contenía colorantes artificiales. La fase C incluyó el nivel de interés de la variable
independiente: galletas de avena con colorante amarillo artificial. Rose eligió este color artificial
porque se usa comúnmente en la fabricación de
59533_10_ch09_p227-260.indd 249 9533_10_ch09_p227-260.indd 249 3/5/08 /5/08

alimentos, y tenía el beneficio adicional de que no cambiaba el sabor ni la apariencia de las galletas.
(Cuando se les pidió que clasificaran las galletas según el color, los jueces no pudieron hacerlo de
manera sistemática con respecto a la presencia del tinte). Los sujetos, sus padres y los observadores
estaban ciegos cuando los niños comieron el tinte. galleta atada.
Varios observadores diferentes registraron varios aspectos del comportamiento de las dos niñas
durante la escuela. Una variable dependiente que midió Rose fue el porcentaje de tiempo que las niñas
estuvieron fuera de sus asientos durante la escuela. Rose descubrió que las chicas estaban más
activas durante las fases C , cuando habían ingerido una galleta con colorante artificial. Rose también
notó que no había efecto placebo. Es decir, el porcentaje de tiempo fuera de sus asientos fue
esencialmente el mismo durante las fases A (sin galleta) y B , en las que las niñas comieron galletas
sin colorantes artificiales. Entonces, Rose concluyó que los colorantes artificiales pueden causar
hiperactividad en algunos niños.
Diseño de línea de base múltiple

La extensión del diseño de inversión de Rose permite que un experimentador examine los efectos de
más de dos niveles de la variable independiente. Sin embargo, la extensión no permite experimentos
que involucren variables independientes que probablemente tengan fuertes efectos de arrastre. El
diseño de línea de base múltiple, ilustrado en la figura 9.8, es adecuado para situaciones en las que
el comportamiento de interés puede no revertirse a los niveles de línea de base (es decir, cuando hay
efectos de arrastre permanentes).
Cabe destacar dos características del diseño de línea de base múltiple. Primero, observe que
diferentes comportamientos (o diferentes sujetos) tienen períodos de referencia de diferente duración
antes de la introducción de la variable independiente. Los periodos de referencia están a la izquierda
de las líneas verticales, y los periodos de tratamiento, en los que se ha introducido la variable
independiente, están a la derecha de las líneas verticales. El uso de un diseño de este tipo en el caso
de Bill (descrito anteriormente) podría implicar un seguimiento de referencia continuo de algún otro
comportamiento no deseado (por ejemplo, buscar peleas) cuando se introdujo el período de extinción
del llanto. Luego, después de varios días, quizás, el procedimiento de extinción podría aplicarse al
comportamiento de lucha. El comportamiento A de la figura 9.8 podría ser llorar, y
TIEMPO
Persona A
(o) BASE TRATAMIENTO
Comportamiento A
Persona B
Comportamiento B
Persona C
Comportamiento C
ÿ FIGURA 9.8
Un esquema del diseño de línea de base múltiple. Diferentes personas (entre sujetos) o
diferentes comportamientos (dentro de los sujetos) tienen períodos de referencia de diferentes
duraciones. Las líneas verticales indican cuándo se introdujo la variable independiente (el tratamiento).
59533_10_ch09_p227-260.indd 250 9533_10_ch09_p227-260.indd 250 3/5/08 /5/08

El comportamiento B podría ser pelear. El comportamiento de pelea ocurre bajo condiciones de referencia
mientras se trata el comportamiento de llanto. Si el comportamiento no tratado se mantiene estable antes
de la introducción de la variable independiente y luego cambia, podemos suponer que la variable
independiente altera el comportamiento y no otra cosa que también cambia durante el período de
observación. Supongamos, sin embargo, que el llanto y las peleas suelen ir juntos. Así, el tratamiento de
una conducta podría infl uir en la ocurrencia de la otra. Si las peleas de Bill disminuyeron al extinguirse el
llanto, entonces no podríamos atribuir los cambios en uno de los comportamientos a la variable
independiente.
Este problema nos lleva a la segunda característica importante del diseño de línea de base múltiple.
El diseño de línea de base múltiple se puede utilizar como un equivalente de n pequeño del diseño entre
sujetos. Como se muestra en la figura 9.8, en lugar de monitorear varios comportamientos como en un
diseño dentro de los sujetos, se pueden monitorear diferentes personas durante diferentes períodos antes
de la introducción de la variable independiente. Este tipo de diseño de línea de base múltiple, como ocurre
con el diseño común entre sujetos, debería ser apropiado para situaciones en las que la variable
independiente tendrá fuertes efectos de arrastre. El procedimiento de línea de base múltiple entre sujetos
también es apropiado para los casos en los que es probable que los comportamientos objetivo se influyan
entre sí, como podría haber ocurrido en nuestro experimento hipotético con el sujeto de Hart y sus
compañeros de trabajo, Bill.
Un experimento de Schreibman, O'Neill y Koegel (1983) ilustra muy bien la forma entre sujetos del
diseño de línea de base múltiple. Schreibman y sus compañeros de trabajo querían enseñar procedimientos
de modificación del comportamiento a los hermanos normales de niños autistas para que pudieran
convertirse en maestros efectivos de sus hermanos autistas. El autismo es un trastorno del comportamiento
de origen desconocido. Se caracteriza por un comportamiento social empobrecido, un uso mínimo del
lenguaje y autoestimulación de varios tipos. Para cada uno de los tres pares de hermanos, uno normal (la
edad media era de 10 años) y uno autista (la edad media era de 7 años), se eligieron varias conductas
objetivo, como contar, identificar letras y aprender sobre el dinero. el hermano normal para enseñar al
hermano autista. Dado que los hermanos normales tenían que aprender técnicas correctas de modificación
del comportamiento, como el refuerzo para una respuesta adecuada, los experimentadores primero
registraron medidas de referencia del uso de las técnicas correctas de modificación del comportamiento
por parte de los hermanos normales y el desempeño correcto de los comportamientos objetivo. por los
niños autistas. Los datos de referencia para cada par de niños aparecen a la izquierda de las líneas
verticales en la Figura 9.9. Dado que es probable que el aprendizaje de técnicas de modificación del
comportamiento influya en una amplia variedad de comportamientos del maestro y del alumno (el niño
normal y el autista, respectivamente), se utilizó un diseño de referencia múltiple entre pares de niños. Los
cambios en el comportamiento de los niños normales y autistas después de que los hermanos normales
fueron entrenados para usar los procedimientos de modificación del comportamiento aparecen a la
derecha de las líneas verticales en la Figura 9.9. El desempeño correcto de ambos niños en cada pareja
aumentó después del comienzo del entrenamiento. Schreibman y asociados concluyeron que el
entrenamiento, y no algún otro factor de confusión (como los cambios resultantes de la observación),
alteró el comportamiento.
Tenga en cuenta los puntos de datos representados por signos más y puntos de referencia. Estos
símbolos muestran el comportamiento de los niños en un ambiente que era completamente diferente del
salón de entrenamiento, uno en el que los niños no sabían que estaban siendo monitoreados por los
experimentadores. El comportamiento en este entorno de generalización fue muy similar al comportamiento
en la sala de capacitación, por lo que el programa de tratamiento fue efectivo para lograr cambios
generales en el comportamiento de los niños.
59533_10_ch09_p227-260.indd 251 9533_10_ch09_p227-260.indd 251 3/5/08 /5/08

Hermano. (Configuración Exp.)
Aut. Niño (Configuración Exp.)
Base Capacitación Hermano. (Configuración general)
+ Aut. Niño (configuración general)

100
Par #1
80
+ +
60
40
20
0
1 234 5 6 7 8 9 10 11 12 13 14 15 16
100 +
Par #2
80 +
rendimiento
Porcentaje
intervalos
correcto
los
de
de
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
100
Par #3
80
60
+ +
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Sesiones
ÿ FIGURA 9.9
El uso de los hermanos normales de los procedimientos correctos de modificación del

comportamiento y las respuestas apropiadas de los niños autistas. El período de referencia está a la
izquierda de la línea vertical para cada par de niños. Los puntos positivos y los blancos muestran el
comportamiento en un entorno de generalización (Schreibman et al., 1983, en Journal of Applied
Behavior Analysis, 16, p. 135. Copyright 1983 de la Society for the Experimental Analysis of Behavior,
Inc.) Reimpreso con permiso de Blackwell Publishing, Ltd.
Los diseños de investigación de condicionamiento operante descritos son representativos de

las poderosas técnicas de investigación desarrolladas por Skinner y sus seguidores. El control
cuidadoso ha proporcionado una base de datos enormemente valiosa para la psicología. Como
hemos visto, los procedimientos se han utilizado en entornos clínicos con un éxito sustancial. El
lector interesado verá cuán ampliamente se han aplicado las técnicas en Kazdin (2001). Los
procedimientos de n pequeña del análisis operante son herramientas importantes para los psicólogos
que desean comprender el pensamiento y el comportamiento.
59533_10_ch09_p227-260.indd 252 9533_10_ch09_p227-260.indd 252 3/5/08 /5/08

Diseño de criterio cambiante
El diseño de cambio de criterio implica cambiar el comportamiento necesario para obtener el refuerzo. Por
ejemplo, una rata puede tener que presionar una palanca cinco veces durante varios minutos para obtener el
refuerzo alimenticio, y luego el criterio de comportamiento podría cambiar a siete palancas presionadas para
obtener el refuerzo. Este procedimiento podría repetirse luego con varios otros criterios. Aquí la variable
independiente es el criterio de comportamiento necesario para obtener el resultado, y la lógica subyacente es
similar a la de otros diseños de n pequeño. Si el comportamiento cambia sistemáticamente con los criterios
cambiantes, entonces asumimos que los criterios están produciendo el cambio.
Los terapeutas utilizan un diseño de criterio cambiante en una variedad de situaciones de terapia
conductual. Kahng, Boscoe y Byrne (2003) utilizaron un diseño de este tipo para aumentar la aceptación de
alimentos en Clara, una niña de 4 años. Bebía de una botella, pero no comía. El terapeuta usó un procedimiento
inteligente de escapar de la comida dependiendo de un cierto número de bocados de comida. Además, si Clara
aceptaba un bocado de comida, recibía elogios y luego, en terapia, una ficha de Blues Clues que podía jugar
después de la comida. El terapeuta aumentó el número de bocados de criterio para escapar del entorno de
comida de su comida favorita (puré de manzana). Gradualmente aceptó la compota de manzana más fácilmente
con aumentos en el criterio. La aceptación de otros alimentos también aumentó gradualmente.
Al final de la terapia cumplió con el criterio de 15 mordiscos de todos los alimentos en aproximadamente 16
minutos. En una comida de seguimiento 6 meses después de la terapia, comió más del 90 por ciento de 50
bocados en 10 minutos.
McDougall y sus asociados (McDougall, Hawkins, Brady y Jenkins, 2006; McDougall y Smith, 2006) han
desarrollado variaciones interesantes del diseño de criterio cambiante. El criterio de cambio de límite de rango
implica criterios que especifican los límites superior e inferior del comportamiento objetivo. Por lo tanto, un niño
que necesita más ejercicio aeróbico podría tener criterios que especifiquen la cantidad mínima y máxima de
carrera para cada período de ejercicio. El diseño de criterios distribuidos comparte características del diseño
de línea de base múltiple y el diseño de tratamientos alternos. En este diseño, un niño que no jugaba bien con
los demás podría tener criterios para la cantidad de tiempo que pasa en solitario y en juegos sociales durante el
recreo. Estos porcentajes y criterios se distribuyen en dos o más comportamientos y se pueden cambiar a lo
largo del tiempo para aumentar el comportamiento deseado (juego social en este caso). Una lección que
aprender del trabajo de McDougall es que los diversos diseños son formas poderosas de cambiar el
comportamiento y que la combinación de estos diseños puede mejorar la situación terapéutica.

LA TUERCAS Y PERNOS
Problema El Efecto de Extinción de Refuerzo Parcial

Para producir aprendizaje instrumental (condicionamiento operante), seguimos con un estímulo de refuerzo el
comportamiento que nos interesa que el animal aprenda. El animal pronto aprende que la recompensa está
próxima en la situación si se emite la respuesta adecuada. Por ejemplo, supongamos que queremos enseñar a
un animal a aprender un laberinto. El tipo de laberinto más simple es el callejón recto, que se compone de un
cuadro de salida donde se coloca el animal, un callejón por el que corre el animal cuando se abre la puerta del
cuadro de salida y el cuadro de meta donde
59533_10_ch09_p227-260.indd 253 9533_10_ch09_p227-260.indd 253 3/5/08 /5/08

el animal se refuerza. El refuerzo suele ser comida y, por lo general, el animal ha sido
privado de comida antes del experimento. La variable dependiente es la velocidad de
carrera o el tiempo para recorrer el laberinto de callejones rectos. A menudo, la velocidad
del animal en cada sección de la pista se mide para que el experimentador encuentre las
velocidades para salir de la caja de salida, atravesar el callejón y acercarse a la meta. El
aprendizaje está indicado por el hecho de que después de varios intentos, la velocidad de
la rata aumenta (la latencia disminuye). Al principio, la rata se entretiene, pero en pruebas
posteriores, realmente se apresura.
Problema ¿Cómo se ve afectado el aprendizaje por la cantidad de refuerzo?

Supongamos que ahora queremos hacer una pregunta directa sobre el aprendizaje en
esta situación: ¿Cómo se ve afectado el aprendizaje por la cantidad de refuerzo?
Intuitivamente, podría esperar que el aprendizaje aumentara a medida que aumenta la
cantidad de refuerzo. Pero si lee atentamente la primera parte de este capítulo, debe
darse cuenta de que esto depende de cómo se definan “cantidad de refuerzo” y
“aprendizaje”. Podríamos variar la cantidad de refuerzo variando el porcentaje de intentos
en los que los sujetos reciben recompensa o variando la magnitud de la recompensa
después de cada intento. También podríamos medir el aprendizaje de varias maneras:
una podría ser la velocidad de carrera, otra podría ser juicios de persistencia (por parte
de humanos, por supuesto, Svartdal, 2003), o podríamos medir la resistencia a la extinción.
La última medida, discutida en la sección "Introducción de las variables", se encuentra al
ver cuánto tiempo después de entrenar un animal seguirá corriendo un laberinto cuando
ya no reciba refuerzo.
Problema ¿Cuál es el efecto del porcentaje de recompensa sobre la resistencia

a la extinción?
Limitemos nuestro interés al caso en el que variamos el porcentaje de pruebas

recompensadas. Nuestro experimento ahora se ha vuelto más manejable.
Variamos el porcentaje de ensayos en los que los animales reciben recompensas por
recorrer el laberinto (la variable independiente), y medimos el tiempo que tardan los
animales en recorrer el laberinto y su resistencia a la extinción (o velocidades de carrera
durante el entrenamiento de extinción).
En muchos experimentos como estos, los investigadores han encontrado que la
resistencia a la extinción es generalmente mayor cuanto menor es el porcentaje de
pruebas durante las cuales el animal recibe refuerzo durante el entrenamiento. Si un
animal recibe un refuerzo continuo (es decir, es reforzado después de cada prueba), su
conducta de correr se extinguirá mucho más rápidamente cuando se retira el refuerzo que
los animales que reciben refuerzo solo en un porcentaje de las pruebas de adquisición.
En general, cuanto menor sea el porcentaje de pruebas reforzadas, mayor será la
resistencia a la extinción (es decir, más rápido correrá el animal cuando se retire el
refuerzo). El hecho de que el reforzamiento poco frecuente conduzca a una mayor
persistencia en la respuesta que el reforzamiento continuo se denomina efecto de
extinción del reforzamiento parcial (PREE). Se han propuesto varias explicaciones
(Amsel, 1994; Capaldi, 1994).
Una serie de variables pueden contribuir al PREE típico. Cuando las ratas son
recompensadas solo en una parte de los ensayos, una serie de factores pueden variar
59533_10_ch09_p227-260.indd 254 9533_10_ch09_p227-260.indd 254 3/5/08 /5/08

simultaneamente. Un factor es el número de ensayos sin recompensa (o N-ensayos) que
preceden a un ensayo con recompensa (o R). Otro factor es el número de transiciones
de pruebas sin recompensa a recompensas (o transiciones N-R) durante el curso del
entrenamiento de refuerzo parcial. Un tercer factor es el número de longitudes N
diferentes (o el número de secuencias diferentes de pruebas sin recompensa que
preceden a una prueba con recompensa) durante el reforzamiento parcial. Todas estas
variables podrían ser (y han sido) examinadas; Consideremos el primero a modo de
experimento en la investigación del aprendizaje animal.
Hipótesis La resistencia a la extinción aumentará con el aumento del número de
pruebas sin recompensa que preceden a una prueba con recompensa (la longitud N).
Básicamente, queremos diseñar un experimento en el que el número de pruebas sin
recompensa varíe antes de una prueba con recompensa. Podría haber tres
N-longitudes de uno, dos y tres ensayos no recompensados antes de un ensayo
recompensado, con la hipótesis de que la resistencia a la extinción debería aumentar
con N-longitud. Cuanto mayor sea el número de ensayos sin recompensa, más rápido
deberían correr las ratas durante la extinción.
Se usa un callejón recto simple como aparato de entrenamiento, y el tiempo que tarda
la rata en recorrer el laberinto es la variable dependiente. ¿Queremos usar un diseño
intra-sujetos o entre-sujetos? Si usamos un diseño intra-sujetos, tenemos que contrarrestar
los tres programas de refuerzo. Pero incluso si hacemos esto, hay un serio problema de
un efecto de arrastre, o el efecto que tiene el entrenamiento de ratas bajo un programa
en el siguiente.
Cuando se examina una sola respuesta, como correr en un callejón recto, se utiliza
un diseño entre sujetos. Sin embargo, es posible evitar un problema de remanente
haciendo que los sujetos aprendan diferentes respuestas bajo diferentes programas de
pruebas sin recompensa. Los animales podrían recibir una longitud N en un callejón
recto pintado de negro y una longitud N diferente en un callejón blanco. Este tipo de
experimento dentro de los sujetos en el PREE a menudo ha producido el resultado
sorprendente de un PREE invertido, en el que el animal muestra una mayor resistencia
a la extinción para la respuesta que tiene el mayor porcentaje de ensayos reforzados
(para una discusión de algunos de los cuestiones involucradas en un PREE intra-sujetos,
ver Rescorla, 1999). En un solo experimento con participantes humanos, Svartdal (2000)
observó el PREE habitual en una comparación entre sujetos y un PREE invertido en una
comparación dentro de los sujetos. Si está interesado en unir la comprensión de los
efectos de diseño, los efectos de contraste y el refuerzo parcial, le sugerimos que
examine el trabajo de Rescorla (1999) y Svartdal (2000) y diseñe su propio experimento.
Probablemente se podrían lograr resultados estables en una situación de refuerzo

parcial entre sujetos con sólo 15 sujetos en cada uno de los tres grupos. Antes de
comenzar el experimento, es habitual entrenar previamente a los animales para que se
acostumbren a la situación experimental. Esto reduce la cantidad de variabilidad dentro
de los sujetos causada por factores extraños, como el miedo a ser manipulado por el
experimentador. Así, durante varios días, el experimentador manipula a los animales
durante una hora más o menos cada día. Las ratas también deben colocarse en la caja
objetivo con gránulos de comida en el plato de comida para asegurarse de que comerán lo
De lo contrario, como puede suponer fácilmente, es poco probable que las bolitas sirvan
como refuerzo. Finalmente, las ratas deben colocarse en el callejón recto y dejarse
59533_10_ch09_p227-260.indd 255 9533_10_ch09_p227-260.indd 255 3/5/08 /5/08

para explorarlo durante unos minutos en cada uno de varios días antes de la prueba real.
Esto es para asegurar que no se asusten cuando se coloquen en él para la prueba. En
cada ensayo del experimento propiamente dicho, el experimentador saca la rata de su
jaula y la coloca en la caja de inicio. Se abre la puerta de la caja de inicio, lo que inicia
un cronómetro, y la rata avanza por el callejón hasta la caja de meta. Cerca de la portería,
la rata atraviesa un haz fotoeléctrico que detiene el cronómetro. Cuando la rata entra en
la portería, la puerta de la portería se cierra para que la rata no pueda volver al callejón.
Por lo general, la rata está confinada en la casilla objetivo durante un período de tiempo
constante en todas las condiciones, por ejemplo, 30 segundos. Luego, la rata se coloca
en una jaula separada para esperar el próximo ensayo. En este experimento, la variable
independiente es el número de intentos sin recompensa o N (uno, dos o tres) que
preceden a un intento con recompensa o R. Esto es sencillo, ya que es fácil proporcionar
o no proporcionar comida cuando la rata recorre el laberinto. El único aspecto complicado
es que el procedimiento experimental confunde el número de pruebas sin recompensa
con la cantidad de pruebas con recompensa que reciben las ratas durante una serie de
pruebas. Las ratas con mayores longitudes N reciben menos recompensa. Una forma de
corregir esta confusión es proporcionar a los sujetos en condiciones con longitudes N de
dos y tres refuerzos entre pruebas. Estos son simplemente períodos en los que las ratas
reciben recompensas entre ensayos en la jaula neutral. Las recompensas no dependen
de la respuesta instrumental.
Las ratas deben recibir un número de días de entrenamiento, tal vez 10, para
asegurarse de que aprendan su programa particular de refuerzo. Doce ensayos por día
sería un número apropiado. Después de 10 días de aprendizaje, se introduce el
entrenamiento de extinción. Esto consiste simplemente en hacer correr a las ratas en 12
intentos por día durante quizás 4 días sin recompensa alguna y medir el tiempo que
tardan las ratas en recorrer el laberinto. Esta fase del experimento es crítica, ya que
queremos determinar el efecto de los programas de entrenamiento sobre la resistencia a
la extinción. Pero aquí entra un problema. Es común durante la extinción que al menos
algunas ratas simplemente dejen de correr. O se niegan a salir del box de inicio, o se
detienen a la mitad del callejón. ¿Qué sucede con nuestra medida dependiente en casos
como este? La convención adoptada para evitar este problema es permitir a las ratas
una cantidad de tiempo fija para atravesar el callejón y retirarlas y comenzar la siguiente
prueba si no superan el límite. A menudo se utiliza un límite de 90 segundos; si una rata
no ha recorrido unos metros por el laberinto en 90 segundos, es poco probable que lo
haga. Por lo tanto, el experimentador simplemente retira al animal, registra su tiempo
como 90 segundos y lo coloca en la jaula neutral en preparación para la siguiente prueba.
Dado que los diferentes programas de entrenamiento algunas veces producen
distribuciones asimétricas o sesgadas de los tiempos de ejecución, a menudo es
necesario usar la mediana del tiempo para cada animal en lugar de la media para
eliminar el efecto de unos pocos tiempos extremadamente largos. (Vea el Apéndice B
para una discusión de las medianas).
El propósito básico del experimento es ver si el número de ensayos no recompensados
produce una mayor resistencia a la extinción. En otras palabras, si los sujetos reciben
mayores N-longitudes, ¿correrán más rápido si no reciben recompensa durante la
extinción? En un experimento similar al descrito aquí, Capaldi (1964) encontró que
mayores longitudes de N estaban asociadas con una mayor resistencia a la extinción.
59533_10_ch09_p227-260.indd 256 9533_10_ch09_p227-260.indd 256 3/5/08 /5/08

ÿ RESUMEN
1. El estudio del aprendizaje y comportamiento animal ha 7. En los diseños intra-sujetos, es necesario contrarrestar las
identificado dos tipos básicos de condicionamiento. En el condiciones o variar las condiciones de manera sistemática
condicionamiento clásico (o pavloviano o respondiente), un para que no se confundan con el tiempo de prueba. Si las
estímulo neutral, como una luz o un tono, precede a un condiciones no se equilibran, entonces los efectos
estímulo incondicionado que produce una respuesta relacionados con el tiempo, como la fatiga o la práctica,
automática o incondicionada. en lugar de la manipulación de la variable independiente,
Después de varios de estos emparejamientos, el pueden explicar los resultados.
estímulo originalmente neutral produce la respuesta si También es necesario equilibrar los diseños entre sujetos
existe una relación contingente (predictiva) entre el estímulo a través de variables que no son de interés central. Un
neutral y el estímulo incondicionado. esquema de contrapeso bastante útil es el diseño del
2. En el condicionamiento instrumental (operante), una conducta cuadrado latino equilibrado, en el que cada condición
particular seguida de un estímulo reforzante aumentará en precede y sigue a las demás con la misma frecuencia.
frecuencia. Un estímulo de refuerzo positivo (las
recompensas familiares) aumenta la frecuencia de la 8. La metodología de investigación tradicional de n grande a
respuesta que lo produce. Un estímulo de refuerzo negativo menudo es inapropiada en entornos aplicados, donde solo
aumenta la frecuencia de la respuesta que lo elimina. Una hay un sujeto. A menudo, un diseño AB se usa como un
respuesta que es seguida por un estímulo de castigo diseño de n pequeña. Se establece una línea base de
disminuye en frecuencia. comportamiento (la fase A ) y luego se impone algún
3. En toda investigación experimental, ya sea con humanos u tratamiento (la fase B ).
otros organismos, una pregunta fundamental es si se deben La conclusión de que los cambios en el comportamiento
usar los mismos organismos en cada condición del durante la fase B fueron el resultado del tratamiento es
experimento (un diseño dentro de los sujetos) o usar errónea porque otras variables pueden confundirse con el
diferentes organismos en las diferentes condiciones (un tratamiento (como la práctica o los efectos de la fatiga).
diseño de sujetos). diseño entre sujetos). 9. El diseño ABA es una poderosa alternativa al diseño AB .
4. Los diseños intra-sujetos son preferibles cuando pueden La segunda fase A , introducida después de la fase B
usarse, porque minimizan la cantidad de variabilidad (tratamiento), elimina el tratamiento para determinar si los
causada por las diferencias entre sujetos. Además, los cambios observados durante la fase B fueron causados
diseños intrasujetos emplean menos sujetos que los diseños por la variable independiente o por factores de confusión.
entre sujetos, aunque, por supuesto, es necesario evaluar El diseño de tratamientos alternos permite un examen de
a cada individuo durante períodos más largos. varias variables independientes o de variables
independientes con más de dos niveles.
5. El peligro principal en los diseños dentro de los sujetos es el
de los efectos de arrastre, los efectos relativamente 10. El diseño de línea de base múltiple es otro diseño de n
permanentes que los sujetos de prueba en una condición pequeña en el que diferentes comportamientos o diferentes
pueden tener en su comportamiento posterior en otra condición. En personas reciben períodos de línea de base de duración
En tales casos, es necesario utilizar diseños entre sujetos, variable antes de la introducción de la variable
aunque se necesitarán más sujetos y la variabilidad de independiente. Para uso dentro de los sujetos, este diseño
sujetos es menos controlable. es preferible al diseño ABA si la variable independiente
6. La elección de un diseño experimental puede, en algunos tiene fuertes efectos de arrastre.
casos, afectar fuertemente el resultado de un experimento.
Por ejemplo, la intensidad del estímulo parece jugar un
papel pequeño en el condicionamiento clásico cuando se
manipula entre sujetos, pero un papel importante cuando
se manipula dentro de los sujetos. Por lo tanto, el tipo de
diseño experimental elegido a veces puede ser crítico.
59533_10_ch09_p227-260.indd 257 9533_10_ch09_p227-260.indd 257 3/5/08 /5/08

ÿ TÉRMINOS CLAVE
AB diseño diseño de línea de base múltiple

Diseño ABA (inversión) efecto de contraste negativo
diseño ABAB estímulo de refuerzo negativo
diseño ABBA contingencia nula
diseño de tratamientos alternos condicionamiento operante
transferencia asimétrica efecto de extinción de refuerzo parcial (PREE)
diseño cuadrado latino equilibrado efecto de contraste positivo
diseño entre sujetos estímulo de refuerzo positivo
bloqueando efecto de practica
efecto de arrastre psiconeuroinmunología
diseño de criterio cambiante pseudocondicionamiento
condicionamiento clásico castigo
respuesta condicionada (RC) diseño de grupos aleatorios
estímulo condicionado (CS) criterio de cambio de rango limitado
contingencia condicionamiento respondiente
refuerzo continuo diseño de inversión (ABA)
contrapeso formación
estímulo discriminativo (DE) contraste simultáneo
diseño de criterio distribuido diseños de n pequeña

extinción experimental técnica de arena dividida
efecto de fatiga respuesta incondicionada (UR)
condicionamiento instrumental estímulo incondicionado (EE. UU.)
diseños con n grande diseño dentro de los sujetos
diseño de grupos emparejados
1. Analice las ventajas de los diseños intrasujetos. C. Un experimento diseñado para responder a la pregunta
¿Qué complicaciones y problemas conlleva el uso de un de si el color del cabello de una mujer afecta la
diseño intra-sujetos? probabilidad de que la inviten a salir.
2. Discuta las ventajas y desventajas de usar
un diseño entre sujetos. d. Un estudio en el que se comparan tres técnicas de
3. En cada uno de los siguientes casos, indique si sería mejor entrenamiento diferentes en cuanto a su eficacia para
examinar la variable independiente en un diseño enseñar trucos a los animales.
intrasujetos o entre sujetos. Justifique su respuesta en 4. Indica qué es un cuadrado latino equilibrado y explica por
cada caso. qué es un esquema de contrapeso preferido en muchas
una. Un estudio psicológico social de la ayuda, en el que situaciones. Dibuje dos cuadrados latinos balanceados
los investigadores están interesados en cómo el similares a los de las tablas 9.1 y 9.2 para los casos en
tamaño del grupo afecta si un individuo ayudará o no los que hay (a) tres condiciones y (b) cuatro condiciones.
a otra persona del grupo.
b. Un estudio del efecto de variar el volumen de un tono 5. Los resultados de algunos experimentos descritos en este
para medir la rapidez con la que las personas pueden capítulo mostraron diferentes efectos de una variable
responder al tono. independiente cuando se manipulaba entre
59533_10_ch09_p227-260.indd 258 9533_10_ch09_p227-260.indd 258 3/5/08 /5/08

y dentro de las materias. Haga una lista de tres tipos de diseños producirían resultados diferentes.
variables para las que cree que los diseños entre y Justifica tu razonamiento en cada caso.
dentro de los sujetos mostrarían los mismos efectos, 6. Discuta los tipos de confusión que pueden surgir del
y proporcione dos ejemplos más en los que crea que los dosuso de un diseño AB .
CONEXIONES WEB
Explore la presentación paso a paso de "Entre y dentro de los diseños" en:
http:// academic.cengage.com/psychology/workshops/student_resources/
talleres/entre1.html
Una descripción general útil del aprendizaje está disponible en:
http://www.funderstanding.com/theories.cfm
Una buena discusión sobre el diseño de la investigación se puede encontrar en:
http://trochim.human.cornell.edu/kb/expfact.htm
Conocimiento de los resultados como refuerzo

Las personas reciben muchos refuerzos en forma de conocimiento de los resultados en lugar de recompensas
biológicas, como los gránulos de comida que se dan a las ratas hambrientas en las cajas de Skinner. “Eso es bueno” o
“Casi lo has entendido bien” se dan con frecuencia como retroalimentación. Entonces, además de ser recompensados
por las aproximaciones a una respuesta correcta, también se nos dice qué tan cerca estamos de una respuesta objetivo.
Lo siguiente se basa en un famoso experimento realizado por Thorndike (1932). Proporcionamos una variante de
su procedimiento que fue sugerida por Snellgrove (1981). Thorndike les vendó los ojos a los sujetos y les pidió que
dibujaran líneas de 3 pulgadas de largo. Se produjeron pocas o ninguna mejora en la precisión cuando los sujetos no
recibieron el conocimiento de los resultados, pero Thorndike encontró una rápida configuración del comportamiento
cuando se les dio el conocimiento de los resultados: a las personas se les dijo "correcto" cuando estaban dentro de un
octavo de pulgada y "equivocado" cuando estaban desviados por más de un octavo de pulgada. Usted variará el tipo
de retroalimentación: a algunos participantes no se les dirá nada, a otros se les dirá "bien" cuando estén dentro de un
octavo de pulgada de 3 pulgadas, y a un tercer grupo se le dirá exactamente cuánto largo dibujó una línea (para un
dieciseisavo de pulgada). Necesitarás papel, lápices, una regla y una venda para los ojos.
Cada persona recibirá 10 ensayos, con un único tipo de conocimiento de resultados. Registre la precisión (hasta un
dieciseisavo de pulgada) en cada prueba para cada persona, de modo que pueda comparar la tasa de progreso en las
10 pruebas para cada forma de retroalimentación.
Podría usar un diseño dentro de los sujetos, en el que una persona intenta dibujar diferentes longitudes de línea
(por ejemplo, 2 pulgadas, 3 pulgadas y 5 pulgadas) bajo una de cada una de las condiciones de retroalimentación. Con
un diseño dentro de los sujetos, deberá equilibrar el tipo de retroalimentación a lo largo de la línea, así como el orden
de las condiciones a lo largo del experimento. Este experimento probablemente se realice mejor con un diseño entre
sujetos, debido a los efectos de arrastre relativamente permanentes que resultan de los diferentes tipos de
retroalimentación.
59533_10_ch09_p227-260.indd 259 9533_10_ch09_p227-260.indd 259 3/5/08 /5/08

Si usa un diseño entre sujetos, debe combinar sus esfuerzos con los de sus compañeros de clase, de
modo que pueda tener una muestra grande de participantes en cada grupo de retroalimentación.
Asegúrese de acordar un protocolo, porque todos los experimentadores deben tratar a los
participantes de manera idéntica (excepto por los niveles de la variable independiente) durante la prueba.
El tiempo para dar retroalimentación debe ser el mismo para cada condición de retroalimentación. El
conocimiento tardío de los resultados generalmente produce un mejor aprendizaje que el conocimiento
inmediato (p. ej., Swinnen, Schmidt, Nicholson y Shapiro, 1990), así que no confunda la rapidez con la
que se proporciona la retroalimentación con la naturaleza de la retroalimentación. En cada prueba, mida y
registre el desempeño, luego proporcione el conocimiento apropiado de los resultados antes de pasar a la
siguiente prueba. ÿ
59533_10_ch09_p227-260.indd 260 9533_10_ch09_p227-260.indd 260 3/5/08 /5/08

CAPÍTULO 10
RECORDANDO
Y
OLVIDANDO
LA CONTRIBUCIÓN DE EBBINGHAUS: CUANDO LA MEMORIA

ERA JOVEN
VARIEDADES DE MEMORIA
ILUSTRACIONES
Atenuación de escala: diferencias de modalidad

ILUSTRACIONES
Generalidad de los resultados: niveles de procesamiento

ILUSTRACIONES
Efectos de interacción: pruebas de memoria implícita y explícita

¿Qué es más efectivo, leer o escuchar?
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
RECURSOS DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: RECORDANDO EL 11-S
ATAQUES TERRORISTAS
261
59533_11_ch10_p261-296.indd 261 9533_11_ch10_p261-296.indd 261 3/5/08 /5/08

Toda la ciencia no es más que el refinamiento del pensamiento
cotidiano. (ALBERT EINSTEIN)
¿Qué experiencias puedes recordar de tu año en el octavo grado? Piense en ellos por un momento.
Aprendiste muchos hechos allí; te pasaron muchas cosas Probablemente nunca recordará ni siquiera
una pequeña fracción de los hechos que aprendió o las experiencias que tuvo entonces. ¿Qué ha
pasado con estos recuerdos? ¿Se pierden para siempre? ¿O los recuerdos todavía están almacenados
en algún lugar pero nunca se recuerdan activamente porque no ha tenido una situación apropiada
para traerlos a la mente? Hay algunas cosas que nunca olvidarás, aunque quieras, pero otras que no
puedes recordar, por más urgente que sea la necesidad. Si un romance en ciernes tuvo un final
catastrófico, este recuerdo de sus días en el octavo grado puede quedarse con usted mucho después
de que otros eventos hayan sido relegados a los oscuros rincones del pasado. ¿Por qué?
El humorista Robert Benchley, en un ensayo titulado "Lo que me hizo la universidad", intentó
recordar las cosas que había aprendido en la universidad años antes y clasificarlas según el año en
que las aprendió. Había 39 artículos en la lista. Recordó 12 cosas de su primer año; esto disminuyó a
solo 8 cosas recordadas de su último año. Un muestreo selectivo de la lista de Benchley aparece en
la Tabla 10.1.
Es selectivo solo con respecto a la cantidad de piezas de información incluidas, por lo que brinda una
representación justa de la profundidad y el alcance del conocimiento duradero adquirido en la
universidad. Por supuesto, debería estar feliz y orgulloso de saber que usted también puede tener
pronto un título universitario, un certificado que proclama su conocimiento de ciertos hechos básicos
como estos.
¿Es esto todo lo que Benchley realmente recuerda de sus días de universidad? Si hiciera una
lista de sus días en el octavo grado, probablemente sería igual de breve. Esto lleva a una pregunta
interesante: ¿Cómo podemos estudiar los recuerdos que no se pueden recordar? Si una persona no
puede recordar una experiencia, ¿podemos suponer que el rastro de memoria que representa esa
experiencia se ha desvanecido?
ÿ LA CONTRIBUCIÓN DE EBBINGHAUS: CUANDO LA MEMORIA ERA JOVEN
La investigación experimental de la memoria humana fue iniciada por un psicólogo alemán, Hermann
Ebbinghaus (Figura 10.1; véase Boneau, 1998, para una reseña biográfica).
Ebbinghaus fue un verdadero pionero científico. Él creía, a diferencia de su famoso contemporáneo,
Wilhelm Wundt (ver Apéndice A), que la psicología experimental podría desarrollarse para estudiar
los procesos mentales superiores y no solo los procesos sensoriales. Su principal logro fue demostrar
cómo la investigación empírica podía responder preguntas interesantes sobre la memoria. Esta
investigación se publicó en 1885 en un libro extraordinario, Memory: A Contribution to Experimental
Psychology. Una de las primeras preguntas que enfrentó Ebbinghaus fue la que hemos estado
considerando: cómo medir la memoria. Ebbinghaus sirvió como único sujeto en todos sus
experimentos; los materiales que inventó para ser memorizados son
59533_11_ch10_p261-296.indd 262 9533_11_ch10_p261-296.indd 262 3/5/08 /5/08

llamadas sílabas sin sentido. Por lo general, usaba sílabas sin sentido que contenían una
vocal intercalada entre dos consonantes (por lo tanto, llamadas sílabas CVC), como ZOK, VAP,
etc. Al usar estas sílabas, esperaba minimizar la influencia de las asociaciones lingüísticas que
habrían estado presentes si hubiera usado palabras, oraciones o (como lo hacía a veces)
pasajes de poesía como materiales para recordar. (Investigaciones posteriores han demostrado
que las sílabas "sin sentido" son un nombre inapropiado, porque algunos elementos que usó
fueron palabras. Además, al aprender incluso palabras sin sentido, las personas las imbuyen de si
Ebbinghaus seleccionó estas sílabas al azar de un conjunto maestro de 2300 y las colocó
en listas que variaban en longitud. Si la lista contenía, digamos, 30 sílabas sin sentido,
Ebbinghaus se leía las sílabas en voz alta a un ritmo uniforme. Inmediatamente después, tapaba
la lista y luego intentaba repetírsela a sí mismo.
59533_11_ch10_p261-296.indd 263 9533_11_ch10_p261-296.indd 263 3/5/08 /5/08

ÿ FIGURA 10.1
Hermann Ebbinghaus inició el

estudio experimental del
aprendizaje verbal y la memoria.
Bettman/
Corbis
©
o escribirlo. Obviamente, en el primer intento, esta hazaña fue imposible, pero pudo medir el número de
sílabas que pudo recordar correctamente. Luego leía la lista en voz alta por segunda vez, intentaba
recordarla, y así sucesivamente. Una medida de la dificultad de recordar una lista que usó Ebbinghaus es el
número de ensayos de estudio/prueba (o la cantidad de tiempo) necesarios para una recitación perfecta de
la lista. Esto se llama una prueba de criterio de medida de la memoria; fue ampliamente utilizado en la
investigación de la memoria durante años, aunque ahora es raro.
Supongamos que Ebbinghaus quisiera probar su memoria de una lista un mes después de aprenderla.
Podría, como señal inicial, proporcionarse la primera sílaba sin sentido de la lista.
Pero supongamos que esto no lo ayudó a recordar la lista y que, por mucho que lo intentó, no pudo recordar
nada más. ¿Significaría esto que la serie que había memorizado un mes antes no había dejado una
impresión duradera? ¿Cómo podríamos saberlo? Ebbinghaus inventó un ingenioso método para responder
a esta pregunta. Al medir la memoria de una serie de sílabas sin sentido, Ebbinghaus intentó volver a
aprender la serie, tal como la había aprendido en primer lugar, leyéndola repetidamente en voz alta y luego
intentando recitarla o escribirla. Una vez más, pudo medir el número de intentos o la cantidad de tiempo
necesario para aprender la lista. La memoria de la lista en el momento de volver a aprender podría medirse
por los ahorros en términos de menos intentos o menos tiempo necesario para volver a aprender la lista;
esta medida de la memoria se podría obtener incluso cuando una persona no pudiera recordar nada del
material antes de volver a aprenderlo. Ebbinghaus descubrió que incluso cuando no podía recordar ninguna
de las sílabas sin sentido de una lista, a menudo mostraba un ahorro considerable en el número de intentos
o la cantidad de tiempo que le tomaba volver a aprender la lista, lo que indica que la memoria de la lista
podría existir. sin recuerdo activo.
El puntaje de ahorro que usó Ebbinghaus fue el porcentaje de intentos ahorrados al volver a aprender
una lista en relación con el número original de intentos necesarios para aprender la lista en primer lugar. Por
ejemplo, si Ebbinghaus hizo 10 intentos para aprender una lista de sílabas sin sentido en orden, y luego,
una semana más tarde, solo tomó 5 intentos para volver a aprender la lista, esto representaría un ahorro del
10 5
50 por ciento (100%). Para decirlo10de manera
diferencia
más general,
entre elelnúmero
porcentaje
de intentos
de ahorro
en se
el aprendizaje
define comooriginal
la
(OL) de un
59533_11_ch10_p261-296.indd 264 9533_11_ch10_p261-296.indd 264 3/5/08 /5/08

lista y su reaprendizaje (RL) dividido por el número de intentos en el aprendizaje original (OL), con esta relación
multiplicada por 100. (La ecuación es OL RL 100%). Para mostrarle que tiene sentido,
OL
considere que inmediatamente después de aprender una lista a la perfección, no se necesitarán intentos
adicionales para volver a aprenderla, por lo que el ahorro sería del 100 por ciento
10
( 10100%
0 = 100%). Sin
embargo, si una persona esperó 10 años para volver a aprender la lista, probablemente sería como empezar
de nuevo, por lo que el ahorro sería del 0 por ciento (si se necesitara el mismo número de intentos para volver
a aprender la lista que para aprenderla originalmente:
10
10 10100% = 0%).
Los ejemplos que acabamos de usar eran hipotéticos, pero ¿cuál es la relación entre el ahorro y el tiempo
desde el aprendizaje original? Ebbinghaus planteó esta pregunta y, al responder, proporcionó uno de sus
hallazgos más conocidos, que se muestra en la figura 10.2.
El gráfico muestra la relación entre la cantidad de ahorro y el tiempo desde el aprendizaje original, o cómo
se relaciona el olvido con el tiempo. Como puede ver, Ebbinghaus descubrió que el olvido es rápido poco
después del aprendizaje, pero luego se ralentiza. el metodo del ahorro
todavía se usa hoy para hacer preguntas importantes sobre la memoria (p. ej., MacLeod, 1988; Keisler &
Willingham, 2007).
Aunque Robert Benchley puede haber exhibido poca memoria de la información que aprendió en la
universidad, si se le hubiera pedido que volviera a tomar sus cursos, probablemente, al igual que Ebbinghaus,
habría exhibido ahorros considerables. (Él nos dice que estos cursos incluían gemas como Grabadores del
Renacimiento Temprano, La Vida Social de los Poetas Menores del Siglo XVI, y la Historia de la Confección de
Encajes). libro, para el caso), pero presumiblemente encontraría el curso mucho más fácil si tuviera que tomarlo
de nuevo.
Quizás se pregunte si los hallazgos de Ebbinghaus son representativos de la memoria humana en general,
ya que estudió un solo sujeto (él mismo) repetidamente, un método que rara vez es aceptable en la investigación
moderna.
Sin embargo, sus hallazgos se han replicado muchas veces con grupos más grandes de sujetos y todavía
se consideran válidos. (La importancia de la "replicabilidad" o repetibilidad de los resultados experimentales se
analiza en el Capítulo 11).
100
80
60
Porcentaje
Ahorro
de
40
20
0
1 8 24 48
Intervalo de retención en horas
ÿ FIGURA 10.2
La curva del olvido. Ebbinghaus midió los ahorros en volver a aprender una lista de sílabas sin
sentido después de que habían transcurrido varios períodos de tiempo desde el aprendizaje original.
Observe que el olvido es rápido al principio y luego se nivela.
59533_11_ch10_p261-296.indd 265 9533_11_ch10_p261-296.indd 265 3/5/08 /5/08

El trabajo de memoria de Ebbinghaus fue verdaderamente original. Pero además de su
investigación seminal sobre la memoria, sus otros logros incluyen una interesante discusión sobre el
problema del sesgo del experimentador, la producción de uno de los primeros modelos matemáticos
de la psicología, uno de los primeros ejemplos de prueba de hipótesis explícita y una discusión
avanzada (por el momento) de problemas estadísticos en la investigación. También escribió un
interesante texto de psicología y diseñó una prueba temprana de inteligencia (Tulving, 1992).
Mary Calkins también hizo una importante contribución en el área de la investigación de la
memoria. Calkins, un antiguo alumno de William James, estaba interesado en cómo se formaban
las asociaciones (ver Furumoto, 1991). El método que inventó se conoce como aprendizaje asociado
emparejado. En esta técnica, los sujetos aprenden una lista de asociaciones arbitrarias como
cuchara-avión y silla-confianza. Más tarde, se prueba la memoria de las asociaciones presentando
la primera palabra de cada par (p. ej., cuchara) como clave de recuperación de la segunda palabra
(avión). A lo largo de los años, los investigadores interesados en la memoria han utilizado este
método y sigue siendo popular en la actualidad.
ÿ VARIEDADES DE MEMORIA
El término memoria es bastante amplio y abarca muchos tipos diferentes de destrezas y habilidades.
Todos tienen en común las propiedades de que algo se aprende, se retiene con el tiempo y luego se
usa en alguna situación particular, pero más allá de eso, los tipos de memoria pueden diferir
considerablemente (consulte Roediger, Marsh y Lee, 2002, para obtener un resumen). Probablemente
hayas tenido una experiencia como esta: te presentan a tres personas y olvidas por completo el
nombre de la primera persona cuando le das la mano a la tercera. Este olvido espectacularmente
rápido parece bastante diferente del olvido más lento estudiado por Ebbinghaus. Recordar
información como un número de teléfono durante un breve intervalo refleja la memoria a corto plazo
o de trabajo, y algunos psicólogos creen que tiene propiedades diferentes de la memoria a largo
plazo (el tipo que estudió Ebbinghaus) y que debería considerarse una memoria distinta. sistema o
tienda. Una forma de definir la memoria a corto plazo es la recuperación de la información poco
después de haber sido percibida, incluso antes de que haya dejado la conciencia (James, 1890). La
memoria a largo plazo, entonces, se refiere a la recuperación de recuerdos que han desaparecido
de la conciencia después de su percepción inicial.
Esta definición general de memoria a largo plazo parece hoy demasiado amplia para la mayoría
de los psicólogos, que hacen más distinciones entre los tipos de memoria. Estos se analizan con
más detalle más adelante en el capítulo, cuando ilustramos cómo se estudia la memoria de diferentes
maneras. Una distinción básica que guía gran parte de la investigación actual es la memoria explícita
versus la memoria implícita (Graf & Schacter, 1985; Schacter, 1987). La memoria explícita (a veces
llamada memoria episódica) se refiere al recuerdo consciente de eventos (o episodios) en la vida
de uno. Se les puede pedir a las personas que recuerden lo que aprendieron en un momento o lugar
en particular o que distingan las cosas que les sucedieron de distracciones plausibles. Los ejemplos
serían responder a la pregunta de qué hizo el sábado pasado por la noche, qué aprendió en su
curso de introducción a la psicología o qué ha hecho hasta ahora. Las tareas que normalmente se
usan para medir tanto la memoria a corto como a largo plazo se clasificarían como pruebas de
memoria explícita, porque a las personas se les dice explícitamente que recuperen información de su pas
La memoria implícita, por otro lado, se refiere a la expresión del aprendizaje pasado en el que
una persona no necesita hacer ningún esfuerzo consciente para recuperar información del pasado
(Roediger & McDermott, 1993; Schacter, 1990). Simplemente sucede, más o menos automáticamente.
Por ejemplo, cuando te agachas para atarte los cordones de los zapatos, no necesitas decirle a
59533_11_ch10_p261-296.indd 266 9533_11_ch10_p261-296.indd 266 3/5/08 /5/08

Variables dependientes (ver Capítulo 7). Recientemente, los investigadores

interesados en el reconocimiento han utilizado el tiempo de
Recordar puede medirse de muchas maneras; estos a reacción como medida dependiente, como se explica en el
menudo implican recuerdo o reconocimiento. En las pruebas capítulo 8.
de recuerdo, se requiere la reproducción del material, mientras El estudio de las pruebas de memoria implícita ha
que en las pruebas de reconocimiento, el material se presenta intrigado a los psicólogos cognitivos últimamente (Roediger,
a las personas y se les pide que juzguen si lo han visto o no 1990). Aunque estas pruebas no requieren que las personas
previamente. Tres pruebas populares de recuerdo son el recuerden conscientemente el material que han estudiado, el
recuerdo en serie, el recuerdo libre y el recuerdo asociado desempeño en estas tareas se ve influenciado o “preparado”
emparejado. En el recuerdo en serie, se requiere que las por la exposición previa al material. Es decir, las pruebas de
personas recuerden la información en el orden en serie en memoria implícita son tareas que se pueden realizar sin una
que se presentó, mientras que en el recuerdo libre, el orden referencia específica a las experiencias previas en el
de recuerdo es irrelevante. En el recuerdo de pares asociados, laboratorio, como completar una palabra fragmentada como
a las personas se les presentan pares de elementos, como el “s_r_w_e_r_”. En este tipo de tareas, la “memoria” se refleja
salón iglú; al recordar, se les da un miembro de la pareja (iglú, en el hecho de que el desempeño en la prueba está
denominado estímulo) y se les pide que produzcan el otro condicionado o sesgado por el episodio de estudio anterior.
miembro (salón, la respuesta). Por ejemplo, su capacidad para completar el fragmento de
palabra anterior como fresa
Las pruebas de reconocimiento son generalmente de dos tipos. mejoraría mucho si hubiera leído la palabra fresa antes,
En las pruebas de reconocimiento de sí/no , a las personas aunque no se le pidió explícitamente que recordara haberlo
se les da el material original que estudiaron, como palabras, hecho. Estas pruebas son especialmente interesantes porque
mezclado con una serie de elementos (palabras) nuevos pero se comportan de manera muy diferente a las pruebas
generalmente similares. Los sujetos responden sí o no a cada tradicionales de memoria explícita, como el recuerdo y el
palabra, según crean que estaba en la lista original. Las reconocimiento. En cierto sentido, las "leyes de la memoria"
pruebas de reconocimiento de elección forzada son son diferentes cuando se examinan con estas pruebas
pruebas de opción múltiple. Se presentan varias alternativas, implícitas que con las pruebas estándar de memoria explícita.
de las cuales sólo una es correcta, y el sujeto del experimento
se ve obligado a elegir la alternativa correcta. Decisión forzada Más adelante en el capítulo, examinaremos más de cerca
estas pruebas implícitas.
Se prefieren las pruebas a las pruebas de sí/no porque
corregir las conjeturas es un problema menor. Variables independientes
Las pruebas de recuerdo y reconocimiento no son
dicotómicas; más bien, pueden verse como si estuvieran en En los experimentos sobre la memoria humana se manipulan
un continuo, siendo la dimensión la cantidad de información muchos tipos de variables. Una de las variables más populares
dada sobre el material, o el poder de las pistas de recuperación históricamente ha sido la naturaleza del material presentado
presentadas. Si GRA se presenta como una pista para la para la memoria. Pueden ser letras, dígitos, sílabas sin
palabra GRAPH, sentido, palabras, frases, oraciones, párrafos o largos pasajes
que aparecían en la lista, ¿es esta una prueba de recuerdo o de prosa; las características de cada uno de estos tipos de
de reconocimiento? material también pueden ser variadas. Por ejemplo, las
En cada caso, la medida dependiente en las pruebas palabras que se refieren a objetos concretos (cigar, rhi
de recuerdo y reconocimiento es el número o proporción de noceros) se recuerdan mejor que las palabras abstractas
elementos correctamente recordados o reconocidos en (beauty, dread), cuando otros factores relevantes, como la
diferentes condiciones o el número de errores, que equivale longitud de la palabra, se mantienen constantes (Paivio,
a lo mismo. 1969). Varias otras variables independientes importantes
cosa. A veces se usa una medida derivada, como d de la serán consideradas en los experimentos.
teoría de detección de señales
Continuado
59533_11_ch10_p261-296.indd 267 9533_11_ch10_p261-296.indd 267 3/5/08 /5/08

discutido en este capítulo. Uno es bastante obvio: el intervalo Variables de control

de retención entre la presentación del material y la prueba, que
Ebbinghaus estudió por primera vez (ver Figura 10.2). ¿Qué tan Los experimentos de memoria suelen estar bastante bien
rápido ocurre el olvido? controlados. Las variables importantes que generalmente se
¿Cuáles son sus mecanismos? Otra variable que llama mucho mantienen constantes a través de las condiciones son la cantidad
la atención es la modalidad de presentación. ¿Se recuerda mejor de material presentado y la tasa de presentación, aunque estas
la información si entra por los oídos o por los ojos, o no hay pueden ser variables interesantes por derecho propio. La
diferencia? La estrategia de estudio también es importante, modalidad de presentación es otro factor que no debe variar,
como la forma en que una persona trata de aprender (o codificar) salvo que se trate de una variable de mayor interés. Si se está
el material. Una última variable que se está considerando es la variando alguna característica del material, entonces es necesario
naturaleza de la prueba de memoria que se les da a las personas. mantener constantes otros factores. Si un investigador está
interesado en variar la concreción o abstracción de las palabras,
Por ejemplo, ¿las pruebas de recuerdo muestran resultados entonces otras características, como la longitud de la palabra y
diferentes de las pruebas de reconocimiento? ¿En qué se la frecuencia de aparición en el uso cotidiano, deben mantenerse
diferencian las pruebas de memoria implícita de las pruebas constantes en las diferentes condiciones.
explícitas? Esta es solo una muestra de las variables que se
investigan en los estudios de memoria.
usted mismo, “¿Cómo hago esto? ¿Cuándo aprendí a hacer esto? ¿Puedo recordar cómo? En cambio, el
comportamiento ocurre relativamente sin esfuerzo, y si te detienes a reflexionar sobre cómo lo estás
haciendo exactamente, es posible que te vaya peor. Por supuesto, la información expresada implícitamente
fue aprendida, pero el quid de la distinción es que, a diferencia del recuerdo explícito, las expresiones
implícitas de la memoria no requieren que las personas recuperen conscientemente información de su
pasado. De hecho, como veremos más adelante en el capítulo, los patrones de desempeño en las pruebas
de memoria explícitas e implícitas suelen ser bastante diferentes (Roediger, 1990).
Atenuación de escala de tema

Ilustración Modalidad Diferencias
El primer tema que estamos considerando aquí es importante, pero a menudo se pasa por alto en la
investigación psicológica. El problema general es cómo interpretar el desempeño de alguna variable
dependiente en un experimento cuando el desempeño es casi perfecto (cerca del “techo” de la escala) o
casi inexistente (cerca del “piso”). Estos efectos se denominan efectos de atenuación de escala (o, más
comúnmente, efectos de techo y suelo).
Como de costumbre, insertaremos nuestra discusión en el contexto de un problema de investigación real.
Un tema en la investigación de la memoria que ha llamado mucho la atención es el de las diferencias
de modalidad. ¿Recordamos mejor la información si nos llega por los ojos o por los oídos? ¿O no hay
diferencia? ¿Se recuerda mejor la información si se presenta tanto a los oídos como a los ojos
simultáneamente en relación con una condición en la que se presenta solo a uno u otro? Estas preguntas
son de importancia no sólo teórica sino también práctica. Cuando busca un número de teléfono y necesita
recordarlo mientras cruza la habitación hacia el teléfono, ¿es suficiente simplemente leer el número en
silencio para sí mismo como lo hace habitualmente, o sería mejor leer también el número en voz alta?
¿Entonces esa información entró tanto en tus oídos como en tus ojos?
59533_11_ch10_p261-296.indd 268 9533_11_ch10_p261-296.indd 268 3/5/08 /5/08

Los ojos lo tienen: el experimento de Scarborough
Scarborough (1972) informó de un intento de responder a estas preguntas. Usó una tarea de memoria a
corto plazo llamada técnica Brown-Peterson en honor a sus inventores (Brown, 1958; Peterson & Peterson,
1959). Aquí, a las personas se les presenta información para que la recuerden durante un período corto y
luego se distraen de ensayar (repitiéndolas a sí mismas) al exigirles que realicen alguna otra tarea hasta
que luego se les pide que recuerden la información. Por lo general, a los sujetos se les da un solo trigrama
CCC (tres consonantes, por ejemplo, NRF). Luego se les pide que cuenten hacia atrás de tres en tres a
partir de un número de tres dígitos (464, 461, 458, etc.) durante períodos variables (el intervalo de retención)
hasta aproximadamente 30 segundos antes de intentar recordar. (Nuevamente, el conteo es para evitar que
las personas ensayen las letras o las repitan en silencio). Pruébelo usted mismo. Aparecerán tres letras y
un número de tres dígitos después de la siguiente oración. Lea las letras y el número en voz alta, mire hacia
otro lado y luego cuente hacia atrás de tres en tres a partir del número durante unos 30 segundos antes de
intentar recordar las letras.
XGR 679
¿Como hiciste? Lo más probable es que hayas recordado perfectamente el trigrama. La gente casi siempre
lo hace en la primera prueba de los experimentos que utilizan esta tarea. Sin embargo, el recuerdo disminuye
cuando se utilizan varios intentos con un trigrama diferente en cada intento, de modo que después de cuatro
o cinco intentos, los sujetos suelen recordar los trigramas correctamente solo el 50 por ciento del tiempo,
con un intervalo de retención de 18 segundos (Figura 10.3). ). Este fenómeno se denomina interferencia
proactiva, ya que las primeras pruebas en esta tarea interfieren con el recuerdo en pruebas posteriores.
En el experimento de Scarborough (1972), todos los sujetos recibieron 36 trigramas de consonantes
presentados durante 0,7 segundos en la técnica de Brown-Peterson. Había tres grupos de seis sujetos; el
método en el que se presentaron los trigramas difirió para cada
1.0
.8
3 segundos
.6
Proporción
correcta
.4
18 segundos
.2
0 1 246 3 5
Número de intentos
ÿ FIGURA 10.3
Retención de un Trigrama de Estímulo en Función del Número de Pruebas (1-6) y el Intervalo

de Retención en Cada Prueba (3 o 18 segundos). En la primera prueba, se olvida muy poco el
trigrama, incluso con un intervalo de retención de 18 segundos. Sin embargo, después de una
serie de pruebas, el recuerdo se vuelve más pobre debido a las pruebas anteriores, especialmente
con el intervalo de retención de 18 segundos (Keppel & Underwood, 1962). Este fenómeno se
conoce como interferencia proactiva.
59533_11_ch10_p261-296.indd 269 9533_11_ch10_p261-296.indd 269 3/5/08 /5/08

Señal de advertencia Tono y luces amarillas
Trigrama de estímulo presentado NFR

(auditivo, visual o ambos)
Número presentado 681
Cuenta hacia atrás de tres en tres 678

o 0, 3, 6, 9, 12 o 18 segundos
F 675
672
669
666
etc.
Período de recuperación (10 segundos) luces verdes

n..?...R
ÿ FIGURA 10.4
Resumen esquemático de una prueba típica en el procedimiento de memoria a corto plazo de Brown-Peterson,
como se usa en el experimento de Scarborough.
grupo. Un grupo de sujetos vio los trigramas (solo condición visual), un grupo escuchó los trigramas
(solo auditivo) y un tercer grupo vio y escuchó los trigramas (auditivo visual). El tiempo de
presentación se controló cuidadosamente haciendo que los trigramas se presentaran en una
grabadora o un taquistoscopio, un dispositivo para exponer y eliminar rápidamente la información
visual. Un segundo después de la presentación del trigrama, los sujetos escucharon un número de
tres dígitos, excepto en una condición en la que se pidió a los sujetos que recordaran el trigrama
inmediatamente (la condición de intervalo de retención de 0 segundos). Los sujetos en cada
condición debían retener las letras durante intervalos de retención de 0, 3, 6, 9, 12 o 18 segundos.
Una vez que se presentaba el número de tres dígitos, se pedía a los sujetos que contaran hacia
atrás de tres en tres en voz alta a razón de una cuenta por segundo (al compás de un metrónomo)
para evitar que ensayaran el trigrama. Al final del intervalo de retención, el metrónomo se detuvo
y se encendieron dos luces verdes, lo que indica el período de recuperación de 10 segundos. Por
lo tanto, cada prueba consistió en una señal de advertencia (dos luces amarillas y un tono) que
indicaba que el trigrama estaba a punto de mostrarse; presentación del trigrama; presentación del
número de tres dígitos (con la única excepción que se acaba de señalar); el intervalo de retención
durante el cual los sujetos contaron hacia atrás de tres en tres; y, finalmente, el período de
recuperación. Un ensayo típico se ejemplifica en la Figura 10.4. Este procedimiento se repitió 36
veces (seis ensayos en cada uno de los seis intervalos de retención, en un orden equilibrado) con
diferentes trigramas. En resumen, se combinaron tres condiciones entre sujetos (solo visual, solo
auditivo, visual y auditivo) con seis condiciones dentro de los sujetos (intervalos de retención de 0,
1, 3, 6, 9, 12 o 18 segundos) en el experimento. .
Los resultados del experimento de Scarborough se reproducen en la figura 10.5, donde el

porcentaje de veces que se informó correctamente un trigrama se representa en función del
intervalo de retención. Esta figura (y las estadísticas que informa Scarborough lo respaldan)
muestra que los sujetos que recibieron solo una presentación visual de los trigramas generalmente los
59533_11_ch10_p261-296.indd 270 9533_11_ch10_p261-296.indd 270 3/5/08 /5/08

Auditivo + Visual
Solo auditivo
Solo visual
1.0
.9
.8
.7
.6
Probabilidad
correcto
informe
de
.5
.4
.3
.2
.1
0 3 6 9 12 18
Intervalo de retención
ÿ FIGURA 10.5
La probabilidad de recordar correctamente un trigrama de estímulo en función de las tres condiciones

de presentación y la duración de la tarea de conteo. Note que (1) la presentación visual es generalmente
superior a la presentación auditiva, y (2) la presentación auditiva y visual simultánea no es mejor que la
presentación visual solamente (Scarborough, 1972).
un mayor porcentaje del tiempo que los sujetos que recibieron solo presentación auditiva.
Además, recibir información en ambas modalidades simultáneamente no produjo mejor
recuerdo que presentar la información solo visualmente; el porcentaje correcto en cada
intervalo de retención es aproximadamente el mismo para sujetos solo visuales y visuales
más auditivos. Hasta aquí todo bien. Pero, ¿qué más podemos concluir de la figura 10.5?
Específicamente, ¿podemos concluir algo sobre las tasas de olvido de la información que
se presenta de forma auditiva y visual? ¿La tasa de olvido es la misma o diferente en los dos
Scarborough (1972) fue bastante cuidadoso a este respecto. Aunque las funciones
solo auditivas y solo visuales parecen divergir cada vez más a medida que se alarga el
intervalo de retención, no llegó a la conclusión de que la tasa de olvido es mayor para la
información presentada a través de los oídos que a través de los ojos. Sin embargo,
considere lo que dijo otro escritor sobre este experimento en su libro de texto:
La figura muestra que las curvas interceptan la ordenada Y aproximadamente en el mismo punto y
divergen significativamente. El valor de intercepción en cero seg. proporciona una medida de la
percepción y almacenamiento original de los estímulos, ya que mide cuánta información tiene el
sujeto inmediatamente después de la presentación de los estímulos, cuando no se ha producido
ningún olvido. La tasa de olvido se puede determinar a partir de las pendientes de las funciones de
olvido. De acuerdo con este análisis, la Figura 10.5 muestra que los ítems presentados auditivamente
se olvidan mucho más rápido que los ítems presentados visualmente (Massaro, 1975, pp. 530-531).
59533_11_ch10_p261-296.indd 271 9533_11_ch10_p261-296.indd 271 3/5/08 /5/08

Lamentablemente, aunque parezca razonable, esta conclusión debe ser cuestionada. La
razón es que el rendimiento en el intervalo de retención de 0 segundos es casi perfecto en todas
las condiciones. Cuando el rendimiento es perfecto, es imposible saber si existen diferencias
"reales" entre las condiciones debido a la atenuación de la escala, en este caso, un efecto de
techo. Si la escala de la medida dependiente fuera realmente lo suficientemente "larga", podría
mostrar diferencias entre la presentación auditiva y visual, incluso en el intervalo de retención de
0 segundos. Por tanto, la conclusión de Massaro de que la tasa de olvido es mayor para la
presentación auditiva que para la visual no puede aceptarse sobre la base del argumento que
acabamos de citar, porque la suposición de un rendimiento equivalente en el intervalo de
retención de 0 segundos puede no ser correcta.
Todo esto puede ser un poco confuso al principio, así que tomemos un caso más claro y
demostremos el mismo principio. Supongamos que dos hombres obesos deciden hacer una
apuesta sobre quién podría perder la mayor cantidad de peso en un cierto período de tiempo.
Un hombre parecía mucho más pesado que el otro, pero ninguno estaba seguro de cuánto
pesaba en realidad, ya que ambos evitaban las balanzas. La báscula que decidieron usar para
la apuesta fue una báscula de baño común que va de 0 a 300 libras. El día que iban a comenzar
sus programas de pérdida de peso, cada hombre se pesó mientras el otro observaba. Para su
gran sorpresa, ambos hombres pesaban exactamente lo mismo, 300 libras. Entonces, a pesar
de sus diferentes tamaños, los dos hombres decidieron que comenzaban su apuesta en pesos iguale
De nuevo, el problema es uno de los efectos de techo en la escala de medida. El rango de
peso de la báscula de baño simplemente no fue lo suficientemente alto para registrar el peso
real de estos hombres. Imaginemos que se encontraría que uno pesa realmente 300 libras y el
otro 350 libras, si sus pesos hubieran sido tomados por una balanza con un rango mayor.
Después de 6 meses de su programa de pérdida de peso, supongamos además que ambos
hombres habían perdido 100 libras. Ambos volverían a pesarse en este punto y descubrirían que
uno ahora pesaba 200 libras y el otro 250. Como creían que ambos habían partido del mismo
peso (300), llegarían a la conclusión errónea de que la persona que actualmente pesaba 200
había ganado la apuesta.
Consulte la Figura 10.6(a).
El problema aquí es realmente el mismo que al interpretar los resultados del experimento
de Scarborough como evidencia de que la información presentada auditivamente se olvida a un
ritmo mayor que la información presentada visualmente. No hay mejor manera para que sepamos
la tasa de olvido en las dos condiciones de interés en ese experimento que para los dos hombres
saber la tasa de pérdida de peso al juzgar quién ganó su apuesta. En ningún caso podemos
asumir puntajes iniciales equivalentes antes de que comience la medición de la pérdida.
Una forma de evitar este problema en el experimento de Scarborough sería ignorar los
puntos de datos en el intervalo de retención de 0 segundos y preguntar si la tasa de olvido es
mayor entre 3 y 18 segundos para la presentación auditiva que para la visual. Esto podría
hacerse calculando una interacción entre la presentación y el intervalo de retención en el rango
de 3 a 18 segundos; pero simplemente inspeccionando la figura 10.5, puede hacerse una idea
de si los puntos solo auditivo y solo visual son cada vez más divergentes. Son entre 3 y 9
segundos, pero después de eso, la diferencia entre ellos se mantiene constante.
Sin embargo, esta falta de una diferencia cada vez mayor en los últimos tres puntos puede
deberse a un efecto suelo en la condición solo auditiva, ya que el rendimiento es muy bajo,
especialmente en el último punto (solo el 7 u 8 por ciento correcto). Se debe ser muy cuidadoso
al interpretar los datos cuando hay efectos techo o piso. Un investigador prudente dudaría en
sacar alguna conclusión de los datos de la figura 10.5 sobre las tasas de olvido: el índice de Scarboro
59533_11_ch10_p261-296.indd 272 9533_11_ch10_p261-296.indd 272 3/5/08 /5/08

375
350
325
300 300
275 275
250 250
225 225
200 200
175 175
150 150
0 0
Antes Después Antes Después
(a) (b)
ÿ FIGURA 10.6
El panel (a) ilustra la situación tal como la creían los hombres con sobrepeso: comenzaron
con el mismo peso y uno perdió el doble que el otro. El panel (b) revela el caso real, con el
efecto techo en la escala de medición eliminado. De hecho, ambos hombres perdieron 100
libras. La atenuación de escala (efectos techo y suelo) puede ocultar las diferencias reales
que pueden existir entre las condiciones de un experimento.
acercarse exactamente. Pero también debemos señalar que en los intervalos de retención en los que
no hay efectos techo ni suelo (3, 6 y 9 segundos), parece haber más olvido con la presentación
auditiva que con la visual, de acuerdo con la conclusión de Massaro citada anteriormente. .
¿Cómo se pueden evitar los problemas de los efectos suelo y techo en la investigación
psicológica? Desafortunadamente, no se puede dar una regla estricta. Los investigadores suelen
tratar de diseñar sus experimentos de modo que eviten los extremos en el rendimiento; luego, a
menudo ponen a prueba sus intuiciones sobre el desempeño en la tarea probando pequeños grupos de
Si estos sujetos rinden cerca del techo o del piso de la escala, a menudo será necesario revisar la
tarea experimental. Por ejemplo, si el rendimiento en un experimento de memoria es demasiado
bueno, se puede aumentar la cantidad de material que se proporciona para reducir el rendimiento. De
manera similar, si la tarea es tan difícil que las personas apenas recuerdan nada, se puede facilitar la
tarea reduciendo la cantidad de material, presentándolo más lentamente, etc. La idea es diseñar
tareas y escalas de desempeño para que las personas normalmente obtengan puntajes en rangos
medios. Luego, a medida que se manipulan las variables independientes, se pueden observar mejoras
o disminuciones en el desempeño de las personas. El investigador prudente por lo general hará el
esfuerzo de evaluar a los sujetos piloto antes de lanzarse a un experimento que puede resultar más
tarde defectuoso debido a los efectos techo o suelo. La prueba de sujetos piloto también permite al
investigador aprender acerca de otros problemas en el diseño o procedimiento del experimento.
59533_11_ch10_p261-296.indd 273 9533_11_ch10_p261-296.indd 273 3/5/08 /5/08

Tema Generalidad de los resultados

Ilustración Niveles de procesamiento
Mencionamos en el Capítulo 3 que hay muchas maneras de probar una hipótesis y que los
experimentos individuales que prueban una hipótesis, aunque informativos hasta cierto punto, deben
verse en el contexto de otros experimentos diseñados para probar la misma hipótesis de otras
maneras. Idealmente, a los investigadores les gustaría que los experimentos que prueban una hipótesis
particular en una variedad de situaciones converjan en una conclusión, pero en realidad, a menudo no
es así. El problema es de generalidad de los resultados: a menudo, la conclusión extraída de una
situación experimental no se generaliza a otras situaciones. Esto es frustrante pero inevitable. También
es importante. Siempre debemos hacernos estas preguntas después de que algún experimento haya
mostrado un efecto de alguna variable independiente sobre alguna variable dependiente: ¿A qué
poblaciones de sujetos se generaliza este efecto? (El hecho de que un efecto sea válido para las ratas
no significa necesariamente que lo sea para las personas; véase el capítulo 15.) ¿Bajo qué escenarios,
experimentales o extraexperimentales, se mantiene esta conclusión? ¿Se mantendrá la conclusión
cuando las variables independientes y dependientes se operacionalicen o definan de una manera
ligeramente diferente a como lo hacen en el experimento original? La cuestión de la generalidad surge
en todos los tipos de investigación. Si grandes dosis de alguna droga producen cáncer en ratones de
laboratorio, ¿debería prohibirse el consumo humano de esta droga, incluso cuando el nivel de dosis
es mucho más pequeño y el organismo es completamente diferente? Por supuesto, probar con
animales es un primer paso crítico para descubrir si una sustancia es dañina (o útil) antes de probarla
en humanos, pero los efectos en una especie no significan necesariamente que se encontrarán los
mismos efectos en otra especie.
Para ilustrar las cuestiones que rodean el problema de la generalidad de los resultados,
consideramos experimentos relacionados con los niveles de enfoque de procesamiento de la
memoria. Craik y Lockhart (1972) propusieron que la memoria podría verse como un subproducto de
la percepción y, además, que la percepción podría concebirse como un progreso a través de varias
etapas o niveles. Por ejemplo, considere su percepción y comprensión de la palabra YATE. Craik y
Lockhart (1972) notaron que una persona presta atención a las características en diferentes "niveles"
cognitivos cuando lee una palabra así. Un primer nivel es el de los rasgos superficiales de las
apariencias: la palabra tiene cinco letras, incluye una vocal, está en mayúsculas, etc. La percepción
de las letras de la palabra es un primer paso para leerla; un grafémico
Se requiere un nivel de análisis (letra). En segundo lugar, la lectura de muchas palabras va
acompañada de la traducción de la forma escrita a algún código común (fonémico) que se comparte
con las palabras que se escuchan. El código se llama fonético (o fonológico) porque se supone que
se basa en fonemas, los patrones de sonido básicos de un idioma. Confiaríamos en un código fonético
cuando decidiéramos que yate rima con caliente, aunque las palabras no se parezcan. Una tercera
etapa, o nivel, de procesamiento es la determinación del significado de una palabra. El propósito de la
lectura es derivar el significado de las palabras, saber qué es un yate. Esto se conoce como un nivel
semántico de análisis.
Craik y Lockhart (1972) propusieron que percibir palabras (o cualquier otra cosa) implicaba el
progreso a través de las etapas desde la apariencia (niveles superficiales del sistema cognitivo) hasta
el significado (niveles profundos del sistema cognitivo). Además, argumentaron que el recuerdo
posterior de las experiencias estaba directamente relacionado con la profundidad del procesamiento
durante la percepción inicial: cuanto más profundo sea el nivel de procesamiento durante la percepción
inicial, mejor debería ser el recuerdo de la experiencia.
59533_11_ch10_p261-296.indd 274 9533_11_ch10_p261-296.indd 274 3/5/08 /5/08

Un experimento informado por Craik y Tulving (1975) ilustra el tipo de evidencia que respalda el
enfoque de los niveles de procesamiento de la memoria. Los investigadores presentaron sujetos de
pregrado con 60 palabras y les pidieron que respondieran preguntas sobre cada palabra. Las preguntas
fueron diseñadas para manipular el nivel de procesamiento de las palabras.
Por ejemplo, los sujetos pueden ver la palabra OSO en una pantalla y se les hace una de las siguientes
tres preguntas: ¿Está en letras mayúsculas? ¿Rima con silla? ¿Es un animal? En cada caso, el sujeto
debe responder que sí, pero al hacerlo debe procesar la palabra en diferentes niveles. En el primer caso,
solo se deben verificar las características superficiales (grafémicas) de la palabra para responder a la
pregunta sobre el tipo de letra. En el segundo caso, se debe consultar el sonido de la palabra (o su código
fonético). Finalmente, en el tercer caso, el sujeto debe acceder al significado de la palabra, o procesarla
semánticamente. Los investigadores predijeron, de acuerdo con la teoría de los niveles de procesamiento,
que las palabras procesadas a niveles más profundos deberían recordarse mejor que aquellas procesadas
a niveles más superficiales (semántico, fonémico, grafémico).
Los resultados de Craik y Tulving (1975) confirmaron estas predicciones de manera impresionante.
Examinaron la memoria mediante una prueba de reconocimiento en la que a los sujetos se les dieron las
60 palabras antiguas (aquellas sobre las que habían respondido preguntas) junto con 120 palabras nuevas.
Se les dijo a los sujetos que trataran de elegir y encerrar en un círculo exactamente 60 palabras que
habían visto en la fase anterior del experimento. Debido a que los sujetos tenían que elegir 60 palabras,
el rendimiento aleatorio (es decir, el nivel esperado para las personas que nunca habían visto las palabras)
habría sido del 33 por ciento (60 de 180). Los resultados se muestran en la Figura 10.7 para aquellas
palabras que recibieron una respuesta afirmativa durante la fase de estudio. El reconocimiento aumentó
desde justo por encima del azar con el procesamiento superficial y grafémico de la apariencia de la
palabra hasta casi la perfección con un nivel de procesamiento profundo y semántico. La única diferencia
entre las tres condiciones durante la fase de estudio fue el proceso mental muy breve que se produjo
cuando la persona respondió la pregunta, por lo que este experimento muestra el poder de los procesos
de codificación incluso muy rápidos en la memoria. Los resultados se ajustaron muy bien a las predicciones
de la teoría de los niveles de procesamiento.
90
80
70
Reconocido
correctamente
Porcentaje
60
50
40
grafémico fonético Semántico

(carta) (rima) (sentido)
Niveles de Procesamiento
ÿ FIGURA 10.7
Resultados de Craik y Tulving (1975). Los sujetos respondieron preguntas sobre palabras
que fueron diseñadas para efectuar diferentes niveles de procesamiento: grafémico (¿Está en
letras mayúsculas?), fonémico (¿Rima con ____?) y semántico (¿Está en la categoría ____?).
De acuerdo con el enfoque de niveles de procesamiento, cuanto más profundo era el nivel de procesamiento
original, más preciso era el reconocimiento en la prueba posterior. (Según Craik y Tulving, 1975.)
59533_11_ch10_p261-296.indd 275 9533_11_ch10_p261-296.indd 275 3/5/08 /5/08

Los niveles del enfoque de procesamiento y los experimentos diseñados para probarlo han entusiasmado
mucho a los psicólogos experimentales y han producido una gran cantidad de investigación (ver Gardiner, Java y
Richardson-Klavehn, 1996; Lockhart y Craik, 1990). De hecho, la revista Memory publicó un número especial
completo sobre el tema (2002, vol. 10, número 5–6). Nuestra preocupación aquí es la generalidad de los resultados
experimentales básicos, como se ve en la figura 10.7, más que la teoría misma. La teoría ha sido criticada por ser
circular e incomprobable, porque no existe una forma independiente de evaluar la profundidad o el nivel de
procesamiento excepto por el desempeño en una prueba de memoria (Nelson, 1977). Sin operaciones convergentes
(véanse los capítulos 7 y 14) sobre la construcción de los niveles de procesamiento, la teoría corre el riesgo de ser
circular: el procesamiento que produce una buena retención es un procesamiento profundo, y viceversa. A pesar de
esta dificultad, el marco de trabajo de los niveles de procesamiento ha generado una enorme cantidad de
investigación, en parte porque los efectos experimentales básicos son muy fuertes. Pocas variables en el estudio
de la memoria llevan el desempeño de niveles casi aleatorios a casi perfectos, con todas las demás variables
manteniéndose constantes.
Los resultados de Craik y Tulving (1975) son poderosos, pero ¿qué tan generales son? Los sujetos del
experimento eran estudiantes universitarios muy seleccionados; los materiales eran palabras sueltas sobre las que
se hacían preguntas; la prueba era de reconocimiento, con sujetos obligados a responder con un número fijo de
palabras (por lo que tenían que adivinar); y el nivel de procesamiento fue operacionalizado (manipulado) de una
manera particular. ¿Alguna o todas estas características fueron críticas para producir los resultados de Craik y
Tulving (1975)? Como discutimos en el Capítulo 3, cada experimento implica muchas opciones para decidir cómo
se prueba una teoría o hipótesis en particular. Se necesita más investigación para determinar la generalidad de los
hallazgos.
Jenkins (1979) ha propuesto una forma interesante de pensar sobre el tema de la adaptabilidad general de
los resultados, tal como se representa en su modelo tetraédrico de experimentos de memoria .
se muestra en la figura 10.8. (Un tetraedro tiene cuatro caras; de ahí el nombre.) Jenkins (1979) señaló que
cualquier investigador que explore la memoria debe elegir entre cuatro dimensiones, ya sea que esa dimensión en
particular sea o no de interés en el experimento (es decir, incluso si es una variable de control). Estos son (1) los
sujetos que se evalúan, (2) el material utilizado para aprender y evaluar, (3) las tareas de orientación (o las
características del entorno en el que se evalúan los sujetos) y (4) el tipo de prueba usó. Roediger (2008) observó
recientemente que hay incluso más dimensiones que deben considerarse, pero aquí nos centraremos en las cuatro
originales de Jenkins. En el experimento de Craik y Tulving (1975), los investigadores estaban interesados en cómo
la tarea de orientación (las preguntas que orientaban a los sujetos a procesar las palabras de formas particulares)
afectaba la retención. Los otros tres no eran de interés, por lo que se controlaron estas posibles variables: todos los
sujetos eran estudiantes universitarios, la prueba de memoria era de reconocimiento y los materiales utilizados eran
palabras.
El marco de Jenkins (1979) señala que cualquier resultado experimental debe verse en el contexto de otras variables
potenciales que podrían haber sido manipuladas. La cuestión de la generalidad de los resultados se puede enmarcar
de la siguiente manera: si se manipularan las otras variables de control, ¿se mantendrían los mismos resultados? Si
la variable independiente se definiera operativamente de una manera diferente, ¿se replicaría el resultado? Pasamos
ahora a la investigación que ayuda a responder esta pregunta sobre los niveles de efecto de procesamiento. (La
siguiente cobertura no está completa, pero ilustra los puntos mediante el uso selectivo de ejemplos).
Asignaturas
¿Las personas que no sean estudiantes universitarios muestran los niveles de efecto de procesamiento (mejor
memoria para el material procesado de manera significativa)? En general, la respuesta aquí hasta la fecha es sí.
Por ejemplo, Cermak y Reale (1978) probaron pacientes con síndrome de Korsakoff,
59533_11_ch10_p261-296.indd 276 9533_11_ch10_p261-296.indd 276 3/5/08 /5/08

Asignaturas
Estudiantes universitarios
esquizofrénicos
jugadores de ajedrez
Niños
•
•
•
Orientación de tareas/configuraciones
Pruebas (Tareas Criterios)
Instrucciones
retiro libre
Estrategias Recuerdo con clave
Expectativas
Reconocimiento
Contexto
Transferir
•
•
•
•
•
•
Materiales
Palabras
Fotos
Párrafos
Organización
•
•
•
ÿ FIGURA 10.8
Modelo tetraédrico de experimentos de memoria de Jenkins (1979). Cada esquina representa un

conjunto de factores en los que pueden estar interesados los investigadores de la memoria. Incluso si
solo un factor (digamos, tipo de material) es de interés en un experimento, el resultado del experimento
aún puede verse infl uido por los valores seleccionados en las otras dimensiones como variables de contro
un trastorno cerebral que sufren algunos alcohólicos crónicos debido a una deficiencia de vitaminas.
Una característica del síndrome de Korsakoff es un grave déficit de memoria en las pruebas de memoria
explícita, como el recuerdo o el reconocimiento. No obstante, Cermak y Reale (1978) descubrieron que
los pacientes de Korsakoff sí mostraban un nivel de efecto de procesamiento cuando se les evaluaba
de manera similar a Craik y Tulving (1975). Aunque el rendimiento fue mucho más bajo en general para
59533_11_ch10_p261-296.indd 277 9533_11_ch10_p261-296.indd 277 3/5/08 /5/08

Los pacientes de Korsakoff que los sujetos de control normales, los pacientes todavía mostraron una
retención algo mejor después de la codificación significativa que después de la codificación superficial.
Otros experimentos se han dirigido a la variable edad. Murphy y Brown (1975) evaluaron a niños
en edad preescolar (menores de 5 años) dándoles 16 imágenes y haciendo que diferentes grupos las
juzgaran en tres dimensiones diferentes. A un grupo se le preguntó si las imágenes pertenecían a una
categoría en particular. A un segundo grupo se le preguntó si las imágenes representaban algo agradable
o desagradable. A los niños de un tercer grupo se les pidió que nombraran el color dominante en las
imágenes. Se consideró que esta última tarea implicaba una codificación superficial, mientras que se
pensaba que las dos primeras eran profundas. Los resultados salieron de esta manera: los niños que
habían nombrado los colores de las imágenes durante la fase de estudio recordaron el 18 por ciento de
las imágenes más tarde, pero los que habían realizado las tareas de codificación más significativas
recordaron alrededor del 40 por ciento. Se ha argumentado que incluso los bebés de 3 meses muestran
niveles de efectos de procesamiento; las manipulaciones que dirigieron selectivamente su atención
durante la codificación afectaron su reconocimiento posterior de los estímulos móviles (Adler, Gerhardstein
y Rovee Collier, 1998). En el otro extremo de la vida, los adultos mayores también muestran fuertes
niveles de efectos de procesamiento (Craik, 1977). En resumen, los niveles del efecto de procesamiento
son relativamente sólidos en todas las variables de los sujetos estudiados hasta ahora.
Materiales
¿Se pueden encontrar efectos de nivel de procesamiento con materiales que no sean listas de palabras?
Obviamente, el efecto sería de poco interés si no se generaliza más allá de esta restricción. Smith y
Winograd (1978) mostraron rostros de personas a razón de uno cada 8 segundos. A un grupo se le pidió
que decidiera si cada persona tenía o no una nariz grande (un juicio superficial). A otro grupo se le dijo
que juzgara si cada persona era amistosa (un juicio profundo). En una prueba de reconocimiento
posterior, los sujetos que juzgaron las caras por su amabilidad las reconocieron mejor que aquellos que
las juzgaron por el tamaño de la nariz, confirmando los niveles básicos del efecto de procesamiento con
las caras.
Como se mencionó en la sección anterior, Murphy y Brown (1975) probaron a niños en edad
preescolar con imágenes en un nivel de paradigma de procesamiento y también replicaron el efecto
básico. Lane y Robertson (1979) también encontraron un nivel de efecto de procesamiento en la memoria
de los jugadores de ajedrez para las posiciones en los tableros. También se han encontrado niveles de
efectos de procesamiento con materiales tan diversos como caracteres chinos (Lee, 2002) y acciones
simples (Zimmer & Engelkamp, 1999).
En general, existe evidencia de que el nivel de procesamiento de ideas puede extenderse al
material no verbal, aunque ciertamente es cierto que la gran mayoría de los niveles de procesamiento de
la investigación han utilizado material verbal. Sin embargo, Intraub y Nicklos (1985) informaron una
excepción a este patrón. Hicieron que las personas miraran imágenes y respondieran preguntas físicas
(¿Esto es horizontal o vertical?) o preguntas que requerían acceso al significado (¿Esto es comestible o
no comestible?). Más tarde, pidieron a los sujetos que recordaran las imágenes escribiendo una frase
descriptiva de una o dos oraciones. Sorprendentemente, descubrieron que las preguntas físicas
conducían a una mejor retención que las preguntas significativas, un patrón inverso al habitual. El
resultado no puede descartarse como una casualidad, porque replicaron el hallazgo en seis experimentos
en diversas condiciones. El hallazgo inusual de Intraub y Nicklos (1985) representa algo así como un
misterio; hasta ahora nadie ha explicado satisfactoriamente por qué encontraron un nivel inverso del
efecto de procesamiento (juicios físicos superiores a los juicios significativos) en la retención de imágenes.
Pero las excepciones a un patrón general pueden generar oportunidades para el avance teórico, como
veremos en la siguiente sección.
59533_11_ch10_p261-296.indd 278 9533_11_ch10_p261-296.indd 278 3/5/08 /5/08

Orientación de tareas y configuraciones
Esta categoría de variables se refiere a los muchos aspectos del contexto experimental particular, incluidas
las instrucciones que se dan a los sujetos, la versión particular de la tarea experimental, las estrategias que
usan los sujetos, etc.
Se ha demostrado que el nivel básico del efecto de procesamiento (la codificación profunda produce
una mayor retención que la codificación superficial) se mantiene sobre una amplia variedad de cambios en el
entorno experimental. Por ejemplo, una dimensión que a menudo se considera en los experimentos de
memoria es si los sujetos saben, antes de exponerse al material de estudio, que se evaluará su memoria.
Cuando se les dice a los sujetos que se evaluarán sus recuerdos, se habla de aprendizaje intencional; cuando
se les da material sin tal advertencia (pero creen que están realizando alguna otra tarea), se denomina
aprendizaje incidental (porque el sujeto percibe que aprender el material es incidental al propósito del
experimento). Craik y Tulving (1975) evaluaron a sujetos en condiciones de aprendizaje incidental e intencional
y demostraron que el efecto del nivel de procesamiento se produjo en ambos casos.
Otra dimensión de interés en el nivel de experimento de procesamiento son las preguntas particulares
(o las tareas de orientación) utilizadas para inducir un procesamiento superficial y profundo. Craik y Tulving
(1975) hicieron que los sujetos juzgaran el tipo de letra de las palabras (mayúsculas o minúsculas) para la
dimensión física superficial y juzgaran si la palabra pertenecía o no a una categoría particular (¿animal?) para
el nivel profundo. Pero se podrían usar muchos otros tipos de preguntas para dirigir la atención de los sujetos
a la superfi -
aspectos especiales o significativos de las palabras. Por ejemplo, Hyde y Jenkins (1969) preguntaron a los
sujetos si las palabras contenían letras particulares (¿una e ?) como tarea superficial y que calificaran el
agrado de las palabras como tarea profunda. Esta manipulación también produjo un nivel robusto de efecto
de procesamiento. En general, numerosas manipulaciones con materiales verbales convergen en la misma
conclusión: la retención es más pobre después de tareas de orientación físicas (superficiales) que después
de tareas de orientación significativas (profundas).
Por lo tanto, el nivel de efecto de procesamiento es generalmente robusto en muchas variaciones del
paradigma experimental básico con materiales verbales y con recuerdo o reconocimiento como pruebas de
memoria.
Tipo de prueba
La cuarta dimensión en el modelo de experimentos de memoria de Jenkins (1979) es el tipo de prueba
utilizada para evaluar la memoria. Las medidas estándar de la memoria han sido variaciones en las pruebas
de recuerdo y reconocimiento. Los efectos del nivel de procesamiento se han encontrado repetidamente con
ambos tipos de prueba. Sin embargo, los investigadores han encontrado otro tipo de pruebas en las que el
nivel de procesamiento no tiene efecto (Fisher & Craik, 1977; Jacoby & Dallas, 1981; McDaniel, Friedman &
Bourne, 1978) o incluso un efecto inverso (Morris, Bransford, & francos, 1977). Este descubrimiento ha
ayudado a refinar las ideas sobre los niveles de procesamiento y condujo a un nuevo enfoque, el
procesamiento apropiado para la transferencia. La idea básica que guía esta investigación es que la forma de
una prueba, qué tipo de conocimiento aprovecha, puede determinar qué actividades de codificación son útiles
para la prueba.
Morris y asociados (1977) realizaron un experimento similar en muchos aspectos al experimento original
de Craik y Tulving (1975). Usaron estudiantes universitarios como sujetos y les pidieron que hicieran juicios
sobre las palabras. Las preguntas sobre las palabras (p. ej., EAGLE ) se diseñaron para inducir un nivel de
procesamiento fonético ("— ¿rima con legal ?") o un nivel semántico ("— ¿es un pájaro grande?"). Los sujetos
respondieron preguntas fonémicas para la mitad de las palabras y preguntas semánticas para la otra mitad,
con la respuesta correcta.
59533_11_ch10_p261-296.indd 279 9533_11_ch10_p261-296.indd 279 3/5/08 /5/08

responda “sí” la mitad de las veces y “no” la mitad de las veces. De acuerdo con la vista de los niveles de
procesamiento, las preguntas significativas deberían producir una codificación más profunda y una mejor retención.
Esta predicción se confirmó en una prueba de reconocimiento estándar (como la utilizada por Craik y Tulving)
en la que las palabras estudiadas se mezclaban con palabras no estudiadas y la tarea de los sujetos era
seleccionar las palabras estudiadas. Como se muestra en el panel izquierdo de la figura 10.9, los sujetos
reconocieron palabras el 84 por ciento de las veces después de la codificación semántica, pero solo el 63 por
ciento de las veces después de la codificación fonémica.
Pero Morris y asociados (1977) le dieron a un segundo grupo de sujetos una prueba diferente llamada
prueba de reconocimiento de rimas. El trabajo de los sujetos en esta prueba era examinar una lista de palabras
y seleccionar palabras que rimaran con palabras que habían estudiado anteriormente. Entonces, si beagle
estuviera en la lista de prueba, deberían elegirlo porque rima con la palabra estudiada águila. (Ninguna de las
palabras de la lista de prueba había aparecido en la lista de estudio, solo palabras que rimaban con ellas). Los
sujetos se desempeñaron mejor en la prueba de reconocimiento de rimas si habían estudiado palabras en la
condición fonémica (49 por ciento correcto) que en la semántica. condición (33 por ciento correcto), una
inversión del hallazgo habitual. Así, Morris y asociados (1977) argumentaron que un tipo de procesamiento no
es inherentemente superior o inferior a otro tipo, sino que los efectos de las manipulaciones de codificación
dependen de cómo se usará o probará la información. En lugar de niveles fijos de procesamiento, abogaron
por un procesamiento apropiado para la transferencia: el desempeño en una prueba se beneficiará en la
medida en que el conocimiento adquirido (o las operaciones realizadas) durante el estudio coincidan con el
conocimiento o las operaciones requeridas por la prueba. En una prueba de reconocimiento que requería el
uso de conocimiento fonético (rima), la codificación fonémica previa condujo a un mejor desempeño que la
codificación semántica.
Aunque los niveles de efectos de procesamiento son sólidos en muchas variables, no se generalizan a
todos los tipos de pruebas. Para las pruebas que requieren acceso a información significativa,
.90 Reconocimiento estándar Reconocimiento de rimas

Prueba Prueba
.80
.70
.60
correctamente
reconocida
Proporción
.50
.40
.30
.20
rima semántica rima semántica
Condición de codificación
ÿ FIGURA 10.9
Resultados de Morris, Bransford y Franks (1977). Después de responder preguntas sobre palabras
diseñadas para hacerles pensar sobre el sonido de la palabra (codificación fonémica) o significado
(codificación semántica), los sujetos tomaron una prueba de reconocimiento estándar (panel izquierdo) o una
prueba de reconocimiento de rima en la que tenían que seleccionar palabras que rima con las palabras
originales estudiadas (panel derecho). Los niveles habituales de efectos de procesamiento se encontraron con la
prueba de reconocimiento estándar, pero la codificación fonémica produjo un mejor rendimiento que la codificación
semántica en la prueba de reconocimiento de rimas. Por lo tanto, los tipos de procesamiento no son
inherentemente superficiales o profundos, sino que dependen de la forma en que se debe usar la información.
Un procesamiento deficiente para un tipo de prueba puede ser un buen procesamiento para otra prueba.
59533_11_ch10_p261-296.indd 280 9533_11_ch10_p261-296.indd 280 3/5/08 /5/08

nivel estándar de efectos de procesamiento se encuentran. Sin embargo, esto no es así para otros tipos
de pruebas (ver Jacoby y Dallas, 1981; Roediger, Weldon, Stadler y Riegler, 1992).
Esta sección se ha orientado en torno al modelo de experimentos de memoria de Jenkins (1979)
que se muestra en la figura 10.8, pero su modelo también puede ampliarse para aplicarse a todos los
experimentos de psicología. Es decir, en cualquier línea de investigación, uno debe preguntarse si los
resultados se generalizarán entre tipos de sujetos, entre entornos de investigación, entre diferentes
medidas dependientes y entre diferentes formas de manipular las variables independientes.
Siempre que un resultado experimental no se generalice a través de alguna variable, notar este
hecho es solo el primer paso. El verdadero problema es averiguar por qué. Los científicos a menudo
tienden a no creer oa ignorar las excepciones a las creencias firmemente sostenidas, al menos hasta
que la excepción se ha replicado suficientes veces como para destacar. Siempre es incómodo cambiar
de opinión acerca de creencias fuertemente arraigadas, pero una de las formas en que la ciencia a veces
progresa a pasos agigantados es cuando se comprende una excepción empírica a una teoría ampliamente
A menudo, comprender la excepción hace que descartemos o modifiquemos mucho nuestra teoría.
Así, los fracasos de la generalización no son necesariamente de lamentar; pueden ser grandes
oportunidades. El hallazgo de que los niveles de los efectos del procesamiento no se mantienen en todas
las pruebas ha llevado a un nuevo enfoque teórico llamado procesamiento apropiado para la transferencia,
que también se ha aplicado en otros dominios (ver Blaxton, 1989; Roediger, 1990).
Efectos de la interacción del tema

Ilustración Pruebas de memoria implícita y explícita
El efecto de interacción es un término estadístico que surge del uso del análisis de varianza en la
evaluación de experimentos multifactoriales, o aquellos que tienen más de una variable independiente.
Los efectos de interacción se conocen más comúnmente como interacciones y se discutieron
previamente en los Capítulos 3 y 8. (El análisis de varianza se describe en el Apéndice B). Sin embargo,
debido a que el concepto de interacciones es tan importante, lo consideramos nuevamente con algo más
de detalle. . Además, hemos descubierto que es un concepto que molesta un poco a los estudiantes, por
lo que los tratamientos repetidos deberían proporcionar una mejor comprensión del tema.
Como recordará, los experimentos multifactoriales son aquellos en los que dos o más variables
independientes se manipulan al mismo tiempo. Un efecto de interacción ocurre cuando el efecto de una
variable independiente difiere según el nivel de la otra variable independiente. Ya ha estado expuesto a
los efectos de interacción varias veces en este capítulo, aunque no nos referimos a ellos como tales. Por
ejemplo, los resultados de Scarborough (1972) que se ven en la figura 10.5 muestran que la superioridad
de la presentación visual sobre la auditiva en su paradigma de memoria a corto plazo dependía del
intervalo de retención utilizado. De manera similar, los resultados de Morris y asociados (1977) que se
muestran en la figura 10.9 muestran una interacción entre el nivel de procesamiento durante el estudio y
el tipo de prueba realizada. Los ejemplos utilizados en esta sección son similares a los de Morris y
asociados (1977).
Pruebas implícitas y explícitas

Usaremos las diferencias entre las pruebas de memoria implícita y explícita para ilustrar varios tipos de
interacciones. La distinción entre estos tipos de pruebas se describió brevemente al comienzo del capítulo
y se amplía aquí.
59533_11_ch10_p261-296.indd 281 9533_11_ch10_p261-296.indd 281 3/5/08 /5/08

Las medidas de memoria explícita son aquellas que requieren que una persona recuerde conscientemente
el material que estudió durante una parte anterior del experimento. Ejemplos de tales pruebas son el recuerdo
libre, el recuerdo con claves y el reconocimiento; en cada caso, se les dice a las personas que recuerden
experiencias previas. Por lo tanto, estas pruebas se presentan explícitamente como pruebas de memoria.
Por el contrario, las pruebas de memoria implícita son tareas que se pueden realizar sin una referencia
específica a las experiencias previas en el laboratorio. Un ejemplo de una prueba implícita es la tarea de
completar fragmentos de palabras. En esta tarea, los sujetos ven palabras a las que les faltan letras y deben
completar los espacios en blanco para formar palabras completas (p. ej., __l__p__a__t para elefante). Por lo
general, se les dice a las personas que produzcan cualquier palabra que se ajuste al marco lo más rápido
posible; no se les dice que algunos de los fragmentos están hechos de elementos previamente estudiados.
Los fragmentos son bastante difíciles y, por lo general, una persona puede completar solo del 20 al 35 por
ciento de ellos si no los ha visto recientemente. La proporción de fragmentos que se pueden completar sin que
un sujeto haya estudiado nunca los elementos es la condición de control, a menudo denominada "línea de
base no estudiada". Sin embargo, si la persona ha leído las palabras que completan los fragmentos en algún
momento antes de realizar la prueba de finalización de fragmentos, puede completar muchos más fragmentos:
por lo general, alrededor del 25 por ciento más de ellos. Esto ocurre incluso cuando a las personas no se les
dice que los fragmentos provienen de las palabras estudiadas anteriormente.
Se dice que la memoria se prueba implícitamente, porque aunque los sujetos no tienen que tratar de recordar
las palabras estudiadas para realizar la tarea, su desempeño mejora espontáneamente por las exposiciones
previas.
Esta mejora en el rendimiento se llama cebado. Para medir el priming, los investigadores evalúan a los
sujetos en una mezcla aleatoria de fragmentos de palabras que estudiaron y palabras que no estudiaron. La
puntuación de preparación de cada persona se puede calcular restando la proporción de elementos no
estudiados que se resolvieron (la línea base no estudiada) de la proporción de elementos estudiados
completados. Por ejemplo, suponga que ha estudiado 10 palabras. Más tarde, recibe una prueba de fragmentos
con fragmentos de las 10 palabras que ha estudiado, más otros 10 fragmentos de palabras que no ha
estudiado, mezclados al azar. Si resuelve fragmentos para 5 de las 10 palabras estudiadas (50 por ciento),
pero solo 2 de las 10 palabras no estudiadas (línea de base no estudiada del 20 por ciento), entonces su
puntuación inicial sería 0,50 0,20 0,30. (Para asegurarse de que la diferencia entre las palabras estudiadas y
las no estudiadas no se deba simplemente a que los elementos estudiados son más fáciles, los elementos se
equilibran entre los sujetos. Es decir, la mitad de los sujetos estudian la mitad de los elementos, mientras que
los otros sujetos estudian la otra mitad). la mitad de los ítems. Por lo tanto, durante el transcurso del
experimento, cada ítem aparece como un ítem estudiado y no estudiado con la misma frecuencia. Consulte el
Capítulo 9).
Otro ejemplo de una prueba de memoria implícita es la prueba de finalización de raíz de palabra. En esta
prueba, las personas ven raíces de palabras que son las primeras tres letras de una palabra, como ele___, y
se les dice que completen la raíz con la primera palabra que les venga a la mente. ¿Qué palabra se te ocurrió
para completar esta raíz? Lo más probable es que hayas pensado en "elefante" en lugar de "elemento" o
"elegante", etc., porque te prepararon con esa palabra en un párrafo anterior. La misma preparación ocurre
cuando las personas estudian una lista de palabras antes de realizar la prueba de finalización de raíz de
palabra.
También se han utilizado varios otros tipos de pruebas de memoria implícita, pero no los describiremos
aquí (ver Roediger & McDermott, 1993). La característica crítica de estas pruebas es que todas se pueden
realizar sin que las personas necesariamente se den cuenta de que están recordando el episodio de estudio
anterior, aunque sus respuestas estén influenciadas o “preparadas” por el material que han visto anteriormente.
A veces se dice que estas pruebas
59533_11_ch10_p261-296.indd 282 9533_11_ch10_p261-296.indd 282 3/5/08 /5/08

reflejan “memoria sin conciencia” (Jacoby & Witherspoon, 1982) porque un mejor desempeño no
requiere que las personas sean conscientes de la relación entre la prueba y los materiales de estudio.
Amnesia
El interés en la distinción entre medidas de memoria implícitas y explícitas surgió originalmente de la
investigación con amnésicos (p. ej., Warrington y Weiskrantz, 1970). Los pacientes con amnesia tienen
daño cerebral por cualquiera de varias fuentes, como alcoholismo crónico (síndrome de Korsakoff),
anoxia (pérdida de oxígeno al cerebro), cirugía o lesión en la cabeza; muestran graves déficits de
memoria en las medidas de retención explícitas.
Por lo general, pueden recordar o reconocer muy poco sobre la información presentada recientemente,
aunque sus otras funciones cognitivas estén intactas. ¡Algunos casos son tan profundos que los médicos
del paciente deben volver a presentarse cada vez que se reúnen con el paciente!
El siguiente extracto está tomado de un libro de Wayne Wickelgren (1977), quien trabajó con pacientes
amnésicos.
Una vez, en el curso de la prueba de una de estas personas, tuve una experiencia bastante espeluznante.
El paciente era un joven de unos veinte años que recientemente había sufrido daño cerebral debido a un
accidente de esgrima inusual. Suzanne Corkin me presentó al paciente diciendo algo como: “Este es
Wayne Wickelgren”. El joven respondió: "Wickelgren, ese es un nombre alemán, ¿no?" Dije que no."
Luego dijo "¿irlandés?" Nuevamente dije “no”. Luego dijo "¿escandinavo?" y respondí “sí”. Hablé con él
durante unos cinco minutos y luego tuve que irme para hacer una llamada telefónica. Cuando regresé,
todos estaban parados en aproximadamente los mismos lugares que antes. Sue, al darse cuenta de que
el paciente no sabría que me había conocido antes, me volvió a presentar. Después de que ella dijo: “Este
es Wayne Wickelgren”, él procedió a decir: “Ese es un nombre alemán, ¿no es así?”. Respondí, “no”.
Luego dijo: "¿Irlandés?" Dije “no” y él dijo “¿escandinavo?”, exactamente la misma serie de preguntas que
me había hecho la primera vez que me vio (p. 326).
Para más ejemplos de las dificultades que enfrentan los amnésicos en la vida diaria, el lector interesado
debería adquirir el libro de Philip Hilts (1995) sobre HM, quien es probablemente el amnésico más
famoso. Hilts, un reportero, relata cómo HM no recordaba haber presenciado un accidente (a pesar de
que HM estaba en un auto que tuvo que virar bruscamente para evitar chocar con el auto volcado) y
cómo HM seguía sin estar seguro del estado de su padre 4 años después de su muerte. muerte del
padre. Por lo tanto, el recuerdo explícito de los amnésicos se ve gravemente afectado, en comparación
con el de los sujetos normales. En el pasado, a menudo se planteó la hipótesis de que los amnésicos
carecían de la capacidad de aprender y almacenar nueva información verbal.
En 1970, Elizabeth Warrington y Lawrence Weiskrantz decidieron evaluar la memoria de los
amnésicos de una manera diferente e hicieron un descubrimiento que ha cambiado mucho la forma en
que los científicos piensan sobre la amnesia, en particular, y el funcionamiento de la memoria en general.
Warrington y Weiskrantz pidieron a amnésicos y sujetos de control (pacientes sin enfermedad
neurológica) que estudiaran listas de 24 palabras y luego probaron sus recuerdos de varias maneras
diferentes. (Estudiaron diferentes listas para cada prueba de memoria). Discutimos dos de las pruebas
aquí.
La primera prueba era una prueba tradicional de recuerdo libre explícito, en la que simplemente se
instruía a los sujetos para que recordaran tantas palabras como fuera posible. Como era de esperar, los
amnésicos recordaron muchos menos elementos (33 por ciento) que los controles (54 por ciento).
La segunda prueba era una prueba implícita, en la que los sujetos veían palabras perceptualmente
degradadas (se borraban partes de cada letra, de modo que ninguna de las palabras podía ser interpretad
59533_11_ch10_p261-296.indd 283 9533_11_ch10_p261-296.indd 283 3/5/08 /5/08

identificado por los sujetos antes de la prueba); simplemente se les indicó que trataran de descifrar y
nombrar la palabra. (Todas las palabras habían sido presentadas previamente durante la fase de
estudio.) La pregunta interesante era si los amnésicos mostrarían su pobre desempeño típico en esta
tarea de memoria implícita o si sucedería algo diferente.
Para introducir el concepto de interacciones, en la siguiente sección examinamos varios

resultados posibles que podrían haberse obtenido en este experimento.
Interacciones
En general, se dice que dos variables independientes interactúan cuando el efecto de una variable
(sobre la variable dependiente) cambia en diferentes niveles de la otra variable.
Hemos optado por ilustrar este concepto con nuestra discusión de las pruebas de memoria implícita y
explícita porque exhiben muchas interacciones interesantes. Es decir, las pruebas de memoria implícita
y explícita responden de manera diferente a las manipulaciones de ciertas variables independientes.
Las variables que tienen un gran efecto en una prueba implícita pueden no tener ningún efecto, o
incluso el efecto contrario, en las pruebas explícitas. Ahora ilustraremos las interacciones que
involucran pruebas de memoria implícita y explícita examinando algunos patrones diferentes de
resultados que podrían haberse obtenido en el experimento de Warrington y Weiskrantz, descrito en
la sección anterior.
La figura 10.10 contiene cuatro conjuntos de datos hipotéticos que ilustran diferentes patrones
de resultados que Warrington y Weiskrantz podrían haber observado en su experimento comparando
memoria implícita y explícita en sujetos amnésicos y de control. Los datos de las tablas de la izquierda
se ilustran en los gráficos de barras correspondientes (en los paneles centrales) y gráficos de líneas
(a la derecha). Tenga en cuenta que, técnicamente, las variables representadas aquí no deben
trazarse en gráficos de líneas; se representan de esta manera aquí solo para facilitar las comparaciones
de los diferentes formatos para presentar los datos. Discutiremos cada pantalla a su vez. Mientras
analizamos cada ejemplo, examine el patrón de datos en la tabla y luego observe cómo aparecen los
datos cuando se trazan en los gráficos.
El ejemplo A se incluye como punto de partida para demostrar cómo se verían los datos cuando
no hay interacción entre las variables. Aquí, los sujetos de control se desempeñan mejor que los
amnésicos tanto en las pruebas explícitas como implícitas, mostrando un efecto principal del grupo
de sujetos. Es decir, los sujetos cuyos recuerdos están intactos (controles) tienen mejores recuerdos
que los amnésicos, independientemente de cómo se pruebe la memoria. Por lo tanto, no hay
interacción entre el grupo de memoria y el tipo de prueba en este ejemplo. Los efectos principales son
generalizaciones; nos dicen que en cada nivel de una variable (aquí, tipo de prueba), se observó el
mismo efecto en la otra variable (aquí, los controles se desempeñaron mejor que los amnésicos).
El ejemplo B ilustra un posible tipo de interacción que podría obtenerse. En este caso, los
controles funcionan mejor que los amnésicos en la prueba de recuerdo libre explícito, pero los
amnésicos funcionan tan bien como los controles en la tarea de identificación de palabras. En otras
palabras, la diferencia tradicional entre los grupos amnésico y control desaparece cuando la memoria
se mide implícitamente. Así, el efecto de una variable independiente (la presencia o ausencia de un
déficit de memoria) cambia, dependiendo del nivel de la otra variable independiente (tipo de prueba).
Este es un ejemplo de lo que significa una interacción entre dos variables.
El ejemplo C ilustra un tipo de interacción que los investigadores suelen encontrar más
interesante, conocida como interacción cruzada. La razón de este nombre se ilustra mejor en el
gráfico de líneas C. En nuestro ejemplo, los sujetos de control muestran mejor memoria que los
amnésicos en la prueba explícita, pero los amnésicos muestran mejor memoria que los controles.
59533_11_ch10_p261-296.indd 284 9533_11_ch10_p261-296.indd 284 3/5/08 /5/08

3/5/08 /5/08 59533_11_ch10_p261-296.indd 285 9533_11_ch10_p261-296.indd 285
Los
datos
de
las
tablas
de
la
izquierda
se
ilustran
con
gráficos
de
barras
(paneles
del
medio)
ygráficos
de
líneas
(paneles
de
la
derecha).
Las
variables
categóricas,
como
las
ilustradas
aquí,
deben
trazarse
con
gráficos
de
barras.
Las
variables
con
escalas
de
medición
ordinales,
de
intervalo
yde
razón
se
pueden
trazar
con
gráficos
de
líneas.
Tenga
en
cuenta
que,
técnicamente,
las
variables
representadas
aquí
no
deben
representarse
en
gráficos
de
líneas:
se
representan
de
esta
manera
aquí
solo
para
facilitar
las
comparaciones
de
los
diferentes
formatos
para
presentar
los
datos.
Interacciones
hipotéticas
entre
el
tipo
de
prueba
(recuerdo
libre
explícito
versus
identificación
implícita
de
palabras)
yel
déficit
de
memoria
(amnésicos
versus
controles). ÿFIGURA
10.10 amnésicos Ejemplo
B amnésicos
Ejemplo
A
Control
S Control
S
Retirada
gratuita Retirada
gratuita
Explícito Explícito
.33 .54 .33 .54
Tipo
de
prueba Tipo
de
prueba
Mesas
Identificación Identificación
Implícito Implícito
Palabra Palabra
.48 .46 .33 .54
Proporción
correcta Proporción
correcta
.20 .30 .40 .50 .60 .70 .20 .30 .40 .50 .60 .70
Controla
Amnésicos Controla
Amnésicos
Retirada
gratuita Retirada
gratuita
Gráficos
de
barras
Identificación
de
palabras
Identificación
de
palabras
Proporción
correcta
.20 .30 .40 .50 .60 .70 .20 .30 .40 .50 .60 .70
Retirada
gratuita Retirada
gratuita
Explícito
Explícito
Gráficos
de
líneas
amnésicos amnésicos
Control
S Control
S
Identificación
de
palabras
Identificación
de
palabras
Implícito
Implícito
3/5/08 /5/08 59533_11_ch10_p261-296.indd 286 9533_11_ch10_p261-296.indd 286
continuaciónÿFIGURA
10.10 amnésicos Ejemplo
D amnésicos
Ejemplo
C
Control
S Control
S
Retirada
gratuita
Retirada
gratuita
.23 .64 .33 .54
Tipo
de
prueba Tipo
de
prueba
Mesas
Identificación Identificación
Palabra Palabra
.33 .54 .54 .33
Proporción
correcta
.20 .30 .40 .50 .60 .70 .20 .30 .40 .50 .60 .70
Controla
Amnésicos Controla
Amnésicos
Retirada
gratuita
Retirada
gratuita
Gráficos
de
barras
Identificación
de
palabras
Identificación
de
palabras
Proporción
correcta
.20 .30 .40 .50 .60 .70 .20 .30 .40 .50 .60 .70
Retirada
gratuita
Retirada
gratuita
Explícito
Explícito
Gráficos
de
líneas
amnésicos
amnésicos Control
S
Identificación
de
palabras
Identificación
de
palabras Control
S
Implícito
Implícito
en la prueba implícita. Así, en una interacción cruzada, la primera variable independiente tiene un
efecto en un nivel de la segunda variable independiente, pero tiene el efecto opuesto en el otro nivel
de la segunda variable independiente. Si obtuviéramos los datos del Ejemplo C en nuestro
experimento, concluiríamos que los amnésicos tienen mejor memoria que los sujetos de control si la
memoria se mide implícitamente (al menos en esta prueba), pero ocurre lo contrario en la prueba
explícita.
Aunque existen muchos otros tipos de interacciones, terminaremos nuestras ilustraciones con la
interacción representada en el Ejemplo D. Si estos datos se obtuvieran en nuestro experimento,
concluiríamos que el déficit amnésico es más pronunciado en la prueba explícita que en la implícita. .
Es decir, aunque los sujetos de control se desempeñan sustancialmente mejor que los amnésicos en
la prueba implícita, la superioridad de la memoria de los controles sobre la memoria de los amnésicos
es aún mayor en la prueba explícita. Estos datos sugerirían que la prueba implícita es una medida
menos sensible de los déficit amnésicos que la prueba explícita.
No te mantendremos en suspenso por más tiempo. Resulta que Warrington y Weiskrantz
obtuvieron los resultados representados en el Ejemplo B. Descubrieron que, aunque los amnésicos
se desempeñaron muy mal en la prueba de recuerdo explícito, la cantidad de preparación que
mostraron en la tarea de identificación de fragmentos de palabras fue idéntica al desempeño de los
sujetos de control normales. ! (Recuerde que ningún sujeto pudo identificar ninguna de las palabras
fragmentadas antes de comenzar el experimento, por lo que las proporciones de los ítems identificados
son puntajes primarios). realizado sin hacer referencia al episodio de aprendizaje previo.
Desde el importante descubrimiento de Warrington y Weiskrantz, muchos otros experimentadores

han obtenido resultados similares con una variedad de tareas implícitas (Dunn, 1998; Gabrieli, Keane,
Zarella y Poldrack, 1997; Shimamura, 1986). Es decir, aunque los amnésicos se desempeñan mal en
las pruebas explícitas, muestran cebado conservado en las pruebas implícitas. Las razones de estas
interacciones no se comprenden del todo, pero ciertamente disipan la noción de que los amnésicos
no conservan un registro conmemorativo de experiencias recientes. Al menos parte del problema de
los amnésicos parece residir en obtener acceso consciente a estas experiencias almacenadas.
Una consecuencia interesante del trabajo que compara el desempeño en pruebas explícitas e
implícitas es el examen de la memoria de personas normales. ¿Se pueden encontrar interacciones
entre estas medidas en personas normales? Si es así, esto argumentaría que el explícito/
el contraste implícito se generaliza a otros sujetos. En este caso (a diferencia de los niveles anteriores
de instancia de procesamiento), nos preguntamos si los hallazgos obtenidos con una población
inusual (pacientes amnésicos) se generalizan a grupos más típicos. De hecho, muchos experimentos
han mostrado interacciones entre variables independientes y el tipo de prueba en sujetos normales
(Roediger, 1990); consideramos aquí uno informado por Weldon y Roediger (1987).
Weldon y Roediger (1987) estaban interesados en el efecto de superioridad de la imagen, el
hallazgo de que las imágenes se recuerdan mejor que las palabras. Sin embargo, este efecto
generalmente solo se ha estudiado con pruebas de memoria explícita (recuerdo y reconocimiento), y
Weldon y Roediger (1987) querían extender el estudio de las diferencias entre imágenes y palabras a
las pruebas implícitas. (Sospechaban, por varias razones, que el efecto de superioridad de imagen no
se encontraría en pruebas implícitas, como las utilizadas por Warrington & Weiskrantz [1970]). En su
experimento, los estudiantes universitarios estudiaron una larga serie de imágenes y palabras en
anticipación de una prueba de memoria posterior, cuya naturaleza no se especificó.
Había tres juegos de artículos; los sujetos estudiaron un conjunto como imágenes y un conjunto como
palabras y no estudiaron el tercer conjunto. Los conjuntos de elementos se equilibraron entre los
sujetos, de modo que si los sujetos de un grupo veían la imagen de un elefante, los de otro grupo
veían la palabra elefante y los de un tercer grupo no veían el elemento de ninguna forma.
59533_11_ch10_p261-296.indd 287 9533_11_ch10_p261-296.indd 287 3/5/08 /5/08

Después de estudiar las palabras y las imágenes, los sujetos realizaron una prueba explícita de
recuerdo libre o una prueba implícita de finalización de fragmentos de palabras. En la prueba de
recuerdo libre, a los sujetos se les dio una hoja de papel en blanco y se les pidió que recordaran los
nombres de las imágenes y las palabras lo mejor posible (es decir, recordaron las imágenes
escribiendo sus nombres, no tratando de dibujarlas). A pesar de que el modo de respuesta siempre
fue verbal, las imágenes se recordaban mejor que las palabras, como se muestra en el lado izquierdo de la
El efecto de superioridad de imagen no fue grande en este experimento, pero fue estadísticamente
significativo y replica muchos otros informes (Madigan, 1983).
En la prueba de completar fragmentos de palabras, a los sujetos se les dio una larga serie de
palabras fragmentadas (p. ej., __l__p__a__t) y se les dijo simplemente que completaran cada una con
una palabra, si era posible. En este caso, la medida de interés era el cebado: la ventaja de completar
un fragmento cuando su presentación anterior era una imagen o una palabra, en relación con el caso
en que no se ha estudiado ninguna forma. Cuando los sujetos no estudiaron el concepto, completaron
el 37 por ciento de los fragmentos. Los datos en el lado derecho de la figura 10.11 muestran la
preparación del estudio previo de imágenes y palabras sobre este nivel. A diferencia de los resultados
de la izquierda y de toda la literatura anterior, las palabras produjeron más preparación que las
imágenes en la prueba implícita de finalización de fragmentos de palabras. El patrón de la figura 10.11
muestra una interacción entre la retención explícita e implícita en sujetos normales. De alguna manera, est
.40 .40
Retirada gratuita Fragmento de palabra
Terminación
.35 .35
.30 .30
.25 .25
Cebado
.20 .20
.15
Proporción
correcta
.15
.10 .10
.05 .05
.00 .00
Imágenes Palabras Fotos Palabras
Tipo de material
ÿ FIGURA 10.11
Resultados de Weldon y Roediger (1987). Las imágenes se recordaron mejor que las palabras en las
pruebas de recuerdo libre explícito, pero las palabras produjeron más preparación que las imágenes en la
prueba de finalización de fragmentos de palabras implícitas. El patrón general revela una interacción cruzada.
59533_11_ch10_p261-296.indd 288 9533_11_ch10_p261-296.indd 288 3/5/08 /5/08

La interacción es aún más llamativa que la interacción entre las pruebas que se muestra en los
amnésicos, porque representa una interacción cruzada.
El tema de las interacciones también está relacionado con el primer problema considerado en
el capítulo, el de la atenuación de escala. A menudo, los efectos techo y suelo hacen que la
interpretación de las interacciones sea peligrosa. Vuelva a mirar los resultados del experimento de
Scarborough, que se muestran en la figura 10.5. Allí se representa una interacción entre la modalidad
de presentación y el intervalo de retención. La modalidad de presentación tiene un efecto, pero solo
en los intervalos de retención más largos. Sin embargo, decidimos que esta interacción no podía
interpretarse completamente, ya que podría haber sido producida por un efecto de techo en el
intervalo de retención de 0 segundos. Ahora podemos enunciar una regla general: se debe tener
mucho cuidado al interpretar las interacciones en las que el desempeño de la variable dependiente
está en el piso o en el techo en algún nivel de una de las variables independientes.
Los experimentos multifactoriales son extremadamente útiles y mucho más preferibles que los
experimentos de un solo factor por la misma razón que nos ayudan a responder la pregunta de
generalidad. Como discutimos en la sección anterior de este capítulo, una cosa que queremos saber
sobre el efecto de alguna variable independiente sobre una variable dependiente son las condiciones
bajo las cuales se cumple. Al variar independientemente una segunda (o incluso una tercera)
variable en el mismo experimento, podemos obtener al menos una respuesta parcial a esta pregunta.
Hemos considerado casos en los que dos factores se manipulan simultáneamente.
Sin embargo, esta lógica se puede extender para diseñar experimentos que impliquen la
manipulación simultánea de tres, cuatro o incluso más variables. (En la práctica, los investigadores
casi nunca diseñan experimentos con más de cuatro variables independientes de interés). Cuando
la naturaleza de un efecto de interacción entre dos variables cambia según el nivel de alguna tercera
variable, la interacción se denomina interacción de orden superior. ción, ya que involucra varias
variables.
Por ejemplo, supongamos que un investigador diseña un experimento en el que se manipulan
el tipo de prueba y el déficit de memoria, como en el experimento de Warrington y Weiskrantz; en
este experimento, también se manipula el nivel de procesamiento. A las personas en una condición
se les dice que cuenten el número de vocales en cada palabra, mientras que a las personas en la
otra condición se les dice que formen una oración usando cada palabra. Cuando las personas
cuentan las vocales, están codificando las palabras a un nivel superficial, porque están enfocando
su atención en las características superficiales o grafémicas de las palabras. Por otro lado, cuando
las personas forman oraciones, se enfocan en el significado o los aspectos semánticos de las
palabras y, por lo tanto, procesan las palabras a un nivel más profundo. Entonces, los tres factores
en el experimento serían (1) condición de codificación (contar vocales versus formar oraciones), (2)
grupo de sujetos (amnésico versus control) y (3) finalización de fragmentos de palabras y recuerdo
libre. Si el investigador encontrara el patrón de resultados representado en la figura 10.12, entonces
existiría una interacción de orden superior. Aquí, los resultados muestran que cuando los sujetos de
control estudian las palabras formando oraciones, recuerdan muchas más palabras en la prueba de
recuerdo explícito que cuando simplemente cuentan las vocales. Sin embargo, los amnésicos no
muestran esta mejora en el desempeño en la prueba explícita. En la prueba implícita, no hay
cambios en el desempeño ni de los controles ni de los amnésicos cuando estudian las palabras
formando oraciones. Por lo tanto, la manipulación de una tercera variable (nivel de procesamiento)
cambia la naturaleza de la interacción entre las otras dos variables. (Observe que los datos de la figur
Se han obtenido muchas otras interacciones intrigantes que involucran pruebas de memoria
implícita versus explícita; están abriendo toda una nueva área de investigación (Roediger &
McDermott, 1993). Hasta la fecha, esta investigación ha generado muchas ideas y teorías nuevas
sobre la memoria humana. Así, las interacciones entre pruebas implícitas y explícitas no sólo
59533_11_ch10_p261-296.indd 289 9533_11_ch10_p261-296.indd 289 3/5/08 /5/08

Explícito Implícito Explícito Implícito
.60 Prueba Prueba .60 Prueba Tes
.50 .50
Proporción
correcta .40 Proporción
correcta .40
.30 .30
.20 .20
Controla los amnésicos

Control S
amnésicos Controlamnésicos
S Control S
amnésicos
Tarea grafémica Tarea semántica

ÿ FIGURA 10.12
Una interacción hipotética de orden superior que involucra el tipo de prueba, el déficit de memoria y el nivel
de procesamiento (grafémico versus semántico).
han revelado cosas interesantes sobre los trastornos de la memoria, como la amnesia, pero también están
brindando una gran cantidad de información nueva sobre la memoria normal.
Graficar los datos

Durante la discusión anterior, probablemente descubrió que la manera más fácil de detectar interacciones
es graficar los datos y luego examinar los patrones en los gráficos. Cuando los patrones del efecto de una
variable son consistentes en los niveles de la otra variable (p. ej., el ejemplo A de la figura 10.10), entonces
las dos variables no interactúan. Cuando los patrones cambian en diferentes niveles de las variables
independientes (es decir, las medias convergen, se cruzan o divergen), entonces probablemente existan
interacciones entre las variables. Por supuesto, se deben realizar pruebas estadísticas apropiadas para
determinar el grado en que las interacciones son efectos reales y no se deben simplemente a la variación
aleatoria.
Diferentes tipos de gráficos son apropiados para trazar diferentes tipos de variables. Los gráficos de
barras deben usarse cuando la variable independiente es categórica o cualitativa, es decir, cuando los
niveles de la variable independiente no guardan una relación cuantitativa entre sí. Ejemplos de variables
categóricas son la especialización en la escuela; modalidad de presentación del estímulo; tipo de material
de estudio (p. ej., imágenes versus palabras); y las dos variables utilizadas en el experimento de Warrington
y Weiskrantz, tipo de prueba y deterioro de la memoria. Las variables categóricas no deben trazarse con
gráficos de líneas porque una línea continua implica que la variable subyacente es continua, o al menos
ordenada de manera significativa.
¿Cómo pediría materiales de estudio, por ejemplo? ¿Son las imágenes “más” o “menos” que las palabras?
Obviamente, son simplemente diferentes tipos de elementos. Estrictamente hablando, sabemos que los
gráficos de líneas en los paneles de la derecha de la figura 10.10 no son apropiados para graficar los datos
del ejemplo, porque las dimensiones categóricas se trazan en la abscisa (eje X).
Los modos adecuados para presentar estas variables son gráficos de barras o tablas.
Para usar gráficos lineales, asigne a la variable trazada a lo largo de la abscisa (eje X) al menos una
escala ordinal y preferiblemente una escala de intervalo o de razón (vea el Capítulo 6). Un ejemplo de una
variable escalada ordinalmente es el orden de clasificación de los elementos según algún atributo (p. ej.,
desagradable, neutral, agradable). Diferentes niveles de variables ordinales implican “más” o “menos” de
algún atributo, pero se desconoce la magnitud de la diferencia. Porque
59533_11_ch10_p261-296.indd 290 9533_11_ch10_p261-296.indd 290 3/5/08 /5/08

las distancias entre puntos en una escala ordinal no son significativas, las variables ordinales a menudo se
trazan más apropiadamente con gráficos de barras que con gráficos de líneas.
Las escalas de intervalo tienen distancias significativas entre puntos, como la temperatura (Celsius o
Fahrenheit) o el coeficiente intelectual, pero tienen puntos cero arbitrarios.
Las escalas de razón también tienen distancias significativas entre puntos; además, tienen verdaderos
puntos cero, por lo que las proporciones entre las medidas son significativas. Algunos ejemplos son la
distancia, el peso, el intervalo de retención (el tiempo transcurrido entre el estudio y la prueba) y la dosis
del fármaco. Tanto las escalas de intervalo como las de razón son continuas; las variables independientes
que tienen estas propiedades se pueden trazar en gráficos de líneas. También se pueden usar tablas para
presentar dichos datos.

LA TUERCAS Y PERNOS
Problema ¿Qué es más efectivo, leer o escuchar?

Hemos discutido el problema de las diferencias de modalidad en las tareas de memoria que implican una
cadena corta de estímulos, como tres letras. Una cuestión de interés más general es si existen diferencias
en la comprensión y el recuerdo de la información que se lee frente a la que se escucha. Si la misma
información fuera presentada por un disertante o leída en un libro, ¿cuál sería más efectivo?
La lectura puede permitirnos repasar rápidamente el material que comprendemos bien y detenernos en las
ideas difíciles. Pero mientras leemos, podemos ser más propensos a simplemente deslizar nuestros ojos
sobre la página y soñar despiertos; un conferenciante moviéndose y hablando podría captar mejor nuestra
atención.
Problema ¿Es mejor leer que escuchar?

Se pueden formular y definir operativamente numerosas hipótesis de diferentes maneras para responder a
esta pregunta. Una de tales hipótesis será considerada aquí.
Hipótesis Los sujetos que leen un pasaje largo de material estarán mejor
capacitados para responder preguntas de opción múltiple sobre el material
que los sujetos que escuchan a otra persona leyendo el material.
A pesar de que esta hipótesis es bastante específica, aún quedan muchas cuestiones abiertas a la
interpretación al realizar el experimento. Es necesario dar definiciones operativas a las variables. ¿Cuánto
dura un “pasaje largo”? ¿Cuál debe ser el tema del pasaje? ¿Deberíamos usar más de un pasaje? ¿Cómo
debe presentarse el pasaje que se va a leer? ¿Cuánto tiempo debe durar la presentación? ¿Quién debería
leer el pasaje, o deberíamos variar eso?
¿Qué tipo de preguntas debemos hacer en la prueba de opción múltiple (reconocimiento de opción
forzada)? ¿Deberíamos usar un diseño entre sujetos o intra-sujetos? Estas son solo algunas de las
preguntas que deben responderse al traducir la hipótesis en un experimento real. La forma en que
decidimos estos asuntos puede afectar el resultado del experimento.
Consideremos primero la última pregunta y analicemos estas preguntas en orden inverso. ¿Deberíamos
usar cada sujeto tanto en las condiciones de lectura como de escucha, o deberíamos usar diferentes
grupos de sujetos en las dos condiciones? En
59533_11_ch10_p261-296.indd 291 9533_11_ch10_p261-296.indd 291 3/5/08 /5/08

En general, es mejor usar los mismos sujetos en cada condición, ya que en ese caso no
tenemos que preocuparnos de que las diferencias entre las condiciones sean causadas por
las diferencias entre los sujetos en las dos condiciones. Siempre que equilibremos las
condiciones para los efectos de la práctica probando a la mitad de los sujetos en la condición
de lectura antes de la condición de escucha y la otra mitad en el orden inverso, no hay nada
que nos impida utilizar el diseño ventajoso dentro de los sujetos.
Esta decisión ayuda a determinar la respuesta a otra pregunta. Dado que estamos
usando cada sujeto en dos condiciones diferentes, obviamente deberíamos usar al menos
dos pasajes de material de prueba, uno para una condición y otro para la otra. Incluso
podríamos usar más pasajes, ya que nos gustaría tener cierta confianza en que nuestros
resultados se generalicen a otro material de lectura además de los pasajes particulares
usados en el experimento. Este tema de la generalidad de los resultados sobre los materiales
es importante, especialmente porque se pasa por alto ampliamente en ciertos tipos de
investigación, con el resultado de que las pruebas estadísticas a menudo se aplican incorrectame
¿Qué tipos de pasajes se deben usar? Presumiblemente, el material que es relativamente
desconocido para los sujetos sería la mejor opción, ya que queremos evaluar el conocimiento
que adquirieron durante la lectura del pasaje y no el que adquirieron antes del experimento.
Si los sujetos pudieran responder a casi todas las preguntas de la prueba de opción múltiple
antes de comenzar el experimento, no habría posibilidad de que nuestra variable
independiente (leer versus escuchar el pasaje) ejerza alguna influencia sobre nuestra
variable dependiente (reconocimiento) , ya que tendríamos un efecto techo en la prueba de
reconocimiento (rendimiento cercano al 100 por ciento). Al tratar de evitar materiales
familiares, los investigadores que investigan la memoria de pasajes en prosa "naturalistas"
a menudo eligen pasajes que contienen tantas palabras y conceptos ajenos a los sujetos
que podríamos preguntarnos qué tan "naturales" son estas extrañas historias. Probablemente
sería mejor usar pasajes con palabras familiares en su mayoría pero con información nueva.
Se pueden tomar pasajes de partes de artículos de Scientific American u otras revistas con
un nivel de dificultad similar.
¿Cuánto debe durar el pasaje? Esto está estrechamente relacionado con el tiempo que
debe durar la presentación. Supongamos que decidimos que las pruebas de reconocimiento
deben durar unos 7 minutos en cada caso. Entonces podríamos querer limitar el tiempo de
presentación de cada pasaje a 15 minutos para que el experimento dure solo una hora.
(Debe haber unos 15 minutos asignados para las instrucciones, la entrega y la recogida de
las pruebas y la explicación del experimento cuando haya terminado).
Quizás el aspecto más complicado de diseñar este experimento es decidir exactamente
cómo se presentarán los pasajes durante los minutos en cada condición de presentación.
Supongamos que elegimos pasajes que tardan 15 minutos en leerse en voz alta en la
condición Escuchar. En la condición en que los sujetos leen el pasaje, ¿deberíamos
simplemente permitirles 15 minutos para leerlo? Entonces es muy probable que tengan más
tiempo de presentación real, ya que la mayoría de las personas pueden leer en silencio más
rápido que en voz alta. Por lo tanto, los sujetos que leyeron el pasaje podrían dedicar más
tiempo al material difícil. ¿Queremos tratar de eliminar esto de alguna manera, por ejemplo,
instruyendo a los sujetos para que lean el pasaje una vez de principio a fin? ¿O queremos
dejarlo como una de las diferencias naturales entre leer y escuchar que estamos tratando
de investigar? Si de alguna manera eliminamos o minimizamos la regresión (releyendo el
material) en la condición de lectura y luego encontramos que escuchar es mejor
59533_11_ch10_p261-296.indd 292 9533_11_ch10_p261-296.indd 292 3/5/08 /5/08

que leer, podemos estar abiertos a la crítica de que nuestra conclusión se sostiene solo en
situaciones de laboratorio artificial y no en el “mundo real”. Entonces, para maximizar la
posibilidad de resultados generalizables, permitamos a los sujetos en la condición de lectura
15 minutos para leer el material, la misma cantidad de tiempo que se permite para la
presentación oral, y luego veamos qué diferencias ocurren. Si leer es superior a escuchar (o
viceversa), tendremos que investigar más para ver exactamente qué aspectos del proceso son
importantes.
El mismo problema surge con la presentación oral del pasaje. ¿Deberíamos variar quién lo
lee? ¿El sexo de la persona? ¿Su atractivo? ¿Debería leerse en un tono monótono o con
entusiasmo y entusiasmo, como podría tratar de transmitir un disertante? Decidamos que una
mujer lo lea con entonación normal tanto como sea posible y no en un tono monótono.
El diseño de la prueba de opción múltiple también es importante, especialmente en lo que

respecta a que no sea ni demasiado difícil ni demasiado fácil, para evitar efectos de techo y piso.
¿Debe la prueba tocar solo preguntas superficiales (¿se discutió en el tercer párrafo?) o
preguntas más significativas sobre el texto? ¿O deberíamos variar esto? Probablemente
podríamos estar de acuerdo en usar preguntas significativas. ¿O por qué no usar una prueba
de recuerdo en primer lugar? (Porque es más difícil derivar medidas cuantitativas del recuerdo
de la prosa, aunque es posible).
Hay incluso más opciones y dificultades de las que hemos discutido aquí, a pesar de que
solo tenemos un diseño de 2 2 dentro de los sujetos dentro de los sujetos con dos tipos de
presentación (leer versus escuchar) y dos pasajes (el pasaje es una variable que no
conocemos). principalmente interesado en). Dado que es obvio que podríamos haber
operacionalizado las condiciones básicas de manera diferente y utilizado una variable
dependiente diferente, sería importante considerar los resultados del presente experimento en
el contexto de otros experimentos en los que las variables se operacionalizan de manera
diferente. Una serie de tales experimentos convergentes es necesaria si queremos tener una
idea de la generalidad o limitación de cualquier resultado experimental en particular.
Esta área de investigación que examina las diferencias de modalidad en la retención a largo
plazo de materiales en prosa ha recibido sorprendentemente poca atención. Sin embargo, dos
referencias relevantes son King (1968) y Kintsch y Kozminsky (1977). Más recientemente, los
investigadores se han interesado por las implicaciones de esta pregunta para el periodismo
(Eveland, Seo y Marton, 2002; Furnham, 2001). Es decir, ¿las personas recuerdan más las
noticias si leen una noticia o si escuchan un reportaje en la televisión o la radio? Podría pensar
en cómo podría modificar el estudio descrito en esta sección para que sea más aplicable a la
pregunta de periodismo aplicado.
ÿ RESUMEN
1. Ebbinghaus fue el primer psicólogo en estudiar el aprendizaje Los métodos de ahorro todavía se usan hoy en día, la
y la memoria de forma sistemática. Resolvió el problema de mayoría de los investigadores miden la memoria de otras
cómo estudiar recuerdos irrecuperables reaprendiendo maneras: por lo general, con alguna variación de las pruebas
material y midiendo los ahorros en el número de intentos de de recuerdo (producción) y reconocimiento (discriminación
reaprendizaje en comparación con los necesarios para el del material estudiado del no estudiado).
aprendizaje original. A pesar de que
59533_11_ch10_p261-296.indd 293 9533_11_ch10_p261-296.indd 293 3/5/08 /5/08

2. La atenuación de escala en la investigación psicológica se escenario experimental y diferentes formas de operacionalizar
refiere a situaciones en las que una escala de medición es las variables independientes?
demasiado restringida para medir las diferencias que pueden 5. Los investigadores están interesados en saber si un resultado
existir entre condiciones. Cuando el rendimiento es casi en particular se generalizará en varias dimensiones: poblaciones
perfecto, el problema se conoce como efecto techo, ya que el de sujetos, materiales, situaciones, medidas dependientes,
rendimiento choca contra la parte superior o el techo de la etc. Los experimentos multifactoriales, o aquellos en los que
escala. Cuando el rendimiento está casi ausente por completo, se manipula más de una variable simultáneamente, son
el problema se denomina efecto suelo. extremadamente importantes para determinar la generalidad
3. Es un error suponer que el desempeño en dos condiciones es de los resultados. Tales experimentos nos dicen si el efecto de
equivalente cuando se encuentra en el techo o en el piso de una variable independiente sobre una variable dependiente es
una escala de medición. Aunque los sujetos en dos condiciones el mismo o diferente cuando se manipulan otras variables al
pueden obtener puntajes equivalentes en la variable mismo tiempo.
dependiente (cerca del 0 por ciento o del 100 por ciento), 6. Cuando una variable independiente tiene un efecto que es el
puede haber una verdadera diferencia entre las condiciones, mismo en todos los niveles de la segunda variable
pero la escala de medición de la variable puede ser demasiado independiente, esto se denomina efecto principal. Se dice que
restringida (demasiado “corta”) para mostrar la verdadera dos variables independientes interactúan cuando el efecto de
diferencia. Recordemos el caso de los dos hombres que se una variable independiente sobre la variable dependiente es
pesan en una báscula de baño que solo registra hasta 300 diferente en diferentes niveles de una segunda variable
libras. Los ejemplos de este capítulo ilustran los efectos de independiente. Se puede pensar que los efectos principales
techo, pero los efectos de suelo son igualmente comunes e permiten hacer generalizaciones a través de otras condiciones,
importantes. Si el recuerdo medio en un experimento de porque la variable independiente tiene el mismo efecto en
memoria con niños de 2 y 3 años es del 2 por ciento para cada todos los niveles de la otra variable independiente. Las
grupo de edad, ¿está justificado concluir que la capacidad de interacciones indican que las generalizaciones simples sobre
memoria es la misma para ambos grupos de niños? De manera una variable independiente no son seguras; el efecto de esta
similar, puede haber errores en la interpretación de las variable independiente depende del nivel de la segunda
interacciones cuando el rendimiento en algunas condiciones variable independiente en el experimento multifactorial.
está limitado por los efectos techo y suelo.
7. Las pruebas de memoria implícita y explícita interactúan con
una variedad de variables independientes. Por ejemplo, aunque
4. Una cuestión crítica sobre cualquier resultado experimental es los amnésicos se desempeñan mal en las pruebas explícitas,
su generalización más allá de las condiciones en las que se como el recuerdo libre, muestran tanta preparación como los
descubrió. El modelo tetraédrico de experimentos de memoria sujetos de control en las pruebas implícitas, como la
de Jenkins proporciona cuatro dimensiones a través de las preparación en la identificación de palabras. Las imágenes
cuales se puede evaluar tal generalidad: (1) ¿Se mantendría producen mejor retención que las palabras en las pruebas de
el hallazgo con diferentes poblaciones de sujetos? (2) ¿Se memoria explícita, pero las palabras producen más preparación
obtendría el hallazgo con diferentes materiales experimentales? que las imágenes en las pruebas de memoria verbal implícita.
(3) ¿Ocurriría el hallazgo con diferentes tipos de pruebas de Al estudiar la forma en que estos tipos de pruebas interactúan
memoria? con otras variables, los científicos están obteniendo una nueva
(4) ¿Ocurrirían los mismos resultados con una diferente comprensión de la función de la memoria tanto normal como anorma
ÿ TÉRMINOS CLAVE
amnesia memoria episódica

memoria autobiográfica memoria explícita
Técnica de Brown-Peterson flash de memoria
Efecto techo efecto de oreja a oreja
interacción cruzada prueba de reconocimiento de elección forzada
59533_11_ch10_p261-296.indd 294 9533_11_ch10_p261-296.indd 294 3/5/08 /5/08

recuerdo libre recuerdo
generalidad de los resultados reconocimiento

código grafémico método de ahorro
interacción de orden superior puntaje de ahorro
memoria implícita efectos de atenuación de escala
interacciones semántico
niveles de procesamiento retiro en serie
memoria a largo plazo memoria de corto plazo

efecto principal modelo tetraédrico de experimentos de memoria
recuerdo de sílabas sin procesamiento apropiado para la transferencia
sentido asociado emparejado ensayos a criterio
código fonético (fonológico) tarea de completar fragmentos de palabras
cebado prueba de reconocimiento si/no
interferencia proactiva
1. Identifique dos situaciones, además de las presentadas en el ¿Piensas en los descubrimientos científicos provocados por
capítulo, en las que los efectos techo y suelo probablemente un resultado anómalo cuando el conocimiento pasado no se
dificultarían la interpretación de las observaciones generalizó a una nueva situación?
experimentales. ¿Cómo podrían superarse en los experimentos 3. ¿Cuáles son las ventajas de los experimentos multifactoriales
los problemas causados por estos efectos? que los hacen tan populares entre los investigadores, a pesar
2. Los investigadores a menudo lamentan el descubrimiento de de su complejidad? Discuta la relación de los experimentos
que algún resultado no se generaliza a un nuevo entorno. multifactoriales con el problema de la generalidad de los
Discuta por qué las fallas en la generalización a menudo resultados.
pueden conducir al progreso en la comprensión de un fenómeno. Pueden
CONEXIONES WEB
Un excelente sitio que cubre información básica sobre la memoria y cómo desarrollar una mejor memoria se puede
encontrar en:
http://www.muskingum.edu/~cal/database/general/memory.html
El sitio web del Practical Memory Institute incluye una lista de preguntas frecuentes (y respuestas) sobre la memoria.
Se puede encontrar en:
http://www.memoryzine.com/index.html
ÿ RECURSOS DE LABORATORIO
El capítulo 5 de Langston (2002) describe una tarea de memoria semántica: los sujetos recuperaron palabras para
definiciones como “un arco o un aro en el croquet por el que deben pasar las bolas” (la respuesta es wicket). De interés
fue la capacidad de realizar esta tarea con o sin gestos (algunos sujetos se vieron obligados a sostener una barra en
sus manos mientras que otros eran libres de gesticular si así lo deseaban). La hipótesis era que los gestos ayudan a
las personas a recuperar palabras. Lea estos experimentos y use el modelo de memoria de Jenkins para generar
variaciones experimentales.
59533_11_ch10_p261-296.indd 295 9533_11_ch10_p261-296.indd 295 3/5/08 /5/08

Recordando los ataques terroristas del 11 de septiembre
Puedes responder las siguientes preguntas?
1. ¿A qué hora del día escuchó por primera vez las noticias de los ataques del 11 de septiembre?
2. ¿Dónde estabas?
3. ¿Qué estabas haciendo?
4. ¿Quién te lo dijo?
5. ¿Quién más estaba allí?
6. ¿Cómo te sentiste al respecto?
7. ¿Puedes describir al menos tres detalles vívidos de la experiencia?
8. ¿Qué hizo inmediatamente después de escuchar la noticia?
Hágales estas preguntas a algunos de sus amigos también. Es muy probable que tanto usted como
sus amigos puedan responder con confianza al menos cinco de las preguntas, y que sus recuerdos de
escuchar las noticias del 11 de septiembre encajen en la categoría de recuerdos de memoria flash. Lo
sorprendente de los recuerdos de flash es su viveza; las personas informan que recuerdan detalles tan
periféricos como lo que vestían cuando escucharon las noticias. El término fue acuñado por Brown y Kulik
(1977) para describir los vívidos recuerdos de las personas al escuchar noticias impactantes. Eligieron el
término flashbulb porque “sugiere sorpresa, una iluminación indiscriminada y brevedad”.
Los llamados recuerdos de flash son recuerdos autobiográficos realmente vívidos y, como tales,
son tan propensos al error como otros recuerdos personales. Por ejemplo, Neisser y Harsch (1992)
encontraron cambios en la memoria de las personas al escuchar la noticia de la explosión del Chal·lenger
cuando compararon los informes iniciales con los recopilados 32 a 34 meses después. De los 36 sujetos,
solo 3 recordaron correctamente todos los atributos principales. Veintidós sujetos estaban equivocados en
dos de los tres principales atributos de la memoria (ubicación, actividad y fuente de noticias); los sujetos
restantes se equivocaron en los tres. Tales distorsiones de la memoria parecen desarrollarse con el
tiempo. Schmolck, Buffalo y Squire (2000) examinaron los recuerdos para escuchar el veredicto en el
juicio de OJ Simpson; 15 meses después del veredicto, el 50 por ciento de los informes se consideraron
altamente precisos (en comparación con las cuentas iniciales), mientras que después de 32 meses, solo
el 29 por ciento se etiquetaron como altamente precisos.
Hay muchas razones por las que estos recuerdos pueden distorsionarse con el tiempo.
La gente sigue hablando y pensando en los hechos mucho después de que hayan ocurrido. Dependiendo
de su audiencia o metas, pueden contar sus historias de manera diferente, con consecuencias para la
memoria (p. ej., Tversky y Marsh, 2000). Las personas también escuchan los relatos de otras personas, y
los oyentes pueden incorporar posteriormente detalles de las historias de otros en sus propios recuerdos
(p. ej., Niedzwienska, 2003). Las personas también tienen creencias acerca de cómo deberían haber sido
las cosas y pueden reconstruir sus recuerdos para que coincidan con esas creencias (p. ej., Ross, 1989).
Muchos psicólogos recopilaron recuerdos del 11 de septiembre inmediatamente después de los
ataques. Se están realizando estudios de seguimiento y se han publicado numerosos informes (p. ej.,
Luminet et al., 2004; Talarico & Rubin, 2003; Wolters & Goudsmit, 2005). Podría pensar en qué preguntas
sobre la memoria sería interesante hacer si tuviera acceso a la misma muestra de personas repetidamente
durante un período de años. ÿ
59533_11_ch10_p261-296.indd 296 9533_11_ch10_p261-296.indd 296 3/5/08 /5/08

CAPÍTULO 11
PENSANDO
Y PROBLEMA
RESOLVIENDO
DOS ENFOQUES DEL PENSAMIENTO

Aprendizaje por ensayo y error de Thorndike
Insight en los chimpancés de Köhler

ILUSTRACIONES
Confiabilidad y replicación: razonamiento analógico

ILUSTRACIONES
Control Experimental: Fijación Funcional

ILUSTRACIONES
Informes verbales: exceso de confianza en los juicios

Incubación en la resolución de problemas
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: SESGO DE CONFIRMACIÓN
297
59533_12_ch11_p297-326.indd 297 9533_12_ch11_p297-326.indd 297 3/5/08 /5/08

La vida no consiste principalmente, ni siquiera en gran medida, en hechos y acontecimientos.
Consiste principalmente en la tormenta de pensamientos que siempre soplan en la cabeza
de uno. (MARK TWAIN)
En caso de que no tengas ningún problema en este momento, déjanos darte uno. Lea atentamente el
siguiente problema y examine su representación en la figura 11.1. Piense bien en el problema antes de
continuar leyendo el texto.
Dos estaciones de tren están a 100 millas de distancia. A las 14:00 horas de un sábado por
la tarde, los dos trenes parten uno hacia el otro, uno de cada estación. Un tren viaja a 60
millas por hora, el otro a 40 millas por hora. Justo cuando los trenes salen de sus estaciones,
un pájaro salta en el aire frente al primer tren y vuela hacia el frente del segundo tren.
Cuando el pájaro alcanza el segundo tren, da la vuelta sin perder velocidad y vuela
directamente hacia el primer tren. El pájaro continúa volando de un lado a otro entre los
trenes a una velocidad de 80 millas por hora. ¿Cuántas millas habrá volado el ave antes de
que los trenes se encuentren?
¿Pudiste resolver el problema? La mayoría de la gente tiene mucha dificultad con él, pero algunas
personas lo resuelven casi de inmediato. Deben ser muy buenos matemáticos, podrías estar pensando.
De nada.
Consideremos cómo la mayoría de la gente trata de resolver este problema. Debido a la forma en
que se expresa y la forma en que se dibuja la imagen de la figura 11.1, la mayoría de las personas
comienzan a preocuparse de inmediato por cuánto tiempo le tomará al ave ir del primer al segundo tren,
qué distancia se habrá movido el segundo tren. para cuando llegue el pájaro, cuánto tiempo le llevará al
pájaro volver al primer tren y cuánto se habrá movido ese tren, y así sucesivamente. La estrategia general
es tratar de averiguar cuánto tiempo le tomará al pájaro hacer cada viaje entre los trenes, luego sumar
estos tiempos para averiguar cuántas millas habrá volado el pájaro antes de que los trenes se encuentren.
Esta es una estrategia bastante razonable y le dará la respuesta, siempre que tenga mucho tiempo, una
buena calculadora y conocimientos de cálculo.
Dado que es muy probable que no disponga de uno o más de estos tres recursos, es posible que
deba encontrar una solución más sencilla. El pensamiento se puede definir como “el logro de una nueva
representación a través de la realización de operaciones mentales” (Posner, 1973, p. 147). Podemos
decir que es necesario pensar para encontrar una solución más simple al problema del pájaro y el tren.
Para resolver el problema, debes reconceptualizarlo. De hecho, después de hacer una reconceptualización
adecuada, la solución al problema es simple.
En lo que debe concentrarse es en cuánto tiempo viajarán los trenes antes de encontrarse.
Como uno viaja a 60 millas por hora y el otro a 40 millas por hora y están separados por 100 millas, se
encontrarán en una hora. Una vez que piensas en reformular el problema de esta manera y usar otra
información, la solución es obvia. Dado que los trenes se encontrarán en una hora y el pájaro vuela a 80
millas por hora, el pájaro habrá volado 80 millas antes de que los trenes se encuentren. No se necesita
mucho tiempo; ni es una calculadora; ni las matemáticas superiores. Solo pensaba.
¿Solo pensaba? Eso es bastante simple de decir, pero el proceso es muy complicado.
¿Qué sucede mentalmente mientras una persona está tratando de encontrar una solución a un problema?
59533_12_ch11_p297-326.indd 298 9533_12_ch11_p297-326.indd 298 3/5/08 /5/08

80 mph
100 millas
Tren 1 – 60 mph Tren 2 – 40 mph
ÿ FIGURA 11.1
Una ilustración del problema del pájaro y el tren.
¿Cómo hace una persona para descubrir una solución más simple al problema (pensar)?
¿Podemos encontrar leyes psicológicas generales del pensamiento? ¿Cómo podemos siquiera
estudiar este proceso oculto? Estas son algunas de las preguntas difíciles que consideraremos en este
capítulo.
Los temas experimentales tratados en este capítulo incluyen el tema de la confiabilidad de los
resultados (o replicabilidad), el problema de las variables extrañas y el control experimental, y el
uso de informes verbales en la investigación psicológica. La primera preocupación es la confiabilidad
de los resultados: si realizáramos un experimento por segunda vez, ¿cuál sería la probabilidad de
obtener datos que nos permitieran llegar a la misma conclusión que en el primer experimento? Este
problema existe en toda investigación pero, por razones que se discutirán más adelante, puede
acentuarse en la investigación sobre el pensamiento y otros procesos complejos. En segundo lugar, el
tema de la resolución de problemas y el pensamiento es tan complicado que se necesita un gran
ingenio para realizar experimentos interesantes y útiles en esta área. ¿Cómo podemos obtener control
sobre alguna variable independiente mientras controlamos las variables extrañas, ya que hay tantas
que pueden influir en el proceso de pensamiento? El tema final es uno de informe subjetivo (verbal)
y su valor en la investigación psicológica. En un área como la resolución de problemas y el pensamiento,
la gente está bastante dispuesta, por lo general, a decir cómo piensan que se dedican a resolver un
problema. ¿Debemos aceptar sus informes como evidencia útil sobre la naturaleza de los procesos
involucrados?
Históricamente, ha habido dos enfoques principales para el estudio de la resolución de problemas
que tienen diferentes énfasis. Ambos han sido muy infl uyentes en el estudio del pensamiento y el
estudio del aprendizaje. Los dos enfoques representan un análisis de abajo hacia arriba (impulsado por
datos) y un análisis de arriba hacia abajo (impulsado por conceptos) análogos a las formas de examinar
la percepción que se discutieron en el Capítulo 7.
ÿ DOS ENFOQUES DE PENSAMIENTO
Aprendizaje por ensayo y error de Thorndike
En algunos experimentos iniciales interesantes, Thorndike (1898) estudió la resolución de problemas

en gatos. Los colocó en cajas de rompecabezas especialmente construidas con comida colocada afuera.
El problema de los gatos era cómo escapar de la caja y obtener la comida. En algunos casos, la
solución adecuada era simplemente arañar una cuerda, pero a veces había hasta tres soluciones
diferentes que el gato podía usar. Thorndike observó a los gatos
59533_12_ch11_p297-326.indd 299 9533_12_ch11_p297-326.indd 299 3/5/08 /5/08

desempeño en pruebas sucesivas en la caja del rompecabezas y midió la cantidad de tiempo que
les tomó escapar en cada prueba. En la primera prueba, el gato probaría una variedad de
estrategias para intentar escapar de la caja y atacaría sin dirección a los objetos cercanos.
Eventualmente, el gato arañaría la cuerda que lo soltó de la jaula. Aparentemente aprendió por
prueba y error. Su éxito al escapar de la caja parecía completamente accidental, al menos al
principio. En ocasiones sucesivas, sin embargo, los gatos comenzaron a escaparse de la caja
cada vez más rápida y sistemáticamente. Sin embargo, el principio rector que parecía regir los
intentos de solución de los gatos era el aprendizaje por ensayo y error.
En su análisis del aprendizaje por ensayo y error, Thorndike se preocupó especialmente por
el éxito. Parecía obvio que el éxito de un movimiento correcto hacía que éste fuera impreso o
aprendido. El efecto del movimiento fue conducir al éxito, lo que "sella" el movimiento, como lo
expresó Thorndike. Estos primeros experimentos condujeron a la ley del efecto y al concepto de
reforzamiento (ver Capítulo 9). El impacto histórico de esta investigación ascendente ha sido
mucho mayor en el campo del aprendizaje animal, donde su importancia es abrumadora, que en
la investigación relacionada con el pensamiento y la resolución de problemas. El énfasis en la
investigación sobre el pensamiento humano y la resolución de problemas ha estado mucho más
en los procesos impulsados conceptualmente de alto nivel, en la tradición que se discutirá a
continuación. No obstante, ha habido intentos de analizar los procesos del pensamiento humano
en términos de aprendizaje por ensayo y error, o condicionamiento operante (ver Skinner, 1957, cap. 1
Insight en los chimpancés de Köhler

Wolfgang Köhler, psicólogo alemán, fue destinado por su país a la isla de Tenerife (parte de las
Islas Canarias) durante 1913 para estudiar simios antropoides. Poco después estalló la Primera
Guerra Mundial y Köhler permaneció en Tenerife. Mientras estuvo allí, realizó una investigación
sobre las capacidades de resolución de problemas de los chimpancés. Muchos de los problemas
que usó no podían resolverse de una manera simple y directa, como el problema de la caja de
rompecabezas de Thorndike, en el que el gato simplemente tenía que arañar una cuerda. En
cambio, las soluciones requerían un enfoque más indirecto. Köhler discutió su investigación en un
libro publicado en alemán en 1921 y traducido al inglés como The Mentality of Apes (1927).
En un problema, Köhler colgaba un plátano fuera del alcance de los chimpancés. Estaba
demasiado por encima de ellos para que pudieran alcanzarlo, incluso con la ayuda de un palo
colocado dentro de su recinto. Se requería una solución más indirecta al problema. Köhler describe
en detalle los intentos de los chimpancés por obtener el plátano. Por lo general, primero probarían
varias estrategias directas para obtenerlo, como alcanzarlo y pincharlo con el palo.
Al fallar con estos métodos, parecerían participar en varios actos aleatorios o, a menudo,
aparentemente abandonar el problema por completo. Algo más tarde, sin embargo, un chimpancé
implementaría repentinamente la solución adecuada al problema. La solución en este caso fue
apilar unos cajones que estaban en el recinto uno encima del otro y luego trepar por ellos para
llegar al plátano (Figura 11.2).
Köhler enfatizó la importancia de la intuición para resolver el problema. Insight se refiere a la
capacidad de conceptualizar un problema de una manera única que permita resolverlo. Como en
el caso de los chimpancés, la intuición a menudo parece ocurrir en un instante.
Después de un período de actividad aleatoria o de ninguna actividad, el chimpancé
(presumiblemente) de repente concibió las cajas como relacionadas con el problema. Una vez
que se logró esta idea, implementar la solución fue bastante simple.
59533_12_ch11_p297-326.indd 300 9533_12_ch11_p297-326.indd 300 3/5/08 /5/08

ÿ FIGURA 11.2
Uno de los chimpancés de Köhler

apilando cajas una encima de la otra para
alcanzar las bananas. De The Mentality of
Apes (Plate V), de W. Köhler, 1927,
Londres: Routledge y Kegan Paul.
El enfoque de arriba hacia abajo de Köhler para la resolución de problemas enfatizó su

naturaleza estructurada, planificada y conceptual, en lugar de su aspecto de prueba y error. Köhler
fue miembro de la escuela de psicología de la Gestalt (ver Apéndice A), que en general se oponía
al tipo más elemental de análisis del conductismo que surgió, en parte, de trabajos como el de
Thorndike. Sin embargo, tanto el enfoque conductista como el de la Gestalt han sido tremendamente
influyentes en la psicología del pensamiento y la resolución de problemas (Holyoak, 1990).
Tema Confiabilidad y replicación

Ilustración Razonamiento Analógico
La cuestión básica de la fiabilidad de los resultados experimentales es simplemente esta: si se

repitiera un experimento, ¿los resultados serían los mismos que los encontrados la primera vez?
Este es un tema crucial en la investigación psicológica, ya que un resultado experimental no tiene
valor si no podemos tener una certeza razonable de que los resultados son confiables.
La clave para asegurar la confiabilidad de nuestras observaciones es el número de
observaciones que hacemos. Cuanto mayor sea el número de observaciones, más seguros
podemos estar de que nuestras estadísticas muestrales se aproximan a los valores reales de los
parámetros de la población. Si tomamos una muestra aleatoria de personas en los Estados Unidos
y les hacemos preguntas de encuesta (p. ej., sobre su preferencia en las próximas elecciones
presidenciales), podemos estar más seguros de que los resultados representan con precisión a la
población si la muestra consta de 100 000 personas. que si consta de sólo 100.
59533_12_ch11_p297-326.indd 301 9533_12_ch11_p297-326.indd 301 3/5/08 /5/08

Esto es similar a la forma en que los casinos de Las Vegas garantizan la rentabilidad. En juegos
como el blackjack, los dados y la ruleta, se conocen los parámetros de población (las probabilidades reales).
Cuantas más observaciones individuales (apuestas) se hagan, más probable será que los resultados
reflejen los parámetros de la población. Debido a que las probabilidades favorecen a los casinos, los
casinos ganan.
Lo que hay que tener en cuenta, entonces, es que nuestra confianza en la fiabilidad de un resultado
particular aumenta con el número de observaciones en las que se basa el resultado. Entonces, en
general, deberíamos intentar maximizar el número de observaciones en las condiciones de nuestros
experimentos. Esto aumenta no sólo nuestra confianza en la fiabilidad del resultado, sino también el
poder de las pruebas estadísticas que empleamos, o la capacidad de las pruebas para permitir el rechazo
de la hipótesis nula si de hecho es falsa. La hipótesis nula es la predicción de que la variable
independiente no tendrá efecto sobre la variable dependiente.
La confiabilidad implica no solo el tamaño de la muestra y las estadísticas, sino también diferentes
tipos de replicabilidad experimental. La clave para la replicabilidad experimental es la identificación de las
variables relevantes, porque deben manipularse o controlarse sistemáticamente para producir resultados
consistentes. En general, en el estudio de procesos más complejos, probablemente debería haber mayor
preocupación por la confiabilidad de los resultados que en el estudio de procesos más simples. Una
razón es que en la investigación relacionada con procesos complejos, a menudo es necesario utilizar
diseños entre sujetos, o diseños en los que un grupo diferente de sujetos sirve en cada condición
experimental, debido a los efectos de arrastre que se producirían en los diseños dentro de los sujetos.
(ver Capítulo 9). El uso de diseños entre sujetos en lugar de diseños dentro de los sujetos tiende a
aumentar la variabilidad de las observaciones, ya que las diferencias entre sujetos individuales no están
tan bien controladas.
Pero hay otra razón por la que la fiabilidad experimental puede ser un problema en la investigación
de la cognición compleja. Típicamente, por razones prácticas, es difícil obtener muchas observaciones
por condición en el estudio de procesos complejos con diseños entre sujetos. Esto es cierto porque a
menudo es necesario evaluar a los sujetos individualmente, lo que requiere una gran cantidad de tiempo.
En experimentos sobre procesos complejos, como la resolución de problemas, puede llevar una hora
evaluar a un sujeto individual. Por lo tanto, incluso si hubiera solo cuatro condiciones en el experimento
y solo quisiéramos 25 observaciones en cada condición, eso equivaldría a hasta 100 horas de prueba de
sujetos. Debido a estas consideraciones prácticas, entonces, a menudo encontramos muy pocas
observaciones por condición experimental en el estudio de procesos complejos, aunque esto significa
que tendremos menos confianza en la confiabilidad de los resultados y nuestras pruebas estadísticas
tendrán menos poder. .
Razonamiento Analógico
Ilustraremos algunos puntos adicionales sobre la confiabilidad de la investigación discutiendo la
resolución de problemas por analogía. Cuando las personas comprenden algún punto por analogía,
entienden una cosa en términos de otra. Si te dijeran en física en la escuela secundaria que la estructura
del átomo era similar en algunos aspectos a la organización del sistema solar, o en química que las
moléculas de gas chocan entre sí como bolas de billar en una mesa de billar, o en psicología que la
memoria humana podría compararse con una biblioteca o diccionario gigante, tu maestro estaba
empleando un razonamiento analógico. Ella o él estaba tratando de hacerte entender algo desconocido
en términos de algo que ya entendías. Los psicólogos interesados en el pensamiento han reconocido
desde hace mucho tiempo la importancia de las analogías al pensar y hacer descubrimientos. El arte del
descubrimiento a menudo radica en percibir una semejanza entre dos elementos en diferentes dominios
de conocimiento.
59533_12_ch11_p297-326.indd 302 9533_12_ch11_p297-326.indd 302 3/5/08 /5/08

Variables dependientes de manera que en condiciones en las que menos sujetos

son capaces de resolver un problema, también tardan más
en hacerlo.
Hay tres formas principales de medir el proceso de
Una tercera medida que se puede utilizar en algunas
resolución de problemas. Supongamos que presentamos o
no una ilustración junto con el problema del tren y el pájaro. situaciones de resolución de problemas donde es posible
Un grupo de sujetos intenta resolverlo con la figura 11.1 más de una solución es la calidad de la solución.
presente y otro grupo intenta resolverlo sin la ilustración. Debe ser posible clasificar las soluciones en una escala
¿Qué medimos? El primero ordinal; en otras palabras, debe ser posible ordenarlos de
mejor a peor. Entonces, incluso si el porcentaje correcto y
y lo más obvio para medir es el número o proporción de las medidas de latencia no indican ninguna diferencia entre
sujetos en las dos condiciones que pueden resolver el los sujetos que resuelven problemas en dos condiciones,
problema dentro de un límite de tiempo (digamos, 45 los sujetos en una condición aún pueden lograr soluciones
minutos). Pero es probable que la mayoría de los problemas más satisfactorias que los sujetos en otra condición.
elegidos para el estudio sean bastante fáciles o al menos
solucionables dentro del límite de tiempo. ¿Qué pasa si Uno podría querer usar las tres medidas de solución
todos en ambos grupos resuelven el problema? Entonces de problemas como operaciones convergentes de algún
es imposible decir si la variable independiente tuvo algún constructo de resolución de problemas, pero es posible que
efecto, debido a un efecto techo en el desempeño (ver no haya una relación directa entre ellas. Por ejemplo, los
Capítulo 10). Por supuesto, es incorrecto concluir que la sujetos en una condición pueden tardar mucho más en
variable no tuvo efecto solo porque el porcentaje de personas resolver un problema en particular que los sujetos en otra
que resolvieron el problema es equivalente, ya que el condición, y quizás un porcentaje menor de sujetos resolverá
problema era demasiado fácil para revelar posibles el problema en la primera condición, pero las soluciones que
diferencias. Lo que podemos hacer es observar una segunda los sujetos logran en esta condición pueden ser superiores
medida de rendimiento para resolver el problema: la latencia, a los del otro. En otras palabras, la variación en la variable
o el tiempo que lleva resolver el problema. Aunque todos los independiente podría permitir que los sujetos en una
sujetos de ambos grupos resolvieron el problema, es posible condición produzcan con frecuencia una solución deficiente
que se hayan tomado diferentes cantidades de tiempo para en un período relativamente corto, a diferencia de los sujetos
hacerlo en las diferentes condiciones. Entonces, aunque en otra condición que pueden producir una mejor solución
puede que no haya diferencias en los porcentajes de con menos frecuencia y tardar más tiempo en hacerlo. . Así
personas que resuelven el problema, la medición del tiempo que puede que no haya una relación simple entre las
necesario para resolver el problema puede resultar un índice medidas. Este problema es una variante del problema de
más sensible de la dificultad del problema en las dos equilibrio entre velocidad y precisión analizado en las
condiciones (imagen versus sin imagen). De hecho, incluso medidas del tiempo de reacción en el Capítulo 8.
si no hubiera un efecto de techo, pero los porcentajes de
personas que resolvieron el problema aún fueran equivalentes
a, digamos, 60 por ciento, las latencias aún podrían revelar
diferencias en el rendimiento. Variables independientes
Por lo tanto, podemos decir que es probable que las latencias La principal variable independiente en el estudio de la
sean una variable dependiente más sensible que el resolución de problemas es la forma en que se presenta el
porcentaje correcto, ya que es más probable que esta problema. Esto se puede variar de varias maneras diferentes.
medida indique un efecto de la variable independiente en la Consideremos el problema de cuánto tarda el pájaro en
mayoría de las situaciones. (Sería muy inusual encontrar lo volar entre los dos trenes antes de que se encuentren, que
contrario: un efecto sobre el porcentaje correcto pero no se presentó al principio del capítulo.
sobre la latencia). Por supuesto, normalmente esperaríamos
una alta correlación negativa entre el porcentaje correcto y Una cosa que podríamos variar es el orden y prominencia
la latencia. de la información necesaria para resolver el problema.
59533_12_ch11_p297-326.indd 303 9533_12_ch11_p297-326.indd 303 3/5/08 /5/08

problema. El hecho crítico de que el pájaro volaba a para resolver el problema; si la magnitud de la
80 millas por hora está oculto en la descripción del recompensa ofrecida afecta la solución; y si existen
problema. Si se hiciera más prominente, los sujetos diferencias individuales entre las clases de personas
podrían tener la idea de usar este hecho antes en sus (p. ej., CI alto versus bajo) para resolver el problema.
intentos de reestructurar el problema. Un segundo
factor que puede variar es la cantidad de información
irrelevante presentada. Por ejemplo, la información de Variables de control
que los trenes comenzaron a las 2:00 p . m. de un
sábado es completamente irrelevante para resolver el Los experimentos relacionados con la resolución de
problema y debe ignorarse. Bien puede ser que cuanta problemas y el pensamiento suelen ser más
más información irrelevante se presente junto con los complicados que otros en la psicología experimental
pocos hechos relevantes, más tiempo llevará resolver humana; por lo tanto, esta área (junto con otras, como
el problema. Si se presenta o no una ilustración y la la psicología social y ambiental, que se ocupan de
naturaleza de la ilustración también podría variar. procesos complejos) requiere mucho cuidado para
Presentar o no presentar una ilustración con el producir control experimental. Dado que es típico en
problema puede ayudar o dificultar su solución, este campo el uso de diseños entre sujetos (se asignan
dependiendo de la naturaleza del problema. También grupos de sujetos independientes a diferentes
podrían estudiarse otros tipos de variables condiciones), se debe tener cuidado para asegurar
psicolingüísticas, como si se usan oraciones activas o que los sujetos en las diferentes condiciones sean
pasivas para describir el problema. Además de estadísticamente equivalentes, ya sea asignándolos
aquellas relacionadas con la forma en que se presenta aleatoriamente a las condiciones o comparándolas en
el problema, otras variables de interés podrían ser si alguna dimensión como el coeficiente intelectual. De
existe presión de tiempo (o algún otro tipo de estrés) manera similar, uno debe controlar tan estrictamente
bajo el cual las personas están trabajando cuando como sea posible todas las variables extrañas (como
intentan solucionarlo. la forma en que se plantea el problema o cómo se presenta).
(Hadamard, 1945). Por ejemplo, en el siglo XVII, William Harvey desarrolló un modelo hidráulico de
circulación sanguínea después de concebir el corazón como una bomba.
El estudio del razonamiento por analogía es bastante difícil. La resolución de problemas, el
pensamiento y el descubrimiento son temas que durante mucho tiempo se han resistido a comprender
por parte de los psicólogos. Sin embargo, en los últimos 20 años más o menos, se han logrado avances
reales en esta área en numerosos frentes (Mayer, 1983). Aquí consideramos ejemplos de experimentos
de Gick y Holy Oak (1980, 1983) para ilustrar cómo se puede realizar una investigación interesante
sobre estos temas y mostrar la importancia de determinar la confiabilidad de los fenómenos experimentales.
Gick y Holyoak estaban interesados en los efectos del razonamiento analógico en la resolución
de problemas. Antes de discutir esta investigación, le daremos el problema que usaron, para que pueda
reflexionar sobre él antes de continuar. Se llama el problema de la radiación y fue utilizado por primera
vez por Duncker en 1945. Puede enunciarse de la siguiente manera:
Supongamos que usted es un médico que se enfrenta a un paciente que tiene un tumor maligno en el estómago.
Es imposible operar el tumor, pero a menos que se destruya el tumor, el paciente morirá. Hay una especie de
rayo que se puede usar para destruir el tumor. Si los rayos alcanzan el tumor todos a la vez con una intensidad
suficientemente alta, el tumor se destruirá. Desafortunadamente, a esta intensidad también se destruirá el tejido
sano por el que pasan los rayos en su camino hacia el tumor. A intensidades más bajas, los rayos son inofensivos
para el tejido sano, pero tampoco afectarán al tumor. ¿Qué tipo de procedimiento podría usarse para destruir el
tumor con los rayos y al mismo tiempo evitar destruir el tejido sano? (Gick & Holyoak, 1980, págs. 307–308).
59533_12_ch11_p297-326.indd 304 9533_12_ch11_p297-326.indd 304 3/5/08 /5/08

Cierra tu libro y piensa en cómo resolver este problema antes de seguir leyendo. Hacer
No siga leyendo hasta que haya pensado en al menos una solución al problema.
¿Como hiciste? Muchos estudiantes tienen dificultad para resolver el problema, dadas todas las
restricciones que se les imponen. Muchas “soluciones” dependen de tecnología avanzada, como
inmunizar el tejido sano con algún fármaco y luego pasar el rayo a través de él al tumor canceroso.
Una solución más práctica es operar al paciente e insertar un tubo en el área afectada o exponer el
tumor, de modo que la radiación pueda aplicarse directamente al órgano enfermo. Sin embargo, quizás
la solución más creativa y efectiva al problema sería apuntar varios rayos débiles al tumor desde
diferentes direcciones, de modo que convergieran en él. Cada uno de los rayos sería lo suficientemente
débil como para no dañar el tejido a través del cual pasara, pero la fuerza de todos los rayos cuando
convergieran sería suficiente para destruir el tumor. Esta solución es generada por muy pocos
estudiantes; en los estudios originales de este problema realizados por Duncker (1945), solo 2 de 45
sujetos (4 por ciento) dieron con esta solución.
Gick y Holyoak (1980, 1983) estaban interesados en ver si podían lograr que más personas
resolvieran este problema dándoles un problema y una solución análogos antes del problema de la
radiación. La idea es que las personas abstraigan el principio rector del primer problema y luego
puedan aplicarlo al segundo. Con esto en mente, Gick y Holyoak desarrollaron otras “historias análogas”
que incorporaban el mismo principio que se aplicaba a la solución más efectiva al problema de la
radiación.
En una historia, llamada "El Comandante", el líder de un cuerpo de tanques necesitaba montar un
ataque contra un cuartel general enemigo. Al atacar con muchos tanques, tenía buenas posibilidades
de ganar, pero tenía que atacar a través de puentes angostos y desvencijados que solo permitirían el
paso de unos pocos tanques. Un asalto con una fuerza tan pequeña a través de un puente sería
fácilmente repelido. Para lograr la victoria, el comandante del tanque ideó el plan de enviar algunos
tanques a cada uno de los pequeños puentes que rodeaban el cuartel general. Todos los tanques
pudieron atacar a través de los puentes a la vez y alcanzar el cuartel general enemigo.
La similitud entre el problema del ataque con tanques y el problema de la radiación debería ser
evidente. En ambos casos, es necesario que el solucionador de problemas renuncie a un ataque
directo a la sede (o tumor canceroso) y disperse fuerzas (o radiación) para un ataque convergente
simultáneo desde diferentes direcciones. Pero, ¿utilizarían los sujetos de un experimento los principios
derivados de la lectura de una historia como “El Comandante” para resolver el problema de la radiación?
Gick y Holyoak (1980) realizaron una serie de experimentos en los que los sujetos intentaron resolver
el problema de la radiación después de leer una historia similar a “El Comandante” o después de no
leer ninguna historia (o una historia irrelevante). Descubrieron en varios experimentos que los sujetos
a los que no se les dio una historia o una historia irrelevante antes del problema de la radiación
resolvieron el problema con la solución más efectiva solo alrededor del 10 por ciento de las veces. Sin
embargo, cuando a los sujetos se les dio una historia análoga antes del problema de la radiación,
alrededor del 75 por ciento lo resolvió dentro del límite de tiempo. Dado que este resultado se obtuvo
en varios experimentos, el fenómeno básico se repitió varias veces. Obviamente, las personas pueden
beneficiarse de la analogía para resolver problemas.
Los resultados de uno de sus experimentos llevaron a Gick y Holyoak (1980) a considerar más de
cerca los procesos involucrados en el razonamiento por analogía. En el experimento 4 de su serie, les
dieron a todos los sujetos la historia analógica para leer y luego el problema de la radiación para
resolver. Sin embargo, en la condición de "pista" del experimento 4, se les dijo a los sujetos, después de
59533_12_ch11_p297-326.indd 305 9533_12_ch11_p297-326.indd 305 3/5/08 /5/08

Habían leído la historia pero antes de que entendieran el problema de la radiación, usaron la
historia como una pista sobre cómo resolver el problema. (Esta instrucción también se había
incluido en todos los experimentos anteriores de la serie de Gick y Holyoak.) Para los sujetos en
la condición de "sin pistas", no se mencionó la relación entre la historia que acababan de leer y
la resolución de problemas. tarea por delante. Los resultados revelaron que la pista era de hecho
un componente crítico para resolver el problema por analogía. Cuando se dio la pista, el 92 por
ciento de los sujetos resolvió el problema; cuando no se dio la pista, solo el 20 por ciento de ellos
la resolvió. Los resultados parecen mostrar que no basta haber estado expuesto a la analogía;
uno debe ser inducido a hacer un uso activo de él durante el intento de resolver el problema
posterior. (El mayor porcentaje de estudiantes que resolvieron el problema en el experimento 4
en relación con los experimentos anteriores (92 por ciento a alrededor del 75 por ciento)
probablemente se debió a que se usaron historias algo diferentes en los experimentos).
Este hecho puede no parecer sorprendente: decirle a la gente que use una fuente de
conocimiento los lleva a hacerlo. Pero lo que es sorprendente es cómo pocos sujetos (20 por
ciento) dieron con la solución espontáneamente, sin la pista. La primera pregunta que nos
hacemos ante un descubrimiento sorprendente en cualquier campo experimental es: ¿Es real?
Esto nos lleva de nuevo a la cuestión de la fiabilidad: si se repitiera el experimento, ¿se obtendría
el mismo resultado?
Una forma de responder a esta pregunta es calcular estadísticas inferenciales, cuya lógica
se describe en el Apéndice B. Brevemente, las estadísticas inferenciales se utilizan para
determinar si una diferencia obtenida entre condiciones se debe a la operación de la variable
independiente o a factores aleatorios. . Si la diferencia entre las condiciones es lo suficientemente
grande como para que ocurra por casualidad en menos de 5 de cada 100 casos, entonces el
investigador rechaza la posibilidad de que los factores aleatorios hayan producido el resultado y,
en cambio, acepta el resultado como evidencia de un efecto real del resultado. variable
independiente, en este caso, la presencia o ausencia de la pista. De hecho, Gick y Holyoak
(1980) realizaron las estadísticas inferenciales apropiadas y concluyeron que la diferencia en el
porcentaje de soluciones entre los dos grupos no era el resultado de factores aleatorios sino la
presencia o ausencia de la pista. Por lo tanto, podemos concluir sobre la base de dicha prueba
que la diferencia tiene confiabilidad estadística.
La confiabilidad estadística es una condición necesaria para tomar en serio un resultado
experimental, pero muchos investigadores prefieren que un experimentador también establezca
la confiabilidad experimental. Si el experimento se repite esencialmente bajo las mismas
condiciones, ¿los resultados serán los mismos que antes? Un adagio entre los investigadores
es que “una réplica vale mil pruebas” . (La prueba t es una prueba estadística bien conocida que
se usa para evaluar la confiabilidad estadística entre dos condiciones). La esencia del adagio es
que muchos investigadores están más convencidos por las repeticiones del experimento que por
las estadísticas inferenciales aplicadas al resultado original. Aunque un resultado puede
considerarse estadísticamente confiable, existe la posibilidad de que haya ocurrido por casualidad
(la confiabilidad estadística aún permite una tasa de error del 5 por ciento) o debido a alguna
confusión o error no intencional por parte del experimentador. Por ejemplo, quizás los sujetos
más inteligentes fueron asignados a una condición en lugar de otra. Aunque estas posibilidades
pueden parecer poco probables, a veces ocurren. En algunos experimentos, los sujetos se
asignan aleatoriamente a las condiciones y luego, antes del experimento principal, se somete a
los diversos grupos a una prueba previa para determinar si los grupos son realmente equivalentes
(en promedio) en capacidad. Ocasionalmente, las pruebas previas de este tipo revelan
diferencias, antes de que se haya introducido la variable independiente (ver, por ejemplo, Tulving
y Pearlstone, 1966). Dado que tales problemas pueden ocurrir incluso en investigaciones bien contro
59533_12_ch11_p297-326.indd 306 9533_12_ch11_p297-326.indd 306 3/5/08 /5/08

fomentar la replicación de experimentos, incluso cuando las estadísticas inferenciales indiquen que
algún efecto es confiable.
Hay tres tipos de replicación experimental: replicación directa, replicación sistemática y
replicación conceptual. La replicación directa, como su nombre lo indica, es el intento de repetir
el experimento con la mayor precisión posible, con la menor cantidad de cambios posible en el
método original. Si Gick y Holyoak (1980) hubieran intentado repetir su cuarto experimento con la
mayor precisión posible con la excepción de probar nuevos grupos de sujetos asignados
aleatoriamente a las condiciones, esto habría constituido una réplica directa de su experimento.
Un tipo de replicación más interesante es la replicación sistemática. En las repeticiones

sistemáticas, el experimentador intenta variar los factores que se cree que son irrelevantes para el
resultado experimental. Si el fenómeno no es ilusorio, sobrevivirá a estos cambios. Si el efecto
desaparece, entonces el investigador ha descubierto importantes condiciones de contorno en el
fenómeno que se está estudiando. En realidad, el experimento 4 de la serie de Gick y Holyoak
podría considerarse en sí mismo una réplica sistemática que condujo a nueva información importante.
En sus primeros tres experimentos, Gick y Holyoak compararon las condiciones en las que los
sujetos resolvieron el problema de la radiación después de estudiar una historia que contenía una
solución análoga (la condición experimental) o después de estudiar una que no (la condición de
control). Como se discutió anteriormente, encontraron que un mayor porcentaje de sujetos resolvió
el problema de la radiación con la "solución de convergencia" (apuntando los rayos desde varios
lados) cuando se probaron en la condición experimental que cuando se probaron en la condición de
control. Repitieron esta observación varias veces. Sin embargo, en cada uno de los primeros tres
experimentos, se les dijo a los sujetos en la condición experimental que debían usar la historia para
intentar resolver el problema. En el experimento 4, Gick y Holyoak intentaron repetir el experimento
pero variaron esta característica (aparentemente pequeña); esta pequeña variación permitió que el
experimento fuera considerado una réplica sistemática. Descubrieron que esta pista era en realidad
una parte crítica de la manipulación experimental; simplemente hacer que los sujetos estudiaran la
historia y luego trataran de resolver el problema de la radiación sin la pista específica produjo un
porcentaje mucho más bajo de sujetos que resolvieron el problema que instruirlos para que usaran
la pista.
En una replicación conceptual, se intenta replicar un fenómeno, pero de una manera

radicalmente diferente al experimento original. En experimentos que siguieron a los ya descritos,
Gick y Holyoak (1983) intentaron determinar las condiciones que promoverían la transferencia
positiva de historias análogas a soluciones de problemas. En tres experimentos con el problema de
la radiación y otro problema, Gick y Holyoak hicieron que los sujetos procesaran la historia analógica
de diferentes maneras (las condiciones experimentales) para ver si se podía aumentar la cantidad
de transferencia positiva, en comparación con el caso en el que la analogía era simplemente
presentado por sí mismo sin instrucciones especiales (la condición de control). Descubrieron que la
cantidad de transferencia positiva (indexada por un mayor porcentaje de sujetos que resolvieron el
problema en las condiciones experimentales) no mejoró cuando (1) se les dijo a los sujetos que
resumieran historias en lugar de estudiarlas para una prueba de recuerdo (experimento 1) ; (2) a los
sujetos se les dio o no un principio verbal junto con la historia que capturaba la esencia de la
estrategia (experimento 2); o (3) los sujetos recibieron diagramas junto con la historia (experimento
3).
Gick y Holyoak (1983) lograron descubrir condiciones que produjeron una transferencia positiva
de los análogos de la historia para resolver el problema de la radiación. Cuando los sujetos
estudiaron dos análogos y luego describieron sus similitudes (antes de que se les presentara el proble
59533_12_ch11_p297-326.indd 307 9533_12_ch11_p297-326.indd 307 3/5/08 /5/08

se produjo una mayor transferencia positiva que cuando los sujetos estudiaron sólo un análogo. Gick
y Holyoak argumentaron que los sujetos que procesaban dos análogos y pensaban en sus similitudes
podían generar una mejor idea subyacente (o esquema, en sus términos), que luego podía aplicarse
espontáneamente para resolver nuevos problemas.
Aunque los experimentos informados por Gick y Holyoak (1983) no fueron réplicas directas o
sistemáticas de su experimento anterior que indicaba que los sujetos tenían dificultad para usar
analogías espontáneamente para resolver problemas, convergieron en la misma conclusión de que es
difícil mejorar el razonamiento a partir de analogías Por lo tanto, estos últimos experimentos pueden
considerarse réplicas conceptuales, en el sentido de que reprodujeron la esencia del fenómeno de la
dificultad de razonar a partir de analogías sin una dirección manifiesta para hacerlo, aunque las
técnicas experimentales no fueran réplicas exactas de aquellas. utilizado en el experimento original.
El problema de la replicabilidad está entrelazado con el tema de la generalidad de los resultados.

En el caso de las replicaciones sistemáticas y conceptuales, un investigador no está repitiendo
exactamente un experimento, sino que realmente se pregunta si el fenómeno de interés se generaliza
de una forma u otra. En las réplicas sistemáticas, las variables manipuladas (ya través de las cuales
se busca la generalidad) no suelen ser muy diferentes de las del experimento original, mientras que
en las réplicas conceptuales, las diferencias en el procedimiento suelen ser mucho mayores. En cierto
sentido, es mejor si el investigador finalmente encuentra condiciones bajo las cuales el fenómeno no
puede ser replicado.
Por ejemplo, Spencer y Weisberg (1986) replicaron la condición de Gick y Holyoak (1983) en la
que a los sujetos se les dieron dos historias análogas antes de resolver el problema de la radiación.
Sin embargo, agregaron un giro interesante al cambiar el pretexto bajo el cual se administraron las
dos historias de entrenamiento inicial y el problema de la radiación. En la condición de “mismo
contexto”, se les hizo creer a los sujetos que las tres historias eran parte de un experimento piloto y un
experimentador que llegó a sus aulas las probó en las tres. En la condición de “contexto diferente”, se
les dijo a los sujetos que solo las dos primeras historias eran parte de un experimento. Después de
realizar las historias de entrenamiento, el experimentador salió del salón de clases y luego su instructor
les dio el problema de radiación para que lo resolvieran como parte de una “demostración de clase”.
Además, el problema de la radiación se daba inmediatamente o 45 minutos después de los problemas
de entrenamiento. Diferentes aulas de sujetos participaron en las cuatro combinaciones diferentes de
condiciones, y ningún sujeto recibió indicios de que el problema de la radiación estaba relacionado
con los dos primeros problemas.
Los resultados se presentan en la Figura 11.3. Cuando no hubo demora entre los dos primeros
problemas y el problema de la radiación, hubo cantidades iguales de transferencia en los grupos del
mismo y diferente contexto. Sin embargo, cuando hubo un intervalo de 45 minutos entre el
entrenamiento y los problemas de radiación, solo los sujetos que intentaron resolver el problema de
radiación en el mismo contexto mostraron transferencia. Los sujetos en la condición de contexto
diferente no mostraron transferencia después del intervalo de 45 minutos. Los sujetos no vieron que
el problema de la radiación era como los dos primeros problemas cuando la relación aparente entre
ellos se destruyó al cambiar el pretexto para realizar la tarea de radiación. Estos resultados representan
una interacción de contexto y tiempo de prueba y apoyan la noción de que el razonamiento analógico
no se generaliza fácilmente a nuevos problemas y situaciones. También ayudan a defi nir las
condiciones bajo las cuales se obtendrá y no se obtendrá la transferencia analógica.
Gran parte de la investigación se ha centrado en el uso de la analogía en situaciones educativas
(p. ej., Bulgren, Deshler, Schumaker y Lenz, 2000; Kolodner, 1997). Pero muchas otras situaciones
también son de interés para los investigadores, incluyendo (pero no limitado a) cómo las personas
usan analogías durante las negociaciones (Gentner, Loewenstein y Thompson, 2003), y cómo las personas
59533_12_ch11_p297-326.indd 308 9533_12_ch11_p297-326.indd 308 3/5/08 /5/08

Inmediato Demorado
.30
Prueba Prueba
.25
.20
Proporciones
sujetos
que
de
proporcionadas
convergencia
Soluciones
de
.15
.10
.05
Mismo Diferente Mismo Diferente

Contexto Contexto Contexto Contexto
ÿ FIGURA 11.3
Proporción de sujetos en el experimento de Spencer y Weisberg (1986) que mostraron transferencia al
resolver tipos similares de problemas. Cuando el problema de prueba se presentó 45 minutos después de los
dos problemas de entrenamiento, los sujetos en la condición de contexto diferente, a quienes se les dijo que
los problemas de entrenamiento eran parte de un experimento pero que el problema de prueba era parte de
una demostración en clase, no mostraron transferencia de habiendo resuelto previamente los problemas de
entrenamiento. Los sujetos en la misma condición de contexto, a quienes se les dijo que los tres problemas
eran parte de un experimento, mostraron transferencia tanto en la prueba inmediata como después de la larga dem
hacer analogías entre eventos políticos y líderes (Holyoak & Thagard, 1997). Una nueva línea
creativa de investigación está investigando cómo las analogías concretas ayudan a las personas a
comprender conceptos abstractos (Boroditsky, 2000). Por ejemplo, considere cómo habla sobre el
tiempo: toma prestados términos espaciales como "adelante", "adelante" y "detrás". Es decir, usas
tu experiencia personal con el espacio físico como una analogía para hablar y pensar sobre el tiempo
(que en realidad no puedes ver ni tocar). En una serie de ingeniosos experimentos, Boroditsky y
Ramscar (2002) demostraron cómo las posiciones físicas de las personas afectaban sus respuestas
a las preguntas sobre el tiempo. Hicieron a las personas la pregunta ambigua: “Suponga que le
dicen que la reunión del próximo miércoles se ha adelantado 2 días. ¿Qué día es la reunión, ahora
que ha sido reprogramada? Dependiendo de su perspectiva, podría responder razonablemente
"lunes" o "viernes" (la mayoría de las personas confían mucho en su respuesta, pero pregúntele a
algunos de sus amigos: ¡encontrará que las personas responden esta pregunta de manera diferente!).
Tu respuesta depende de cómo pienses sobre el tiempo. Si ve el tiempo moviéndose hacia usted (la
perspectiva del tiempo moviéndose), entonces pensará en el tiempo avanzando (adelantándose) 2
días más cerca y responderá "Lunes". Si te ves a ti mismo moviéndose a través del tiempo (la
perspectiva del movimiento del ego), "adelante" implica tu movimiento hacia el futuro, y responderás
"viernes".
Boroditsky y Ramscar (2002) hicieron esta pregunta a las personas en el aeropuerto. Como era de
esperar debido a la naturaleza ambigua de la pregunta, la mitad de las personas que esperaban
para recoger a los pasajeros respondieron “viernes” y la mitad respondió “lunes”. Pero más de la
mitad de los pasajeros de líneas aéreas (personas que estaban esperando para subirse a un avión
o que acababan de bajarse de un avión) eligieron "viernes", porque los viajeros aéreos estaban en
el modo de pensar en sí mismos como moviéndose, como viajando a través físico. espacio, y así
usó la perspectiva espacial del movimiento del ego para responder a la pregunta temporal. Boroditsky
59533_12_ch11_p297-326.indd 309 9533_12_ch11_p297-326.indd 309 3/5/08 /5/08

encontró evidencia convergente para el uso de metáforas espaciales para responder preguntas
temporales de fuentes tan diversas como un experimento de laboratorio, pasajeros en un tren y
personas esperando en una fila para almorzar. Por ejemplo, cuanto más cerca estaban las personas
del frente de una larga fila para almorzar, más probable era que respondieran la pregunta ambigua
con "viernes": acababan de experimentarse a sí mismos moviéndose a través del espacio y, por lo
tanto, usaron esa perspectiva para responder la pregunta.
Dada la investigación que acabamos de describir, podríamos preguntar razonablemente:
"¿Qué condiciones le permiten a una persona usar analogías para resolver problemas de manera
eficiente?" Holyoak (1990; Holyoak & Thagard, 1989) ha desarrollado una teoría que describe las
condiciones bajo las cuales ocurrirá una transferencia analógica exitosa. De acuerdo con Holyoak,
tener experiencia con el problema del ataque con tanque ayudará a una persona a resolver el
problema del tumor solo si la persona encuentra el mejor conjunto de correspondencias entre el
problema original y el problema de transferencia. Holyoak llama mapeo a las formas en que una
persona relaciona los elementos de un problema con otro . En el caso del tanque/tumor, por ejemplo,
la persona que trata de resolver el problema necesita reconocer que los objetivos de capturar la
fortaleza y destruir el tumor corresponden. Además, la persona necesita darse cuenta de que la
capacidad de destrucción de los rayos corresponde a la capacidad de captura del ejército.
Según la teoría, las correspondencias que se advierten deben ser consideradas de forma
unificada. Es decir, el mapeo o correspondencia entre el problema original y el problema de destino
debe tener consistencia estructural, lo que significa que los elementos que se corresponden en
los dos problemas deben estar relacionados entre sí de manera consistente con otros mapeos.
Considere los mapeos estructurales ilustrados en la Figura 11.4. Holyoak asume que si la
relación percibida de un par de elementos en los dos problemas es consistente, entonces las
relaciones entre otros elementos también tienen que ser consistentes. Si el solucionador de
problemas nota la analogía entre la fortaleza y el tumor, entonces capturar tendría que corresponder
a destruir, y el destructor (rayos) tendría que mapear al capturador, que sería el ejército en este
caso. El patrón de tales mapeos analógicos sería estructuralmente consistente.
Las correspondencias entre los componentes de los dos problemas que se muestran en la
figura 11.4 forman un conjunto coherente y, por lo tanto, se apoyan entre sí. Por ejemplo, si una
persona reconoce primero un punto de correspondencia (digamos, ejército es lo mismo que rayos),
entonces es más probable que la persona note otra correspondencia, como entre general y médico.
Holyoak cree que su teoría de la consistencia estructural ayuda a especificar las condiciones bajo
las cuales las soluciones análogas son fáciles o difíciles. Si una persona es capaz de reconocer uno
o dos mapeos, entonces las otras consistencias encajarán y el problema debería resolverse.
Los experimentos de Novick (1990) muestran que la cantidad de generalización depende de

cómo se representen o conceptualicen los problemas. Si las estrategias generales de resolución de
problemas, como pensar en usar una matriz bidimensional como ayuda para la solución, son valiosas
para resolver un tipo de problema, entonces las personas volverán a usar la técnica en otros
problemas que no tengan soluciones análogas.
Si un investigador no puede encontrar las variables que controlan la presencia o ausencia del
fenómeno, la comprensión del tema se verá obstaculizada. La realización de réplicas sistemáticas y
conceptuales debería permitir a un investigador delinear las condiciones límite de un fenómeno:
las condiciones fuera de las cuales el fenómeno no se cumple. Cuando se pueden descubrir las
variables que controlan un fenómeno, el investigador puede construir una mejor teoría al respecto,
porque se conocen los factores relevantes.
59533_12_ch11_p297-326.indd 310 9533_12_ch11_p297-326.indd 310 3/5/08 /5/08

Capturar = Destruir Fortaleza = Tumor
Ejército = Rayos General = Médico
ÿ FIGURA 11.4
Un esquema del modelo de correspondencias analógicas de Holyoak entre el problema del

tumor y el problema de la fortaleza.
Tema Experimental Control

Ilustración Fijación funcional
El tema del control experimental se desarrolla a lo largo de este libro, como debería ser, ya que es
crucial para todos los tipos de investigación experimental. El propósito de cualquier experimento es
observar el efecto de la manipulación de ciertas variables —las variables independientes— sobre la
medición de las variables dependientes. Para que una conclusión sobre el efecto de una variable
independiente sobre una variable dependiente sea sólida, es necesario que obtengamos una
cantidad suficiente de control experimental sobre la situación para asegurar que ningún otro factor
varíe con la variable independiente. En este libro, estas otras variables se denominan generalmente
variables de control, aunque también se denominan variables extrañas o incluso variables molestas.
Si se permite que una variable extraña varíe al mismo tiempo que la variable independiente de
interés, no podemos saber si el efecto sobre la variable dependiente es causado por la variación en
la variable independiente, la variable extraña o ambas operando juntas. En tales casos, decimos que
las dos variables se confunden.
En el estudio de procesos complejos, a menudo hay mayores problemas de control
experimental que en otros tipos de investigación. En el estudio de temas como la resolución de
problemas, con frecuencia hay una gran variación en las medidas tomadas sobre la variable
dependiente. Ya hemos discutido algunas de las razones de esto. Debido a que es necesario utilizar
diseños entre sujetos en gran parte de esta investigación, las diferencias individuales entre los
sujetos contribuyen en gran medida a la variación no controlada o “varianza del error”.
Además, puede que no sea posible controlar estrictamente todas las variables molestas que pueden
afectar una situación. En su lugar, se puede dejar que varíen de forma no sistemática, ya que la
variación no sistemática no afectará a una condición experimental más que a otra. Aún así, estos
factores que varían aleatoriamente pueden servir para aumentar la variabilidad de las mediciones.
Debido al efecto de estas variaciones sobre la variable dependiente, puede ser más difícil
detectar un efecto confiable de la variable independiente. Entonces, otra razón para el control
experimental es reducir estas fuentes extrañas de variación en
59533_12_ch11_p297-326.indd 311 9533_12_ch11_p297-326.indd 311 3/5/08 /5/08

las variables dependientes Pero dado que ocurren y pueden ser más frecuentes en el estudio de la
resolución de problemas y otros procesos complejos, se hace necesario aumentar el número de
observaciones en condiciones experimentales para obtener resultados fiables.
Por razones prácticas que ya hemos comentado, esto no siempre es posible. Por lo tanto, el empleo de
tanto control experimental sobre variables extrañas como se pueda reunir en estas situaciones se vuelve
aún más importante y deseable.
Nuestra intención al discutir todas estas consideraciones no es implicar que la investigación sólida
sobre procesos interesantes y complejos sea prácticamente imposible. Sin embargo, es necesario tener
muy en cuenta las dificultades que uno encuentra en tal investigación. Algunos psicólogos experimentales
ven la investigación en estas áreas complejas como relativamente "descuidadas", ya que a menudo
carecen de un control experimental estricto y emplean relativamente pocas observaciones en condiciones
experimentales (lo que lleva a la posibilidad de resultados poco confiables). Es como si algunos
investigadores en esta área creyeran que la mayor dificultad para estudiar procesos psicológicos complejos
justifica de alguna manera un menor control experimental en lugar de un mayor.
Pero es bastante obvio que los problemas inherentes al estudio de procesos complejos pueden superarse:
tenemos casos de investigación ejemplar en esta área.
Un buen ejemplo es la investigación sobre la fi jación funcional en la resolución de problemas. Este
trabajo comenzó con una importante serie de estudios de Karl Duncker (1945, pp. 85-101).
La idea general detrás del concepto es que si un objeto se ha usado recientemente de una manera
particular en una situación dada, es probable que se pase por alto su uso de una segunda manera diferente
para resolver un nuevo problema. Duncker inventó una serie de problemas que utilizó para probar esta
idea general, pero nos centramos en uno solo, el conocido problema de la “caja”. Este problema es un
clásico y todavía está bajo investigación en la actualidad (p. ej., Carnevale & Probst, 1998; German &
Defeyter, 2000).
Problema de la caja de Duncker

En el problema de la caja, se les dijo a los sujetos que su tarea consistía en colocar tres velas pequeñas
en una puerta a la altura de los ojos. Los materiales que iban a utilizar se colocaron sobre una mesa. Entre
los objetos había varios cruciales: algunas tachuelas, fósforos, tres pequeñas cajas de cartón del tamaño
de una caja de fósforos y las velas. La solución adecuada al problema fue clavar las cajas a la pared y
usarlas como plataformas en las que se podían unir las velas con un poco de cera derretida. En la
condición de control, las cajas estaban vacías; pero en la condición de fi jación funcional, las cajas se
llenaron con el material necesario. Había varias velas en una, tachuelas en una segunda y fósforos en una
tercera. Así, en la última condición, la función de la caja como contenedor debía ser “fijada” en la mente de
los sujetos. Esto debería haber sido menos el caso en la condición de control, ya que las cajas no se
utilizaron como contenedores. Duncker también empleó una tercera condición, a la que nos referiremos
como la condición de uso neutral. Aquí, las cajas también se usaron como contenedores, pero contenían
objetos neutrales (como botones) que no se necesitaban como parte de la solución.
En este experimento era necesario un diseño entre sujetos, ya que una vez que los sujetos habían
estado expuestos al problema, no podían, por razones obvias, volver a ser evaluados en una condición
diferente. En este experimento en particular, Duncker empleó solo siete sujetos en cada condición. Los
resultados para las tres condiciones se reportan en la Tabla 11.1 como el número de sujetos que resolvieron
el problema en cada condición. Los siete sujetos en la condición de control resolvieron el problema, pero
solo el 43 por ciento de los sujetos en la condición de fijeza funcional (tres de siete) pudieron hacerlo. En
la condición de uso neutral, solo un sujeto (14 por ciento) pudo resolver el
59533_12_ch11_p297-326.indd 312 9533_12_ch11_p297-326.indd 312 3/5/08 /5/08

ÿ TABLA 11.1
Número de sujetos que resolvieron el problema de la caja de Duncker en

tres condiciones experimentales diferentes. Cuando a los sujetos se les
dieron las cajas que contenían material (las condiciones de fijación
funcional y de uso neutral), un número menor pudo resolver el problema
que cuando se les dieron las cajas vacías (control). Presuntamente, en los
casos anteriores, la función de la caja estaba "fijada" como contenedor y,
por lo tanto, los sujetos no pensaron tan fácilmente en las cajas como platafo
Problema resuelto
Condición Cajas (n 21)
Control Vacío 7 (100%)

fijeza funcional Lleno de velas, fósforos y tachuelas 3 (43%)
Neutral Lleno de materiales irrelevantes (botones, etc.) 1 (14%)
problema. Por supuesto, estas diferencias entre las condiciones no se evaluaron estadísticamente,
pero la diferencia entre las condiciones de control y de fijeza funcional se replicó con otros cuatro
problemas. La diferencia entre las condiciones de fijación funcional y de uso neutral se replicó con
dos grupos independientes que resolvieron otro problema. Desde entonces, el efecto de la fijeza
funcional se ha replicado varias veces, por lo que podemos estar seguros de que es fiable, a pesar
del pequeño número de sujetos utilizados en los estudios originales.
Los hallazgos de Duncker pueden interpretarse dentro del marco de los principios de
resolución de problemas de la Gestalt, discutidos anteriormente en este capítulo. Recuerde que
los gestaltistas creían que muchos problemas se resuelven a través de la intuición, o una
reestructuración repentina del problema de manera que conduzca a la solución correcta. En el
experimento de Duncker, los sujetos en la condición de fijeza funcional parecían incapaces de
superar el sesgo inducido al ver que todos los objetos cumplían sus funciones ordinarias y no
podían reestructurar sus percepciones para ver diferentes usos de los objetos.
Réplica de Adamson
Un estudio de Adamson (1952) es interesante al respecto. Trató de replicar el experimento original
de Duncker comparando sujetos en las condiciones de fijeza funcional y control en la solución de
tres problemas. Estos incluían el problema de la caja que ya hemos discutido, así como otros dos,
conocidos como el problema del sujetapapeles y el problema del gimlet. (La naturaleza exacta de
estos problemas no tiene por qué preocuparnos.) En cada situación, la comparación se realizó
entre sujetos que tenían experiencia previa con un objeto (y que, por lo tanto, deberían haber
estado pensando en la función del objeto como algo fijo) y sujetos de control. para quien este no
fue el caso. Adamson estaba principalmente preocupado por la cantidad de sujetos que se
utilizaron en el experimento original de Duncker, por lo que utilizó entre 26 y 29 sujetos en cada
una de sus seis condiciones separadas (3 problemas, 2 condiciones experimentales). Las medidas
dependientes que usó fueron el porcentaje de sujetos que pudieron resolver el problema en el
período de 20 minutos y la cantidad de tiempo que les tomó a los sujetos exitosos resolver el
problema.
Los resultados son bastante instructivos. Cuando Adamson usó la medida dependiente de
Duncker del porcentaje de sujetos que pudieron resolver el problema, pudo
59533_12_ch11_p297-326.indd 313 9533_12_ch11_p297-326.indd 313 3/5/08 /5/08

para replicar el efecto de la fijeza funcional solo en el problema de la caja. El 86 por ciento de los
sujetos de control, pero solo el 41 por ciento de los sujetos en la condición de fijeza funcional,
pudieron resolver el problema de la caja. Sin embargo, el desempeño de los otros dos problemas
fue imposible de interpretar con esta medida, debido a los efectos techo .
en ambas condiciones. Es decir, casi todos los sujetos en ambas condiciones resolvieron el
problema, por lo que el rendimiento no difirió; para ambos problemas, se acercó al 100 por ciento
en cada condición. Este problema se analiza en la sección "Introducción de las variables" de este
capítulo (consulte también el Capítulo 10); una vez más, no estamos justificados para concluir
que no hubo diferencia entre las dos condiciones bajo estas circunstancias. La conclusión, más
bien, es que la variable dependiente no era lo suficientemente sensible para permitir la detección
de cualquier posible diferencia entre las condiciones.
Afortunadamente, Adamson también utilizó una segunda medida dependiente. También
midió cuánto tiempo se tardaba en resolver los problemas, lo que suele llamarse latencia. Los
resultados, en términos del tiempo medio de solución para los sujetos en las dos condiciones, se
presentan en la figura 11.5 para los problemas de la barrena y del sujetapapeles. Solo se incluyen
los datos relativos a los sujetos que realmente resolvieron los problemas. Aunque casi todos los
sujetos pudieron resolver los problemas, la cantidad de tiempo que les llevó hacerlo varió mucho
en las dos condiciones, como se ve en la figura 11.5. En cada caso, los sujetos en la condición
de control resolvieron el problema mucho más rápido que los sujetos en la condición experimental
(fijación funcional). Por lo tanto, tener la función de los objetos arreglada por la forma en que se
presentó el problema ralentizó pero no impidió la solución del problema. El punto importante es
que la fijeza funcional se demostró en los tres problemas de Adamson, pero en dos de ellos fue
necesario utilizar una medida de latencia que fuera más sensible que simplemente el porcentaje
de sujetos que resolvían el problema.
250
200
segundos
en
150
problema
solución
Latencia
media
del
de
la
100
50
0
Control Experimental Control Experimental
(fijeza funcional) (fijeza funcional)
Problema de barrena Problema con el clip de papel
ÿ FIGURA 11.5
Tiempo necesario para resolver los problemas de la barrena y el clip en las condiciones de
control y experimentales (fijación funcional) del experimento de Adamson (1952). Los sujetos en
la condición de fijeza funcional tardaron más en resolver los problemas que los controles.
59533_12_ch11_p297-326.indd 314 9533_12_ch11_p297-326.indd 314 3/5/08 /5/08

Las medidas de latencia también pueden ser difíciles de interpretar debido a los efectos de
piso. Por ejemplo, en los experimentos de Adamson, si el tiempo para resolver un problema era
muy rápido (en el extremo inferior de la escala de medición) tanto en las condiciones experimentales
como de control y no se observaba una diferencia significativa, habría sido difícil concluir que la
manipulación no tuvo ningún efecto. Aunque este no fue el caso, se puede ver claramente en la
figura 11.5 que cuando la latencia general era más rápida (el problema del clip), la diferencia entre
la condición experimental y la condición de control era menor que cuando la latencia general era
más lenta (el problema del clip). problema de la barrena).
¿Por qué Adamson no pudo replicar los resultados de Duncker con los problemas del gimlet y
del clip, cuando el porcentaje de sujetos que resolvieron el problema era la medida dependiente?
Adamson sugiere que simplemente pudo haber tenido sujetos más capaces, lo que ciertamente es
una posibilidad. Pero otra posibilidad real es que Adamson concedió 20 minutos a sus sujetos para
resolver el problema, mientras que Duncker parece haber concedido mucho menos tiempo, aunque
varió un poco de un individuo a otro, dependiendo del progreso de cada uno hacia la solución.
El estudio de Adamson es un excelente ejemplo de una réplica sistemática y bien controlada

que sirvió para limpiar una demostración original de un fenómeno interesante.
Tales réplicas son bastante valiosas, especialmente porque a menudo conducen a nuevos
conocimientos sobre la generalidad del fenómeno en cuestión. Sin embargo, después de que un
fenómeno novedoso se haya replicado una o dos veces en laboratorios independientes, se debe
desalentar el esfuerzo de investigación adicional dirigido a replicaciones simples. (Las posibilidades
son excelentes de que los editores de revistas no consideren adecuado publicar más estudios de
replicaciones directas o incluso sistemáticas en este punto). El esfuerzo de investigación debe
centrarse en desarrollar una comprensión de los factores que influyen en el fenómeno y desarrollar
una teoría. o modelo de los procesos psicológicos implicados.
En el área de la fijeza funcional, Glucksberg y sus asociados han realizado investigaciones
sistemáticas sobre el efecto de la verbalización y el etiquetado en la fijeza funcional (Glucksberg y
Weisberg, 1966; Glucksberg y Danks, 1967, 1968). Por ejemplo, se ha encontrado que cuando los
objetos en el problema de la vela reciben etiquetas verbales (vela, tachuelas, caja, fósforos) cuando
se muestran a los sujetos, el problema es resuelto por más sujetos que cuando no se les dan
etiquetas. El truco consiste en hacer que los sujetos piensen en la caja no solo como un contenedor
de tachuelas, sino como un objeto separado que puede usarse para resolver el problema. Etiquetar
los objetos ayuda en este proceso. Como ha señalado Glucksberg, “No es la forma en que el mundo
es lo que influye en lo que hacemos tanto como la forma en que representamos ese mundo
simbólicamente” (1966, p. 26; las cursivas son de Glucksberg).
Tema Informes verbales

Ilustración Exceso de confianza en los juicios
Al principio de la historia de la psicología experimental, se hizo hincapié en el uso de informes
introspectivos como método para descubrir la estructura de la mente. Como se analiza en el
Apéndice A, la introspección no era una reflexión casual y caprichosa sobre los contenidos de la
mente durante una experiencia u otra, sino una técnica rigurosa y metódica para describir la
experiencia. Su problema básico era de confiabilidad: los investigadores que usaban la introspección
en diferentes laboratorios de psicología a menudo llegaban a conclusiones diferentes.
59533_12_ch11_p297-326.indd 315 9533_12_ch11_p297-326.indd 315 3/5/08 /5/08

sobre la estructura de la mente. El método probablemente habría caído en desuso sólo por esta razón,
pero su alejamiento de la psicología fue acelerado por el ataque de Watson (1913) a toda la empresa
de la psicología estructural y por el subsiguiente surgimiento del conductismo. Dado que la introspección
tiene un significado técnico en el vocabulario de la psicología estructural, utilizaremos el término
informe verbal para referirnos al uso de los informes de los sujetos en los experimentos psicológicos
(véase también el Capítulo 7). Estos también se denominan a veces informes subjetivos .
A pesar del éxito del conductismo en barrer con el enfoque estructural, el uso del informe
subjetivo ha mantenido su lugar en la psicología. De hecho, el uso del informe verbal está muy de
acuerdo con las reglas científicas de los conductistas, ya que los informes verbales son, por supuesto,
un comportamiento manifiesto. De hecho, Watson, el fundador del conductismo, lo afirma claramente
en una sección llamada “La plataforma del conductista” en Behaviorism:
El conductista pregunta: ¿Por qué no hacemos de lo que podemos observar el campo real de la
psicología? Limitémonos a las cosas que se pueden observar y formulemos leyes que se refieran
sólo a esas cosas. Ahora, ¿qué podemos observar? Podemos observar el comportamiento, lo
que el organismo hace o dice. Y señalemos de una vez: ese decir es hacer, es decir, comportarse.
Hablar abiertamente o para nosotros mismos (pensar) es un tipo de comportamiento tan objetivo
como el béisbol. (1925, p. 6; las cursivas son de Watson)
El uso del informe verbal, entonces, fue respaldado por el fundador del conductismo. Pero como
señaló Spence (1948), el uso del informe verbal es muy diferente para los psicólogos estructuralistas
y conductistas. Para los primeros, los informes introspectivos son hechos o datos sobre eventos
mentales internos que se piensa que reflejan directamente estos eventos. Para los conductistas, por
otro lado, los informes verbales son simplemente un tipo de comportamiento que puede valer la pena
estudiar como variable dependiente. Deben considerarse ni más ni menos valiosas o “reales” a priori
que cualquier otro tipo de respuesta o variable dependiente (ver Capítulo 7). Si uno quiere usar
informes verbales como evidencia para alguna construcción mental particular, deben ser considerados
como solo una de varias operaciones convergentes necesarias. Los informes verbales, por supuesto,
tienen más probabilidades de ser útiles en ciertas áreas de la psicología que en otras. La investigación
sobre el pensamiento es un área en la que se hace un uso extensivo de los informes verbales.
Un componente crítico en el pensamiento es la capacidad de evaluar el conocimiento propio.
Varios experimentos han explorado el fenómeno de la sensación de saber , primero estudiado
sistemáticamente por Hart (1965). Un experimento representativo es el de Freedman y Landauer
(1966). A los sujetos se les dio una larga serie de preguntas de conocimiento general (¿Cuál es la
capital de Ecuador? ¿Quién fue el quinto presidente de los Estados Unidos?) y se les pidió que
proporcionaran respuestas. Para cada pregunta para la que los sujetos no podían dar una respuesta,
se les pidió que calificaran en una escala de cuatro puntos qué tan seguros estaban de poder
reconocer la respuesta si se les presentaran alternativas similares. Los cuatro juicios fueron
"definitivamente sabe" la respuesta, "probablemente sabe", "probablemente no sabe" y "definitivamente
no sabe". Después de hacer estos juicios sobre la sensación de saber, se les volvieron a dar las
preguntas a los sujetos y se les pidió que eligieran la respuesta correcta entre seis alternativas.
Los sujetos reconocieron el 73 por ciento de los ítems que habían juzgado que definitivamente
sabrían, el 61 por ciento dijeron que probablemente sabrían, y el 51 por ciento y el 35 por ciento de
las respuestas a las preguntas pensaron que probablemente o definitivamente no sabían. saber. El
hecho de que las calificaciones se correlacionen generalmente con el rendimiento de reconocimiento
posterior puede tomarse como una indicación de que los sentimientos subjetivos de las personas
sobre lo que saben (después de una falla en la memoria) son bastante precisos. Otro
59533_12_ch11_p297-326.indd 316 9533_12_ch11_p297-326.indd 316 3/5/08 /5/08

Los experimentos han revelado un efecto de sensación de saber similar (por ejemplo, Koriat & Levy
Sadot, 2001; Schacter, 1983; pero ver Perfect & Hollins, 1999, para una excepción), y la investigación
reciente ha iluminado la actividad cerebral específica asociada con el sentimiento (Maril, Simons,
Mitchell, Schwartz y Schacter, 2003). Sin embargo, otra característica interesante de los datos es que
incluso cuando las personas estaban convencidas de que sabían la respuesta a una pregunta, solo
pudieron responder correctamente el 73 por ciento de las veces. Obviamente, la capacidad de
monitorear el estado del conocimiento de uno es bastante imperfecta. A menudo parecemos demasiado
confiados en que sabemos algo cuando en realidad no lo recordamos o al menos no podemos
recordarlo en el momento en que nos someten a la prueba.
Otros estudios que utilizan técnicas ligeramente diferentes han demostrado que las personas
tienen esta tendencia a confiar demasiado en sus conocimientos. Una técnica es pedir a las personas
que respondan preguntas con dos respuestas alternativas y luego pedirles que califiquen la probabilidad
de que las hayan respondido correctamente. Suponga que le dan el siguiente artículo: “Los pigmentos
biliares se acumulan como resultado de una condición conocida como (a) ictericia o (b) gangrena”.
Después de elegir la respuesta que creía que era correcta, se le pediría que estimara la probabilidad
de 0,50 a 1,00 de que de hecho sea correcta. (Dado que hay dos alternativas, 0,50 es probabilidad.)
Lichtenstein y Fischhoff (1977) informaron que aunque había una correlación general entre los juicios
de confianza y precisión, los sujetos generalmente tenían mucha más confianza de lo que justificaba
su conocimiento. Por ejemplo, para los elementos que los sujetos estimaron que responderían
correctamente el 80 por ciento de las veces, la precisión real fue solo del 70 por ciento. Este exceso de
confianza no parece ser el resultado de que los sujetos no tomen la tarea muy en serio, ya que otros
estudios han informado la misma tendencia incluso cuando los sujetos reciben instrucciones elaboradas
que enfatizan la precisión y cuando se les da la oportunidad de apostar en sus respuestas con el
posibilidad de perder dinero como resultado (Fischhoff, Slovic y Lichtenstein, 1977).
Estos estudios muestran que aunque los informes verbales de nuestro conocimiento fáctico están
generalmente correlacionados con ese conocimiento, de ninguna manera son reflejos perfectos de lo
que sabemos. Esto señala una deficiencia de los informes verbales retrospectivos de los procesos
cognitivos. Los caprichos de la memoria pueden producir un juicio inexacto o sesgado de lo que
pensamos mientras realizamos algún acto. Muchos factores (motivacionales, emocionales, sociales)
pueden disminuir la precisión de los informes verbales. De hecho, los investigadores en algunas áreas
han sido recelosos durante mucho tiempo de aceptar informes verbales al pie de la letra.
Nisbett y Wilson (1977) revisaron muchos experimentos que relacionaban los informes verbales
de los individuos con su comportamiento en situaciones experimentales y llegaron a la sorprendente
conclusión de que "puede haber poca o ninguna conciencia introspectiva directa de los procesos
cognitivos de orden superior" (p. 231). . Usaron muchas líneas de evidencia para llegar a esta
conclusión; un tipo general implica experimentos que comparan el rendimiento de las personas entre
diseños de sujetos. Se manipula alguna variable experimental y se demuestra que tiene una fuerte
influencia en el comportamiento; más tarde, se pregunta a los sujetos de los diferentes grupos por qué
respondieron de la forma en que lo hicieron. Si los sujetos son conscientes de las fuerzas que guían su
comportamiento, deberían reportar la infl uencia de la variable independiente como un determinante
crítico de su desempeño. En muchos casos revisados por Nisbett y Wilson, los sujetos no podían hacer
esto y, además, a menudo negaban que la variable independiente pudiera haberlos afectado, incluso
cuando el experimentador lo sugería como una posibilidad.
Nisbett y Wilson (1977) utilizaron dichos informes como base para su afirmación de que las
personas no tienen acceso introspectivo directo a los procesos cognitivos que median el comportamiento
Un corolario de esta posición parecería ser que los informes subjetivos son generalmente inexactos
como descripciones de eventos cognitivos. (Nisbett y Wilson argumentan que aun cuando
59533_12_ch11_p297-326.indd 317 9533_12_ch11_p297-326.indd 317 3/5/08 /5/08

tales informes son precisos, pueden basarse en conocimientos generales y no en algún conocimiento
especial de uno mismo). Otros argumentan que la posición de Nisbett y Wilson es demasiado extrema
(ver Ericsson y Simon, 1979; Smith y Miller, 1978). Sostienen que, bajo muchas condiciones, se
puede demostrar que las personas tienen un acceso generalmente preciso a sus estados mentales.
Después de todo, los estudios sobre la sensación de saber discutidos anteriormente mostraron que
los sujetos generalmente son precisos al juzgar si conocen información, incluso cuando no pueden
recordarla. Muchos de los estudios descritos por Nisbett y Wilson tenían características tales como
diseños entre sujetos e informes de los sujetos después de completar la tarea.
Los sujetos probablemente mostrarían una mayor conciencia si participaran en experimentos que
usaran diseños dentro de los sujetos, ya que estarían expuestos al rango completo de la variable
independiente. De manera similar, si se les pide a los sujetos que hagan informes durante la ejecución
real de una tarea (p. ej., informando en voz alta al experimentador), los informes podrían ser más
precisos. El uso de informes retrospectivos en lugar de los tomados "en línea" hace que los sujetos
confíen en la memoria falible; quizás sabían lo que estaban haciendo en el momento en que lo
estaban haciendo, pero luego olvidaron (o distorsionaron) sus razones.
Janet Metcalfe (1986) realizó un experimento en el que obtuvo dichos informes en línea. Metcalfe
se preguntó si las personas que intentan resolver cierto tipo de problemas experimentan premoniciones
de que se acercan a la solución o si la solución les llega de repente. Tenga en cuenta que esta
pregunta se relaciona con el tema del aprendizaje por prueba y error versus el aprendizaje intuitivo,
discutido al comienzo de este capítulo.
Metcalfe pidió a los sujetos que resolvieran una variedad de problemas, como anagramas (descifrar
las letras en palabras codificadas, como valert para viajar ) y otros acertijos. Mientras trabajaban en
los problemas, sonaba un clic cada 10 segundos; en cada clic, los sujetos calificaron qué tan cerca
creían que estaban de resolver el problema escribiendo un número del 0 al 10. Un 0 significaba que
estaban muy "fríos" y no tenían idea de cuál era la solución; los valores intermedios significaban que
sentían que se estaban “calentando”; y un 10 significaba que habían resuelto el problema, momento
en el que escribieron la solución.
Metcalfe razonó que si la resolución de problemas procede de forma gradual mediante ensayo
y error, las personas lograrán las soluciones paso a paso, y sus calificaciones de "sensación de
calidez" serán cada vez más altas a medida que se acerquen a la solución. Por otro lado, si las
personas resuelven problemas a través de una percepción repentina, entonces sus sentimientos de
calidez deben permanecer relativamente bajos y constantes durante los intervalos que preceden a la
solución y luego saltar a 10 cuando resuelven el problema. Finalmente, si las personas pueden
evaluar con precisión si están llegando a una solución correcta, entonces los juicios de "sensación de
calidez" deberían ser más altos antes de las respuestas correctas que de las respuestas incorrectas.
Para resumir, el experimento abordó dos preguntas interesantes. En primer lugar, ¿las personas
tienen la sensación subjetiva de que resuelven los problemas gradualmente o descubren las
respuestas en un instante? En segundo lugar, ¿tienen las personas premoniciones subjetivas precisas
de que están alcanzando con éxito la solución de un problema? Es decir, ¿saben cuándo su línea de
razonamiento conduce a una solución correcta?
Los resultados del experimento de Metcalfe fueron bastante interesantes. En primer lugar, las
calificaciones de "sentimientos de calidez" que dieron los sujetos tendieron a seguir un patrón de
percepción. Es decir, mientras intentaban resolver los problemas, los sujetos se sentían relativamente
“fríos” y no indicaban que se estaban calentando o acercando a la solución hasta el intervalo en el
que resolvieron el problema. Por lo tanto, para el tipo de problemas que utilizó, la gente tendía a
lograr las soluciones con percepciones bastante repentinas. Sin embargo, el resultado más
sorprendente fue que los juicios sobre la sensación de calidez de los sujetos eran muy inexactos. Es
decir, cuando los sujetos indicaron que pensaban que estaban muy cerca de una solución (es decir, su ca
59533_12_ch11_p297-326.indd 318 9533_12_ch11_p297-326.indd 318 3/5/08 /5/08

las calificaciones eran relativamente altas), en realidad era más probable que dieran una solución
incorrecta que correcta. Por lo tanto, el experimento de Metcalfe muestra que las intuiciones subjetivas
de las personas acerca de si resolverán un problema pueden no ser confiables. Una vez más, los
informes subjetivos deben interpretarse con cautela (véase también el Capítulo 7).
¿Dónde nos dejan todas estas consideraciones al evaluar el uso de informes verbales subjetivos
como herramienta de investigación? Aunque el tema es complejo, podemos aventurar algunas
afirmaciones resumidas. En primer lugar, probablemente no sea prudente en muchos casos poner
demasiado énfasis en los informes verbales usándolos, por ejemplo, como la única medida dependiente
en un experimento. Algunos psicólogos han sugerido que para experimentos que podrían ser poco
prácticos o poco éticos, los investigadores deberían describir el procedimiento y varias condiciones a los
sujetos y pedirles que digan cómo reaccionarían (p. ej., Brown, 1962; Kelman, 1966). Sin embargo, la
suposición de que las predicciones de uno durante el juego de roles siempre (o incluso generalmente)
reflejan con precisión cómo se comportará uno cuando se encuentre en una situación real parece
arriesgado. En segundo lugar, los informes verbales pueden muy bien ser útiles en algunas situaciones,
pero un investigador tendrá que analizar cada situación con cuidado para determinar el potencial de error
al usar informes verbales. La mayoría de los investigadores consideran los informes subjetivos como
fuentes adicionales útiles de información en los experimentos, pero no como la principal variable
dependiente de interés. Sin embargo, Ericsson y Simon (1979) detallan las condiciones bajo las cuales
creen que los informes verbales pueden servir como datos primarios. Finalmente, creemos que los
informes verbales pueden servir como medidas dependientes interesantes, ya sea que tales informes
reflejen con precisión los estados cognitivos del individuo o no. Incluso si Nisbett y Wilson tienen razón
al afirmar que las personas tienen poca o ninguna conciencia introspectiva precisa de las causas de su
comportamiento, el estudio de las creencias y los informes de las personas sobre esas causas sería de
interés en sí mismo.

LA TUERCAS Y PERNOS
Incubación de problemas en la resolución de problemas
Muchos escritores sobre el tema del pensamiento y la resolución de problemas han descrito un proceso
bastante misterioso que parece ayudar en la resolución de problemas. Considere el siguiente relato del
matemático francés Henri Poincaré. (Los términos matemáticos de la cita no deben desanimarlo;
simplemente examine el pasaje para conocer el principio psicológico involucrado).
Justo en ese momento dejé Caen, donde vivía entonces, para emprender una excursión
geológica bajo los auspicios de la escuela de minas. Los cambios de viaje me hicieron olvidar
mi trabajo matemático. Habiendo llegado a Coutances, subimos a un ómnibus para ir a un
lugar u otro. En el momento en que puse el pie en el peldaño me vino la idea, sin que nada en
mis pensamientos anteriores pareciera haberme allanado el camino, que las transformaciones
que había utilizado para definir las funciones de Fuchsian eran idénticas a las de geometría
no euclidiana. No verifiqué la idea; No tendría tiempo, pues al tomar asiento en el ómnibus
continué con una conversación ya iniciada, pero sentí una certeza perfecta. A mi regreso a
Caen, por motivos de conciencia, verifiqué el resultado en mi tiempo libre.
59533_12_ch11_p297-326.indd 319 9533_12_ch11_p297-326.indd 319 3/5/08 /5/08

Luego dirigí mi atención al estudio de algunas cuestiones aritméticas
aparentemente sin mucho éxito y sin sospechar mi conexión con mis
investigaciones precedentes. Disgustado por mi fracaso, fui a pasar unos días
a la playa y pensé en otra cosa. Una mañana, paseando por el risco, se me
ocurrió, con las mismas características de brevedad, brusquedad y certeza
inmediata, la idea de que las transformaciones aritméticas de formas
cuadráticas ternarias indeterminadas eran idénticas a las de la geometría no
euclidiana. . . .
Me limitaré a este único ejemplo; es inútil multiplicarlos.

En cuanto a mis otras investigaciones tendría que decir cosas análogas. . . .
Lo más sorprendente al principio es esta apariencia de iluminación

repentina, un signo manifiesto de un trabajo anterior largo e inconsciente. El
papel de este trabajo inconsciente en la invención matemática me parece indiscutible.
(Poincaré, 1929, p. 388)
Hay muchos informes de experiencias similares de escritores, matemáticos y científicos.

Koestler (1964) citó varios ejemplos de un problema que se resolvió en un destello
repentino de iluminación después de que todo el progreso aparente había cesado y, de
hecho, el solucionador se había centrado en otros asuntos. (Recuerde la apariencia
similar en los chimpancés de Köhler.) Pero, ¿qué vamos a hacer con estos informes?
¿Cómo se van a evaluar? ¿Podemos aceptarlos como evidencia útil sobre la naturaleza
del pensamiento? Si es así, aparentemente la búsqueda de soluciones a los problemas
puede continuar sin una atención consciente; la mente puede esforzarse inexorablemente
por resolver un problema sin ninguna dirección consciente por parte de su dueño.
Es poco probable que estos informes convenzan a los psicólogos experimentales

de que tal proceso es fundamental para el pensamiento, en lugar de representar un
accidente más o menos raro y curioso. En cambio, es probable que consideren dichos
informes como hipótesis que necesitan pruebas experimentales. Sobre la base de sus
propias intuiciones, Pioncaré delineó cuatro etapas en el proceso de pensamiento.
Primero está la preparación, durante la cual una persona se sumerge en tratar de
resolver un problema y aprende los numerosos hechos y consideraciones relevantes.
El segundo es la incubación, durante la cual una persona se vuelve hacia otros asuntos
después de no poder resolver el problema. Se dice que el problema se incuba, como lo
hacen los huevos mientras una gallina se sienta sobre ellos. (La misma idea se expresa
cuando dices "Déjame dormir sobre eso".) Luego viene la etapa de iluminación (que
Köhler llama introspección), cuando la idea nace. Finalmente viene la etapa de
verificación, cuando la solución al problema debe ser revisada cuidadosamente. Estas
etapas se identificaron sobre la base de la intuición y, por lo tanto, solo se les han dado defi
Aunque Poincaré recopiló muchos casos que parecían confirmar su teoría de la
resolución de problemas, y en particular el proceso de incubación, como todos sabemos,
se pueden encontrar uno o dos ejemplos para respaldar casi cualquier idea o teoría, sin
importar cuán tonta sea. Y seguro que podemos encontrar muchos contraejemplos en
los que los problemas se resuelven sin incubación ni iluminación repentina.
En lugar de proporcionar anécdotas, debemos someter el concepto de incubación a
pruebas experimentales.
59533_12_ch11_p297-326.indd 320 9533_12_ch11_p297-326.indd 320 3/5/08 /5/08

Problema ¿Podemos encontrar evidencia para el concepto de incubación?
En la actualidad, este concepto es bastante confuso. Necesitamos darle una definición

operativa más precisa, para que sepamos exactamente lo que estamos buscando.
Examinemos una definición de Posner (1973): “La incubación se refiere a un aumento
en la probabilidad de resolver con éxito un problema que resulta de colocar un retraso
entre el período de trabajo intenso que inicia la solución del problema y otro período de
esfuerzo consciente que finaliza la solución” (p. 171).
Esto es algo preciso, pero aún deben especificarse varios puntos. De hecho, es una defi
nición operativa bastante curiosa, ya que ni siquiera sabemos si el fenómeno definido
existe en este punto. Lo que hemos hecho, en realidad, es sugerir una definición
operacional hipotética que pueda servir como hipótesis de un experimento en busca del
concepto.
Hipótesis Los sujetos a los que se les permite un descanso entre dos períodos de trabajo para
resolver un problema tendrán más probabilidades de encontrar finalmente una solución (o de
encontrar una más rápido) que los sujetos a los que no se les proporcionó un descanso.
Además, cuanto más larga sea la pausa, más probable es que los sujetos encuentren
la solución (y más rápido), al menos hasta cierto límite.
Quedan, como siempre, una serie de consideraciones a las que debemos dirigir
nuestra atención. ¿Cuánto tiempo debemos permitir que los sujetos resuelvan el
problema? Podrían ser apropiados dos períodos de 15 minutos, o un total de 30 minutos.
La variable independiente primaria es el retraso que se va a introducir entre los dos
periodos de trabajo sobre el problema. Como mínimo, querríamos tres condiciones
independientes, por lo que los retrasos apropiados podrían ser de 0, 15 o 30 minutos
entre los dos períodos de trabajo. (También podrían ser apropiadas más condiciones
con una gama más amplia de intervalos de demora). El experimento probablemente
debería emplear un diseño entre sujetos, ya que la cantidad de tiempo requerida para
que los sujetos cumplan las tres condiciones sería prohibitiva. El número de sujetos a
servir en cada condición dependería de los recursos disponibles pero debería ser el
mayor posible. Un mínimo de 20 puede ser suficiente, pero el poder de las pruebas
estadísticas basadas en una muestra tan pequeña no sería muy grande. Sería mucho
mejor tener 75 o 100 sujetos por condición. Dado que se podrían evaluar grupos de
sujetos en lugar de individuos, la cantidad de esfuerzo en evaluar a 300 sujetos no sería
prohibitivo, si hubiera tanta gente disponible. La duración de todo el procedimiento
variaría desde quizás 45 minutos en la condición de retraso cero hasta 75 minutos en la
condición de retraso de 30 minutos.
Otra consideración importante es el tipo de problema a utilizar. Probablemente sería

mejor evaluar a los sujetos en las tres condiciones en más de un problema para
asegurarse de que el fenómeno, si se encuentra, no sea específico de un solo problema.
Si se usaran 75 sujetos en cada condición, se podrían evaluar 25 en cada uno de los
tres problemas. Sería necesario probar previamente los problemas en sujetos similares
a los que se usarán en el experimento para garantizar que (1) muy pocos sujetos puedan
resolver los problemas en 15 minutos, o antes de que se introduzca la variable
independiente; y (2) alrededor de la mitad (al menos) podría resolver el problema en 30
minutos sin demora. El último requisito es para protegerse contra los efectos de piso, o
un rendimiento demasiado bajo para permitir la manipulación.
59533_12_ch11_p297-326.indd 321 9533_12_ch11_p297-326.indd 321 3/5/08 /5/08

de la variable independiente para revelar cualquier efecto. Un ejemplo de problema podría ser
el siguiente:
Un hombre tenía cuatro cadenas, cada una de tres eslabones. Quería unir las cuatro
cadenas en una sola cadena cerrada. Tener un enlace abierto cuesta 2 centavos y
tener un enlace cerrado cuesta 3 centavos. El hombre tenía sus cadenas unidas en
una cadena cerrada por 15 centavos. ¿Cómo lo hizo?
Otra consideración es lo que deberían estar haciendo los sujetos durante los intervalos de
demora. No se les debe permitir simplemente sentarse allí y reflexionar sobre el problema, ya
que entonces esencialmente no se les da ningún retraso. Los sujetos deben estar ocupados
con problemas de aritmética mental o similares; incluso podría ser prudente hacerles creer, al
comienzo de la pausa, que van a pasar a una nueva fase del experimento y que no volverán
al problema que no lograron resolver. Esto aseguraría que los sujetos no estén tratando de
prestar atención al problema mientras trabajan en la actividad de relleno.
Las medidas dependientes primarias serían el porcentaje de sujetos en cada condición

que resolvieron el problema y la cantidad de tiempo que les llevó hacerlo. Si los problemas se
seleccionaron con el cuidado suficiente para que hubiera varias soluciones, también podría
evaluarse la calidad de las soluciones. Incluso si los problemas no tuvieran esta característica,
se les podría pedir a los sujetos al final del segundo período de 15 minutos que escribieran
cómo estaban tratando de resolver el problema, y se podría evaluar la calidad de estos
intentos para ver si difieren. Las condiciones ent afectaron la calidad de los intentos de
solución terminal. Las evaluaciones, por supuesto, deben ser realizadas por alguien que no
conozca las condiciones de los sujetos (es decir, alguien que sea ciego con respecto a las
condiciones).
Estos son los elementos esenciales, entonces, para un experimento de incubación. Las
predicciones son que los sujetos que experimentan un retraso entre los dos períodos de 15
minutos de trabajo en el problema resolverán el problema con mayor frecuencia (y lo harán
más rápido) que los sujetos que trabajan en el problema continuamente durante 30 minutos.
Además, los sujetos que tienen un descanso de 30 minutos deberían lograr una solución más
a menudo (y hacerlo más rápido) que aquellos que tienen un descanso más corto de 15
minutos.
Experimentos como este pueden hacer contribuciones reales a la comprensión de la
incubación. Quizá la mejor evidencia a favor de la incubación proviene de una tesis doctoral
de Silveira (1971), que es una versión algo más complicada del tipo de experimento que
acabamos de esbozar aquí. Se discute brevemente en el libro de Posner (1973, pp. 169-175).
Los experimentos publicados arrojan resultados mixtos.
Olton y Johnson (1976) no pudieron encontrar ninguna evidencia de incubación, mientras que
los datos de Steve Smith respaldan los efectos de la incubación (p. ej., véase Smith &
Blankenship, 1989; Smith & Blankenship, 1991; Smith, 1995).
Si el fenómeno de la incubación se ha establecido experimentalmente, este es solo el
comienzo de nuestros intentos por comprenderlo. ¿Qué factores infl uyen en la incubación?
¿Qué tipo de teoría psicológica podría explicarlo? Decir que es causado por “procesos de
pensamiento inconscientes” es tan malo como no decir nada. En realidad, podría ser incluso
peor, ya que da la ilusión de dar una explicación cuando, en realidad, no hace nada por el
estilo. ¿Puedes pensar en hipótesis explícitas y comprobables que puedan explicar la
incubación? Este es el camino que debemos tomar para siquiera comenzar a comprender el
fenómeno.
59533_12_ch11_p297-326.indd 322 9533_12_ch11_p297-326.indd 322 3/5/08 /5/08

(Por cierto, la solución al problema de la cadena es que el hombre abrió todos los eslabones de una
de las cadenas, tres se abrieron a 2 centavos cada uno, a 6 centavos, y luego usó los tres bucles
abiertos para unir las tres cadenas restantes. —tres cerrados a 3 centavos cada uno, por 9 centavos.)
ÿ RESUMEN
1. Los estudios de procesos psicológicos complejos, como el repita el experimento lo más exactamente posible para ver si
pensamiento y la resolución de problemas, tienen problemas se obtienen los mismos resultados un segundo
especiales en términos de confiabilidad de los resultados y segunda vez Las replicaciones sistemáticas implican cambiar
control experimental. Un problema principal tiene que ver con variables que no se consideran críticas para el fenómeno bajo
la variabilidad relativamente grande que es probable que consideración para asegurarse de que sobreviva.
ocurra en las observaciones bajo diferentes condiciones tales cambios. Las réplicas conceptuales intentan demostrar
experimentales. Las diferencias individuales que muestran las el fenómeno con un paradigma o conjunto de condiciones
personas al realizar una tarea compleja, como resolver un experimentales completamente nuevo.
problema, tienden a ser mucho mayores que al realizar tareas 5. Las réplicas sistemáticas y conceptuales también abordan la
más simples. generalidad de los resultados. ¿Se generalizan los resultados
2. En experimentos complejos, a menudo es necesario utilizar de un experimento a través de los cambios más bien leves en
diseños entre sujetos, en los que un grupo independiente de el procedimiento de las réplicas sistemáticas y los mayores
sujetos sirve en cada condición experimental. cambios en el procedimiento de las réplicas conceptuales? A
Desafortunadamente, es posible un menor control sobre la menudo, los avances en la comprensión de un fenómeno
varianza introducida por las diferencias entre sujetos que en mejoran cuando los investigadores pueden encontrar condicione
los diseños dentro de los sujetos. Una solución parcial a estos que el fenómeno no se replica. Cuando se establecen tales
problemas es obtener tantas observaciones por condición condiciones límite y el investigador comprende qué factores
como sea posible para producir resultados estables y controlar controlan la presencia o ausencia del fenómeno, se pueden
tan estrictamente como sea posible todas las variables construir mejores teorías.
extrañas, para que no aumenten la variabilidad dentro de las
condiciones. 6. Los informes subjetivos son informes verbales sobre la
3. La confiabilidad de los resultados de un solo experimento puede conciencia de las personas sobre sus procesos cognitivos. A
evaluarse a través de la lógica de la inferencia estadística veces se utilizan en el estudio del pensamiento, pero se debe
mediante el empleo de pruebas estadísticas apropiadas. tener precaución. En algunos casos, las personas confían
Estas pruebas nos permiten evaluar qué tan probable es que demasiado en los juicios sobre su conocimiento. En
el efecto de alguna variable experimental sea realmente experimentos sobre varios juicios complejos, las personas
causado por la operación de esa variable y no por factores proporcionaron impresiones subjetivas erróneas con respecto
aleatorios (casuales). a la infl uencia de variables particulares que demostraron
4. La confiabilidad experimental, que muchos psicólogos prefieren controlar realmente su comportamiento. Los informes verbales
a la confiabilidad estadística, se refiere a la replicabilidad real a veces son útiles en la investigación psicológica, pero es
de los experimentos. Se identifican tres tipos. En las réplicas probable que su confiabilidad varíe según el tema que se
directas, el intento es estudie.
ÿ TÉRMINOS CLAVE
analogía sesgo de confirmación

condiciones de borde replicación directa
Efecto techo controles experimentales
replicación conceptual confiabilidad experimental
59533_12_ch11_p297-326.indd 323 9533_12_ch11_p297-326.indd 323 3/5/08 /5/08

variables extrañas energía
sentimiento de saber preparación
efectos de piso fiabilidad de los resultados
fi jeza funcional fiabilidad estadística
generalidad de los resultados consistencia estructural
iluminación informe subjetivo
incubación replicación sistemática
latencia de pensamiento
conocimiento informe oral

ley del efecto verificación
cartografía Tarea de selección de tarjeta Wason
hipótesis nula
1. Un investigador del departamento de biología de su universidad ción), le preguntamos al experimentador cuántas de las ratas
acaba de demostrar la percepción extrasensorial (ESP) en puntuaron por debajo del azar en un 10 por ciento o más.
ratas. Las ratas se colocaron en un laberinto, donde debían El investigador informa que tres lo hicieron y dice estar fascinado
elegir entre dos posibles caminos, uno de los cuales conducía a por este descubrimiento, que parece indicar que algunas ratas
la comida. Las ratas no podían ver ni oler la comida en el lugar tienen una “percepción extrasensorial negativa”. ¿Qué concluye
del laberinto donde tenían que tomar su decisión, y la pista en usted, como observador desapasionado, acerca de estas
la que el experimentador colocaba la comida variaba afirmaciones?
aleatoriamente de una prueba a otra. A lo largo de una serie de 3. Distinguir entre réplicas directas, réplicas sistemáticas y réplicas
50 pruebas, el investigador encontró que había 2 ratas de 100 conceptuales. ¿Deberían considerarse los tres tipos
probadas que parecían funcionar mejor de lo que cabría esperar cualitativamente diferentes, o se encuentran en un continuo? Si
sobre la base del azar. se encuentran en un continuo, ¿qué dimensión subyace?
Uno escogió la pista correcta el 64 por ciento de las veces; el 4. El sistema de recompensas en la ciencia desalienta las réplicas
otro lo eligió el 66 por ciento de las veces (con una probabilidad del trabajo de otras personas. Los investigadores son mucho
del 50 por ciento). ¿Cuál de las dos pruebas siguientes sería más recompensados por contribuciones novedosas que por
más convincente para usted como confirmación de que estas “simplemente repitiendo” el trabajo de otros. Algunos han
ratas tienen PES? una. El investigador realiza pruebas argumentado que este sistema de recompensas tiende a crear
estadísticas que muestran que las dos ratas se habían fragmentación y desorden en muchas áreas de la psicología,
desempeñado mejor que el azar al tomar sus decisiones; o porque las personas son recompensadas por seguir su propio
camino y (a veces) ignorar el progreso en otras áreas
b. un investigador diferente prueba las dos ratas en sev estrechamente relacionadas. Por lo tanto, los fenómenos
eral cien ensayos más y tiene éxito en básicos a menudo no se replicarán. ¿Cree que la replicación
replicando los hallazgos del primer investigador. debería fomentarse con más fuerza? ¿Si es así, cómo?
Defiende tu elección. Si usted fuera el segundo investigador,
5. Muchas revistas psicológicas alientan a los investigadores
¿qué salvaguardas introduciría en el experimento para
a informar sobre una serie de experimentos sobre algún
asegurarse de que las ratas no usaran señales sensoriales para
fenómeno en lugar de un solo experimento. ¿Crees que
resolver el problema (suponiendo que las ratas se desempeñaron
es buena idea? Si es así, ¿por qué? ¿Qué peligros podrían
nuevamente por encima del azar)?
ser inherentes al requerir que los informes de investigación
2. Después de ver los resultados del primer experimento (es decir,
contengan numerosos experimentos?
2 de cada 100 ratas aparentemente puntuaron mejor que el
azar en la prueba de percepción extrasensorial).
59533_12_ch11_p297-326.indd 324 9533_12_ch11_p297-326.indd 324 3/5/08 /5/08

6. Es probable que los informes verbales sean más útiles b. Estudiando el comportamiento sexual de estudiantes universitarios.
en algunas áreas de la psicología que en otras. Para C. Estudiar los procesos mentales de las personas que ocurren
cada uno de los siguientes temas, discuta las ventajas y cuando deciden comprar un producto en lugar de otro.
desventajas de usar informes verbales. Para aquellos
casos en los que crea que no se pueden utilizar informes d. Estudiar las razones por las que a una persona le gusta un
verbales, sugiera mejores métodos: otro
una. Estudiar estrategias mediante las cuales las personas mi. Estudiar qué factores afectan a las ilusiones visuales
recuerdan sus experiencias de la infancia cuando se les pide
que lo hagan.
CONEXIONES WEB
El siguiente sitio web tiene enlaces a muchos acertijos clásicos de resolución de problemas, incluido
el dilema del prisionero:
http://www.psychnet-uk.com/games/games.htm
El siguiente sitio web tiene enlaces a diferentes demostraciones y estudios de resolución de problemas:
http://psych.hanover.edu/research/exponnet.html#Cognición
Sesgo de confirmación
Considere el siguiente problema: Cada una de las siguientes tarjetas tiene dos caras; por un lado hay
una letra y por el otro un número. Tu tarea es averiguar qué cartas deben darse vuelta para probar la
siguiente regla: "Si una carta tiene una vocal en un lado, tiene un número par en el otro".
A GRAMO 4 7
¿Qué tarjeta(s) eligió? La mayoría de las personas eligen solo la carta A o las cartas A y 4. Pero en
realidad, debe seleccionar las cartas A y 7, ya que ambas cartas le permitirán refutar la hipótesis (si
el 7 tiene una vocal en el otro lado, o si la carta A se convierte en un número impar, entonces la regla
debe ser falsa (la verificación de la carta 4 solo le permitirá confirmar la hipótesis). Esta tarea es la
clásica Tarea de Selección de Cartas de Wason (p. ej., Wason, 1968), y el sesgo de confirmación
es el nombre que se le da a la tendencia de las personas a buscar evidencia que respalde su hipótesis.
A las personas les va mejor en esta tarea cuando la tarea se conceptualiza dentro de un dominio
más familiar; por ejemplo, saben qué cartas dar la vuelta para probar la regla: “para beber alcohol hay
que tener al menos 21 años” (una carta tiene una edad por un lado y una bebida por el otro).
59533_12_ch11_p297-326.indd 325 9533_12_ch11_p297-326.indd 325 3/5/08 /5/08

refresco de cerveza 21 dieciséis
Ahora, la gente no se molesta en revisar las bebidas de los jóvenes de 21 años (porque no
importa para la regla); saben que necesitan ver qué edad tienen los bebedores de cerveza y
qué beben los de 16 años (p. ej., Ahn y Graham, 1999; Cox y Griggs, 1982).
Pruebe estos problemas con sus amigos. Podría considerar hacer una variación de los
estudios de Gick y Holyoak descritos anteriormente: si sus amigos hacen primero la versión
de cerveza más fácil, ¿es más probable que resuelvan la versión tradicional? Si no, ¿les ayuda
una pista a transferir sus conocimientos? ÿ
59533_12_ch11_p297-326.indd 326 9533_12_ch11_p297-326.indd 326 3/5/08 /5/08

CAPÍTULO 12
INDIVIDUAL
DIFERENCIAS
Y
DESARROLLO
ENFOQUES DE LAS DIFERENCIAS INDIVIDUALES
Enfoques metodológicos de las diferencias individuales
Variables que conducen a las diferencias individuales

ILUSTRACIONES
Confiabilidad de las medidas: inteligencia e investigación del desarrollo
diseños

ILUSTRACIONES
Definiciones operativas: inteligencia

ILUSTRACIONES
Artefactos de regresión: evaluación educativa

¿Qué roles juegan la motivación y la emoción en el desempeño
intelectual?
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: UNA DEMOSTRACIÓN
DE ARTEFACTOS DE REGRESIÓN
327
59533_13_ch12_p327-357.indd 327 9533_13_ch12_p327-357.indd 327 3/5/08 /5/08

Teóricamente, podemos distinguir entre aprendizaje y crecimiento, pero en la práctica son
inseparables: no hay comportamiento que sea independiente de la herencia del animal, o
de su crecimiento hasta la madurez, o del entorno que lo sustenta; y ningún comportamiento
superior que no esté influido por el aprendizaje. [DONALD HEBB]
Cuando Balamural Krishna Ambati era estudiante de pregrado en medicina, disfrutaba del ajedrez,
el baloncesto y varios tipos de investigación biológica. ¿Qué lo distinguió de otros estudiantes
universitarios? Bueno, por un lado, tenía 13 años cuando completó su programa de pregrado. Por otro
lado, esperaba convertirse en el graduado más joven de una facultad de medicina. Bala, como se le
llama, es un niño prodigio que dominó el cálculo a los 4 años.
Su promedio de calificaciones y los puntajes de sus exámenes indicaron que debería graduarse de la
escuela de medicina antes de cumplir dieciocho años (Stanley, 1990), y lo hizo a los 17 años en 1995
(Baker, 2006). Cuando comenzó su carrera médica a los 24 años, era demasiado joven para alquilar
un automóvil (Baker, 2006).
Claramente, Bala es diferente de la mayoría de los médicos, quienes podrían comenzar la escuela
de medicina a los 22 años y finalmente terminar a mediados de los 20. ¿Por qué Bala estaba tan por
delante de la típica persona que ingresa a la profesión médica? ¿Cómo y por qué se desarrolló tan
rápido que fue a la escuela con estudiantes mucho mayores que él? Este tipo de preguntas son
abordadas por psicólogos interesados en las diferencias y el desarrollo individuales. En este capítulo,
examinamos algunas cuestiones metodológicas relevantes para llevar a cabo una investigación sobre
cómo se diferencian y se desarrollan las personas.
El estudio de las diferencias individuales comenzó debido a importantes decisiones prácticas que
debían tomarse sobre las personas, pero es un tema que ha sido mayormente ignorado por los
psicólogos experimentales, quienes están interesados principalmente en encontrar leyes generales y
explicaciones para el comportamiento. Los psicólogos que emplean métodos experimentales apenas
están comenzando a investigar las diferencias individuales, aunque durante mucho tiempo ha sido un
tema de preocupación para los psicólogos con intereses más prácticos y aplicados.
La investigación experimental de las diferencias individuales ilustra la necesidad de fiabilidad de

las medidas de las características individuales. Si las decisiones de los individuos relativas a la acción
futura deben basarse en sus habilidades mentales, intereses y formas particulares de responder a los
eventos, entonces las medidas de estos factores deben arrojar resultados similares en diferentes
ocasiones de prueba. Además, las características que interesan a un psicólogo deben definirse de
manera que puedan comunicarse a los demás. Sería irrazonable esperar medidas consistentes de
inteligencia si todos los que la miden usaran una definición diferente de inteligencia. El tipo de definición
más útil, porque es el más fácil de comunicar, describe un procedimiento para producir y medir la
característica de interés. Estos procedimientos se denominan definiciones operativas y son un
componente necesario de toda investigación. Un uso de las definiciones operativas es separar a las
personas en clases o categorías sobre la base de las definiciones, para que los investigadores puedan
estudiar estas clases de personas en entornos experimentales. Cuando las personas se clasifican de
esta manera, las variables se denominan variables de sujeto. Ejemplos de variables del sujeto son la
edad, la inteligencia, el sexo, el grado de neuroticismo o cualquier característica de las personas que
se pueda especificar con precisión. La edad es una variable sujeto de particular interés para el
desarrollo.
59533_13_ch12_p327-357.indd 328 9533_13_ch12_p327-357.indd 328 3/5/08 /5/08

psicólogos, que estudian los cambios en el comportamiento a lo largo de la vida. Más adelante en el capítulo,
consideramos los problemas asociados con el estudio de los cambios relacionados con la edad.
Una vez que un investigador ha definido operativamente una característica individual y ha encontrado que la
medida es confiable, puede desear cambiar esa característica a través de algún tipo de experiencia de aprendizaje.
Uno de los riesgos de interpretar tal cambio se conoce como regresión a la media, lo que puede llevar a un
investigador a creer que se ha producido un cambio cuando, de hecho, no es así, o viceversa. En este capítulo,
analizamos la confiabilidad, las definiciones operativas, las variables del sujeto y la regresión en el contexto de la
investigación sobre las diferencias y el desarrollo individuales.
ÿ ENFOQUES DE LAS DIFERENCIAS INDIVIDUALES

Una cuestión general en la ciencia, y particularmente en la psicología de las diferencias individuales, se refiere a
qué métodos y teorías permiten predecir mejor los eventos futuros. Históricamente, el estudio de las diferencias
individuales se ha caracterizado por el debate sobre las formas apropiadas de entender cómo difieren las personas
y, por lo tanto, cómo se puede predecir su comportamiento futuro.
Enfoques metodológicos de las diferencias individuales

Un conjunto de problemas involucra los métodos utilizados para derivar predicciones. Dos métodos para abordar
el problema son el empírico y el analítico, que son equivalentes a los enfoques inductivo y deductivo discutidos en
el Capítulo 1. El enfoque empírico tiene como objetivo lograr el mayor grado de precisión predictiva posible por
cualquier medio disponible. Esto a menudo implica la búsqueda de una combinación de medidas que prediga los
eventos en cuestión. La prueba de inteligencia tradicional que se aplica a los escolares es un ejemplo de este
enfoque de la predicción. A principios del siglo pasado, el gobierno francés encargó a Alfred Binet y Theodore
Simon que diseñaran pruebas que determinaran qué niños podrían y cuáles no beneficiarse de la educación. Así,
el propósito original de las pruebas de inteligencia (y el principal en la actualidad) era predecir el rendimiento
escolar. Binet y Simon razonaron que a medida que se desarrollan los niños normales, deberían ser capaces de
manejar problemas más difíciles. Se cree que los niños más pequeños que responden bien a las preguntas
diseñadas para los mayores son inteligentes, y aquellos que no se desempeñan a la altura de su edad se
consideran menos inteligentes que el promedio. Binet y Simon emplearon pruebas de memoria, comprensión,
atención y similares. Definieron operativamente (ver Capítulo 6) la inteligencia como la capacidad de tener éxito en
la escuela, y un predictor de este éxito fue la puntuación del niño en las pruebas que construyeron.
Las pruebas de inteligencia se hicieron muy populares porque cumplen el importante objetivo de determinar
qué niños se beneficiarán de qué tipo de educación. Las correlaciones entre la inteligencia y las medidas de éxito
académico generalmente se encuentran en torno a 0,60. Cuando una prueba predice bien el comportamiento de
un criterio, se dice que tiene validez predictiva (a veces llamada validez de criterio). Además de la validez
predictiva, las pruebas pueden tener una validez aparente considerable, lo que significa que parecen medir algo
que la mayoría de la gente estaría dispuesta a llamar inteligencia. Esto ocurre cuando el éxito en la escuela se
predice mejor mediante elementos de prueba que parecen medir la capacidad mental que mediante pruebas que
miden alguna capacidad que no está relacionada con lo académico, como la destreza.
59533_13_ch12_p327-357.indd 329 9533_13_ch12_p327-357.indd 329 3/5/08 /5/08

en el tiro al billar. Saber lo que funciona en la ciencia a menudo conduce a una mejor comprensión
de cómo y por qué funciona algo. Por esta razón, las soluciones empíricas a problemas específicos a
menudo preceden a la comprensión teórica y analítica de esos problemas.
Un enfoque analítico para medir la inteligencia implica un análisis teórico de lo que produce los
efectos que atribuimos a la inteligencia. Una vez que hemos analizado los componentes del concepto,
podemos medirlos. En el siglo XIX, Sir Francis Galton creía que la capacidad de formar imágenes
mentales y la capacidad de responder rápidamente a un estímulo eran componentes de una gran
inteligencia. Cuando comparó estas habilidades en científicos y estadistas con las de los trabajadores
comunes, se sorprendió al no encontrar diferencias. Concluyó que estas habilidades no contribuyen
en gran medida a la inteligencia, contrariamente a su propia opinión y la de otros.
Los investigadores contemporáneos han tenido más éxito al descomponer la inteligencia en sus
componentes (Gardner, 1983; Hunt & Lansman, 1975; Sternberg, 1988). Sin embargo, todavía
estamos a cierta distancia de poder predecir el rendimiento escolar así como las pruebas de
inteligencia de los empiristas. Los enfoques analítico y teórico se ven mejor como complementarios
que antagónicos, que es la forma en que Jean Piaget, el eminente psicólogo del desarrollo, intentó
comprender el desarrollo intelectual.
Piaget (1932) pasó muchos años observando niños (principalmente los suyos). A partir de las
regularidades empíricas que observó en el desarrollo cognitivo y social, Piaget desarrolló una teoría
integral del desarrollo (Piaget e Inhelder, 1969). La teoría, a su vez, se convirtió en la fuerza rectora
detrás de una parte sustancial de la investigación en psicología del desarrollo. Como señalamos en el
Capítulo 1, los científicos individuales pueden enfocarse en un enfoque particular hacia la comprensión;
sin embargo, una combinación de trabajo empírico y analítico conducirá mejor al progreso científico.
Variables que conducen a las diferencias individuales
Un segundo conjunto de cuestiones que subyacen al estudio de las diferencias individuales se refiere
a las variables básicas que conducen a ellas. Al igual que en el estudio de la percepción (véase el
Capítulo 7), algunos investigadores han defendido una base nativista (naturaleza) para las diferencias
individuales, mientras que otros han propuesto una base empírica (crianza). Este contraste naturaleza-
crianza es antiguo en psicología (Schultz & Schultz, 1987), y todavía está vivo con mucha controversia.
Según la teoría de la naturaleza, las diferencias genéticas subyacen a las diferencias
individuales. Un estudio reciente de Herrnstein y Murray (1994), The Bell Curve, ilustra una teoría de
la heredabilidad de la inteligencia. En particular, Herrnstein y Murray argumentan que existe un “factor
genético en las diferencias étnicas cognitivas” (p. 270), que explica las diferencias de inteligencia
entre negros y blancos, así como otras diferencias de grupos étnicos. Varios científicos (Fraser, 1995;
Sternberg, 1995) han socavado enérgicamente su propuesta y algunas de sus implicaciones, y Nisbett
(1995) señaló que mucha evidencia se opone a la opinión de Herrnstein y Murray de que las
diferencias entre blancos y negros en las puntuaciones de las pruebas de inteligencia tienen una base
genética.
Una visión nutritiva de las diferencias individuales se centra en los factores experienciales que
infl uyen en cómo se desarrollan los organismos. Ericsson, Krampe y Tesch-Romer (1993) desarrollaron
un ejemplo de este tipo de propuesta para explicar las diferencias en las habilidades de violinistas y
pianistas. Contrariamente a la opinión generalizada de Galton (1869/1979) de que el genio es
hereditario, Ericsson y asociados presentan una variedad de pruebas para demostrar que la calidad
de la maestría musical es una función de la cantidad y
59533_13_ch12_p327-357.indd 330 9533_13_ch12_p327-357.indd 330 3/5/08 /5/08

calidad de la práctica. Argumentan que la práctica extensiva durante al menos 10 años es el
principal contribuyente a la habilidad musical.
Como ocurre con otros puntos de vista dicotómicos que hemos examinado, es probable que
ninguno de los polos por sí solo revele el estado correcto de las cosas. Hebb ha defendido
durante mucho tiempo un análisis más sofisticado de los efectos de la naturaleza y la crianza en
el comportamiento (p. ej., Hebb y Donderi, 1987). Señala que los efectos de la herencia deben
tener lugar en algún tipo de entorno, lo que significa que la genética nunca actúa sola. Por otro
lado, señala que la experiencia (nutrir) siempre requiere un organismo que tenga antecedentes
genéticos, lo que significa que la experiencia no puede actuar sola. Entonces, ha propuesto que
debemos considerar seis factores que interactúan cuando examinamos el desarrollo de un
organismo. El primer factor es la genética. El segundo es el entorno nutritivo prenatal, del que se
sabe desde hace mucho tiempo que tiene efectos importantes en el desarrollo. Una madre
embarazada que tiene sarampión puede tener un hijo con retraso en el desarrollo cognitivo, y la
ingestión de grandes cantidades de alcohol durante el embarazo puede producir defectos de
nacimiento. Por ejemplo, el trabajo ha demostrado que el razonamiento espacial-visual está
comprometido en niños de 14 años cuyas madres habían ingerido cantidades de alcohol, pero
menos que excesivas, durante el embarazo (Hunt, Streissguth, Kerr y Olson, 1995). Hunt y
asociados encontraron que cuanto más bebía una madre durante el embarazo, más rápido pero
con menos precisión respondían los niños a cómo se podían combinar triángulos y cuadrados
para formar una figura. El tercer factor que identificó Hebb fue la nutrición postnatal, y el
desarrollo cognitivo después del nacimiento está relacionado críticamente con la adecuación de
la dieta. Estos tres factores pueden considerarse como las variables físicas o constitucionales
asociadas con la forma en que crecen las personas. En el caso de la inteligencia, sabemos que
las tres variables se relacionan con el desarrollo del cerebro. Por su parte, Duncan y asociados
(2000, 2003) han mostrado la relación entre la inteligencia general y partes del cerebro, en
particular los lóbulos prefrontales.
Los factores cuarto y quinto que identifica Hebb son los que suelen asociarse con la
experiencia, es decir, el aprendizaje cultural e individual. Hebb señala que debemos considerar
el entorno compartido por todos los miembros de un grupo o especie en particular: el aprendizaje
cultural en el caso de los humanos. Las personas que crecen en el frío de Mongolia comparten
experiencias que son marcadamente diferentes de las que se desarrollan en un clima tropical,
como en partes de Brasil. El segundo tipo de aprendizaje (el que se analiza en el Capítulo 9) se
refiere a las experiencias únicas de un individuo. Incluso los gemelos idénticos que viven en la
misma cultura no tienen experiencias de aprendizaje idénticas. El sexto y último factor de Hebb
es el trauma físico, que puede incluir cosas como un tumor cerebral o la pérdida de la vista como
resultado de un accidente.
Podemos considerar los factores de Hebb como un esquema de desarrollo más que como
una teoría. Sin embargo, estos factores interactuantes ciertamente complican el análisis del
desarrollo y apuntan a la inutilidad de optar por una explicación puramente genética o experiencial
de un comportamiento. Zuckerman (1995) ha explorado las hormonas y los neurotransmisores
asociados con ciertos rasgos de personalidad. Su estudio implica de manera convincente ciertas
clases de hormonas y neurotransmisores en conductas como la extraversión y la impulsividad.
Sin embargo, Zuckerman señala cuidadosamente que “no heredamos rasgos de personalidad o
incluso mecanismos de comportamiento como tales” (p. 331).
Indica que nuestras plantillas químicas heredadas interactúan de formas aún desconocidas con
los tipos de factores propuestos por Hebb. “Solo la investigación psicobiológica comparada,
evolutiva y interdisciplinaria puede proporcionar las respuestas” (p. 332) sobre cómo interactúan
los factores.
59533_13_ch12_p327-357.indd 331 9533_13_ch12_p327-357.indd 331 3/5/08 /5/08

Consideramos aquí sólo un tipo de diferencia individual, la en comparación con el desempeño normativo, como con las
inteligencia, pero los principios generales también son válidos pruebas empíricas. Una puntuación combinada calculada a partir
para otras diferencias individuales. de todos los resultados de las tareas separadas posiblemente se
pueda usar como predictor del rendimiento escolar.
Las variables dependientes en el estudio de la inteligencia son
las medidas de inteligencia utilizadas por cada experimentador. Todas las diferencias individuales, incluida la inteligencia, son
Dado que las nociones de lo que realmente es la inteligencia variables sujetas y no verdaderas variables independientes. Los
difieren mucho entre los experimentadores, es difícil idear una estudios de la inteligencia humana a menudo tienen como objetivo
única medida que sea aceptable para todos. Los enfoques determinar la importancia relativa de los factores genéticos, en
empíricos generalmente se basan en la observación de que a oposición a los ambientales, en la producción de inteligencia.
medida que los niños crecen, pueden realizar tareas más Una de las técnicas empleadas en esta investigación ha sido
complicadas y difíciles. Para individuos de cualquier edad dada, examinar gemelos monocigóticos (idénticos), gemelos dicigóticos
se puede determinar un nivel promedio de desempeño en ciertas (fraternos), otros hermanos y niños no emparentados que se
tareas probando una muestra grande y representativa. Las tareas crían en el mismo hogar o en hogares diferentes. La similitud
particulares o elementos de prueba se seleccionarán sobre la genética varía en estos estudios de la siguiente manera: los
base de sus correlaciones con criterios objetivos de éxito en la gemelos idénticos (por supuesto) tienen la misma herencia
escuela, como las calificaciones y el nivel de lectura, y genética, los gemelos fraternos y otros hermanos son
posiblemente también con criterios subjetivos, como las genéticamente similares en menor grado que los gemelos
calificaciones de los maestros. idénticos, y los niños no emparentados tienen el menor grado de
similitud genética. . La similitud ambiental varía en que los niños
criados en el mismo hogar tienen más experiencias similares que
En cualquier nivel de edad en particular, habrá un número los niños criados en hogares separados.
promedio de elementos que los niños
puede pasar.
Si un niño de 7 años puede aprobar la misma cantidad de
ítems que el niño promedio de 9 años, diríamos que este niño Se pueden plantear varias objeciones a la definición de
tiene una edad mental de 9. El cociente de inteligencia, o CI, se similitud ambiental. En primer lugar, no parece razonable suponer
define como mental. edad dividida por la edad cronológica 100, que todos los pares de niños en el mismo hogar han tenido
o (en este caso) 9/7 100 129. Por defi - experiencias igualmente similares. Los gemelos, y en particular
los gemelos idénticos, a menudo reciben un trato más parecido
nición, un puntaje de 100 significa que un individuo obtuvo el que otros pares de niños, aunque solo sea porque tienen la
promedio para su edad, y cada variación de 15 puntos de este misma edad cuando ocurren varios eventos familiares. Además,
promedio representa una desviación estándar (consulte el los niños adoptivos y los niños biológicos pueden recibir un trato
Apéndice B) de este promedio. Las variantes del CI se utilizan algo diferente incluso cuando tienen la misma edad. Una segunda
como índice de inteligencia. objeción se basa en el hecho de que los hijos adoptivos ingresan
a la familia a edades más tardías que los hijos biológicos, aunque
Una prueba de inteligencia puramente analítica (ninguna sea por unas pocas semanas o meses. Aunque esta diferencia
es actualmente de uso general) contendría muchas subpruebas puede parecer trivial cuando la inteligencia se mide entre los 10
diseñadas para medir propiedades específicas del sistema de y los 15 años o más, muchos estudios han demostrado que las
procesamiento de información de una persona. experiencias tempranas son bastante importantes en el desarrollo
Ejemplos de estas propiedades pueden ser la capacidad de la de la inteligencia.
memoria a corto plazo y la velocidad de exploración, la
organización de la memoria a largo plazo y el tiempo de acceso,
las velocidades máximas de transmisión de información en varios
tipos de tareas y la capacidad de asignar atención. El desempeño Una tercera objeción se basa en la influencia potencial de
en estas tareas podría ser experiencias que ocurren incluso antes
59533_13_ch12_p327-357.indd 332 9533_13_ch12_p327-357.indd 332 3/5/08 /5/08

que las de las primeras semanas en el hogar, es decir, preguntas, en lugar de tener que “razonar” las respuestas,
las que ocurren en el ambiente prenatal. Al igual que parecerán más inteligentes que otros individuos que no
con la herencia genética, estas experiencias prenatales han aprendido previamente estos hechos, palabras o
generalmente serán más similares para los gemelos, relaciones en particular.
menos similares para los hermanos y menos similares Aunque se han eliminado muchos ítems de las
para los niños no emparentados. La similitud de la pruebas de inteligencia modernas para hacerlas más
experiencia prenatal y posnatal temprana puede, por lo "justas para la cultura" o menos influenciadas por
tanto, estar correlacionada con la similitud genética, lo experiencias de aprendizaje particulares, es imposible
que hace que sea arriesgado interpretar las correlaciones eliminar todos los efectos del aprendizaje, el uso del
de una u otra con la inteligencia medida. lenguaje, la motivación, el conocimiento cultural. ,
experiencia en pruebas y otros factores que se sabe que
Variables de control afectan las medidas de inteligencia. Esto no es un
problema si la inteligencia se interpreta simplemente
En estudios de inteligencia, es difícil definir un conjunto como probabilidad de éxito en la escuela, ya que estos
exhaustivo de variables de control. Sin embargo, otros factores sin duda infl uyen en el rendimiento
generalmente se piensa que el factor individual más escolar. Pero si la inteligencia se interpreta como
importante a controlar es el aprendizaje específico que "capacidad mental" o alguna construcción similar, los
podría afectar el desempeño de la prueba. Si ciertas efectos de estas variables extrañas deben minimizarse.
personas han aprendido las respuestas a un número de la prueba
Tema Fiabilidad de las Medidas

Inteligencia de ilustración y diseños de investigación de desarrollo
Cuando los psicólogos hablan de confiabilidad, se refieren a la consistencia de sus medidas de
alguna cantidad. Se podría suponer que varios intentos de medir lo mismo arrojarían los mismos
números, a menos, por supuesto, que alguien haya cometido un error. De hecho, casi siempre
hay alguna variabilidad en un grupo de medidas; la cantidad de variabilidad determina la
confiabilidad del instrumento y procedimiento de medición. El "error" al que se refieren los
psicólogos no implica que alguien cometió un error, sino simplemente que ciertos factores
inevitables causaron una variabilidad impredecible en los datos. Estas fuentes de error suelen
estar fuera del control del investigador y resultan del comportamiento diferente de las personas
en ocasiones sucesivas. Los psicólogos tratan de reducir esta variabilidad, aumentando así la
fiabilidad de sus medidas, tomando sus medidas en las mismas condiciones en ocasiones
sucesivas.
Si pudieran garantizarse condiciones idénticas, entonces la variabilidad en la medición
tendría que ser causada por un cambio real en la cantidad medida. Si su altura se mide en dos
ocasiones, con los resultados 5'8” y 5'10”, ¿esta variabilidad se debe a un error oa un cambio real
en su altura? La respuesta podría ser una o ambas. Pero cuanto más similares sean las
condiciones (zapatos usados, postura), menos probable será que atribuyas la diferencia a un
error. Además, cuanto más cerca estuvieran las dos medidas en el tiempo, menos probable sería
atribuir la diferencia a un cambio real en la estatura. Tienes alguna noción de lo rápido que puede
cambiar la estatura, o de la estabilidad de la verdadera estatura de una persona.
Sin embargo, la inteligencia es más difícil de medir que la estatura y es probable que las
fuentes de error sean difíciles de detectar. El desempeño de una persona en una prueba de
inteligencia puede verse momentáneamente alterado por factores extraños, como la cantidad de sue
59533_13_ch12_p327-357.indd 333 9533_13_ch12_p327-357.indd 333 3/5/08 /5/08

persona ha tenido, si él o ella comió una buena comida antes de la prueba, y así sucesivamente. También es más
difícil desarrollar una noción de su estabilidad. ¿Varía algo la inteligencia o permanece fija a lo largo de la vida?
Si cambia notablemente, ¿puede hacerlo dentro de una semana, un mes, un año o 10 años? Si cambia, ¿podemos
determinar los factores que producen el cambio? Estas son preguntas que a los psicólogos les gustaría responder;
las respuestas requieren medidas de inteligencia. Pero el lector alerta se dará cuenta de que ahora nos hemos
razonado en un círculo lógico. Demos otra vuelta e intentemos salir.
Varias medidas de la misma cantidad, en general, no coincidirán exactamente. Esta variabilidad puede ser
el resultado de un error o de un cambio real en la cantidad medida. No podemos decir, sin algunos supuestos
adicionales, cuánto error hay en nuestra medida. Entonces, ¿cómo podemos preguntar si la inteligencia cambia?
Una suposición útil, que permite romper el círculo lógico, sostiene que la cantidad medida es estable durante
períodos relativamente cortos. (Si un investigador mide su inteligencia por la mañana y luego nuevamente por la
tarde, se puede suponer que cualquier cambio es causado por un error de medición en lugar de un cambio real
en la inteligencia). Con esta suposición, un psicólogo puede estimar el error de medición e intentar mejorar y
especificar la fiabilidad del instrumento de medida. Las preguntas relacionadas con la estabilidad de la cantidad
subyacente, en este caso la inteligencia, pueden responderse. Primero revisamos algunas de las técnicas que
usan los desarrolladores de pruebas para evaluar la confiabilidad de sus medidas, y luego revisamos un estudio
que intentó determinar la estabilidad de la inteligencia durante muchos años.
Confiabilidad de la prueba
Señalamos anteriormente que el concepto de inteligencia no está bien definido teóricamente. Algunos teóricos
postulan un número de habilidades mentales separadas, quizás más de 100 (Guilford, 1967). Otros creen que
hay una habilidad mental primaria y que aunque otras habilidades más específicas pueden estar aisladas, son
menos importantes (Herrnstein & Murray, 1994). Esta habilidad primaria ha sido descrita como “una capacidad
para el razonamiento abstracto y la resolución de problemas” (Jensen, 1969, p. 19). Para probar esta habilidad,
reunimos colecciones de problemas o tareas y se las presentamos a individuos para que las resuelvan,
generalmente dentro de un período específico. El puntaje que logra un individuo se compara luego con los
puntajes obtenidos por otros. Sin embargo, antes de depositar mucha confianza en el puntaje de un individuo,
necesitamos saber qué tan confiable es. ¿Lograría el individuo aproximadamente el mismo puntaje si lo
evaluáramos nuevamente al día siguiente o una semana después? Debido a que creemos que la habilidad
subyacente no cambia apreciablemente durante un tiempo tan corto, atribuimos un gran cambio en las
puntuaciones al error de medición, lo que indica falta de confiabilidad en nuestra prueba. Este procedimiento de
dar la misma prueba dos veces seguidas durante un intervalo de tiempo corto se usa para determinar lo que se
llama la confiabilidad de prueba-reprueba de una medida. Generalmente se expresa como una correlación
entre la primera y la segunda puntuación obtenida de una muestra grande de sujetos.
Se puede emplear un procedimiento ligeramente diferente para evitar problemas tales como los efectos de
la práctica específica. Esta técnica consiste en dar formas alternas o paralelas de la prueba en las dos ocasiones
de prueba. De nuevo, si las correlaciones entre la primera y la segunda puntuación son altas, indican la fiabilidad
de las pruebas. Además, de esta manera se puede determinar la equivalencia de las dos formas de la prueba.
Se puede utilizar un tercer procedimiento para evaluar la confiabilidad con una sola presentación de prueba.
Esta técnica proporciona confiabilidad dividida por la mitad; implica dividir los elementos de la prueba en dos
grupos arbitrarios (como elementos pares e impares) y correlacionar las puntuaciones obtenidas en las dos
mitades de la prueba. Si estas correlaciones son altas, se confirma la confiabilidad de la prueba. Además, se
establece la equivalencia de los ítems de prueba.
59533_13_ch12_p327-357.indd 334 9533_13_ch12_p327-357.indd 334 3/5/08 /5/08

Estabilidad de las medidas de inteligencia
Por lo general, se encuentra que las pruebas de inteligencia modernas producen confiabilidades de prueba
y reevaluación bastante altas (correlaciones de alrededor de 0,95). Si aceptamos estas pruebas como
confiables, entonces podemos proceder a preguntar qué tan estable se mantiene la inteligencia medida
durante la vida de un individuo. Se han iniciado varios estudios longitudinales para examinar esta cuestión,
y cada 10 años se publican informes para actualizar los resultados. Un informe (Kangas & Bradway, 1971)
incluye datos sobre un grupo de sujetos que fueron evaluados con la prueba de Stanford-Binet en 1931, a
una edad promedio de un poco más de 4 años, y luego evaluados nuevamente en 1941, 1956. y 1969.
La muestra original consistía en niños del Área de la Bahía de San Francisco que formaban parte de una
población de estandarización a nivel nacional para una revisión de la escala Stanford-Binet. Las
puntuaciones se obtuvieron en dos formas alternativas de la prueba. En 1941, 138 de estos sujetos fueron
evaluados nuevamente con la misma forma de prueba, y en 1956, 111 recibieron la Escala de Inteligencia
para Adultos de Wechsler y la prueba de Stanford-Binet. En 1969, 48 personas aceptaron volver a hacerse la
Antes de examinar los resultados de este estudio, debemos recordar que estos resultados serán
descriptivos de la población de sujetos de los que se recopilaron los datos. También, se espera, serán
representativos de datos de sujetos similares. Pueden o no ser representativos de sujetos que difieren en
aspectos importantes de los sujetos de este estudio.
Kangas y Bradway proporcionaron datos para demostrar que los 48 sujetos evaluados en 1969 no
diferían del grupo más grande de 111 sujetos evaluados en 1956. Proporcionaron medias y desviaciones
estándar tanto para la edad cronológica como para el coeficiente intelectual evaluado por la prueba de
Stanford Binet en cada edad. y no encontró diferencias entre las dos muestras.
Los autores informaron correlaciones entre las puntuaciones obtenidas en cada par de
administraciones de pruebas, con las puntuaciones de las formas paralelas administradas en 1931
promediadas. Las pruebas utilizadas en cada edad fueron las pruebas de inteligencia de Stanford-Binet
(SB) y, solo para las pruebas de 1956 y 1969, la Escala de Inteligencia para Adultos de Wechsler (WAIS).
Los resultados se presentan en la Tabla 12.1. Tenga en cuenta que WAIS tiene un componente verbal y
un componente de desempeño, que juntos dan la puntuación completa. Si observa la tabla de izquierda a
derecha, verá que las correlaciones entre las pruebas sucesivas disminuyen con la cantidad de tiempo
entre las pruebas. La caída es especialmente pronunciada cuando la inteligencia preescolar, tomada
cuando la edad promedio de los niños era 4.1, se correlaciona con los otros puntajes (la fila superior de la
tabla). Las correlaciones son mucho más altas cuando se correlacionan las puntuaciones de los adultos.
Sin embargo, todas las correlaciones de la tabla 12.1 son estadísticamente significativas; Se puede decir
que las puntuaciones obtenidas cuando los niños tienen alrededor de 4 años predicen hasta cierto punto
(una correlación de 0,41) qué tan bien les irá mucho más tarde, a la edad de 41,6. (También debemos
tener en cuenta que las pruebas de inteligencia que se les dan a los niños de 4 años son muy diferentes
en tipos de preguntas de las que se les dan a los niños mayores; esto puede ayudar a explicar las bajas corre
Puede ver el aumento en la correlación entre las medidas de 1969 y las anteriores a medida que
aumenta la edad de los sujetos al mirar desde la parte superior de la tabla hasta la parte inferior.
Las correlaciones son mayores cuando las puntuaciones de SB se correlacionan entre sí en lugar de con
las puntuaciones de WAIS, y viceversa. Dado que la prueba SB es verbal, no se correlaciona demasiado
con la parte de rendimiento de la WAIS. Los resultados presentados en la Tabla 12.1 indican que la
inteligencia es bastante estable a lo largo de 37 años para esta muestra.
Otro hallazgo interesante del estudio de Kangas y Bradway es que los puntajes de las pruebas
aumentaron en cada edad de prueba de 4,1 a 41,6. Este aumento se examinó por separado para hombres
y mujeres (24 de cada uno), y estos grupos se separaron aún más en grupos de puntuación alta, media y
baja tomando los ocho primeros, los ocho medios y los ocho últimos sujetos de cada uno. sexo. Los
resultados se presentan en la Figura 12.1, donde se trazan las ganancias en SB IQ para los hombres y
mujeres con puntaje alto y bajo. Como ya fue mencionado,
59533_13_ch12_p327-357.indd 335 9533_13_ch12_p327-357.indd 335 3/5/08 /5/08

ÿ TABLA 12.1
Correlaciones entre los puntajes de las pruebas de coeficiente intelectual en cuatro administraciones de 1931 a 1969.
1941 (Nº 138) 1956 (N 109 111*) 1969 (Nº 48)
WAIS WAIS
SB SB SB
Prueba (Formulario L) (Formulario L) Completo Verbal Actuación (Formulario LM) Completo Verbal Actuación
1931 SB
(Formularios L y M) .sesenta y cinco .59 .64 .60 .54 .41 .39 .28 .29
1941 SB
(Formulario L) .85 .80 .81 .51 .68 .53 .57 .18
1956 SB
(Formulario L) .83 .89 .46 .77 .58 .68 .14
1956 WAIS
Completo .87 .84 .72 .73 .69 .41
Verbal .59 .73 .63 .70 .20
Actuación .36 .67 .47 .57
1969 SB
(Formulario LM) .77 .86 .36
1969 WAIS
Completo .87 .74
Verbal .38
Nota: SB es la prueba de Stanford-Binet, aplicada a todas las edades, y WAIS es la escala de inteligencia para adultos de Wechsler, aplicada en 1956 y 1969. Todas las correlaciones son significativas más
allá del nivel .01. De “Intelligence at Middle Age: A Thirty-Eight Year Follow-Up”, de J. Kangas y K. Bradway, 1971, Developmental Psychology, 5, págs. 333–337, Tabla 2. La parte de la tabla correspondiente
a 1931–1956 es una reimpresión de un artículo de Katherine P. Bradway y Clare C. Thompson, 1962, Journal of Educational Psychology. Copyright 1962 por la Asociación Americana de Psicología.
Reimpreso con permiso. *Debido a los datos incompletos de dos de los sujetos, el número total de sujetos en los que se basa cualquier correlación varía de 109 a 111.
se registraron ganancias continuas para todos los grupos, incluidos los grupos medianos, que no se
muestran. Pero un grupo parecía ganar mucho menos que los demás: el grupo de mujeres con puntaje
alto. Este resultado puede o no ser causado por un efecto techo (ver Capítulos 10 y 11), porque los
hombres con puntajes altos muestran un aumento sustancial. Dado que no sabemos si los hombres y las
mujeres con puntajes altos eran equivalentes inicialmente, y dado que las mujeres con puntajes bajos
mejoraron drásticamente, existe la posibilidad de un efecto techo.
Aunque este estudio no puede considerarse concluyente en sí mismo, en general está de acuerdo
con otros al mostrar que la inteligencia medida permanece relativamente estable durante una gran parte
de la vida, desde la primera infancia hasta la mediana edad. Esto también significa que las medidas
tempranas del desarrollo mental pueden predecir la inteligencia posterior, lo que Bornstein y Sigman
(1986) confirmaron en un importante estudio longitudinal.
La edad como variable

En el estudio de Kangas y Bradway, la principal variable de interés fue la edad. Como se discutió
anteriormente, la edad es una variable sujeto. Las variables del sujeto, por definición, no pueden
manipularse experimentalmente. En cambio, un investigador solo puede seleccionar instancias que
satisfagan diferentes categorías y estudiar esas instancias. Por lo tanto, la investigación con variables
temáticas es en gran medida de naturaleza correlacional; los investigadores pueden identificar variables
dependientes que cambian con las variaciones en una variable en cuestión, pero es difícil atribuir la
causalidad a la variable en cuestión y no a algún factor posiblemente confuso que varía con la variable en
cuestión. Los estudios con la edad como variable sujeto ilustran claramente la dificultad de mostrar la edad com
59533_13_ch12_p327-357.indd 336 9533_13_ch12_p327-357.indd 336 3/5/08 /5/08

El diseño experimental más típico en el que varía la edad se denomina diseño transversal. En
este diseño, un investigador toma una muestra representativa de la población y prueba a los sujetos
en el experimento o procedimiento de interés. Si un investigador estuviera interesado en cómo varía
la inteligencia con la edad, él o ella podría evaluar a personas de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50,
55, 60, 65, 70 y 75 años. años. Si se hiciera la prueba a 25 personas de cada edad, entonces se
necesitarían hacer la prueba a 375 personas. De hecho, este es un diseño de investigación bastante
común, aunque la gran cantidad de edades muestreadas es atípica. Este diseño para la investigación
del desarrollo ha fallado por motivos importantes. Se ha argumentado que es probable que muchos
otros factores se confundan con la edad en este tipo de diseño. Por ejemplo, es probable que las
personas que tenían 25 años en 1997 difieran de las personas que tenían 65 o 75 años en varias
dimensiones importantes: los sujetos mayores habrán sido criados y educados de manera diferente,
es más probable que hayan emigrado a los Estados Unidos, es más probable que hayan servido en
las fuerzas armadas, y así sucesivamente. Estos factores de confusión se han denominado efectos
de cohorte, que se refieren a los efectos de los diferentes tipos de personas (las cohortes) que
crecen con personas de diferentes edades.
Tus cohortes, como tus compañeros de clase, son necesariamente diferentes de las cohortes de
tus abuelos. Otra diferencia crucial en muchos estudios sobre rendimiento intelectual es que es
probable que las personas mayores hayan tenido menos años de educación formal que las personas
más jóvenes. Por lo tanto, si al usar un diseño de investigación transversal, los investigadores
descubren diferencias entre personas de diferentes edades, tendrán dificultades para mostrar que la
edad es responsable de la diferencia en lugar de cualquier número de factores de confusión.
59533_13_ch12_p327-357.indd 337 9533_13_ch12_p327-357.indd 337 3/5/08 /5/08

Muchos estudios transversales de inteligencia que se han realizado muestran un patrón común de
desempeño: la inteligencia (medida en una prueba estándar) aumenta de manera constante hasta los 20
años, luego cae gradualmente hasta alrededor de los 60 años y luego disminuye más rápidamente a partir de
entonces. La conclusión, entonces, es bastante sombría, ya que muchos investigadores infirieron que la
inteligencia se estabilizó o incluso disminuyó después de que las personas cumplieron 20 años. Sin embargo,
en retrospectiva y con evidencia de otros estudios, parece una conclusión más probable que los estudios
transversales de inteligencia son defectuosos por todos los factores que acabamos de mencionar, en particular
las diferencias en la educación a lo largo de las décadas. De hecho, como acabamos de ver, cuando Kangas
y Bradway usaron un diseño de investigación diferente para hacer la pregunta de cómo la edad afecta la
inteligencia, concluyeron que la inteligencia aumentaba continuamente a lo largo de las edades del estudio.
Kangas y Bradway utilizaron un diseño longitudinal. En estos diseños, el mismo grupo de sujetos se
prueba repetidamente a lo largo del tiempo, se evitan todas las confusiones inherentes al diseño transversal.
Por lo tanto, un investigador puede estar más seguro en algunos casos de que la edad, en lugar de las
variables del sujeto confundidas, es responsable de cualquier cambio observado en el desempeño. Sin
embargo, el diseño longitudinal tampoco está exento de problemas. Imagine que un investigador en 1950
estaba interesado en cómo la edad afectaba las actitudes de las personas hacia la guerra y si Estados Unidos
debería tener una fuerte capacidad militar. Si se midiera a las personas en 1950, sus actitudes en general
podrían haber sido bastante favorables, ya que Estados Unidos había experimentado recientemente el éxito
de la Segunda Guerra Mundial. Sin embargo, si estas personas hubieran sido examinadas 20 años después,
en el apogeo de la impopular Guerra de Vietnam, sus actitudes podrían haber sido mucho menos favorables.
Este ejemplo ilustra el problema de los efectos de la historia, la confusión de la fecha del examen con
la edad. Es decir, los eventos sociales (p. ej., la Segunda Guerra Mundial y la Guerra de Vietnam) exclusivos
del momento de la prueba pueden tener un efecto significativo en el comportamiento de interés (p. ej., las
actitudes expresadas acerca de la guerra). Obviamente, un investigador sería precipitado al concluir que las
actitudes de las personas hacia la guerra y la defensa se vuelven menos favorables a medida que envejecen.
Otro problema con el diseño longitudinal implica pruebas repetidas. Los sujetos en estudios longitudinales
son, por definición, medidos múltiples veces. Por lo tanto, el investigador cuidadoso debe tratar de asegurarse
de que el desempeño no refleje la experiencia previa con la prueba. Un problema final con los estudios
longitudinales es la deserción de sujetos. Con el tiempo, las personas pueden abandonar el experimento (por
muerte o mudanza), y esta tasa de abandono aumenta con el tiempo. De hecho, las tasas de deserción
pueden llegar al 50 por ciento en algunos estudios longitudinales (Pedhazur & Pedhazur Schmelkin, 1991).
Desafortunadamente, los sujetos no abandonan los estudios al azar. En otras palabras, puede haber
diferencias importantes entre los sujetos que permanecen en un estudio y los que no. En general, los diseños
longitudinales no conducirán a conclusiones sólidas acerca de cómo la edad altera el comportamiento cuando
los cambios experienciales durante el período entre pruebas pueden haber producido el cambio.
Dados estos problemas de diseños transversales y longitudinales, ¿cómo pueden los psicólogos realizar
una investigación sólida sobre las diferencias de desarrollo? De hecho, muchos de los estudios del desarrollo
de los que dependen los psicólogos han empleado estudios transversales y longitudinales (con predominio de
los primeros).
Sin embargo, Schaie (1977) abogó por otros diseños de investigación que permitieran evaluaciones
menos ambiguas de los cambios en el desempeño con la edad. Uno de estos, el diseño secuencial cruzado,
se ilustra en la Figura 12.2, que muestra cómo las personas nacidas en 4 años consecutivos (1987–1990)
podrían someterse a pruebas en 4 años consecutivos (2006–2009). Cada columna de la figura representa un
diseño transversal, ya que en un año se están evaluando personas de diferentes edades. De manera similar,
cada fila representa un diseño longitudinal, ya que las personas de la misma edad se prueban repetidamente
a medida que envejecen.
59533_13_ch12_p327-357.indd 338 9533_13_ch12_p327-357.indd 338 3/5/08 /5/08

año de prueba
2006 2007 2008 2009

Longitudinal
1987 19 20 21 22
Diseño
1988 18 19 20 21
nacimiento
Año
de
1989 17 18 19 20
1990 dieciséis 17 18 19
equipo de tiempo
Diseño
transversal
Diseño
ÿ FIGURA 12.2
El diseño de investigación secuencial cruzada para investigar las diferencias de desarrollo.

Las personas nacidas entre 1987 y 1990 se analizan repetidamente entre 2006 y 2009. El número en
cada celda es la edad de la persona cuando se hizo la prueba.
Además, la figura 12.2 ilustra un tercer tipo de diseño en diagonal. Este es el diseño de retardo de
tiempo, cuyo objetivo es determinar los efectos del tiempo de prueba mientras se mantiene constante la
edad. La edad en el momento de la prueba se mantiene constante en 19 años en el diseño de intervalo
de tiempo, por lo que cualquier cambio observado puede atribuirse a las eras cambiantes en las que se
evalúa a las personas. Sin embargo, la edad en este diseño se confunde tanto con el año de nacimiento
como con el año de la prueba. En todo el diseño secuencial cruzado, si tanto los componentes
longitudinales como transversales muestran alguna variable dependiente que cambia con la edad y el
componente de retardo de tiempo no muestra cambios con el tiempo de la prueba mientras se mantiene
constante la edad, entonces un investigador puede atribuir con seguridad la variable observada. cambios
a la edad en sí y no algún factor de confusión.
Definiciones operativas del tema

Ilustración Inteligencia
Considere el siguiente juego, que se llama juego de imitación. El juego de imitación es un experimento
hipotético ideado por Turing (1950) en un artículo titulado “Computing Machinery and Intelligence”. El
propósito de Turing era idear una situación que permitiera evaluar si una máquina podía pensar.
Se juega con tres personas, un hombre (A), una mujer (B) y un interrogador (C) que pueden ser de
ambos sexos. El interrogador permanece en una habitación aparte de los otros dos.
El objeto del juego para el interrogador es determinar cuál de los otros dos es el hombre y cuál es la
mujer. Él (el interrogador) los conoce por las etiquetas X e Y, y al final del juego dice "X es A e Y es B" o
"X es B e Y es A".
El interrogador puede hacer preguntas a A y B de la siguiente manera: C: “¿Podría X decirme el largo de
su cabello?” Ahora suponga que X es en realidad A; entonces A debe responder. El objetivo de A en el
juego es tratar de hacer que C haga una identificación incorrecta. Por lo tanto, su respuesta podría ser:
"Mi cabello está cubierto de tejas y los mechones más largos miden aproximadamente nueve pulgadas".
59533_13_ch12_p327-357.indd 339 9533_13_ch12_p327-357.indd 339 3/5/08 /5/08

largo." Para asegurarse de que el tono de voz no ayude al interrogador, las respuestas deben ser
escritas o, mejor aún, mecanografiadas. El arreglo ideal es tener una teleimpresora que se comunique
entre las dos habitaciones. Alternativamente, la pregunta y las respuestas pueden ser repetidas por un
intermediario. El objetivo del juego para el tercer jugador (B) es ayudar al interrogador. La mejor
estrategia para ella es probablemente dar respuestas veraces. Ella puede agregar cosas como "¡Yo soy
la mujer, no lo escuches!" a sus respuestas, pero no servirá de nada ya que el hombre puede hacer
comentarios similares.
Ahora hacemos la pregunta: "¿Qué pasará cuando una máquina tome el papel de A en este
juego?" ¿Decidirá el interrogador incorrectamente tan a menudo cuando el juego se juega así como lo
hace cuando el juego se juega entre un hombre y una mujer?
Estas preguntas reemplazan nuestra pregunta original, "¿Pueden pensar las máquinas?" (Turing, 1950,
págs. 433–434).
El juego de la imitación suele llamarse test de Turing. Presumiblemente, la prueba podría
determinar si alguna máquina, computadora o no, tenía inteligencia. El criterio para la inteligencia en las
máquinas se especifica en la prueba de Turing: una máquina se llamaría inteligente si un interrogador
estuviera físicamente separado de una máquina y una persona no pudiera distinguir entre sus respuestas
escritas a máquina a las preguntas. Más sin rodeos, una máquina cuya salida es capaz de imitar a un
humano tiene inteligencia.
Turing argumentó que, al menos en principio, una máquina sería tomada por un humano en el
juego de la imitación. Para muchos psicólogos e informáticos, el test de Turing es válido para determinar
la inteligencia. Sobre la base de los argumentos que respaldan la prueba de Turing, la creencia en la
posibilidad de la inteligencia artificial (IA) se ha generalizado. Hay dos puntos de vista generales sobre
la IA (Searle, 1980). La primera, llamada IA fuerte, es la creencia, siguiendo a Turing, de que las
máquinas pueden tener inteligencia. Dicho de otra manera, la posición fuerte de la IA establece que es
posible que las máquinas posean un estado cognitivo que se llamaría inteligencia si una persona
poseyera ese estado cognitivo. El estado cognitivo se realiza en el programa que ejecuta la máquina.
Desde este punto de vista, la inteligencia es simplemente la manipulación de los símbolos formales en
el programa. El segundo tipo de IA, llamada IA débil, implica el uso de programas informáticos para
modelar la inteligencia humana; pone a prueba las teorías de la cognición por medio de programas
informáticos. El enfoque de IA débil no ha generado mucho desacuerdo y no lo consideraremos aquí.
En su lugar, nos centraremos en la fuerte posición de la IA, porque ha generado una gran controversia.
Definiciones operacionales
Muchos consideran válida la prueba de Turing porque tiene dos características importantes. El primero
es el hecho de que la evaluación de la inteligencia de las máquinas usando el juego de imitación implica
un experimento: si un interrogador cree que una máquina es equivalente a una persona. La segunda
característica es más importante para nuestros propósitos. El experimento descrito por Turing produce
una definición operativa.
Las definiciones operativas se discutieron en el Capítulo 6, utilizando el concepto de umbral como
ejemplo. Recuerde que una definición operativa es una fórmula para construir una construcción, como
la inteligencia, de manera que otros científicos puedan duplicarla, especificando las operaciones
utilizadas para producirla y medirla. Una definición operativa del hambre podría especificar retener la
comida de un perro por un tiempo y luego medir cuánto come el perro.
Asimismo, según la definición operativa de inteligencia de Turing, especificamos la producción de
inteligencia, un programa de máquina que responde preguntas, y medimos la inteligencia por la cantidad
de engaño que producen las respuestas. Esta parece ser una definición operativa perfectamente
aceptable, entonces, ¿por qué ha generado tanto debate?
59533_13_ch12_p327-357.indd 340 9533_13_ch12_p327-357.indd 340 3/5/08 /5/08

La principal razón por la que la prueba de Turing es controvertida es el hecho de que las
definiciones operativas son fiables en principio, pero no necesariamente válidas. El principal
valor de una definición operativa es facilitar la comunicación. En este caso, si alguien afirma que
las máquinas son inteligentes, se refiere al hecho de que la máquina pasó la prueba de Turing
y, presumiblemente, nada más.
En términos de claridad de expresión, la prueba de Turing parece ser adecuada.
Las condiciones necesarias para producir consistentemente (es decir, confiablemente) lo que
Turing llama inteligencia están precisamente dadas. Sin embargo, el debate sobre la IA fuerte
se centra en la cuestión de si la prueba de Turing captura adecuadamente lo que llamaríamos
inteligencia en humanos. Así, existen desacuerdos sobre la validez de la prueba de Turing como
definición de inteligencia. La validez en el contexto actual se refiere a la verdad o solidez de la
definición. El término validez de constructo se refiere a la medida en que la prueba (p. ej., la
prueba de Turing) mide el constructo (p. ej., inteligencia) que se supone que debe medir. ¿La
prueba de Turing define inteligencia o define algo más? ¿La cantidad de engaño producido por
la computadora refleja inteligencia?
Las definiciones operativas casi siempre tienen una aplicabilidad limitada, lo que significa
que su validez se verá afectada. Reconsidere la definición operativa de hambre que se presentó
anteriormente: retenga la comida por un tiempo y observe la cantidad ingerida.
¿Especifica esto adecuadamente lo que entendemos por hambre? Probablemente no. Los seres
humanos comen por una variedad de razones, solo una de las cuales tiene que ver con la
privación de alimentos. A veces comemos para ser sociables, a veces comemos porque
deseamos un tipo particular de comida, ya veces comemos porque no hemos comido durante
varias horas. Además, la definición operativa anterior no es simétrica, porque no comer no
significa que el estómago esté lleno. A veces no comemos porque tenemos malestar estomacal,
a veces no comemos porque estamos tratando de perder peso ya veces no comemos porque
acabamos de comer. Para caracterizar el concepto de hambre de una manera que dé cuenta de
este tipo de observaciones, necesitamos tener múltiples definiciones operativas que encajen en
una teoría coherente. Tenemos que usar operaciones convergentes (ver Capítulos 7 y 14).
Gran parte de la crítica contra la IA fuerte es del tipo que podría formularse contra nuestra
definición de hambre. “Las máquinas no son humanas. Pero, ¿puede hablar una computadora?
¿Puede escribir sonetos? Turing anticipó algunas de estas críticas y cree que se pueden
responder a tiempo; sí, un programa de computadora puede hacer esas cosas de tal manera
que un observador (interrogador) no sabría que una máquina las produjo. Como dijo Turing
(1950),
El método de preguntas y respuestas parece adecuado para introducir casi cualquiera de

los campos del quehacer humano que deseamos incluir. No queremos penalizar a la
máquina por su incapacidad para brillar en concursos de belleza, ni penalizar a un hombre
por perder en una carrera contra un avión. Las condiciones de nuestro juego hacen que
estas incapacidades sean irrelevantes. Los “testigos” pueden alardear, si lo consideran
conveniente, cuanto quieran de sus encantos, fuerza o heroísmo, pero el interrogador no
puede exigir demostraciones prácticas. (pág. 435)
Algunas de las críticas y la refutación de Turing pueden ser preguntas empíricas que
podrían resolverse mediante la observación y la experimentación, pero incluso si se desarrollaran
máquinas que pudieran hacer estas cosas, hay críticas adicionales. Abordaremos ahora una
crítica a la validez del test de Turing.
59533_13_ch12_p327-357.indd 341 9533_13_ch12_p327-357.indd 341 3/5/08 /5/08

La habitación china
El filósofo Searle (1980, 1990) desarrolló un argumento importante contra la posibilidad de una IA
fuerte, y sus objeciones se relacionan con la validez fundamental de la prueba de Turing. Searle
también usa un experimento hipotético para reforzar su argumento. Nos pide que imaginemos a
una persona que no conoce el idioma chino. Para los propósitos de nuestra discusión, supongamos
que la persona es usted. Estás aislado en una habitación, y en ella hay un libro de instrucciones
completo escrito en tu idioma nativo que especifica lo que debes hacer cuando una hoja de papel
entra en la habitación con ciertos garabatos.
Las instrucciones te dicen que hagas coincidir esos garabatos con ciertas cartas que están contigo
en la habitación. Estas tarjetas también tienen diferentes patrones de líneas. Cuando haya
encontrado la tarjeta o tarjetas que se le indicó que encontrara, las coloca en una ranura que deja
caer la tarjeta fuera de la habitación.
Sin que usted lo sepa, las tarjetas tienen caracteres chinos, y también sin que usted lo sepa,
en realidad está respondiendo preguntas en chino que se le hicieron en chino. El experimento
mental asume que sus instrucciones son lo suficientemente detalladas como para permitirle
responder las preguntas adecuadamente aunque no entienda nada de chino; ni siquiera sabe que
está manipulando símbolos chinos.
Por lo tanto, usted está participando en una versión de la prueba de Turing, porque las personas
están haciendo preguntas en chino de "la sala" (de ahí el nombre de sala china), y los
interrogadores no deberían poder distinguir sus respuestas de las que da un persona que habla
chino. Está manipulando adecuadamente un conjunto de símbolos formales, pero estos símbolos
no tienen ningún significado para usted.
Searle cree que pasarías la prueba de Turing en un concurso de habitaciones chino real.
¿Eso significa que eres inteligente en chino? La respuesta de Searle es no. No entiendes nada de
chino, pero pasas la prueba de Turing. Estás funcionando igual que una computadora que engaña
a un interrogador haciéndole creer que un ser humano en lugar de una máquina está respondiendo
preguntas. El programa de computadora, como ustedes en la sala china, manipula símbolos y,
como ustedes, la computadora no les atribuye significado ni comprensión a los símbolos. Según
Searle, esto debe significar que la prueba de Turing es una forma inválida de demostrar que las
máquinas tienen inteligencia.
Searle se suma a su argumento al sugerir que la verdadera comprensión aparentemente
requiere un cerebro que tenga poderes causales en la situación que se examina. No entiendes el
chino de la misma manera que entiendes tu idioma nativo, porque no puedes producirlo. Todo lo
que puede hacer con el chino, y presumiblemente todo lo que una computadora puede hacer en
cualquier actividad "inteligente", es seguir las instrucciones sobre cómo manipular símbolos. Para
producir un comportamiento inteligente, los símbolos que se manipulan deben tener contenido o
significado. Dado que las mentes humanas tienen contenidos significativos y los programas de
computadora no, los programas no pueden ser inteligentes. Searle (1990) sostiene que las
máquinas con base biológica, como nuestro cerebro, pueden no ser las únicas cosas que pueden
pensar, pero considera que la posibilidad de crear dispositivos de pensamiento artificial es, en el
mejor de los casos, un proyecto para un futuro lejano.
El argumento de la habitación china de Searle y su posición sobre los cerebros no han
quedado sin respuesta (ver Churchland & Churchland, 1990; Hauser, 1997). Los temas básicos
parecen ser estos: ¿Qué cuenta como una prueba adecuada de inteligencia? ¿El comportamiento
de un dispositivo que simplemente manipula símbolos es suficiente para contar como inteligencia?
La fuerte respuesta de la IA es sí. La respuesta de Searle es no: un programa que simula que un
hablante de chino no entiende chino, al igual que un programa que simula la digestión no digiere
la comida.
59533_13_ch12_p327-357.indd 342 9533_13_ch12_p327-357.indd 342 3/5/08 /5/08

Definición de inteligencia
Una pregunta que podría hacerse ahora es: "¿No hay otras definiciones operativas de inteligencia que
sean generalmente aceptadas?" La respuesta corta es no. La inteligencia se ha asociado a todo tipo
de medidas. Por ejemplo, recientemente, la inteligencia fluida se ha asociado con la capacidad de la
memoria de trabajo (Engle, 2002; Engle, Tuholski, Laughlin y Conway, 1999) y ciertos lugares del
cerebro (p. ej., Duncan, 2003). Aquí examinamos algunas otras definiciones de inteligencia y algunos
problemas adicionales asociados con la definición operativa de conceptos.
Es posible que haya notado que no definimos la inteligencia cuando analizamos la confiabilidad
en la primera sección de este capítulo. Lo omitimos porque los desarrolladores de pruebas suelen tener
un problema pragmático a mano. Binet simplemente quería determinar el nivel de grado apropiado para
los estudiantes de las escuelas francesas. En estas circunstancias pragmáticas, la validez de la prueba
está determinada por algún criterio, como el éxito en la escuela. De hecho, las pruebas Stanford-Binet
y Wechsler hacen un buen trabajo al predecir el rendimiento académico. Por lo tanto, podría sentirse
tentado a decir que la inteligencia es lo que miden las pruebas si tienen una buena validez de criterio
(las pruebas predicen el rendimiento académico). El problema aquí es doble. Por un lado, la mayoría
de las pruebas de inteligencia se centran en las habilidades matemáticas y verbales, lo que significa
que ignoran otro tipo de actividades intelectuales importantes, como la habilidad musical y la capacidad
de comprender a otras personas. Por otro lado, la capacidad intelectual en un sentido académico a
menudo se considera una forma limitada y culturalmente sesgada de definir la inteligencia. La típica
prueba de CI no mide la capacidad de una persona para triunfar en la vida o adaptarse al entorno.
Entonces, según el argumento, los puntajes de CI de las personas pueden no tener nada que ver con
el sentido común o con llevar una vida productiva. Además, incluso si las personas fueran productivas
y tuvieran sentido común, sus puntajes de coeficiente intelectual no predecirían su éxito en otro
contexto, como sobrevivir en una isla desierta o vivir bien en la jungla. Además, las pruebas de
coeficiente intelectual son, según algunos críticos, un reflejo de los valores de la clase media alta blanca
y no reflejan lo que significa la inteligencia para la sociedad en su conjunto. El hallazgo de que los
estereotipos culturales afectan el desempeño en otras pruebas respalda este supuesto sesgo (Steele y
Aronson, 1995). Por ejemplo, a las mujeres les va peor en un examen difícil de matemáticas después
de haber sido expuestas al estereotipo de que “las mujeres no pueden hacer matemáticas” (Spencer, Ste
Por lo tanto, aceptar la definición de inteligencia como lo que miden las pruebas de inteligencia no
resuelve muchos problemas. Está limitado en su rango de experiencia, y es probable que la definición
sea cuestionada por la concepción del público en general de lo que es la inteligencia (Sternberg, 1995).
Consideremos brevemente un intento contemporáneo de definir la inteligencia operativamente.

Es una teoría de las inteligencias múltiples y fue desarrollada por Gardner (1983, 2000a).
Su objetivo era ampliar la definición académica estándar de inteligencia para incluir inteligencias (para
usar sus términos) que están menos ligadas a los valores culturales occidentales que las asociadas
con la prueba estándar de inteligencia. Gardner presenta evidencia transcultural, psicológica,
psicométrica, de desarrollo y neurológica de la existencia de siete facetas de la inteligencia. Estas
inteligencias múltiples son la corporal-kinestésica, la lingüística, la lógico-matemática, la musical, la
autocomprensión (intrapersonal), el éxito social (interpersonal) y la espacial. De estos, solo los
lingüísticos, lógico-matemáticos y espaciales se evalúan en las pruebas estándar de coeficiente
intelectual. Para cada una de las siete inteligencias, Gardner trata de mostrar que hay estructuras
neuronales separadas asociadas con ellas, que cada una tiene una historia de desarrollo distinta, que
una persona puede ser muy buena en un área y pobre o mediocre en otras, y que culturalmente, se
puede demostrar que cada una de las áreas desempeña un papel destacado, aunque de diferentes
maneras. Gardner (2000a) sugirió que puede haber
59533_13_ch12_p327-357.indd 343 9533_13_ch12_p327-357.indd 343 3/5/08 /5/08

ser más de siete inteligencias diferentes. En el libro 2000a, explora la posibilidad de una
inteligencia naturalista para agregar a la lista original de inteligencias. La inteligencia naturalista se
refiere a cómo las personas obtienen información sobre el mundo natural. Gardner también ha
explorado la posibilidad de una inteligencia espiritual y una inteligencia existencial (para una
muestra de las diversas posiciones, véase Edwards, 2003; Emmons, 2000; Gardner, 1998a;
Gardner, 2000a; Gardner, 2000b; Kwilecki, 2000).
En lugar de examinar cada una de las inteligencias, consideremos cómo Gardner analiza
una: la música. En primer lugar, Gardner muestra que las estructuras neuronales subyacentes a la
música son diferentes de las asociadas con otras inteligencias. La habilidad musical está asociada
con el hemisferio derecho del cerebro, a diferencia de la habilidad lingüística, que está asociada
con el hemisferio izquierdo. Las personas con daño en el hemisferio izquierdo a menudo son
afásicas, lo que significa que tienen un trastorno del lenguaje. Curiosamente, aunque los afásicos
a menudo tienen problemas para hablar, por lo general pueden cantar e, incluso en el raro caso
de que no puedan cantar palabras, sus habilidades musicales no se ven afectadas. Por el contrario,
las personas con daño en el hemisferio derecho a menudo sufren de agnosia tonal. Los agnósicos
tonales son incapaces de cantar y sus inflexiones vocales ordinarias están disminuidas. Por lo
demás, la facilidad lingüística de las personas que padecen agnosia tonal está intacta.
Lo siguiente que observa Gardner son las tremendas diferencias individuales en la inteligencia
musical. Esto puede evaluarse mediante pruebas especiales (es decir, psicométricamente), pero
también es evidente en la observación cotidiana. Mozart era obviamente un genio musical.
A temprana edad, este prodigio componía música sinfónica elegante y actuaba ante las cortes
reales de Europa antes de la adolescencia (ver Gardner, 1998b, cap. 4, para una discusión sobre
Mozart).
Gardner presenta más evidencia de una inteligencia musical separada, que no necesitamos
considerar aquí. El punto es que, para cada una de las inteligencias que propone, trata de definirlas
operativamente a lo largo de varias dimensiones. Esto significa que está utilizando operaciones
convergentes para refinar su concepto de inteligencia. ¿Tiene éxito en la definición de inteligencia?
¿Es la teoría de las inteligencias múltiples de Gardner la definición de inteligencia?
Como era de esperar, la respuesta a esas preguntas es no, o al menos la respuesta es no para
algunos psicólogos.
Un detractor de la teoría de Gardner es el psicólogo Robert Sternberg, que ha adoptado el
enfoque del procesamiento de la información para definir la inteligencia (un tratamiento accesible
del trabajo de Sternberg es The Triarchic Mind, 1988). La principal crítica de Sternberg al enfoque
de Gardner sostiene que los procesos subyacentes a las siete inteligencias no están especificados.
Sternberg sugiere que Gardner simplemente nombra las inteligencias sin especificar exactamente
qué son y qué no son. Una segunda crítica que hace Sternberg es decir que la inteligencia es
general, pero las inteligencias de Gardner son específicas. Según Sternberg, Gardner ha
identificado talentos más que inteligencias. La falta de talento musical no debería ser demasiado
perjudicial para una persona y puede pasar desapercibida. Sin embargo, una persona que no
pudiera planear o razonar, que son componentes importantes de la inteligencia para Sternberg, no
podría funcionar en el mundo.
Las críticas de Sternberg se tienen en cuenta en su propia teoría de la inteligencia (p. ej.,
Sternberg, 1997), que hace hincapié en la capacidad de procesar información, sintetizarla de
formas novedosas y adaptarse a nuevas situaciones. La definición operativa de inteligencia de
Sternberg sugiere que el comportamiento inteligente refleja la capacidad de resolver problemas
establecidos en un contexto social (ver Sternberg & Salter, 1982). Este punto de vista es prominente
y es aceptado por muchos psicólogos interesados en el enfoque del procesamiento de la
información (ver Kantowitz, 1989a).
59533_13_ch12_p327-357.indd 344 9533_13_ch12_p327-357.indd 344 3/5/08 /5/08

Parcialmente en respuesta al enfoque de Sternberg, Gardner (2007) argumenta que hay
varias formas de ver las mentes y la inteligencia. Una forma es considerar la adaptación a las
necesidades del mundo (¿te suena familiar?). En su libro Five Minds for the Future, describe las
habilidades cognitivas que las personas deben desarrollar “si queremos prosperar en el mundo
durante las eras venideras” (p. 1). Las cinco características de las mentes futuras son: la mente
disciplinaria, que ha dominado una escuela de pensamiento (ciencia, historia, derecho, etc.); la
mente sintetizadora, que puede integrar ideas de varias disciplinas; la mente creadora, que puede
plantear y resolver nuevos problemas; la mente respetuosa, que es sensible a las diferencias
humanas; y la mente ética, aquella que satisface las responsabilidades de una persona como
ciudadano.
Pero, ¿es la capacidad adaptativa de resolución de problemas de Sternberg y ahora de
Gardner una especie de inteligencia? En estos puntos de vista, ¿escribir un poema o componer
una sinfonía sería una manifestación de inteligencia o simplemente un talento? Del mismo modo,
¿debemos considerar la habilidad para resolver problemas cotidianos asociados, por ejemplo, con
la plomería o la mecánica automotriz, como una habilidad intelectual? Las respuestas a estas
preguntas requieren una teoría convincente respaldada por datos de confirmación basados en
operaciones convergentes derivadas de muchas definiciones operativas. Aunque las definiciones
operativas juegan claramente un papel importante en el desarrollo de teorías científi cas, el uso de
definiciones operativas tiene ventajas y desventajas. En el lado positivo, las definiciones operativas
pueden facilitar la comunicación científi ca y, por lo tanto, la confiabilidad de la investigación científi
ca. Tal trabajo confiable prepara el escenario para la elaboración y refinamiento de conceptos. En
el lado negativo, las definiciones operativas pueden ser definiciones controvertidas de los conceptos
en cuestión. Aunque pueden ser válidos, su significado es a menudo objeto de debate. Las
definiciones deben encajar en una red de otros conceptos que conducen a la descripción y predicción
Ciertamente, el progreso en la comprensión de la inteligencia tanto natural como artificial depende
de una definición satisfactoria de lo que implica el concepto de inteligencia.
Artefactos de regresión de tema

Ilustración Evaluación Educativa
Un tema relacionado con el estudio de la inteligencia y las diferencias individuales gira en torno a
los intentos de psicólogos y educadores por mejorar el desempeño de los individuos y la importancia
de evaluar dichos intentos. Como puede sospechar, la medición precisa se encuentra en el centro
de la evaluación del cambio. Siempre que se produce un error de medición, existe la posibilidad de
que concluyamos erróneamente que se ha producido o no se ha producido algún tipo de cambio.
Aunque esta declaración puede parecerle poco profunda, varios estudios psicológicos han sido
criticados por no tener en cuenta adecuadamente su verdad.
Ciertos diseños o procedimientos para recopilar datos son particularmente susceptibles al

sesgo causado por errores de medición. Esos diseños, recuerde, se denominan diseños cuasi
experimentales, porque los sujetos no se asignan aleatoriamente a los grupos de tratamiento y
control (Campbell y Stanley, 1966). Un investigador puede emparejar a los sujetos en estos grupos
en una serie de factores, pero es difícil asegurar que no existieran diferencias importantes entre
los grupos antes del comienzo del estudio.
59533_13_ch12_p327-357.indd 345 9533_13_ch12_p327-357.indd 345 3/5/08 /5/08

tratamiento. Este problema se amplifica cuando el grupo experimental (tratamiento) y el grupo de
control (sin tratamiento) no se emparejan antes del estudio en la variable en la que se evaluarán al
final del estudio. Por ejemplo, se puede seleccionar un grupo de niños de un vecindario como grupo
experimental para probar un nuevo curso de capacitación para enseñar a correr. Se puede elegir un
segundo grupo de niños del mismo vecindario para que sirva como grupo de control. Después de 6
semanas de entrenamiento del grupo experimental, ambos grupos podrían someterse a pruebas de
velocidad de carrera. Este sería un diseño cuasi-experimental, porque los niños no fueron asignados
aleatoriamente a uno de los dos grupos. Incluso si el experimentador informara que los dos grupos
tenían la misma estatura, peso y edad promedio, no sabríamos con certeza si la velocidad promedio
de carrera de los dos grupos había sido la misma antes del tratamiento. De hecho, incluso si los
sujetos de control hubieran sido elegidos para igualar las velocidades de carrera del grupo
experimental, no podríamos estar seguros de que las diferencias entre los grupos después del
entrenamiento se debieran a los efectos del entrenamiento. Quedaría la posibilidad de que los dos
grupos hubieran sido muestreados de poblaciones que diferían antes del estudio.
Cuando existen diferencias de población, existe la posibilidad de ser engañado por lo que se conoce
como artefactos de regresión, o efectos experimentales producidos por “regresión estadística”, en
lugar de manipulaciones experimentales. Discutimos los artefactos de regresión en el Capítulo 2.
Quizás un ejemplo ayude aquí. Suponga que usted es un estudiante A y que su vecino es un
estudiante C, aunque ambos tienen antecedentes similares. En una tarea en particular, ambos
reciben una B. En un esfuerzo por mejorar, su vecino decide asistir a una serie de sesiones de
ayuda. Su instructor decide evaluar la efectividad de las sesiones de ayuda comparando las
calificaciones futuras de los estudiantes de la sesión de ayuda con las calificaciones futuras de los
estudiantes que no son de la sesión de ayuda que tienen antecedentes similares y recibieron las
mismas calificaciones en la tarea anterior. Usted es seleccionado como el estudiante emparejado
para ser comparado con su amigo.
En la próxima tarea, usted recibe una A- y su amigo recibe una C.
El curso de los acontecimientos en este programa de evaluación se ilustra en la Tabla 12.2. Tenga
en cuenta los cambios en la calificación del criterio en función de la calificación media de la persona.
¿Debería el instructor concluir que las sesiones de ayuda son dañinas porque su amigo pasó de a
, mientras
retrocedieron hacia sus
que
calificaciones
usted pasó medias.
de B a A-?
El efecto
Probablemente
visto en este
no, ya
pequeño
que ambos
estudio
simplemente
probablemente
no sea un verdadero efecto de tratamiento sino más bien un artefacto de regresión causado por el
hecho de que usted y su amigo no eran realmente estudiantes equivalentes. La sesión de ayuda
puede incluso tener
ÿ TABLA 12.2
Ilustración de cómo la regresión a la media puede confundir la interpretación

del resultado de un cuasi-experimento. Aunque ambas personas fueron
emparejadas como estudiantes B, su desempeño, con o sin la sesión de
ayuda, retrocedió hacia su calificación promedio real. ¿Ayudó la sesión de ayud
Persona Grado medio Grado coincidente Sesión de ayuda Grado de criterio
Tú A B No A
Vecino C B Sí C
59533_13_ch12_p327-357.indd 346 9533_13_ch12_p327-357.indd 346 3/5/08 /5/08

beneficiado a su amigo, ya que su calificación fue más alta que la calificación habitual de C. Si los
estudiantes B en la primera asignación hubieran sido asignados aleatoriamente a grupos de sesión de
ayuda o sin sesión de ayuda y luego se compararan sobre la base de las calificaciones en la segunda
tarea, se podría haber obtenido una evaluación precisa del efecto de las sesiones de ayuda en las
calificaciones de los estudiantes.
El fenómeno de la regresión a la media ocurre porque todas las medidas psicológicas están sujetas
a una cierta cantidad de variabilidad. Con cualquier medida que no sea perfectamente fiable, el grupo de
sujetos que obtienen las puntuaciones más altas incluye no sólo a los que realmente pertenecen a la
categoría más alta, sino también a otros que fueron colocados en esta categoría por errores de medición
fortuitos. En una nueva prueba, estos errores de medición fortuitos no necesariamente ocurrirán en la
misma dirección. Por lo tanto, las puntuaciones del grupo más alto tenderán a tener un promedio más
bajo en una nueva prueba. De manera similar, un grupo seleccionado por un desempeño deficiente en
una prueba original tenderá a tener un promedio más alto en una nueva prueba.
La sección de Psicología en acción al final de este capítulo pretende brindarle una mejor comprensión
de este punto a través de una simple demostración de la regresión a la media. La importancia de los
artefactos de regresión como este en los estudios cuasi-experimentales de la educación compensatoria
ha sido objeto de mucho debate. Un estudio influyente de los efectos del programa Head Start de la
década de 1960 (Cicirelli & Granger, 1969) recibió especial atención. En este estudio, llamado estudio
de Westinghouse-Ohio, los niños que completaron su experiencia de Head Start fueron seleccionados al
azar para su evaluación. Luego defi nieron una población de control de niños de la misma área que
habían sido elegibles para el programa pero no habían asistido. Los niños de control se seleccionaron al
azar para emparejarlos con los niños experimentales en función del sexo, la pertenencia a un grupo
étnico-racial y la asistencia al jardín de infancia. Tenga en cuenta que los niños fueron seleccionados de
dos grupos diferentes: uno que asistía a Head Start y otro que no asistía. Después de que los
investigadores hicieran la selección final de los sujetos experimentales y de control, compilaron y
compararon medidas adicionales de nivel socioeconómico, estado demográfico y actitud para los dos
grupos. Las diferencias fueron leves.
Luego se calcularon y compararon las medidas del rendimiento académico y el potencial de los niños
experimentales (Head Start) y de control (sin Head Start). La conclusión general de este gran estudio fue
que Head Start no fue eficaz para eliminar los efectos de la pobreza y la desventaja social.
Otros psicólogos (Campbell y Erlebacher, 1970a) se apresuraron a criticar este estudio por varios
motivos. Primero, señalaron que los resultados del estudio sin duda fueron causados parcialmente por
artefactos de regresión. Peor aún, no se pudo estimar la magnitud de los artefactos, lo que arrojó dudas
sobre todo el conjunto de hallazgos.
El problema básico es el de hacer coincidir (ver el Capítulo 2 para un ejemplo similar).
Cicirelli y sus compañeros de trabajo intentaron encomiablemente unir una muestra de niños
desfavorecidos que habían estado en el programa Head Start con otros de la misma área que no habían
estado en el programa. Las diferencias posteriores entre los dos grupos deberían haberse debido al
programa, ¿no? No necesariamente. Es correcto solo si las dos muestras provienen de las mismas
distribuciones de población subyacentes, lo cual es poco probable. Lo que es probable es que las dos
poblaciones difieran, con los niños de "tratamiento" desfavorecidos provenientes de una población que
era más pobre en capacidad que los niños de "control". Los niños de “tratamiento” que asistieron a Head
Start generalmente fueron preseleccionados para ser de un entorno desfavorecido (razón por la cual
fueron incluidos en el programa), mientras que los “controles” que no estaban en el programa pueden
haber venido de una población diferente que era mayor en habilidad. El problema básico es que los
sujetos no fueron asignados aleatoriamente a
59533_13_ch12_p327-357.indd 347 9533_13_ch12_p327-357.indd 347 3/5/08 /5/08

condiciones, por lo que los investigadores tuvieron que tratar de emparejar sujetos de control con
sujetos experimentales. Para emparejar dos muestras de estas poblaciones diferentes, los
experimentadores habrían tenido que seleccionar niños por encima de la media de la población
para el grupo de tratamiento desfavorecido y por debajo de la media para el grupo de control. Pero
cuando se hace esto, siempre se introducirá el temido artefacto de regresión. Cuando se vuelve a
evaluar a cada grupo, el desempeño de los individuos tenderá a regresar a la media del grupo; en
otras palabras, el grupo desfavorecido tenderá a desempeñarse peor en este ejemplo, y el grupo
de control tenderá a desempeñarse mejor.
Esta regresión a la media ocurrirá en ausencia de cualquier tratamiento dado a cualquier
grupo y a pesar del emparejamiento. El efecto es el mismo que en el ejemplo anterior de las
calificaciones del estudiante superior aumentando a A- desde B y el otro disminuyendo de B a C-,
cuando los dos estudiantes fueron erróneamente “emparejados” como estudiantes B. Dado que ya
esperamos una diferencia entre los grupos (a favor del control) en esta situación debido a la
regresión a la media, ¿cómo evaluamos el resultado de nuestro estudio? Cicirelli y colaboradores
no encontraron diferencias entre los grupos. Dado que podríamos esperar que el grupo de
tratamiento (Head Start) en realidad fuera peor debido a los artefactos de regresión, ¿significa esto
que el grupo realmente mejoró debido a Head Start? Es imposible responder a esta pregunta,
porque en Westinghouse–
Ohio de Head Start, no se pudo evaluar la dirección o magnitud de los artefactos de regresión.
En el párrafo anterior, hicimos suposiciones razonables acerca de los artefactos de regresión

en este tipo de estudio. Pero la conclusión de que Head Start no tuvo ningún efecto no puede
extraerse del estudio de Westinghouse-Ohio. Más correctamente, no se puede sacar ninguna
conclusión sobre la base de ese estudio, ya que no se sabe cómo los artefactos de regresión
afectaron los resultados.
En general, entonces, los artefactos de regresión de una magnitud difícil de estimar son
altamente probables en este tipo de estudio, y este hecho es reconocido por todos. ¿Por qué,
entonces, se llevarían a cabo tales estudios, particularmente cuando decisiones políticas,
económicas y sociales muy importantes podrían basarse en sus resultados? Esta pregunta fue
planteada por Campbell y Erlebacher (1970a, 1970b) y por Cicirelli y sus partidarios (Cicirelli, 1970;
Evans y Schiller, 1970). Sus respuestas fueron bastante diferentes y representan el tipo de
problema que con frecuencia enfrentan los científicos pero que la ciencia nunca puede resolver.
Campbell y Erlebacher propusieron que la mala información era peor que la falta de información: si
no se podían realizar experimentos controlados adecuadamente, entonces no se deberían recopilar
datos. Del otro lado de la cuestión, Evans y Schiller respondieron: “Esta posición no comprende
que todo programa será evaluado por los medios más arbitrarios, anecdóticos, partidistas y
subjetivos” (p. 220).
Campbell y Erlebacher estuvieron de acuerdo, pero declararon: “Consideramos que es
fundamentalmente engañoso otorgar el prestigio de la ciencia a cualquier informe en una situación
en la que no es posible una evaluación científica” (1970b, p. 224). Como última solución, propusieron
que se convocara una comisión “integrada por expertos que aún no son partidistas en esta
controversia” para decidir el asunto.
Puede ser imposible decidir este tema sobre bases estrictamente racionales, pero todos
podemos estar de acuerdo en que un estudio de investigación debe realizarse de acuerdo con los
mejores procedimientos científicos disponibles. ¿Cómo se podría haber realizado correctamente el
estudio Westinghouse-Ohio?
Una solución sería asignar aleatoriamente a todos los niños a diferentes grupos y ponerlos en
diferentes programas, para enfrentar la efectividad de los programas contra
59533_13_ch12_p327-357.indd 348 9533_13_ch12_p327-357.indd 348 3/5/08 /5/08

unos y otros. Una dificultad aquí sería que los programas de capacitación podrían resultar
igualmente efectivos. Entonces uno no podía saber si alguno de ellos era mejor que ningún
programa.
La mejor forma de diseñar el estudio de Westinghouse-Ohio habría sido asignar al azar a
los participantes a la condición sin tratamiento o con tratamiento (Head Start) al principio. No
hay sustituto para la asignación aleatoria en la eliminación de factores de confusión. Pero
parece injusto que la mitad de los niños que buscan la ayuda de un programa de recuperación
no reciban formación alguna. Por supuesto, no hay garantía desde el principio de que el
programa les hará ningún bien; eso es lo que el estudio pretende descubrir. El mismo problema
ocurre en la investigación médica cuando a un grupo de control con una enfermedad se le da
un placebo en lugar de un fármaco de tratamiento. Es posible en ambos casos que, al final,
más personas se beneficien de una investigación cuidadosa sobre la efectividad de los
tratamientos que las que puedan verse perjudicadas por la suspensión del tratamiento.
¿Qué sucede cuando los niños son asignados aleatoriamente a un tratamiento y no

reciben condiciones de tratamiento? Considere un experimento longitudinal de 4 años y medio
realizado por Breitmayer y Ramey (1986). Los sujetos de su trabajo fueron 80 niños de familias
desfavorecidas de una gran ciudad estadounidense. Al nacer, la mitad de los niños fueron
asignados aleatoriamente al grupo de control sin tratamiento. Los niños control asistieron a una
guardería hasta el final del experimento, pero no recibieron ningún tratamiento educativo
especial. La otra mitad de los niños fueron asignados aleatoriamente al grupo de tratamiento.
Su guardería incluía un programa tipo Head Start que fue diseñado para prevenir el retraso
mental. Todos los sujetos del experimento tuvieron un parto normal y pesaron al menos 5
libras. En el primer minuto después del nacimiento, se evaluó la capacidad de respuesta
biológica de los recién nacidos en una escala similar a la ideada por Brazelton que se describió
en el Capítulo 3. Los resultados de esta prueba indicaron que un poco más de la mitad de los
bebés en los grupos de control y experimental no eran biológicamente óptimos inmediatamente
después del nacimiento. Entonces, terminamos con cuatro grupos en este experimento:
experimental (cuidado diurno enriquecido educativamente)/óptimo; control (cuidado diurno
ordinario)/óptimo; experimental/no óptimo; y control/no óptimo.
Las medidas de inteligencia a la edad de 41 ÿ2 indicaron tres hallazgos importantes. En

primer lugar, los niños biológicamente óptimos en el primer minuto después del nacimiento
puntuaron más alto en las pruebas de inteligencia que los niños biológicamente no óptimos.
En segundo lugar, a los niños tratados educativamente les fue algo mejor que a los sujetos
de control en la parte verbal de la prueba, y los sujetos experimentales superaron con creces a
los sujetos de control en el componente de desempeño. Finalmente, la mayor parte del efecto
de la educación se debió a una interacción: los sujetos de control no óptimos obtuvieron
resultados especialmente malos en todos los aspectos de la prueba de inteligencia. Los
resultados ilustrativos se muestran en la Figura 12.3. Esta interacción es similar al ejemplo de
sinergismo mencionado en el Capítulo 2. Dado que el examen posterior reveló situaciones
hogareñas muy similares para los dos grupos, Breitmayer y Ramey pudieron concluir con
seguridad que la educación temprana tiene algunos beneficios importantes:
especialmente para los niños que no son biológicamente óptimos al nacer. Para el lector que
esté intrigado por este hallazgo, recomendamos el libro de Ellsworth y Ames (1998) sobre Head
Start, que ofrece un panorama general del programa y sus objetivos (ver también Arnold,
Fisher, Doctoroff y Dobbs, 2002; Mantzicopoulos, 2003; Slaughter-Defoe & Rubin, 2001).
59533_13_ch12_p327-357.indd 349 9533_13_ch12_p327-357.indd 349 3/5/08 /5/08

Educativamente
tratado
50
45
rendimiento
percepción/
Puntuación
de
Educativamente
sin tratar
40
35
Óptimo no óptimo
Puntuación en la prueba de detección al nacer
ÿ FIGURA 12.3
Los resultados de Breitmayer y Ramey (1986), que muestran una interacción del tratamiento educativo
y la salud al nacer en la puntuación de percepción/desempeño obtenida a los cincuenta y cuatro meses
de edad. Se observaron interacciones similares, aunque no tan pronunciadas, en las puntuaciones de
las partes verbal y cuantitativa de las pruebas de inteligencia.

LA TUERCAS Y PERNOS
Problema ¿Qué roles juegan la motivación y la emoción en el desempeño intelectual?
Muchos de ustedes pueden tener fobia a las matemáticas; otros de ustedes pueden odiar los exámenes de
opción múltiple. Si pertenece a cualquiera de esos grupos, o si tiene gustos o disgustos intelectuales
particulares que pueden influir en su desempeño en los exámenes, entonces está mostrando los efectos de
la motivación y la emoción en el desempeño intelectual.
Tales gustos y disgustos deberían ser particularmente importantes para que los maestros de escuela primaria
identifiquen, porque una vez que a un estudiante comienza a disgustarle algo, podría surgir un efecto de bola
de nieve. Por ejemplo, supongamos que a un estudiante joven le comienzan a disgustar las matemáticas por
alguna razón. Ese estudiante no solo encontrará aversivos los exámenes de matemáticas, sino que también
encontrará aversivo el aprendizaje de las matemáticas. No aprender conceptos matemáticos más nuevos
conducirá a un desempeño deficiente en las pruebas, lo que aumentará la aversión, y así sucesivamente.
Los puntos de vista emocionales hacia las búsquedas cognitivas no necesitan ser específicos. Dweck y
sus asociados han identificado dos metas generales que los niños parecen tener cuando emprenden
actividades intelectuales, y estas metas se manifiestan en las teorías primitivas que los niños tienen sobre la
inteligencia (Dweck, 1999; Dweck & Bempechat, 1983; Dweck & Elliott, 1983). ; Levy, Plaks, Hong, Chiu y
Dweck, 2001). Algunos niños adoptan lo que se llama metas de desempeño.
Estos niños parecen estar motivados por no parecer tontos; quieren verse inteligentes y no recibir evaluaciones
negativas de sus compañeros o sus maestros.
Los niños que adoptan metas de desempeño tienen lo que Dweck llama una entidad, la teoría de la
inteligencia. Estos niños creen que la inteligencia fija que tienen se evalúa mejor por qué tan bien los evalúan
los demás y qué tan bien lo hacen.
59533_13_ch12_p327-357.indd 350 9533_13_ch12_p327-357.indd 350 3/5/08 /5/08

en las tareas intelectuales. Otros niños tienden a estar motivados por objetivos de aprendizaje,
en los que intentan volverse más inteligentes aprendiendo nuevas habilidades y conocimientos.
Los niños que están motivados por metas de aprendizaje creen en lo que Dweck llama una
teoría incremental instrumental, que se refiere a su creencia de que la inteligencia es un
conjunto de habilidades y conocimientos que pueden incrementarse a través del trabajo duro y
el esfuerzo. ¿Cómo afectan estos objetivos al rendimiento de los jóvenes? ¿Las metas son
benéficas en algunas circunstancias? Estos son los temas tratados aquí.
Problema ¿Cómo infl uyen las metas motivacionales de los niños en su

desempeño intelectual?
Podríamos esperar que la forma en que las metas de los niños influyan en su desempeño
interactúe con las demandas de la tarea (Hetherington y Parke, 1986). Si la situación exige un
desempeño rápido, preciso y correcto, entonces podemos esperar que los teóricos de entidades
se desempeñen mejor que si la situación requiere un nuevo aprendizaje y un esfuerzo
sustancial. Para los teóricos instrumentales incrementales, en cambio, debería darse un mejor
desempeño en esta última situación, que requiere esfuerzo y nuevos aprendizajes.
Hipótesis La naturaleza de la tarea y las metas motivacionales de los niños

interactuarán de tal manera que el desempeño intelectual será mejor en
aquellas situaciones que pongan énfasis en metas congruentes con las de los
niños, y el desempeño intelectual se verá afectado en aquellas situaciones en
las que la tarea exija metas motivacionales. están en conflicto.
Un diseño experimental para probar esta hipótesis requiere dos grupos de niños: entidad e
instrumental incremental. Cada uno de estos grupos debe ser evaluado bajo dos condiciones:
metas de desempeño y metas de aprendizaje. Por lo tanto, el diseño sería mixto con el grupo
de sujetos como una variable entre sujetos y la condición de prueba como una variable dentro
de los sujetos.
La razón principal para incluir estas dos variables es buscar la interacción entre ellas. Esto
es muy importante cuando una de las variables es una variable casi independiente, como lo
son las variables sujeto. Dado que la variable sujeto debe ser seleccionada y no manipulada,
es importante buscar el efecto diferencial de una variable independiente real en los diferentes
niveles de la variable sujeto.
Lo primero que se debe hacer en esta investigación es seleccionar sujetos en los dos
grupos. Desafortunadamente, no hay pruebas publicadas que sirvan para este propósito.
Sin embargo, Dweck ha proporcionado una forma bastante sencilla de distinguir entre los
teóricos de la entidad y los incrementales instrumentales. Se les pide a los niños que elijan una
de dos afirmaciones sobre la inteligencia, donde una afirmación refleja metas de desempeño y
la otra refleja metas de aprendizaje. Por lo tanto, tendría que inventar una serie de tales pares
de declaraciones (digamos, 16). El puntaje de un niño en esta prueba sería el número de veces
que se seleccionó un tipo particular de declaración. La puntuación de una entidad podría oscilar
entre 0 y 16 en este ejemplo. Algunos ejemplos de los tipos de sentencias que puede generar
son:
1. (a) Puedes aprender cosas nuevas, pero lo inteligente que eres se mantiene bastante
lo mismo.
(b) La inteligencia es algo que puedes aumentar tanto como quieras.
59533_13_ch12_p327-357.indd 351 9533_13_ch12_p327-357.indd 351 3/5/08 /5/08

2. (a) Me siento inteligente cuando no cometo errores.
(b) Me siento inteligente cuando descubro cómo hacer algo.
3. (a) Me gusta el trabajo escolar cuando puedo entregar mis papeles primero.
(b) Me gusta el trabajo escolar cuando aprendo algo nuevo.
4. (a) Me siento inteligente cuando tengo un trabajo fácil.
(b) Me siento inteligente cuando estoy leyendo un libro duro.
La manera más fácil de determinar a qué grupo pertenece un niño es calcular la puntuación de entidad mediana
(es decir, la del medio) para todos los niños que tomaron la prueba. Luego, asigna a los niños al grupo de
entidades que puntuaron alrededor de la mediana del grupo, y asigna al resto de los niños, aquellos que
puntuaron por debajo de la mediana, al grupo incremental instrumental. Diseñar una prueba confiable y válida
podría ser extremadamente difícil y llevar mucho tiempo. También es posible que le resulte difícil obtener una
amplia variedad de puntajes en su examen. Para asegurarse de obtener muchos niños con puntajes muy altos
y muchos con puntajes muy bajos, es posible que deba revisar el conjunto de preguntas de la prueba hasta
que encuentre un conjunto que produzca una buena distribución de puntajes.
Después de determinar la pertenencia al grupo de un número de niños (alrededor de 15 en cada grupo

sería un buen número mínimo), deberá idear situaciones de prueba. Aquí, el trabajo previo de Dweck y sus
asociados puede ser de alguna ayuda. Dweck y Bempechat (1983) describen varios tipos de tareas entre las
que pidieron a los niños de la entidad y de los grupos incrementales instrumentales que eligieran y que hicieran
estimaciones sobre qué tan bien lo harían.
Estas tareas diferían en su dificultad y en los objetivos de desempeño (aprender o parecer inteligente). Después
de hacer sus elecciones, a todos los niños se les dio la misma tarea, que era de dificultad moderada. Por lo
tanto, manipularon la percepción de los niños sobre la tarea mediante instrucciones previas. El mismo tipo de
procedimiento podría realizarse en el presente experimento. Podría usar instrucciones similares a las que usó
Dweck y luego hacer que los niños realicen alguna tarea. Para evaluar a la mayoría de los niños, a menudo es
útil sugerirles que el procedimiento de prueba es una especie de juego. Esto se hace para mantener su
motivación e interés. Para la tarea orientada al aprendizaje, se les puede decir a los niños lo siguiente: “En este
juego probablemente aprenderás algunas cosas nuevas, pero también cometerás algunos errores. Puede que
te confundas y te sientas tonto, pero deberías aprender algunas cosas interesantes”. Para la tarea orientada al
rendimiento, las instrucciones podrían ser: “Este juego es muy divertido porque es más fácil que otros. Aunque
no aprenderá mucho, realmente me mostrará cuánto pueden hacer los niños”. A continuación, necesitará dos
tareas, una para cada conjunto de instrucciones. Para mantener el interés de los niños, las dos tareas no deben
ser demasiado similares. Pero con dos tareas diferentes tendrás que equilibrar las tareas a través de
instrucciones para los dos grupos de niños. Seleccionar tareas puede ser difícil, pero la forma más directa de
encontrarlas sería obtener la ayuda de un maestro de niños que tengan la misma edad que los sujetos de
prueba. El maestro debería poder ayudarlo a seleccionar dos tareas intelectuales que el típico estudiante de
tercer grado, por ejemplo, encontraría de dificultad moderada.
culto Llamemos a las dos tareas que seleccione A y B. En la tabla 12.3 se ilustran un contrapeso adecuado y
una descripción general del diseño.
Se predice que los sujetos del grupo entidad tendrán peor desempeño en la tarea precedida por el
aprendizaje de instrucciones que en la tarea precedida por la ejecución.
59533_13_ch12_p327-357.indd 352 9533_13_ch12_p327-357.indd 352 3/5/08 /5/08

ÿ TABLA 12.3
Diseño y Contrapeso para las Combinaciones

de Dos Tareas (A y B) y Dos Tipos de
Instrucciones (Ejecución y Aprendizaje).
Los números en la tabla indican el número de
sujetos en cada condición.
Se supone que el número total de sujetos en
cada grupo es dieciséis.
Grupo Primer examen Segunda prueba
(4) Tarea A/Desempeño Tarea B/Aprendizaje
(4) Tarea B/Desempeño Tarea A/Aprendizaje
Entidad (4) Tarea A/Aprendizaje Tarea B/Desempeño
(4) Tarea B/Aprendizaje Tarea A/Rendimiento
(4) Tarea A/Desempeño Tarea B/Aprendizaje

Instrumental (4) Tarea B/Desempeño Tarea A/Aprendizaje
incrementales (4) Tarea A/Aprendizaje Tarea B/Desempeño
(4) Tarea B/Aprendizaje Tarea A/Rendimiento
instrucciones. Por otro lado, esperamos que los sujetos incrementales instrumentales lo
hagan mejor en la tarea precedida por las instrucciones de aprendizaje y peor en la tarea
precedida por las instrucciones de ejecución.
Este proyecto de investigación parece ser manejable, con la posible excepción de
desarrollar la prueba de teoría de entidades. Sin embargo, la investigación sobre variables
temáticas, especialmente con niños, presenta muchas dificultades para el investigador. Un
problema tiene que ver con la ética. Dado que es poco probable que un niño pueda dar un
verdadero consentimiento informado para participar en un experimento, se debe permitir
que los padres de los niños indiquen si quieren que su hijo participe. Esto significa que
tendría que acercarse a un maestro de escuela primaria, obtener su consentimiento para
evaluar a los estudiantes y luego hacer que los padres firmen un formulario de consentimien
Su profesor podrá ayudarlo a diseñar un formulario de consentimiento que sea aceptable
para estos fines.
Otro tema que hay que resolver es la edad de los niños. La mayoría de los trabajos
anteriores han utilizado niños en los grados de escuela primaria y secundaria, y eso sería
una apuesta segura aquí. Si los niños son demasiado pequeños, por ejemplo, en edad
preescolar, es posible que no tengan una idea bien desarrollada de lo que significa ser intelig
Por otro lado, los estudiantes de secundaria pueden ser demasiado sofisticados en sus
creencias sobre la inteligencia para permitirle generar diferentes grupos de sujetos.
Sin embargo, Dweck, Mangels y Good (2004) informan sobre experimentos que mejoraron
con éxito la motivación intelectual en estudiantes universitarios.
Otro tema más tiene que ver con el género. ¿Quiere evaluar solo a niños, solo a niñas
o una mezcla? Dweck y colegas (2004) informan que los niños y las niñas responden de
manera diferente a las situaciones de aprendizaje y desempeño, por lo que al menos le
gustaría asegurarse de tener la misma proporción de cada sexo en cada uno de sus
grupos de prueba, como el 45 por ciento. chicos de cada grupo. Por otro lado, si está
interesado en las formas en que los niños y las niñas pueden
59533_13_ch12_p327-357.indd 353 9533_13_ch12_p327-357.indd 353 3/5/08 /5/08

difieren en su situación, podría considerar incluir el género como una variable temática
adicional.
La investigación sobre variables temáticas suele ser particularmente interesante y,
con frecuencia, se refiere a cuestiones que tienen importancia práctica. Sin embargo, no
pierda de vista el hecho de que las variables del sujeto son seleccionadas y no manipuladas.
Las conclusiones que saque deben reconocer que no está trabajando con una verdadera
variable independiente.
ÿ RESUMEN
1. El enfoque empírico de las diferencias individuales se basa diseños transversales y longitudinales dentro de él y
en encontrar correlatos de la diferencia en cuestión, como permite la evaluación de la variación causada por el
las pruebas de inteligencia diseñadas para predecir los cambio de épocas o épocas (en lugar de la edad) a través
puntajes escolares. Las teorías analíticas de las diferencias del examen del diseño de desfase temporal incorporado.
individuales intentan proporcionar explicaciones señalando En el diseño de lapso de tiempo, las personas de la misma
las diferencias en los procesos psicológicos subyacentes. edad se examinan en diferentes eras, lo que revela el
Las teorías de la naturaleza sobre las diferencias efecto de la era en lugar de la edad. El diseño secuencial
individuales sostienen que la genética subyace en ellas, cruzado permite hacer inferencias más fuertes sobre los
mientras que la visión de la crianza se centra en los efectos de la edad, sin confundirlos con otros factores,
factores experienciales que influyen en el desarrollo de un pero desafortunadamente tales diseños son difíciles de
organismo. Una visión más completa, de Hebb, propone implementar en la práctica. La mayor parte de la
dar cuenta de las diferencias individuales considerando investigación sobre el desarrollo todavía se basa en el
seis factores que interactúan. enfoque transversal, con intentos de emparejar a las
2. La confiabilidad de los instrumentos y dispositivos de personas en otros factores, como el estatus socioeconómico.
medición es crucial para toda investigación científi ca, 4. Las definiciones operativas de los constructos psicológicos
incluido el estudio de las diferencias individuales. Es difícil implican especificar el constructo en términos de las
idear medidas fiables de habilidades mentales complicadas operaciones experimentales utilizadas para estudiarlo. La
como la inteligencia, pero si se derivan medidas fiables, prueba de Turing define la inteligencia de tal manera que
se pueden utilizar para investigar cuestiones tan las máquinas podrían poseer inteligencia. La controversia
interesantes como la estabilidad de la cantidad, medida suscitada por esta prueba apunta al problema de la validez
durante largos períodos. de las definiciones operativas.
3. El diseño más común utilizado en la investigación del 5. Cuando las diferencias individuales, como la inteligencia,
desarrollo es el diseño transversal, en el que se evalúa a el peso o la edad, se examinan en experimentos, se
personas de diferentes edades (una sección transversal denominan variables de sujeto. Por su naturaleza, las
de la población). Desafortunadamente, cualquier diferencia variables de sujeto impiden la asignación aleatoria de
encontrada puede deberse a factores que se confunden sujetos a condiciones; uno debe evitar concluir que los
con la edad, como las diferencias en la educación u otras efectos experimentales son producidos por las variables
experiencias de vida particulares. En el diseño longitudinal, del sujeto, porque algún factor de confusión puede haber
el mismo grupo de personas se prueba repetidamente a producido el efecto.
medida que envejecen, eliminando así gran parte de la 6. En los estudios en los que los sujetos de dos grupos (un
confusión que ocurre en el enfoque transversal. tratamiento y un control) se emparejan según algún
Desafortunadamente, en algunos casos el diseño criterio en lugar de ser asignados al azar a los dos grupos,
longitudinal también puede ser engañoso, cuando los existe una gran probabilidad de que la regresión estadística
cambios observados no se deben a la edad per se, sino a afecte los resultados y las conclusiones. dibujado. Cuando
experiencias de vida que simplemente están se seleccionan grupos extremos de sujetos (extremo en
unamúltiples
correlacionadas con la edad. El diseño secuencial cruzado incorpora dimensión), sus puntajes
59533_13_ch12_p327-357.indd 354 9533_13_ch12_p327-357.indd 354 3/5/08 /5/08

al volver a realizar la prueba tenderá hacia la media del grupo. Por lo tanto, se vuelve difícil o imposible evaluar el efecto del
Esto ocurre a pesar de coincidir con otros criterios. Esto puede tratamiento en estudios que emplean dichos diseños cuasi-
afectar materialmente el resultado de un estudio, porque experimentales ex post facto . La única forma segura de evitar el
esperamos que las puntuaciones de los grupos cambien incluso problema es, en primer lugar, asignar sujetos aleatoriamente a
sin ningún tratamiento intermedio. las condiciones.
ÿ TÉRMINOS CLAVE
aproximación analítica teoría de la naturaleza
afásico nutrir la vista

inteligencia artificial (IA) definiciones operacionales
cuarto chino formas paralelas
edad cronológica validez predictiva (criterio)
efectos de cohorte diseños cuasiexperimentales
cohortes artefactos de regresión
validez de constructo regresión a la media
diseño transversal fiabilidad
diseño secuencial cruzado confiabilidad dividida por la mitad
enfoque empírico IA fuerte

validez aparente variables de sujeto
efectos de la historia fiabilidad test-retest
juego de imitación diseño de retardo de tiempo
inteligencia tonal agnosia

diseño longitudinal prueba de Turing
edad mental IA débil

inteligencias multiples
1. A menudo, las pruebas psicológicas se construyen para medir 3. Discuta las ventajas y desventajas de cada uno de los siguientes
algún constructo psicológico, como la inteligencia, la depresión diseños de investigación para la investigación del desarrollo:
o la restricción dietética. Un requisito primordial es que dichas
pruebas sean fiables. ¿Qué es la confiabilidad? Discuta tres una. transversal
formas diferentes de evaluar la confiabilidad en una prueba b. Longitudinal

psicológica. C. Secuencial cruzada
2. Discuta las razones por las que las definiciones operativas son 4. Discuta el enfoque fuerte de IA para la inteligencia. ¿Son las
necesarias en psicología. Proporcione dos definiciones operativas computadoras inteligentes?
para cada una de las siguientes construcciones: 5. Una psicoterapeuta está interesada en evaluar la eficacia de la
una. Sed nueva terapia que ha inventado. Se llama terapia con mascotas y
b. Inteligencia consiste en convencer a las personas deprimidas de que tengan
C. Capacidad de memoria un perro como mascota, con la esperanza de que cuidar a un
d. satisfacción sexual perro los anime. Para evaluar la terapia, la terapeuta le da a cada
mi. Miedo a las serpientes uno de sus pacientes un perro de Humane Society para que lo
¿Le preocupa que pueda haber más de una definición del “mismo” cuide. Ella mide la depresión usando una prueba escrita.
constructo?
59533_13_ch12_p327-357.indd 355 9533_13_ch12_p327-357.indd 355 3/5/08 /5/08

(que ha demostrado ser confiable) una semana antes de que 6. Discuta la siguiente declaración: “Todos los experimentos que
obtengan las mascotas y luego nuevamente 2 meses después. involucran variables del sujeto son cuasi-experimentos; los
Descubre que los pacientes están mucho menos deprimidos resultados obtenidos son siempre de naturaleza correlacional
cuando se les evalúa por segunda vez y así concluye y posiblemente contaminados por factores de confusión”.
que la terapia con mascotas es un éxito. Discuta varias cosas ¿Es cierta esta afirmación? ¿Se te ocurren excepciones? Al
que están mal con esta pieza de investigación y la conclusión tratar de hacerlo, haga una lista de todas las variables
extraída de ella. ¿Cómo es probable que hayan jugado un temáticas que se le ocurran y que puedan ser de interés para
papel los artefactos de regresión? ¿Cómo podría haberse los psicólogos.
hecho mejor la investigación?
CONEXIONES WEB
Puede encontrar la página de inicio del Dr. Bala Ambati en:
http://www.mcg.edu/eyes/Ambati_Page.html
Los siguientes sitios tienen documentos que puede descargar sobre el trabajo de Howard Gardner sobre
las inteligencias múltiples:
http://pzweb.harvard.edu/PIs/HG.htm
http://www.howardgardner.com/Papers/papers.html
El siguiente sitio detalla la historia de las pruebas y teorías de inteligencia, y tiene enlaces a las
descripciones de los principales investigadores:
http://www.indiana.edu/intell/
Una demostración de artefactos de regresión

Un problema serio en muchos dominios de investigación se conoce como regresión estadística a la
media o artefacto de regresión. Puedes apreciar mejor este fenómeno permitiéndote convertirte en una
víctima de él. Pruebe el siguiente experimento, siguiendo los pasos que se indican:
1. Tira seis dados en una mesa frente a ti.

2. Coloque los tres dados que muestran los números más bajos a la izquierda y los tres dados que
muestran los números más altos a la derecha. En caso de empate, asigna aleatoriamente los dados
a los dos grupos.
3. Calcule y registre el número medio por dado para cada grupo de tres dados.
4. Levanta ambas manos sobre tu cabeza y proclama en voz alta: “Mejora, en el nombre de
Ciencias."
5. Tirar los tres dados de puntuación baja y calcular un nuevo número medio por dado para el
grupo bajo.
6. Lanza los tres dados con la puntuación más alta y calcula un nuevo número medio por dado para el
grupo alto.
7. Compare las puntuaciones previas y posteriores al tratamiento para ambos grupos. Combina tus datos
con los de tus compañeros, si es posible.
59533_13_ch12_p327-357.indd 356 9533_13_ch12_p327-357.indd 356 3/5/08 /5/08

En promedio, este procedimiento producirá un aumento en el desempeño del grupo bajo y
una disminución en el desempeño del grupo alto. Puede sentirse tentado a concluir que invocar
el nombre de la ciencia tiene un efecto benéfico en los dados de bajo rendimiento y que los
dados de rendimiento superior requieren una atención más individualizada para mantener su
rendimiento sobresaliente. Tales conclusiones, sin embargo, no tienen en cuenta los efectos de
la regresión, que reflejan la tendencia de muchos tipos de medidas a arrojar valores cercanos a
su media. Sabes que la tirada de un dado justo puede arrojar valores del 1 al 6, pero que el
valor promedio de muchas tiradas será de alrededor de 3,5. La probabilidad de que el promedio
de tres dados esté cerca de 3.5 es mayor que la probabilidad de que este promedio esté cerca
de 1 o 6. Por lo tanto, cuando selecciona tres dados que le dan un promedio bajo y los vuelve a
tirar, tenderán a dar resultados. un valor promedio más alto (un valor más cercano a la media de 3
De la misma manera, los tres dados del grupo alto deberían arrojar un valor más bajo cuando
se vuelvan a tirar. En ambos casos, lo que estás observando es una regresión a la media. ÿ
59533_13_ch12_p327-357.indd 357 9533_13_ch12_p327-357.indd 357 3/5/08 /5/08

CAPÍTULO 13
SOCIAL
PSICOLOGÍA
LOS ORÍGENES DE LA PSICOLOGÍA SOCIAL

ILUSTRACIONES
Control Experimental: Obediencia a la Autoridad

Condiciones que fomentan la obediencia

ILUSTRACIONES
Características de la demanda y sesgo del experimentador: hipnosis

ILUSTRACIONES
Investigación de campo: Intervención de espectadores

ILUSTRACIONES
Elección de la variable dependiente: medición de estereotipos y
Prejuicio

¿Cómo afecta la presencia de otras personas el desempeño de una
persona en una tarea?
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: EL PODER DE ESTAR EN UNA
EXPERIMENTO
59533_14_ch13_p358-387.indd 358 9533_14_ch13_p358-387.indd 358 3/5/08 /5/08

Sabemos más sobre el átomo que nosotros mismos, y las consecuencias están
por todas partes a la vista. (CARL KAYSEN)
El comportamiento de cada ser humano está potencialmente determinado por una red de infl uencias
sociales y culturales complejas. Muchos de los actos que realizamos todos los días están determinados
por la cultura y la sociedad en la que nacemos y crecimos. Nuestra experiencia está limitada por nuestra
cultura, por lo que estamos expuestos solo a un conjunto muy pequeño de acciones potenciales que los
humanos podrían realizar. La mayoría de la gente en nuestra sociedad nunca hablará hotentote, ni
navegará en canoas ni cazará ñus, por la muy buena razón de que estas actividades no son parte de
nuestra cultura. En cada sociedad, el comportamiento del individuo se ajusta en gran medida al de sus
“personas importantes”, es decir, familia, compañeros, maestros, etc.
El estudio psicológico de cómo la sociedad afecta al individuo es parte del campo de la psicología
social. Este es un campo amplio: una enorme variedad de temas de investigación se encuentran bajo la
rúbrica general de la psicología social. Entre otras cosas, se ocupa de cómo se influye en las personas
para que cambien sus actitudes, creencias y conductas; cómo forman impresiones de otras personas; por
qué se gustan; las raíces de la agresión y la violencia; y las condiciones que determinan el altruismo y la
ayuda. La lista podría duplicarse fácilmente. Pero con pocas excepciones, los temas que estudian los
psicólogos sociales tienen que ver con el impacto de la sociedad (otras personas) en el comportamiento
del individuo.
Muchos experimentos están motivados por hechos reales de importancia social. Por ejemplo, más
adelante en el capítulo describiremos el trabajo estimulado por el asesinato de Amidou Diallo, un hombre
negro baleado 41 veces por policías blancos. Diallo estaba alcanzando su billetera; los oficiales creyeron
que estaba buscando un arma. Las absoluciones de los oficiales provocaron protestas, leyes y litigios,
todos dirigidos a los posibles prejuicios raciales en la actuación policial. ¿Podrían los oficiales de policía
haber sido predispuestos por la raza de Diallo? Es decir, ¿el hecho de ser negro jugó un papel clave en
su identificación errónea de la billetera como un arma? Regresaremos a estas preguntas más adelante
en el capítulo.
ÿ LOS ORÍGENES DE LA PSICOLOGÍA SOCIAL
La empresa de la psicología científica tiene sólo unos 100 años, y la aplicación del método científico al
estudio de los interesantes y complejos fenómenos de la psicología social es aún más reciente. Los dos
primeros textos sobre psicología social aparecieron en 1908; uno fue escrito por William McDougall,
psicólogo, y el otro fue escrito por EA Ross, sociólogo. En ambos libros, el tratamiento de la psicología
social es muy diferente del enfoque utilizado hoy. Sin embargo, el libro de McDougall tuvo un gran impacto
en el campo de la psicología en general.
Sostuvo con firmeza que el comportamiento social está determinado en gran medida por una
variedad de instintos que son innatos y relativamente no afectados por la historia de una persona en
particular o su situación social actual.
Nadie cree hoy que el instinto pueda explicar el complejo comportamiento social humano en la
forma en que McDougall trató de aplicarlo. Nociones más sofisticadas de cómo interactúan la biología y
la cultura (recuérdese la discusión de los puntos de vista de Hebb en el Capítulo 12) en las relaciones socia
59533_14_ch13_p358-387.indd 359 9533_14_ch13_p358-387.indd 359 3/5/08 /5/08

el comportamiento se puede ver en relatos contemporáneos de un fenómeno como la selección de
pareja. Los procesos evolutivos (p. ej., Buss y Schmitt, 1993) y las influencias culturales (p. ej., Shweder
y Sullivan, 1993) deben interactuar para producir un comportamiento de selección de pareja. Sin
embargo, análisis recientes apuntan a un papel crucial de las normas sociales y culturales en la
determinación de cómo las personas eligen pareja (Eagly & Wood, 1999).
La psicología social se estableció como un campo independiente de estudio empírico durante las
décadas de 1920 y 1930. El trabajo significativo de Sherif (1935) es un punto culminante de esta época.
Sherif estudió las normas sociales, que son las reglas de conducta generalizadas que nos dicen cómo
debemos comportarnos. Investigó el impacto sorprendentemente poderoso de las normas sociales y su
desarrollo utilizando una ilusión perceptiva, el fenómeno autocinético. Cuando se coloca a una persona
en una habitación que está completamente a oscuras y se muestra un solo punto de luz en una de las
paredes, la luz parece moverse. Este movimiento aparente se produce a pesar de que la luz está
realmente estacionaria. La luz parece “moverse a sí misma”, dando así origen al nombre del fenómeno.
Sherif estaba interesado en cómo los juicios de otras personas afectarían los de una persona que
percibe la luz. Lo que Sherif descubrió a partir de una serie de experimentos fue que los juicios de una
persona sobre cómo se movía el punto de luz estaban muy influidos por los informes de otros
participantes. Si el experimentador (u otro sujeto) hizo que un sujeto esperara que la luz se moviera en
un amplio arco, entonces el sujeto generalmente informaría que, de hecho, parecía moverse en un amplio
arco. Estos experimentos indicaron que los informes de percepción de una persona pueden ser
manipulados por la influencia social de manera dramática y que este proceso puede estudiarse
experimentalmente.
En los experimentos de Sherif, los sujetos se encontraban en una situación bastante ambigua. Tal
vez fueron influenciados fácilmente por otros porque estaban muy inseguros de sus propias percepciones.
¿Podríamos seguir encontrando evidencia de efectos tan grandes de la influencia social en la percepción
y el comportamiento si hiciéramos la situación menos ambigua? Solomon Asch (1951, 1956, 1958)
formuló esta interesante pregunta en sus experimentos históricos sobre la conformidad. Asch (1956)
comentó sobre la importancia del problema de la siguiente manera: “Concediendo el gran poder de los
grupos, ¿podemos simplemente concluir que pueden inducir a las personas a cambiar sus decisiones y
convicciones en casi cualquier dirección deseada, que pueden impulsarnos a llamarlos cierto lo que ayer
tuvimos por falso, que nos pueden hacer investir a la misma acción con el aura de la rectitud o el estigma
de lo grotesco y la maldad? (pág. 2). La respuesta a esta pregunta proporcionada por sus experimentos
fue un sí calificado, y la conformidad, que es cómo los grupos influyen en el comportamiento individual
para que el comportamiento esté de acuerdo con las normas sociales, se convirtió en un tema popular
en la psicología social siguiendo el trabajo de Asch.
El procedimiento básico que utilizó Asch fue el siguiente. Un grupo de estudiantes se reunió en una
sala para participar en lo que se describió como un estudio de discriminación visual. Se les mostró una
sola línea y luego tres líneas de comparación. Su tarea era decir cuál de las tres líneas de comparación
coincidía con el estándar. Un ejemplo aparece en la Figura 13.1.
Había siete personas en el grupo en un experimento, pero solo había un sujeto real. Los otros seis eran
cómplices del experimentador, o asistentes. La situación se dispuso de modo que el sujeto real
respondiera siempre con su penúltima respuesta, después de que otros cinco “sujetos” ya hubieran
emitido sus juicios. Todos respondieron en voz alta, para que el resto del grupo supiera la respuesta de
cada persona.
Hubo 18 ensayos; en cada caso, una línea de comparación era igual al estándar.
Se instruyó a los confederados para que dieran la respuesta correcta en 6 de los intentos, pero una
respuesta incorrecta constante en 12 intentos. La cuestión de interés era si el sujeto real en el
procedimiento se ajustaría al juicio del grupo e iría en contra de su o
59533_14_ch13_p358-387.indd 360 9533_14_ch13_p358-387.indd 360 3/5/08 /5/08

ÿ FIGURA 13.1
Se pidió a los sujetos en la tarea de

discriminación perceptual utilizada por
Asch que decidieran cuál de las líneas
de comparación (B) tenía la misma
longitud que la del estándar (A). ¿Cómo
crees que responderías si cinco personas
antes que tú hubieran dicho que la línea
de comparación 3 era la respuesta
12 3 correcta?
A B
su propia percepción. La mayoría se conformó con los juicios erróneos del grupo en uno o más de los 12
ensayos. También se utilizó un grupo de control, en el que los confederados no cometieron ningún error;
en estas condiciones, sólo el 5 por ciento de los sujetos reales cometieron un error. Irónicamente, el
estudio clásico de Asch pretendía demostrar que las personas se resisten a la influencia del grupo cuando
tienen la evidencia objetiva de sus sentidos en los que confiar.
De hecho, el 63 por ciento de las respuestas en el estudio de Asch fueron correctas, a pesar de la presión
del grupo en sentido contrario. Los psicólogos sociales, sin embargo, han tendido a enfatizar cuánto se
conformaban los sujetos, probablemente porque la conformidad es más sorprendente o controvertida que
la independencia en la sociedad estadounidense (Friend, Rafferty y Bramel, 1990). Más recientemente,
los resultados de Asch se han extendido al dominio de la memoria. Los sujetos vieron diapositivas de
escenas domésticas comunes; Luego, parejas de sujetos se turnaron para recordar los elementos de las
diapositivas. Sin que el sujeto lo supiera, el otro participante era en realidad un cómplice que
deliberadamente sugirió artículos para el hogar que no habían estado en las diapositivas. De interés fue
el “contagio social de la memoria”; los sujetos luego afirmaron haber visto objetos en las diapositivas que
solo habían sido sugeridos por el cómplice (Meade y Roediger, 2002; Roediger, Meade y Bergman, 2001).
La investigación sugiere que el contagio social también puede distorsionar los recuerdos de los testigos
oculares de los hechos delictivos (Gabbert, Memon y Allen, 2003).
En resumen, los experimentos de Sherif y Asch indican que los juicios grupales pueden tener mucho
poder sobre el individuo. Sin embargo, investigaciones posteriores han descubierto muchos factores que
pueden disminuir la infl uencia del grupo. Por ejemplo, si solo un cómplice, respondiendo antes que el
sujeto, no está de acuerdo con el grupo pero responde correctamente, entonces el sujeto generalmente
tampoco seguirá el ejemplo de la mayoría y responderá con la respuesta correcta.
Aproximadamente al mismo tiempo que Sherif escribía sobre normas sociales, Kurt Lewin también
escribía extensamente sobre psicología social. Lewin proporcionó una explicación teórica del
comportamiento social, conocida como teoría de campo, así como algunos experimentos interesantes.
También estaba bastante preocupado por aplicar el conocimiento que los psicólogos sociales estaban
recopilando para la solución de problemas sociales. Ayudó a fundar el Centro de Investigación de
Dinámica de Grupos (ahora en la Universidad de Michigan) para el estudio de temas como el liderazgo y
la productividad de grupos. También desempeñó un papel importante en el establecimiento del
"entrenamiento de la sensibilidad" como un método para hacer frente a las relaciones humanas complejas.
Hoy en día, la psicología social es una de las subdisciplinas más grandes dentro de la psicología
científica. Los psicólogos sociales emplean métodos experimentales para tratar de comprender muchos
temas que son de interés para la mayoría de las personas, como la agresión, la atracción, el altruismo y
la ayuda. Pero debido a que la mayoría de la gente está interesada en la psicología social
59533_14_ch13_p358-387.indd 361 9533_14_ch13_p358-387.indd 361 3/5/08 /5/08

y probablemente han pensado un poco en los temas que incluye, a veces tienden a considerar
sus fenómenos y teorías como mero sentido común. Peor aún, algunas personas incluso creen
que esta área no debe abordarse de manera científica con la lógica del método experimental.
Lewin (1948) argumentó en contra de este tipo de razonamiento
Hace algunos años:
Durante miles de años, la experiencia cotidiana del hombre con objetos que caen no fue
suficiente para llevarlo a una teoría correcta de la gravedad. Se necesitó una secuencia de
experiencias hechas por el hombre muy inusuales, los llamados experimentos, que surgieron de
la búsqueda sistemática de la verdad para lograr un cambio de conceptos menos adecuados a
conceptos más adecuados. Por lo tanto, parece injustificable suponer que la experiencia de
primera mano en el mundo social conduciría automáticamente a la formación de conceptos
correctos oa la creación de estereotipos adecuados. (págs. 60 y 61)
Tema Experimental Control

Ilustración Obediencia a la autoridad
Los psicólogos realizan experimentos para descubrir las causas del comportamiento. Primero,
el investigador selecciona un problema de interés: ¿Por qué ocurre algún comportamiento?
Segundo, se sugiere una hipótesis que proporciona una comprensión tentativa del
comportamiento. Por lo general, la hipótesis especificará los factores que causan o determinan
el comportamiento. Luego, el investigador intentará crear condiciones experimentales para
probar la hipótesis. Si la hipótesis ha señalado un factor como la supuesta causa del
comportamiento, ¿se verá afectado el comportamiento cuando el factor se manipule de manera
sistemática? En el experimento, el factor que se manipula se denomina variable independiente
y el comportamiento medido se denomina variable dependiente. El control experimental tiene
que ver con el hecho de que el investigador obtenga control sobre otros factores en la situación
para que él o ella pueda estar seguro de que el cambio en el comportamiento es causado por la
variable independiente y no por algún otro factor. Cuanto más complejo sea el comportamiento
de interés, más difícil será controlar todos los demás aspectos relevantes de la situación.
El error experimental ocurre cuando un cambio en la variable dependiente, el
comportamiento de interés, es producido por algún factor que no sea la variable independiente.
El control experimental intenta minimizar o eliminar el error experimental. Una fuente principal
de error experimental es la confusión, que ocurre cuando una segunda variable varía
involuntariamente junto con la variable independiente de interés. Cuando esto sucede, el
investigador no puede estar seguro de si la variable independiente o la segunda variable,
confundida, ha producido el cambio en la variable dependiente.
Hay varias formas disponibles para reducir el error experimental causado por la confusión.
El enfoque más directo es controlar todas las demás variables de interés para que solo se
manipule la variable dependiente. Los otros factores que se mantienen constantes se conocen
como variables de control, como ya hemos comentado (ver Capítulo 3).
A veces no es posible controlar rígidamente una variable en todas las condiciones de un
experimento; en esos momentos, se deben utilizar otras técnicas. Este problema ocurre, por
ejemplo, cuando se utiliza un diseño experimental entre sujetos. Si hay dos condiciones, una
experimental y una de control, que difieren en la manipulación de la variable independiente, un
investigador no quiere tener ninguna segunda variable en la que se basen los dos grupos.
59533_14_ch13_p358-387.indd 362 9533_14_ch13_p358-387.indd 362 3/5/08 /5/08

Variables dependientes fe que podemos poner en la relación descubierta en el

experimento.
La variable dependiente en la investigación en
psicología social es a menudo una medida de Variables independientes
preferencia (o agrado, o creencia, etc.) obtenida al
hacer que los sujetos completen un cuestionario Las variables independientes en los experimentos de
después de experimentar algún tratamiento psicología social suelen ser características de una
experimental. Por ejemplo, se les puede pedir a las situación social o de las personas en una situación que
personas que juzguen en una escala de siete puntos pueden manipularse. En un experimento sobre el
cuánto les gustaron o disgustaron las otras personas cambio de actitud, la capacidad de persuasión de un
en el experimento o cuánto están de acuerdo con la mensaje puede variar mediante la manipulación del
posición de que el aborto es un asesinato. Estas medidas senúmero
usu de argumentos utilizados en apoyo de la
tomarse sólo después de que se haya diseñado un posición que se argumenta (p. ej., que el aborto es un
tratamiento experimental para influir en los juicios de asesinato). En un experimento que prueba la hipótesis
alguna manera. Aunque se ha obtenido mucha de que la agresión aumenta a medida que aumenta la
información útil a través de la técnica del cuestionario, temperatura, el experimentador puede variar la
los psicólogos sociales recurren cada vez más a temperatura de la habitación en la que puede ocurrir
técnicas que no dependen del autoinforme. Por una actividad agresiva entre una persona y un cómplice.
ejemplo, los experimentadores también pueden incluir En un experimento sobre la conformidad, un
la medición del comportamiento. En cambio investigador puede variar el número de personas que
de preguntarle a una persona cuánta animosidad no están de acuerdo con algún juicio que ha hecho
siente hacia otro sujeto en un experimento de agresión, una persona para ver si es más probable que el sujeto
el experimentador podría preparar la situación de modo cambie de opinión. También se pueden examinar
que el sujeto tuviera la oportunidad de administrar variables relacionadas con las características de las
descargas eléctricas leves al otro sujeto bajo la personas en el experimento, como el sexo y la raza.
apariencia de un experimento de aprendizaje. experimento. ¿Es más probable que las personas ayuden (o
Por lo tanto, la agresión podría medirse en términos de muestren agresividad, agrado o estén de acuerdo con) perso
cuántas descargas se aplicaron. (En realidad, la otra
persona, un cómplice del experimentador, no recibiría Variables de control
descargas). Más recientemente, los psicólogos sociales
han estado utilizando muchas de las mismas técnicas La introducción del control experimental en la
que los psicólogos cognitivos, basándose en medidas investigación en psicología social es bastante
dependientes como el tiempo de reacción y la memoria. complicada, ya que las situaciones que se tratan suelen
Por ejemplo, los sujetos pueden recordar selectivamente ser complejas. A menudo es muy difícil variar uno o
solo aquellas acciones de los otros participantes que varios factores mientras se mantienen todos los demás
se ajustan a cuánto les gustaban. En general, cuantas constantes, el requisito previo para proporcionar
más medidas convergentes podamos obtener de la inferencias firmes sobre la relación entre las variables
misma entidad hipotética (p. ej., agresión) que independientes y dependientes en los experimentos.
concuerden, más La siguiente sección trata este tema.
también difieren. Sin embargo, en un diseño entre sujetos, hay al menos otra diferencia en las
condiciones, que está incorporada: diferentes grupos de personas se prueban en las dos condiciones
Cuando no es posible controlar una variable, como ocurre con las personas en un diseño
entre sujetos, el experimentador aleatoriza la variable para descartar su infl uencia. Por lo tanto, si
se usa un diseño entre sujetos, el investigador asigna aleatoriamente a los participantes a las
condiciones. (La asignación se basa en algún esquema que garantiza una verdadera aleatorización,
59533_14_ch13_p358-387.indd 363 9533_14_ch13_p358-387.indd 363 3/5/08 /5/08

como la tabla de números aleatorios, descrita en la Tabla H en el Apéndice C al final del libro). A
medida que los participantes llegan al experimento, el investigador podría usar los números en las
filas de la tabla para asignar personas a las condiciones. Si hay dos condiciones, los números
impares indicarían personas en una condición y los números pares representarían a las personas en
la otra condición.
La aleatorización minimiza la probabilidad de que haya diferencias sistemáticas entre los
grupos de participantes en un experimento. Sin la aleatorización, un experimentador corre el riesgo
de que las diferencias entre los grupos se confundan con la variable independiente, lo que influirá en
el resultado del experimento. Aunque se asignan diferentes personas a las dos condiciones, el
investigador puede estar seguro de que, en promedio, los participantes en las dos condiciones son
similares en todos los aspectos importantes. Por lo tanto, si hay una diferencia estadísticamente
confiable en el comportamiento entre las dos condiciones, podría atribuirse con seguridad a la
operación de la variable independiente y no al hecho de que hubo diferentes personas en las dos
condiciones.
En la investigación en psicología social, los investigadores están interesados en situaciones
que generalmente son más complejas que las consideradas hasta ahora en el libro. En situaciones
sociales, muchos factores pueden influir en el comportamiento de las personas, como el número de
otras personas presentes, el comportamiento y las actitudes de estas otras personas, la dinámica
interpersonal y otros eventos o interacciones sociales que pueden ocurrir de manera descontrolada
o impredecible. Es decir, en situaciones sociales, muchas variables además de la variable
independiente deben controlarse o aleatorizarse antes de que el investigador pueda estar seguro de
que cualquier cambio en una variable dependiente es causado por la variable independiente.
¿Cómo hacemos para estudiar un fenómeno social complejo en un entorno controlado?
Consideremos, por ejemplo, el problema de la obediencia a la autoridad. ¿Cómo podría una persona
o grupo de personas con autoridad inducir a otros a seguir órdenes, especialmente cuando esas
órdenes pueden ser para realizar actos sociales o inmorales? El caso más espantoso de esto en el
siglo XX ocurrió en la Alemania nazi, donde un pequeño grupo de fanáticos nazis instituyó un
programa para el asesinato sistemático de una gran parte de la población de Alemania y de los
países que había conquistado. La implementación del plan implicó tanto la aceptación tácita por
parte de la mayor parte de la población alemana como las acciones de otras personas normales
sabias.
Para estudiar la obediencia en el laboratorio, es necesario considerar una gran cantidad de
factores, como el poder percibido de la figura de autoridad, el comportamiento que se espera que
realice el participante, las consecuencias percibidas de la desobediencia, los efectos de la presión
de grupo, las cuestiones políticas o ideológicas implicadas, etc. ¿Y cómo medimos la obediencia?
¿Cómo podemos llevar un fenómeno tan complejo a un entorno controlado para estudiar los factores
críticos subyacentes, mientras mantenemos los demás constantes?
Milgram respondió a esta pregunta en una fascinante serie de experimentos que culminaron
en un libro sobre el tema (Milgram, 1974). Consideraremos estos experimentos como un caso
histórico de llevar un tema psicológico social complicado al laboratorio para un examen más
detallado. Todos los experimentos originales (Milgram, 1963, 1964a, 1965) utilizaron una metodología
común para establecer la obediencia a la autoridad en un entorno experimental controlado. En el
primer estudio, Milgram (1963) usó participantes masculinos que respondieron a los anuncios para
participar, por pago, en un estudio de memoria y aprendizaje en la Universidad de Yale. Cuando un
participante apareció en el laboratorio, conoció a otro participante (en realidad, un cómplice del
experimentador) que era un contador de 47 años especialmente capacitado para su función.
El cómplice parecía bastante apacible y agradable (Figura 13.2). A los participantes se les dijo que
se sabía muy poco sobre los efectos del castigo en la memoria y
59533_14_ch13_p358-387.indd 364 9533_14_ch13_p358-387.indd 364 3/5/08 /5/08

ÿ FIGURA 13.2
El aprendiz (o víctima) en el estudio

original de Milgram sobre la obediencia
a la autoridad. ¿Te arriesgarías a dañar
gravemente a este hombre en un
experimento si alguien te lo ordenara?
Los hallazgos de Milgram sugieren que sí.
De THE OBEDIENCE distribuido por
The Pennsylvania State University
Media Sales.
Milgram.
Stanley
1965
por
©
que uno de ellos iba a ser el maestro y el otro el alumno en un estudio científi co de este tema.
Los hombres sacaron tiras de papel de un sombrero para determinar quién iba a aparecer en qué
rol, pero en realidad, el dibujo fue manipulado de modo que el participante ingenuo siempre fuera
el maestro y el cómplice siempre el aprendiz. El experimentador fue interpretado por un profesor
de biología bastante severo de 31 años que vestía una bata blanca de laboratorio. El alumno fue
atado a una silla eléctrica para evitar el movimiento excesivo, y se colocaron electrodos en sus
muñecas con pasta "para evitar ampollas y quemaduras". En respuesta a una pregunta del
alumno, el experimentador dijo: “Aunque las descargas pueden ser extremadamente dolorosas,
no causan daños permanentes en los tejidos” (Milgram, 1963, p. 373).
Se pidió a los profesores-participantes que leyeran una lista de pares asociados al aprendiz
(ver Capítulo 10) y luego que lo pusieran a prueba en la lista presentando un estímulo y cuatro
alternativas, una de las cuales era correcta.
Se le pidió al alumno-cómplice que eligiera la respuesta correcta de entre las cuatro
alternativas y la dijera en voz alta. Si cometía un error, se le indicaba al maestro-participante que
le aplicara una descarga eléctrica presionando un interruptor en un imponente generador de
descargas. Aunque el cómplice en realidad no recibió descargas, al participante real se le dio una
descarga de muestra leve al comienzo del experimento para convencerlo de que el generador
era real. Durante el transcurso del experimento, se pidió a los profesores que aumentaran la
cantidad de descargas cada vez que el alumno cometía un error. La medida dependiente principal
fue la cantidad de descarga eléctrica que el participante ingenuo estaba dispuesto a dar. El
generador de choque constaba de 30 interruptores de palanca, claramente etiquetados como
procedentes de 15 a 450 voltios. Hubo siete interruptores (en cada uno de los cuatro grupos) y a
los participantes se les dieron las siguientes descripciones verbales de las etiquetas de los
interruptores (de izquierda a derecha): descarga leve, descarga moderada, descarga fuerte, descar
59533_14_ch13_p358-387.indd 365 9533_14_ch13_p358-387.indd 365 3/5/08 /5/08

shock, shock de extrema intensidad y peligro: shock severo. Otros dos interruptores en el extremo
derecho estaban marcados con XXX.
Desde el principio, el aprendiz-cómplice cometió errores; por lo tanto, se suponía que el maestro-
participante administraría cada vez más descargas eléctricas. En el estudio original, el cómplice no estaba
a la vista del profesor, pero podía oírse. Sus respuestas fueron estandarizadas en cinta. “A partir de 75
voltios, el alumno comienza a gruñir y gemir. A 150 voltios exige que lo dejen salir del experimento. A 180
voltios grita que ya no aguanta más el dolor. A 300 voltios se niega a dar más respuestas. . . . El
experimentador (entonces) instruye a la persona ingenua a tratar la ausencia de una respuesta como
equivalente a una respuesta incorrecta, y a seguir el procedimiento habitual de choque” (Milgram, 1965,
p. 61).
Todas las personas que participaron en este procedimiento parecían muy nerviosas y molestas y
preguntaban con frecuencia al experimentador qué debían hacer a continuación. Cada vez que las
personas parecían no estar dispuestas a continuar, el experimentador tenía una serie de declaraciones
(que se convirtieron en órdenes) que la persona debía obedecer. El primero fue bastante amable: “Por
favor, continúa”. El siguiente fue "El experimento requiere que continúes", que progresó a "Es
absolutamente esencial que continúes". Finalmente, el experimentador dijo: “No tienes otra opción. Debes
continuar.
Los resultados de Milgram (1963) son verdaderamente notables. De las 40 personas evaluadas
originalmente en esta situación, 26 (65 por ciento) "fueron hasta el final" y le dieron al confederado la
serie completa de descargas, mientras que las otras 14 interrumpieron el experimento al negarse a
continuar en o después de los 300- nivel de voltios Los resultados se muestran en la Figura 13.3. Los
participantes aquí no eran torturadores impasibles y crueles. Eran (al igual que tú y yo) personas normales que
100%
90%
Maestro Víctima
80%
Recibe Libras
70% en Víctima
Muestra
Choque Muro Libras
60% en
50% Muro
Otra vez
choque
nivel
cada
de
en 40%
30%
20%
10%
Porcentaje
obedecen
personas
órdenes
que
de
0%
Muy
): XXX
Leve
Fuerte Fuerte
Intenso Severo Choque
Intensidad
Extremo Peligro
Moderado
15 voltios 450 voltios

Nivel de choque
ÿ FIGURA 13.3
Porcentaje de personas que obedecieron las órdenes de continuar descargando a

la víctima en varios niveles de intensidad de la descarga. Incluso cuando la víctima
reaccionó como si tuviera dolor y dejó de responder a la tarea de memoria, casi dos
tercios obedecieron al experimentador y administraron descargas al nivel de "peligro" y
más allá. (De Social Psychology: Understanding Human Interaction [p. 292], por RA Baron
y D. Byrne, 1977, Boston: Allyn and Bacon.)
59533_14_ch13_p358-387.indd 366 9533_14_ch13_p358-387.indd 366 3/5/08 /5/08

una gran cantidad de confl icto en esta situación. Un capítulo del libro de Milgram (1974) contiene
transcripciones que muestran que muchos sujetos sintieron angustia pero, sin embargo, continuaron
bajo las instrucciones del experimentador. La mayoría sudaba profusamente y muchos temblaban.
Otro síntoma de su malestar fue la aparición de la risa nerviosa, que se volvió incontrolable en varios
sujetos. Un espectador del experimento comentó:
Observé a un hombre de negocios maduro e inicialmente sereno entrar al laboratorio

sonriendo y confiado. En 20 minutos se redujo a un desastre nervioso y tartamudo, que se
acercaba rápidamente a un punto de colapso nervioso. Constantemente se tiraba del
lóbulo de la oreja y retorcía las manos. En un momento, empujó su puño contra su frente
y murmuró: “Oh Dios, dejémoslo”. Y, sin embargo, siguió respondiendo a cada palabra del
experimentador y obedeció hasta el final. (Milgram, 1963, pág. 377)
Es interesante notar que la demostración de Milgram en realidad puede subestimar la voluntad de

obedecer de las personas. Debido a que Milgram quería estudiar la obediencia en un entorno de
laboratorio controlado, faltaba una fuente de obediencia: el poder genuino sobre el comportamiento de la p
Es decir, los hombres simplemente podrían haberse retirado del experimento y nunca haber sufrido
ninguna repercusión negativa por la desobediencia. Sin embargo, en la mayoría de las situaciones del
mundo real, una figura de autoridad tiene el poder de infligir daño si no se siguen sus órdenes. Los
padres, maestros y funcionarios encargados de hacer cumplir la ley pueden castigar a quienes
desobedecen. Por lo tanto, el estudio de Milgram no capturó todos los componentes esenciales de la
obediencia tal como ocurre naturalmente. Sin embargo, esta diferencia entre la configuración del mundo
real y la configuración del laboratorio de Milgram no devalúa su contribución. Más bien, hace que su
demostración sea aún más sorprendente cuando uno se da cuenta de que obtuvo niveles tan altos de
obediencia sin la amenaza de castigo por la desobediencia. Podríamos predecir que las personas
habrían sido aún más obedientes si el experimentador hubiera poseído algún poder real sobre ellas.
Condiciones que fomentan la obediencia
Es posible que haya notado que falta algo en la descripción del estudio de Milgram, algo crucial para
un experimento. No hubo variación de una variable independiente en la investigación. Por lo tanto, no
se obtuvo información sobre las condiciones que mejoran o disminuyen la obediencia a la autoridad en
esta situación. Aunque Milgram empleó un entorno controlado para producir obediencia en el laboratorio,
es mejor referirse a su primer estudio como una demostración que como un experimento, ya que no
hubo manipulación de una variable independiente. Milgram, por supuesto, se dio cuenta de esto y no
afirmó lo contrario.
En el informe original, describió áreas en las que las variaciones sistemáticas en el procedimiento
podrían conducir a nueva información útil sobre las condiciones necesarias para la obediencia; también
proporcionó algunas de estas variaciones en experimentos posteriores.
Un factor que podría haber fomentado la obediencia en el estudio original fue el entorno; se llevó
a cabo en la Universidad de Yale, una institución presumiblemente muy apreciada por los participantes
(al menos antes del experimento). Quizás el aura general de Yale ayudó a fomentar la obediencia, ya
que presumiblemente esta conocida institución no permitiría que sus instalaciones se usaran con fines
turbios. Milgram (1965) informó sobre un estudio posterior similar al original en la mayoría de los
detalles, excepto que se realizó en un viejo edificio de oficinas en una parte bastante sórdida de
Bridgeport, Connecticut, bajo los auspicios de Research Associates of Bridgeport, una empresa ficticia.
empresa. Aunque el cumplimiento se redujo en el estudio de Bridgeport (el 48 por ciento administró la
descarga máxima frente al 65 por ciento en el
59533_14_ch13_p358-387.indd 367 9533_14_ch13_p358-387.indd 367 3/5/08 /5/08

muestra original de Yale), la diferencia aparentemente no fue estadísticamente significativa; Milgram
concluyó que la reputación de Yale no era responsable del alto nivel original de cumplimiento. Debido a
que esta conclusión se basa en la imposibilidad de rechazar la hipótesis nula, es sospechosa (consulte el
Capítulo 3), especialmente porque hubo una diferencia absoluta bastante grande entre los dos estudios
(17 por ciento).
Es interesante preguntar a qué conclusiones podría haber llegado Milgram de este estudio si hubiera
habido una reducción significativa en la obediencia en Bridgeport en relación con el estudio original de
Yale. ¿Podría haber llegado a la conclusión de que fue la naturaleza del entorno (Yale frente a un edificio
de oficinas en ruinas) lo que produjo los resultados? La respuesta es no,
o al menos no estrictamente, ya que muchas otras condiciones variaban entre las dos situaciones además
del escenario (por ejemplo, la ciudad y la época del año). Por lo tanto, al menos varias variables fueron
potencialmente confundidas. Puede haber sido que los diferentes escenarios produjeron el resultado, ya
que el experimentador y los cómplices eran los mismos en los dos estudios.
Pero, en general, sacar conclusiones a partir de una comparación de condiciones en diferentes
experimentos es peligroso, ya que uno nunca puede estar seguro de que todas las demás condiciones se
mantuvieron constantes y que no hubo confusión. ¿Qué podría haber concluido Milgram si los voluntarios
de Bridgeport que respondieron a su anuncio hubieran resultado ser diferentes en ocupación o nivel
socioeconómico de la muestra de Yale? (De hecho, las dos muestras no diferían de manera obvia). Para
determinar las razones de las diferencias en la obediencia, habría tenido que realizar experimentos
adicionales. En primer lugar, podría haber formulado hipótesis razonables sobre qué factores estaban
causando las diferencias (p. ej., estatus socioeconómico, edad, ocupación). Luego, pudo haber realizado
una serie de experimentos en los que manipuló cada factor hasta identificar los que afectaban la
obediencia. En otras palabras, cuando varios factores no controlados cambian a lo largo de los
experimentos (es decir, se confunden) y se encuentran resultados diferentes en esos experimentos,
entonces los factores confundidos deben aislarse y variarse independientemente para determinar cuáles
producen las diferencias en el comportamiento.
En experimentos reales posteriores, se ha encontrado que otras variables tienen un gran efecto
sobre la obediencia. Cuando otras personas sirven en el experimento como maestros que se supone que
deben proporcionar descargas (aunque en realidad son cómplices), su comportamiento afecta
notablemente al del participante ingenuo. En un caso, Milgram (1965) hizo que los dos confederados se
negaran a continuar en niveles predeterminados de shock. Los resultados se muestran en la figura 13.4,
lo que indica que las personas ingenuas estaban mucho más capacitadas para negarse a continuar
cuando otros lo hacían. Por otro lado, en otro experimento, cuando dos compañeros conformistas
alentaron a los sujetos ingenuos a aumentar el nivel de descarga, administraron una descarga mucho
mayor que cuando determinaron ellos mismos el nivel de descarga (Milgram, 1964a).
Otra manipulación interesante que intentó Milgram (1965) fue variar la cercanía de la víctima, de
modo que en una condición el maestro solo podía escuchar a la víctima gemir y quejarse; en otra
condición, estaba en la misma habitación para poder ver también a la víctima; y en otra condición más,
se instruyó al participante para forzar el brazo del aprendiz hacia abajo sobre la placa de choque de metal
en cada prueba (Figura 13.5). Aunque la obediencia disminuyó con la cercanía de la víctima, del 74 por
ciento al 40 por ciento y al 30 por ciento obedeciendo las instrucciones del experimentador hasta el final
en las diferentes condiciones, aún es notable que casi un tercio continuó dando las descargas incluso
cuando tenían que hacerlo. sostenga la mano de la persona.
La investigación de Milgram sobre la obediencia nos permite ver cómo se puede investigar un
problema interesante y complicado relacionado con la influencia social en el contexto relativamente controlado
59533_14_ch13_p358-387.indd 368 9533_14_ch13_p358-387.indd 368 3/5/08 /5/08

100%
90%
80% Persona sin apoyo de pares

70%
60%
primer confederado
50%
desafía al experimentador
40%
choque
nivel
cada
de
en
30%
Persona con dos compañeros desafiantes
20%
segundo confederado
Porcentaje
obedecen
personas
órdenes
que
de 10%
0%
desafía al experimentador
Muy
): XXX
Leve
Fuerte Fuerte
Intenso Severo Choque
Intensidad
Extremo Peligro
Moderado
15 voltios 450 voltios

Nivel de choque
ÿ FIGURA 13.4
La presión de grupo como influencia en el desafío a la autoridad. Cuando las personas no cuentan
con el apoyo de sus compañeros, el 65 por ciento sigue obedeciendo las órdenes del experimentador de
aplicar descargas cada vez más fuertes durante todo el experimento. Cuando las personas están con
compañeros que desafían al experimentador, solo el 10 por ciento sigue obedeciendo las órdenes del
experimentador. (De Social Psychology: Understanding Human Interaction [p. 297], por RA Baron y D.
Byrne, 1977, Boston: Allyn and Bacon.)
Milgram.
Stanley
1965
©
ÿ FIGURA 13.5
Un participante obediente que golpea a un cómplice mientras fuerza su brazo contra la placa de metal.
De THE OBEDIENCE distribuido por Pennsylvania State University Media Sales.
59533_14_ch13_p358-387.indd 369 9533_14_ch13_p358-387.indd 369 3/5/08 /5/08

escenario del laboratorio de psicología social. Aunque no todos los aspectos de la obediencia se
transportan al laboratorio (p. ej., como se mencionó anteriormente, la persona que daba las órdenes no
tenía poder real sobre los participantes ingenuos), la situación era lo suficientemente convincente como
para producir un nivel de cumplimiento espectacularmente alto.
Antes de dejar este tema, conviene mencionar brevemente tres cuestiones más. Mucha gente
que se encuentra con la investigación de Milgram dice: “Yo no haría eso”. El punto es que, dada la
configuración adecuada, probablemente lo harías. Los estudiantes universitarios de Yale fueron
evaluados en la situación original; sus resultados no fueron diferentes a los de las “personas reales” en
la comunidad de New Haven. Quizás después de leer esto no participarías en una situación exactamente
como la de Milgram, pero probablemente harías cosas similares sin pensar mucho en ellas. (Consulte
Geher, Bauman, Hubbard y Legare, 2002, para obtener datos más recientes sobre las predicciones de
las personas sobre lo que harían).
Un segundo aspecto de los estudios de Milgram que a menudo provoca comentarios es si era (y
es) ético someter a las personas a este procedimiento, ya que su cooperación se obtiene bajo falsos
pretextos y el procedimiento es bastante estresante. Estos temas han sido debatidos por Baumrind
(1964) y Milgram (1964b) con cierta extensión, por lo que simplemente referiremos al lector interesado
a estos artículos y al Apéndice I del libro de Milgram (1974) para comentar los temas éticos involucrados
en esta investigación. (Consideramos el problema de la ética en el Capítulo 4.)
Finalmente, como Milgram señala repetidamente en sus escritos, la obediencia en sí misma no es

necesariamente mala. De hecho, si casi todos nosotros no obedeciéramos las numerosas leyes y
personas con autoridad en nuestra sociedad, la vida sería casi insoportable. Sólo cuando se le pide a
uno que obedezca órdenes que producen daño, la obediencia es indeseable.
La obediencia y el legado del trabajo de Milgram aún reciben un gran interés en la psicología
social (ver Blass, 1999, 2002; Miller, Collins, & Brief, 1995; Zimbardo, 2007). Se han ofrecido
explicaciones teóricas alternativas de la obediencia vista por Milgram (Nissani, 1990). Además, un
número completo del Journal of Social Issues (51:3) está dedicado a la obediencia a la autoridad. A la
luz de las recientes atrocidades relacionadas con la guerra en Europa central y el Medio Oriente, parece
justificada una comprensión adicional de la obediencia ciega.
Características de la demanda del tema y sesgo del experimentador

Ilustración Hipnosis
Los experimentos psicológicos típicamente emplean tanto control experimental como puede reunir el
investigador prudente. Esta sección se ocupa de dos fuentes de sesgo que incluso el investigador más
concienzudo puede pasar por alto: el sesgo introducido por los experimentadores y por los propios
sujetos. El problema del sesgo del experimentador
es potencialmente prevalente en todas las ciencias. La forma más flagrante de sesgo es la falsificación
deliberada de datos. Las presiones sociales que existen para ser productivos, publicar muchos artículos
y encontrar resultados espectaculares para recibir más dinero de las agencias de subvenciones han
llevado a algunos investigadores a obtener resultados falsos. Broad y Wade (1982) consideran varios
casos documentados de tal fraude y analizan el problema en detalle. Desafortunadamente, no se puede
hacer mucho para reducir este tipo de fraude, excepto estar alerta y castigar a los infractores cada vez
que se los descubra. Dichos fraudes pueden descubrirse cuando otros investigadores intentan replicar
y confirmar el trabajo. En el Capítulo 4 se analizan consideraciones adicionales sobre el fraude en la
investigación.
59533_14_ch13_p358-387.indd 370 9533_14_ch13_p358-387.indd 370 3/5/08 /5/08

El sesgo del experimentador se refiere no solo a los casos conscientes de fraude, sino también
a las influencias mucho más sutiles que los experimentadores pueden ejercer sin saberlo sobre el
resultado de su investigación. Que tales efectos ocurren ha sido establecido por muchas
investigaciones, así como por observaciones anecdóticas. Esta forma más encubierta de sesgo
puede introducirse inadvertidamente de varias maneras. El experimentador puede interactuar con
los participantes en las diferentes condiciones de formas ligeramente diferentes; el tono de voz y el
énfasis pueden cambiar cuando se leen las instrucciones; y, de manera similar, las señales faciales,
los gestos, etc., pueden diferir. Es posible que el experimentador ni siquiera sea consciente de tales
efectos, pero las expectativas sobre la forma en que los participantes deben comportarse en las
diferentes condiciones pueden cambiar su comportamiento muy levemente para ayudar a producir el e
Rosenthal (1966, 1969, 2002) revisó el trabajo (en gran parte suyo) sobre la infl uencia de las
expectativas del experimentador y discutió varias soluciones al problema. Una de las soluciones más
efectivas es que el experimentador se mantenga aislado de alguna manera de conocer las hipótesis
que se están considerando o las condiciones particulares del sujeto que se está probando. En tal
caso, se dice que el experimentador está ciego con respecto a las condiciones. Desafortunadamente,
es difícil o poco práctico satisfacer esta condición en muchas investigaciones, porque el
experimentador debe administrar las condiciones.
El problema del sesgo del experimentador, aunque potencialmente peligroso, puede no ser tan
grave como a veces se supone. Barber y Silver (1968) analizaron exhaustivamente la investigación
sobre los efectos de las expectativas del experimentador y argumentan que todavía no hay suficiente
evidencia para concluir que tales efectos son fenómenos probados. Independientemente de la
validez de esta afirmación, otros factores nos hacen creer que a menudo se exagera la importancia
de los efectos del experimentador. Hemos enfatizado repetidamente a lo largo de este libro que los
resultados de cualquier experimento individual deben verse en el contexto de otros experimentos
similares antes de poder hacer una generalización. Si un resultado experimental en particular se
considera importante, uno puede estar seguro de que gran parte de la investigación futura estará
dirigida a descubrir las condiciones bajo las cuales se da, explicar los mecanismos involucrados, etc.
En el curso de tal investigación, habrá muchas ocasiones para que el fenómeno básico sea replicado
por experimentadores con muchos puntos de vista diferentes sobre el tema, algunos con la
esperanza de encontrarlo, otros con la esperanza de no encontrarlo. Si el fenómeno es replicado
por todos, entonces podemos asumir que no es producido por el sesgo del experimentador; si no,
podemos sospechar que el sesgo del experimentador es responsable de parte de la dificultad. El
punto importante es que el sesgo del experimentador, o incluso la flagrante deshonestidad de un
investigador aislado, se descubrirá en el curso normal de la investigación científica. Esos efectos
aún deben evitarse con toda la precaución posible, por supuesto. A la larga, sin embargo, los efectos
del sesgo del experimentador probablemente se eliminarán en el proceso científico.
Una fuente de sesgo potencialmente más poderosa, que es exclusiva de las ciencias sociales,
tiene que ver con el participante y lo que espera encontrar en un experimento psicológico. Martin
Orne (1962, 1969) fue un pionero en concienciar a los psicólogos sobre este problema. Señaló que
las personas que participan en un experimento tienen algunas nociones generales de qué esperar y
probablemente están tratando de descubrir el propósito específico del experimento. Es probable que
crean que se tomarán las precauciones razonables para su bienestar y que cualquier cosa que el
experimentador les pida que hagan tendrá un propósito útil. También querrán conocer este propósito
y buscar pistas en la situación experimental. Debido a que muchos experimentos psicológicos,
especialmente los de psicología social como los estudios de obediencia de Milgram, proporcionarían
resultados poco interesantes si se conociera el verdadero propósito del estudio (pronto todos se
negarían a obedecer al experimentador),
59533_14_ch13_p358-387.indd 371 9533_14_ch13_p358-387.indd 371 3/5/08 /5/08

a menudo se involucran engaños elaborados para enmascarar los verdaderos propósitos del experimento.
Sin embargo, como señala Orne, a veces estos pueden ser bastante transparentes. De todos modos,
existe el problema general de cómo las expectativas de la persona afectan o determinan su comportamiento
en un experimento. Como señala Orne (1969):
En la medida en que el sujeto se preocupe por el resultado, su percepción de su papel y de la

hipótesis que se somete a prueba se convertirá en un determinante significativo de su
conducta. Las señales que gobiernan su comportamiento, que comunican lo que se espera de
él y lo que el experimentador espera encontrar, pueden ser, por lo tanto, variables cruciales.
Hace algún tiempo propuse que estas señales se llamaran “características de demanda de un
experimento”. . . . Incluyen rumores sobre el experimento, su escenario, instrucciones implícitas
y explícitas, la persona del experimentador, pistas sutiles proporcionadas por él y, de particular
importancia, el procedimiento experimental. (pág. 146)
Si los resultados de un experimento son producidos por las características de demanda de la situación
experimental, no se generalizarán a otras situaciones. Es bien sabido que el conocimiento de alguien de
que él o ella es parte de un experimento afectará en gran medida su comportamiento. En “Psicología en
acción” al final del capítulo, sugerimos un ejercicio que puede realizar para demostrar este punto.
En todos los experimentos de laboratorio, las personas se dan cuenta de que están siendo
observadas y que su comportamiento está siendo monitoreado cuidadosamente. Sus expectativas de
cómo se supone que deben comportarse pueden determinar en gran medida su desempeño en el
experimento. Otro fenómeno de este tipo es bien conocido por los investigadores médicos; se llama efecto
placebo. Esto se refiere al hecho de que cuando a los pacientes en investigación médica se les da una
sustancia químicamente inerte y se les dice que es la medicina la que debería ayudarlos, a menudo
muestran una mejoría en la enfermedad o encuentran alivio de su dolor. Por lo tanto, cuando se evalúa un
fármaco en la investigación médica, no es suficiente comparar un grupo de pacientes que recibe el fármaco
con un grupo que no lo recibe, porque los pacientes que reciben el fármaco pueden mejorar simplemente
por el efecto placebo (ver Capítulo 6). ). En su lugar, el grupo de fármaco también se compara con un
grupo de placebo para que el efecto del fármaco pueda medirse en relación con el efecto placebo. El
término experimento simple ciego
a menudo se aplica a este tipo de investigación porque las personas, en este ejemplo, no saben si están
recibiendo medicación o un placebo. Las salvaguardas experimentales generalmente se extienden en la
investigación médica para que los médicos que administran los medicamentos también estén ciegos al
tratamiento de los pacientes. La ventaja de este tipo de experimento doble ciego es que ni las
expectativas de mejora de los pacientes ni de los médicos pueden afectar los resultados.
En una línea de investigación de laboratorio, Orne (1962) trató de encontrar una tarea que fuera tan
aburrida y sin sentido que los participantes normales se negaran a realizarla. Estaba interesado en
encontrar tal tarea porque luego quería ver si los participantes bajo la influencia de la hipnosis realizarían
o no la tarea cuando se les indicara que lo hicieran. Un experimento consistió en dar a los sujetos 2000
hojas de papel llenas de filas de dígitos aleatorios. Se instruyó a las personas para que sumaran los
muchos pares de dígitos en cada fila en todas las hojas. Claramente, era una tarea imposible; Orne asumió
que la gente de control se daría cuenta rápidamente de esto y se negaría a continuar. Pero en cambio, la
gente, que se vio privada de sus relojes, se mantuvo en la tarea durante horas y horas, con poca
disminución en el rendimiento. A las personas en un estudio posterior (que tenía como objetivo hacer la
tarea aún más onerosa y sin sentido) se les dijo que después de completar cada hoja, debían tomar una
tarjeta y seguir las instrucciones escritas en ella. Cada tarjeta les indicó que rasgaran
59533_14_ch13_p358-387.indd 372 9533_14_ch13_p358-387.indd 372 3/5/08 /5/08

hasta la hoja de papel en un mínimo de 32 piezas y continuar con la siguiente hoja.
Aun así, persistieron durante horas. Cuando se les preguntó, explicaron su comportamiento
diciendo que, dado que estaban en un experimento, pensaron que debía haber una buena razón
para la solicitud (una prueba de resistencia o similar).
Los investigadores han pedido a los participantes bajo hipnosis que hagan todo tipo de cosas,
a menudo con notable éxito. Un hallazgo aparentemente bien establecido es que los participantes
bajo hipnosis pueden ser inducidos a realizar varios actos antisociales y destructivos, como arrojar
ácido a la cara de alguien y manipular serpientes venenosas (Rowland, 1939; Young, 1952). Orne
y Evans (1965) sospecharon que este comportamiento podría atribuirse más a las características
de demanda de la situación que a los efectos de la hipnosis. Pidieron a las personas que realizaran
una serie de actos aparentemente peligrosos, como agarrar una serpiente venenosa, tomar una
moneda del ácido humeante y arrojar ácido nítrico a la cara del experimentador. (Los procedimientos
estaban diseñados para parecer amenazantes, pero los actos eran realmente seguros). Hubo
varias condiciones de tratamiento: (1) personas que estaban bajo hipnosis profunda; (2) personas
a las que se les dijo que simularan o fingieran que estaban bajo hipnosis; (3) controles despiertos
a los que no se les pidió que simularan la hipnosis pero que fueron presionados por el
experimentador para cumplir con las solicitudes; (4) controles despiertos que no fueron presionados
para cumplir; y (5) personas a las que se les pidió que realizaran las tareas sin formar parte de un
experimento.
El experimentador en este estudio estaba ciego a las condiciones de los sujetos, para no afectar
su comportamiento. Los resultados se resumen en la Tabla 13.1. Como era de esperar, las
personas que no estaban en el entorno experimental se negaron a realizar las tareas antisociales,
pero como informaron otros investigadores, un alto porcentaje de personas hipnotizadas sí llevaron
a cabo las tareas según las instrucciones. Sin embargo, todos los participantes del control de
simulación también realizaron las tareas; incluso los controles que no simulaban las realizaban en
gran medida si se les presionaba para que cumplieran, lo que demuestra el poder de la situación
experimental.
La conclusión a extraer es que la hipnosis no es necesariamente responsable de la realización
de los actos antisociales. Más bien, las características de demanda de la situación experimental,
incluido el escenario, las instrucciones y la forma en que las personas creen que deben comportarse
mientras están bajo hipnosis, son suficientes para producir los actos antisociales.
Tal vez se pueda inducir a las personas a realizar actos antisociales bajo hipnosis profunda, pero
los estudios actualmente disponibles no ofrecen pruebas fiables que apoyen la idea de que la
hipnosis es responsable de la conducta.
ÿ TABLA 13.1
Porcentaje de participantes que realizaron tareas peligrosas en

respuesta a solicitudes del experimentador. (Adaptado de Orne & Evans, 1
Sujetar Tomar Tirar ácido al
Grupo de participantes Serpiente venenosa moneda de ácido experimentador
Hipnosis real 83 83 83
Simulando hipnosis 100 100 100
Control de vigilia: presionado para cumplir 50 83 83
Control de activación, sin ser presionado 50 17 17
para cumplir
No experimental 0 0 0
59533_14_ch13_p358-387.indd 373 9533_14_ch13_p358-387.indd 373 3/5/08 /5/08

El uso de participantes de control simulados, como en el experimento de Orne y Evans, es
una forma de atacar el problema de las características de la demanda. La lógica es esencialmente la
misma que la de usar una condición de placebo en la investigación médica. Se supone que las
características de demanda de la situación son las mismas para los participantes tanto en la condición
experimental como en la condición de control de simulación. Si la manipulación experimental (por
ejemplo, la hipnosis) es verdaderamente efectiva, entonces el comportamiento de los participantes
experimentales debería diferir de forma fiable del de los controles de simulación. Un problema con
esta lógica, por supuesto, es la implicación de que debido a que no se encontró ninguna diferencia,
no existe ninguna diferencia. Este es un ejemplo del error lógico de aceptar la hipótesis nula (ver
Apéndice B). Sin embargo, el hecho de no encontrar una diferencia entre los participantes de control
hipnotizados y los que simulan no prueba que la hipnosis no tenga efecto sobre el comportamiento.
Más bien, el experimento de Orne y Evans simplemente señala que existe una explicación alternativa
del cumplimiento de las solicitudes de realizar actos peligrosos por parte de las personas hipnotizadas:
pueden estar respondiendo a las características de demanda de la situación, en lugar de demostrar
un efecto único de la hipnosis. Para ver ejemplos adicionales del uso de participantes de control
simulados, consulte el trabajo de Bryant y Barnier (1999) y Reed y colegas (Reed, Kirsch, Wickless,
Moffi tt y Taren, 1996).
El problema de las características de la demanda es espinoso, especialmente en la investigación
psicológica social. Como señala Orne (1969, p. 156), estas preocupaciones son menos importantes
en aquellos estudios experimentales que no implican engaño y que alientan a las personas a
responder con la mayor precisión posible. Pero en los estudios en los que no se fomenta el rendimiento
óptimo por diversas razones y en los que a menudo hay engaño, los resultados pueden estar
contaminados por las características de la demanda. En el estudio de hipnosis, las personas en todas
las condiciones experimentales dijeron que realizaron los actos porque estaban en un experimento y
se sentían seguras, a pesar de las pretensiones bastante convincentes de lo contrario, de que el
experimentador había tomado precauciones para no dañarse a sí mismo ni a ellos. (Estaban en lo correcto
Investigación de campo del tema

Intervención de espectadores de ilustración
Los problemas de las características de la demanda en entornos de laboratorio, junto con otros
factores, han provocado que muchos psicólogos sociales recurran a la investigación de campo. En
lugar de intentar traer algún fenómeno al laboratorio para estudiarlo en un entorno controlado, el
investigador intenta introducir suficiente control en un entorno (en "el campo") para permitir que se
hagan inferencias sobre cómo las variaciones en una variable independiente afectar una variable
dependiente. En tales casos, no hay problema de generalizar al mundo real; para empezar, el
experimento se lleva a cabo en el mundo real. Sin embargo, en cierto modo, la investigación de
campo en psicología social es aún más difícil de concebir y llevar a cabo que la investigación de
laboratorio. Discutiremos algunos de estos problemas antes de examinar un estudio de campo.
El quid del método experimental en la investigación de laboratorio es abstraer variables

relevantes de situaciones complejas en la naturaleza y luego reproducir partes de estas situaciones,
de modo que al variar diferentes factores podamos determinar su contribución al comportamiento de
interés. Al llevar el fenómeno al laboratorio, ganamos control sobre la situación. Los principales
problemas de la investigación de campo tienen que ver con este tema del control. ¿Cómo podemos
controlar y manipular la variable independiente en un entorno de campo?
59533_14_ch13_p358-387.indd 374 9533_14_ch13_p358-387.indd 374 3/5/08 /5/08

Suponiendo que podamos hacer esto, ¿cómo podemos controlar o aleatorizar simultáneamente
todos los demás factores que probablemente varíen de cualquier manera en situaciones complejas?
¿Y qué medimos, de todos modos, en un entorno natural? ¿Cuál debe ser nuestra variable
dependiente? Hay todo tipo de cosas que podríamos medir, pero ¿cuán directamente relacionadas
están con el fenómeno de interés? Estas son preguntas muy difíciles; las respuestas dependerán
en gran medida del problema investigado y del ingenio de los investigadores individuales para
brindar control en una situación compleja.
El tema de especificar variables dependientes es tratado sistemáticamente por Webb y
asociados en un libro llamado Medidas discretas: investigación no reactiva en las ciencias sociales
(1966). Los autores están preocupados por el problema de los cambios de comportamiento de las
personas cuando saben que están siendo observadas o estudiadas. Discuten una serie de medidas
"discretas" que se pueden tomar sobre el comportamiento sin el conocimiento del sujeto y que, por
lo tanto, son adecuadas para su uso en la investigación de campo en psicología y otras ciencias
sociales (ver Capítulo 2). Aunque su libro contiene muchas sugerencias inteligentes e ingeniosas,
la mayoría de las medidas discretas que describen tienen poca relación con muchos problemas
psicológicos que los psicólogos están investigando activamente. El principal problema para obtener
una buena medida dependiente, o proporcionar una buena definición operativa de cualquier
construcción subyacente que se esté tratando de medir, es garantizar que exista un vínculo plausible
entre la construcción y lo que se mide. Este es un problema en toda investigación, como lo es
encontrar operaciones convergentes en un constructo, pero en la investigación de campo, estos
problemas se magnifican. La medida dependiente a menudo parece estar relacionada sólo
tangencialmente con el constructo subyacente, como cuando, por ejemplo, se utiliza una tasa de
mortalidad estándar como índice de patología social (véanse los capítulos 2 y 14).
Otro problema en la investigación de campo es la cuestión de la ética. ¿Podemos justificar la
participación de personas en la investigación en nombre de la ciencia cuando no se ofrecen como
voluntarios y, de hecho, no lo sospechan? ¿Deberíamos permitirnos manipular a nuestros
conciudadanos (a través de la variable independiente) y luego registrar sus reacciones (las variables
dependientes)? Esto es especialmente un problema cuando la manipulación implica inducir estrés
o vergüenza o algún otro estado indeseable. En el laboratorio, los psicólogos pueden (y están
obligados a) interrogar a los participantes después del experimento y decirles por qué fueron
colocados en esta situación incómoda, pero en el campo, esto generalmente no se hace, ya que
los participantes ni siquiera son conscientes de que están siendo manipulados y observados por psicó
Los psicólogos han decidido, no sin cierta dosis de interés propio, que la investigación de campo
realizada en un entorno público es permisible siempre que no se ocasione un gran estrés o daño a
los "participantes". Si los propios ciudadanos estarán de acuerdo con este juicio cuando (si) la
legitimidad de la investigación de campo alguna vez se convierte en un problema es otra cuestión.
Ciertamente, no toleramos la manipulación y el espionaje por parte de las agencias gubernamentales
y parece poco probable que el público en general encuentre más aceptables los motivos científicos
de los psicólogos. El problema aún no se ha planteado en gran medida, pero cuando lo haga,
puede significar la sentencia de muerte para la investigación de campo.
Antes de discutir un estudio de campo relacionado con la intervención de los espectadores,
examinemos cómo los psicólogos sociales se interesaron en este tema. Considere los siguientes
incidentes reales:
Kitty Genovese es atacada por un maníaco cuando regresa a casa del trabajo a las 3 a.m.
Treinta y ocho de sus vecinos en Kew Gardens se acercan a sus ventanas cuando ella
grita de terror; ninguno acude en su ayuda a pesar de que su acosador tarda más de
media hora en asesinarla. Nadie ni siquiera llama a la policía. Ella muere.
59533_14_ch13_p358-387.indd 375 9533_14_ch13_p358-387.indd 375 3/5/08 /5/08

Andrew Mormille es apuñalado en el estómago mientras viaja en el tren A a casa en Manhattan.
Otros once jinetes observan al chico de diecisiete años mientras se desangra; ninguno acude en su ayuda a
pesar de que sus atacantes han abandonado el coche. Él muere.
Una telefonista de dieciocho años, sola en su oficina en el Bronx, es violada y golpeada. Escapando
momentáneamente, corre desnuda y sangrando hacia la calle, gritando por ayuda. Una multitud de cuarenta
transeúntes se reúne y observa cómo, a plena luz del día, el violador intenta arrastrarla escaleras arriba; nadie
interfiere. Finalmente, dos policías pasan y arrestan a su agresor.
Estas viñetas están tomadas textualmente de un libro fascinante de Bibb Latané y John Darley
llamado The Unresponsive Bystander: Why Doesn't He Help? (1970, pp. 1-2), en el que describen
su investigación destinada a responder a esta pregunta. Aunque potencialmente hay muchas
razones por las que el transeúnte no puede ayudar en tales situaciones de crisis, una que surgió
al principio de esta investigación tenía que ver con la cantidad de transeúntes. Cuantas más
personas observen una crisis y sean ayudantes potenciales, es menos probable que un espectador
ayude a la víctima. Los psicólogos sociales llaman a esto el efecto espectador.
En un experimento de laboratorio (Darley y Latané, 1968), se hizo creer a los participantes que
estaban participando (a través de un sistema de intercomunicación) en una discusión sobre
problemas personales en la vida universitaria, con uno, dos o cinco estudiantes más. El
experimentador abandonó la escena después de que la persona recibió instrucciones. La
discusión comenzó con la presentación de los estudiantes, pero de repente uno de los estudiantes
comenzó a actuar, de una manera muy convincente, como si estuviera sufriendo un ataque
epiléptico. (En realidad, solo un verdadero participante participó a la vez; las otras voces que se escuc
El interés estaba en ver cómo se comportarían cuando pensaran que había cero, uno o cuatro
transeúntes más. Los resultados se muestran en la Tabla 13.2, donde se puede ver que el
porcentaje de personas que intentaron ayudar al extraño disminuyó a medida que aumentaba el
número de otros transeúntes. Incluso cuando las personas respondieron a la emergencia, fueron
más lentas cuando pensaron que otros también estaban presentes en la situación. Aparentemente
hay una “difusión de responsabilidad”, de modo que cuantas más personas estén presentes
(y más personas haya para presenciar potencialmente cómo uno se pone en ridículo), menos se
siente obligado cualquier individuo a intervenir. Un estudiante en una clase con otros 100
estudiantes se siente menos responsable de responder la pregunta de un instructor que un
estudiante en una clase con otros cinco.
ÿ TABLA 13.2
Tanto el porcentaje de personas que ayudan a una persona que sufre un

ataque epiléptico como la velocidad con la que responden se ven afectados
por el número de otras personas en la situación. A medida que aumenta el
número, menos personas intentan ayudar y pasa más tiempo antes de que se bri
(De Darley y Latané, 1968.)
Número de segundos
Número de Porcentaje de participantes Transcurriendo antes de Persona
Transeúntes percibidos Tratando de ayudar a un extraño intenta ayudar
1 85 52
2 62 93
5 31 166
59533_14_ch13_p358-387.indd 376 9533_14_ch13_p358-387.indd 376 3/5/08 /5/08

Piliavin, Rodin y Piliavin (1969) realizaron un interesante estudio de campo sobre la intervención de los
transeúntes en el metro de la ciudad de Nueva York. Escogieron un recorrido rápido entre dos estaciones que
duró 7,5 minutos y produjo una emergencia para observar quién respondía y con qué rapidez. Cuatro equipos
de estudiantes realizaron el experimento, que involucró el colapso de una persona (la víctima) en el tren unos
70 segundos después de que salió de la estación. Las variables independientes fueron la raza de la víctima y si
la víctima parecía estar enferma (portaba un bastón) o ebria (portaba una botella de licor envuelta en una bolsa
de papel marrón y además olía a licor). Otros dos experimentadores sirvieron como observadores y registraron
las medidas dependientes, que eran si se ofreció ayuda y el tiempo que transcurrió antes de que se ofreciera la
ayuda. Además, registraron la raza del ayudante, el número de ayudantes y el número y composición racial del
grupo de transeúntes u observadores.
Algunas de las predicciones eran que sería más probable que las personas ayudaran a una persona de
su propia raza que a una de otra raza, que la ayuda se brindaría más probablemente cuando la víctima fuera
percibida como enferma en lugar de borracha, y que la tendencia a ayudar sería mayor. disminuye con el
número de observadores. Curiosamente, estas predicciones (que parecen estar de acuerdo con el sentido
común) solo se verificaron parcialmente. Hubo una clara tendencia a ofrecer ayuda más fácilmente a las
víctimas enfermas que a las ebrias (en el 95 por ciento de los ensayos para la víctima enferma frente al 50 por
ciento para la víctima ebria). Pero en ambas condiciones, el número de observadores no afectó de ninguna
manera la probabilidad de que se ofreciera ayuda o la velocidad con la que se ofreció. Además, la raza de la
víctima enferma no afectó si una u otra raza ayudó. Sin embargo, cuando la víctima estaba borracha, las
personas de la misma raza ayudaron a la víctima más que las personas de una raza diferente.
Consideremos nuevamente la teoría de la difusión de la responsabilidad. Esta hipótesis fue desarrollada

por Darley y Latané cuando analizaron los factores que podrían haber infl uido en los transeúntes que no
respondieron a las crisis en entornos naturales. Probaron esta idea en una situación de laboratorio variando
sistemáticamente el número de espectadores y encontraron apoyo para ella. Pero cuando la idea se probó en
las circunstancias naturales del campo (donde el fenómeno se notó por primera vez), ¡no se encontró evidencia
de ello! Presumiblemente, los resultados difirieron no por una mayor diferencia entre la investigación de campo
y la de laboratorio, sino por otros factores sutiles que infl uyen en ayudar en situaciones tan complejas.
¿Cómo podemos determinar cuáles son estos factores? Primero, el investigador tendría que formular
hipótesis para responder a esta pregunta: ¿Cuándo un mayor número de espectadores reduce la disposición
de otras personas a intervenir? Después de decidir qué variables pueden ser importantes, el experimentador
debe variarlas sistemáticamente para ver qué influencia influye en la intervención de los espectadores cuando
hay diferentes números de espectadores presentes. En este caso, el experimentador estaría buscando una
interacción entre el número de espectadores y algún otro factor que está tratando de descubrir.
Otra lección que se puede extraer de los estudios de intervención de espectadores es que las respuestas
de los demás determinan en gran medida lo que percibimos como la realidad social de una situación. Si otras
40 personas se quedan mirando un asesinato, tú y yo también lo haremos. Tal comportamiento se considera
apropiado, ya que todos los demás lo están haciendo. ¿Por qué arriesgar nuestros cuellos, cuando todos estos
otros podrían ayudar? ¿Dónde está la policía cuando la necesitas? Las investigaciones han demostrado que si
se hace que las personas se sientan responsables de una crisis o ven a alguien más intervenir, es más probable
que intervengan (Moriarity, 1975). El tipo de evento también importa. En un estudio, era más probable que se
produjera un efecto de espectador cuando las personas presenciaban a un confederado pintando graffiti en un
ascensor que cuando lo veían tirando basura en un parque público (Chekroun & Brauer, 2002). Presumiblemente,
la gente sentía más responsabilidad por el parque público compartido que por el ascensor corporativo.
59533_14_ch13_p358-387.indd 377 9533_14_ch13_p358-387.indd 377 3/5/08 /5/08

Los experimentos de campo sobre la intervención de los espectadores son buenos ejemplos de
investigación de campo bien realizada. Aunque no es posible controlar las variables con tanta precisión como
se podría hacer en un entorno de laboratorio, las variables independientes se pueden manipular sin confundirlas
con otras variables. Esto se logra aleatorizando las otras variables. Por ejemplo, en cada recorrido del tren en
el estudio de Piliavin y asociados (1969), la condición del experimento se determinó aleatoriamente. Por lo
tanto, otras variables, como las diferencias entre las personas particulares que viajaban en los trenes, se
aleatorizaron entre las condiciones, lo que redujo en gran medida la probabilidad de que afectaran las
conclusiones extraídas del estudio. Sin embargo, podemos preguntarnos si hubo un problema ético en la
realización de esta investigación, ya que los “participantes” no sabían que estaban en el experimento.
Supongamos que uno de los transeúntes se hubiera desmayado (o hubiera tenido un ataque al corazón)
mientras observaba la crisis que se escenificaba repetidamente en el transcurso del experimento. ¿Valdría la
pena el sufrimiento de los participantes por los conocimientos adquiridos en el experimento? Este problema se
enfrenta a cualquiera que opte por investigar los problemas a través de la investigación de campo.
Tema Elección de la variable dependiente

Ilustración Medición de estereotipos y prejuicios
Suponga que desea estudiar si los estudiantes de su universidad tienen prejuicios contra los negros. ¿Qué
harías? Podrías encuestar a tus compañeros de estudios, pero ¿creerías lo que la gente te dijera? Al estudiar
temas socialmente delicados como el racismo, los psicólogos sociales a menudo no están dispuestos a aceptar
los autoinformes verbales de las personas. Las personas pueden no ser conscientes de sus propios prejuicios
(porque están motivadas para creer lo contrario), o pueden informar erróneamente sus actitudes para ser más
consistentes con las normas sociales contra el racismo (una forma de característica de demanda). Así, aunque
los psicólogos sociales aún utilizan cuestionarios sobre el racismo (p. ej., la escala Modern Racism; McConahey,
Hardee y Batts, 1981), también han desarrollado otras formas de medir el prejuicio. Es decir, los psicólogos
sociales han trabajado para crear variables dependientes que no sean sensibles a los problemas de autoinforme
y deseabilidad social.
En el Capítulo 10 ("Recordar y olvidar"), leíste acerca de las pruebas de memoria implícita que permiten
a los psicólogos medir la memoria sin pedir explícitamente a las personas que recuerden el episodio de estudio.
Los psicólogos sociales han adoptado un enfoque similar, creando medidas de actitud implícitas que les
permiten observar correlatos hipotéticos de prejuicio sin pedir explícitamente a los sujetos que informen sobre
sus actitudes.
Una medida reciente de actitud implícita fue impulsada por un hecho real, el asesinato de un inmigrante
negro por parte de policías blancos. Como se describió anteriormente en el capítulo, en febrero de 1999, cuatro
oficiales de la policía de la ciudad de Nueva York le dispararon 41 veces a Amidou Diallo cuando buscaba su
billetera. Diallo estaba desarmado, pero la policía disparó porque creyeron que estaba tratando de sacar un
arma. ¿Es posible que los agentes de policía hayan sido parcializados por la raza de Diallo? Es decir, ¿podría
el hecho de que él sea negro haber afectado su identificación errónea de la billetera como un arma?
Para estudiar esto experimentalmente, Payne (2001) creó un experimento de cebado con la siguiente
estructura: en cada prueba, una cara se mostró brevemente en la pantalla durante 200 ms, seguida de un
objeto presentado durante 200 ms. Las máscaras visuales comenzaron y terminaron cada ensayo.
La cara principal era negra o blanca, y el objeto objetivo era un arma o una herramienta. La tarea de los
sujetos (blancos) era ignorar las caras y presionar una tecla si el objeto era un arma y otra si era una
herramienta. Este procedimiento se representa en la figura 13.6. En uno
59533_14_ch13_p358-387.indd 378 9533_14_ch13_p358-387.indd 378 3/5/08 /5/08

(a)
Schulke/
Corbis
Flip
© O Hamburguesa/
Images
Harriet
Getty
©
(b) (C)
O
Edmundson/
Images
Getty
Paul
© Images
Krejci/
Getty
Ume
©
(d) (y)
(a)
ÿ FIGURA 13.6
En cada prueba, se mostró brevemente una cara negra o blanca, seguida de una pistola o herramienta. Las máscaras
visuales comenzaron y terminaron cada ensayo. La tarea consistía en presionar una tecla que indicaba "pistola" o "herramienta".
Adaptado de Payne (2001).
59533_14_ch13_p358-387.indd 379 9533_14_ch13_p358-387.indd 379 3/5/08 /5/08

experimento, Payne les dio a los sujetos el tiempo que necesitaban para hacer sus identificaciones de objetos; en el
segundo experimento, se impuso una fecha límite. Es decir, en el experimento 2, los sujetos tenían que responder
dentro de los 500 ms del inicio del objeto objetivo. La retroalimentación dada durante una fase de entrenamiento
aseguró que los sujetos aprendieran a responder rápidamente en el segundo experimento.
En el experimento 1, debido a que los sujetos podían tomar todo el tiempo que quisieran para tomar una decisión
sobre un objeto, hubo pocos errores. Es bueno que Payne haya incluido una segunda variable dependiente, a saber,
la velocidad con la que las personas tomaron sus decisiones sobre armas y herramientas. Como se muestra en el lado
izquierdo de la figura 13.7, surgió un patrón estereotipado en el tiempo de reacción. En general, los sujetos fueron más
rápidos para identificar las armas. Sin embargo, dado que se había presentado un arma, los sujetos eran mucho más
rápidos para presionar la tecla "arma" si la imagen había sido precedida por una cara negra en lugar de una cara
blanca. Se observó un patrón opuesto para las herramientas. Hubo una interacción entre la raza de la cara principal y
la identidad del objeto de destino. Visualización de una cara negra preparada para la identificación de armas.
En el experimento 2, debido a que los sujetos tenían que responder rápidamente (en menos de 500 ms),
cometieron más errores que en el primer experimento. Ahora puede ver evidencia de sesgo racial en los datos de
error. Los datos se muestran en el lado derecho de la Figura 13.7. En general, los sujetos tenían más probabilidades
de cometer errores con las herramientas que con las armas, llamando erróneamente a las herramientas "armas". Sin
embargo, de manera crítica, los sujetos identificaron erróneamente más herramientas como pistolas después de una
cara negra que después de una cara blanca.
Volviendo al caso de Amidou Diallo, se puede imaginar que los policías reaccionaron rápidamente y bajo estrés.
Los datos de Payne sugieren que cuando las personas responden rápidamente, ver a una persona negra aumenta la
probabilidad de percibir erróneamente un objeto inofensivo como un arma. Cuando tienen prisa, las personas se ven
obligadas a confiar en los estereotipos (que pueden actuar como una heurística o un atajo); desafortunadamente, los
estadounidenses tienen el estereotipo de que los negros son peligrosos (Devine & Elliot, 1995). El paradigma arma-
herramienta se está volviendo
Negro Negro
Blanco Blanco
460 0.4
450
0.3
440
reacción
Tiempo
(ms)
de
430 Proporción
errores
de
0.2
420
0.1
410
400 0
armas Instrumentos armas Instrumentos
mal identificado mal identificado

Tipo de objeto presentado como herramientas como armas
ÿ FIGURA 13.7
El panel izquierdo muestra los resultados del primer experimento de Payne, en el que a los sujetos se les dio todo el
tiempo necesario para tomar sus decisiones sobre armas y herramientas. El sesgo racial estuvo presente en los datos
del tiempo de reacción; los sujetos fueron particularmente rápidos para responder a las armas cuando habían sido
precedidos por una cara negra. El panel derecho muestra los resultados del segundo experimento, en el que los
sujetos tenían que responder rápidamente. Ahora cometieron errores: críticamente, era más probable que identificaran
erróneamente una herramienta como un arma después de haber visto una cara negra. Adaptado de Payne (2001).
59533_14_ch13_p358-387.indd 380 9533_14_ch13_p358-387.indd 380 3/5/08 /5/08

popular para estudiar una variedad de preguntas sobre prejuicios raciales (p. ej., Amodio,
Harmon Jones y Devine, 2003; Payne, Lambert y Jacoby, 2002), y se han obtenido resultados
similares cuando la tarea es disparar/no disparar decisión en un videojuego (Correll, Park,
Judd, & Wittenbrink, 2002). Sin embargo, las noticias no son del todo malas. También se han
logrado avances en la comprensión de cómo eliminar los sesgos en el paradigma de los
videojuegos (Plant, Peruche y Butz, 2005).

LA TUERCAS Y PERNOS
Problema ¿Cómo afecta la presencia de otras personas el desempeño de una persona

en una tarea?
La presencia de otras personas puede afectar nuestro comportamiento de muchas maneras.

Ciertamente, cuando sabemos que alguien nos está mirando, nos comportamos de manera
diferente que cuando creemos que nadie nos observa. Un ejemplo de este efecto se conoce
como facilitación social, que es el fenómeno de que la presencia de otros puede facilitar el
desempeño de un individuo en una tarea. Es posible que hayas notado este efecto cuando
haces ejercicio en un gimnasio o practicas un deporte, por ejemplo. Cuando los espectadores
están presentes, probablemente se esfuerce un poco más y se desempeñe un poco mejor. A
partir de esta observación, podríamos predecir que cuando las personas trabajan juntas en una
tarea, en realidad lo harán mejor que cuando trabajan solas.
Problema ¿Las personas se desempeñan mejor cuando trabajan en una tarea con otras
personas?
Esta es una consideración importante en la industria, por ejemplo. ¿Deberían diseñarse los
trabajos de modo que las personas trabajen solas o en grupos? ¿Existen condiciones bajo las
cuales el desempeño individual puede verse favorecido u obstaculizado por otros? ¿Cuáles
son esas condiciones?
Hipótesis Cuando una persona comparte la responsabilidad de una tarea con otras, se
desempeñará mejor en la tarea que si la realiza sola.
Para probar esta hipótesis, primero debemos encontrar una tarea apropiada para que la gente
la realice en el laboratorio. Debemos seleccionar algo que se pueda realizar tanto solo como
con un grupo de personas. Además, la tarea debe tener un resultado que sea medible y
comparable tanto en situaciones individuales como grupales. Por ejemplo, supongamos que la
tarea fuera diseñar un mejor teléfono para discapacitados. Naturalmente, esperaríamos que la
mayoría de los diseños grupales fueran mejores que los diseños de la mayoría de los individuos
(con la excepción, quizás, de algún genio ocasional). Pero, ¿cómo compararíamos el
desempeño de cada individuo que trabaja en el grupo con su desempeño trabajando solo?
Cuando trabaja solo, el individuo es el único responsable del producto. Cuando se trabaja en
grupo, el individuo es miembro de un equipo y contribuye solo parcialmente al producto final.
Sería difícil determinar cuánto contribuye el individuo al producto del grupo en relación con su
producto individual. Lo que necesitamos es una tarea que sea esencialmente la misma, ya sea
que se realice solo o en grupo.
59533_14_ch13_p358-387.indd 381 9533_14_ch13_p358-387.indd 381 3/5/08 /5/08

grupo y que también refleja los efectos del esfuerzo del grupo, al mismo tiempo que nos permite
evaluar la contribución relativa del individuo.
Un candidato potencial para esta tarea es uno que implique esfuerzo físico, como la fuerza con
la que uno puede tirar de una cuerda, una tarea discutida en la investigación descrita en el Capítulo
1. Veamos si esta tarea cumple con los criterios descritos anteriormente.
Primero, la medida del desempeño se cuantifica fácilmente. La cuerda se puede unir a un
mecanismo que mide la cantidad de fuerza ejercida cuando una persona tira de ella. En segundo
lugar, la medida es significativa ya sea que una o varias personas tiren de la cuerda, ya que la
métrica de desempeño, es decir, la fuerza, es la misma en ambas situaciones. Finalmente, el
desempeño individual puede compararse fácilmente con el desempeño grupal. Podemos pedirle a
cada persona que tire de la cuerda sola lo más fuerte posible y luego sume todas las puntuaciones
de fuerza. Esta suma representaría la contribución potencial de cada individuo al esfuerzo del
grupo y serviría como referencia para comparar el efecto del desempeño del grupo. A continuación,
podríamos hacer que todos los participantes tiren juntos de la cuerda y comparen la fuerza ejercida
por el grupo con la suma de las fuerzas de los individuos. Si el total del grupo es mayor que la
suma de las puntuaciones de los individuos, concluiríamos que el desempeño individual de las
personas mejora cuando realizan esta tarea con otros. Sabríamos que en general los participantes
se esforzaron más en grupo que solos.
Una pregunta interesante que surge en relación con este experimento es si el tamaño del grupo
afecta el desempeño individual. Por ejemplo, si creemos que la presencia de otras personas
facilitará el desempeño, entonces tal vez cuanta más gente esté presente, más se facilitará el
desempeño.
Hipótesis Cuanto más grande sea el grupo trabajando juntos, mayor será la
mejora en el desempeño de los individuos.
Podemos probar fácilmente esta hipótesis con nuestra tarea de tirar de la cuerda. Simplemente
podemos variar el tamaño de los grupos que evaluamos: grupos de dos, tres, cinco y ocho sujetos.
Ahora, resumamos las variables experimentales hasta ahora. Tenemos dos variables
independientes, tamaño del grupo (dos, tres, cinco u ocho) y entorno social (solo versus con el
grupo). El tamaño del grupo será un factor entre sujetos; no podemos manipular esto dentro de los
sujetos porque los grupos son de diferentes tamaños, por lo que, por definición, debemos tener
diferentes personas en cada grupo. Se comparará el entorno social dentro de los sujetos: cada
persona realizará la tarea de tirar de la cuerda solo y también con un grupo.
Nuestra variable dependiente será la fuerza total ejercida por los miembros del grupo. En la
condición de solo, las puntuaciones de los individuos se sumarán para obtener la puntuación total.
Hay una dificultad con esta medida, ahora que hemos decidido comparar grupos de diferentes
tamaños. Las fuerzas totales serán mucho mayores en los grupos más grandes que en los más
pequeños, ya que más puntuaciones contribuyen al total en los grupos más grandes. Para que los
grupos sean comparables, podemos convertir las puntuaciones de los grupos en proporciones. Es
decir, podemos medir la fuerza total ejercida por el grupo y luego dividirla por la suma de las
fuerzas individuales de los miembros de este grupo. Por ejemplo, si un grupo ejerció 500 libras de
tensión en la cuerda cuando tiraron juntos y un total sumado de solo 400 libras cuando tiraron
solos, la proporción sería de 5:4.
Si prevemos que el grupo facilitará el desempeño individual, estos
59533_14_ch13_p358-387.indd 382 9533_14_ch13_p358-387.indd 382 3/5/08 /5/08

las proporciones deben ser mayores que 1.00: La fuerza del grupo (el numerador) debe
ser mayor que la suma de las fuerzas individuales (el denominador). Además, si
predecimos que los grupos más grandes producen más facilitación, la proporción debería
aumentar a medida que aumenta el tamaño del grupo (p. ej., 5:4 para un grupo de tres
versus 6:4 para un grupo de ocho).
¿Qué otros factores debemos considerar? Primero, debemos probar más de un grupo
en cada condición. Aunque unas pocas personas participarán en cada grupo, cada grupo
proporcionará solo dos puntos de datos: la suma de la fuerza ejercida por los miembros
solos y la fuerza total ejercida por el grupo tirando juntos. Obviamente, no podemos hacer
comparaciones significativas si solo tenemos una observación en cada condición de
tamaño de grupo. Idealmente, deberíamos probar de 20 a 30 grupos en cada condición.
En segundo lugar, debemos equilibrar el orden de las condiciones de extracción. Para
cada condición de tamaño de grupo, los individuos de la mitad de los grupos deben
realizar primero el tirón individual; la otra mitad debe realizar primero el tirón grupal.
Tercero, las personas deben tener un descanso adecuado entre sus ejercicios individuales
y grupales, para que sus músculos no estén más fatigados en una condición que en la
otra.
Ahora pensemos en nuestro experimento. Primero, ¿crees que encontraremos
evidencia de facilitación social? Es decir, ¿piensas que las personas se esforzarán más
cuando tiran con el grupo que cuando tiran solas? En segundo lugar, ¿crees que las
personas de los grupos más grandes se esforzarán más que las personas de los grupos
más pequeños? ¿Puedes pensar en alguna razón por la que realmente podamos predecir
que sucederá lo contrario, es decir, que la situación del grupo en realidad producirá un
rendimiento más bajo? Recuerde que en la última sección (y en el Capítulo 1) introdujimos
la idea de la difusión de la responsabilidad para explicar la apatía de los espectadores. Es
decir, en muchos entornos se ha observado que cuantas más personas sean testigos de
una emergencia, es menos probable que intervenga una sola persona, tal vez porque las
personas se sienten personalmente menos responsables cuando hay otras personas
cerca para ayudar. Curiosamente, podemos invocar esta teoría para predecir que compartir
el trabajo con otras personas en realidad reducirá el rendimiento individual: la predicción
opuesta a la de nuestra hipótesis de facilitación social. Por lo tanto, nuestro experimento
propuesto proporciona una prueba de dos teorías en competencia, una situación deseable
desde el punto de vista de un científico.
Como recordará del Capítulo 1, se han llevado a cabo experimentos muy similares al
que hemos propuesto: La investigación indica que, de hecho, las personas trabajan menos
en un grupo que cuando están solas. El primer estudio de este tipo (realizado por
Ringelmann, publicado en Kravitz & Martin, 1986) sugirió que los grupos de dos trabajan
solo al 93 por ciento de sus capacidades individuales totales y los grupos de cuatro y ocho
se redujeron al 77 y 49 por ciento, respectivamente. Así, contrariamente a nuestras
predicciones originales (facilitación social), el desempeño de los individuos es menor en
los grupos y se vuelve aún más bajo a medida que aumenta el tamaño del grupo. Este
fenómeno ha sido denominado holgazanería social (Latané et al., 1979) y parece
consistente con la noción de que la responsabilidad se difunde entre los miembros de un
grupo.
¿Nuestro experimento refuta la hipótesis de la facilitación social? De nada. Como han
demostrado investigaciones posteriores, la variable crítica que determina si la presencia
de otras personas facilita o perjudica la
59533_14_ch13_p358-387.indd 383 9533_14_ch13_p358-387.indd 383 3/5/08 /5/08

el rendimiento es la cuestión de si el comportamiento del individuo se puede observar de forma única en la
situación. La holgazanería social ocurre cuando un individuo es un miembro anónimo de un grupo. Sin embargo,
cuando el individuo sabe que su desempeño puede ser identificado, el efecto puede ser eliminado. Por ejemplo,
los corredores de relevos nadan más rápido cuando se anuncian sus tiempos de vuelta individuales que cuando
solo se anuncia el tiempo total del equipo (Williams, Nida, Baca y Latané, 1989). Por lo tanto, cuando las
personas saben que se puede evaluar su desempeño personal, es probable que trabajen más duro cuando
otros están presentes. Sin embargo, si una persona puede “desvanecerse entre la multitud”, es probable que
haga menos esfuerzo. ("Después de todo, ¿por qué debería noquearme cuando nadie se da cuenta, de todos
modos?")
El consejo para el administrador de empresas parecería ser que los grupos de trabajo deben diseñarse de
modo que los resultados de una persona puedan ser observados por otros (para producir facilitación social) y
también para que los esfuerzos de cada individuo puedan evaluarse independientemente de los del grupo (para
evitar la holgazanería social).
ÿ RESUMEN
1. La investigación en psicología social es, en muchos sentidos, 4. El problema de que el comportamiento de los participantes esté
más difícil de realizar que otros tipos de investigación moldeado por las características de la demanda del entorno
discutidos en este libro porque las situaciones examinadas experimental es potencialmente más peligroso que el del
son a menudo bastante complejos, con muchas variables que sesgo del experimentador porque es probable que las
afectan el comportamiento. Por lo tanto, introducir control características de la demanda sean comunes en los
experimental en la situación para que las inferencias sólidas puedan experimentos en diferentes laboratorios. Las características de la d
hacerse acerca de los efectos de diferentes tratamientos expectativas de los participantes sobre cómo deberían
experimentales sobre la variable dependiente a menudo desempeñarse en el experimento. Orne desarrolló algunas
requiere un gran esfuerzo. técnicas ingeniosas para evaluar el efecto de las características
2. El control experimental combate el problema del error de la demanda. Usó grupos de cuasicontrol, como participantes
experimental, o cualquier variación en la variable dependiente simulados, que a menudo permiten a los investigadores evaluar
que no sea causada por la variable independiente. Tales si las características de la demanda afectan un experimento en
factores extraños deben ser controlados particular, pero no cuál sería el resultado del experimento si se
tanto como sea posible equiparándolos a través de las eliminaran las características de la demanda.
condiciones. Si el control no es posible, estos factores deben
distribuirse aleatoriamente entre las condiciones. 5. Una forma de evitar el problema de las características de la
3. Las expectativas tanto del experimentador como de los demanda es realizar un experimento “en el campo” o en un
participantes pueden crear problemas en la investigación entorno natural. Entonces se excluyen las características de
psicológica social (y otras). El experimentador puede sesgar la demanda, ya que las personas ni siquiera son conscientes
sutilmente los resultados de varias maneras, por ejemplo, de que están en un experimento. Muchos psicólogos sociales
tratando a las personas de manera ligeramente diferente en están recurriendo a la investigación de campo, ya que la
las diferentes condiciones. Una solución a este problema es generalidad de los resultados ya no es un problema como lo
que el experimentador esté ciego con respecto a la condición es en la investigación de laboratorio. Sin embargo, también
en el momento de la prueba, pero esto no suele ser factible, pueden ocurrir problemas graves con la investigación de
ya que el experimentador debe proporcionar la manipulación campo. A menudo es difícil manipular de manera efectiva una
experimental de alguna manera. Es probable que se descubran variable independiente mientras se controlan variables
los efectos del sesgo del experimentador en el curso normal extrañas "molestas", y también es difícil saber qué medir, ya
de la investigación científica. que los participantes ni siquiera saben que están en una situación.
59533_14_ch13_p358-387.indd 384 9533_14_ch13_p358-387.indd 384 3/5/08 /5/08

experimentar y no se les puede pedir que realicen alguna tarea, 6. Recientemente, los psicólogos sociales han adaptado las técnicas
calificar cómo se sienten, etc. Incluso si se superan estos de los psicólogos cognitivos para estudiar temas como las
problemas, nos queda un problema ético importante, aún más difícil actitudes. Podemos hacer inferencias sobre las actitudes y
de resolver, en cuanto a si los psicólogos están justificados para preferencias de las personas según el tiempo que tardan en
experimentar con miembros desprevenidos de la sociedad. responder a las situaciones o lo que recuerdan.
ÿ TÉRMINOS CLAVE
fenómeno autocinético Interacción

ciego obediencia
intervención del espectador (efecto espectador) efecto placebo

conformidad
confuso
variables de control aleatorización de cebado primo
características de la demanda simulación de participantes de control
difusión de la responsabilidad experimento simple ciego
experimento doble ciego facilitación social
controles experimentales barra social de

error experimental normas sociales
sesgo del experimentador Psicología Social

tema de investigación objetivo
medidas implícitas de actitud visual mascarillas
pruebas de memoria implícita
1. ¿Por qué el control experimental suele ser más difícil de lograr en minimizar los problemas en situaciones experimentales?
los experimentos de psicología social que en otros tipos de ¿Son estos problemas igualmente probables de ocurrir en todos
investigación? Para ilustrar, haga una lista de variables que los tipos de investigación?
tendrían que controlarse (o aleatorizarse) en un estudio típico de 4. Discuta las ventajas y desventajas de la investigación de campo.
intervención de espectadores que se realiza ¿Le importaría ser el participante involuntario en un experimento
sobre la intervención de un espectador si luego descubriera que
una. en una situación de laboratorio, y sus reacciones en la situación habían sido registradas?
b. en un experimento de campo.
2. Evalúe la siguiente afirmación: “Si una variable extraña corre el 5. Haz una lista de los temas que crees que podrían ser mejor
peligro de confundirse con la variable independiente de interés en estudió
un experimento, es mejor aleatorizar la influencia de la variable. una. en experimentos de laboratorio, y b. en

experimentos de campo.
capaz a travs de las condiciones que controlarlo para que Explica por qué eliges los temas que haces en cada
no puede variar entre condiciones.” Explica por qué crees que esta caso.
afirmación es verdadera o falsa. 6. La investigación de Milgram (1963) sobre la obediencia a la
3. Discutir los problemas del sesgo del experimentador no intencional autoridad fue duramente criticada por varios psicólogos. Uno de
y las características de la demanda de la situación experimental. los críticos más vocales, Baumrind (1964), argumentó que el
¿Cómo puede la infl uencia de estos impacto psicológico a largo plazo
59533_14_ch13_p358-387.indd 385 9533_14_ch13_p358-387.indd 385 3/5/08 /5/08

el riesgo para los participantes superó cualquier validez de los informes verbales y autoinformes, ¿qué
contribución potencial a la ciencia psicológica. Milgram haría para determinar si una persona ha incurrido en
realizó sesiones de seguimiento (inmediatas y 1 año efectos negativos a largo plazo por participar en un
después) para determinar si los participantes habían estudio de obediencia como el de Milgram?
sufrido efectos negativos a largo plazo por su 7. Evaluar la validez de la tarea de identificación de armas de
participación en sus experimentos de obediencia. Este Payne. Es decir, ¿cómo te sientes al estudiar el sesgo
seguimiento incluyó cuestionarios de autoinforme e racial en un paradigma de preparación? ¿Cuáles son las
informes verbales a un psiquiatra. Dado lo dudoso fortalezas y debilidades de este enfoque?
CONEXIONES WEB
Una buena visión general de la psicología social se puede encontrar en:
http://www.sspp.org/what.htm
Este sitio cubre casi todos los aspectos de la psicología social:
http://www.psicologíasocial.org/
Este sitio le permitirá medir sus propias actitudes implícitas hacia los negros y los blancos, los hombres y las
mujeres, los jóvenes y los ancianos, y una variedad cada vez mayor de otros grupos.
https://implicit.harvard.edu/implicit/
En este capítulo, leíste acerca de los estereotipos raciales. Hay otros tipos de sesgos que podrías estudiar,
como el sexismo, la discriminación por edad y la homofobia. Langston (2002)
El capítulo 8 describe experimentos sobre estereotipos sexuales. Por ejemplo, a menudo se supone que los
conductores de camiones y los médicos son hombres, mientras que las secretarias y enfermeras son mujeres.
La evidencia de estos sesgos de género se puede encontrar en un examen de los tiempos de lectura de las
personas. Es decir, las personas tardan más en leer oraciones en las que una ocupación estereotípicamente
masculina se asocia con un pronombre femenino que con un pronombre masculino. Por ejemplo, los sujetos
leen la oración "Un abogado debe argumentar su caso con frecuencia fuera de los tribunales" más rápido que
la oración "Un abogado debe argumentar su caso con frecuencia fuera de los tribunales". Además de replicar
este efecto básico, sería interesante pensar en cómo el tamaño del efecto podría diferir entre tipos de personas.
Por ejemplo, ¿cree que los estereotipos de género serían más o menos frecuentes en adultos mayores o
jóvenes? ¿Conservadores o liberales? Hombres o mujeres? También podría pensar en cómo podría modificarse
esta tarea para estudiar otros dominios de estereotipos (p. ej., discriminación por edad).
El poder de estar en un experimento

El conocimiento de las personas de que están participando en un experimento a menudo afecta fuertemente su
comportamiento. Las personas hacen cosas cuando están en un experimento que no harían en otras
circunstancias. Puede demostrar esto realizando un simple
59533_14_ch13_p358-387.indd 386 9533_14_ch13_p358-387.indd 386 3/5/08 /5/08

experimenta con tus amigos. Haga una lista de 10 amigos y asígnelos aleatoriamente a una de dos
condiciones, ya sea la condición experimental o la condición de control. La variable independiente para
los dos grupos es la afirmación que haces al comienzo del experimento. Dígales a los participantes
experimentales: “Me gustaría que hicieran algunas cosas por mí como parte de un experimento de
psicología para uno de mis cursos”. Dígale al grupo de control: “Me gustaría que me hicieran un favor”.
Luego dile a cada amigo que tienes una petición: te gustaría que la persona hiciera cinco saltos, seis
abdominales, cuatro flexiones y un avión de papel lo más rápido posible.
Por supuesto, el pequeño número de participantes en el experimento hace que sea difícil sacar
conclusiones sólidas. Pero probablemente descubras que los amigos a los que se les pide que te
ayuden con un experimento de psicología probablemente sean mucho más cooperativos. Probablemente
harán más actividades, las harán más rápido y harán menos preguntas. Las personas en el grupo de
control probablemente pensarán que has estado estudiando demasiado.
El objetivo de esta demostración es mostrar que los experimentos de psicología no solo

proporcionan encuestas neutrales del comportamiento; también pueden crear los comportamientos que
se estudian. Cuando las personas saben que están siendo observadas en un experimento, pueden
reaccionar de manera diferente. Así, el psicólogo corre el peligro de estudiar conductas producidas en
el laboratorio que pueden tener poca relación con las conductas que ocurren en el mundo exterior. Las
señales en el experimento que guían el comportamiento de las personas de esta manera se denominan
características de la demanda. ÿ
59533_14_ch13_p358-387.indd 387 9533_14_ch13_p358-387.indd 387 3/5/08 /5/08

CAPÍTULO 14
AMBIENTAL
PSICOLOGÍA
¿ES LA CIENCIA EL ÚNICO CAMINO HACIA LA VERDAD?
Descubriendo la verdad sobre la vida en la ciudad

ILUSTRACIONES
Generalización de resultados: hacinamiento

ILUSTRACIONES
Cuasi-Experimentos: Ruido y Rendimiento Cognitivo

ILUSTRACIONES
Cuestiones éticas: engaño y ocultación

¿La exposición al ruido es mala para usted?
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: RUIDO Y MEMORIA
59533_15_ch14_p388-409.indd 388 9533_15_ch14_p388-409.indd 388 28/03/08 /28/08

La ciencia se construye con hechos, como una casa con piedras. Pero una colección de
hechos no es una ciencia más de lo que un montón de piedras es una casa. (JH POINCARÉ)
En su manual de dos volúmenes sobre psicología ambiental, que tiene más de 1500 páginas,
Stokols y Altman (1987) describen la psicología ambiental como un estudio interdisciplinario del
“comportamiento humano y el bienestar en relación con el entorno sociofísico” (p. 1 ). Además de los
psicólogos que estudian psicología ambiental, un grupo sorprendentemente amplio de investigadores
y profesionales se ha centrado en las interacciones persona-ambiente. Estas personas provienen de
campos como la arquitectura, la geografía, la salud pública, la sociología y la planificación urbana. Esta
diversidad de intereses disciplinarios ha llevado al crecimiento de un campo amplio que incluye el
estudio del comportamiento espacial, el hacinamiento, el estrés y la territorialidad en una variedad de
entornos, incluidas escuelas, residencias, lugares de trabajo, el entorno natural y condiciones extremas.
y lugares inusuales (como los desiertos o el Ártico). Además, muchos investigadores han estudiado
diversas aplicaciones de la psicología ambiental en áreas tales como la conservación de recursos y el
fomento del reciclaje. De esta amplia gama de temas, hemos seleccionado algunos para ilustrar tres
problemas metodológicos.
El problema discutido con mayor profundidad en este capítulo es la generalidad de los resultados.
Un estudio sobre el ruido (Cohen, Glass y Singer, 1973) mostró que los niños que vivían en los pisos
inferiores de un edificio de apartamentos construido directamente sobre una autopista concurrida eran
peores lectores que los niños que vivían en los pisos superiores, donde el ruido el tráfico de paso era
menos intenso. Como resultado de este estudio, los ocupantes del edificio exigieron que se construyera
un techo sobre la autopista (Figura 14.1). ¿El problema justificaba esta demanda? Los investigadores
deben poder demostrar, como lo hicieron Cohen y sus colegas, que las conclusiones extraídas de sus
datos pueden generalizarse de manera significativa.
Un segundo problema que los psicólogos ambientales comparten con los psicólogos
experimentales son los efectos del ruido en el comportamiento. Es más probable que los psicólogos
experimentales aborden este problema con experimentos de laboratorio. Sin embargo, los psicólogos
ambientales generalmente prefieren los estudios de campo, de modo que los cuasi-experimentos
reemplacen a los experimentos verdaderos. Por lo tanto, discutiremos los efectos del ruido de los
aviones y la construcción en los estudiantes que no han sido asignados al azar a las condiciones experim
Un tercer problema, que quizás sea más problemático para los psicólogos ambientales que para
otros investigadores, implica cuestiones éticas en la investigación. El científico tiene la responsabilidad
de garantizar que las personas no sufran daños en la búsqueda del conocimiento. A menudo, sin
embargo, existe cierto grado de riesgo. ¿Cómo, entonces, puede el psicólogo asegurarse de que la
investigación cumpla con los principios éticos establecidos?
ÿ ¿ES LA CIENCIA EL ÚNICO CAMINO HACIA LA VERDAD?
Nuestra sociedad otorga un alto valor a la ciencia y la tecnología. El aterrizaje de los astronautas en la
luna simboliza el poder y el prestigio de la ciencia estadounidense. Muchos ciudadanos creen que
nuestro alto nivel de vida, directamente atribuible a dispositivos tecnológicos como automóviles,
televisores y computadoras, seguirá aumentando a medida que la ciencia
59533_15_ch14_p388-409.indd 389 9533_15_ch14_p388-409.indd 389 28/03/08 /28/08

ÿ FIGURA 14.1
Estos apartamentos están construidos sobre el acceso

al puente George Washington en la ciudad de Nueva
York. El ruido de la carretera es un problema grave para
los residentes.
Shelden
Cortesía
Cohen
Dr.
del
avances. Por lo tanto, la búsqueda del conocimiento científico está ampliamente justificada sobre la base
práctica de que la ciencia crea una vida mejor para las personas, así como sobre la base filosófica de que
la ciencia, en lugar del arte, la religión, la literatura, etc., ofrece la mejor oportunidad. para encontrar la
verdad.
La psicología aún tiene que lograr tantos éxitos sorprendentes como otras ciencias, como la física y
la química. Por lo tanto, es más difícil justificar los beneficios científicos de la psicología sobre bases
puramente prácticas. Sin embargo, algunas personas afirman que nuestra comprensión de los procesos
físicos, como los relacionados con la energía nuclear, ha superado tanto nuestra comprensión de los
procesos humanos que nos hemos convertido en cautivos de nuestra ciencia, en lugar de beneficiarios. A
medida que la contaminación, el hacinamiento y los problemas ambientales relacionados disminuyen la
calidad de vida, la importancia de las ciencias sociales se vuelve cada vez más obvia. La psicología
ambiental se ocupa de cuestiones que afectan directamente a nuestra vida cotidiana.
Dado que los científicos físicos han logrado logros impresionantes, tanto en la teoría como en la
práctica, parece razonable que los científicos sociales emulen a sus colegas más establecidos.
Prácticamente todos los científicos sociales creen que se pueden descubrir y se descubrirán verdades
poderosas aplicando los métodos científi cos utilizados por los científicos físicos.
La ciencia nos otorgará una mejor comprensión teórica de la naturaleza de la actividad humana, y esto
eventualmente conducirá a una tecnología capaz de mejorar la calidad de vida.
No todos los científicos son conscientes de las limitaciones de la ciencia, a pesar de una breve
exposición a estos puntos como parte de su educación. El científico en ejercicio puede eventualmente
descartar una variedad de puntos filosóficos por tener un valor limitado en su trabajo diario (Medawar,
1969, Capítulo 1).
No obstante, es oportuno presentar la otra cara de la moneda y discutir estas limitaciones. La ciencia
se enfoca solo en ciertas preguntas e ignora otras cuestiones.
Sería extremadamente difícil responder a la pregunta “¿Existe Dios?” científicamente, por lo que la
mayoría de los científicos se contentan con dedicarse a otros asuntos. Del mismo modo, los psicólogos tienden
59533_15_ch14_p388-409.indd 390 9533_15_ch14_p388-409.indd 390 28/03/08 /28/08

concentrarse en el estudio del comportamiento más que en otros tipos de experiencia humana.
Aldous Huxley (1946) comenta sobre este aspecto de la ciencia:
Pragmáticamente, [los científicos] están justificados al actuar de esta manera extraña y

extremadamente arbitraria; porque concentrándose exclusivamente en los aspectos medibles de
tales elementos de la experiencia que pueden ser explicados en términos de un sistema causal,
han sido capaces de lograr un control grande y creciente sobre las energías de la naturaleza.
Pero el poder no es lo mismo que la intuición y, como representación de la realidad, la imagen
científica del mundo es inadecuada por la sencilla razón de que la ciencia ni siquiera pretende
tratar con la experiencia como un todo, sino solo con ciertos aspectos de ella. en ciertos contextos.
Todo esto lo entienden muy claramente los hombres de ciencia más filosóficos. Pero algunos
científicos. . . tienden a aceptar la imagen del mundo implícita en las teorías de la ciencia como
una descripción completa y exhaustiva de la realidad; luego tienden a considerar aquellos
aspectos de la experiencia que los científicos dejan fuera de consideración, porque son
incompetentes para tratar con ellos, como algo menos real que los aspectos que la ciencia
arbitrariamente ha elegido abstraer de la infinitamente rica totalidad de hechos dados. . (págs. 35–3
Weizenbaum (1976) hace esta misma observación utilizando una anécdota sobre un borracho
que buscaba las llaves perdidas. El borracho, arrodillado bajo una farola, es abordado por un oficial de
policía. El borracho explica que está buscando sus llaves, que perdió en algún lugar de la oscuridad.
Cuando el policía le pregunta por qué no mira para allá, el borracho responde que aquí hay más luz
debajo de la farola. La ciencia es un poco como el borracho, ya que mira donde sus herramientas
proporcionan la mejor iluminación.
La psicología ambiental se ve particularmente presionada cuando se aplica esta crítica de la
ciencia. El mundo real, a diferencia del mundo algo artificial de los estudios de laboratorio
cuidadosamente controlados del psicólogo experimental, está repleto de problemas fuera del círculo
de luz que emite una farola. Los psicólogos saben que el progreso científico se produce, de forma lenta
pero segura, si se mantienen dentro de los rayos de la farola hasta que un nuevo avance produzca
una luz más potente. Pero este enfoque tradicional ofrece poca esperanza para la solución rápida de
problemas ambientales apremiantes.
Si los psicólogos ambientales se mueven lenta y tradicionalmente, están abiertos a la crítica de que
su investigación es irrelevante para las necesidades de la sociedad. Esta es una acusación grave, ya
que, en última instancia, la sociedad paga el precio de esta investigación a través de subvenciones de
investigación federales y demás. Por otra parte, el psicólogo desprevenido que se lanza de inmediato
a solucionar los males de la sociedad corre un alto riesgo de obtener resultados que luego pueden
resultar inadecuados. Y si la política pública se formula sobre la base de dicha investigación incompleta
(o de ninguna investigación), el precio para la sociedad puede ser bastante alto (Figura 14.2).
Descubriendo la verdad sobre la vida en la ciudad
Todos nosotros, ya sea que vivamos en grandes áreas metropolitanas o en comunidades rurales,
tenemos opiniones sobre la calidad de vida urbana. Para algunos, la ciudad representa el apogeo de
la cultura y los logros. Para otros, la ciudad es un pozo negro de violencia, contaminación y ruido.
¿Cómo podemos descubrir la verdad sobre la vida en la ciudad?
Una de las visiones más perspicaces de la vida de la ciudad se puede encontrar en un libro
fascinante, Death and Life of Great American Cities, de Jane Jacobs (1961). Como un ejemplo de su
perspicacia, discutiremos brevemente los puntos de vista de Jacobs sobre las funciones de la acera.
59533_15_ch14_p388-409.indd 391 9533_15_ch14_p388-409.indd 391 28/03/08 /28/08

Bettmann
Corbis/
©
ÿ FIGURA 14.2
Demolición de Parte del Proyecto de Vivienda Pruitt-Igoe en St. Louis. Estos edificios,
aunque en buen estado físico, quedaron inservibles para ser ocupados debido al vandalismo.
Desde entonces, la investigación realizada por científicos sociales ambientales ha revelado cómo
prevenir tales tragedias.
Para la mayoría de nosotros, la acera existe para llevarnos de un lugar a otro. La mayoría de
nosotros, incluidos los psicólogos, no hemos pensado mucho en las funciones psicológicas de la
acera común. Jacobs muestra que la acera hace una gran contribución a la interacción social dentro
de la ciudad. Ella señala que los propietarios de pequeñas tiendas que bordean las calles locales
(sastres, farmacias, tiendas de dulces) brindan una multitud de servicios sociales para los usuarios
de las calles del vecindario. Estos servicios van más allá de la naturaleza de cada negocio en
particular. Por lo tanto, un sastre podría estar atento a los niños que corren por la calle y advertir a
sus padres; el dueño de la tienda de golosinas podría dejar que los niños usen sus baños para que
no tengan que correr escaleras arriba; el propietario de la tienda de delicatessen podría recibir
correo de un cliente que está fuera de la ciudad durante unos días. Cada uno de estos servicios por sí so
Pero cuando se suman, argumenta Jacobs, forman la base de sentimientos positivos sobre un
vecindario como un buen lugar para vivir.
Cualquiera que haya vivido en una calle tan anticuada de la ciudad acepta intuitivamente la
verdad de las declaraciones de Jacobs. Sin embargo, sus conclusiones se basan únicamente en la
observación naturalista. Aunque la observación es un origen importante para la ciencia (ver Capítulo
2), un mejor método agregaría credibilidad a sus afirmaciones. No hay nada experimental en la
forma en que Jacobs recopiló sus datos. No se hicieron intentos sistemáticos para manipular
variables dependientes y registrar variables dependientes; no se realizaron réplicas; ninguna
variable de control entra en sus descripciones de comportamiento. Aunque ningún científico
rechazaría sus conclusiones de plano, pocos las aceptarían. La mayoría de los científicos afirmarían
que aún no se ha logrado una prueba adecuada de sus sugerencias, que no son hipótesis claras
que puedan probarse fácilmente. Hasta que se lleven a cabo debidamente los procedimientos
formales requeridos por la ciencia, las conclusiones de Jacobs no pueden ser santificadas como
verdad científica, sino sólo consideradas como posibilidades interesantes.
59533_15_ch14_p388-409.indd 392 9533_15_ch14_p388-409.indd 392 28/03/08 /28/08

El problema nos lleva de vuelta a nuestro ejemplo de la farola. Jacobs está operando fuera de la luz. Esto hace que
los científicos se muestren reacios a aceptar sus verdades. Sin embargo, para muchas personas, sus conclusiones parecen
obviamente correctas. ¿Por qué el método científico es mejor que la observación astuta? La respuesta a esta importante
pregunta se da en el Capítulo 1, donde discutimos la fijación de la creencia. Recordarás que la gran ventaja del método
científi co es que se corrige a sí mismo. Si un observador diferente llegara a conclusiones diferentes sobre las funciones y
el valor de las aceras, ¿cómo podrías decidir qué punto de vista es el correcto? Hasta ahora no tenemos una mejor manera
que la ciencia para decidir tales cuestiones. La ciencia como método para fijar creencias se parece mucho a la democracia
tal como la describe Winston Churchill: “La democracia es el peor sistema de gobierno excepto todos los demás”. Aceptar
el método científico no implica que cualquier otro método para llegar a la verdad, como las observaciones de Jacobs sobre
la vida en la ciudad, sea necesariamente inválido. De hecho, la investigación psicológica ha confirmado muchas de las
sugerencias de Jacobs. Ciertamente hay más de un camino hacia la verdad. Pero cuando debemos estar de acuerdo
sobre alguna verdad particular sobre la cual hay alguna disputa, entonces el método científi co, con todas sus limitaciones,
ofrece la mejor solución a largo plazo.
Tema Generalización de Resultados

Ilustración hacinamiento
Ningún experimento es un fin en sí mismo. Los experimentos son pasos en el camino hacia el objetivo final del psicólogo
de predecir y explicar el comportamiento. A menos que los resultados de experimentos anteriores puedan aplicarse a
situaciones nuevas, los experimentos tienen poco valor. Por lo tanto, los modelos que explican el flujo de electricidad están
diseñados para tratar no solo con la pequeña cantidad de electrones que se han estudiado en el laboratorio, sino también
con los electrones en los enchufes de pared de su casa.
Un criterio importante para juzgar la utilidad de un experimento es su representatividad. Los experimentos que son
representativos nos permiten extender sus hallazgos a situaciones más generales. Cuando los investigadores descubrieron
que los alquitranes de los cigarrillos causaban cáncer en los beagles de laboratorio, muchos fumadores de cigarrillos
sintieron que tal investigación solo demostraba que los perros no deberían fumar. En resumen, dudaron de la
representatividad de los hallazgos y no creían que los resultados pudieran generalizarse a los humanos. Sin embargo,
estudios posteriores confirmaron estos hallazgos anteriores; ahora, el cirujano general está tan convencido de los peligros
de fumar cigarrillos que todos los paquetes de cigarrillos deben etiquetarse con una advertencia para el usuario.
El experimento cigarrillo-beagle es un ejemplo del problema de generalizar los resultados de una muestra a una
muestra diferente oa una población diferente. Llamaremos generalización a esta muestra. Ocurre en muchas formas. El
organismo humano más estudiado es el estudiante universitario que asiste a una clase de introducción a la psicología y,
como parte del proceso educativo, a menudo se le pide que participe en varios experimentos.
Supongamos que acabamos de completar un estudio sobre diferentes métodos para mejorar la velocidad de lectura y la
comprensión utilizando una pequeña muestra de estudiantes de la Universidad de Rice inscritos en Introducción a la
Psicología. Si tal estudio arroja resultados apropiados, podría tener implicaciones importantes para la educación. Pero
primero, antes de que se puedan hacer estas implicaciones, se deben responder varias preguntas sobre la generalización
de la muestra.
Primero, ¿son estos resultados típicos o representativos de todos los estudiantes de Rice que toman clases introductorias?
59533_15_ch14_p388-409.indd 393 9533_15_ch14_p388-409.indd 393 28/03/08 /28/08

Variables dependientes El compañero que fue útil y cooperativo podría ser

juzgado más atractivo físicamente que el mismo
Los psicólogos ambientales a menudo registran compañero (en una condición experimental diferente)
sentimientos y emociones además del comportamiento que fue insultante y grosero.
observable. Tales estados internos se infieren de las
escalas de calificación. Por lo tanto, un estudio sobre el Variables independientes
hacinamiento podría pedir a las personas que califiquen
cosas como su opinión sobre las otras personas Los estudios de hacinamiento, comportamiento espacial
involucradas en el estudio, lo agradable de la experiencia y territorialidad manipulan la densidad, que suele
y el tamaño percibido de la habitación. Sin embargo, el definirse como el número de personas por unidad de
simple hecho de etiquetar una escala con algún título área, por ejemplo, seis personas en 10 metros cuadrados (o pies
descriptivo no garantiza que la escala mida esa, y solo Dado que podemos contar el número de personas y
esa, faceta particular de la experiencia humana. medir el área, la densidad así definida satisface nuestros
Considere una pregunta de calificación como la siguiente, requisitos para una definición operativa clara. Como la
para la cual el lector debe rodear un número del 1 al 5: densidad tiene dos componentes, podemos manipularla
En términos de atractivo físico, mi parte de dos formas. Primero, podemos mantener constante
no que: el número de personas y variar el tamaño de la habitación
que las contiene. En segundo lugar, podemos mantener
Extremadamente guapo 2 un perro de verdad
constante el tamaño de la habitación y variar el número
1 3 4 5
de personas en la habitación. Aunque estos dos tipos de
La respuesta del sujeto bien podría estar influenciada manipulación de la densidad pueden parecer al principio
por características conductuales no físicas. A equivalentes, resulta que tienen diferentes
¿psicología? Nuevamente, si nuestra muestra consiste solo en estudiantes de primer año de Rice, no podemos
estar seguros de que los estudiantes de último año de Rice produzcan los mismos resultados. E incluso si
nuestros resultados se generalizaran a todos los estudiantes universitarios de Rice, probablemente no valdría
la pena instituir un cambio drástico en la metodología de lectura, a menos que se pudiera demostrar que los
estudiantes universitarios de todo el país podrían beneficiarse. Incluso entonces, podríamos preguntarnos si
los estudiantes de secundaria y primaria podrían usar este nuevo método de lectura. Claramente, un solo
experimento rara vez se generalizará a todas las poblaciones de interés.
También existen problemas similares sobre la generalización de variables independientes y dependientes.
El estrés ambiental puede ser inducido por medios tan diversos como el aumento de la temperatura, el
aumento del nivel de ruido y la privación de sueño a una persona la noche anterior a un experimento. En la
medida en que nuestra preocupación se centre en el estrés ambiental en general, más que en los efectos
específicos del ruido, la temperatura y la falta de sueño, debemos asegurarnos de que estas diferentes
manipulaciones de las variables independientes relacionadas nos permitan hacer afirmaciones representativas
sobre el estrés. Llamaremos a esta variable representatividad. Digamos que nos preocupan los efectos de
la temperatura en los disturbios urbanos: ¿el largo y caluroso verano conduce a la agresión? Cuando esto se
estudia en el laboratorio (Baron & Bell, 1976), encontramos que las altas temperaturas no conducen
necesariamente a una mayor agresión.
Pero antes de que podamos rechazar esta explicación de los problemas urbanos de verano y avanzar hacia
otras hipótesis (p. ej., más jóvenes holgazanean en las calles durante los meses de verano), debemos
asegurarnos de que las medidas independientes y dependientes se generalicen desde el laboratorio a la
escena urbana. La mayoría de nosotros estaríamos dispuestos a aceptar la afirmación
59533_15_ch14_p388-409.indd 394 9533_15_ch14_p388-409.indd 394 28/03/08 /28/08

efectos sobre el comportamiento y los sentimientos (p. y la contaminación del aire son ejemplos de este tipo
ej., véase Marshall y Heslin, 1975). Así que la definición de variable independiente.
operativa usual, aunque precisa y clara, es inadecuada,
porque confunde dos variables separadas: número de
personas y cantidad de espacio. Por ejemplo, si la Variables de control
densidad se manipula aumentando el número de
personas y manteniendo constante el tamaño de la Los estudios de psicología ambiental a menudo carecen
habitación, no sabemos si las diferencias observables de las variables de control cuidadoso que se encuentran
se atribuyen mejor a los efectos de la densidad oa los en el trabajo de laboratorio realizado en psicología.
efectos del número de personas. Aunque se controlan las características físicas generales
El problema se complica aún más por el hecho de que del entorno, como la temperatura ambiente, a menudo
la densidad psicológica a menudo no es lo mismo que se pasan por alto las variables de grano más fino, por
la densidad física. La sensación de hacinamiento ejemplo, la posición relativa de los participantes (uno al
depende no solo de la densidad física sino también del lado del otro o cara a cara). Este defecto es
contexto social (Rapoport, 1975). Una discoteca particularmente evidente en los estudios de campo que,
abarrotada tiene asociaciones mucho más agradables por su propia naturaleza, no ofrecen al experimentador
que un vagón de metro igualmente abarrotado. mucho control sobre la situación. Los psicólogos
Otro conjunto de variables independientes ambientales que realizan estudios de campo son
estudiadas por los psicólogos ambientales cae en la conscientes de este problema, pero piensan que la
categoría de estresores: aquellos agentes que producen mayor realidad de la situación de campo en comparación
situaciones estresantes. Ruido fuerte, altas temperaturas, con el entorno de laboratorio más artificial es una amplia recom
que una temperatura de 95°F en el laboratorio es equivalente a la misma temperatura en la calle

de la ciudad. Pero esta equivalencia es menos clara cuando consideramos medidas comunes de
laboratorio de agresión. La técnica más utilizada requiere que el sujeto administre una descarga
eléctrica a un cómplice, como se usa en el trabajo de Milgram que se describe en el capítulo 13
(ver también la figura 14.3). (En realidad, no se administra ninguna descarga, pero el
experimentador espera que el sujeto piense que está controlando una descarga eléctrica). Descarg
ÿ FIGURA 14.3
Una máquina de choque típica

utilizada en estudios de
laboratorio de agresión. Los
botones controlan la intensidad
(hipotética) de la descarga.
Tagawa
Estado
Bunji
de
59533_15_ch14_p388-409.indd 395 9533_15_ch14_p388-409.indd 395 28/03/08 /28/08

Delevingne/
Boston
Lionel
Stock
©
ÿ FIGURA 14.4
Agresión en una situación fuera del laboratorio. ¿Crees que este es el mismo tipo de
agresión probado en la figura 14.3?
las intensidades y duraciones más largas de las descargas se interpretan como evidencia de una mayor
agresión. ¿Es la agresión involucrada en presionar un botón la misma agresión involucrada en lanzar un
ladrillo a través de la ventana de una tienda o disparar a la policía y los bomberos con un rifle (Figura
14.4)? Aunque el efecto final (dañar a otra persona) parece ser el mismo en la agresión dentro y fuera
del laboratorio, el desorden civil puede agregar otra dimensión a la agresión. Establecer una analogía
física en el laboratorio —como cuando se entrena a las ratas para “acaparar” dinero— no implica
necesariamente una identidad psicológica.
De hecho, es esta considerable dificultad para establecer la representatividad de las variables lo que ha
alejado a muchos psicólogos ambientales de los estudios de laboratorio hacia los estudios de campo, a
pesar del hecho de que los resultados del control experimental son considerablemente menores.
En este capítulo, discutimos cuatro estudios sobre el hacinamiento y examinamos cuidadosamente
cómo se pueden generalizar sus resultados. El primer estudio utiliza sujetos animales; el resto usa
humanos. Los tres estudios en humanos difieren en que uno se basa en datos demográficos
correlacionados por sociólogos, uno usa técnicas de estudio de campo con control experimental en lugar
de control estadístico post hoc, y uno es un experimento de laboratorio.
Hacinamiento en animales: un estudio de laboratorio

Una larga serie de estudios realizados por John Calhoun (1962, 1966, 1971) en el Instituto Nacional de
Salud Mental produjo algunos hallazgos asombrosos sobre los efectos a largo plazo del hacinamiento
en ratas. Calhoun colocó a sus ratas en un “universo de ratas” (Figura 14.5) con cuatro compartimentos.
Como los compartimentos 1 y 4 no estaban conectados (Figura 14.5), se convirtieron en callejones sin
salida y las ratas se congregaron en los compartimentos 2 y 3. Este hacinamiento provocó el desarrollo
de varios tipos patológicos de comportamiento. La tasa de mortalidad de las ratas bebés llegó al 96 por
ciento en los corrales 2 y 3. Las ratas hembras no podían construir nidos adecuados y con frecuencia
dejaban caer a las ratas bebés. Estos bebés murieron donde los arrojaron.
59533_15_ch14_p388-409.indd 396 9533_15_ch14_p388-409.indd 396 28/03/08 /28/08

ÿ FIGURA 14.5
El universo de las ratas estudiado por Calhoun. Tenga en cuenta que los corrales no están todos unidos por rampas, por lo
que dos de ellos se convierten en callejones sin salida. (Reimpreso con permiso del albacea del patrimonio de Bunji Tagawa.)
y a menudo eran comidas por ratas adultas. Las altas tasas de mortalidad tuvieron las mayores
implicaciones para el universo de las ratas. Las ratas macho también exhibieron un comportamiento sexual
extraño. Las ratas más extrañas fueron llamadas "probers" por Calhoun. En lugar de participar en el cortejo
normal de las ratas, estos exploradores perseguían a las ratas hembra hasta sus madrigueras, donde
comían ratas crías muertas. Así, la variable independiente (alta densidad) provocó la evolución de
comportamientos maternos y sexuales extraños (variables dependientes).
Estos resultados son aterradores, por decir lo menos; si se generalizan al hacinamiento humano,
implican fuertemente que el hacinamiento eventualmente destruirá la sociedad tal como la conocemos hoy.
Pero antes de abandonar nuestros apartamentos de gran altura por los espacios abiertos, examinemos
primero un estudio más reciente realizado con primates no humanos.
El trabajo clásico de Calhoun que acabamos de describir estableció un modelo que vincula el
hacinamiento y la agresión. Pero un trabajo más reciente con primates sugiere que un modelo de
afrontamiento es más preciso. Los primates no humanos hacen frente al hacinamiento desarrollando un
comportamiento compensatorio que reduce los encuentros agresivos. Por ejemplo, van Wolkenten, Davis,
Gong y de Waal (2006) observaron monos capuchinos marrones en condiciones de poca aglomeración y
de aglomeración a corto plazo (30 minutos). No encontraron diferencias en los comportamientos agresivos,
59533_15_ch14_p388-409.indd 397 9533_15_ch14_p388-409.indd 397 28/03/08 /28/08

que apoya el modelo de afrontamiento y rechaza el modelo de densidad/agresión de Calhoun.
Sin embargo, en condiciones de hacinamiento, los capuchinos exhibieron mayores comportamientos de
acicalamiento; los autores interpretaron este resultado en el sentido de que el acicalamiento reduce la
agresión, lo cual es coherente con el modelo de afrontamiento. Sin embargo, como señalaron debidamente
los autores, la exposición relativamente corta al hacinamiento no descarta la posibilidad de agresión con
duraciones de hacinamiento mucho más largas.
En resumen, el hallazgo clásico de la investigación con ratas es que el hacinamiento produce
comportamientos agresivos, pero los primates hacinados pueden evitar la agresión desarrollando conductas
de afrontamiento. Pasemos a los estudios de hacinamiento con humanos para descubrir si los humanos
hacinados se las arreglan con una alta densidad (como los capuchinos) o se vuelven agresivos (como las ratas).
Hacinamiento en humanos: un estudio demográfico correlacional

Los estudios de Calhoun con ratas implican que la alta densidad provoca un comportamiento patológico.
Dado que sería muy poco ético para un investigador amontonar a la gente durante largos períodos de la
forma en que Calhoun aglomeraba a las ratas, una prueba experimental directa análoga a los experimentos
de Calhoun es imposible.
Sin embargo, hay partes de nuestras grandes ciudades donde la sociedad ha creado altas densidades,
y ciertamente es ético observar los efectos de estas densidades en el mundo real. La ventaja de estudiar
tales situaciones de la vida real es que tenemos menos dificultad para generalizar los resultados, por
ejemplo, de una ciudad a otra, que de un laboratorio a una ciudad. La desventaja es que prácticamente no
hay control experimental sobre la variable independiente y las posibles variables extrañas. Una solución que
se utiliza a menudo cuando el control experimental no es factible es el control estadístico a posteriori.
Este es el enfoque adoptado por Evans, Palsane, Lepore y Martin (1989), quienes estudiaron el
hacinamiento y el retraimiento social en Pune, India. Estos investigadores plantearon la hipótesis de que las
personas harían frente al hacinamiento retirándose de las interacciones sociales. Esto, a su vez, disminuiría
los lazos sociales, lo que resultaría en una peor salud psicológica. El apoyo social se midió mediante un
cuestionario de 40 ítems diseñado para indicar las relaciones con familiares y amigos. Los síntomas
psicológicos se midieron mediante ítems de entrevista adicionales que preguntaban si se había experimentado
un síntoma en particular en los últimos 2 meses. Los sujetos fueron 175 hombres cabeza de familia que
vivían en Pune, India.
La técnica estadística utilizada para evaluar los resultados fue la correlación. Cuando se utiliza la
correlación para examinar un rango amplio de la variable independiente, es importante evitar la restricción
del rango (consulte el Capítulo 2), que puede producir una correlación baja. Debido a que el estudio se llevó
a cabo en la India, la densidad residencial varió de 11 personas por habitación a 2 personas por habitación,
un rango mayor que el típicamente disponible en los Estados Unidos (Galle, Grove y McPherson, 1972).
La figura 14.6 muestra la correlación entre densidad y síntomas psicológicos y entre densidad y apoyo
social. Ambos coeficientes de correlación son estadísticamente fiables al nivel de significación de 0,05. La
correlación positiva muestra que el aumento de la densidad se asocia con más síntomas psicológicos,
mientras que la correlación negativa muestra que el aumento de la densidad se asocia con menos apoyo
social.
Debido a que este es un estudio correlacional, no podemos concluir automáticamente que la densidad
cause síntomas psicológicos y una disminución del apoyo social. Es lógicamente posible que personas con
estas características hayan optado por vivir en viviendas de mayor densidad. Los estudios demográficos
como este no pueden asignar personas aleatoriamente a diferentes condiciones de densidad, como suele
ser el caso en los estudios de laboratorio. Sin embargo,
59533_15_ch14_p388-409.indd 398 9533_15_ch14_p388-409.indd 398 28/03/08 /28/08

Síntomas Psicológicos ÿ FIGURA 14.6
Apoyo social
0.2 Correlaciones entre Densidad y
0.2
Síntomas Psicológicos y Apoyo
Social. (Adaptado de Evans et al.,
1989.)
Correlación
Densidad
con
la
–.2
–.4
–0.39
después de considerar la explicación de la autoselección, los investigadores concluyeron con cautela

que era más probable que la densidad fuera un factor causal a pesar de las limitaciones del método
correlacional. Por lo tanto, estos resultados son similares a las conclusiones extraídas por Calhoun en
sus estudios sobre el hacinamiento de animales.
Hacinamiento en humanos: estudios de campo en entornos ferroviarios

Sólo un estudio que manipula variables independientes permite afirmaciones sobre la causalidad.
Saegert, Mackintosh y West (1975) llevaron a sus sujetos a la estación de tren de Pensilvania de
Manhattan para probar los efectos del hacinamiento en el rendimiento y el afecto (sentimientos).
La densidad, la variable independiente más importante, se manipuló eligiendo la hora a la que se
visitaba la estación: de 10 a. m. a 11:30 a . m. (no es una hora concurrida) o de 5 p . m. a 6 p . m. (en el
punto álgido de la hora pico). Esta manipulación confunde la hora del día con la densidad, pero los
experimentadores sintieron que la hora del día no tendría efectos significativos en las tareas. Sin
embargo, esta suposición no fue probada empíricamente. Los experimentadores tuvieron cuidado de
hacer algunos recuentos de población para asegurarse de que el número de personas realmente
presentes estuviera dentro de los rangos deseados.
A los sujetos se les dio una lista de 42 tareas que debían realizar dentro de la estación: cosas
como buscar un número de teléfono, encontrar el mostrador de boletos, comprar algo en el puesto de
periódicos, etc. Se les dio 30 minutos para completar tantas tareas como pudieran; esta era una variable
dependiente. Luego, los sujetos completaron una lista de verificación de adjetivos de estado de ánimo.
Este es un esquema de calificación que permite a las personas describir sus sentimientos.
El hallazgo principal fue que “el hacinamiento parecía interferir un poco con las tareas que
requerían el conocimiento y la manipulación del entorno”, ya que en la condición de alta densidad, los
sujetos completaron unas 25 tareas, frente a unas 29 en la condición de baja densidad. Sin embargo,
estadísticamente, este efecto fue significativo solo en el nivel de 0,10, lo que significa que podría haber
ocurrido por casualidad en 1 de cada 10 experimentos. Las conclusiones extraídas por Saegert y sus
compañeros de trabajo no son muy representativas. Las tareas requerían que los sujetos caminaran de
un lado a otro entre la multitud en la estación de tren. Incluso si no se hubieran hecho demandas
cognitivas, es decir, si simplemente se les hubiera pedido a los sujetos que caminaran de un lado a otro
tantas veces como fuera posible, esperaríamos que las multitudes tuvieran
59533_15_ch14_p388-409.indd 399 9533_15_ch14_p388-409.indd 399 28/03/08 /28/08

los ralentizó. Es más difícil moverse en una multitud densa que en una estación vacía. Por lo tanto, no parece
razonable generalizar estos resultados, como hacen los autores, en el sentido de que el funcionamiento cognitivo
se ve afectado en situaciones de hacinamiento. Sin embargo, las escalas de calificación confirmaron que los sujetos
se sentían más ansiosos y más escépticos en condiciones de hacinamiento. Dado que la lista de verificación tenía
11 escalas, no es de extrañar que algunas de ellas mostraran un efecto de densidad. Este enfoque de escopeta, en
el que un gran número de escalas de calificación se administran rutinariamente con la esperanza de que algunas
de ellas produzcan resultados significativos, puede conducir a una hipótesis autocumplida que puede ser engañosa.
Aunque es bastante razonable que los sujetos se sintieran más ansiosos en las condiciones de hacinamiento
donde fueron golpeados y empujados, los autores no interpretan el hallazgo como mayores sentimientos de
escepticismo.
Cuando este estudio se compara con el estudio demográfico de Evans, una conclusión es obvia. Aunque los
estudios que manipulan variables independientes generalmente deben preferirse a los estudios que solo
correlacionan variables, esto no significa necesariamente que cualquier estudio experimental sea automáticamente
superior a cualquier estudio correlacional. La buena investigación, incluso de la variedad correlacional, es siempre
preferible a la investigación deficiente, incluso de la variedad experimental.
Los psicólogos ambientales a menudo se pasean por las estaciones de ferrocarril para observar el
hacinamiento, y un estudio más reciente muestra que los trenes pueden usarse para una investigación cuidadosa.
Evans y Wener (2007) estudiaron a los pasajeros de trenes que viajaban entre Nueva Jersey y Manhattan durante
las horas pico y registraron dos medidas de densidad (densidad de automóviles: personas/número de asientos en
el automóvil; densidad de asientos: personas/número de asientos en fila) y tres medidas de estrés (cortisol salival,
desempeño en la corrección de pruebas y una autoevaluación del estado de ánimo).
Mediante el análisis de regresión múltiple, sus resultados no mostraron correlaciones significativas entre la
densidad de automóviles y el estrés, pero para la densidad de asientos, los tres índices de estrés fueron significativos.
Los viajeros hacen frente a la densidad de automóviles organizándose para evitar la proximidad física con otros
pasajeros cuando sea posible; por ejemplo, un viajero podría optar por permanecer de pie en lugar de ocupar un
asiento vacío entre otros dos pasajeros. Por lo tanto, la proximidad de otras personas cercanas es un factor
estresante mucho más importante que el número de pasajeros en un vagón de tren.
Hacinamiento en humanos: un estudio de laboratorio

En este estudio de laboratorio, Bateson y Hui (1992) usaron diapositivas fotográficas y cintas de video para simular
el comportamiento en una oficina de boletos de trenes de Londres, Inglaterra. Las diapositivas y los videos fueron
tomados desde el mismo lugar. La densidad se manipuló dividiendo las diapositivas y los videos en tres categorías
según la cantidad de personas presentes en la boletería. En la condición de baja densidad, solo una o dos personas
estaban en línea en cada taquilla. Más personas estaban presentes en la condición de densidad media y la
condición de alta densidad estaba bastante llena.
Luego, los sujetos completaron un cuestionario, que era la variable dependiente.

Contenía escalas relacionadas con el apiñamiento percibido, el control percibido, el placer y el acercamiento-
evitación. Se construyó un modelo estructural para explicar las relaciones entre estas variables dependientes y
variables independientes como la densidad. Este modelo predijo que la densidad influye en el hacinamiento a través
del control percibido y que el control percibido y el hacinamiento determinan las respuestas emocionales y
conductuales de las personas según lo medido por el cuestionario. Se utilizó un procedimiento estadístico complejo
(LISREL) para determinar que los resultados se ajusten al modelo.
59533_15_ch14_p388-409.indd 400 9533_15_ch14_p388-409.indd 400 28/03/08 /28/08

De especial interés en este estudio fue un cuasi-experimento de campo adicional que entrevistó a
pasajeros reales que compraban boletos de tren en la misma taquilla donde se fotografiaron los estímulos de
laboratorio. Se calcularon tres matrices de correlación diferentes (diapositivas, cintas de video y campo). Los
análisis estadísticos no pudieron rechazar la hipótesis de que las tres matrices eran iguales. Así, la metodología
de laboratorio fue validada.
Los autores concluyeron que las diapositivas y las cintas de video son bastante apropiadas ("ecológicamente
válidas") para los estudios de densidad y hacinamiento.
Comparación de estudios de hacinamiento

Hemos examinado los efectos del hacinamiento en cuatro estudios: un estudio con animales, un estudio
demográfico correlacional, un estudio de campo y un experimento de laboratorio. Los tipos de generalizaciones
que podemos extraer de cada estudio difieren sustancialmente. Probablemente te estés preguntando qué
estudio es el mejor. No hay una respuesta directa a esta pregunta: los psicólogos no se ponen de acuerdo
sobre cuál es mejor, aunque los psicólogos experimentales tienden a preferir los estudios de laboratorio.
El propósito de esta sección es familiarizarlo con las dificultades involucradas en la generalización de

los resultados de cualquier estudio, independientemente del tipo. A estas alturas, puede sentir que estas
dificultades son tan grandes que apenas parece valer la pena investigar. Pero esta conclusión es indebidamente
pesimista. Aunque es difícil generalizar a partir de un solo estudio, un conjunto de estudios puede llevarnos a
conclusiones representativas.
Tema Cuasi-Experimentos
Ilustración Ruido y Rendimiento Cognitivo
Los verdaderos experimentos requieren la asignación aleatoria de participantes a las condiciones
experimentales. Esto puede ser difícil de lograr en el área de la psicología ambiental, por lo que los cuasi-
experimentos (ver Capítulo 3) a menudo se sustituyen por experimentos verdaderos. Esta sección analiza
dos cuasi-experimentos recientes que investigaron los efectos del ruido en estudiantes de primaria y
universitarios.
Un estudio europeo (Hygge, Evans y Bullinger, 2002) aprovechó la apertura y el cierre simultáneos del
aeropuerto de Múnich para crear un cuasi-experimento.
Dos grupos experimentales estaban formados por niños que estaban expuestos al ruido de los aviones en el
antiguo aeropuerto o que estarían expuestos en el nuevo aeropuerto. Dos grupos de control, emparejados en
variables sociodemográficas, no estuvieron expuestos al ruido de los aviones. Los datos se recolectaron en
tres oleadas: la ola 1 fue 6 meses antes de la apertura del nuevo aeropuerto, la ola 2 fue 1 año después y la
ola 3 fue 2 años después. Las pruebas se realizaron en una furgoneta móvil insonorizada para que no hubiera
confusión con los efectos de ruido inmediatos.
La figura 14.7 muestra los resultados de una prueba de memoria a largo plazo en la que los niños
recordaron información un día después de leerla. En el antiguo aeropuerto, la memoria con el ruido de los
aviones era peor antes del cierre del aeropuerto (onda 1). Sin embargo, una vez que el aeropuerto cerró, los
efectos del ruido desaparecieron. Esperaríamos resultados opuestos en el nuevo aeropuerto. En Wave 1 no
hubo un efecto de ruido estadísticamente significativo. Sin embargo, en Wave 3 el rendimiento fue mejor sin
ruido. Estos resultados muestran que el ruido infl uye en la memoria pero que este efecto es reversible cuando
se elimina la fuente de ruido.
59533_15_ch14_p388-409.indd 401 9533_15_ch14_p388-409.indd 401 28/03/08 /28/08

Es interesante comparar este cuasi-experimento con un estudio ex post facto (ver Capítulo 2)
del ruido de los aviones alrededor del aeropuerto de Heathrow en Londres. Haines, Stansfeld, Head y
Job (2002) correlacionaron las pruebas estandarizadas de matemáticas, ciencias e inglés con la
exposición al ruido de las aeronaves; la exposición variaba según la distancia desde el aeropuerto. La
exposición se relacionó estadísticamente con puntajes más bajos en las pruebas de lectura y
matemáticas. Sin embargo, cuando se controlaron estadísticamente otras variables socioeconómicas,
esta asociación correlacional desapareció. En general, los resultados de los cuasi-experimentos son
más sólidos que los resultados de los estudios ex post facto porque los científicos prefieren
afirmaciones sobre causalidad a afirmaciones sobre correlación.
Otro cuasi-experimento estudió los efectos del ruido de la construcción en los residentes de los
dormitorios universitarios (Ng, 2000). El nivel de ruido de la construcción del edificio exterior varió en
tres alas de dormitorios (cerca, central, lejos). Se tomaron cuatro tipos de medidas: una encuesta de
cuestionario, registros de actividad autocompletados, registro de rotación de residentes y observación
externa de ventanas abiertas o cerradas. Mayores porcentajes de residentes en las alas más ruidosas
reportaron interferencia con actividades tales como conversaciones telefónicas. Los residentes del ala
cercana informaron que mantenían las ventanas cerradas con más frecuencia que los residentes de
las alas más tranquilas. Sin embargo, mientras que la observación externa objetiva de las ventanas
encontró más ventanas abiertas en las alas más silenciosas, no hubo un efecto o interacción confiable de
59533_15_ch14_p388-409.indd 402 9533_15_ch14_p388-409.indd 402 28/03/08 /28/08

si la construcción estaba en marcha. El correlato más importante del número de ventanas abiertas fue
la temperatura exterior.
Todos los cuasi-experimentos no son automáticamente igualmente útiles solo porque son cuasi-
experimentos. La comparación de los dos cuasi-experimentos discutidos en esta sección revela que el
estudio europeo fue más sofisticado y elegantemente diseñado. Muchas de las medidas tomadas en el
estudio de dormitorios universitarios no discriminaron entre la presencia o ausencia de ruido de
construcción. Esta es una debilidad compartida con los estudios ex post facto del ruido. En contraste,
el estudio de Munich controló varias variables, como la presencia de ruido durante la recolección de
datos.
Tema Cuestiones éticas

Ilustración Engaño y Ocultamiento
Los psicólogos están sumamente preocupados por la ética de la investigación cuando se trata de
participantes humanos. Aunque parte de esta preocupación es pragmática, provocada por el temor a
la restricción de los fondos de investigación y la pérdida de acceso a las poblaciones de sujetos, la
mayoría de los psicólogos son personas éticas que no desean causar daño a nadie. El investigador
loco que hará cualquier cosa para obtener datos es en gran medida un mito.
Dado que es difícil para un experimentador ser completamente imparcial y objetivo al juzgar las
cuestiones éticas relacionadas con su propia investigación, la mayoría de las universidades e
instituciones de investigación tienen juntas de revisión institucional (consulte el Capítulo 4) que juzgan
si la investigación propuesta es ética. De hecho, todas las investigaciones financiadas con fondos
federales deben ser aprobadas por dicha junta antes de que se otorguen los fondos. Como se señaló
en el Capítulo 4, estas juntas se guían por varios principios defendidos por la Asociación Estadounidense
de Psicología (2002). Un principio importante es el derecho al consentimiento informado. Esto
significa que cada participante potencial en un experimento recibe una explicación de todas las
características sobresalientes de la investigación antes de realizar el experimento y la oportunidad de
negarse a participar en la investigación. Así, el experimentador tiene una clara obligación ética de
informar a los participantes de cualquier posible efecto nocivo del experimento. Por ejemplo, si un
experimento de psicología ambiental requiere ruidos fuertes como factores estresantes, se debe
informar a los participantes con anticipación, de modo que cualquier persona con un historial de
sensibilidad al sonido, como resultado quizás de una enfermedad infantil, pueda negarse a participar.
(Incluso con el consentimiento informado, ningún investigador ético usaría sonidos extremadamente
fuertes que podrían causar una pérdida auditiva permanente).
Es extremadamente difícil para muchos estudios propuestos en psicología ambiental cumplir con
el principio del consentimiento informado. Hay muchas situaciones en las que, si las personas supieran
que están siendo observadas, es posible que no se comporten con normalidad.
En tales casos, al investigador le gustaría ocultar el hecho de que se está realizando un experimento,
y solo informa o informa a los participantes una vez que el estudio ha terminado. Claramente, este
procedimiento viola el principio del consentimiento informado, ya que la persona no ha sido informada
ni ha dado su consentimiento: dicha investigación podría prohibirse de plano.
Sin embargo, muchos psicólogos piensan que una restricción tan severa afectaría seriamente su
capacidad para diseñar estudios destinados a comprender el comportamiento humano en entornos de
la vida real, es decir, reduciría en gran medida la capacidad de generalizar la investigación.
Argumentan que el valor potencial de la investigación debe sopesarse frente al daño potencial para los
participantes.
59533_15_ch14_p388-409.indd 403 9533_15_ch14_p388-409.indd 403 28/03/08 /28/08

Imagine que está sirviendo en una junta de revisión de ética. Decida si permitiría los
siguientes ejemplos de investigación propuesta:
1. Un psicólogo ambiental se sienta en una biblioteca llena de gente y mantiene registros detallados de
patrones de asientos.
2. Un psicólogo ambiental hace cintas de video de patrones de asientos en una biblioteca. Estas cintas se mantienen
indefinidamente; los usuarios de la biblioteca no saben que han sido filmados.
3. Una psicóloga experimental les dice a los estudiantes que está interesada en su comprensión lectora cuando en
realidad está registrando la velocidad de sus respuestas en lugar de su comprensión.
4. Un psicólogo social está estudiando la intervención de espectadores en una licorería. Se ha obtenido el permiso del
gerente de la tienda. A la vista de un cliente, un experimentador “roba” una botella de licor. Un segundo
experimentador se acerca al cliente y le pregunta: "¿Lo viste robar esa botella?"
5. Un psicólogo social conecta electrodos de superficie a participantes masculinos con su aprobación previa. A estos
participantes se les dice que los electrodos están conectados a un medidor frente a ellos que mide la excitación
sexual. En realidad, el medidor es controlado por el experimentador. Luego, a los participantes se les muestran
diapositivas de hombres y mujeres desnudos. El medidor da lecturas altas para fotografías de hombres, lo que lleva
a los participantes a creer que tienen tendencias homosexuales latentes.
No hay absolutos en ética, y no podemos afirmar que algunos de estos ejemplos son
claramente éticos y otros claramente no lo son. Sin embargo, las discusiones informales con
nuestros colegas revelaron que solo el número 1 se consideraba inequívocamente ético. Dado
que el psicólogo se limita a observar y no conoce a las personas (en la ficha técnica solo se
representan mediante símbolos), no se considera necesario el consentimiento informado.
Cualquier individuo, psicólogo o no, podría observar fácilmente a estas mismas personas en la
biblioteca. El daño potencial a los participantes es insignificante.
Puede que se sorprenda de que se hayan planteado objeciones a todos los demás ejemplos.
Se pensaba que el número 2 invadía la privacidad personal, ya que las cintas no se borraban
después de que se extraían los datos. El número 3 sería aceptable solo si el experimentador
informara cuidadosamente a los participantes explicando la naturaleza y las razones de este
pequeño engaño. El número 4 se interpretó realmente; un cliente negó haber visto el robo y luego
llamó a la policía tan pronto como salió de la tienda. El investigador tuvo que ir a la comisaría para
rescatar a los experimentadores. El número 5 se consideró poco ético, incluso con el interrogatorio.
No está claro que el daño psicológico potencial de que los participantes pensaran que tenían
tendencias homosexuales ocultas podría eliminarse incluso con un interrogatorio inmediato,
especialmente si realmente tenían tendencias homosexuales latentes que hasta el experimento
habían sido suprimidas con éxito.
Middlemist, Knowles y Matter (1976) realizaron un experimento que generó cierta controversia
ética. Estaban interesados en los efectos del hacinamiento en un baño de hombres. Los hombres
parecen preferir estar separados en los urinarios siempre que sea posible, por lo que los
experimentadores controlaron el espacio entre los hombres en una fila de tres urinarios adyacentes
a un inodoro colocando un balde para trapeador y un cartel de "No usar" en uno de los urinarios. .
Un cómplice del experimentador estaba apostado en uno de los urinarios del final. Se varió la
distancia entre el participante y el cómplice colocando el balde y el letrero junto al cómplice oa un
urinario de distancia. Esto obligó a los participantes a seleccionar un urinario inmediatamente
adyacente a la cabina del baño, por lo que el cómplice estaba al lado del participante o a un
urinario de distancia del participante. Middlemist y asociados razonaron
59533_15_ch14_p388-409.indd 404 9533_15_ch14_p388-409.indd 404 28/03/08 /28/08

que el hacinamiento daría como resultado estrés, lo que, a su vez, retrasaría el inicio y acortaría
la duración de la micción del participante. Para determinar si este era el caso, uno de los
experimentadores se sentó en el inodoro con un periscopio oculto a través del cual podía ver y
medir en secreto el inicio y la duración de la micción.
Aunque los participantes no pudieron ser identificados por la persona que miraba a través
del periscopio, esto parece ser una invasión de la privacidad particularmente poco ética,
especialmente porque los usuarios del urinario eran participantes sin saberlo. En una crítica a la
ética del experimento del orinal, Koocher (1977) señaló que los principios éticos exigen que los
psicólogos mantengan la dignidad de sus participantes y que cuando la dignidad y la privacidad
estén amenazadas, el experimentador debe sopesar cuidadosamente los beneficios de la
investigación. contra sus costos. Koocher señaló que aunque este era un baño público, las
personas que lo usan esperan cierto grado de privacidad. Middlemist y asociados (1977)
defendieron su proyecto señalando que, dado que los participantes no sabían que estaban
siendo observados, no podían sentirse avergonzados ni heridos.
Estos ejemplos, especialmente el estudio del urinario, deberían mostrar que a menudo no
hay una respuesta clara sobre lo que es ético. La responsabilidad recae en el experimentador y
las juntas de revisión. Aunque el engaño y el ocultamiento pueden estar justificados en casos
limitados, se requiere mucha precaución en tales experimentos y se debe obtener el
consentimiento informado siempre que sea posible.

LA TUERCAS Y PERNOS
Problema ¿La exposición al ruido es mala para usted?
Un tema que preocupa a casi todo el mundo es el efecto psicológico del ruido en los humanos.
Los aeropuertos, las fábricas y las calles de las ciudades exponen a los ciudadanos a entornos
ruidosos a largo plazo. ¿Cómo podríamos evaluar los posibles efectos de tal exposición al ruido?
Problema ¿El ruido causa daño psicológico?
Como siempre, se pueden derivar varias hipótesis de este vago problema. Primero, intentaremos
un enfoque de laboratorio formulando una hipótesis que pueda probarse en circunstancias muy
controladas.
Hipótesis La exposición a ruido blanco fuerte (nivel de presión de sonido de 110 decibelios) y
continuo provocará disminuciones en el número y la precisión de los problemas aritméticos
que se pueden realizar en 25 minutos.
¿Cómo llegamos a algunas de las variables especificadas en la hipótesis? La variable

independiente, la intensidad del ruido (establecida en 110 decibelios, aproximadamente tan alta
como una remachadora), está cerca del límite de exposición segura a 25 minutos de ruido.
Cualquier ruido más fuerte podría ser dañino, y cualquier ruido más suave podría no producir
efectos experimentales; es decir, si no se obtuvieran efectos del ruido en el rendimiento con un
ruido mucho menor que 110 decibelios, podríamos sentirnos tentados a concluir que nuestro
ruido no era lo suficientemente fuerte. El ruido blanco (que es más o menos similar al sonido que
escucha cuando su radio está sintonizada entre estaciones) contiene todas las frecuencias de
sonido y es una fuente de ruido conveniente que se usa a menudo en el laboratorio.
59533_15_ch14_p388-409.indd 405 9533_15_ch14_p388-409.indd 405 28/03/08 /28/08

¿Por qué 25 minutos de exposición al ruido? Dado que esperamos utilizar estudiantes
universitarios como participantes, sabemos que les resulta más conveniente si un experimento
dura aproximadamente 1 hora, es decir, aproximadamente el mismo tiempo que una clase.
Dado que nuestra hipótesis implica una condición de control sin ruido, hemos dividido nuestro
experimento de una hora en dos segmentos de 25 minutos, uno con ruido y otro sin ruido.
Esto deja 10 minutos para las instrucciones y el informe.
Nuestra variable dependiente es el rendimiento en una tarea aritmética. Se eligió esta
tarea porque es una tarea simple con la que los estudiantes universitarios están familiarizados,
por lo que no se necesita capacitación durante el experimento. El rendimiento (número de
problemas correctos e incorrectos) es fácil de medir. Debido a que los efectos de la práctica
o la fatiga pueden estar presentes, debemos tener cuidado de contrarrestar nuestro
experimento haciendo que la mitad de los participantes comiencen en la condición de silencio
y la otra mitad en la condición de ruido. Dado que todos los participantes completan todas las
condiciones, este es un diseño experimental dentro de los sujetos, que ofrece una mayor
precisión experimental que un diseño entre sujetos. En un diseño intra-sujetos, cada persona
se compara consigo misma, de modo que las diferencias entre las personas no aumenten el
error en un experimento. Sin embargo, si nos preocupa que la actuación después del ruido
pueda ser diferente de la actuación después del silencio, es decir, que los efectos del ruido
puedan persistir incluso después de que el ruido ya no esté físicamente presente, un mejor
diseño experimental sería usar grupos separados de participantes para cada segmento de
25 minutos, dándonos un diseño entre sujetos.
Aunque nuestro experimento está bien controlado, tenemos varios problemas cuando
intentamos generalizar los resultados. Si no se obtuvieran efectos del ruido (si el rendimiento
aritmético fuera el mismo para los segmentos de ruido y silencio), se podría argumentar que
una muestra de vida de 25 minutos es demasiado corta para decirnos acerca de un trabajador
que ha estado expuesto a 110 -ruido de decibelios durante 8 horas al día durante muchos años.
Por otro lado, si se obtuvieran efectos del ruido (si el desempeño aritmético fuera peor en los
segmentos de ruido), aún se podría argumentar que eventualmente un trabajador se adapta
a ambientes ruidosos, por lo que si hubiéramos probado a los participantes durante varios
días o semanas, nuestro el efecto inicial podría haber desaparecido. Ahora formularemos
otra hipótesis, para que los resultados puedan generalizarse más fácilmente.
Hipótesis Los residentes de una calle ruidosa de la ciudad (a) se mudarán con más frecuencia y (b)
obtendrán una puntuación más baja en una escala de calificación de satisfacción residencial que los
residentes de una calle tranquila.
Dado que esta hipótesis se ocupa de los efectos a largo plazo de la residencia permanente,
evita los problemas de generalización vistos en el experimento anterior.
Sin embargo, esta hipótesis no es tan precisa como la otra hipótesis. Los niveles de sonido
para calles ruidosas y tranquilas no se especifican de antemano, pero deben medirse durante
el experimento. El experimentador tiene que decidir si medir los niveles de sonido solo en
ciertos momentos, por ejemplo, durante las horas pico, o tomar un promedio de 24 horas.
Esta variable casi independiente no está completamente bajo el control del experimentador.
Además, puede confundirse con cosas como los ingresos y el estatus, ya que es más
probable que las personas con un estatus socioeconómico más bajo residan en calles más
ruidosas.
Las variables dependientes tampoco son del todo satisfactorias. Incluso si los residentes
desean mudarse más a menudo de las calles ruidosas, los factores económicos pueden
59533_15_ch14_p388-409.indd 406 9533_15_ch14_p388-409.indd 406 28/03/08 /28/08

prohibirles que lo hagan. Por otro lado, la rotación en un área es un número objetivo que se puede medir de
manera confiable. La segunda variable dependiente depende en gran medida de la validez de la escala de
calificación utilizada para evaluar la satisfacción residencial. El experimentador intentará encontrar una escala
que ya haya sido utilizada en varios estudios y previamente validada.
Si el experimentador se ve obligado a construir una escala, primero se debe validar la escala, un proceso difícil
y que requiere mucho tiempo. Así, el precio de la mayor facilidad de generalización en este estudio es una
pérdida considerable de control del experimentador.
Cuando comparamos ambos estudios como soluciones al problema planteado al inicio de esta sección,
queda claro que ninguno es perfecto. Esto siempre es cierto con la investigación. Ningún experimento individual
puede responder una pregunta. El científico se ve obligado a centrarse en una hipótesis más específica,
respondiendo así solo a una pequeña parte del problema. Esta es una fuente importante de frustración para
todos los psicólogos, ya que no hay respuestas generales posibles hasta que se juntan muchas piezas
pequeñas, cada una de las cuales corresponde a una hipótesis específica. Un psicólogo ambiental fácilmente
podría dedicar toda su carrera a tratar de comprender el problema del ruido y sus efectos psicológicos. Para
obtener más información sobre la psicología del ruido, consulte Kantowitz y Sorkin (1983), Capítulo 16.
La evidencia de que la contaminación acústica es un peligro para la salud se ha extendido más allá de la
psicología experimental y ambiental. Por ejemplo, los arquitectos ahora se dan cuenta de que sus diseños
deben amortiguar los sonidos (Bronzaft, 1993). Cuando se encuentran citas de investigaciones psicológicas en
revistas de arquitectura, podemos estar seguros de que el mensaje de la psicología ambiental, que el
comportamiento y la salud humanos se ven profundamente afectados por las características del medio ambiente,
está llegando.
ÿ RESUMEN
1. La ciencia no es el único camino hacia la verdad, y actualmente 3. Dado que la mayoría de los psicólogos ambientales prefieren la
solo ciertas partes de la experiencia humana están abiertas al investigación de campo a la investigación de laboratorio, rara
análisis científico. Sin embargo, el método científi co se corrige vez es posible asignar participantes aleatoriamente a
a sí mismo, mientras que otros métodos de corrección de condiciones experimentales y manipular todas las variables
creencias no lo son. Por lo tanto, la ciencia es preferible independientes. Por lo tanto, los cuasi-experimentos y los
siempre que sus herramientas sean apropiadas. estudios ex post facto son más probables.
2. Los experimentos son pasos en el camino hacia el objetivo 4. El ruido de los aviones influye en la memoria, pero este efecto
final del psicólogo de predecir y explicar el comportamiento. se puede invertir cuando se elimina el ruido.
Este objetivo puede lograrse más rápidamente realizando 5. Los psicólogos están sumamente preocupados por los aspectos
experimentos que sean representativos y que puedan éticos de la participación en la investigación. El derecho al
generalizarse a situaciones relacionadas. consentimiento informado no siempre puede otorgarse en la
Dos tipos de representatividad son la generalización de la investigación. En tales casos, el daño potencial a los
muestra y la representatividad variable. Se discuten cuatro participantes debe sopesarse frente al valor potencial de la
tipos de estudios de hacinamiento; los tipos de generalizaciones investigación. Los experimentos que involucren engaño y
que podríamos sacar de cada uno difieren sustancialmente. ocultación deben llevarse a cabo con gran precaución, si es
que se deben realizar.
59533_15_ch14_p388-409.indd 407 9533_15_ch14_p388-409.indd 407 28/03/08 /28/08

ÿ TÉRMINOS CLAVE
densidad cuasi-experimento
cuestiones éticas representatividad
después del hecho muestra generalización
generalidad de los resultados variable representatividad
consentimiento informado
1. Un sacerdote, un rabino y un científico caminaban por la playa 3. Corre a la biblioteca y lee los últimos números de Environment
discutiendo si era posible caminar sobre el agua. Como prueba and Behavior and Human Factors.
empírica, el sacerdote y el rabino se adentraron en el océano Estas dos revistas se especializan en investigación aplicada.
mientras el científico Discuta si los artículos que lee se pueden generalizar más
tist observaba con asombro desde la playa. Pronto fácilmente que los artículos publicados en el Journal of
el sacerdote estaba hasta la barbilla, mientras que el rabino Experimental Psychology.
estaba seco de rodillas para arriba. "¿Cómo te las arreglas para 4. Haz una pequeña lista de experimentos poco éticos que te
mantenerte seco?" preguntó el sacerdote. “Tranquilo”, respondió gustaría hacer. Visite a miembros de la facultad que se
el rabino, “camino sobre las rocas”. ¿Qué le dijeron los dos especializan en las áreas de investigación de sus experimentos
clérigos sobre el empirismo al científico cuando regresaron a la y pregúnteles si estarían dispuestos a supervisar los
playa, y cuál fue su respuesta? experimentos. ¿Cuántos miembros de la facultad le dicen que
2. Seleccione dos áreas en las que la ciencia no sea el camino se niegan porque su experimento no es ético? ¿Es esta
adecuado hacia la verdad. Discuta por qué las herramientas de asignación ética?
la ciencia son irrelevantes o inaplicables en estos dos campos.
¿Será posible que la ciencia maneje estas áreas en un futuro
lejano?
CONEXIONES WEB
Información general sobre psicología ambiental está disponible en:

http://www.edra.org
http://psy.gu.se/iaap/envpsych.htm
Varios enlaces relacionados con la psicología ambiental se pueden encontrar en:
http://www.apa34.org/
Langston (2002), capítulo 6, describe un experimento de laboratorio para explorar los efectos del color de la
habitación y el estado de ánimo en las personas. La teoría a probar afirma que el rojo es un color “expansivo” que
hace que las personas presten más atención al entorno externo, mientras que el verde es un color “contractivo”
que induce estados introspectivos. Si bien la variable independiente es clara, existen varias posibilidades para que
las variables dependientes y las tareas se realicen en el entorno coloreado. Si se prueban suficientes tareas
diferentes, existe la posibilidad estadística de que se obtengan resultados significativos falsos. Si desea mejorar la
metodología sugerida por Langston, averigüe cómo realizar un MANOVA (consulte el Capítulo 3 sobre más de una
variable dependiente) con su instructor.
59533_15_ch14_p388-409.indd 408 9533_15_ch14_p388-409.indd 408 28/03/08 /28/08

Ruido y Memoria
Este ejercicio le brinda varias opciones para investigar los efectos del ruido en dos tipos de
memoria: recuerdo de elementos y recuerdo de prueba. Haz un juego de siete fichas y escribe
un día de la semana en cada una: lunes, martes. . . Domingo. Estas tarjetas serán los estímulos
presentados a sus participantes, y barajará el mazo para reorganizar el orden cada vez que las
presente. En la tarea de recordar elementos, presenta solo seis cartas. El participante debe
nombrar el día que falta. La recuperación del elemento faltante no depende del orden en que se
presentaron los días. En la tarea de recuerdo de la sonda, el participante tiene que recordar el
día que siguió al estímulo de la sonda en la lista. Por ejemplo, si su lista de seis elementos
hubiera sido lunes, viernes, miércoles, domingo, sábado y martes y la sonda fuera sábado, la
respuesta correcta sería martes. En esta tarea, el conocimiento del orden en que se presentaron
los días es crucial.
Nuestra pregunta de investigación es cómo el ruido afecta estos dos tipos de recuperación
de la memoria. ¿Anticipa que el ruido afectará ambas tareas de la misma manera? ¿Importa el
tipo de ruido? ¿Qué pasa con la intensidad del ruido?
El experimento más simple que podríamos idear tendría solo dos niveles de la variable
independiente del ruido: silencio (una condición sin control de ruido) y ruido. La mayoría de los
experimentadores diseñarían un experimento más complejo. Por ejemplo, podrías variar el tipo
de ruido y también su intensidad. Los posibles tipos de ruido incluyen música instrumental,
música vocal, voz, tonos y ruido blanco, un ruido especial que contiene todas las frecuencias.
(Puede crear un sonido muy similar al ruido blanco al sintonizar una radio con el silbido que se
produce cuando el dial está entre estaciones de radio). La intensidad del sonido se mide en
decibelios, a menudo usando la escala A del medidor. (Si su instructor no tiene acceso a un
medidor de nivel de sonido, puede comprarlo a bajo costo en las tiendas Radio Shack).
Si desea variar la intensidad, los niveles de sonido de 55 decibelios (escala A) a 90 decibelios
(A) serían apropiados.
Intencionalmente no estamos especificando las hipótesis para este experimento. Se puede
encontrar más información sobre el recuerdo y el ruido en Banbury, Banbury, Macken, Trembley
y Jones (2001, p. 22) y Jones (1999). Los efectos del tipo de ruido sobre la memoria verbal se
pueden encontrar en Iwanaga e Ito (2002). Puede formular hipótesis sobre la base de su
experiencia con el ruido, como intentar estudiar mientras escucha la radio, o consultando estos
artículos. Resista la tentación de diseñar un experimento que combine muchos tipos e
intensidades de ruido; será demasiado difícil adquirir y analizar tantos datos. En su lugar,
seleccione un subconjunto de estas variables independientes que le parezcan interesantes.
Formule sus hipótesis, obtenga la aprobación de su experimento para garantizar la
protección de los participantes humanos y recopile sus datos. Su variable dependiente será un
porcentaje correcto o errores en las tareas de memoria. Para los autores de este libro, la parte
más emocionante de la psicología experimental es descubrir si los datos respaldan o rechazan las
Diviértete y que al menos algunas de tus hipótesis se confirmen. ÿ
59533_15_ch14_p388-409.indd 409 9533_15_ch14_p388-409.indd 409 28/03/08 /28/08

CAPÍTULO 15
FACTORES HUMANOS
FACTORES HUMANOS Y COMPORTAMIENTO HUMANO

Definición
Honra a tu usuario
El valor de la vida

ILUSTRACIONES
Diseño Small-n : agudeza visual dinámica

ILUSTRACIONES
Selección de Variable Dependiente: Carga de Trabajo Mental

ILUSTRACIONES
Investigación de campo: la luz de freno montada en alto centrada

Mida la carga de trabajo mental del piloto en vuelo

RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: ENTENDER EL TRÁFICO
SIGNOS SÍMBOLOS
59533_16_ch15_p410-431.indd 410 9533_16_ch15_p410-431.indd 410 3/5/08 /5/08

Cuando nuestras ciencias de la naturaleza humana y las relaciones humanas
estén tan desarrolladas como nuestras ciencias de la naturaleza física, su principal
preocupación será el problema de cómo se modifica más efectivamente la
naturaleza humana. La pregunta no será si es capaz de cambiar, sino cómo se va
a cambiar bajo qué condiciones. (JOHN DEWEY)
La principal justificación de la investigación de laboratorio es su capacidad para proporcionar

declaraciones precisas sobre la causalidad. Una vez que se comprende algún efecto o fenómeno de
la investigación de laboratorio, el psicólogo aplicado puede usar esta información para mejorar algún
aspecto del mundo fuera del laboratorio. Esta empresa aplicada cumple una función científica,
además de resolver algunas dificultades prácticas. Si un efecto importante se ha identificado
correctamente dentro del laboratorio, entonces las leyes y relaciones de comportamiento que
describen o explican este efecto también deberían operar fuera del laboratorio. De hecho, si no lo
hacen, pueden surgir serias dudas sobre la validez de la investigación de laboratorio original. Para
ser útil, el conocimiento debe ser aplicado; la investigación de laboratorio es, por lo tanto, un
comienzo, no un fin (ver Capítulo 1). En este capítulo mostramos cómo algunos hallazgos
originalmente descubiertos y refinados en el laboratorio de psicología experimental pueden aplicarse
de manera útil y significativa a problemas prácticos de factores humanos. Resolver problemas
prácticos a veces significa trabajo de laboratorio adicional. En otras ocasiones, el investigador debe
salir del laboratorio para buscar soluciones. No pretendemos que estos pocos ejemplos de factores
humanos se interpreten como la justificación última de la psicología experimental, ya que es
demasiado pronto para determinar cómo los hallazgos de la investigación básica darán forma a
nuestras vidas en el futuro. La lección a aprender en este capítulo es la generalización de los
principios básicos de la psicología experimental; las aplicaciones específicas analizadas pretenden ilust
ÿ FACTORES HUMANOS Y COMPORTAMIENTO HUMANO
Definición
Los factores humanos se defi nen como “la disciplina que trata de optimizar la relación entre la
tecnología y lo humano” (Kantowitz & Sorkin, 1983, p. 4). La tecnología puede referirse a algo
pequeño y común, como un abrelatas, o algo grande y esotérico, como una estación espacial. El
común denominador de la tecnología son las personas; todos los sistemas grandes y pequeños
deben ser utilizados por personas. Si tuviéramos suficiente comprensión de cómo opera el ser
humano, en principio podríamos diseñar toda la tecnología para interactuar mejor con las personas.
El papel central de la persona en los factores humanos explica por qué la psicología experimental
ha tenido una infl uencia tan fuerte en la investigación de los factores humanos. Más de la mitad de
los miembros de la Sociedad de Factores Humanos y Ergonomía fueron formados como psicólogos.
Una parte sustancial de los artículos publicados en la revista Human Factors pueden considerarse
psicología experimental aplicada. Comprender cómo funcionan los humanos en entornos aplicados
es un aspecto crucial de la investigación de factores humanos.
59533_16_ch15_p410-431.indd 411 9533_16_ch15_p410-431.indd 411 3/5/08 /5/08

Honra a tu usuario
El primer mandamiento de los factores humanos es “Honra a tu usuario”. Si hay algo que deberías
recordar dentro de 25 años sobre los factores humanos, es "Honra a tu usuario". Todo lo demás
simplemente embellece este tema dominante.
Antes de que pueda honrar al usuario, primero debe saber quién será el usuario. Diferentes
poblaciones de usuarios tienen diferentes requisitos de factores humanos. Cuando Japón comenzó
a fabricar automóviles, diseñó automóviles para ciudadanos japoneses. Esto creó un problema
cuando los automóviles se exportaron a los Estados Unidos. Los hombres estadounidenses no
podían pisar el pedal del freno sin pisar simultáneamente los pedales del embrague o del acelerador.
En retrospectiva, la razón de este error de diseño fue clara. Los estadounidenses son, en promedio,
físicamente más grandes que los japoneses y tienen pies más grandes. Aunque el espacio entre los
pedales era satisfactorio para el pie japonés más pequeño, los pedales estaban demasiado juntos
para el pie estadounidense más grande. Dado que los pies americanos no se habían especificado en
las características del diseño original, se había violado el primer mandamiento de los factores humanos.
Este mismo error puede ocurrir de formas más sofisticadas. Una gran empresa estadounidense
de telecomunicaciones, muy apreciada por sus esfuerzos en factores humanos, estaba diseñando
un sistema para presentar mensajes grabados por teléfono en momentos especificados por el usuario.
Dado que se especificó el hardware para este esfuerzo, los diseñadores de factores humanos
tuvieron que idear el equivalente de un lenguaje de computadora en miniatura con el que el usuario
pudiera ingresar los comandos apropiados. Así que se seleccionó a informáticos para crear este
nuevo mini-lenguaje. Después de varios meses de esfuerzo, dieron con un lenguaje poderoso que
podía controlar de manera eficiente los mensajes grabados. Además, siendo diseñadores prudentes,
probaron su nuevo sistema utilizando secretarias como sujetos de prueba. Dado que este dispositivo
estaba diseñado para ser utilizado por secretarias, esta era la población de prueba ideal. Por
desgracia, ninguna de las secretarias pudo dominar el nuevo idioma. Después de reflexionar un
poco, los diseñadores decidieron que necesitaban un manual de instrucciones muy mejorado y
dedicaron varios meses más a perfeccionar un manual tutorial con muchos ejemplos e ilustraciones.
Una segunda prueba encontró que algunas secretarias podían usar el dispositivo, pero la mayoría
aún estaba desconcertada. Los diseñadores estaban muy descontentos y cuestionaron
cuidadosamente a las pocas secretarias exitosas. Resultó que todas las secretarias que pudieron
usar el dispositivo tenían experiencia previa con la programación de computadoras. Ahora el problema
estaba claro. Los diseñadores, siendo ellos mismos programadores de computadoras, habían creado
un sistema que era óptimo para cualquiera que pudiera pensar como un programador de
computadoras. Pero el usuario típico carecía de conocimientos informáticos. Por lo tanto, los
diseñadores crearon un lenguaje nuevo e ineficiente que requería muchas más instrucciones para
completar cualquier programa de grabación dado. Pero este nuevo lenguaje era fácil de aprender y
fácil de usar. Una prueba final mostró que la gran mayoría de las secretarias ahora podían cumplir
con la tarea. El entrenamiento del diseñador, que había enfatizado la eficiencia en minimizar la
duración de un programa, los había engañado para que violaran el primer mandamiento. Habían
diseñado para ellos mismos y no para el usuario. Pero se evitó el desastre porque los diseñadores
fueron lo suficientemente inteligentes como para probar su producto antes de enviarlo por la puerta.
Entonces, un aspecto importante de honrar al usuario es probar usando la misma población que eventualm
El último ejemplo de una violación a discutir es el diseño de un torno (Figura 15.1).
Aquí, la población de usuarios es conocida. Pero, como muestra la figura 15.1, los controles del torno
fueron diseñados para un ser humano con un tronco muy corto y brazos extremadamente largos.
Ningún ser humano tiene estas dimensiones corporales. Este ejemplo demuestra que es más fácil
cambiar la máquina que cambiar a la persona que debe operarla.
59533_16_ch15_p410-431.indd 412 9533_16_ch15_p410-431.indd 412 3/5/08 /5/08

ÿ FIGURA 15.1
Los controles de un torno en uso actual no están
al alcance de la mano de la persona promedio.
Están colocados de manera que el operador ideal
debe medir 1372 mm (41 ÿ2 pies) de altura, 640
mm (2 pies) de ancho de hombro y tener una
extensión de brazos de 2348 mm (8 pies). (Cortesía
Butterworth Heinemann, Ltd.)
El valor de la vida
Un tema importante, pero a menudo descuidado, en los factores humanos es el valor de la vida. Puede
parecer una tontería asignar un valor económico a la muerte, pero esto se hace todo el tiempo cuando
los fabricantes deciden cuánto equipo de seguridad se debe incorporar en los sistemas y qué tipo de
advertencias de seguridad se necesitan. Ningún producto es perfectamente seguro. Incluso un botón
pequeño podría resultar fatal si se lo traga un bebé.
Un discurso presidencial a la Sociedad de Factores Humanos (Parsons, 1970) discutió la vida y la
muerte. El valor de una vida humana se ha evaluado de muchas maneras, desde unos pocos centavos
correspondientes al valor de los productos químicos que componen el cuerpo humano hasta pólizas de
seguros de millones de dólares sobre la vida de ejecutivos corporativos. Parsons estimó que elegir
devolver a los astronautas del Apolo a la Tierra, en lugar de permitirles morir en el espacio, le costó a los
contribuyentes estadounidenses alrededor de 500 millones de dólares por astronauta. Aunque Parsons
no abogaba por una misión Apolo kamikaze, está claro que no todas las vidas se valoran por igual.
¿Cómo se podría evaluar la utilidad de la decisión de un fabricante de automóviles estadounidense

de incluir bolsas de aire en sus automóviles modelo 2004? Un procedimiento estadístico para responder
59533_16_ch15_p410-431.indd 413 9533_16_ch15_p410-431.indd 413 3/5/08 /5/08

Variables dependientes usar algunas de las mismas variables independientes que un

psicólogo experimental involucrado en la investigación de la
La variable dependiente más común en la investigación de atención.
factores humanos es la tasa de error. Esta es una elección Sin embargo, un especialista en factores humanos
obvia ya que disminuir el error humano es un objetivo principal interesado en sistemas tan complejos como las plantas de
de los factores humanos como disciplina. energía nuclear o los sistemas militares de comando, control
El tiempo también es una variable dependiente importante. y comunicación podría manipular las vías de comunicación en
El tiempo total para completar una tarea a menudo se mide pequeños grupos de manera similar a las que podrían usar
así como los tiempos de los componentes, como el tiempo de los psicólogos sociales y organizacionales o los sociólogos.
reacción y el tiempo de movimiento. En situaciones prácticas, Las variables ambientales independientes, como el ruido, la
un tiempo de respuesta excesivo puede equivaler a un error. temperatura y la vibración, son de interés en los entornos
Por ejemplo, si decide correctamente pisar el pedal del freno aplicados. Se pueden seleccionar variables temáticas, como
de su automóvil pero retrasa su respuesta hasta justo antes personas con diferentes estilos de liderazgo.
de que su vehículo caiga por un precipicio, el resultado sería
el mismo que no pisar el pedal del freno. Los horarios de trabajo por turnos y la hora del día también se
manipulan en la investigación de factores humanos.
Variables independientes Variables de control
Los psicólogos de factores humanos estudian una amplia Aunque no están del todo ausentes, las variables de control
gama de temas. Como resultado, se estudia una amplia son mínimas en gran parte de la investigación aplicada.
variedad de variables independientes. Un investigador Los entornos de campo en los que se lleva a cabo la mayor
interesado en el papel de las ilusiones visuales en los parte de esta investigación impiden el tipo de control
accidentes aéreos estudiaría las mismas variables experimental que exigiríamos dentro del laboratorio.
independientes que un psicólogo experimental interesado en Por esta razón, los investigadores deben estar atentos a la
la percepción. De manera similar, un investigador interesado hora de identificar posibles variables de confusión que podrían
en la capacitación manipularía algunas de las mismas proporcionar explicaciones contrapuestas de los resultados
variables independientes, por ejemplo, la práctica, la experimentales. Alternativamente, cuando se permite que
distribución de la práctica y la modalidad de presentación, varíen variables extrañas relevantes, pueden oscurecer los
como un investigador de la memoria. Un científico de factores efectos reales del tratamiento.
humanos que estudie la carga de trabajo mental
esta pregunta se denomina años de vida ajustados por calidad (AVAC). Se calcula en tres
pasos (Thompson, Graham, & Zellner, 2001). Para ilustrar esto, suponga algún nuevo
dispositivo de seguridad para vehículos que evitará 1000 muertes y 50 000 lesiones a largo plazo p
1. Calcule el número de años de vida conservados por el dispositivo. Si la muerte promedio reduce la
esperanza de vida en 40 años y la lesión promedio reduce la esperanza de vida en 0,5 años, la
ganancia total es de 65 000 años de vida (1 000 × 40 más 50 000 × 0,5).
2. Ajuste por la calidad de los años de vida ahorrados. Si el nuevo dispositivo no permite que las
personas funcionen con la máxima calidad (1,0), sino que solo permite una calidad de 0,9, entonces,
en lugar de 40 000 AVAC, solo hay 36 000 AVAC (1000 × 40 × 0,9).
3. Dar cuenta de la calidad de vida de los sobrevivientes con lesiones. Suponga que el dispositivo
mejora la calidad de vida promedio de 0,6 (accidente sin dispositivo) a 0,9. Luego, 50 000
supervivientes obtendrán 0,3 AVAC por año durante el resto de sus vidas. Asumiendo en promedio
que esto es 40 años, esto produce 600,000 AVAC adicionales.
59533_16_ch15_p410-431.indd 414 9533_16_ch15_p410-431.indd 414 3/5/08 /5/08

Los AVAC ahorrados para mejoras comunes en la seguridad de los vehículos en una cohorte de 10
millones de vehículos son 219 629 para cinturones de seguridad, 312 735 para bolsas de aire del conductor y
334 531 para bolsas de aire dobles (Thompson, Segui-Gomez y Graham, 2002). La rentabilidad incremental de
agregar equipo de seguridad más allá de los cinturones de seguridad es de $24 000 por QALY para las bolsas
de aire del conductor y de $61 000 por QALY para las bolsas de aire duales. En comparación, la rentabilidad
de las mamografías anuales para mujeres de 40 a 50 años es de $227 000 por QALY; La evaluación de los
trabajadores de la salud para prevenir la transmisión del VIH a los pacientes tiene una relación costo-eficacia de $
La sociedad debe decidir cuánto está dispuesta a gastar por un año de vida ahorrado.
Tema Diseño de n pequeña

Ilustración Agudeza Visual Dinámica
Muchas situaciones prácticas requieren la detección y el reconocimiento de un objetivo en movimiento.

Un jardinero central que corre para atrapar una pelota larga debe encontrar el objetivo (béisbol) en su campo
visual antes de poder predecir dónde caerá la pelota. Un piloto de avión que opera en un área terminal llena de
gente bajo las reglas de vuelo visual debe detectar y evitar las aeronaves que se aproximan. Un astronauta
que intenta atracar un transbordador espacial debe juzgar el movimiento relativo entre su nave y la puerta de
atraque. El conductor de un automóvil que rebasa a otro automóvil en una carretera debe detectar el tráfico
que se aproxima para decidir si es seguro rebasarlo. Todas estas situaciones son ejemplos de agudeza visual
dinámica en el trabajo.
La agudeza visual dinámica se define como la capacidad de percibir detalles en objetos en movimiento.
Suele compararse con la agudeza visual estática, la capacidad de percibir detalles en un objeto fijo.
La agudeza visual a menudo se mide presentando una letra C (llamada Landolt-C) con un pequeño espacio
(Figura 15.2). Si la brecha es grande, es fácil notarlo. Si el espacio es muy pequeño, la letra C puede percibirse
como la letra O. El tamaño del espacio que le permitirá discriminar de manera confiable entre la letra C y una
letra O aparentemente cerrada es un índice de su agudeza visual. Si el Landolt C no se mueve, estamos
midiendo la agudeza estática. Si el Landolt C tiene una trayectoria, estamos midiendo la agudeza dinámica.
Cuando intenta leer una tabla optométrica de Snellen en el consultorio del optometrista, se está determinando
su agudeza visual estática.
Aunque la agudeza visual estática y dinámica están relacionadas (Scialfa et al., 1988), el uso de la
agudeza visual estática para predecir la agudeza visual dinámica puede dar lugar a problemas técnicos. Por lo
tanto, para determinar la capacidad de una persona para desempeñarse con éxito en ocupaciones que exigen
una buena agudeza dinámica, el investigador prudente mide directamente la agudeza visual dinámica. Además,
la agudeza visual dinámica tiene importantes implicaciones en el diseño de sistemas complejos.
Al diseñador le gustaría elegir valores que faciliten que un ser humano detecte y reconozca objetivos en
movimiento.
ÿ FIGURA 15.2
Landolt C's.
59533_16_ch15_p410-431.indd 415 9533_16_ch15_p410-431.indd 415 3/5/08 /5/08

Los oftalmólogos están interesados en la relación entre la agudeza visual dinámica y el tamaño de la pupila
(Ueda, Nawa, Yukawa, Taketani y Hara, 2006). Como parte de los procedimientos de prueba estándar, se usan
gotas para los ojos para dilatar la pupila (una parte del ojo, no un estudiante).
Algunas investigaciones han sugerido que la dilatación de la pupila puede limitar la capacidad del conductor
para reconocer y evitar los peligros de la carretera (Wood, Garth, Grounds, McKay y Mulvahil, 2003), por lo que
no se debe permitir conducir inmediatamente después de un examen de la vista en el que la pupila estaba
dilatado Dado que la agudeza visual dinámica es necesaria para conducir, Ueda y colegas (2006) se preguntaron
si la dilatación de la pupila disminuía la agudeza visual dinámica. Descubrieron que la dilatación de la pupila
aumentaba la agudeza visual dinámica, a pesar de su predicción de que la agudeza disminuiría. Si bien este
resultado inesperado no implica que podamos mejorar la conducción tomando gotas para los ojos para dilatar
nuestras pupilas, sí sugiere que las disminuciones de conducción observadas anteriormente pueden no atribuirse
a los déficits de agudeza visual dinámica. Por supuesto, un solo experimento nunca prueba una explicación
(consulte el Capítulo 1), por lo que se necesitarán más investigaciones para explicar este resultado mediante el
examen de otras variables independientes, como el tamaño del objetivo y la iluminación.
Efectos de la longitud de onda objetivo en la agudeza visual dinámica

Como ocurre con todos los problemas interesantes de factores humanos, el efecto del color en la resolución de
un objetivo en movimiento tiene una importancia tanto práctica como teórica. Las decisiones de diseño que
involucran elementos tan dispares como pantallas de computadora y letreros de calles están influenciadas por el
conocimiento de que algún color en particular es más fácil de percibir. Desde un punto de vista teórico, se sabe
que los receptores de color del cono azul difieren de los otros receptores de color, ya que tienen una menor
agudeza estática y son más lentos (Long y Garvey, 1988). Por lo tanto, Long y Garvey (1988) tenían razones
tanto prácticas como teóricas para estudiar el efecto de la longitud de onda (color) en la agudeza visual dinámica.
En su estudio, solo se utilizaron dos observadores masculinos en todas las condiciones experimentales.
Ambos observadores tenían una agudeza estática de 20/20 cuando usaban anteojos, los cuales, por supuesto,
se usaron durante el experimento. Aunque se trata de un pequeño número de sujetos, cada observador participó
en más de cuarenta sesiones de 40 a 60 minutos durante un período de 12 meses. Los diseños de n pequeña
no se utilizan para minimizar el esfuerzo experimental.
En cambio, son apropiados en situaciones experimentales altamente controladas donde los datos se pueden
replicar fácilmente.
El experimento
Los objetivos de Landolt C se proyectaron en una pantalla blanca. La longitud de onda o el color era una variable
independiente, con objetivos individuales presentados en una de cuatro longitudes de onda: blanco, azul,
amarillo o rojo. La brecha en los objetivos tenía cuatro ubicaciones posibles: arriba a la izquierda, arriba a la
derecha, abajo a la izquierda, abajo a la derecha. La posición de la brecha varió aleatoriamente de un ensayo a
otro. El observador, para estar en lo correcto, tenía que informar la posición de la brecha.
La figura 15.2 muestra una muestra de los tamaños de los espacios utilizados en el experimento. El método de
los límites, una técnica psicofísica (véase el capítulo 6), se utilizó para determinar el umbral o el tamaño del
espacio que era demasiado pequeño para permitir que los sujetos identificaran correctamente la posición del
espacio. El tamaño de la brecha, entonces, era una segunda variable independiente. Una ejecución de prueba
siempre comenzaba con una gran brecha objetivo. Después de una respuesta correcta, se redujo el tamaño de la bre
Esto continuó hasta que se dio una respuesta incorrecta. Luego se aumentó el tamaño del espacio hasta el del
ensayo anterior y se repitió el procedimiento. Cuando el observador cometió un error por segunda vez con un
tamaño de espacio dado, se detuvo la prueba en esas condiciones.
El umbral se registró como la siguiente brecha de mayor tamaño.
59533_16_ch15_p410-431.indd 416 9533_16_ch15_p410-431.indd 416 3/5/08 /5/08

Otra variable independiente importante fue el nivel de adaptación del ojo del observador. En condiciones
de visión nocturna, las varillas controlan la visión; esto se llama visión de tema sco. En condiciones de
visión diurna más brillante, la visión está controlada por los conos; esto se llama visión fotópica. Los
bastones y los conos tienen diferentes sensibilidades a la longitud de onda (color). Aunque las varillas no
pueden reconocer el color, todavía responden con diferente sensibilidad a varias longitudes de onda. Por lo
tanto, era prudente estudiar los efectos de la longitud de onda en condiciones escotópicas, donde dominan
los bastones, frente a las condiciones fotópicas, donde los conos dominan la visión. En este estudio, se utilizó
una condición de visualización nocturna para producir una visión escotópica y una condición de visualización
diurna para producir una visión fotópica.
Finalmente, la última variable independiente que discutimos es la velocidad del objetivo. Se eligieron
tres valores de velocidad angular en función de los valores utilizados en estudios anteriores y porque se
esperaba un efecto nocivo del movimiento del objetivo sobre la agudeza para el rango de velocidades elegido.
Long y Garvey (1988) examinaron los datos de los dos observadores por separado, porque la
investigación de n pequeña generalmente no promedia los datos de diferentes observadores. Descubrieron
que a medida que aumentaba la velocidad del objetivo, también aumentaba el umbral (tamaño de la brecha).
Los objetivos que se movían más rápido eran más difíciles de percibir. Los objetivos azules eran más fáciles
de percibir (tenían un umbral más bajo) que los objetivos presentados en blanco, amarillo o rojo en la
condición de visualización nocturna (visión escotópica), pero no en la condición de visualización diurna (visión f
Estos resultados tienen algunas implicaciones prácticas interesantes. Por ejemplo, la iluminación roja
se usa habitualmente para mantener la adaptación humana a la oscuridad (es decir, para mantener los ojos
de una persona acostumbrados a ver en la oscuridad). La investigación de Long y Garvey sugiere que la
iluminación azul (en lugar de la roja) permitiría a las personas detectar y reconocer más fácilmente objetivos
en movimiento en condiciones de observación nocturna.
Tema Selección de Variable Dependiente

Carga de trabajo mental de ilustración
El vuelo 401 de Eastern Airlines se acercaba al Aeropuerto Internacional de Miami cuando el piloto se dio
cuenta de que la luz indicadora de la rueda de morro no estaba iluminada. Por lo tanto, se desvió y voló
sobre los Everglades a baja altura mientras la tripulación intentaba determinar si el problema era la luz de
señal o si el tren de proa no estaba bajado y bloqueado en su posición de aterrizaje. Aunque aterrizar un
avión con una rueda de morro averiada no es un procedimiento muy peligroso, la tripulación naturalmente
quería bajar la rueda manualmente si la luz de señal mostraba correctamente una falla en el tren de morro.
El avión volaba con piloto automático mientras toda la tripulación de tres hombres intentaba determinar
si la bombilla estaba defectuosa y si el tren no funcionaba. Sin embargo, sin que la tripulación lo supiera, el
piloto automático se había desconectado accidentalmente y el avión había comenzado un descenso gradual.
La atención de la tripulación se centró en la luz de señal; Pasó bastante tiempo antes de que un copiloto
notara la lectura del altímetro. En los 8 segundos restantes antes de que el vuelo 401 se estrellara contra el
suelo, la tripulación no intentó aumentar la altitud. La causa mecánica de este accidente que mató a 99
personas fue una bombilla quemada. La causa psicológica fue el proceso mental de atención. La tripulación
estaba tan concentrada mentalmente en resolver el problema de la señal luminosa que nadie prestó atención
al problema más importante de volar el avión y controlar la altitud.
59533_16_ch15_p410-431.indd 417 9533_16_ch15_p410-431.indd 417 3/5/08 /5/08

La investigación básica sobre la atención dividida y enfocada proporciona modelos y datos que se
relacionan directamente con este tipo de problema práctico (ver Capítulo 8). Pero la utilidad práctica de
la investigación no se puede evaluar en el laboratorio. Se necesita investigación de campo para
determinar si la investigación de laboratorio realizada en universidades funciona en el mundo real. En
aviación, es costoso y posiblemente peligroso realizar estudios de campo en aviones en pleno vuelo.
Por lo tanto, la mayor parte de la investigación de campo se realiza en simuladores de vuelo. Estos
simuladores reproducen tan fielmente la realidad del vuelo que están aprobados por la Agencia Federal
de Aviación para la formación y recertificación de pilotos profesionales. En la aviación, el simulador de
vuelo proporciona una “casa intermedia” entre el laboratorio cuidadosamente controlado y las vías respiratoria
Revisamos aquí una serie de estudios realizados en simuladores de vuelo en el Centro de Investigación
Ames de la Administración Nacional de Aeronáutica y del Espacio (NASA) en California y luego
concluimos con un estudio de campo del observatorio volador estacionado en Ames. Nuestro objetivo es
explicar cómo medir y evaluar los requisitos de atención del vuelo: los efectos de la carga de trabajo en
la capacidad de los pilotos para controlar los simuladores.
Los experimentos GAT de la NASA: medición de la carga de trabajo en un simulador

A partir de 1983, se llevó a cabo una serie de experimentos en el General Aviation Trainer (GAT) de la
NASA. Este es un simulador de vuelo relativamente económico que entrena a los pilotos para volar un
avión monomotor genérico. Está montado sobre una base que permite que toda la cabina se mueva de
acuerdo con las acciones del piloto. Se usa con mayor frecuencia con la ventana de la cabina cubierta,
de modo que el piloto debe depender de las lecturas de los instrumentos para guiar el vuelo.
El objetivo de este esfuerzo de investigación, expresado de manera general, fue proporcionar
métodos objetivos de medición de la carga de trabajo, especialmente utilizando la metodología de tareas
secundarias, que funcionarían en un simulador de vuelo. Una tarea secundaria es una tarea adicional
insertada con la tarea importante (llamada tarea principal) bajo investigación. A menudo, el desempeño
en la tarea secundaria puede interpretarse como un índice de atención requerido por la tarea principal.
Si el rendimiento de la tarea secundaria es deficiente, esto podría indicar una gran demanda de atención
o una carga de trabajo mental para la tarea principal. El problema era cómo utilizar la gran cantidad de
investigaciones sobre la atención para ayudar a resolver un problema práctico en un entorno de campo.
Muchos estudios realizados en los laboratorios de psicólogos experimentales que estudian la
atención sugirieron que las tareas secundarias eran indicadores útiles de la carga atencional (Kantowitz,
1985). El reto consistía en utilizar este conocimiento básico de la investigación, la mayor parte del cual
no estaba destinado a resolver ningún problema práctico en un futuro próximo, en un entorno más
realista. El entorno GAT fue un compromiso razonable entre el rigor y el control del laboratorio de
psicología experimental y la alta validez de un avión real.
La investigación de campo en la carga de trabajo del piloto utiliza variables dependientes tanto
objetivas como subjetivas. Las medidas objetivas incluyen variables, como el tiempo de reacción y el
porcentaje correcto, que el experimentador puede verificar fácilmente. Las medidas subjetivas son
informes verbales dados en escalas de calificación; por ejemplo, se le puede pedir a un piloto que juzgue
la carga de trabajo en una escala del 1 al 10. El experimentador no puede verificar directamente las
calificaciones subjetivas. A principios de la década de 1980, los investigadores que estudiaban la carga
de trabajo en los simuladores de vuelo tenían problemas para encontrar medidas objetivas satisfactorias.
El estudio típico investigaría muchas medidas objetivas y subjetivas. Era común encontrar medidas
subjetivas que arrojaran significación estadística, pero las medidas objetivas útiles eran raras. Un estudio
que encontró una medida objetiva de tal vez una docena para producir resultados estadísticos confiables
fue lo último en tecnología. Por lo tanto, los investigadores comenzaron a preferir las medidas subjetivas
a las medidas objetivas. Esta preferencia es bastante comprensible, ya que nadie quiere desperdiciar
recursos estudiando efectos que no cumplen con los criterios estadísticos apropiados.
59533_16_ch15_p410-431.indd 418 9533_16_ch15_p410-431.indd 418 3/5/08 /5/08

Supuestos Teóricos
Un problema importante en los factores humanos de la aviación es la ausencia de marcos teóricos
significativos para ayudar a guiar la investigación y la práctica. Mucha de la literatura psicológica parece
irrelevante para el practicante; por lo tanto, la mayoría de los estudios de carga de trabajo anteriores no
se basaron en ningún punto de vista teórico. Se adoptó una especie de enfoque de ingeniería flexible,
basado en la noción de que si se estudiaban suficientes medidas objetivas, los investigadores descubrirían
una que se veía afectada por la carga de trabajo mental del piloto. Aunque se consideró la posibilidad de
copiar los métodos utilizados en los estudios de laboratorio sobre la atención, se dedicó poco esfuerzo a
comprender las implicaciones teóricas de estos métodos.
Afortunadamente, esta situación está comenzando a mejorar a medida que los investigadores
aceptan la idea de que una buena teoría es la mejor herramienta práctica (Kantowitz, 1989b). Por ejemplo,
una investigación reciente sobre la carga de trabajo mental de los controladores de tráfico aéreo (Loft,
Sanderson, Neal y Mooij, 2007) comienza con un modelo cualitativo que enfatiza la importancia de las
estrategias cognitivas del controlador en la gestión de la carga de trabajo. De hecho, a medida que
aumenta el uso de la teoría en los factores humanos del transporte, podemos esperar un mayor uso de
modelos cuantitativos o computacionales (Kantowitz, 1998), como un modelo computacional reciente que
detecta los cambios de carril del conductor (Salvucci, Mandalia, Kuge y Yamamura, 2007).
Una tarea secundaria común es una tarea de elección-reacción. En las tareas de elección-reacción,
son posibles varios estímulos (p. ej., tonos de diferentes frecuencias); cada uno tiene su propia respuesta
única. Dado que la reacción de elección requiere capacidad de atención, siempre existe el peligro de que
interfiera con la tarea principal. Si esto sucede, el rendimiento en la tarea principal se verá afectado y no
podremos sacar ninguna conclusión sobre las demandas de atención de la tarea principal. Afortunadamente
los pilotos están extremadamente bien entrenados.
Han aprendido que pase lo que pase, su primera responsabilidad es volar el avión. Recuerde que fue el
incumplimiento de esta regla lo que condenó al Vuelo 401.
El experimento
Se utilizó una tarea de elección-reacción para evaluar a los pilotos en escenarios de vuelo simulados. Los
objetivos principales del experimento eran (1) descubrir si una tarea secundaria de elección-reacción
podía cumplir con el supuesto de no interferencia con la tarea primaria de vuelo; y, si pudiera, (2) para
ver si era una variable dependiente adecuada para medir la carga de trabajo mental del piloto. No todos
los resultados se discuten aquí; el lector interesado debe ver el informe publicado por Kantowitz, Hart y
Bortolussi (1983).
La tarea secundaria consistía en dos o cuatro tonos auditivos. (Las razones para usar tareas de
dos y cuatro opciones están relacionadas con cuestiones teóricas que van más allá del alcance de este
capítulo; consulte Kantowitz & Knight, 1976). Los pilotos respondían a los tonos presionando un interruptor,
montado debajo del pulgar izquierdo del piloto. en la dirección apropiada, dependiendo del tono del tono.
Los tonos ocurrieron cada 22 segundos durante el vuelo simulado.
Cada piloto voló un escenario de vuelo difícil y uno fácil, con una duración de 22 minutos cada uno.
Los escenarios se construyeron con base en datos de calificación anteriores (Childress, Hart y Bortolussi,
1982). Cada escenario se voló tres veces: una vez solo como condición de control, una vez con una tarea
secundaria de dos opciones y una vez con una tarea secundaria de cuatro opciones.
La figura 15.3 muestra el error en la tarea de vuelo en función del nivel de la tarea secundaria. El
escenario de vuelo duro mostró mayor error, como se esperaba; esto confirmó las predicciones basadas
en los datos de calificación utilizados para construir los escenarios de vuelo. De mayor importancia es el
efecto de la tarea secundaria. Un análisis estadístico apropiado muestra que las dos curvas de la figura
15.3 son planas. No hay diferencia estadística entre ninguna tarea secundaria (etiquetada como "ninguna"
en la figura) y secundaria de dos o cuatro opciones.
59533_16_ch15_p410-431.indd 419 9533_16_ch15_p410-431.indd 419 3/5/08 /5/08

ÿ FIGURA 15.3
Error de tarea primaria (vuelo) en Escenario de vuelo duro

60
función de los niveles de la tarea
secundaria.
50
Error
40
Escenario de vuelo fácil

30
Ninguna Dos cuatro
Nivel de Tarea Secundaria
Tareas. Por lo tanto, se validó la suposición clave de que los pilotos primero vuelan el avión y no dejan
que las tareas secundarias interfieran con la tarea principal de vuelo.
La figura 15.4 muestra el desempeño en la tarea de tono secundario en función del segmento de
vuelo. El eje vertical muestra la información transmitida en bits por segundo. Esta es una medida que
tiene en cuenta tanto la velocidad como la precisión de la respuesta. Las puntuaciones más altas
indican un mejor desempeño. Existen diferencias estadísticas fiables entre estos puntos. En particular,
los últimos segmentos de vuelo mostraron las puntuaciones más bajas. Esto significa que la atención y
la carga de trabajo fueron mayores durante este segmento. Se prestó relativamente menos atención a
la tarea secundaria durante este segmento, por lo que la puntuación de bits por segundo es baja. Este
resultado tiene un sentido intuitivo para los pilotos, quienes creen que la carga de trabajo es mayor
durante el aterrizaje. Sin embargo, su opinión es subjetiva. Los resultados objetivos de la figura 15.4 no
se basan en opiniones.
ÿ FIGURA 15.4
1.50
Información transmitida sobre la tarea
secundaria en función del segmento de
1.25
vuelo.
1.00
0.75
segundo
medios
Bits
por
0.50
0.25
1 2 3 45
comienzo Aterrizaje
Segmento de vuelo
59533_16_ch15_p410-431.indd 420 9533_16_ch15_p410-431.indd 420 3/5/08 /5/08

El experimento descrito brevemente ha demostrado que la teoría es de hecho una herramienta práctica.
En el simulador GAT, un entorno que está menos controlado que los entornos de laboratorio que crearon la
teoría, aún pudimos encontrar una medida objetiva de la carga de trabajo del piloto mediante el uso de
reacciones de elección. También encontramos que los informes u opiniones subjetivos de los pilotos sobre su
carga de trabajo mental convergieron con la medida objetiva de elección-reacción.
La convergencia de las medidas subjetivas y objetivas aumenta nuestra fe en el resultado de que el aterrizaje
provoca una gran carga de trabajo mental.
Medición de la carga de trabajo del piloto en el aire

El Observatorio Aerotransportado Kuiper de la NASA (Figura 15.5) es un “telescopio volador” que permite a los
astrónomos volar por encima de gran parte de la atmósfera volando a grandes altitudes (más de 40 000 pies,
con el 85 por ciento de la atmósfera terrestre debajo) obteniendo así mejores imágenes de eventos astrales.
Junto con la misión regular del observatorio, los investigadores de la carga de trabajo pudieron monitorear
cuatro medidas de la carga de trabajo del piloto: análisis de comunicaciones, calificaciones subjetivas de la
carga de trabajo, calificaciones subjetivas de factores adicionales relacionados con la carga de trabajo y
frecuencia cardíaca (Hart, Hauser y Lester, 1984).
Debido a que la carga de trabajo de la investigación no podía interferir con los procedimientos normales
de vuelo, los investigadores tuvieron que aceptar varias limitaciones en el diseño de la investigación. Por
ejemplo, no se tomaron medidas (excepto la frecuencia cardíaca) durante los despegues y aterrizajes, por
razones de seguridad. Tampoco era práctico obtener medidas objetivas introduciendo una tarea secundaria.
Sin embargo, todavía se obtuvo alguna información útil. El resultado más interesante fue una diferencia en la
frecuencia cardíaca media entre pilotos y copilotos. Los pilotos, que eran responsables de volar el avión, tenían
frecuencias cardíacas medias más altas que los copilotos, que eran responsables de la navegación y la
comunicación. Esta diferencia no podía atribuirse a diferencias en el entrenamiento, porque todos los pilotos
estaban completamente calificados; de hecho, a menudo ocurría que alguien que había actuado como copiloto
en un vuelo sería el piloto de otro vuelo. Sin embargo, las dificultades prácticas de programación impidieron un
diseño experimental completo mediante el cual todos los pilotos pudieran ser probados tanto en trabajos de
piloto como de copiloto.
NASA
©
ÿ FIGURA 15.5
El Observatorio Aerotransportado Kuiper de la NASA.
59533_16_ch15_p410-431.indd 421 9533_16_ch15_p410-431.indd 421 3/5/08 /5/08

De manera similar, no fue posible obtener datos de frecuencia cardíaca de referencia sin volar. Hubo una gran diferencia en la
frecuencia cardíaca (72 a 87 latidos por minuto) para el piloto; no se obtuvo tal aumento para el copiloto. Sin embargo, las estimaciones
subjetivas de la carga de trabajo, aunque difirieron significativamente entre segmentos de vuelo, no difirieron entre pilotos y copilotos.
Como ocurre con la mayoría de los estudios de carga de trabajo en vuelo, estos resultados no son tan fáciles de interpretar
como los estudios de laboratorio o de simulador. La frecuencia cardíaca es muy sensible a la cantidad de esfuerzo físico: la frecuencia
cardíaca más alta para los pilotos podría reflejar la actividad física más que la actividad mental. La variación de la frecuencia cardíaca
es una medida de la carga de trabajo mental que se ve menos afectada por el esfuerzo físico, pero los investigadores no informaron
los resultados de la variación. El mejor enfoque parece ser una combinación de medidas objetivas, subjetivas y fisiológicas realizadas
en laboratorios y simuladores. Las medidas objetivas se pueden utilizar para calibrar los otros tipos de medidas que son más
apropiadas para las pruebas en vuelo. El progreso futuro en la medición de la carga de trabajo mental del piloto depende de la
vinculación de los resultados actuales con las teorías de la atención. Esta no es una tarea fácil y requerirá una mejor cooperación
entre investigadores básicos y aplicados (Kantowitz, 1982).
Carga de trabajo del conductor de vehículos pesados
Los métodos utilizados para medir la carga de trabajo mental del piloto se han aplicado con éxito para medir la carga de trabajo de
los conductores de camiones profesionales. Recuerde que la suposición principal para medir la carga de trabajo es que la inserción
de la tarea secundaria no altera el desempeño del operador en la tarea principal (Figura 15.6). Aunque esta suposición suele ser
cierta para los pilotos profesionales que requieren una gran cantidad de capacitación especializada antes de poder obtener y mantener
una licencia de piloto (Kantowitz y Casper, 1988), no hay garantía de que esta suposición se cumpla para los conductores de camiones.
Kantowitz (1995) probó esta suposición en un simulador de manejo utilizando conductores que tenían licencias de conducir
comerciales. Medidas de tareas primarias de posición de carril y velocidad del vehículo
Sin tarea secundaria Tarea secundaria

0.5 0.5
Curvas Curvas
0.4 0.4
Difícil Difícil
0.3 Fácil 0.3 Fácil
0.2 0.2
0.1 0.1
0.0 0.0
Posición
media
carril
de
-0.1 -0.1
-0.2 -0.2
-0.3 -0.3
-0.4 -0.4
-0.5 -0.5
Luz Pesado Luz
Densidad de tráfico pesado Densidad de tráfico

ÿ FIGURA 15.6
Posición de carril (pies) y densidad de tráfico.
59533_16_ch15_p410-431.indd 422 9533_16_ch15_p410-431.indd 422 3/5/08 /5/08

no se vieron afectados cuando se agregaron tareas secundarias; por lo tanto, se cumplió el supuesto principal
para los camioneros profesionales. Se utilizaron dos tareas secundarias. En la tarea del tacómetro, se instruyó a
los conductores para que leyeran el tacómetro del vehículo, que había sido manipulado para mostrar solo valores
de 1000, 2000, 3000 o 4000 rpm. Los conductores respondieron presionando un interruptor de cuatro posiciones
montado en el volante. En la tarea de memoria inmediata, los conductores tenían que repetir un número de
teléfono de siete dígitos que se presentaba de forma auditiva. La figura 15.7 muestra que el tiempo de reacción a
la tarea del tacómetro dependía de la densidad del tráfico y la geometría de la carretera. La interacción
estadísticamente significativa en esta figura muestra que la carga de trabajo del conductor fue más alta para el
tráfico pesado en curvas cerradas. La figura 15.8 muestra que el recuerdo inmediato fue mejor en tráfico ligero.
Esto implica que la carga de trabajo del conductor es mayor en tráfico pesado.
Estos resultados muestran que el concepto de carga de trabajo del operador no se limita a los pilotos de
aviones. Las mismas herramientas y técnicas que han tenido éxito en la medición de la carga de trabajo del piloto
se pueden utilizar en los simuladores de conducción. Sin embargo, la carga de trabajo del conductor del camión
debe probarse en la carretera antes de que podamos concluir que el concepto de carga de trabajo puede
generalizarse por completo a los vehículos terrestres. Actualmente, los fabricantes de vehículos utilizan
simuladores y prototipos virtuales para evaluar nuevos dispositivos en los vehículos (Bullinger & Dangelmeier,
2003).
Conducción y Teléfonos Celulares

¿Es seguro usar un teléfono celular mientras conduce? El sentido común y los resultados de la investigación
(Reed & Green, 1999) coinciden en que marcar un número de teléfono no es seguro, en parte porque esto requiere
apartar la vista de la carretera. De hecho, el estado de Nueva York ha prohibido el uso de teléfonos celulares
portátiles y se está considerando una legislación similar en muchos otros estados y localidades. Una desventaja
de dicha legislación es que implica que el uso de un teléfono celular con manos libres es seguro.
Esta es una pregunta de investigación importante que actualmente se está estudiando en varios laboratorios.
Tarea de tacómetro
4.00
Curvas
3.95 Difícil
Fácil
3.90
3.85
3.80
respuesta
Tiempo
medio
de
3.75
3.70
3.65
3.60
3.55
3.50
Pesado Luz
Densidad de tráfico
ÿ FIGURA 15.7
Tiempo de respuesta (segundos) y densidad de tráfico para la tarea secundaria del tacómetro.
59533_16_ch15_p410-431.indd 423 9533_16_ch15_p410-431.indd 423 3/5/08 /5/08

ÿ FIGURA 15.8 80
Curvas
79
Memoria de Dígitos Difícil
Inmediatos y Densidad 78
Fácil
de Tránsito. 77
76
inmediato
Correcto)
Recuerdo
(%
75
74
73
72
71
70
Pesado Luz
Densidad de tráfico
La metodología de tarea dual es ideal para evaluar el uso de teléfonos móviles con manos libres, aunque
es necesario incluir las condiciones de control de tarea única adecuadas (Kantowitz & Simsek, 2000). ¿La carga
cognitiva impuesta por la conversación en un teléfono celular (tarea secundaria) interfiere con el desempeño de
la tarea principal (conducir)?
Un estudio reciente (Strayer & Johnston, 2001) utilizó una tarea de conducción simulada primitiva para
responder a esta pregunta. Esta tarea, llamada seguimiento de persecución, requiere que las personas usen un
joystick para controlar un cursor en una pantalla de computadora que debe seguir (o rastrear) un objetivo en
movimiento. Ocasionalmente, el objetivo parpadeaba en rojo o verde y los participantes tenían que presionar un
botón en el joystick para responder al destello rojo; por lo tanto, se utilizó una reacción de Donders C como tarea
secundaria. Luego, los autores agregaron lo que llamaron una condición de doble tarea en la que los participantes
escuchaban la radio o entablaban conversaciones en un teléfono portátil o manos libres. En realidad, esta era
realmente una condición de triple tarea, ya que los participantes tenían que realizar (1) seguimiento de
persecución, y (2) una reacción de Donders C, y (3) conversar o escuchar la radio.
El tiempo de reacción de Donders C fue elevado en las condiciones de teléfono (triple tarea) en relación
con la condición de seguimiento de persecución sin teléfono de doble tarea. Los resultados fueron los mismos
para las condiciones de teléfono de mano o de manos libres. El tiempo de reacción no fue elevado para la
condición de radio. Si bien estos resultados son consistentes con la hipótesis de que ningún tipo de teléfono
celular debe usarse mientras se conduce, existen varias limitaciones en el estudio.
Primero, los autores no demostraron que la tarea de seguimiento de persecución, aunque ampliamente
utilizada durante décadas en psicología experimental (Jagacinski y Flach, 2003), sea un sustituto válido de la
conducción real y no citaron ninguna investigación dirigida a este punto. En segundo lugar, los autores fueron
negligentes al no informar sobre el rendimiento en la tarea de seguimiento de persecución. Es posible que las
diferencias entre el uso de teléfonos portátiles y de manos libres se hayan reflejado en el seguimiento del
rendimiento. En tercer lugar, los autores no reconocieron que habían creado una tarea triple y que su condición
de referencia en sí misma era una condición de tarea dual. Por lo tanto, no se incluyeron en su experimento las
condiciones apropiadas de una sola tarea de seguimiento sin reacción C y reacción C sin seguimiento.
Este experimento fue ampliamente citado en los medios de comunicación como prueba de que los teléfonos
móviles con manos libres también deberían prohibirse. Si bien los autores de este texto están de acuerdo con
esa conclusión, el estudio de Strayer y Johnston (2001) por sí solo no es suficiente para justificar la legislación. Otro
59533_16_ch15_p410-431.indd 424 9533_16_ch15_p410-431.indd 424 3/5/08 /5/08

Se necesitan estudios en simuladores de conducción validados y en la carretera utilizando vehículos instrumentados
para proporcionar una base científica sólida para prohibir todos los teléfonos móviles en los vehículos en
movimiento. De hecho, un estudio más reciente realizado por los mismos investigadores (Strayer, Drews y
Johnston, 2003) utilizó un simulador de manejo y encontró un mayor tiempo de reacción de frenado cuando los
conductores conversaban por un teléfono celular con manos libres.
Le recomendamos que no hable por ningún tipo de teléfono mientras conduce, ya que los estudios de datos
de accidentes muestran que se trata de una práctica peligrosa (Goodman, Tijerina, Bents, & Wierwille, 1999) algo
similar a conducir bajo la infl uencia del alcohol. Si necesita usar su teléfono celular en su vehículo, deténgase en
un lugar seguro (un área de descanso, no al costado de una carretera interestatal) y detenga su automóvil antes
de llamar. Contestar un teléfono celular mientras se conduce es aún más arriesgado (Reed & Green, 1999).
Investigación de campo del tema

Ilustración La luz de freno montada en alto centrada
Como se mencionó en la ilustración de investigación anterior, la seguridad del tráfico es una de las principales
preocupaciones de los psicólogos de factores humanos. La historia de amor de Estados Unidos con el automóvil
no muestra signos de disminuir a pesar de los crecientes costos operativos, la contaminación del aire y la creciente
frecuencia y severidad de los atascos de tráfico en muchas de nuestras principales ciudades. Los accidentes de
tráfico suponen una grave amenaza para los jóvenes de nuestra sociedad; Los accidentes automovilísticos
representan la principal causa de muerte entre los estadounidenses de 1 a 34 años (Consejo Nacional de Seguridad
Si su automóvil fue fabricado en 1986 o más recientemente, usted es un beneficiario directo de una de las historias
de éxito de la psicología de los factores humanos: la luz de freno centrada y montada en alto. El ímpetu para el
desarrollo de esta luz fue el hallazgo de que el 25 por ciento de todos los accidentes de vehículos múltiples y el
7,4 por ciento de los accidentes fatales involucran colisiones traseras.
A principios de 1977, Malone y Kirkpatrick realizaron un estudio de campo a gran escala con taxis en el área de
Washington, DC, para probar diferentes configuraciones de luces de freno en un intento por reducir la incidencia
de colisiones traseras. Malone (1986) esbozó los detalles de este estudio en el boletín de la Sociedad de Factores
Humanos.
Configuraciones de luces de freno e incidencia de colisiones traseras

Malone y Kirkpatrick dividieron un total de 2100 taxistas en cuatro grupos de igual tamaño: tres grupos
experimentales y un grupo de control. Los taxistas habían sido emparejados por edad, género e historial previo de
accidentes. La variable independiente fue cómo se montaron las luces de freno en la parte trasera del coche. Se
utilizaron cuatro configuraciones diferentes. La condición de control era la disposición (entonces) existente de dos
luces de freno a cada lado del automóvil a un nivel bajo. Las tres configuraciones experimentales probadas
incluyeron (1) una luz de freno montada en alto en el centro del automóvil, (2) luces de freno dobles separadas
montadas en alto y (3) una condición de función separada que separó el presente (luz trasera). ) desde las
funciones de parada y giro.
Las variables dependientes, colisiones traseras y millas recorridas, se recopilaron durante un período de 1
año. Durante el curso del estudio, los taxistas acumularon más de 60 millones de millas bajo una variedad de
condiciones climáticas y de la carretera.
Malone y Kirkpatrick encontraron que los conductores que usaban una luz de freno montada en alto y
centrada experimentaron significativamente menos colisiones traseras que los conductores en cualquier otra
condición de configuración. La figura 15.9 muestra el número de accidentes en los cuatro
59533_16_ch15_p410-431.indd 425 9533_16_ch15_p410-431.indd 425 3/5/08 /5/08

ÿ FIGURA 15.9 300
Número de accidentes
250
para diferentes
configuraciones de luces de freno. 200
accidentes
Número
de
150
100
50
0
Control Apartado Doble alto alto centrado
Existente Función Montado Montado
Configuración de la luz de freno
condiciones experimentales. Como puede ver, los conductores en la condición de luz de freno montada
en alto y centrada tuvieron un 54 por ciento menos de accidentes que los conductores en la condición
de control (la configuración existente). Cuando ocurrieron accidentes, la luz de freno montada en alto
centrada redujo la extensión del daño en un 38 por ciento. Malone y Kirkpatrick especularon que esta
configuración de luces de freno resultó en una aplicación más rápida de los frenos en el siguiente
vehículo, lo que resultó en velocidades más lentas en el impacto y menos daño a ambos vehículos. ¿Qué
permitió que el siguiente vehículo frenara más rápido cuando el taxi estaba equipado con la luz de freno
central montada en alto? Malone y Kirkpatrick llegaron a la conclusión de que se acercaba más a la línea
de mirada normal de las personas, es decir, hacia donde las personas normalmente miran cuando
conducen. Este estudio ayudó a cambiar la configuración de las luces de freno en todos los automóviles
vendidos en los Estados Unidos. Ahora todos los autos nuevos deben tener la luz de freno centrada y montad
Desafortunadamente, investigaciones posteriores han demostrado que la luz de freno montada en
alto no ha resultado en una reducción cercana al 50 por ciento de los accidentes (Mortimer, 1993). El
beneficio real oscila entre el 22 y el 3,5 por ciento. Un estudio reciente basado en datos de accidentes
de reclamos de seguros encontró solo un beneficio del 5 por ciento (Farmer, 1995). No sabemos por qué
el beneficio fue mucho menor de lo previsto. Parte de la razón de este beneficio reducido puede ser la
novedad: a medida que más vehículos estaban equipados con luces de freno montadas en alto, los
conductores se acostumbraron más a ellas y, por lo tanto, las luces se volvieron menos efectivas. Sin
embargo, la investigación de factores humanos sobre estas luces de freno continúa documentando los
beneficios de una luz de freno central montada en alto (Theeuwes & Alferdinck, 1995).
Los factores humanos son un área apasionante y desafiante de la psicología. Muchos investigadores
se sienten atraídos por esta área debido a la oportunidad de aplicar los principios de la psicología
experimental a los problemas de la vida cotidiana. La investigación discutida en este capítulo refleja este
enfoque general. Por ejemplo, Long y Garvey (1988) aplicaron el método de límites desarrollado en
psicofísica para estudiar los efectos de la longitud de onda objetivo en la agudeza visual dinámica.
Malone y Kirkpatrick utilizaron principios básicos de percepción para probar la luz de freno montada en
alto y centrada. En última instancia, el éxito del psicólogo experimental, según lo evaluado por la sociedad
que apoya la investigación psicológica, está relacionado con qué tan bien su investigación aborda los
problemas que preocupan a la sociedad. Como ha visto en este capítulo, los psicólogos de factores
humanos han tenido éxito al abordar varios de estos problemas.
59533_16_ch15_p410-431.indd 426 9533_16_ch15_p410-431.indd 426 3/5/08 /5/08

LA TUERCAS Y PERNOS
Problema Medir la carga de trabajo mental del piloto en vuelo.
La investigación de campo casi siempre tiene limitaciones que impiden la aplicación directa de
métodos y soluciones de laboratorio. Aunque podemos medir la carga de trabajo mental en el
laboratorio y en simuladores de vuelo con cierto grado de éxito (ver Kantowitz & Campbell, 1996,
para una revisión), en la actualidad no existe una técnica en vuelo universalmente aceptada para
el monitoreo continuo de la mentalidad del piloto. carga de trabajo Este es el problema discutido
aquí.
Problema Encuentre una forma discreta de medir la carga de trabajo mental del piloto en vuelo.
La palabra clave aquí es discreta. Esto significa que nuestro método no puede interferir con los
procedimientos normales de vuelo. Por lo tanto, debe descartarse la mejor técnica de laboratorio,
utilizando una tarea secundaria objetiva. Bajo una gran carga de trabajo, la atención adicional
que podría desviarse a una tarea secundaria podría presentar un peligro para la seguridad. El
mismo argumento podría esgrimirse en contra de que los pilotos informen continuamente las
calificaciones subjetivas de la carga de trabajo.
Esto sugiere que una medida fisiológica podría ser la más adecuada como variable
dependiente. A los pilotos no les molestaría que se pudieran colocar electrodos indoloros para
registrar el ritmo cardíaco o las ondas cerebrales, por nombrar dos posibles medidas fisiológicas.
Las variables independientes podrían ser la fase del vuelo y piloto versus copiloto.
Hipótesis Las ondas cerebrales indican la carga de trabajo mental del piloto en vuelo.
Esta hipótesis es mucho más compleja de lo que parece al principio. El principal problema
experimental es cómo puntuar las ondas cerebrales. La tecnología para registrar ondas cerebrales
(llamadas potenciales evocados) de electrodos de superficie adheridos al cuero cabelludo sin
dolor está bien establecida, pero la interpretación de estas señales es otra cuestión. Hay muchos
componentes dentro del potencial evocado; Se necesitan sofisticados programas informáticos
para distinguir los componentes verdaderos del ruido eléctrico. Incluso después de que los
componentes se hayan identificado y puntuado correctamente, aún deben estar relacionados con
la carga de trabajo del piloto.
En aras de la discusión, supongamos que hemos sido capaces de localizar algunos
componente potencial evocado específico y tener un pequeño pero poderoso sistema informático
en el avión que puede procesar continuamente las ondas cerebrales del piloto y el copiloto. Nos
gustaría demostrar que la magnitud del componente de potencial evocado aumenta con el
aumento de la carga de trabajo del piloto. También podríamos predecir que el piloto exhibiría una
magnitud mayor que el copiloto.
Los detalles de nuestro diseño experimental probablemente dependerán de los requisitos de
vuelo de la misión. Los investigadores de campo por lo general no pueden darse el lujo de diseñar
misiones que se ajusten a sus necesidades de investigación. En su lugar, el problema de
investigación debe llevarse a cuestas a alguna misión existente. Esto limita mucho el diseño
experimental. Esperamos poder identificar diferentes fases de vuelo (aterrizaje, crucero, etc.) que
proporcionaron diferentes niveles de carga de trabajo del piloto. Por supuesto, tendríamos que
usar los resultados publicados de experimentos anteriores para relacionar la carga de trabajo y la
fase de vuelo.
59533_16_ch15_p410-431.indd 427 9533_16_ch15_p410-431.indd 427 3/5/08 /5/08

Si nuestro experimento funcionara, los mayores componentes de ondas cerebrales ocurrirían durante las fases
más difíciles del vuelo. Sin embargo, si este no fuera el caso, podría haber muchas fuentes de error potencial en este
campo de estudio que podrían impedir el resultado deseado, incluso si nuestra hipótesis fuera correcta. Quizás las
fases del vuelo no diferían lo suficiente en la carga de trabajo del piloto. Quizás se seleccionó el componente de onda
cerebral equivocado. Tal vez no pudimos obtener datos suficientes para crear una prueba estadística poderosa de
nuestros resultados. Quizás nuestra muestra de pilotos era demasiado pequeña. Quizás el nivel de habilidad de
nuestros pilotos era tan alto en relación con una misión que se encontraba en el extremo inferior de la carga continua
de trabajo que no se produjo ninguna sobrecarga. Muchos otros problemas podrían enumerarse aquí.
ÿ RESUMEN
1. Los factores humanos es la disciplina que trata de optimizar la sistemas de trabajo. Por razones de seguridad y economía, la
relación entre las personas y la tecnología. investigación con simuladores se utiliza en áreas como la aviación y la
Muchos investigadores y profesionales de los factores humanos se energía nuclear.
formaron originalmente en psicología experimental. 5. Tanto las medidas objetivas como las subjetivas se utilizan para
Sin embargo, el alcance de los factores humanos incluye más que la estudiar la carga de trabajo mental. Las medidas subjetivas son
psicología experimental. más fáciles de obtener, mientras que las medidas objetivas son
2. El principio principal de los factores humanos es "Honra a tu más fáciles de verificar por los investigadores.
usuario". Dado que las personas son el elemento común en varios 6. Las teorías son tan importantes para guiar la investigación de
sistemas tecnológicos, no podemos mejorar el rendimiento y la factores humanos como lo son para guiar la investigación básica.
calidad del sistema sin comprender cómo funciona el ser humano Los modelos de la visión del color se han aplicado al estudio de
como parte del sistema. la agudeza visual dinámica. Los modelos de atención son útiles
3. En muchos escenarios de factores humanos, no se puede emplear la para dirigir los estudios de simulación de la carga de trabajo mental.
metodología de investigación tradicional de n grande de la investigación 7. Los psicólogos de factores humanos están cada vez más
psicológica. La agudeza visual dinámica es un tema de investigación en preocupados por la seguridad del tráfico. Esto se estudia en
factores humanos donde las técnicas de investigación psicofísicas son simuladores de conducción, en pistas de prueba y en carretera con tráf
las más apropiadas. El color y la velocidad del movimiento afectan la Los estudios con simulador son los más seguros y ofrecen un alto
agudeza visual dinámica. control experimental. Los estudios en carretera son más arriesgados y ofrecen
menos control pero son más realistas.
4. Los experimentos en factores humanos se pueden realizar en el

laboratorio, en simuladores o en el campo en
ÿ TÉRMINOS CLAVE
tarea de elección-reacción visión fotópica

agudeza visual dinámica Tarea principal
tema de investigación años de vida ajustados por calidad (AVAC)
factores humanos visión escotópica
Landolt C tarea secundaria
método de límites medidas subjetivas
línea normal de mirada carga de trabajo
medidas objetivas
59533_16_ch15_p410-431.indd 428 9533_16_ch15_p410-431.indd 428 3/5/08 /5/08

1. ¿Qué factores éticos debe tener un investigador de factores humanos? 5. Compare las ventajas y desventajas de estudiar la carga de trabajo
considerar al emprender una investigación que tiene el mental del piloto en un simulador de vuelo en lugar de en un avión
potencial de alterar los ambientes de trabajo de las personas? durante el vuelo.
2. ¿Cómo podría un diseñador de sistemas tener en cuenta las 6. El estudio revisado en el capítulo mostró que las luces de freno, que
características de seguridad que agregan costos al sistema pero se habían mantenido en un arreglo en los automóviles durante
que pueden proteger vidas humanas? años, se podían configurar de manera diferente para producir
3. Enumere algunas situaciones prácticas en las que el color del objeto automóviles más seguros. ¿Hay alguna manera de hacer lo mismo
podría ser un aspecto importante de la agudeza visual dinámica. con los faros, de modo que ayuden al conductor a ver mejor y sea
menos probable que cieguen a los conductores que se aproximan?
4. Discuta algunas de las dificultades inherentes al fuego de campo Sugiera algunas ideas que podrían probarse.
búsqueda. ¿Se te ocurren métodos para combatir estos
problemas?
CONEXIONES WEB
Un sitio interesante que cataloga los malos diseños de los objetos y el medio ambiente se puede encontrar en:
http://www.baddesigns.com
Una excelente descripción general de los factores humanos junto con numerosos enlaces está disponible en:
http://www.ergonomics.org.uk
También es interesante la web de la Human Factors and Ergonomics Society:
http://www.hfes.org
Comprender los símbolos de las señales de tráfico
Muchos conductores, especialmente los de mayor edad, no entienden todas las señales de tráfico simbólicas de las
carreteras estadounidenses (Dewar, Kline y Swanson, 1994; Hanowski, Kantowitz y Kantowitz, 1996). Una vez que los
expertos en factores humanos puedan determinar qué señales son difíciles de comprender, estas señales se pueden
rediseñar y mejorar. Realice el siguiente cuestionario breve y descubra cuántas señales de tráfico comprende. Luego
muéstrele el cuestionario a un conductor anciano, tal vez un abuelo, y vea cómo les va. Compare sus resultados con las
respuestas dadas al final de esta sección. ÿ
59533_16_ch15_p410-431.indd 429 9533_16_ch15_p410-431.indd 429 3/5/08 /5/08

1. 2. 3. 4.
8.
5. 6. 7.
10 11 12
9.
13 14 15. dieciséis.
17 18 19 20
59533_16_ch15_p410-431.indd 430 9533_16_ch15_p410-431.indd 430 3/5/08 /5/08

Porcentaje correcto
Icono Conductores más jóvenes Conductores mayores
1. Prohibido girar a la derecha 99 93.5
2. Sin vuelta en U 99 94.5
3. Ruta de 86 76
senderismo 4. Servicios médicos de emergencia 80 64.5
5. Extremos de carreteras divididas 6. 73 62.5
Resbaladizo cuando está mojado 41 43.5
7. Cruce de bicicletas 47 41
8. Anfiteatro 32 28
9. Carril agregado 37 11.5
10. Biblioteca 62 43
11. Badenes de velocidad más adelante 100 100
12. Ambulancia acercándose 100 100
13. Maletero abierto 100 95
14. Ferry 100 100
15. Propano próxima salida 16. 90 93
Faros antiniebla encendidos 95 60
17. Baja presión de los neumáticos 95 62
18. Estación de tren 100 78
19. Cruce escolar 32 45
20. Recreación acuática 100 88
Los ítems 1 a 10 son de Dewar et al. (1994). Los conductores más jóvenes tenían entre 18 y 39 años; los conductores mayores tenían más de 60 años. Elementos
11 a 20 son de Hanowski et al. (1996). Los conductores más jóvenes tenían entre 18 y 22 años; los conductores mayores tenían más de 65 años.
59533_16_ch15_p410-431.indd 431 9533_16_ch15_p410-431.indd 431 3/5/08 /5/08

APÉNDICE A
EXPERIMENTAL
PSICOLOGÍA:
UN HISTÓRICO
BOSQUEJO
ORÍGENES DE LA PSICOLOGÍA EXPERIMENTAL:

FILOSOFIA Y FISIOLOGIA
La contribución de Helmholtz
PSICOLOGÍA CIENTÍFICA PRIMERA

ernesto weber
Gustav Fechner
wilhelm wundt
Hermann Ebbinghaus
ESCUELAS DE PSICOLOGÍA
Estructuralismo: la estructura de la vida mental
Funcionalismo: los usos de la mente
Conductismo: rechazo de las explicaciones mentales
Psicología de la Gestalt: Percepción del Todo
ALGUNAS TENDENCIAS MODERNAS
La Segunda Guerra Mundial y la Extensión de la Psicología
Psicología cognitiva: el retorno de la mente
Neurociencia cognitiva: la década del cerebro
Especialización
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
59533_17_appendixA_p432-447.indd432 432 9533_17_appendixA_p432-447.indd432 432 3/5/08 /5/08

La psicología tiene un largo pasado, pero sólo una breve historia.
(HERMANN EBBINGHAUS)
La curiosidad y el asombro son las principales motivaciones de la ciencia, y hay pocos temas
que la gente haya encontrado más interesantes que el funcionamiento de sus propias mentes.
Muchos de los escritos de los grandes filósofos, desde la época de Aristóteles hasta el presente, se
han ocupado de lo que puede llamarse problemas psicológicos. ¿Cómo percibimos y conocemos el
mundo exterior? ¿Cómo aprendemos al respecto y recordamos lo que aprendemos? ¿Cómo usamos
esta información para construir conceptos del mundo y resolver los problemas que el mundo nos
presenta? ¿Cuáles son las raíces del comportamiento anormal? ¿Existen leyes que rigen el
comportamiento social y político? ¿Hay significado para los sueños?
Aunque estos temas se han discutido durante siglos, los métodos de la ciencia no se aplicaron
al estudio de la mente y el comportamiento humanos hasta trescientos o cuatrocientos años después
de encontrar un lugar sólido en la física (así la cita de Ebbinghaus).
De hecho, la psicología de hoy debe compararse, tal vez, con la física del siglo XVI.
Como muchos estudiantes de psicología se dan cuenta (para su consternación), todavía tenemos
mucho que aprender sobre muchas áreas importantes del comportamiento humano. Este apéndice
proporciona un bosquejo breve y muy tosco de la historia intelectual de la psicología experimental.
Se pueden encontrar historias completas en Boring (1950), el clásico en el campo, y en un trabajo
más reciente y fácil de leer de Schultz y Schultz (1987) (ver también Pickren & Dewsbury, 2002;
Rieber & Salzinger, 1998).
ÿ ORÍGENES DE LA PSICOLOGÍA EXPERIMENTAL:

FILOSOFIA Y FISIOLOGIA
Un tema importante en la historia de la filosofía es el problema mente-cuerpo. ¿Son la mente y el
cuerpo esencialmente iguales o de naturaleza diferente? Una posición popular sobre este tema, que
probablemente retrasó en gran medida el desarrollo de una psicología científica, sostenía que la
mente y el cuerpo son entidades separadas y operan de acuerdo con principios diferentes. De
acuerdo con esta teoría, a menudo llamada dualismo, el cuerpo está gobernado por leyes físicas,
al igual que los objetos inanimados, pero la mente no está gobernada por tales leyes porque posee
libre albedrío. No tiene sentido aplicar métodos científi cos en un intento de descubrir las leyes de la
vida mental si uno es dualista y cree que tales leyes no existen. Los primeros dualistas argumentaron
que aunque la mente podía controlar el cuerpo, había poca influencia en la dirección opuesta.
Los influyentes escritos filosóficos de René Descartes (1596-1650) ayudaron a debilitar la

creencia de que el cuerpo y la mente no interactúan. Descartes avanzó la idea de interacción mutua:
el cuerpo podría afectar a la mente y la mente podría afectar al cuerpo. Aunque la posición dualista
permaneció y la mente todavía se consideraba inmortal y poseía libre albedrío y un alma, el cuerpo
podía ser

estudiado como un sistema mecánico por medios racionales y científi cos. Debido a que se
consideraba que los animales no poseían alma, también podían estudiarse mediante los
métodos aplicados a los objetos inanimados de la ciencia física. Así, la aplicación del método
científi co comenzó a expandirse más allá del estudio de los sistemas puramente físicos al
estudio de los sistemas orgánicos.
A lo largo de los años, se hizo más frecuente la idea de que incluso la mente humana
podía ser tratada como algo que podía estudiarse de forma rentable para descubrir leyes
mentales. Los filósofos empiristas británicos (Locke, Berkeley, Hume, Hartley) quedaron
impresionados por el poder de los modelos mecanicistas para explicar los sistemas físicos (por
ejemplo, la astronomía y la física). Creían que la mente podía modelarse de manera similar,
es decir, en términos de elementos (ideas) y fuerzas (asociaciones) que actúan sobre esos
elementos de manera legal. Los empiristas enfatizaron la naturaleza mecánica de los
fenómenos mentales; discutieron las "leyes" de asociación en el pensamiento y la base física
de la percepción del mundo externo. Empezaba a arraigar la idea de que, para el estudio
científico, la mente podía ser tratada como una máquina.
Los filósofos británicos también enfatizaron la importancia del aprendizaje en nuestra
comprensión del mundo. Descartes había argumentado que algunas ideas son innatas o se
desarrollan sin que la información del mundo externo afecte los sentidos. Kant amplió esta
posición y algunos aspectos de ella se incorporaron más tarde a la escuela de psicología de la
Gestalt. Los empiristas británicos recibieron su nombre al rechazar esta idea (empiric proviene
del griego empeiria, que significa experiencia). John Locke escribió así en Un ensayo sobre el
entendimiento humano:
Supongamos que la mente es, como decimos, un papel blanco, vacío de todo carácter, sin
ninguna idea: ¿Cómo llega a estar amueblada? ¿De dónde viene esa vasta reserva que la
atareada e ilimitada fantasía del hombre ha pintado en ella con una variedad casi infinita?
¿De dónde tiene todos los materiales de la razón y del conocimiento? A esto respondo, en
una palabra, desde la EXPERIENCIA. En eso se funda todo nuestro conocimiento.
(1690/1959, Libro II, Cap. 1)
Los filósofos estaban preparando el camino para una psicología científica al tratar la
mente como sujeta a leyes naturales, pero su método de estudio era simplemente anécdota y
reflexión. No importa lo brillantes que fueran las ideas, estos métodos probablemente harían
avanzar nuestro conocimiento un poco más allá de las cuidadosas reflexiones de Platón y
Aristóteles siglos antes. Lo que se necesitaba era la aplicación de los métodos experimentales
y la lógica de la ciencia al estudio de la mente y el comportamiento. Como observó Boring, “La
aplicación del método experimental al problema de la mente es el gran evento sobresaliente al
que ningún otro es comparable”. Este método llegó a la psicología a través de la fisiología.
Los fisiólogos alemanes de mediados del siglo XIX estaban interesados en lo que hoy se
considera fisiología sensorial: la fisiología de los órganos de los sentidos (ojos, oídos, etc.) y
la transmisión de información desde estos órganos al cerebro a través del sistema nervioso.
sistema. Muchos de los fisiólogos alemanes esperaban que la fisiología pudiera reducirse
finalmente a la física y, a medida que se interesaron en la fisiología del sistema nervioso
humano, se acercaron cada vez más a tratar la mente como una máquina física. La Sociedad
de Física de Berlín se formó en la década de 1840 con un compromiso primordial con la
creencia de que, en última instancia, todos los fenómenos podrían explicarse en términos de
física. Cuatro de los jóvenes científicos radicales de la sociedad, todos veinteañeros, firmaron
con sangre (así cuenta la historia) un

juramento declarando su creencia de que todas las fuerzas en el organismo humano eran químicas y físicas.
La contribución de Helmholtz
Uno de estos jóvenes científicos fue Hermann von Helmholtz (1821–1894). Era principalmente físico y
fisiólogo y no estaba interesado en establecer la psicología como una disciplina independiente, pero se le
da mucho crédito a su investigación por haber tenido este efecto.
Su trabajo sobre la visión y la audición fue abrumadoramente importante, pero lo que debemos enfatizar
aquí es su papel en la conducción de lo que puede considerarse como experimentos de transición entre la
fisiología y la psicología experimental.
Un caso famoso fue su uso de lo que ahora se conoce como un experimento de tiempo de reacción.
para estudiar la velocidad de los impulsos neurales. Johannes Müller, un famoso fisiólogo alemán, había
argumentado que la transmisión de los impulsos nerviosos era instantánea, o quizás se acercaba a la
velocidad de la luz. Si se pellizca la mano, ¿observa que transcurre algún tiempo entre el momento en que
se ve pellizcando y el momento en que siente el pellizco?
Probablemente no. De todos modos, Müller también afirmó que probablemente nunca podríamos calcular la
velocidad de los impulsos nerviosos. Solo unos años más tarde (en 1851), Helmholtz midió la velocidad de
forma experimental. La idea básica era ingeniosamente simple: estimular un nervio a dos distancias
diferentes del cerebro y medir la diferencia de tiempo que tarda el organismo en responder a la estimulación.
Si se conoce la distancia entre los dos puntos de estimulación y la diferencia en el tiempo necesario para
responder, entonces se puede calcular la tasa del impulso nervioso, ya que la tasa es igual a la distancia
dividida por el tiempo. Helmholtz estimuló a personas con los ojos vendados en el hombro o en el tobillo y
midió qué tan rápido podían reaccionar con la mano (empujando una palanca) en cada caso. Dado que
podía medir aproximadamente cuánto más lejos tendría que viajar el impulso al cerebro desde el tobillo que
desde el hombro, pudo estimar la velocidad de los impulsos nerviosos a la velocidad relativamente lenta de
50 metros por segundo, ni siquiera la velocidad del sonido, mucho menos el de la luz! El trabajo experimental
más cuidadoso de Helmholtz sobre este tema fue con ranas (donde, por supuesto, la técnica, pero no la
lógica, era diferente), y las estimaciones no eran demasiado diferentes. De hecho, las estimaciones han
resistido más o menos la prueba del tiempo, aunque hoy sabemos que la velocidad del impulso nervioso
depende del diámetro de los nervios implicados.
Una nota al pie interesante es que Helmholtz estaba tan desesperado por la gran variabilidad (o
diferencias) en los tiempos de reacción que encontró entre los sujetos, e incluso dentro del mismo sujeto en
diferentes ensayos, que abandonó por completo esta línea de investigación (Schultz & Schultz , 1987).
Muchos psicólogos desde Helmholtz también han lamentado la variabilidad que se encuentra en la
investigación psicológica, aunque la mayoría no la ha abandonado por este motivo. Gran parte de este libro
se ocupa del problema de la variabilidad en las medidas del comportamiento animal o humano y de cómo
superar este problema.
ÿ PRIMERA PSICOLOGÍA CIENTÍFICA
La psicología científi ca tuvo su nacimiento y vida temprana en Alemania. En esta sección, mencionamos
las contribuciones de cuatro de los primeros pioneros: Weber, Fechner, Wundt y Ebbinghaus.
La Tabla A.1 resume sus contribuciones y las de Helmholtz.

ÿ TABLA A.1
Cinco científicos históricos
Hermann von Helmholtz 1821–1894 Velocidad medida de los impulsos neurales

ernesto weber 1795–1878 Descubrió la ley de Weber, que relaciona el tamaño de un
aumento en la estimulación física con la diferencia

apenas perceptible
Gustav Fechner 1801–1887 Extendió la ley de Weber (ley de Fechner) y fundó
psicofísica
wilhelm wundt 1832-1920 Estableció el primer laboratorio de experimentación
psicología en 1879
Hermann Ebbinghaus 1850-1909 Escribió Memory en 1885, mostrando que se podían estudiar
fenómenos mentales complejos.
ernesto weber
Ernst Weber (1795–1878) fue un anatomista y fisiólogo de Leipzig cuya investigación se centró
en la sensación cutánea o el sentido del tacto. Su contribución más importante a la psicología
surgió de algunos experimentos que realizó para investigar si la participación activa de los
músculos afectaba el juicio de los pesos de los objetos (ver Capítulo 6). Hizo que la gente
comparara dos pesos, uno de los cuales se llamaba estándar. En un caso, los sujetos con los
ojos vendados tomaron primero un peso estándar y luego un peso de comparación e indicaron
al experimentador si los dos pesaban la misma cantidad. En otro caso, los sujetos eran pasivos;
simplemente tenían los pesos colocados en sus manos sucesivamente, y luego tomaban sus
decisiones.
Weber descubrió que los juicios eran más precisos cuando los sujetos activaban activamente
sus músculos; pero lo que es más importante, notó algo interesante en las habilidades de los
sujetos para detectar una diferencia entre los pesos estándar y de comparación. Cuanto mayor
sea el peso del estándar, mayor será la diferencia entre el peso estándar y el de comparación
antes de que los sujetos puedan notar la diferencia. Cuando el peso estándar era pequeño, solo
era necesaria una pequeña diferencia entre el estándar y la comparación para que los sujetos
detectaran una diferencia. Pero cuando el peso era grande, la diferencia necesaria para la
detección (llamada diferencia apenas perceptible, o jnd) era correspondientemente mayor.
Weber descubrió además que para cualquiera de los sentidos, la relación entre la cantidad de
diferencia necesaria para producir un jnd y el estándar era una constante. Así, no sólo la cantidad
de diferencia necesaria para producir un jnd aumenta con el tamaño del estándar, sino que lo
hace de una forma bastante sistemática. Este hecho se conoce como la ley de Weber (véase el
capítulo 6).
Gustav Fechner
Weber pensó que su hallazgo era una generalización interesante y útil, pero su importancia no lo
asombró de ninguna manera. Gustav Fechner (1801-1887) lo fue. Fechner fue excéntrico en
muchos sentidos, pero su importancia para la psicología fue grande. Se formó como físico, pero
también contribuyó a la filosofía, la religión, la estética y la psicología.
Entre muchas otras empresas académicas, escribió un libro sobre la vida después de la muerte y

otro (anterior a un reciente resurgimiento del interés en este tema) que argumenta que las plantas tienen una
"vida mental". En la década de 1830, su interés se centró en los temas psicológicos de la visión del color y las
imágenes secundarias.
Se lastimó gravemente los ojos mientras miraba al sol a través de lentes de colores; esto, combinado con
una severa depresión y la tensión del exceso de trabajo, lo obligó a retirarse en 1839. Sin embargo, Fechner
se recuperó para el beneficio duradero de la psicología. En 1850 se preocupaba por el problema fundamental
de si había leyes que rigieran la traducción de la energía física en su representación psicológica o mental.
Empezó a buscar leyes que relacionaran la intensidad de los estímulos físicos con la impresión subjetiva de
estos estímulos. Mientras lidiaba con este problema, se encontró con el trabajo de Weber y celebró
enormemente el principio que Weber descubrió, llamándolo ley de Weber. Fechner lo elaboró un poco; como
analizamos en el capítulo 6, esta extensión se denomina ley de Fechner. Para Fechner, esto fue el cumplimiento
de su esperanza de que existan relaciones cuantitativas exactas entre los mundos físico y mental. Así, decimos
que Fechner fundó la importante disciplina de la psicofísica, que consideramos en el Capítulo 6.
wilhelm wundt
Quizá la primera persona que se consideró principalmente un psicólogo, aunque al final de su carrera, fue
Wilhelm Wundt (1832-1920). Formado en fisiología y medicina (por Helmholtz, entre otros), se fue interesando
paulatinamente por la psicología. En 1874 se publicó su Principios de psicología fisiológica ; el eminente
historiador Boring lo llamó el libro más importante en la historia de la psicología experimental.
En él, Wundt revisó sistemáticamente todo lo que se sabía sobre psicología en ese momento y también
presentó su sistema de psicología. El libro pasó por seis ediciones y ayudó a sentar las bases para una
psicología sistemática. Las contribuciones de Wundt consistieron principalmente en organizar la psicología y
ayudar a establecerla como una disciplina independiente, más que en realizar importantes descubrimientos
científicos. Wundt capacitó a muchas personas que luego harían importantes contribuciones por derecho
propio. También se le da crédito por establecer el primer laboratorio de psicología experimental en 1879 en
Leipzig y por establecer la primera revista de psicología.
Aunque Wundt jugó un papel decisivo en el establecimiento de la psicología experimental como una
disciplina separada, no creía que los procesos mentales superiores como la memoria, el pensamiento y la
creatividad pudieran estudiarse experimentalmente. El método experimental, afirmó, sólo podía aplicarse al
estudio de la sensación y la percepción. Pensó que los procesos mentales superiores deberían estudiarse
mediante el examen de los trabajos de la civilización a lo largo de los siglos en varias culturas o mediante la
historia cultural o la antropología cultural. Wundt contribuyó con diez volúmenes de investigación a esta última
búsqueda.
Hermann Ebbinghaus
En el mismo año (1879) en que Wundt estaba estableciendo su laboratorio, se estaba trabajando para
desacreditar su creencia acerca de los límites extremos del método experimental en psicología. En este año,
Hermann Ebbinghaus (1850-1909) inició sus experimentos pioneros sobre el aprendizaje y la memoria
humanos, que culminaron en su importante libro,

Memory, en 1885. Este texto mostró que se podía realizar un interesante trabajo experimental sobre
temas psicológicos más complejos, como la memoria. Sus investigaciones generaron el área crítica
de indagación sobre el aprendizaje y la memoria humanos y se analizan con más detalle en el
Capítulo 10.
ÿ FACULTADES DE PSICOLOGÍA
Es costumbre dividir la psicología en varias escuelas cuando se consideran los años 1890-1940 más
o menos, aunque esto daña ciertas tendencias en psicología que se resisten a encajar perfectamente
en estos casilleros. No obstante, describiremos brevemente aquí algunas de las principales
características de las escuelas del estructuralismo, el funcionalismo, el conductismo y la psicología
de la Gestalt.
Estructuralismo: la estructura de la vida mental
Muchos libros de texto de psicología conectan a Wundt con la escuela de psicología estructural,
pero las ideas atribuidas a la psicología estructural están más estrechamente ligadas a Edward
Bradford Titchener (1867-1927). Titchener, uno de los estudiantes de Wundt, trajo este punto de
vista a los Estados Unidos y lo adelantó desde su laboratorio en la Universidad de Cornell. Aunque
estos hombres diferían en algunos detalles, podemos tratar sus puntos de vista juntos.
Como su nombre lo indica, la psicología estructural, o estructuralismo, se preocupaba
principalmente por descubrir la estructura de la mente. Según los estructuralistas, las tres cuestiones
principales de la psicología eran las siguientes: (1) ¿Cuáles son los elementos de la experiencia? (2)
¿Cómo se combinan? y (3) ¿Por qué? ¿Cual es la causa? Se consideraba que los elementos
básicos de la experiencia eran las sensaciones: imágenes, sonidos, sabores, olores, etc. Los otros
dos elementos de la experiencia eran imágenes o ideas, que representaban experiencias que no
estaban realmente presentes, y afectos, que eran reacciones emocionales, como el odio, la alegría
y el amor. Cada elemento de la experiencia también podría evaluarse por sus atributos de duración,
intensidad, calidad y claridad.
El trabajo de la psicología estructural fue descomponer las experiencias mentales complejas
en sus componentes con la creencia de que al comprender los elementos fundamentales de la
experiencia consciente, uno podría comprender cómo se combinan en fenómenos mentales
complejos. Así, era elementalista, ya que buscaba los elementos básicos de la experiencia mental.
Se pensaba que las sensaciones e imágenes elementales se componían a través de principios de
asociación para convertirse en eventos mentales complejos. El método de descomposición de estos
eventos mentales fue la introspección. Para los psicólogos estructurales, la introspección no se
refería a la reflexión casual, ni siquiera a la reflexión crítica, sino más bien a un método técnico
específico de ver la experiencia. Para los observadores ingenuos (es decir, todos nosotros), la
conciencia parece ser una sola pieza, o una corriente, como la describió William-James. Los
introspeccionistas entrenados fueron destetados de este punto de vista. Debían informar los
contenidos conscientes de una experiencia, en lugar del objeto focal bajo consideración.
Un introspectivo capacitado no informaría haber visto una mesa en el entorno, sino que informaría
haber visto un patrón espacial, un color, un brillo, etc., en particular. En otras palabras, los
introspeccionistas fueron entrenados para ver los elementos de la experiencia de ver una mesa. Si
uno informaba ingenuamente que había visto una tabla, se consideraba que se estaba cometiendo
el error de estímulo.

La introspección era un método riguroso y difícil que la gente fuera del campo estructural
sentía estéril. Tampoco era fiable; los introspeccionistas de diferentes laboratorios no pudieron
ponerse de acuerdo sobre los contenidos de la misma experiencia. Titchener creía que el
programa estructural establecía el patrón de la forma en que debía desarrollarse la psicología, y
todo lo que quedaba era simplemente completar los detalles. Criticó las nuevas tendencias en
psicología, tendencias que eventualmente sacaron de escena a la escuela estructural después
de 1920. No obstante, Titchener entrenó a muchos psicólogos que más tarde se convertirían en
prominentes, y el estructuralismo cumplió una función importante, ya que las otras escuelas
eran, en parte, , una reacción en su contra.
Aunque se ha asociado a Wundt con el estructuralismo, existen importantes diferencias
entre su tipo de psicología y la atribuida a la escuela estructural. Por ejemplo, Wundt criticó
duramente el método de la introspección, afirmando que no era una técnica científica válida
(Benjamin, 1997). Además, al igual que los psicólogos de la Gestalt, Wundt argumentó que la
percepción no podía explicarse en términos de una síntesis de elementos sensoriales. En
cambio, afirmó que la percepción era única porque incluía tanto los elementos de la sensación
como los procesos de atención de la mente.
Funcionalismo: los usos de la mente

Así como a los estructuralistas les preocupaba la estructura de la vida mental, a los funcionalistas
les preocupaban las funciones de los procesos y estructuras mentales. A fines del siglo XIX, la
teoría de la evolución de Darwin se extendió por los círculos intelectuales de Inglaterra y los
Estados Unidos. Por lo tanto, era bastante natural que la gente comenzara a preguntarse sobre
la importancia adaptativa de los procesos psicológicos. ¿Cuál es la función de los procesos
psicológicos? ¿Qué diferencias hacen?
John Dewey (1859–1952) inició el funcionalismo en la Universidad de Chicago después
de su llegada en 1894. Llegaron casi al mismo tiempo George Herbert Mead, James Rowland
Angell y AW Moore. Dewey estuvo muy influenciado por el concepto de selección natural de
Darwin. En 1896 publicó un artículo titulado “El concepto de arco reflejo en psicología”, en el que
criticaba la tendencia hacia el elementalismo en psicología, que consiste en descomponer los
procesos psicológicos en sus supuestas partes elementales. Curiosamente, no atacó a Titchener
en el periódico, sino que estaba más preocupado por otros temas. Argumentó que los procesos
psicológicos eran eventos continuos y continuos y que los psicólogos deberían tener cuidado de
recordar que las distinciones que introdujeron para estudiar el proceso eran hasta cierto punto
artificiales y no formaban parte del acto en sí. Dewey enfatizó estudiar el comportamiento en su
contexto natural para determinar sus funciones.
La escuela funcionalista era más vaga y amorfa que el pequeño y compacto grupo de
estructuralistas de Titchener. Los funcionalistas tenían poco uso para la introspección, pensaban
que era imposible estudiar los procesos mentales desprovistos de su contexto y función, y eran
mucho más propensos a respaldar programas prácticos o aplicados en psicología. Sin embargo,
los funcionalistas no tenían un programa específico para la psicología, como Titchener, y lo más
cerca que estuvieron de proporcionar un manifiesto fue el discurso presidencial de Angell ante
la Asociación Americana de Psicología (1907). Además de enfatizar las actividades aplicadas,
como las pruebas mentales y la educación (el campo al que emigró Dewey), el funcionalismo
ayudó a introducir el estudio de los organismos inferiores en la psicología. Esto se derivó
naturalmente de su énfasis en la evolución y la función de desarrollo de los procesos psicológicos.

El funcionalismo se extendió desde Chicago en numerosas direcciones, especialmente a la
Universidad de Columbia. Su posición, nunca demasiado sistemática o dogmática, fue simplemente
absorbida por la psicología en general. Y mientras el funcionalismo disfrutaba de su apogeo en la
Universidad de Chicago, un joven psicólogo llamado John Watson se graduó allí en 1903.
Conductismo: rechazo de las explicaciones mentales
En 1913, John Watson publicó un artículo llamado "La psicología como la ve el conductista". Así
comenzó la revolución conductista en psicología. Las ideas de Watson sobre lo que luego se
llamaría conductismo habían comenzado a tomar forma durante sus días en la Universidad de
Chicago, pero no se desarrollaron por completo hasta algunos años después, cuando enseñaba
en la Universidad Johns Hopkins. En su artículo de 1913, Watson atacó duramente la psicología
estructural y la introspección, con su énfasis en la conciencia y los contenidos mentales. Watson
argumentó que deberíamos barrer todas estas tonterías, que ni siquiera se pueden reproducir de
un laboratorio a otro, y estudiar algo en lo que todas las personas razonables podrían estar de
acuerdo: el comportamiento. Respaldó una declaración de Pillsbury de que “la psicología es la
ciencia del comportamiento” y continuó:
Creo que podemos escribir una psicología, definirla como Pillsbury, y nunca volver atrás en
nuestra definición: nunca usar los términos conciencia, estados mentales, mente, contenido,
introspectivamente, verificable, imágenes y similares. Puede hacerse en términos de estímulo y
respuesta, en términos de formación de hábitos, integración de hábitos y similares. Además,
creo que realmente vale la pena hacer este intento ahora. (1913, págs. 166-167)
La declaración clara y concisa de Watson sobre la posición del conductismo fue muy influyente.
Para muchos psicólogos, justificaba desechar muchas de las turbias tonterías que habían ocupado
el campo durante tanto tiempo. El gusto de Watson por escribir de forma directa e interesante
también fue evidente en sus otros trabajos, entre los que se encuentra su notable libro Psychology
from the Standpoint of a Behaviorist (1919).
Los conductistas tenían la intención de establecer la psicología como una ciencia natural, un
estatus del que pensaban que carecía en 1913. Su tema principal era el comportamiento. No había
necesidad de involucrarse en argumentos complicados sobre términos tales como conciencia,
pensamiento sin imágenes y apercepción, cuyos significados no estaban claros. Watson y los otros
conductistas atacaron tanto el estructuralismo como el funcionalismo por motivos de vaguedad.
Los conductistas no dijeron que la conciencia, la imaginería, etc., no existieran; simplemente
sostuvieron que tales términos no eran construcciones científicas útiles.
Los conductistas creían que los comportamientos más importantes se aprendían, por lo que
el estudio del aprendizaje se convirtió en el foco central de interés. Los estudios pioneros de Pavlov
y Thorndike, revisados en los capítulos 9 y 11, indicaron la posibilidad de una psicología objetiva
del aprendizaje, y desde entonces el enfoque de la psicología del comportamiento ha sido el
aprendizaje.
Los temas del conductismo provocaron una revolución dentro de la psicología, una revolución
que todavía está con nosotros. Gran parte del punto de vista conductista ya ha sido absorbido por
la corriente principal de la psicología, aunque siguen existiendo debates sobre muchos detalles.
De hecho, no existe una posición que hoy pueda llamarse conductismo, excepto la general que
respalda el estudio de la conducta como el tema apropiado de la psicología. (Presumiblemente,
todos los psicólogos experimentales se suscriben a este punto de vista hoy en día, ya que todos
están observando el comportamiento.) Más bien, hay una serie de diferentes

posiciones conductistas identificadas con un número de personas diferentes. Algunos de los sucesores
más destacados de Watson en la línea conductista son EB Holt, Karl Lashley, EC Tolman, ER Guthrie,
Clark Hull, Kenneth Spence y BF Skinner. Todos estos psicólogos se han considerado a sí mismos
conductistas, aunque han diferido ampliamente en una serie de cuestiones con respecto a cómo se
debe abordar la psicología. Por ejemplo, Lashley y Hull estaban muy preocupados por las bases
fisiológicas del comportamiento, mientras que Skinner evitaba tales investigaciones. Los críticos de
estos días que argumentan en contra del conductismo generalmente lo hacen en contra de la posición
de BF Skinner, quien ha atraído mucha atención por lo extremo de algunas de sus opiniones como
conductista radical. Pero, por supuesto, la posición de Skinner no debe identificarse como la única
forma de conductismo en psicología, ya que existen muchas otras posiciones conductistas.
Es popular decir en estos días que el conductismo está en declive. Las construcciones mentales
(como la atención) se han reintroducido en la psicología, incluso en el estudio del comportamiento
animal. Pero estas construcciones mentales están estrechamente ligadas a las respuestas
observables. (Discutimos en los capítulos 7 y 14 cómo encontrar evidencia para construcciones
psicológicas no observables.) El conductismo ha tenido un amplio impacto en todas las áreas de la
psicología experimental y prospera hoy en muchas formas.
Psicología de la Gestalt: Percepción del Todo

El funcionalismo y el conductismo se desarrollaron en Estados Unidos en parte como reacción al
estructuralismo. Otra revuelta contra el estructuralismo se desarrolló en su tierra natal, en Alemania.
La visión estructural de la percepción se puede caracterizar como una visión de ladrillo y mortero: las
sensaciones (los ladrillos) se mantienen unidas por medio de asociaciones (el mortero). Los psicólogos
de la Gestalt argumentaron en contra de esta posición elementalista y afirmaron que la percepción de
los objetos era de totalidades, no de sumas complicadas de partes. En los términos de la psicología
de la Gestalt, las personas perciben el mundo en totalidades unitarias.
Max Wertheimer (1880-1943) y los demás psicólogos de la Gestalt produjeron muchas
demostraciones de la unidad del proceso perceptivo que parecían incompatibles con la posición
estructuralista. Uno de ellos fue el fenómeno de la constancia de la forma. Si te paras frente a una
mesa con un libro encima, es posible que se produzca una imagen rectangular en tu retina, pero si te
mueves lateralmente varios pies en una dirección u otra, la imagen retinal puede volverse trapezoidal.
A pesar de este cambio en las sensaciones retinianas, percibes el libro como el mismo y con la misma
forma en ambos casos. La forma permanece constante en tu percepción. Constancias similares de
tamaño y brillo, así como numerosos otros fenómenos de percepción, demuestran el mismo punto. La
percepción parece tener cualidades de totalidad independientes de las sensaciones cambiantes
proyectadas sobre los receptores.
La psicología de la Gestalt comenzó, al igual que el conductismo, como una protesta exitosa
contra la psicología estructural, pero pronto se encontró compitiendo con el conductismo. Los
Gestaltistas encontraron el mismo elementalismo insatisfactorio en las descripciones del
comportamiento de los conductistas que habían encontrado en las de los estructuralistas, pero ahora
los elementos eran estímulos y respuestas. A su vez, los conductistas encontraron las construcciones
de los Gestaltistas tan borrosas y mal definidas como las de los estructuralistas y funcionalistas.
Además, los Gestaltistas a menudo se contentaban con hacer un punto u otro a través de
demostraciones simples, sin idear teorías claras y probarlas experimentalmente. Hasta cierto punto,
los Gestaltistas y los conductistas investigaban diferentes áreas, y los Gestaltistas se preocupaban princ

y los conductistas con el aprendizaje. Pero los últimos psicólogos de la Gestalt, sobre todo Kurt Koffka y
Wolfgang Köhler, comenzaron a aplicar las construcciones de la Gestalt a otras áreas de la psicología,
como el estudio del aprendizaje, la memoria y la resolución de problemas. Por lo tanto, los conductistas y
los gestaltistas a menudo han entrado en conflicto, y las batallas experimentales generalmente terminan
en empate. Bien puede ser que los teóricos de la Gestalt estuvieran describiendo el comportamiento a un
nivel más general que los conductistas y que sus descripciones aparentemente dispares de los mismos
fenómenos psicológicos podrían no ser tan incompatibles como parecían en ese momento.
La psicología de la Gestalt no ha estado tan integrada en la corriente principal de la psicología como
el funcionalismo y el conductismo, pero su influencia en ciertas áreas de la psicología ha sido abrumadora.
Esto es ciertamente cierto en la psicología cognitiva moderna ,
especialmente en las áreas de percepción, resolución de problemas y pensamiento.
ÿ ALGUNAS TENDENCIAS MODERNAS
La era de estas escuelas de psicología declinó alrededor de 1940 y esta forma de dividir estrictamente el
campo de la psicología ya no es rentable. La infl uencia de las escuelas sigue viva en la investigación
contemporánea, pero la organización del campo se encuentra en líneas diferentes. Se ha escrito muy poco
sobre la historia de la psicología desde 1940 porque todavía hay pocos temas unificadores aparentes.
Esbozamos aquí, sin embargo, algunas tendencias modernas.
La Segunda Guerra Mundial y la Extensión de la Psicología
Durante la Segunda Guerra Mundial, los psicólogos se emplearon en ocupaciones tan diversas como
estudiar la opinión pública y la propaganda, ayudar en las relaciones raciales en las fuerzas armadas,
entrenar animales para ayudar en situaciones de combate, diseñar cabinas de aviones complicados,
construir pruebas para la selección de personal y tratar con problemas clínicos de fatiga de batalla,
depresión, etc. Los psicólogos se vieron obligados a abandonar sus retiros escolares y se les animó a
aplicar sus conocimientos a los numerosos problemas que tenían entre manos. En muchos casos, este
contacto con problemas del mundo real les permitió ver lo inadecuado de sus conceptos y les brindó la
oportunidad de desarrollar nuevas y mejores ideas.
Así, la guerra tuvo una influencia saludable en muchas áreas de la psicología. Durante este período, los
factores humanos, entonces llamados ingeniería humana, llegaron a ser una disciplina propia.
Otra tendencia que se produjo aproximadamente al mismo tiempo fue la extensión del método
experimental a áreas problemáticas a las que no se había aplicado anteriormente. La psicología social
experimental y la psicología infantil experimental recibieron una atención considerable durante las décadas
de 1930 y 1940.
Psicología cognitiva: el retorno de la mente
El conductismo dominó la psicología estadounidense durante las décadas de 1930 y 1940, y debido a
que se evitó el estudio de los eventos no observables, el estudio de los procesos mentales fue
prácticamente abandonado durante este tiempo. Sin embargo, varios desarrollos en la década de 1950
reinstauraron el estudio científico de los procesos mentales superiores como un esfuerzo legítimo y factible
(aunque difícil).

Primero, los psicólogos demostraron que muchas operaciones mentales son difíciles de explicar en
términos de asociaciones condicionadas entre estímulos ambientales y respuestas (p. ej., Chomsky,
1959). Los seres humanos participan activamente en el control de la actividad mental, y la variedad y
complejidad de muchos comportamientos humanos interesantes (por ejemplo, el lenguaje, la resolución
de problemas, la creatividad) no pueden explicarse completa y satisfactoriamente mediante simples
mecanismos conductistas. Las teorías más ricas de los mecanismos mentales proporcionan medios más
poderosos para explicar las complejidades de la vida mental. El desafío actual es estudiar estos eventos
mentales no observables con métodos científicos y objetivos que vinculen las construcciones mentales
con las respuestas observables. Se han desarrollado muchas técnicas inferenciales ingeniosas para
hacerlo (véanse los capítulos 7 y 14).
La psicología cognitiva también se ha beneficiado de la tecnología moderna. Los principios de la
teoría de la información, que se tomaron prestados de la ingeniería a fines de la década de 1940,
permitieron la cuantificación de conceptos que antes se medían mal, si es que se medían (por ejemplo,
la cantidad de "información" en un estímulo). Aunque el enfoque no resolvió muchos de los problemas
tradicionales de la psicología, influyó en el desarrollo de modelos de procesamiento de información, que
representan los procesos cognitivos humanos en términos de flujo de información a través del sistema.
Estos modelos han estimulado mucha investigación.
Otra gran infl uencia de fuera de la psicología ha sido la informática.
Debido a que las computadoras son capaces de realizar tareas computacionales complejas, muchos
científicos han sugerido que la computadora puede proporcionar un modelo de la forma en que la mente
humana codifica, almacena, procesa y recupera información. El campo de la inteligencia artificial tiene
como objetivo explorar la relación entre la inteligencia humana y la de las máquinas. La informática
también ha allanado el camino para los enfoques de cognición de procesamiento distribuido paralelo
(PDP) (p. ej., Seidenberg y McClelland, 1989). Un modelo PDP consta de una red de unidades de
procesamiento simples que caen en distintas capas, con todas las unidades de procesamiento dentro de
una capa conectadas a todas las unidades de procesamiento en capas adyacentes. La realización de
modelos particulares se logra mediante simulación por computadora, y los modelos PDP se han utilizado
para simular una amplia variedad de procesos cognitivos (Balota & Cortese, 2000). Más recientemente,
el uso de enfoques cognitivos y computacionales se ha extendido a otras áreas experimentales de la
psicología, como la psicología social (p. ej., Queller & Smith, 2002).
Neurociencia cognitiva: la década del cerebro

El Congreso de los Estados Unidos declaró la década de 1990 la década del cerebro. Los psicólogos
cognitivos aprovecharon con entusiasmo la neurociencia para ampliar nuestra comprensión del
funcionamiento cognitivo (Posner, 1993; Posner y Raichle, 1994). La psicofisiología es la intersección
de la psicología y la fisiología. Dos objetivos importantes de la psicofisiología son (1) descubrir si los
fenómenos psicológicos tienen correlatos fisiológicos medibles y (2) desarrollar modelos psicológicos
plausibles derivados del conocimiento de los estados fisiológicos (Kantowitz, 1987).
El uso de medidas como la frecuencia cardíaca, la dilatación de la pupila (una parte del ojo, no de
un estudiante) y las ondas cerebrales puede ayudar al psicólogo cognitivo a investigar las propiedades
fundamentales (Jennings & Coles, 1991a). Las técnicas de imágenes cerebrales, como la resonancia
magnética funcional (fMRI, por sus siglas en inglés) , se están volviendo cada vez más populares
entre los neurocientíficos cognitivos; fMRI funciona midiendo un correlato de la actividad cerebral, a
saber, el flujo sanguíneo y la oxigenación, en respuesta a una actividad cognitiva específica (p. ej., consulte

Buckner, 2002). Por ejemplo, un tema importante en psicología cognitiva es si la capacidad
mental es limitada y, de ser así, dónde ocurre el cuello de botella mental: ¿en la percepción, la
traducción o el control motor? El psicólogo cognitivo, que sólo puede medir las relaciones de
entrada-salida, se limita a hacer inferencias a partir de medidas globales de rendimiento, como
el tiempo de reacción. Pero el neurocientífico tiene el potencial de mirar dentro de la "caja negra"
para obtener medidas intermedias que se relacionan con eventos mentales hipotéticos.
Por supuesto, la interpretación de las medidas psicofisiológicas no está exenta de riesgos.
Estos peligros se han ilustrado al relacionar el estudio de las ondas cerebrales con estudios
anteriores de frenología (Kantowitz, 1987). Los frenólogos asumieron que la mente consistía en
un conjunto de funciones mentales separadas. Cada función estaba mediada por una ubicación
física específi ca y estaba relacionada con el tamaño de las protuberancias en la cabeza.
Los "bumpólogos" modernos estudian los golpes eléctricos registrados en las cabezas e intentan
relacionar estos golpes con procesos psicológicos. Es fácil ser demasiado literal e interpretar
estas señales eléctricas como manifestaciones directas de procesos psicológicos, al igual que
los frenólogos mapearon los golpes físicos a los procesos, una empresa que ha sido
desacreditada en la psicología moderna.
Mientras uno evite la interpretación literal de los datos psicofisiológicos como un reflejo
directo de los procesos psicológicos, la neurociencia tiene mucho que ofrecer al psicólogo
cognitivo. Ya se han descubierto muchos correlatos fisiológicos útiles del comportamiento, y los
neurocientíficos están trabajando arduamente para desarrollar una mejor integración teórica del
comportamiento y la fisiología (Buckner & Tulving, 1995; Jennings & Coles, 1991b).
Especialización
Quizás la tendencia reciente más notable en psicología es la especialización. Las escuelas de
psicología tendían a abarcar todo; tenían algo que decir sobre cada fase de lo que consideraban
psicología. Por ejemplo, los conductistas no se preocuparon solo por aprender, aunque este era
su principal interés; también aplicaron sus conceptos a las áreas de pensamiento, lenguaje y
desarrollo infantil. Ahora los psicólogos ya no se identifican por escuelas sino por áreas de
interés. La mayoría de los departamentos de psicología están organizados de esta manera, al
igual que los capítulos 6 a 15 de este libro.
Los psicólogos pueden ser psicólogos sociales, psicólogos del aprendizaje animal,
psicólogos del desarrollo, psicólogos cognitivos (sensación, percepción, memoria, lenguaje,
pensamiento, procesamiento de información, etc.), psicólogos de la personalidad, etc. O los
psicólogos pueden especializarse en psicobiología, psicología clínica o psicología organizacional
o industrial. Y todas estas áreas tienen subáreas, como las que acabamos de enumerar para la
psicología cognitiva. Es muy probable que los trabajadores dentro de estos campos sepan muy
poco sobre las otras áreas. Esta tendencia hacia la especialización a menudo se considera
desafortunada, pero parece haber pocas alternativas. Tal especialización es simplemente la
marca de una ciencia madura, porque la posibilidad de que un psicólogo pueda ser conocedor
en todas las áreas de la psicología actual es pequeña.
La psicología experimental es sólo una de las cincuenta y tres divisiones de la Asociación
Americana de Psicología. Sin embargo, muchos psicólogos pertenecientes a otras áreas emplean
el método experimental en su trabajo. (Por otro lado, los miembros de algunos campos se
oponen al uso del método experimental en psicología.) La lista en la Tabla A.2 le da una idea de
la gran diversidad y especialización que se encuentra entre los actuales

.
Las divisiones de la Asociación Americana de Psicología
Número de división APA Nombre de la división APA
1. División de Psicología General División

2. de Enseñanza de la Psicología División de
3. Psicología Experimental División de Evaluación,
5. Medición y Estadística División de Neurociencia del
6. Comportamiento y Psicología Comparada División de Psicología del Desarrollo
7. Sociedad de Psicología Social y de la Personalidad: una división de la APA
8. Sociedad de Psicología Estudio de Problemas Sociales: una división de la APA División
9. de Psicología y las Artes División de Psicología Clínica División de Psicología de Consultoría
10 Sociedad de Psicología Industrial y Organizacional, Inc.: una división de la APA División de
12 Psicología Educativa División de Psicología Escolar División de Psicología de consejería División
13 de Psicólogos en el Servicio Público División de Psicología Militar División de Desarrollo y
14 Envejecimiento de Adultos División de Psicólogos de Ingeniería y Experimental Aplicada División de
15. Psicología de Rehabilitación División de Psicología del Consumidor División de Psicología Teórica y
dieciséis.
Filosófica para el Análisis Experimental del Comportamiento División de Historia de la Psicología División
17 de Psicología Comunitaria División de Psicofarmacología División de Psicoterapia División de Hipnosis
18 Psicológica División de Asuntos de la Asociación Psicológica del Estado División de Psicología
19 Humanística División de Retraso Mental y Discapacidades del Desarrollo División de Psicología Ambiental
20 y de la Población División de Psicología de la Mujer División de Psicología de la Religión División de
21 Servicios para Niños, Jóvenes y Familias División de Psicología de la Salud División de Psicoanálisis
22 División de Neuropsicología Clínica División de Psicología Estadounidense—Sociedad de Abogados
23 División de Psicólogos en Práctica Independiente División de Psicología Familiar The Society for el
24 Estudio Psicológico de Asuntos de Lesbianas y Gays Sociedad para el Estudio de Asuntos de Minorías
25 Étnicas División de Psicología de los Medios División de Psicología del Ejercicio y el Deporte División de
26 Psicología de la Paz División de Psicología de Grupo y Psicología de Grupo División de Terapia de
27 Adicciones
28
29
30
31
32.
33.
34.
35.
36.
37.
38.
39.
40
41.
42.
43.
44.
45.
46.
47.
48.
49.
50
51. La Sociedad para el Estudio Psicológico de los Hombres y la Masculinidad
52. Psicología Internacional
53. Sociedad de Psicología Clínica Infantil y Adolescente
54. Sociedad de Psicología Pediátrica
55. Sociedad Americana para el Avance de la Farmacoterapia
Nota: No hay números de división 4 u 11.

psicólogos Además de la Asociación Americana de Psicología, varias otras sociedades tienen gran
importancia para los psicólogos experimentales. La Psychonomic Society se fundó en 1958. La membresía
plena está restringida a científicos que ya hayan realizado contribuciones académicas mediante la
publicación de artículos en revistas científicas. La Psychonomic Society publica varias revistas influyentes
de psicología experimental y patrocina una importante reunión anual donde los científicos pueden
intercambiar información. La Sociedad Americana de Psicología, fundada en 1988, es la sociedad más
nueva. Sus objetivos son avanzar en la disciplina de la psicología, preservar la base científica de la
psicología, promover la comprensión pública de la ciencia psicológica y sus aplicaciones, mejorar la calidad
de la educación de posgrado y alentar el "regalo" de la psicología en el interés público. Por último, como
reflejo del reciente aumento del interés por la neurociencia cognitiva, muchos psicólogos experimentales
ahora pertenecen a la Society for Neuroscience (fundada en 1970) oa la Cognitive Neuroscience Society
(fundada en 1994).
ÿ RESUMEN
1. La psicología científi ca tiene unos cien años, más o menos técnicas podrían proporcionar información sobre temas
una década. Las raíces de la psicología se encuentran en psicológicos.
las preguntas formuladas por los filósofos durante miles de 3. Weber examinó cuánto tenía que cambiar un estímulo para
años. Las técnicas originales para el estudio experimental que un observador notara la diferencia. Descubrió que la
de la psicología fueron ideadas por físicos y fisiólogos que cantidad de cambio necesaria para una diferencia apenas
se interesaron por los temas psicológicos, en particular los perceptible (jnd) era una proporción constante de la
relacionados con la recepción de estímulos por los sentidos. magnitud del estímulo estándar, un hecho que se conoció
como la ley de Weber. Fechner
2. Cuatro de los primeros pioneros de la psicología fueron continuó el trabajo de Weber y acuñó el término psicofísica,
Helmholtz, Weber, Fechner y Ebbinghaus. En un que se ocupaba de cómo los cambios en el mundo físico
experimento temprano de tiempo de reacción, Helmholtz se relacionan con la percepción de los cambios por parte
midió la velocidad del impulso nervioso, demostrando así cómo experimental
de una persona.
ÿ TABLA A.3
Resumen de cuatro escuelas primarias de psicología
Escuela Tema en cuestion Objetivos de investigación Métodos de búsqueda
Estructuralismo Experiencia consciente Para romper la experiencia consciente Introspección analítica
en sus componentes básicos: sensaciones,

imágenes, afectos
funcionalismo La función de pro mental Estudiar los procesos mentales en su forma natural. Medidas objetivas;
Procesos y cómo ayudan contextos; para descubrir qué efectos observación informal
la gente se adapta ellos tienen e introspección

Behaviorismo Comportamiento: cómo se cambia Descripción, explicación, predicción y Medidas objetivas
bajo diferentes condiciones, control del comportamiento de comportamiento; formal
con énfasis en el aprendizaje experimentos
psicología de la gestalt Experiencia subjetiva, con Para entender los fenómenos de Informes subjetivos; alguno
énfasis en la percepción, experiencia consciente en términos de medidas de comportamiento;
memoria y pensamiento toda la experiencia (para no romper demostraciones
experiencia en categorías arbitrarias)

4. Ebbinghaus realizó los primeros experimentos sistemáticos ismo y Gestalt. Un resumen de sus características principales se
sobre la memoria. Sus métodos de investigación y hallazgos presenta en la Tabla A.3 en la página 446.
tuvieron un tremendo impacto en el campo porque demostraron La infl uencia de las escuelas sigue viva hoy en día, pero la
que incluso los procesos mentales superiores podían psicología contemporánea se divide en varios temas de interés
estudiarse experimentalmente. para los investigadores.
5. Varias escuelas diferentes de psicología surgieron entre 1890 A medida que la psicología ha madurado, el enfoque de la
y 1940. Cuatro primarias fueron estructuralismo, funcionalismo, mayoría de los psicólogos se ha vuelto cada vez más especializado.
comportamiento
ÿ TÉRMINOS CLAVE
afectos introspección
behaviorismo diferencia apenas perceptible (jnd)
Psicología cognitiva procesamiento distribuido paralelo (PDP)
dualismo psicofísica
ley de fechner psicofisiología
resonancia magnética funcional (fMRI) experimento de tiempo de reacción
funcionalismo sensación
psicología de la gestalt constancia de forma
ideas error de estímulo
imágenes estructuralismo
Teoría de la información ley de Weber
CONEXIONES WEB
Una cronología de eventos importantes en la psicología estadounidense se encuentra en:
http://www.cwu.edu/~warren/today.html
Las versiones de texto completo de los artículos psicológicos clásicos se pueden

encontrar en: http://psychclassics.yorku.ca/
Este sitio contiene muchos enlaces a sitios relacionados con la historia de la psicología:
http://elvers.stjoe.udayton.edu/history/welcome.htm

APÉNDICE B
ESTADÍSTICO
RAZONAMIENTO: UN
INTRODUCCIÓN
ESTADÍSTICA DESCRIPTIVA: CONTARLO COMO ES

Tendencia central
Medidas de dispersión
Una nota sobre el cálculo
La distribución normal
Coeficiente de correlación
ESTADÍSTICA INFERENCIAL
Muestreo
La distribución de las medias muestrales
Prueba de hipótesis
Pruebas de diferencias entre dos grupos Prueba t
Magnitud del efecto
El análisis de varianza
2
Prueba de Independencia
MAL USO DE LAS ESTADÍSTICAS

Uso de muestras pequeñas o sesgadas
Comparaciones ausentes o inapropiadas
La falacia del jugador
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
59533_18_appendixB_p448-493.indd448 448 9533_18_appendixB_p448-493.indd448 448 3/5/08 /5/08

El pensamiento estadístico algún día será tan necesario para una ciudadanía eficiente
como la capacidad de leer y escribir. (POZOS HG)
El propósito de este apéndice es darle una idea de por qué la comprensión de la estadística es crucial para
la realización e interpretación de la investigación psicológica. También prestamos atención a cómo se utiliza
el razonamiento estadístico en la investigación psicológica, aunque difícilmente podemos esperar convertirlo
en un experto estadístico al leer esta sección. Este apéndice sirve como repaso para aquellos de ustedes que
ya han tomado estadísticas. Los estudiantes nuevos en estadística pueden necesitar leer la sección varias
veces con mucho cuidado, ya que hay bastante información nueva. Es posible que ya sepa que si tuviera que
completar el trabajo de posgrado para el Ph.D. en psicología, probablemente se le pedirá que tome un mínimo
de tres cursos de estadística.
Muchos aspectos del mundo en que vivimos pueden tratarse en términos de probabilidades. No siempre
sabemos con total certeza que ocurrirán los eventos, sino que ocurrirán en una cierta proporción del tiempo o
con cierta probabilidad. Un ejemplo común es el pronóstico del tiempo. Los meteorólogos dicen que hay un
80 por ciento de posibilidades de lluvia o un 20 por ciento de posibilidades de nieve, dadas ciertas condiciones
previas. Incluso cuando se conocen las condiciones previas, es imposible predecir perfectamente el clima
futuro. Gran parte del comportamiento humano es probabilístico en el mismo sentido. Las estadísticas
inferenciales son útiles para ayudar a los psicólogos a estimar la probabilidad de que las diferencias en
grupos de observaciones entre dos condiciones se hayan producido por factores aleatorios o fortuitos.
Las estadísticas descriptivas ayudan a los psicólogos a resumir o describir las observaciones. Primero
examinamos las estadísticas descriptivas y luego pasamos a las estadísticas inferenciales.
ÿ ESTADÍSTICA DESCRIPTIVA: CONTARLO COMO ES
Cuando llevamos a cabo un experimento y medimos una variable independiente, típicamente producimos
una gran variedad de números. ¿Qué vamos a hacer con ellos? Primero, necesitamos crear un sistema y
organizarlos. No tenemos que mirar toda la gama de números producidos por los sujetos en las diferentes
condiciones del experimento; en cambio, podemos ver una versión más breve. Al resumir los datos, podemos
ver tendencias generales que de otro modo estarían ocultas por la gran variedad de números. Las estadísticas
descriptivas proporcionan esta función de organización y resumen. Los dos tipos principales son medidas de
tendencia central (la puntuación típica) y medidas de dispersión (la dispersión de los datos).
Tomemos una situación experimental hipotética. Una compañía farmacéutica ha patrocinado una prueba
de los efectos del LSD en el comportamiento de las ratas, por lo que decidimos ver cómo la droga afecta la
velocidad de carrera de las ratas. Cuarenta ratas privadas de comida han sido entrenadas para correr un
laberinto de callejones rectos por una recompensa de comida. Los asignamos aleatoriamente a dos grupos.
A un grupo, le administramos LSD por inyección y observamos el efecto sobre la velocidad con la que corren
por el callejón en busca de comida 30 minutos después de la inyección. El otro grupo se prueba de manera
similar 30 minutos después de recibir una inyección de placebo. Los siguientes son los tiempos de ejecución
para los 20 sujetos de control en segundos: 13, 11, 14, 18, 12, 14, 10, 13, 13, 16, 15, 9, 12, 20, 11, 13, 12, 17,
15 y 14. Los tiempos de ejecución para los sujetos que reciben las inyecciones de LSD

ÿ FIGURA B.1 Control
Histogramas que representan 4

las puntuaciones de 20 sujetos
en las condiciones experimentales 3
y de control del experimento
2
hipotético con LSD.
1
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Tiempo (segundos)
Experimental
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Tiempo (segundos)
son 17, 15, 16, 20, 14, 19, 14, 13, 18, 18, 26, 17, 19, 13, 16, 22, 18, 16, 18 y 9. Ahora que tenemos los
tiempos de ejecución, ¿Qué hacemos con ellos? Una cosa que podríamos querer es una representación
gráfica de los números, como en los dos histogramas que se muestran en la figura B.1.
Aquí, los tiempos de ejecución en segundos aparecen a lo largo de la abscisa (eje X), y la frecuencia con la
que ocurrió cada tiempo en las dos condiciones se muestra a lo largo de la ordenada (eje Y). Los tiempos
de ejecución para los sujetos de control se dan en el histograma superior; los de los sujetos experimentales
están representados en la parte inferior. Otra forma de representar la misma información es usar un polígono
de frecuencia. Su construcción es equivalente a la del histograma; puede visualizar este tipo de gráfico
conectando los puntos medios de las barras en el histograma. Los polígonos de frecuencia idealizados
aparecen más adelante en el apéndice (en la Figura B.2). En ambas condiciones de la Figura B.1, el mayor
número de puntajes ocurre en el medio; tienden a colarse hacia los extremos. Esto es más obvio para el
control que para los sujetos experimentales. Además, los tiempos del grupo experimental tienden a ser
mayores que los del grupo de control. Tanto el histograma como el polígono de frecuencias son tipos de
distribuciones de frecuencia. Ayudan a sistematizar un poco los datos, pero hay descripciones resumidas
más eficientes.
Tendencia central
La descripción resumida más común de los datos es alguna medida de tendencia central que, como implica
el término, indica el centro de la distribución de puntuaciones. Con mucho, la medida de tendencia central
más típica en la investigación psicológica es la media aritmética. La media (X¯) es simplemente la suma de
todas las puntuaciones
¯ (X) dividida por el número de puntuaciones (n), o XX/ n. Es lo que la mayoría de la
gente considera como el promedio de un conjunto de

números, aunque técnicamente el término promedio se aplica a cualquier medida de tendencia
central. Las sumas de los tiempos de ejecución para las condiciones experimentales y de control de
nuestro experimento hipotético fueron 338 y 272 segundos, respectivamente. Como hubo 20
observaciones en cada condición, las medias son 16,9 segundos para la condición experimental y
13,6 para el control.
La media es la medida de tendencia central más útil y casi todas las estadísticas inferenciales,
a las que llegaremos más adelante, se basan en ella. Por lo tanto, esta estadística se utiliza siempre
que sea posible. Sin embargo, a veces se utiliza otra medida de tendencia central: la mediana. Es
el puntaje por encima del cual se encuentra la mitad de la distribución y por debajo del cual se
encuentra la otra mitad. La mediana, entonces, es el punto medio de la distribución. Cuando el
número de puntajes (n) en la distribución es impar, como 27, la mediana es el decimocuarto puntaje
desde abajo o desde arriba, ya que ese puntaje divide la distribución en dos grupos de trece
puntajes. Cuando el número de puntajes es un número par, la mediana es la media aritmética de los
dos puntajes centrales, si los puntajes no están empatados. Entonces, la mediana de las
puntuaciones 66, 70, 72, 76, 80 y 96 es (72 76)/2, o 74. Cuando, como sucede a menudo, las dos
puntuaciones intermedias están empatadas, como en la distribución de puntuaciones de la
experimento hipotético de LSD, la convención es designar la mediana como la proporción apropiada
de la distancia entre los límites de la puntuación particular, donde los límites son la mitad de la
puntuación por encima y por debajo de la puntuación empatada. Esto debería quedar claro con un
ejemplo. Considere las distribuciones de puntajes de nuestro experimento. Si organiza los 20
tiempos de ejecución de control de menor a mayor, descubrirá que las puntuaciones octava, novena,
décima y undécima son todas 13. En tales condiciones, la décima puntuación se considera la
mediana. Se considera que está a las tres cuartas partes de la distancia entre los límites de 12,5 y
13,5. Entonces, la mediana sería 12.5 0.75, o 13.25, para los sujetos de control. Por el mismo
razonamiento (y debería probarlo usted mismo), encontramos que la mediana para los sujetos experim
¿Por qué se usa la mediana? La razón principal es que tiene la propiedad (deseable) de ser
insensible a puntuaciones extremas. En la distribución de puntajes de 66, 70, 72, 76, 80 y 96, la
mediana de la distribución permanecería exactamente igual si el puntaje más bajo fuera 1 en lugar
de 66, o el puntaje más alto fuera 1223 en lugar de 96. El media, por otro lado, diferiría ampliamente
con estos otros puntajes. A menudo, este beneficio puede ser extremadamente útil para resumir
datos del mundo real. En nuestro experimento con LSD, suponga que una de las ratas que recibió
LSD se detuvo en la mitad del callejón para examinar una característica particularmente interesante
de la pista antes de continuar su camino hacia la meta y, por lo tanto, su tiempo para completar la
pista fue de 45 minutos. , o 2.700 segundos.
Si esta puntuación reemplazara la puntuación de 26 segundos en la distribución original, la media
pasaría de 16,9 segundos a 150,6, o de 3,30 segundos más que la media de control a 137,0
segundos más. Esto se debe únicamente a una puntuación muy desviada: en tales casos, los
investigadores suelen utilizar la puntuación mediana en lugar de la media para representar la
tendencia central. El uso de la media puede dar una estimación no representativa de la tendencia
central debido a la gran infl uencia de la puntuación única. Sin embargo, el uso de la mediana puede
limitar severamente cualquier prueba estadística que se pueda aplicar a los datos.
Medidas de dispersión
Las medidas de tendencia central indican el centro de las puntuaciones, mientras que las medidas
de dispersión indican cómo se distribuyen las puntuaciones alrededor del centro. Al decidir sobre
una medida de dispersión, queremos proporcionar un número que refleje la cantidad de dispersión que

ÿ TABLA B.1
Cálculo de las desviaciones medias y las desviaciones

medias absolutas de dos conjuntos de puntuaciones. La suma
de las desviaciones (diferencias) al calcular la desviación media
es cero, por lo que es necesario utilizar la desviación media absoluta
Grupo de control Grupo experimental
X ( XX ) |X X | X ( XX ) |X X |
9 4.60 4.60 9 7.90 7.90

10 3.60 3.60 13 3.90 3.90
11 2.60 2.60 13 3.90 3.90
11 2.60 2.60 14 2.90 2.90
12 1.60 1.60 14 2.90 2.90
12 1.60 1.60 15 1,90 1,90
12 1.60 1.60 dieciséis 0.90 0.90
13 0,60 0,60 dieciséis 0.90 0.90
13 0,60 0,60 dieciséis 0.90 0.90
13 0,60 0,60 17 0.10 0.10
13 0,60 0,60 17 0.10 0.10
14 0.40 0.40 18 1.10 1.10
14 0.40 0.40 18 1.10 1.10
14 0.40 0.40 18 1.10 1.10
15 1.40 1.40 18 1.10 1.10
15 1.40 1.40 19 2.10 2.10
dieciséis 2.40 2.40 19 2.10 2.10
17 3.40 3.40 20 3.10 3.10
18 4.40 4.40 22 5.10 5.10
20 6.40 6.40 26 9.10 9.10
X272 _ Total 0.0 Total 41,20 X338 _ Total 0.00 Total 52,20
X¯ 13,60 X¯ 16,90
41.20 52.20
Desviación media absoluta 2.06 Desviación media absoluta 2.61
20 20
los puntajes se exhiben en torno a alguna medida de tendencia central, generalmente la media.
Una de esas medidas que sería apropiada es la desviación media. Esto se calcula tomando la
diferencia entre la media y cada puntaje en una distribución, sumando estas diferencias y luego
dividiendo por el número de puntajes. Sin embargo, en realidad es necesario tomar la diferencia
absoluta media (es decir, ignorar el signo de la diferencia: si la puntuación es mayor o menor
que la media). La razón es que la suma de las desviaciones de las puntuaciones con respecto
a la media siempre es cero, una característica definitoria de la media (ver Tabla B.1). Por lo
tanto, la desviación media debe ser la desviación media absoluta. Las desviaciones medias
para nuestras condiciones experimentales hipotéticas en el experimento LSD se calculan en la Tabla
El símbolo indica el valor absoluto de un número: 6 6.
La desviación media absoluta de un conjunto de puntajes es una medida adecuada de
dispersión y se basa en la misma lógica involucrada en encontrar la media de una distribución.
Sin embargo, la desviación estándar y la varianza (definidas más adelante) son preferibles a la
desviación media porque tienen propiedades matemáticas que las hacen mucho más útiles en
cálculos estadísticos más avanzados. La lógica detrás de su cálculo es bastante similar a la de
la desviación media, razón por la cual hemos considerado aquí la desviación media. Al calcular
la desviación media, tuvimos que tomar el valor absoluto de la diferencia de cada puntuación
con respecto a la media, para que estas diferencias no sumaran

hasta cero En lugar de tomar la diferencia absoluta, podríamos habernos deshecho de los problemáticos
números negativos elevando al cuadrado las diferencias. Esto es exactamente lo que se hace al calcular la
varianza y la desviación estándar de una distribución.
La varianza de una distribución se define como la suma de las desviaciones al cuadrado de la media,
dividida por el número de puntajes. En otras palabras, se toma la diferencia entre cada puntuación y la media
y se eleva al cuadrado; luego, todos estos valores se suman y se dividen por el número de puntajes. La
siguiente es la fórmula para la varianza:
_
2
ÿ( ÿXX
)
s2 = (B.1)
norte
donde s 2
representa la varianza, X las puntuaciones individuales, X¯ la media y n el número de
puntuaciones u observaciones. Aunque la varianza es un número útil, describe la dispersión en unidades al
cuadrado (tiempos de ejecución al cuadrado en este ejemplo), lo que a menudo no es muy útil. Para volver a
la unidad de medida original, todo lo que tenemos que hacer es sacar la raíz cuadrada de la varianza. La
desviación estándar resulta de sacar la raíz cuadrada de la varianza y se representa por s (algunos textos
la denotan por sd). Desde s
es la unidad de medida original, esta y la media se presentan juntas para describir una distribución de
puntajes. Como se verá más adelante, la varianza se usa principalmente para calcular otras estadísticas,
como F, que es una estadística inferencial.
_
2
ÿ( ÿXX
) (B.2)
s =
norte
El cálculo de las desviaciones estándar para el control y las condiciones experimentales del experimento LSD
por el método de desviación media se ilustra en la Tabla B.2.
Las fórmulas para la varianza y la desviación estándar de una distribución dadas en las Ecuaciones B.1
y B.2 son bastante engorrosas; en la práctica, se utilizan fórmulas de cálculo equivalentes. La fórmula de
cálculo de la desviación estándar es
2 _
ÿ X 2
s = ÿ
X (B.3)
norte
donde X2 es la suma de los cuadrados de todos los puntajes, X¯ es la media de la distribución y n es el

número de puntajes. De manera similar, la fórmula computacional para la varianza es
2 _
ÿ X
s2 = ÿ
X 2
(B.4)
norte
El valor en cada caso es el mismo que se obtiene cuando se utiliza la fórmula de definición.
Al describir una serie de datos, los psicólogos suelen presentar dos estadísticas descriptivas, la media
y la desviación estándar. Aunque existen otras medidas de tendencia central y dispersión, éstas son más
útiles para fines descriptivos. La varianza se usa ampliamente, como veremos, en estadística inferencial.
Una nota sobre el cálculo
A lo largo de este apéndice, ilustramos los procedimientos estadísticos con cálculos detallados, como se
hace en la Tabla B.2. Hacemos esto con la esperanza de que la lógica detrás de los cálculos se aclare. Sin
embargo, es muy posible que nunca tenga que

ÿ TABLA B.2
Cálculo de la Desviación Estándar, S, para las Condiciones Experimentales

y de Control por el Método de Desviación Media.
Grupo de control Grupo experimental
X ( XX ) ( XX )2 X ( XX ) ( XX )2
9 4.60 21.16 9 7.90 62.41

10 3.60 12.96 13 3.90 15.21
11 2.60 6.76 13 3.90 15.21
11 2.60 6.76 14 2.90 8.41
12 1.60 2.56 14 2.90 8.41
12 1.60 2.56 15 1.90 3.61
12 1.60 2.56 dieciséis 0.90 0.81
13 0,60 0.36 dieciséis 0.90 0.81
13 0,60 0.36 dieciséis 0.90 0.81
13 0,60 0.36 17 0.10 0.01
13 0,60 0.36 17 0.10 0.01

14 0.40 0.16 18 1.10 1.21
14 0.40 0.16 18 1.10 1.21
14 0.40 0.16 18 1.10 1.21
15 1.40 1.96 18 1.10 1.21
15 1.40 1.96 19 2.10 4.41
dieciséis 2.40 5.76 19 2.10 4.41
17 3.40 11.56 20 3.10 9.61
18 4.40 19.36 22 5.10 26.01
20 6.40 40.96 26 9.10 82.81
X 272 X¯ Total 0.00 (X X¯) 138.80 X338 _ Total 0.00 (X X¯) 2 247.80
13,60 X¯ 16,90
_ _
2 2
ÿ( ÿXX
) ÿ( ÿXX
)
s= s=
norte norte
.
138 80 .
247 80
s= s=
20 20
$ 2.63 3,52 _
trabajar a través de un procedimiento estadístico paso a paso. Muchas calculadoras y computadoras

calcularán las estadísticas por usted. A menudo, todo lo que necesita hacer es ingresar los datos en
la calculadora o computadora; con unos pocos comandos adicionales, se determinarán los resultados.
Las computadoras son populares para los análisis estadísticos porque son rápidas y no cometen
errores a menos que ingrese los datos incorrectamente o seleccione el programa equivocado.
La distribución normal
Los gráficos de los puntajes del experimento hipotético de LSD en la figura B.1 muestran que los
puntajes se acumulan en el medio pero disminuyen hacia los extremos (colas) de la distribución de
puntajes. Aunque estos números son hipotéticos, este tipo de distribución tiene una propiedad que
ocurre con la mayoría de las medidas de comportamiento. Es decir, para la mayoría de los fenómenos
que se miden, las puntuaciones se agrupan en el centro de la distribución. Esta configuración se
denomina curva normal, un ejemplo de la cual se presenta en la Figura B.2 (la curva

Media y mediana
A
B
Frecuencia
Puntaje
ÿ FIGURA B.2
Tres ejemplos de la curva normal que difieren en la variabilidad. C tiene la mayor

variabilidad y A la menor. La curva normal es una distribución simétrica en la que la media
y la mediana tienen el mismo valor.
etiquetado B). Cuando se colocan en un gráfico, los datos psicológicos suelen ser más numerosos en el
medio del conjunto de puntajes; disminuyen en frecuencia con la distancia desde el centro de una manera
aproximadamente simétrica. Una puntuación de 10 puntos por debajo del centro de la distribución ocurre
con tanta frecuencia como una puntuación de 10 puntos por encima del centro.
Las tres curvas que se muestran en la Figura B.2 son todas simétricas. En tales distribuciones de
puntajes, la media y la mediana de la distribución caen en el mismo punto o puntaje.
Las curvas con la misma media y mediana pueden diferir en su variabilidad, al igual que las curvas de la
Figura B.2. La curva alta y delgada etiquetada como A tendría una desviación estándar más pequeña
que las otras dos. De manera similar, la curva amplia y plana (C) tendría una desviación estándar mayor
que las otras dos.
La curva normal tiene una propiedad muy útil. Resulta que una proporción específi ca de puntajes
cae debajo de cada parte de la curva normal. Esta característica se ilustra en la Figura B.3.
A cada lado de la curva normal de la figura B.3, hay un punto en el que la curva invierte ligeramente su
dirección; comienza a doblarse hacia afuera más. Esto se llama el punto de inflexión.
El punto de inflexión en la curva es siempre una desviación estándar de la media. De hecho, la curva
normal tiene la propiedad útil de que proporciones específicas de la distribución de puntajes que
representa están contenidas dentro de áreas específicas de la curva misma. Alrededor del 68 por ciento
de todos los puntajes están contenidos dentro de una desviación estándar de la media (34 por ciento en
cada lado). De manera similar, casi el 96 por ciento de los puntajes están dentro de dos desviaciones
estándar de la media, y el 99.74 por ciento de los puntajes están dentro de tres desviaciones estándar.
El porcentaje en cada área se muestra en la Figura B.3.
Esta propiedad de las curvas normales es extremadamente útil: si conocemos la puntuación de un
individuo y la media y la desviación estándar en la distribución de puntuaciones, también

Punto de inflexión Punto de inflexión
2,14% 2,14%
0,13% 0,13%
13,59% 34,13% 34,13% 13,59%
–4 –3 –2 –1 0 +1 +2 +3 +4
Desviaciones estándar o
Unidades de puntuación estándar (z)
ÿ FIGURA B.3
Proporciones de puntajes en áreas específi cas bajo la curva normal. Los puntos de inflexión
están a una desviación estándar de la media.
conocer el rango relativo de la persona. Por ejemplo, la mayoría de las pruebas de coeficiente intelectual están
diseñadas para que la media de la población sea 100 y la desviación estándar sea 15. Si una persona tiene un
coeficiente intelectual de 115, sabemos que obtuvo una puntuación superior al 84 por ciento de todas las personas en
la prueba ( 50 por ciento de las personas por debajo de la media y 34 por ciento por encima). Del mismo modo, una
persona con un coeficiente intelectual de 130 ha obtenido una puntuación superior a casi el 98 % de todas las personas,
y una persona con un coeficiente intelectual de 145 ha obtenido una puntuación superior al 99,87 % de la población.
Muchas distribuciones de puntajes en datos psicológicos son, o al menos se supone que son, normales. Es
común comparar puntajes a través de distribuciones normales con diferentes medias y varianzas en términos de
puntajes estándar o puntajes z. Esta es simplemente la diferencia entre una puntuación individual y la media,
expresada en unidades de desviaciones estándar. Entonces, un CI de 115 se traduce en una puntuación z de 1,00, es
decir, [115 – 100]/15, y un CI de 78 se traduce en una puntuación z de ÿ1,47, es decir, [78 – 100]/15. Los puntajes
estándar son útiles porque permiten la comparación de los rangos relativos de puntajes para las personas en
distribuciones en las que las medias y las desviaciones estándar varían mucho. Las calificaciones de los cursos deben
calcularse en términos de puntajes z si las medias y las desviaciones estándar de los puntajes varían mucho de una
prueba a otra. Por lo tanto, el rango final de una persona en la clase se calcula más fielmente encontrando la media de
las puntuaciones z que encontrando la media de las puntuaciones brutas de las pruebas.
Cuando se dice que los datos en un experimento u otro se distribuyen normalmente,

significa que si se grafican, tenderán a formar una distribución normal. Así, normal, tal como se utiliza en la investigación
psicológica, suele referirse a un tipo de distribución, no a un juicio de valor sobre la bondad o maldad de las puntuaciones.
Coeficiente de correlación
En el Capítulo 2, describimos la investigación correlacional. El propósito de la investigación correlacional es ver cómo

dos o más atributos de un organismo varían juntos. La fuerza y la dirección de una correlación se determinan mediante
el cálculo de un coeficiente de correlación.
Consideraremos solo uno: el coeficiente de correlación producto-momento de Pearson, o r de Pearson . En el
Cuadro B.1 se muestra la fórmula de cálculo para r, utilizando los datos hipotéticos que relacionan el tamaño de la
cabeza con el rendimiento de la memoria discutidos en el Capítulo 2.

Recuadro B.1
Informática
Llamemos a un conjunto de números en la tabla B.3. puntajes X y el otro conjunto de puntajes Y.
pearson _
Por ejemplo, los tamaños de la cabeza pueden ser puntajes X y las palabras recordadas puntajes
Y. La fórmula para calcular Pearson r a partir de las puntuaciones brutas en los paneles (a), (b) o
(c) de la tabla 2.1 es
n ÿXY XY)(ÿ )
ÿ (ÿ
=
2 2 22 (B.5)
ÿ XX
ÿ ÿ nY
(ÿ )Ynorte
ÿ ÿ ÿÿ ÿ ÿ (ÿ ) ÿ ÿÿ
La n se refiere al número de sujetos sobre los que se toman observaciones (aquí, 10); los
términos X e Y son los totales de las puntuaciones X e Y , respectivamente; X2 e Y2 son
la suma de todos los valores de X (o Y ) después de elevarlos al cuadrado; y (X)2 y
(Y)2 son el total de todos los valores de X o Y con todo el total o suma al cuadrado. Esto
deja el valor XY, o la suma de los productos cruzados.
ÿ TABLA B.3
Cálculo de Pearson r para los datos de la primera (a) columna de

la tabla 2.1, mediante la fórmula de puntuación bruta (ecuación B.5).
X Y
Tema Tamaño de la cabeza Palabras

Número (cm) X2 Retirado Y2 X.Y
1 50.8 2580.64 17 289 863.60

2 63.5 4032.25 21 441 1330.50
3 45.7 2088.49 dieciséis 256 731.20
4 25.4 645.16 11 121 279.40
5 29.2 852.64 9 81 262.80
6 49.5 2450.25 15 225 742.50
7 38.1 1451.61 13 169 495.30
8 30.5 930.25 12 144 366.00
9 35.6 1267.36 14 196 498.40
10 58.4 3410.56 23 529 1343.20
norte 10 X 426.70 X2 19.709,21 ÿ ÿ Y 151 Y2 2451 XY 6915,90
n XY XY)
(ÿ )(ÿ
r =
2 2 22
ÿ nÿ XX
ÿ (ÿnY
) ÿY ÿ ÿÿ ÿ ÿ ÿ (ÿ ) ÿ 2ÿ
( 6915. 90 )426
( 10 . )(
ÿ 70 151 )
r=
2 2
ÿ ÿ( 10 . ) - ( 426 .70 )
( ) 19 .709 21 ( 10
ÿ (ÿ ÿÿ( ) 2451 )151
ÿ ) ÿÿ
69 ,.159
,. 00 64 431 70
ÿ
r=
[197 ,.092
,. ][10 182 072 89
ÿ
24 ,510 22 801
ÿ
, ]
4727 30
.
. ,.
019 21 1709 [ ][ ] = r = 4727 30 15
25 ,667 82
, 9 89 .
4727 30
.
r=
5066 34
.
r 0.93
continuado

Recuadro B.1
Esto se obtiene de forma muy sencilla multiplicando cada valor de X por su correspondiente Y
continuado
y luego sumando estos productos. Puede ver otras fórmulas para el cálculo de Pearson r
además de la fórmula de puntuación bruta en la ecuación B.5, pero serán equivalentes (en
general) a la que se presenta aquí. En la tabla B.3 se presenta una ilustración de cómo se
calcula el r de Pearson utilizando esta fórmula de puntuación bruta utilizando los datos de la
columna (a) de la tabla 2.1 (capítulo 2, página 37). Debe tratar de calcular los valores de
Pearson r para los paneles (b) y (c), para asegurarse de que entiende cómo calcular los
valores y obtener una idea intuitiva del concepto de correlación. Los valores de r se dan debajo
de las columnas correspondientes en la Tabla 2.1.
ÿ ESTADÍSTICA INFERENCIAL
Las estadísticas descriptivas conducen a un resumen de los resultados del experimento con LSD de la
siguiente manera: el tiempo medio de ejecución para el grupo de control fue de 13,6 segundos, con
una desviación estándar de 2,63, mientras que los sujetos experimentales inyectados con LSD tuvieron
una media de 16,9 segundos y una desviación estándar de 3.52. ¿Deberíamos tomar en serio la
diferencia de 3,3 segundos entre los tiempos medios de ejecución? Tal vez se deba simplemente a
factores aleatorios, como un error de medición o el hecho de que algunas ratas en el grupo de control
tuvieron un día particularmente bueno y, por lo tanto, tenían ganas de correr un poco más rápido. ¿Qué
tan grande debe ser la diferencia para que concluyamos que es poco probable que haya ocurrido solo
por casualidad? La estadística inferencial se utiliza para responder a esta pregunta.
El procedimiento no es demasiado complicado. Elegimos una prueba estadística apropiada para
la situación experimental, realizamos algunos cálculos sencillos en una calculadora (o computadora) y
luego consultamos una tabla especial. La tabla nos informa de la probabilidad de que la diferencia que
hemos encontrado entre nuestras condiciones sea resultado de factores aleatorios.
Si es suficientemente improbable que haya ocurrido por casualidad, concluimos que la diferencia es
estadísticamente significativa. Pero, aunque los procedimientos computacionales reales suelen ser
bastante simples, es necesario comprender la lógica detrás de ellos para poder apreciar cómo se
realizan las inferencias estadísticas.
Muestreo
Una población es un conjunto completo de medidas (o individuos u objetos) que tienen alguna
característica observable común. Ejemplos de poblaciones son todos los ciudadanos estadounidenses
en edad de votar y todas las ratas albinas que han recibido inyecciones de LSD. Es imposible estudiar
a toda la población en cada caso. Si pudiéramos medir la velocidad de carrera de toda la población de
ratas después de una inyección de LSD o una inyección de una sustancia químicamente inerte,
entonces sabríamos mejor cuáles fueron los efectos del LSD, ya que habríamos medido a toda la
población. (Cualquier diferencia podría, por supuesto, atribuirse a un error de medición.) Pero dado que
casi siempre es poco práctico medir una población completa, debemos tomar muestras de ella. Una
muestra es un subconjunto de una población; esto es casi siempre lo que estamos examinando cuando
comparamos las condiciones experimentales. Hacemos inferencias estadísticas, luego sacamos una
conclusión que se basa

sólo en una muestra de observaciones sobre toda una población. Realmente queremos saber acerca de los
efectos del LSD y la sustancia inerte en las ratas en general, y esperamos sacar esta conclusión de una
muestra de, digamos, 20 ratas en cada condición. El recuadro B.2 contiene algunos de los parámetros
utilizados con medidas de población y las estadísticas utilizadas con datos de muestra.
Las muestras deben ser siempre lo más representativas posible de la población objeto de estudio. Una
forma de lograr esto es a través del muestreo aleatorio, mediante el cual los miembros se eligen de la
población por algún medio completamente arbitrario. (El muestreo aleatorio a menudo se lleva a cabo usando
una tabla de números aleatorios, como la de la Tabla H en el Apéndice C). Técnicamente, solo podemos
generalizar a la población de la que hemos muestreado, aunque si se toma literalmente, esto haría que la
investigación experimental apenas valiera la pena. Si recibimos 50 ratas de una casa de suministros para
nuestro experimento hipotético, seleccionamos una muestra de 40 y las asignamos al azar a las dos
condiciones del experimento, ¿serían verdaderas nuestras conclusiones solo para la población de 50 ratas?
Tal vez técnicamente, pero a nadie le importaría el resultado si fuera así, y nadie habría perdido el tiempo
haciendo el experimento.
Al menos querríamos suponer que los resultados son característicos de esa cepa de ratas. En la práctica, los
psicólogos asumen que sus resultados se generalizan más ampliamente que la población limitada de la que
tomaron muestras para su experimento. Consideramos el problema de la generalidad de los resultados y la
base de esta suposición con más detalle en los capítulos 10 y 14.
Recuadro B.2
Estadístico Las características de una población de puntajes se denominan parámetros, mientras que las
Notación características de una muestra de puntajes extraída de una gran población son estadísticas. La
media de toda una población de puntajes es un parámetro, y la media de una muestra es una
estadística. Para mantener estas distinciones, se utilizan diferentes símbolos para los parámetros
de población y las estadísticas de muestra. Algunos de los símbolos más frecuentes se enumeran
aquí. Algunos han sido explicados; los otros se discuten en las próximas páginas.
N = número de puntajes en una población
n = número de puntajes en una muestra
µ = media de la población (µ se pronuncia “en”)
X¯ = media muestral
2
= varianza de la población (se pronuncia
_
“sigma”)
2
ÿ( ÿ ) XX
s2 = varianza muestral _
norte 2
ÿ( ÿ ) XX
sˆ2 = estimación no sesgada de la varianza de la población
norte
ÿ
1
= desviación estándar de la población
s = desviación estándar de la muestra
sˆ = desviación estándar de la muestra basada en la estimación de la varianza no sesgada
= error estándar de la media

X
norte
s
sˆx - = error estándar estimado de la media,
norte

La distribución de las medias muestrales
Una forma de preguntarnos sobre la confiabilidad de nuestro experimento hipotético sería

realizarlo repetidamente con nuevos grupos de ratas. Por supuesto, sería muy poco probable
que obtuviéramos exactamente los mismos tiempos medios de ejecución para las condiciones
experimentales y de control en estas réplicas. Las medias en segundos para las condiciones
experimentales y de control en cuatro repeticiones podrían ser 17,9 y 12,5, 16,0 y 13,4, 16,6 y
14,5 y 15,4 y 15,1. Dado que las ratas experimentales que reciben LSD siempre corren más
lentamente que las ratas de control, esto aumentaría nuestra confianza en el hallazgo original,
aunque la diferencia es bastante pequeña en la última réplica. Si repitiéramos el experimento de
esta manera y graficamos la distribución de las medias muestrales obtenidas en las dos
condiciones, estas distribuciones serían normales y tendrían todas las características de una
distribución normal, como una cierta proporción de puntajes que caen dentro de una porción de
la curva Este resultado útil también ocurriría si encontramos la diferencia entre las dos medias
en cada experimento y graficamos estas diferencias. Debido a que las diferencias se distribuyen
normalmente, podemos determinar con qué frecuencia ocurrirá una diferencia media particular.
Esta habilidad proporciona una gran cantidad de información y es la base de la estadística inferencia
Para darle una mejor idea del concepto de la distribución de las medias muestrales,
tomemos prestado un ejemplo de una demostración de clase de Horowitz (1974, pp. 179-182).
Horowitz fabricó una población de 1000 puntajes distribuidos normalmente para que se
conocieran la media y la desviación estándar de toda la población. Esto casi nunca es el caso
en situaciones reales de investigación, por supuesto. Sus 1000 puntuaciones oscilaron entre 0
y 100 con una media de 50 y una desviación estándar de 15,8. Los puntajes se enumeraron en
1000 hojas de papel y se colocaron en un contenedor. Horowitz hizo que 96 estudiantes tomaran
muestras de 10 tiras del contenedor y calcularan la media. En cada extracción del contenedor,
se extraía un recibo, se anotaba su número y luego se volvía a colocar el recibo. Luego, las tiras
se mezclaron un poco en el contenedor y se extrajo otra tira, y así sucesivamente. Después de
que cada estudiante calculó la media de las 10 calificaciones de su muestra, Horowitz recopiló
las 96 y trazó la distribución de las medias de la muestra, que se representa en la Tabla B.4.
Los intervalos entre los cuales pueden caer las medias se muestran a la izquierda; el número
de medias que caen dentro de cada intervalo se muestra a la derecha. La distribución es casi
perfectamente simétrica, con casi tantas puntuaciones en cualquier intervalo a cierta distancia
por debajo de la verdadera media de la población (50) como por encima de ella. Además, la
media de las 96 medias muestrales (49,99) está bastante cerca de la media real de la población
(50). Pero lo principal que muestra la Tabla B.4 es la gran variabilidad entre las medias
muestrales. Aunque cada muestra de 10 fue supuestamente aleatoria y no sesgada de ninguna
manera, una muestra tuvo una media de 37,8, mientras que otra tuvo una media de 62,3.
Obviamente, estos son medios muy dispares, a pesar de que fueron muestreados de la misma
población. Si estuviera haciendo un experimento y encontrara dos medias muestrales muy
diferentes, y estuviera tratando de decidir si provienen de la misma distribución subyacente o de
dos distribuciones diferentes, podría pensar que una diferencia tan grande indicaría que
provienen de distribuciones diferentes. . En otras palabras, pensaría que el tratamiento
experimental produjo puntajes significativamente diferentes (de una distribución diferente) de los
puntajes de control. Por lo general, esta es una buena regla: cuanto mayor sea la diferencia
entre las medias en las condiciones, es más probable que las medias sean confiablemente
diferentes, pero como hemos visto aquí, incluso el muestreo aleatorio de una distribución
conocida puede producir medias de muestra que difieren mucho de entre sí y de la verdadera
media poblacional, que en este caso se conoce. Tenga presente esta lección mientras reflexiona sob

ÿ TABLA B.4
La distribución de las medias muestrales para

las 96 muestras tomadas por los estudiantes de la clase
de Horowitz. La media de cada muestra se basó en 10
observaciones. Después de Elements of Statistics for
Psychology and Education (Tabla 8.1), por LM Horowitz,
1974, Nueva York: Mcgraw-Hill.
Intervalo Frecuencia
62,0–63,9 1
60,0–61,9 1
58,0–59,9 3
56,0–57,9 7
54,0–55,9 9
52,0–53,9 12
50,0–51,9 15 Media de las medias muestrales 49,99
48,0–49,9 15 Desviación estándar (s) de
46,0–47,9 13 muestra media 5.01
44,0–45,9 9
42,0–43,9 6
40,0–41,9 3
38,0–39,9 1
36,0–37,9 1
96 muestras
¿Es realmente fiable la diferencia de 3,3 segundos entre la media experimental y la de control en
nuestro experimento hipotético con LSD?
El error estándar de la media El error estándar de la media es el stan

Desviación estándar de una distribución de medias muestrales. En los datos de la Tabla B.4, es 5.01.
El error estándar de la media nos da una idea de la cantidad de variabilidad en la distribución de las
medias muestrales, o qué tan probable es que el valor de cualquier media muestral en particular sea
erróneo. Los errores estándar grandes indican una gran variabilidad, mientras que los pequeños nos
dicen que es probable que cualquier media muestral en particular esté bastante cerca de la media
poblacional real. Por lo tanto, el error estándar de la media es un número muy útil.
Quizás se pregunte por qué nos molestamos en informarle sobre el error estándar de la media si,
para calcularlo, debe repetir un experimento varias veces para obtener la distribución de las medias
de la muestra y luego calcular su desviación estándar. Afortunadamente, no tienes que repetirlo. La
fórmula para encontrar el error estándar de la media (representada por ) es simplemente la desviación
estándar de la población
X () dividida por la raíz cuadrada del número de observaciones ( ) N .
= (B.6)
X
norte
Ahora, si todavía está con nosotros, es posible que esté pensando: “Fantástico. ¿De qué me sirve
esto, ya que la desviación estándar de la población, el numerador en la Ecuación B.6, nunca se
conoce?” Eso también se les ha ocurrido a los estadísticos, por lo que han ideado un método para
estimar la desviación estándar de la población a partir de la desviación estándar de una muestra. Si
observa la Ecuación B.2, donde la fórmula para la desviación estándar

ÿ TABLA B.5
La distribución de las medias muestrales para

las 96 muestras tomadas por los estudiantes cuando el
tamaño de la muestra (N) es 50. La distribución vuelve a
ser normal, como en la tabla B.4, pero cuando cada
muestra se basa en un tamaño de muestra mayor, como
aquí , la variabilidad de la distribución (representada por
el error estándar de la media) es mucho menor. Después
de Elements of Statistics for Psychology and Education
(Tabla 8.2), por LM Horow itz, 1974, Nueva York: Mcgraw-Hill.
Intervalo Frecuencia
55,0–55,9 1
54,0–54,9 3
53,0–53,9 5
52,0–52,9 9
51,0–51,9 13
50,0–50,9 17
49,0–49,9 dieciséis
Media de medias muestrales- -49.95
48,0–48,9 14 Desviación estándar (sˆ) de las medias muestrales- -2.23
47,0–47,9 9
46,0–46,9 6
45,0–45,9 2
44,0–44,9 1
96 muestras
de una (s) muestra (s) , y simplemente reemplace la n en el denominador por n 1, entonces tiene la
, para
fórmula para obtener una estimación imparcial de la desviación estándar de laencontrar
población.elLa
error
ecuación
estándar de distribución de medias muestrales (llamado error estándar de la media, o ˆs
) es
X
ˆ
ˆ s
Estimado s== (B.7)
XX
norte
Obviamente, queremos que el error estándar de la media sea lo más pequeño posible, ya que
representa el error que tenemos al suponer que nuestra media muestral representa la media
poblacional. Las ecuaciones B.6 y B.7 nos dicen cómo hacer esto: aumentar el tamaño de la muestra,
n, lo que aumenta el denominador en las ecuaciones. Cuanto mayor sea n, el tamaño de la muestra,
Cuanto menor sea el error estándar de la media, la poblaciónX es, . Esto no debería ser una sorpresa. Si el
involucra 1,000 puntajes, la media de la muestra debe estar más cerca de la media de la población si
hay 500 observaciones en la muestra que si solo hay 10.
Horowitz llevó este punto a los 96 estudiantes de su clase al pedirles que repitieran el ejercicio
de sacar boletas de la población de 1000 puntajes y calcular la media nuevamente; pero esta vez les
pidió que muestrearan 50 hojas, en lugar de solo 10. La distribución resultante de las medias muestrales
se da en la tabla B.5. Esta vez, con muestras más grandes, hay mucha menos variabilidad en las
medias muestrales obtenidas por los estudiantes. Están mucho más cerca de la media poblacional real
de 50. La desviación estándar de la distribución de las medias muestrales, o el error estándar de la
media, es 2,23, a diferencia de 5,01 cuando el tamaño de la muestra era solo 10. Si n = 100 en una
muestra de las 1000 puntuaciones, el error estándar

de la media sería 1,59; con una muestra de 500 sería 0,71; y con 1.000 puntuaciones en una
muestra, sería sólo 0,50. (Estos se calcularon a partir de la Ecuación B.6, ya que la desviación
estándar, , se conoce paramedia
toda la
depoblación). Laincluso
la población razón por
con la que
una es posible
muestra que no
de 1000 es obtengamos la
que el muestreo
se realizó con reemplazo; es decir, después de sacar un papelito, se devolvía al contenedor; por lo
tanto, podría haberse sacado más de una vez, mientras que algunos papelitos nunca se sacaron.
La lección que se debe aprender es que siempre debemos tratar de maximizar el número de
observaciones —el tamaño de la muestra— en condiciones experimentales, de modo que las
estadísticas obtenidas se acerquen lo más posible a los parámetros de la población.
Los científicos organizan experimentos para probar hipótesis. La lógica estadística convencional
para probar hipótesis funciona más o menos así. Un experimentador dispone condiciones, como la
experimental (LSD) y la de control (placebo) en nuestro experimento con ratas, para probar una
hipótesis experimental. La hipótesis experimental en este caso es que el LSD tendrá algún efecto
sobre la velocidad de carrera. Esto se prueba comparándolo con la hipótesis nula, que sostiene
que las dos condiciones no difieren en sus efectos sobre la velocidad de carrera. Dicho de otra
manera, la hipótesis experimental es que las muestras de velocidades de carrera provienen de dos
poblaciones subyacentes diferentes (es decir, poblaciones con distribuciones diferentes); la hipótesis
nula es que las dos muestras provienen de la misma distribución.
Una suposición crítica es que es imposible probar la hipótesis alternativa de manera concluyente,
ya que siempre existe alguna posibilidad de que las dos muestras provengan de la misma población,
sin importar cuán diferentes parezcan. Sin embargo, lo que nos permite hacer la estadística inferencial
es determinar cuán confiados podemos estar al rechazar la hipótesis nula. La hipótesis alternativa se
prueba así indirectamente; si podemos confiar bastante en rechazar la hipótesis nula, supondremos
que la hipótesis alternativa es correcta y que existe una diferencia real entre las puntuaciones en las
diferentes condiciones. Los psicólogos han acordado, por convención, que si los cálculos de una
prueba estadística muestran que hay menos de 0,05 de probabilidad (un 5 por ciento de probabilidad)
de que la hipótesis nula sea correcta, podemos rechazarla y aceptar la hipótesis alternativa.
Describiremos brevemente el concepto de probabilidad en este contexto. Considere el siguiente

problema: ¿Cuál es la probabilidad de que si sacamos al azar una carta de una baraja de 52 cartas,
sea una espada? Como hay 13 picas en una baraja, la probabilidad de sacar una pica es 13 dividido
por 52, o 1/4, o 0,25. En general, si hay r formas en que puede ocurrir un evento y un total de N
posibilidades, entonces la probabilidad del evento es r/ N.
¿Cuál es la probabilidad de que una moneda justa salga cara al lanzarla? Hay dos formas en que
una moneda puede salir, por lo que N = 2. Una de ellas es cara, por lo que r = 1. Entonces, la
probabilidad de cara es 1/2, o 0.50.
Ahora podemos describir con mayor precisión lo que significa el nivel convencional de 0,05 para
la significación estadística. Si la hipótesis nula fuera realmente cierta, un investigador obtendría una
diferencia tan grande entre las condiciones cinco veces o menos en 100. Si las posibilidades de
cometer un error al rechazar la hipótesis nula son tan pequeñas, entonces se considera seguro
hacerlo. y optar por la hipótesis alternativa. El criterio de 0,05 se denomina nivel de confianza de
0,05, ya que solo se cometerá un error cinco veces en 100. Cuando se rechaza la hipótesis nula, los
investigadores concluyen que los resultados son estadísticamente significativos. En otras palabras,
los investigadores pueden estar bastante seguros de que el

diferencia obtenida entre las condiciones es confiable y que si se repitiera el experimento, se obtendría
el mismo resultado.
La lógica de oponer una hipótesis experimental a la hipótesis nula ha sido atacada en los últimos
años por varias razones. Algunos argumentan que da una idea engañosa de cómo operan los científicos.
Por un lado, no muchos investigadores en todo el mundo pierden el sueño por la hipótesis nula. En
general, los experimentos se organizan para probar nuestras teorías; lo que interesa principalmente es
cómo pueden interpretarse o explicarse los resultados de los experimentos a la luz de nuestras teorías.
De especial interés es el caso en el que importantes resultados experimentales parecen irreconciliables
con las principales teorías de un fenómeno. Por lo tanto, los experimentos son importantes por lo que
nos dicen sobre nuestras teorías e ideas (esa es la razón por la que los diseñamos en primer lugar) y no
sobre si se rechaza la hipótesis nula. Pero la lógica de la prueba de hipótesis nula se usa ampliamente
como una introducción, aunque sea demasiado simplificada, a la forma en que procede la inferencia
científica. Por lo tanto, lo presentamos aquí. Sin embargo, no se deje engañar pensando que los
psicólogos se pasan el día soñando hipótesis experimentales para oponerse a las hipótesis nulas. Esto
es así en parte, pero los procesos de inferencia científica son afortunadamente mucho más variados y
complicados de lo que la lógica del uso de la hipótesis nula nos haría creer (ver Capítulo 1).
Prueba de hipótesis: parámetros conocidos La lógica de probar hipótesis contra la hipótesis

nula se puede ilustrar adecuadamente en casos en los que se conocen los parámetros de una población
y deseamos determinar si una muestra en particular proviene de la población. Tales casos son bastante
inusuales en la investigación real, ya que los parámetros de la población rara vez se conocen.
Supongamos que estuviera interesado en saber si los miembros de su clase de psicología

experimental estaban confiablemente por encima de la media nacional en inteligencia medida por las
pruebas de coeficiente intelectual (o confiablemente por debajo, según sea el caso). Conocemos los
parámetros de población en este caso. La media es 100 y la desviación estándar es 15. Podría evaluar
a su clase con bastante facilidad dándoles la forma abreviada de alguna prueba de inteligencia, como la
Escala de inteligencia para adultos de Wechsler desarrollada para pruebas grupales. Suponga que toma
una muestra aleatoria de 25 personas de su clase de 100 y encuentra que el coeficiente intelectual
medio de la muestra es 108, con una desviación estándar de 5.
¿Cómo hacemos para probar la hipótesis experimental de que la clase es confiablemente más
brillante que la población en su conjunto? Primero, consideremos las hipótesis. La hipótesis experimental
es que los estudiantes son más brillantes que las personas de la nación en su conjunto, o que los
puntajes de CI de los estudiantes de la muestra provienen de una población diferente a la de las personas
seleccionadas al azar. La hipótesis nula es que no existe una diferencia confiable entre nuestra muestra
y la media nacional, o que los estudiantes de la clase son una muestra de la misma población nacional.
Si la hipótesis nula fuera realmente el caso, la diferencia entre la media muestral de 108 y la media del
parámetro poblacional (ÿ) de 100 se debería a factores aleatorios. Esto no es inverosímil, porque hemos
visto en nuestra discusión sobre la distribución muestral de las medias cuánto puede diferir una media
muestral de un parámetro poblacional, incluso cuando la muestra se selecciona de manera imparcial.
Recuerde la demostración en el aula de Horowitz, cuyos resultados se muestran en las tablas B.4 y B.5.
La curva normal, la distribución de las medias muestrales y las puntuaciones z se pueden usar para
ayudarnos a determinar la probabilidad de que la hipótesis nula sea falsa. Cuando se toman muestras
no sesgadas de una población más grande, normalmente se distribuyen las medias de estas muestras.
Con distribuciones normales, podemos especificar qué proporción de la distribución cae debajo de cada
parte de la curva, como se ve en la Figura B.3. Por último, recuerda también que

Las puntuaciones z son el cálculo de cualquier puntuación en una distribución normal en términos de
unidades de desviación estándar de la media.
Todo esto es a modo de revisión. Ahora bien, ¿cómo nos ayuda esto? Lo que hacemos al probar la
hipótesis de que la muestra es en realidad de una población con un CI medio mayor que la población en
general es tratar la media de la muestra como una puntuación individual (en términos de nuestra discusión
anterior) y calcular una puntuación z en el base de la desviación de la media muestral de la media poblacional.
En este caso, sabemos que la media de la población es 100 y la media de la clase de los estudiantes
seleccionados al azar es 108. Para calcular la z
puntuación, también necesitamos saber el error estándar de la media: la desviación estándar de la distribución
de las medias muestrales. Entonces, la ecuación para el puntaje z aquí es
_
X ÿ
=
Con
(B.8)
X
El error estándar de la media ( ) de la población

X se encuentra dividiendo la desviación estándar de la cual
(que sabemos que en el caso de las puntuaciones de CI es 15) por el tamaño de muestra , es la
n de la clase, o 25 . (Este razonamiento se deriva de la Ecuación B.6.) El es por lo tanto 15 25 /
, o 3. Por lo tanto, z es 108 100/3, o 2,67.
Una puntuación z de 2,67 nos permite rechazar la hipótesis nula con una confianza razonable y
concluir, a favor de la hipótesis alternativa, que la clase es en realidad superior a la población en términos
de CI. Establecemos esto haciendo esta pregunta: ¿Qué probabilidad hay de que ocurra una puntuación z
de 2.67 cuando se extrae una media muestral de una población más grande, cuando la media de la población
es en realidad 100? La respuesta es que ocurrirá solo 0.0038 veces, o 38 veces en 10,000. (Veremos cómo
se calculó esto en el siguiente párrafo). La costumbre de rechazar la hipótesis nula es que si pudiera ocurrir
solo una vez en 20 por casualidad, la rechazaríamos, por lo que la diferencia en la media muestral de la
clase es significativamente diferente de la media de la población.
Para explicar cómo se llega a esta notable conclusión, necesitamos referirnos nuevamente a la
propiedad especial de la curva normal, que es que una cierta proporción de casos cae bajo cada parte de la
curva. La figura B.3 muestra que una puntuación z de ±2,00 es altamente improbable. Los puntajes más
altos en cualquier dirección ocurren solo el 2.15 por ciento del tiempo. En otras palabras, la probabilidad de
tal ocurrencia es 0.0215. Esto también está por debajo del nivel de significación (o nivel de confianza) del 5
por ciento o 0,05, por lo que se considera que cualquier puntuación media de dos o más desviaciones
estándar de la media de la población, utilizando la lógica que hemos esbozado aquí, es confiablemente
( significativamente) diferente de la media poblacional. De hecho, el valor z crítico para rechazar la hipótesis
nula al nivel de confianza de 0,05 es ±1,96. La Tabla A en el Apéndice C presenta (1) puntajes z de cero a
cuatro, con (2) la cantidad de área entre la media y z, y (3) lo más importante, la cantidad de área más allá
de z. La cantidad de área más allá de z es la probabilidad de encontrar una puntuación tan distante de la
media basándose únicamente en el azar. Una vez más, cuando esta probabilidad cae por debajo de 0,05,
como ocurre con puntuaciones z de 1,96 (o más), rechazamos la hipótesis nula. Con una z de 2,67, como en
nuestro ejemplo de CI, la probabilidad de que ocurra una ocurrencia tan rara es solo 0,0038.
El problema estadístico que acabamos de considerar (comparar la media de una muestra con un
parámetro de la población para ver si la muestra proviene de esa población) es bastante artificial, ya que los
parámetros de la población rara vez se conocen. Pero este ejemplo exhibe características de las pruebas
estadísticas más comunes. En todas las pruebas, se realizan algunos cálculos sobre los datos o puntajes
brutos recopilados de un experimento; se encuentra un valor, como en el puntaje z recién calculado; y luego
este valor se compara con una distribución de valores para que podamos determinar la probabilidad de que
tal valor podría obtenerse si el valor nulo

hipótesis eran de hecho ciertas. Esta distribución nos dice, entonces, con qué probabilidad nuestro
resultado puede atribuirse a una variación aleatoria. Si la probabilidad es menor de cinco casos en 100 (p
< .05), entonces por convención decimos que la hipótesis nula puede ser rechazada. Esta probabilidad a
veces se denomina nivel alfa ( ). Como se mencionó, algunos psicólogos prefieren valores de 0.01 o
incluso 0.001 (1 en 100 o 1000, respectivamente), para que puedan estar más seguros de que el rechazo
de la hipótesis nula se hace correctamente.
Nuestra prueba de puntuación z también puede servir para presentarle muy brevemente algunos
otros conceptos estadísticos importantes. Primero, consideremos dos tipos de errores que se pueden
cometer al aplicar pruebas estadísticas a datos experimentales, de acuerdo con la lógica de prueba de
hipótesis nula. Un error de tipo I es el rechazo de la hipótesis nula cuando en realidad es cierta, y la
probabilidad de que se esté cometiendo este error está indexada por el nivel alfa. Si el nivel alfa es p =
0,05, entonces rechazaremos por error la hipótesis nula en cinco casos de 100. Esto ilustra la naturaleza
probabilística de la estadística inferencial; no estamos absolutamente seguros de que se pueda rechazar
una hipótesis nula, solo razonablemente seguros. Por lo tanto, cuanto más bajo sea el nivel o el nivel p
que empleamos para determinar la significación estadística, menos posibilidades tenemos de cometer un
error de tipo I. Sin embargo, esto aumenta la probabilidad de cometer un error de tipo II, que ocurre
cuando no rechazamos la hipótesis nula cuando en realidad es falsa. Así, al establecer niveles en
diferentes puntos, disminuimos y aumentamos sistemáticamente los dos tipos de errores. Se intercambian
entre sí. Los dos tipos de errores se describen en la Tabla B.6.
Los científicos son generalmente conservadores en estos asuntos, por lo que el nivel suele
mantenerse bastante bajo, en puntos como 0,05 o 0,01 (en lugar de, digamos, 0,10 o 0,15). Así,
minimizamos el error de rechazar la hipótesis nula cuando es verdadera, o de reclamar una diferencia en
nuestros resultados cuando no la hay. Sin embargo, como consecuencia, aumentamos la probabilidad de
errores de tipo II. Una prueba estadística conservadora minimiza los errores de tipo I, mientras que una prueba
las pruebas estadísticas aumentan la probabilidad de error de tipo I pero disminuyen la de error de tipo II.
Desafortunadamente, nunca podemos saber con certeza en nuestras situaciones experimentales si
estamos cometiendo errores de tipo I o de tipo II. Descubrimos esto principalmente a través de réplicas
experimentales de nuestros resultados. Sin embargo, también podemos averiguarlo calculando el
ÿ TABLA B.6
La naturaleza de los errores de tipo I y tipo II. Un error tipo I ocurre

cuando el experimentador rechaza falsamente una hipótesis nula
verdadera. La probabilidad de que esto ocurra está determinada por el
nivel. Un error de tipo II ocurre cuando el experimentador no rechaza una
hipótesis nula falsa. Cuando la hipótesis nula es falsa y se rechaza, el
experimentador ha tomado una decisión correcta, que está determinada por el
Estado Actual de la Población
La variable independiente no La variable independiente

Decisión de tuvo efecto; la hipótesis nula tuvo efecto; la hipótesis nula
Experimentador es verdadera. es falsa.
Rechazar hipótesis nula Error tipo I: una decisión falsa Decisión correcta: esto es
de que existe un efecto, que determinado por el poder
ocurre con probabilidad. del experimento
No rechazar la decisión correcta Error de tipo II: una falla en
hipótesis nula detectar que el tratamiento
tuvo un efecto.

potencia de una prueba estadística. El poder de una prueba estadística es la probabilidad de rechazar la
hipótesis nula cuando en realidad es falsa; obviamente, siempre queremos maximizar el poder de nuestras
pruebas estadísticas. Este no es el lugar para describir cómo se calcula el poder de las pruebas, pero
podemos señalar los dos factores principales que infl uyen en el poder. Vuelva a mirar la fórmula de
puntuación z en la Ecuación B.8. Cualquier cosa que hiciera que la puntuación z fuera mayor aumentaría el
poder de la prueba estadística o la probabilidad de rechazar la hipótesis nula. El valor ÿ, la media de la
población, es fijo. Por lo tanto, solo dos cambios en los valores de la Ecuación B.8 pueden afectar a z. Uno
es la diferencia entre la media muestral
¯ y la media poblacional (X ÿ) y el otro es n, el tamaño de la muestra.
Si aumenta la discrepancia entre ÿ y X¯en
(ouna
en otros
comparación
casos, siexperimental),
aumenta la diferencia
también entre
aumenta
medias
la probabilidad
muestrales
de rechazar la hipótesis nula.
Pero no hay nada que podamos hacer sobre el tamaño de la diferencia entre las medias; está
arreglado. Lo que podemos hacer para aumentar el poder de nuestras pruebas estadísticas es aumentar el
tamaño de la muestra. En resumen, la razón de esto es que con muestras más grandes, podemos estar
más seguros de que nuestras medias muestrales representan las medias de las poblaciones de las que se
extraen y, por lo tanto, podemos estar más seguros de que cualquier diferencia entre una media muestral y
una media poblacional (o entre dos medias muestrales) es confiable. El tamaño de la muestra puede tener
un gran efecto en el poder de una prueba, como se muestra en la Tabla B.7. Se presentan las puntuaciones
z y los valores p para nuestra diferencia entre una media muestral de 108 puntos de CI y la media poblacional
de 100, ya que el tamaño de la muestra varía. Obviamente, a medida que varía el tamaño de la muestra,
también lo hará nuestra conclusión sobre si la muestra proviene de una población nacional o de una
población más restringida y con alto coeficiente intelectual. Si asumimos que la hipótesis nula es realmente
falsa aquí, entonces al aumentar el tamaño de la muestra, disminuimos la probabilidad de un error de tipo II
o aumentamos el poder de la prueba que estamos usando.
Una última cuestión a considerar es la especificación de la direccionalidad de las pruebas estadísticas.
De acuerdo con la lógica convencional involucrada en probar una hipótesis alternativa contra la hipótesis
nula, la hipótesis alternativa puede ser direccional o no direccional.
Si un experimento tiene un grupo experimental y otro de control, una hipótesis alternativa no direccional
sería simplemente que los dos grupos diferían en el desempeño de la variable dependiente. Pero una
hipótesis direccional establecería además la dirección predicha de la diferencia; por ejemplo, se puede
predecir que el grupo experimental lo hará mejor que el control.
Esta distinción es importante porque si la hipótesis alternativa es direccional, se usa una prueba
estadística de una cola (o de un lado) , pero si la hipótesis alternativa es no direccional, se usa una prueba
de dos colas (de dos lados) . Una contra dos “colas” se refiere a si al buscar un nivel p asociado con algún
valor determinado de la prueba estadística (digamos, z = 1.69), consideramos una o ambas colas de la
distribución (ver Figura B.4).
Esto debería ser más claro con referencia a nuestro ejemplo anterior. Tomamos una muestra (n = 25)
de estudiantes, determinamos que el coeficiente intelectual medio de la muestra era 108 y calculamos un z
= +2.67 en la prueba para ver si esto era diferente del coeficiente intelectual medio de la población de 100.
Si tuviéramos sin una expectativa previa de cómo el coeficiente intelectual de la muestra debería desviarse
de la población normal (si pensáramos que podría ser mayor o menor), esta habría sido una hipótesis no
direccional. De hecho, esperábamos que el coeficiente intelectual de la muestra fuera superior a 100, por lo
que estábamos probando una hipótesis direccional y, por lo tanto, usamos una prueba de una cola. Esto
significa que buscamos la puntuación z resultante en solo una cola de la distribución normal: la mayor que
cero. Un z = +2,67 conduce a un valor de p de una cola de 0,0038. Si la hipótesis fuera no direccional,
entonces no tendríamos derecho a priori a esperar que la

ÿ TABLA B.7
Cómo la variación del tamaño de la muestra (n) afecta el poder de una

prueba estadística, o qué tan probable es que la hipótesis nula pueda ser
rechazada cuando se usa la prueba. El ejemplo es de la puntuación z (calculada
en el texto) en un coeficiente intelectual medio de la muestra de 108, donde _
X ÿ
Con =
X
si la diferencia de medias permanece igual pero n aumenta, z

aumenta porque
=
X
norte
norte
X X Con
pags*
2 8 13.14 0,61 .2709

5 8 6.70 1.19 .1170
7 8 5.67 1.41 .0793
10 8 4.74 1.69 .0455†
12 8 4.33 1.85 .0322†
15 8 3.88 2.06 .0197†
17 8 3.64 2.20 .0139†
20 8 3.35 2.38 .0087†
25 8 3.00 2.67 .0038†
50 8 2.12 3.77 .0001†
75 8 1.73 4.62 .00003†
100 8 1.50 5.33 .00003†
* Los valores de p son de una cola.

† Todos estos valores cumplen con el nivel convencional de significación estadística, p .05 (una cola).
2,14% 2,14%
0,13% 0,13%
13,59% 34,13% 34,13% 13,59%
–4 –3 –2 –1 0 +1 +2 +3 +4
–2.67 Unidades de puntuación estándar (z) +2.67
ÿ FIGURA B.4
Esta es la distribución normal estándar que se presenta en la Figura B.3. Hay dos lados, o colas, en la
distribución; positivo y negativo. Si un experimentador simplemente afirma que debe haber una diferencia
entre una condición experimental y una de control, pero no especifica la dirección de la diferencia, esto se
denomina hipótesis no direccional.
Si se encuentra z 2.67, es necesario buscar la probabilidad de que esto ocurra tanto en la cola positiva
como en la negativa de la distribución y sumar las dos, ya que el experimentador no ha especificado si la
diferencia debe ser positiva o negativa. Cuando el experimentador ha especificado la dirección o la
diferencia, basta con buscar la probabilidad en una cola. Dado que la distribución es simétrica, la probabilidad
de que se pueda rechazar la hipótesis nula es la mitad de grande con una prueba de una cola que con una
de dos colas. Cuanto menos seguro se esté del resultado de un experimento, mayor debe ser la diferencia
entre las condiciones para que se decida que no se debe al azar.

la puntuación z resultante sea mayor en lugar de menor que cero. La z podría caer en la cola positiva o negativa.
Dado que la diferencia podría haber ocurrido en cualquier dirección, usamos una prueba de dos colas. En la práctica,
dado que las dos colas de la distribución son simétricas, simplemente duplicamos el nivel p para la prueba de una
cola. En nuestro ejemplo, si la hipótesis hubiera sido no direccional, p sería igual a 2 × 0,0038, o 0,0076, todavía
muy por debajo de 0,05.
Las pruebas de dos colas son más conservadoras y menos poderosas que las pruebas de una cola; es más
difícil rechazar la hipótesis nula. Si no estamos seguros del resultado de un experimento, necesitamos un valor
mayor de la estadística que nos permita declarar una diferencia.
En la práctica, la mayoría de los investigadores prefieren utilizar la prueba de dos colas, más conservadora, con un
poder suficiente garantizado por tamaños de muestra bastante grandes.
Pruebas de diferencias entre dos grupos

Hay una variedad desconcertante de pruebas estadísticas para casi todos los propósitos. Actualmente, estamos
interesados en discutir las pruebas que evalúan la confiabilidad de una diferencia entre dos grupos o condiciones.
¿Cómo elegimos una prueba apropiada de todas las disponibles?
No hay una regla estricta. Las pruebas varían en las suposiciones que hacen, su poder y los tipos de situaciones
para las que son apropiadas. Quizás la prueba más popular para la diferencia entre dos medias en la investigación
psicológica es la prueba t . Desde la t
proporciona la misma estimación de confiabilidad que el análisis de varianza simple (que se discutirá pronto),
primero nos concentraremos en otras dos pruebas, la U de Mann-Whitney
prueba y la prueba de rangos con signo de Wilcoxon. Estas pruebas también son útiles para introducir otro tipo
de prueba estadística.
Las pruebas de Mann-Whitney y Wilcoxon son pruebas no paramétricas, a diferencia de las pruebas
paramétricas. Las pruebas estadísticas paramétricas hacen suposiciones sobre los parámetros de población
subyacentes de las muestras en las que se realizan las pruebas. Los supuestos comunes de las pruebas
paramétricas sostienen que las varianzas de las poblaciones subyacentes que se comparan son equivalentes y que
las distribuciones subyacentes son normales. Si no se cumplen estos supuestos, entonces la prueba puede ser
inapropiada. Pero, ¿cómo podemos saber si se cumplen los supuestos subyacentes a la prueba, ya que no
conocemos los parámetros de la población? Por lo general, no podemos saberlo, excepto estimando los parámetros
de la población a partir de estadísticas muestrales. Sin embargo, si recurrimos a las estadísticas no paramétricas, el
problema no surge, porque estas pruebas no hacen suposiciones sobre los parámetros de población subyacentes.
Dado que los parámetros no se pueden conocer de todos modos, esto proporciona una razón importante para usar
pruebas no paramétricas. Otra razón es la simplicidad: estas pruebas generalmente son muy fáciles de calcular y, a
menudo, incluso se pueden hacer a mano. Sin embargo, las pruebas no paramétricas suelen ser menos potentes
que las pruebas paramétricas empleadas en la misma situación; es decir, es menos probable que proporcionen un
rechazo de la hipótesis nula.
La prueba U de Mann-Whitney se usa cuando deseamos comparar dos muestras para decidir si provienen
de la misma o de diferentes poblaciones subyacentes. Se utiliza cuando las dos muestras están compuestas por
diferentes sujetos, o en diseños entre sujetos. El fundamento subyacente de la prueba de Mann-Whitney no se
discute aquí. En general, la lógica es la misma que en otras pruebas estadísticas en las que se calcula un valor a
partir de la prueba y se compara con una distribución de valores para determinar si se debe rechazar la hipótesis
nula. La forma en que se aplica la prueba de Mann-Whitney a los datos reales se describe en el recuadro B.3,
probando la confiabilidad de la diferencia entre las dos muestras en nuestro experimento hipotético con LSD.

Recuadro B.3
Cálculo de una Paso 1: Clasifique todos los números de ambos grupos juntos, comenzando con el número más
prueba U de Mann- pequeño. Asígnele el rango más bajo.
Whitney sobre
datos Control (placebo) Experimental (LSD)
experimentales hipotéticos de Latencia (seg) Rango Latencia (seg) Rango
Figura B.1
9 1.5 9 1.5
10 3.0 13 11.5
11 4.5 13 11.5
11 4.5 14 17.0
12 7.0 14 17.0
12 7.0 15 21.0
12 7.0 dieciséis 24.5
13 11.5 17 28,0
13 11.5 17 28,0
14 17.0 18 32,0
14 17.0 18 32,0
14 17.0 18 32,0
15 21.0 18 32,0
15 21.0 19 35.5
dieciséis 24.5 19 35.5
17 28,0 20 37.5
18 32,0 22 39.0
20 37.5 26 40,0
rango1 295.5 rango2 524.5
Nota: Cuando los puntajes estén empatados, asigne el valor medio de los rangos empatados a cada uno.
Por lo tanto, para ambos tiempos de 9 segundos en este ejemplo, se asigna el rango 1,5
(la media de 1 y 2).
Paso 2: Las ecuaciones para encontrar U y U' son las siguientes, donde n1 es el tamaño de la
muestra más pequeña, n2 es el tamaño de la más grande, R1 es la suma de los rangos de la muestra
más pequeña y R2 es el tamaño de la muestra más pequeña. suma de los rangos de la muestra más
grande. Obviamente, los subíndices de muestra son importantes solo si los tamaños de muestra son
desiguales, lo que no es el caso aquí.
= 12 +
nn (1 +)
1 ÿ ÿ1
U nn R
1
2
( 21
)( 20
EN ) 20 20 = ( )( ) + 2 ÿ
295 5. (B.9)
EN =+ÿ400 210 295 5 .
EN = 314 5.
nn (++) ÿ ÿ1
=12
U nn
ÿ
22 R
2
2
ÿ ( 21
)( 20
EN ) 20 20 = ( )( ) + 2 ÿ
524 5. (B.10)
EN
ÿ
= 85 5.
continuado

Recuadro B.3
continuado En realidad, es necesario calcular solo U o U', porque el otro se puede encontrar de
acuerdo con las ecuaciones
U n1n2 U'
o
U'n1n2 U _
Paso 3: Tome U o U', el valor que sea menor, y observe la Tabla B en el Apéndice C
para ver si la diferencia entre los dos grupos es confiable.
Los valores de la Tabla B se registran de acuerdo con diferentes tamaños de muestra. En
este caso, ambos tamaños de muestra son 20, por lo que el valor crítico de la tabla es 88.
Para que la diferencia entre los dos grupos se considere confiable, la U o la U' del
experimento debe ser menor que el valor apropiado en la Tabla B. Dado que 85.5 es menor
que 88, podemos concluir que la diferencia entre los dos grupos es confiable en el nivel de
confianza de .001.
Nota: La tabla B es apropiada solo para situaciones en las que los tamaños de las dos
muestras están entre 8 y 21. Para otros casos, debe consultar un texto avanzado.
La prueba de rangos con signo de Wilcoxon también se usa para probar la diferencia entre dos
muestras, pero en este caso, el diseño debe ser un diseño de medidas relacionadas. En otras
palabras, los mismos sujetos deben servir tanto en el grupo experimental como en el de control (un
diseño dentro de los sujetos) o los sujetos deben coincidir de alguna manera. Por supuesto, se
deben tomar precauciones en los diseños intra-sujetos para asegurar que alguna variable como la
práctica o la fatiga no se confunda con la variable de interés (ver Capítulo 3).
Pero siempre que el experimento se haya hecho bien, la prueba de los rangos con signo de Wilcoxon es una
herramienta apropiada para el análisis de los resultados.
Antes de considerar la prueba de los rangos con signo, examinaremos su prima más simple,
la prueba de los signos, que también es apropiada en las mismas situaciones. La prueba del signo
es la esencia de la sencillez. Supongamos que tenemos 26 sujetos sirviendo en ambas condiciones
de un experimento en el que estamos prediciendo que cuando los sujetos estén en la condición
experimental, lo harán mejor que cuando estén en la condición de control. Ahora suponga que 19
sujetos en realidad lo hacen mejor en la condición experimental que en el control, mientras que lo
contrario es cierto para los otros 7. ¿Es confiable esta diferencia? La prueba de signos nos permite
responder esta pregunta sin más información sobre cuáles fueron los puntajes reales. En términos
de la hipótesis nula, podríamos esperar que 13 sujetos se desempeñaran mejor en la condición
experimental y 13 en el control. La prueba de signos nos permite calcular la probabilidad exacta de
que la hipótesis nula sea falsa cuando hay 19 casos en la dirección predicha pero también siete
reversiones o excepciones. Resulta que la hipótesis nula se puede rechazar en este caso con un
nivel de confianza de 0,014 (una cola). Con una predicción no direccional, p es igual a 0,028 (dos cola
Una vez más, no podemos profundizar en los detalles de cómo se calcula esto, pero en la Tabla C
del Apéndice C, presentamos los niveles (una cola) para casos de tamaños de muestra de 3 a 42,
cuando hay x número de excepciones a la regla . hipótesis predicha. Entonces, por ejemplo, cuando
hay 16 sujetos en el experimento (recuerde, en ambas condiciones) y 13 muestran el patrón de
resultados predicho mientras que 3 exhiben reversiones, podemos rechazar la hipótesis nula en el
nivel de confianza de 0.011 (una cola). .

La prueba de signos utiliza muy poca información de un experimento: solo si los sujetos se
desempeñaron mejor o peor en una condición que en otra. Para la prueba de signos, no importa si la
diferencia de rendimiento es grande o pequeña; la dirección de la diferencia es todo lo que importa. Por lo
tanto, la prueba de signos desperdicia gran parte de la información recopilada en un experimento y no es
una prueba estadística muy poderosa. La prueba de rangos con signo de Wilcoxon es como la prueba de
signos en el sentido de que se utiliza en situaciones en las que se emplean los mismos sujetos (o
emparejados) en dos condiciones y se tiene en cuenta la dirección de la diferencia. Sin embargo, en la
prueba de rangos con signo de Wilcoxon, también se tiene en cuenta el tamaño de la diferencia. Por esta
razón, también se le llama prueba de signo de tamaño. En el recuadro B.4 se da un ejemplo de cómo se usa
la prueba de rangos con signo de Wilcoxon.
Recuadro B.4
Cálculo de la Imagine un experimento que pruebe si el curso de memoria del profesor Humboldt von Widget,
prueba de rangos “Cómo estreñir su mente recordándolo todo”, realmente funciona. Primero, a un grupo de 30 sujetos
con signo de se les presentan 50 palabras para recordar. Luego, los sujetos se separan al azar en dos grupos, y
Wilcoxon una verificación indica que los grupos no difieren de manera confiable en el número medio de
palabras recordadas. El grupo experimental recibe el curso de tres semanas del profesor von Widget,
mientras que el grupo de control no. Luego, los 30 temas se evalúan nuevamente en otra lista de 50
palabras. Los controles no muestran ninguna mejora de una lista a otra. La pregunta que nos
hacemos aquí es si la memoria de los sujetos experimentales mejoró de forma fiable. (Nota:
Podríamos, y deberíamos, también comparar el desempeño de los sujetos experimentales en la
segunda prueba con el de los controles.
La prueba de Mann-Whitney es apropiada para esta comparación. ¿Sabes por qué?)

Empleamos la prueba de rangos con signo de Wilcoxon para evaluar si los sujetos experimentales
mejoraron de manera confiable desde la primera prueba hasta la segunda.
Paso 1: coloque los datos en una tabla (como la que se muestra más adelante en este cuadro)
en la que se emparejen las puntuaciones de cada sujeto (antes y después del curso de memoria).
Encuentra y anota la diferencia entre los pares.
Paso 2: Clasifique los valores de las diferencias según el tamaño, comenzando con el más
pequeño. Ignora la señal. Usa los valores absolutos de los números. Para rangos empatados,
asigne a cada uno el valor medio de los rangos. (Consulte la columna de la derecha de la tabla
aquí).
Paso 3: Sume los rangos para todos los valores de diferencia que son negativos (5.5 + 2.5 + 8.5 +
5.5 = 22.0) y positivos (14 + 15 + 2.5 + 8.5 + 8.5 + 2.5+13 + 2.5 + 11.5 + 8.5 + 11.5 = 98.0). Estos
son los valores de rango con signo.
Paso 4: Tome el valor de rango con signo que sea más pequeño (22 en este caso) y vaya a la
Tabla D en el Apéndice C. Busque el número de pares de observaciones (enumerados como n a
la izquierda). Hay 15 en este caso. Luego mire el número bajo el nivel de significación deseado.
Dado que en este caso se predijo la dirección del resultado (esperábamos que el curso de la
memoria ayudara en lugar de perjudicar el recuerdo de las palabras), elijamos el valor por debajo
del nivel de significación de 0,025 para una continuación .

Recuadro B.4
continuado prueba de cola Este valor es 25. Si el menor de los dos valores del experimento está por debajo
del valor apropiado en la tabla, entonces el resultado es confiable. Dado que 22 está por debajo
de 25, podemos concluir que el curso del profesor von Widget realmente ayudó a la memoria de
las palabras.
Nota: Recuerde que los controles no mostraron mejoría en el desempeño de una prueba
a la otra. Esta es una información crucial, porque de lo contrario no podríamos descartar dos
hipótesis plausibles en competencia. Una es que la mejora en la segunda lista se debió
simplemente a la práctica en la primera, y la otra es que la segunda lista fue más fácil que la
primera. En realidad, si el curso del profesor von Widget fuera tan efectivo como los numerosos
cursos de memoria actualmente en el mercado, los resultados de un experimento real mostrarían
(y han mostrado) una mejora más espectacular que los resultados hipotéticos aquí. Los cursos
de mejora de la memoria, todos los cuales incorporan los mismos principios, realmente
funcionan para materiales objetivos, como listas de palabras.
Número medio de palabras recordadas
Tema Antes Después Diferencia Rango
1 11 17 6 14.0
2 18 dieciséis 2 5.5
3 9 21 12 15.0
5 14 17 3 8.5
6 12 15 3 8.5
8 dieciséis 17 1 2.5
9 15 20 5 13.0
11 12 13 1 2.5
12 dieciséis 14 2 5.5
13 10 14 4 11.5
14 17 20 3 8.5
15 6 10 4 11.5
X 13.80 X16.07 _
Prueba t
En los Cuadros B.5 y B.6, presentamos las pruebas t correspondientes para los análisis presentados
en los dos cuadros anteriores. La prueba t es una prueba paramétrica; esto significa que asumimos que
las distribuciones subyacentes tienen una forma aproximadamente normal. Además, la prueba t y otras
pruebas paramétricas se diseñaron para usarse en datos que son al menos de naturaleza de intervalo.
La prueba U y la prueba de signos requieren solo datos ordinales. Las pruebas t se basan esencialmente
en puntajes z que tienen que ver con el error estándar de la diferencia entre medias. Por lo tanto, incluso
si las fórmulas computacionales parecen inusuales al principio, la lógica subyacente es la misma que
se analizó anteriormente en este apéndice.

Recuadro B.5
Cálculo de un Estos son datos experimentales hipotéticos discutidos previamente (ver Cuadro B.3).
Entre La fórmula de cálculo es
Sujetos Prueba t
_ _
XX1 ÿ
t= 2
ÿ 2 2 ÿ
(ÿ) ÿX 1 (ÿ) X
ÿ ÿXÿ 2 +ÿ ÿ X 2 2
ÿ
(B.11)
1 2 ÿ 1
norte norte 1 ÿ
1 2 ÿ
ÿ+
ÿ
NN + ÿ 2 ÿ
NN ÿ
2 2 1 2 ÿÿ
ÿ ÿ
ÿ
ÿ
ÿ
ÿ
X¯1 media del grupo 1 X21 suma de puntuaciones al cuadrado en el grupo 1

X¯2 media del grupo 2 X22 suma de puntuaciones al cuadrado en el grupo 2
2
N1 número de puntajes en el grupo 1 (X1) cuadrado del grupo 1 suma
2
N2 número de puntajes en el grupo 2 (X2) cuadrado del grupo 2 suma
Control (placebo) Experimental (LSD)
X X2 X X2 X X2 X X2
9 81 13 169 9 81 17 289
10 100 14 196 13 169 18 324
11 121 14 196 13 169 18 324
11 121 14 196 14 196 18 324
12 144 15 225 14 196 18 324
12 144 15 225 15 225 19 361
12 144 dieciséis 256 dieciséis 256 19 361
13 169 17 289 dieciséis 356 20 400
13 169 18 324 dieciséis 356 22 484
13 169 20 400 17 289 26 676

X272 _ X2 3838 X338 _ X2 5960
X 13,60 X 16,90
Paso 1: Después de calcular X, X2 , y X¯ para cada grupo (por cierto, no hay

2
necesitamos clasificar nuestros datos), necesitamos calcular (X) / N para cada grupo:
(272) 2/20 = 3699,20 y (338) 2/20 = 5712,20. Entonces necesitamos determinar 6X2 ÿ (X)
2
/ N para cada grupo. Obtenemos 3838 – 3699.2 = 138.8 y
5960 ÿ 5712,2 = 247,8.
Paso 2: ahora sumamos las dos cifras de grupo que obtuvimos en el último paso (247.8 + 138.8) y
dividimos esta suma por N1 + N2 ÿ 2, para obtener 386.6/38 = 10.17.
Paso 3: El cociente obtenido en el Paso 2 (10,17) se multiplica por [(1/N1 + 1/N2)] para obtener (10,17)
(2/20) = 1,02.
Paso 4: Ahora sacamos la raíz cuadrada del producto obtenido en el Paso 3 para obtener
1 02 . 1.01.
Paso 5: Hallamos la diferencia absoluta entre las puntuaciones medias de los dos grupos (restando una
de la otra e ignorando el signo): 16,90 ÿ 13,60 = 3,30.
continuado

Recuadro B.5
continuado Paso 6: t = la diferencia entre medias (Paso 5) dividida por los resultados del Paso 4: 3,30/1,01 =
3,27. Entonces, nuestro t = 3.27. Para evaluar esto, observamos los valores de t presentados en la
Tabla E del Apéndice C. Ingresamos a esta tabla con el número de grados de libertad (gl ) en
nuestro experimento, lo que significa el número de puntajes que pueden variar libremente. . Para un
t entre sujetos, los grados de libertad son N1
+ N2 ÿ 2: en este caso, df = 38. Para p = 0,05 y df = 38, el valor crítico de t es 2,04 en nuestra tabla
(siempre tome el siguiente df más bajo para calcular el valor crítico).
Dado que nuestra t obtenida excede el valor crítico, podemos rechazar la hipótesis de que nuestros
dos grupos tienen los mismos puntajes de ejecución; es decir, podemos decir que el LSD tuvo un
efecto sobre el comportamiento de nuestros sujetos.
Recuadro B.6
Cálculo de un Los datos hipotéticos provienen del experimento del profesor von Widget (ver Cuadro B.4). La
Prueba t intra- fórmula computacional para la prueba t dentro de los sujetos es
sujetos
norte
ÿ
1
t = (B.12)
2 1
ÿ ND
ÿ (ÿD) ÿ 2 / ÿÿÿ
donde N = número de sujetos y D = diferencia en las puntuaciones de un sujeto dado (o par de

sujetos emparejados) en las dos condiciones.
Número medio de palabras recordadas
Tema Antes Después Diferencia D2
1 11 17 6 36
2 18 dieciséis 2 4
3 9 21 12 144
4 15 dieciséis 1 1
5 14 17 3 9
6 12 15 3 9
7 17 dieciséis 1 1
8 dieciséis 17 1 1
9 15 20 5 25
10 19 dieciséis 3 9
11 12 13 1 1
12 dieciséis 14 2 4
13 10 14 4 dieciséis
14 17 20 3 9
15 6 10 4 dieciséis
X 13.80 X16.07 _ D 35 D2 285

2
(D) 1,225
Paso 1: Después de organizar los puntajes de cada materia en pares, como se muestra en esta
tabla, registre la diferencia entre cada par, luego eleve al cuadrado cada una de estas diferencias.
puntuaciones de encia.
Paso 2: sume las puntuaciones de diferencia entre las materias, lo que produce D, luego eleve esta
suma al cuadrado. D = 35; (D) 2 = 1,225.
continuado

Recuadro B.6
continuado Paso 3: Calcule la suma de las puntuaciones de diferencia al cuadrado para obtener D2 = 285.
Paso 4: Multiplicar D2 (Paso 3) por el número de sujetos: 285 × 15 = 4,275.

2: 4,275/1,225 = 3,49. Después
Paso 5: Dividir el producto encontrado en el Paso 5 por (D)
restar 1 del resultado: 3,49 – 1 = 2,49.
Paso 6: Dividir el número de sujetos menos 1 (N ÿ 1) por el resultado del Paso 5: 14/2,49 =
5,62.
Paso 7: t es 5 62 . , o 2.37.
Paso 8: Para evaluar t, compárelo con el valor crítico que se muestra en la Tabla E estadística en el
Apéndice C. Ingrese la tabla con N ÿ 1 df. Para este estudio, df = 14. Con df = 14, el valor crítico de
t es 2,145 para p = 0,05. Dado que el t obtenido excede el valor crítico, podemos concluir que el
curso de von Widget realmente afectó el recuerdo de palabras.
Magnitud del efecto

En resumen, calcular un estadístico como z o t nos permite determinar si los resultados se deben a factores
aleatorios. Determinar el nivel de una diferencia, como en el Recuadro B.5, nos dice que la diferencia es
estadísticamente significativa y podemos rechazar la hipótesis nula. Es una característica interesante de t
(y de la prueba F que analizamos a continuación) que el valor de t necesario para rechazar la hipótesis nula
disminuye a medida que aumentan los grados de libertad. Esto significa que la potencia de t aumenta con
el tamaño de la muestra al igual que z (consulte la Tabla B.2). También es el caso, como indica la fórmula
para los grupos independientes t en el Recuadro B.5, que mientras mantenemos constante la diferencia
entre las medias, aumentar el tamaño de la muestra (n) aumentará el valor de t al hacer que el denominador
sea más pequeño. Esto también nos permitirá tener más poder y rechazar más hipótesis nulas. En algunos
casos, entonces, es posible que diferencias muy pequeñas entre las medias sean estadísticamente
significativas. Por lo general, cuando hacemos un experimento, queremos diferencias sustanciales entre las
medias, un gran efecto de la variable independiente. Sin embargo, con un experimento muy poderoso,
podemos detectar diferencias entre medias que son excepcionalmente pequeñas. En el último caso, es
posible que no sepamos si la diferencia se debe a una variable independiente poderosa oa una prueba
estadística muy poderosa.
¿Cómo sabemos que tenemos una variable independiente poderosa? Para determinar la magnitud
del efecto de la variable independiente, necesitamos una forma de mostrar el grado en que pertenecer a
un grupo en particular predice el comportamiento. En el ejemplo del Recuadro B.5, nos gustaría tener un
cálculo que nos permitiera tener una idea de si una rata había recibido un placebo o LSD. La información
que necesitamos es un coeficiente de correlación, porque queremos predecir lo que le sucedió a una rata
de la misma manera que nos gustaría predecir una puntuación de memoria basada en el tamaño de la
cabeza, como en el Cuadro B.1. Después de haber realizado una prueba t , podemos calcular una
correlación para evaluar la magnitud del efecto. El coeficiente de correlación que sería apropiado aquí es
rpb, que se denomina correlación biserial puntual . la fórmula es
(B.13)
2
2
r
pb (+ ) toneladas / t df =

El valor de rpb puede estar entre 0 y 1,00. Por convención, los valores de hasta 0,3 se consideran
pequeños, un valor de 0,31 a 0,5 es moderado y los valores superiores a 0,5 son apreciables (Thompson
y Buchanan, 1979). Para los datos del recuadro B.5, t = 3,27 y df =38, que según la fórmula B.6 da rpb
0,47. Esto se consideraría un efecto moderado. Se podría
resultados
utilizardel
la misma
Cuadrofórmula
B.13. ¿Por
paraqué
rpb no
para los
determinas qué es?
La medida adicional más importante del tamaño del efecto que debe conocer es eta (), que se
utiliza para determinar qué tan equivocada es la hipótesis nula después de realizar una prueba F. Para
anticipar la discusión en la próxima sección, la prueba F en su forma más simple es muy parecida a la
prueba t , excepto que hay más de dos niveles de la variable independiente (digamos, varias dosis de
LSD). Los experimentos más complicados que tienen dos o más variables independientes, cada una
con varios niveles, también se pueden analizar con la prueba F. Al igual que con rpb, es una correlación
entre las puntuaciones de la variable dependiente y la pertenencia al grupo. Cuanto mayor sea el valor
, lo que
de, mejor podremos predecir la pertenencia al grupo sobre la base de lasignifica
puntuación
un tamaño
de un participante,
del efecto
mayor.
En un análisis de varianza, calculamos el cociente de dos varianzas (esto quedará claro en un
momento), y la significancia está relacionada con dos grados de libertad: uno gl para el numerador (n) y
otro para el denominador (d) de la relación F. Entonces, la fórmula para es:
= (B.14)
df nnd
F df F df / × ( × )+
Las medidas de magnitud del efecto tienen otro uso importante, que también está relacionado con
el hecho de que rechazar la hipótesis nula depende del tamaño de la muestra. Supongamos que
realizamos un experimento y descubrimos que el valor de t no es lo suficientemente grande como para
rechazar la hipótesis nula aunque la diferencia entre las medias no sea cero (es decir, difieren).
Una razón por la que el valor t es pequeño podría ser un tamaño de muestra demasiado pequeño para
detectar una diferencia estadísticamente significativa entre las medias. En este caso, un investigador
prudente calcularía la medida adecuada de la magnitud del efecto, como rpb. Si el coeficiente arroja un
valor moderado o apreciable, entonces sería conveniente aumentar el tamaño de la muestra en el
experimento para rechazar la hipótesis nula. Obtener resultados estadísticamente significativos es
importante, pero en realidad es solo “la mitad de la batalla”. Los resultados significativos que son muy
pequeños no son particularmente emocionantes. Los efectos apreciables que no son estadísticamente
significativos probablemente significan que está en lo cierto y se justifica un aumento en el poder estadístic
Hay otras medidas de la magnitud del efecto, pero no las presentaremos. La lógica es la misma
independientemente de la prueba estadística: las estadísticas inferenciales nos dicen qué tan seguros
podemos estar de que la hipótesis nula es incorrecta. Por otro lado, los coeficientes de correlación,
como rpb, miden la magnitud del efecto de la variable independiente—
el grado en que la hipótesis nula es incorrecta (Thompson & Buchanan, 1979).
El análisis de varianza
La mayor parte de la investigación psicológica ha progresado más allá de la etapa en la que sólo se
comparan entre sí dos condiciones, una experimental y otra de control. En lugar de variar solo la
presencia o ausencia de alguna variable independiente, los investigadores varían sistemáticamente la
magnitud de la variable independiente. En nuestro ejemplo de los efectos del LSD en la velocidad de
carrera de las ratas, puede ser bastante útil variar la cantidad de LSD administrada a las ratas. Quizás
los efectos sean diferentes en dosis bajas que en dosis altas. No pudimos determinar esto a partir del
diseño de dos grupos en el que uno

grupo recibió LSD en cierta cantidad y el otro no. Para evaluar los resultados de tal experimento
con múltiples grupos, debemos emplear el análisis de varianza, en particular el análisis de
varianza simple. El análisis de varianza simple se usa cuando un factor o una variable
independiente (como la cantidad de LSD) varía sistemáticamente. Por lo tanto, también se le llama
análisis de varianza de un factor. A menudo, los investigadores están interesados en situaciones
más complejas. Pueden estar interesados en variar dos o más factores simultáneamente. En tales
diseños experimentales de dos factores o multifactores, el análisis de varianza también es
apropiado, pero es más complicado. En esta sección, le presentamos la lógica del análisis de
varianza simple y de dos factores (ANOVA abreviado). Sin embargo, en nuestros ejemplos y
discusión, nos ceñimos al caso de diseños experimentales entre sujetos. Los cálculos para los
diseños dentro de los sujetos son diferentes.
En el centro del procedimiento de análisis de varianza se encuentra una comparación de

estimaciones de varianza. Ya hemos discutido el concepto de varianza y su estimación a partir de
una muestra particular de observaciones. Debería volver a consultar la sección sobre medidas de
dispersión si el concepto de varianza le resulta confuso en este momento. Recuerde que la
ecuación para la estimación insesgada de la varianza de la población es
_
2
ˆ ÿ( ÿXX
)
s2 = (B.15)
norte
ÿ
y que cuando la desviación de las puntuaciones respecto de la media es grande, la varianza será grande.
De manera similar, cuando las desviaciones de la media son pequeñas, la varianza será pequeña.
En el análisis de varianza se obtienen dos estimaciones independientes de la varianza.
Uno se basa en la variabilidad entre los diferentes grupos experimentales: cuánto varían entre sí
las medias de los diferentes grupos. En realidad, la varianza se calcula en cuanto a cuánto difieren
las medias de los grupos individuales de la media general de todas las puntuaciones del
experimento. Cuanto mayor sea la diferencia entre las medias de los grupos, mayor será la
varianza entre grupos.
La otra estimación de la varianza es la varianza dentro de los grupos. Este es el concepto
que ya hemos discutido al considerar las estimaciones de la varianza de muestras individuales;
ahora lo que nos preocupa es encontrar una estimación de la varianza dentro de los grupos que
sea representativa de todos los grupos individuales, por lo que tomamos la media de las varianzas
de estos grupos. La varianza dentro de los grupos nos da una estimación de cuánto difieren entre
sí los sujetos de los grupos (o la media del grupo). En resumen, se obtienen dos estimaciones de
la varianza: una para la varianza dentro de los grupos y otra para la varianza entre grupos. Ahora,
¿de qué sirve esto?
La lógica básica de las pruebas para ver si las puntuaciones de los diferentes grupos o
condiciones son confiablemente diferentes es la siguiente. La hipótesis nula es que todos los
sujetos en las diversas condiciones proceden de la misma población subyacente; la variable
experimental no tiene efecto. Si la hipótesis nula es verdadera y todos los puntajes en los diferentes
grupos provienen de la misma población, entonces la varianza entre grupos debe ser la misma que
la varianza dentro de los grupos. Las medias de los diferentes grupos no deben variar entre sí ni
más ni menos que las puntuaciones dentro de los grupos. Entonces, para que podamos rechazar
la hipótesis nula, las medias de los diferentes grupos deben variar entre sí más de lo que varían
las puntuaciones dentro de los grupos. Cuanto mayor sea la varianza (diferencias) entre los grupos
del experimento, más probable es que la variable independiente haya tenido un efecto,
especialmente si la varianza dentro de los grupos es baja.

La persona que originó esta lógica fue el eminente estadístico británico RA Fisher; la prueba se conoce
como prueba F en su honor. La prueba F es simplemente una relación entre la estimación de la varianza entre
grupos y la estimación de la varianza dentro de los grupos:
Varianza entre grupos

F= (B.16)
Varianza dentro de los grupos
Según la lógica que acabamos de esbozar, la razón F bajo la hipótesis nula debería ser 1,00, porque la varianza
entre grupos debería ser la misma que la varianza dentro de los grupos. Cuanto mayor sea la varianza entre
grupos que la varianza dentro de los grupos y, en consecuencia, cuanto mayor sea el cociente F que 1,00, más
confiados podemos estar en rechazar la hipótesis nula. Exactamente cuánto mayor debe ser la relación F que
1,00 depende de los grados de libertad en el experimento o de la libertad de variación de las medidas. Esto
depende tanto del número de grupos o condiciones en el experimento como del número de observaciones en
cada grupo.
Cuanto mayor sea el número de grados de libertad, menor deberá ser el valor de la relación F para que se
considere un efecto significativo, como puede ver al examinar la Tabla F en el Apéndice C. Debe seguir el ejemplo
de cálculo en el Cuadro B.7 cuidadosamente para tener una idea del análisis de la varianza.
Recuadro B.7
Informática Imagine que acaba de realizar un experimento para probar los efectos del LSD en la velocidad de
Análisis de varianza carrera de las ratas, pero administró tres niveles de LSD en lugar de solo dos, como en nuestro
simple ejemplo anterior. Diez ratas no recibieron LSD, otras 10 recibieron una pequeña cantidad y, sin
embargo, un tercer grupo de 10 recibió una gran cantidad.
Por lo tanto, el experimento emplea un diseño entre sujetos, en el que la cantidad de LSD (ninguno,
pequeño, grande) es la variable independiente y el tiempo de ejecución es la variable dependiente.
Primero, calcule la suma de las puntuaciones (X) y la suma de los valores cuadrados de las puntuaciones
(X2 ).
cantidad de LSD
Ninguna Pequeña Largo
13 17 26
11 15 20
14 dieciséis 29
18 20 31
12 13 17
14 19 25
10 18 26
13 17 23
16 19 25
12 21 27
X 133 175 249
X 13.30 17.50 24.90
X2 1819 3115 6351
continuado

Recuadro B.7
continuado Una cantidad básica en el cálculo del análisis de varianza es la suma de los
cuadrados, que es una forma abreviada del término suma de las desviaciones al cuadrado
de la media. Si revisa la Ecuación B.1, que defi ne la varianza de una muestra, verá que
la suma de los cuadrados es el numerador. En realidad, hay tres sumas de cuadrados de
interés. Primero está la suma total de cuadrados (SS total), que se define como la suma
de las desviaciones al cuadrado de las puntuaciones individuales de la gran media, o la
media de todas las puntuaciones en todos los grupos en el experimento. En segundo lugar
está la suma de cuadrados entre grupos (SS entre), que es la suma de las desviaciones al
cuadrado de las medias de los grupos con respecto a la gran media. En tercer lugar, la
suma de los cuadrados dentro de los grupos (SS dentro de) es la media de la suma de las
desviaciones al cuadrado de las puntuaciones individuales dentro de los grupos o
condiciones de las medias de los grupos. Resulta que SS total lo que
= SSenentre
la práctica
+ SS dentro,
solo sepor
necesita calcular dos sumas de cuadrados; el tercero se puede encontrar por resta.
Estas sumas de cuadrados podrían calcularse tomando las desviaciones de los medios
apropiados, elevándolas al cuadrado y luego encontrando la suma, pero tal método requeriría
mucho tiempo y trabajo. Afortunadamente, las fórmulas computacionales permiten hacer los cálculos
más fácilmente, especialmente si se han encontrado los valores de X y X2 para cada grupo, como en
los datos presentes. La fórmula para encontrar la suma total de cuadrados es
2
2 T
SStotal = ÿÿ ÿ X (B.17)
norte
donde X2 significa que cada puntuación dentro de cada grupo está elevada al cuadrado (X2 ) y
todos estos valores elevados al cuadrado se suman, por lo que. X2
Hay dos signos de suma separados,
uno para sumar los valores cuadrados dentro de los grupos y otro para luego sumar estos X2 en
los diferentes grupos. La T es para el total de todos los puntajes; N aquí es el número total de
puntuaciones en el experimento. Entonces SStotal en nuestro ejemplo se calcula de la siguiente
manera:
2
2 T
SS = X ÿ
totales
norte
2
( 133++)175 249
SS totales
1819 3115 6351 =++ÿ
30
310 249
,
SStotal = 11 ,285 ÿ
30
SStoda = 11 ,285
yo
,. 10 341 63 ÿ
SStotal = 943 37
.
La suma de cuadrados entre grupos se calcula con la siguiente fórmula:
2 2
X T (B.18)
SSentre = ÿ(ÿ ) ÿ
norte norte
continuado

Recuadro B.7
continuado La primera parte de la fórmula significa que la suma de los valores de cada grupo se eleva al
cuadrado y luego se divide por el número de observaciones en las que se basa, o (X)
2 2
/ norte; luego, estos valores se suman entre los grupos, por lo que (X) / norte. los
La segunda parte de la fórmula es la misma que para el total de SS :
2 2
X T
= ÿ(ÿ )
SS entre
ÿ
norte norte
17 ,689 30 ,625 62 ,001

SSEntre = + + = 11 ,031 50
.
10 10 10
= 11 ,031 5. 0 10 341
, 63 .
SS entre
ÿ
= 689 87
.
SS entre
La suma de los cuadrados dentro de los grupos se puede encontrar restando SS entre del total de
compararlo directamente
SS , = 943.37. Esto
– 689.87
se hace
= 253.50
calculando
Pero como
un total
verificación,
SS , comotambién
en la Ecuación
vale la pena
B.16, para
cada grupo y sumando todas estas sumas de cuadrados para los grupos individuales. A menos que
haya cometido un error, esta cantidad debe ser igual a SS dentro de lo obtenido por resta.
Después de haber obtenido las diversas sumas de cuadrados, es conveniente construir

una tabla de análisis de varianza, como la que sigue. En la columna del extremo izquierdo
aparece la fuente de varianza o fuente. Tenga en cuenta que hay dos fuentes principales de
variación que nos interesa comparar: entre grupos y dentro de los grupos.
En la siguiente columna están el número de grados de libertad (df ). Estos se pueden

considerar como el número de puntajes que pueden variar libremente, dado que el total es fijo.
Para los grados de libertad entre grupos, si el total general es fijo, todos los grupos son libres de
variar excepto uno. Así que el df entre grupos es el número de grupos menos uno. Entonces, en
nuestro ejemplo, es 3 ÿ 1 = 2. El gl dentro de los grupos es igual al número total de puntajes
menos el número de grupos, porque hay un puntaje en cada grupo que no puede variar si el total
del grupo es fi fijo Entonces, el gl dentro de los grupos es 30 ÿ 3 = 27. El gl total es igual al gl entre
grupos más el gl dentro de los grupos .
La tercera columna contiene la suma de cuadrados (SS), que ya se han calculado. La cuarta
columna es para los cuadrados medios (MS), que se encuentran dividiendo el SS para cada fila
por el df. Cada cuadrado medio es una estimación de la varianza de la población, si la hipótesis
nula es verdadera. Pero si la variable independiente tuviera un efecto, el cuadrado medio entre
grupos debería ser mayor que el cuadrado medio dentro de los grupos.
Como ya se discutió en el texto, estos dos valores se comparan calculando una relación F ,
que se encuentra dividiendo el MS entre el MS dentro. Una vez que se calcula el valor de F , es
necesario determinar si el valor alcanza un nivel aceptable de significación estadística. Al observar
la Tabla F en el Apéndice C, podemos ver que para 2 y 26 grados de libertad (lo más cercano
que podemos llegar a 2 y 27), se necesita un valor F de 9.12 para el nivel de significancia de .001.
Nuestro valor F supera los 9,12, por lo que podemos concluir que los grupos variaron de forma
fiable en la velocidad de carrera debido a la variación de la variable independiente, la cantidad de
LSD inyectada.
continuado

Recuadro B.7
continuado
Fuente d.f. SS EM F pags
Entre grupos 2 689.87 344.94 36.73 <.001
Dentro de grupos 27 253.50 9.39

Total 29 943.37
Nota: Si calcula análisis de varianza con la ayuda de una calculadora, debe protegerse contra errores. Si alguna vez se te ocurre un
suma negativa de cuadrados dentro de los grupos (restando SSentre de SStotal), sabrá que ha cometido un error. No puedes
tienen una suma de cuadrados negativa. Debe calcular SSwithin tanto por resta como directamente, de todos modos, como verificación. Un error
común es confundir X2 (cuadrar cada número y luego sumar los cuadrados) con (X ) 2 , que es el cuadrado del total (X) de las puntuaciones.
Si el simple análisis de varianza indica que existe una variación confiable entre las condiciones de
un experimento, esto todavía no nos dice todo lo que nos gustaría saber.
En particular, sigue siendo de gran interés saber cuáles de las condiciones individuales varían entre sí.
Esto es especialmente importante en los casos en que la manipulación de variables independientes es
de naturaleza cualitativa. La variación cuantitativa de una variable independiente se refiere al caso
en el que se manipula la cantidad de una variable independiente (por ejemplo, la cantidad de LSD),
mientras que con la variación cualitativa, las condiciones varían pero no de una manera cuantitativa
fácil de especificar.
Un ejemplo de variación cualitativa es una manipulación instruccional en la que las diferentes
condiciones varían en las instrucciones que se dan al inicio del experimento. En tales casos, no es
suficiente simplemente decir que las condiciones varían de manera confiable entre sí. Es de interés
saber qué condiciones particulares difieren. Para responder a esta pregunta, necesitamos realizar
pruebas, después del simple análisis de varianza. En estas pruebas de seguimiento, las condiciones de
los experimentos se toman de dos en dos y se comparan para que podamos ver qué pares son
diferentes de manera confiable.
Se puede utilizar una gran variedad de pruebas estadísticas para este propósito. Podríamos realizar
análisis de varianza sobre grupos tomados como pares, lo que equivale a realizar pruebas t , pero
normalmente se realizan otras pruebas. Estos incluyen la prueba de Newman-Keuls, la prueba de
Scheffé, la prueba de rangos múltiples de Duncan, la prueba HSD (Diferencias honestamente
significativas) de Tukey y la prueba de Dunnett. Estos varían en sus suposiciones y su poder.
Debe consultar los textos estadísticos cuando necesite utilizar una prueba de seguimiento.
Análisis multifactorial de varianza Un aspecto frustrante del estudio del comportamiento es el

hecho de que rara vez hay explicaciones simples o de un factor. Incluso los comportamientos más
simples estudiados en situaciones de laboratorio se ven afectados por múltiples factores.
Para descubrir estos múltiples determinantes del comportamiento y cómo interactúan, debemos realizar
experimentos en los que se varíe más de un factor simultáneamente. El procedimiento apropiado para
analizar los resultados de tales experimentos es el análisis de varianza multifactorial. Esto puede
implicar el análisis de experimentos en los que interviene cualquier número de factores, pero en la
práctica, es raro encontrar más de cuatro variables de interés manipuladas simultáneamente. Con dos
factores, el análisis se denomina ANOVA de dos vías; donde hay tres factores, es un ANOVA de tres
vías; y así.
La importancia de estos diseños complejos que involucran más de un factor es que nos permiten
evaluar cómo pueden interactuar diferentes factores para producir un resultado experimental. Recuerde
que una interacción ocurre cuando el efecto de una variable experimental es

afectado por el nivel de la otra variable experimental (ver Capítulo 3). Si realizamos un experimento 2 2 (esto se
refiere a dos factores diferentes con dos niveles diferentes de cada factor) sobre la atracción interpersonal que
involucra el sexo del sujeto (masculino versus femenino) y el sexo del cómplice experimental a quien el sujeto iba a
evaluar, podría descubrir un efecto de interacción. Si la distancia entre el sujeto y la cómplice fuera una de las
variables dependientes, entonces podríamos encontrar que los sujetos masculinos tienden a estar más cerca de las
cómplices femeninas y las féminas más cerca de los cómplices masculinos. Este es un ejemplo de una interacción.
No existe una generalización simple sobre qué tan cerca estarán los sujetos masculinos o femeninos de un cómplice
en un experimento; depende del sexo del confederado.
Cuando realizamos un análisis de varianza complejo, descubrimos los efectos separados de cada factor en el
experimento (llamados efectos principales) y cómo las variables se afectan entre sí (llamados efectos de
interacción, o simplemente interacciones). Si las mujeres tendieran a estar más cerca del confederado que los
hombres, independientemente del sexo del confederado, esto sería un efecto principal del sexo del sujeto en la
distancia interpersonal. Y, nuevamente, una interacción sería el efecto diferente del sexo del sujeto, dependiendo del
sexo del cómplice.
No podemos dedicar espacio a explicar completamente cómo se realizan estos complejos análisis de varianza.
Brevemente, la SS intermedia se encuentra tal como está en el análisis de varianza simple o unidireccional, pero se
descompone en los efectos principales de las variables independientes y sus interacciones. Luego, los cuadrados
medios se calculan sobre la base de estas sumas de cuadrados dividiendo por el número apropiado de grados de
libertad, y F
Las proporciones se obtienen como antes. En el Cuadro B.8 se muestra un ejemplo.
El análisis de varianza es una prueba estadística paramétrica; por lo tanto, se incorporan supuestos en la
prueba sobre los parámetros de población que subyacen a las muestras. Los dos supuestos más importantes en el
tipo de análisis de varianza que estamos considerando (el modelo de efectos fijos) establecen que las observaciones
en cada condición se distribuyen normalmente y
Recuadro B.8
Cálculo de un Este experimento tuvo 40 sujetos. Se dividieron en cuatro grupos de 10, cada grupo representando
2 2 ANOVA una condición diferente. A dos grupos se les dieron palabras de alta imaginería para aprender, o
sobre los datos palabras que se refieren a objetos concretos que se visualizan fácilmente (por ejemplo, elefante, silla,
de una memoria automóvil). Los otros dos grupos recibieron palabras de baja imaginería, o que son abstractas y de las
Experimento que es difícil formar imágenes (como belleza, democracia, verdad). Los dos grupos que recibieron cada
tipo de palabra difirieron en las instrucciones de aprendizaje que recibieron. Se le dijo a un grupo de sujetos
en cada una de las dos condiciones de imágenes que repitieran cada palabra hasta que vieran aparecer la
siguiente palabra en la pantalla. Estos sujetos estaban en la condición de ensayo de memoria. Se instruyó
a los sujetos en la condición de ensayo elaborativo para que crearan imágenes mentales o asociaciones
significativas entre las palabras a medida que las aprendían. Por lo tanto, el experimento representa un
diseño factorial 2 2, siendo un factor el tipo de material estudiado (palabras con imágenes altas o bajas) y
el otro las instrucciones que se dieron a los sujetos (instrucciones de ensayo de elaboración o de memoria).
El diseño es entre sujetos, ya que en cada una de las cuatro condiciones participó un grupo diferente de
sujetos. El número de palabras recordadas por cada sujeto aparece en la siguiente tabla. Luego se detallan
los pasos involucrados en el análisis de varianza, que nos permiten analizar adecuadamente los resultados
del experimento.
continuado

Recuadro B.8
continuado
Palabras de alta imaginería Palabras con pocas imágenes
elaborativo Rutina elaborativo

Ensayo de memoria Ensayo Ensayo Ensayo
5 8 4 7
7 8 1 6
6 9 5 3
4 7 6 3
4 10 4 5
9 10 3 6
7 8 4 2
5 9 4 4
5 8 5 5
6 3 4
X58 _ 9 86 39 45
X 5,8 8.6 3.9 4.5
X2 358 X2 748 169 225
(358 . . . . 225) 1500 X228 _
Paso 1: Elevar al cuadrado la gran suma (X = 228) y dividir por el número total de
2
puntuaciones (40): (X) / N = (288)2 /40 = 1299,6 Este es el término de corrección.
2
Paso 2: SS Total = X2 – (X) / NORTE. Reste los resultados del Paso 1 de 1500:
1500 – 1299,6=200,4.
Paso 3: Imágenes SS. Obtenga la suma de todos los puntajes en cada condición de imágenes, eleve al
cuadrado cada suma, luego divida cada suma por el número de puntajes que arrojan cada suma, sume
los dos cocientes y luego reste los resultados del Paso 1 de la última suma.
Imágenes SS =( + ) +( + ) 582 /86 20 39 45 20 2/ ÿ
Paso 1
2 2
1 44 84+
= ÿ
1299 6.
20
= 1389 6. 1299 6 ÿ
= 90
Paso 4: Ensayo SS . Esto se calcula de la misma manera que el Paso 3, excepto que basa sus
cálculos en la suma total de cada tipo de ensayo.
2 2
( 86
+ ) 45
+( 58
+ ) 39
Ensayo SS = ÿ
Paso 1
20
= 132 8 .5 1299 6 . ÿ
= 28 9.
Paso 5: Ensayo de imágenes SS. Cuadre la suma de cada grupo y sume los cuadrados. continuado

Recuadro B.8
continuado Luego divida cada suma por el número de puntajes en cada suma. Del último
resultado, reste el Paso 1, las Imágenes SS (Paso 3) y el Ensayo SS (Paso 4).
2222
+++
58 86 39 45
ISQ R × =
20
ÿÿÿ
paso1 3paso Paso 4
= 14306 /.10
. 1299 6 90 28 9
ÿ ÿÿ
= 12 .1
Paso 6: error SS. Reste cada tratamiento SS del total de SS .

SS Error 200.4 90 28.9 12.1
69.4
Paso 7: Determinación de los grados de libertad.
df Número total de compases menos uno (40 1) 39

df Imágenes Número de niveles de imágenes menos 1) 1
uno (2 df Ensayo Número de niveles de ensayo menos 1) 1
1)
uno (2 df IR df imágenes df ensayo (1 df Error 1
df total df imágenes df ensayo df IR
(39 1 1 1) 36
Tabla resumen de un ANOVA 2 2
Fuente SS d.f. EM F pags
Imágenes 90,0 1 90,0 46.6 .05

Ensayo 28,9 1 28,9 15.0 .05
Ensayo de imágenes 12.1 1 12.1 6.3 .05

Error 69.4 36 1.9
Paso 8: Cuadro resumen. Calcule los cuadrados medios (MS) dividiendo SS por el número
de df. Luego calcule las proporciones F dividiendo el tratamiento MS por el error MS .
Paso 9: Para determinar la significancia de la razón F , ingrese la Tabla estadística

F en el Apéndice C con el df para el numerador (en este caso siempre es 1) y con el
df para el denominador (df Error), que es 36 , para cualquier efecto que le interese.
Podemos concluir que el tipo de palabras y el tipo de ensayo infl uyeron en el
recuerdo. Pero debemos señalar que los efectos del tipo de palabra dependían del
tipo de ensayo (es decir, obtuvimos una interacción). El ensayo elaborado produjo
un mejor recuerdo que el ensayo de memoria, pero el efecto fue mayor en las
palabras con muchas imágenes que en las palabras con pocas imágenes.

que las varianzas dentro de los grupos de las diferentes condiciones son equivalentes. Esta última suposición
se denomina suposición de homogeneidad de la varianza . Se supone que la manipulación de las variables
independientes debería afectar la varianza entre grupos pero no la varianza dentro de los grupos. Los
estadísticos han demostrado que el análisis de varianza es una prueba estadística robusta, o una en la que
es poco probable que las violaciones de sus supuestos conduzcan a conclusiones erróneas. La mayoría de
los investigadores ni siquiera verifican las violaciones de los supuestos, pero incluso si lo hacen y encuentran
que se violan los supuestos, la mejor solución es simplemente emplear un nivel de confianza más conservador
(por ejemplo, 0,01 en lugar de 0,05). El hecho de que una manipulación haya infl uido en la varianza de las
diferentes condiciones experimentales puede ser muy interesante por derecho propio, porque indica que los
sujetos en la condición con la varianza alta fueron infl uidos de manera diferente por el tratamiento. Comprender
este hecho puede ser una pista para comprender el comportamiento en la situación.
2
Prueba de Independencia
La tabla B.8 muestra datos como los de la tabla 2.1, que ilustra las frecuencias con las que hombres y mujeres
seleccionaron carreras en cinco departamentos en una universidad pequeña. La hipótesis nula sostiene que
la elección de la carrera es independiente del sexo de una persona (no depende de él). Si las dos variables
son independientes, deberíamos ver frecuencias relativas aproximadamente equivalentes en cada una de las
celdas de la tabla B.8. Sin embargo, las frecuencias son diferentes y podemos usar la prueba de
2
independencia de chi-cuadrado ( ) para determinar si el sexo está relacionado con la elección de la carrera.
2 es como sigue:
La fórmula para determinar
2 2/ Y
(TÚ ) (B.19)
donde O se refiere a las frecuencias observadas (las que se muestran en cada celda de la Tabla B.8), 2
y E se refiere a las frecuencias esperadas para cada celda. Como se muestra en el Recuadro B.9, donde se
calcula, las frecuencias esperadas se calculan multiplicando el total de fila y columna para una celda en
particular y luego dividiendo ese multiplicando por el número total de frecuencias en la tabla. Entonces, para
las mujeres que seleccionan una especialidad en historia, las frecuencias esperadas serían (154 115)/378, lo
que equivale a 46,85. El cálculo completo se muestra en el Recuadro B.9.
ÿ TABLA B.8
Una tabla de contingencia de 2 5 que muestra las frecuencias con las que
hombres y mujeres seleccionaron carreras en cinco departamentos en una
universidad pequeña. Las frecuencias relativas (%) de hombres y mujeres en
cada especialidad se muestran entre paréntesis.
programa principal
Género Historia Psicología inglés Biología Ciencias económicas Total de filas
Mujeres 37(32,2%) 24 (64,9%) 41 (66,1%) 31(38,8%) 21(25%) 154

Hombres 78(67,8%) 13 (35,1%) 21(33,9%) 49(61,2%) 63(72%) 224
Columna Total 115 37 62 80 84 378

Recuadro B.9
2
Cálculo de para Paso 1: Calcular las frecuencias esperadas para cada celda.
los datos de la Mujeres (An ) × Historia (Al ) (115 × 154)/378 = 46,85
tabla B.8 W × Psicología (P) (37 × 154)/378 = 15,07
Ancho × Inglés (En) (62 × 154)/378 = 25,26
Ancho × Biología (G) (80 × 154)/378 = 32,59
W × Economía (Ec) (84 × 154)/378 = 34,22
Hombres (M) × H (115 × 224)/378 = 68,15
M×P (37 × 224)/378 = 21,90
M × En (62 × 224)/378 = 36,74
M×B (80 × 224)/378 = 47,41
M × Ce (84 × 224)/378 = 49,78
Paso 2: reste las frecuencias esperadas de las observadas, eleve al cuadrado cada diferencia y
divida esa diferencia por la frecuencia esperada para esa celda.
ancho x alto (37 ÿ 46,85)2 /46,85 = 97,02/46,85 = 2,07

ancho x profundidad (24 ÿ 15,07)2 /15,07 = 79,74/15,07 = 5,29
ancho x fondo (41 ÿ 25,26)2 /25,25 = 247,75/25,26 = 9,81
ancho × ancho (31 ÿ 32,59)2 /32,59 = 2,53/32,59 = 0,08
ancho × CE (21 ÿ 34,22)2 /34,22 = 174,77/34,22 = 5,11
M×A (78 ÿ 68,15)2 /68,15 = 97,02/68,15 = 1,42
M×P (13 ÿ 21,9)2 /21,9 = 79,21/21,9 = 3,62
M × En (21 ÿ 36,74)2 /36,74 = 247,75/36,74 = 6,74
M×B (49 ÿ 47,41)2 /47,41 = 2,53/47,41 = 0,05
M × CE (63 ÿ 49,78)2 /49,78 = 174,77/49,78 = 3,51
2
Paso 3: Suma los números del Paso 2 para obtener .
2
= 2,07 + 5,29 + 9,81 + 0,08 + 5,11 + 1,42 + 3,62 + 6,74 + 0,05 + 3,51 = 37,7
2
Paso 4: Verifique el significado de en la Tabla G del Apéndice C. Los grados de libertad para esta
estadística son el número de filas menos uno por el número de columnas menos uno. En este caso
los grados de libertad son (2 ÿ 1) × (5 ÿ 1) = 4. Para ser signi -
2
cant en p < .05, a con cuatro grados de libertad debe ser igual o mayor que
2
9.49. Debido a que nuestro = 37,7, supera el valor crítico. Tenemos una estadística significativa y
podemos rechazar la hipótesis nula de que el sexo y la elección de carrera son independientes.
ÿ MAL USO DE LAS ESTADÍSTICAS
Las estadísticas se utilizan con tanta frecuencia que parece posible reforzar cualquier discusión con ellas.
Son empleados por políticos, economistas, publicistas, psicólogos y muchos otros para apoyar diversos
puntos de vista, por lo que no es de extrañar que la gente haya tenido la impresión de que las estadísticas
pueden manipularse para cualquier propósito. Pero el adagio dice que "las estadísticas no mienten, los
estadísticos sí". En realidad, probablemente haya poco que temer de los propios estadísticos, porque su
sofisticación les permite diferenciar un argumento verdadero de uno falso basado en estadísticas. No obstante,
las estadísticas pueden ser mal utilizadas para crear una impresión falsa. Debe tener en cuenta algunos usos
indebidos comunes, para que no se deje engañar por ellos.

Uso de muestras pequeñas o sesgadas
Muchos comerciales de televisión nos engañan implícitamente con muestras pequeñas o sesgadas.
Los espectadores ven a una mujer a la que se le pide que pruebe dos marcas de detergente en la ropa
grasosa y manchada de hierba de su familia. Ella está enfrentando su producto habitual, BAF, contra
el nuevo Super Crud Remover (SCR). BAF entra en una lavadora, SCR entra en la otra, y luego se
muestra a la mujer exclamando por el mejor trabajo que hizo SCR. Locutor: "¿Estás convencido?"
Mujer: “Pues, sí. Siempre usaré Super Crud Remover de ahora en adelante.
Realmente quita la mugre de mi ropa”. Incluso haciendo la improbable suposición de que toda la
demostración no fue amañada, los observadores deberían saber mejor que no dejarse convencer por
una muestra tan pequeña (un caso). Si el “experimento” se repitiera honestamente con cien
consumidores, ¿eligirían todos ellos SCR? El anunciante trata de dejarnos con la impresión de que
debido a que esta mujer prefiere el producto, todos (la población) lo harán. Pero debemos tener cuidado
al asumir que algo es cierto de la población en general a partir de una muestra de uno.
Otro problema es que una muestra de personas encuestadas para un anuncio de este tipo podría
estar sesgada deliberadamente. Los anunciantes siempre están encuestando a grupos que
probablemente estén predispuestos a su favor de todos modos, como las personas que ya poseen el
producto. Los anunciantes preguntan a los consumidores: "¿Qué tan bien le gusta su Bass-o-matic?" y
luego mostrar una pequeña muestra de entrevistas que salieron bien desde el punto de vista del
fabricante. Sería más convincente tomar muestras de personas que nunca habían usado el producto y
probar el producto contra sus principales rivales. Dado que ahora más afirmaciones publicitarias en
televisión deben basarse en hechos, este tipo de comerciales se está utilizando cada vez más. En un
anuncio interesante, se pide a los propietarios de un tipo de automóvil de lujo que lo prueben contra un
automóvil de la competencia. Aquí hay un caso en el que se espera que la muestra analizada esté
sesgada contra el nuevo producto a favor del antiguo, por lo que si se encuentra una preferencia por el
nuevo producto, parece argumentar mucho más a favor del nuevo producto.
Cada vez que escuche acerca de las preferencias que han exhibido las personas, haga dos
preguntas sobre la muestra: (1) ¿Qué tan grande era? (2) ¿Cómo se eligió a las personas para estar en él?
El gráfico exagerado Una forma común de mostrar u ocultar diferencias en los gráficos es
exagerar los resultados que se grafican. Esto implica cambiar la escala en el gráfico para mostrar una
diferencia o (más raramente) para ocultar una diferencia. Suponga que el número de asesinatos en
una ciudad aumentó de 72 a 80 a 91 durante tres años. El próximo año, la alcaldesa se postula para la
reelección y está ansiosa por demostrar que la ciudad ha estado segura durante los últimos tres años
bajo su administración. Entonces, los trabajadores de su campaña dibujan el gráfico que se muestra
en el lado izquierdo de la Figura B.5. Al hacer que la escala en el eje Y sea muy larga, crean la
impresión de que la tasa de homicidios es bastante estable. En el mismo año, la policía de la ciudad
argumenta que necesita niveles más altos de personal. Quieren mostrar que la ciudad se está volviendo
más insegura, por lo que muestran que la tasa de homicidios aumenta abruptamente al cambiar la
escala, como en el gráfico de la derecha de la figura B.5.
Los hechos se muestran con precisión en ambos grupos. Sin embargo, el gráfico de la izquierda
da la impresión de que la tasa de homicidios está aumentando muy gradualmente, por lo que no vale
la pena preocuparse. (¿No ha hecho el alcalde un buen trabajo al frente de la ciudad?) El gráfico de la
derecha, por otro lado, crea la impresión de que la tasa de homicidios está aumentando drásticamente.
(¿No necesitamos más policías?)
Estas técnicas gráficas son comunes. De hecho, se utilizan escalas exageradas en algunos de
los gráficos de este libro para mostrar patrones de resultados más claramente. Debería

240
200 90
160
asesinatos
Número
de
120 asesinatos
Número
de
80
80
40 70
0
2000 2001 2002 2000 2001 2002
Años Años
ÿ FIGURA B.5
Variación en escalas. El gráfico de la izquierda parece mostrar que la tasa de homicidios está
aumentando solo levemente, mientras que el de la derecha muestra que la tasa aumenta drásticamente.
Sin embargo, ambos gráficos muestran la tasa de homicidios con precisión: la diferencia es la escala en
el eje Y. Es importante examinar un gráfico con cuidado y anotar la escala de medida, ya que los
cambios de escala pueden hacer que las pequeñas diferencias parezcan grandes y viceversa.
siempre mire cuidadosamente la escala en un gráfico. Con datos experimentales, es más importante
determinar si una diferencia es estadísticamente confiable que determinar si la diferencia parece grande
cuando se grafica.
Comparaciones ausentes o inapropiadas

Una estratagema común utilizada en la publicidad es decir que algún producto tiene un x por ciento más de
algo bueno o un y por ciento menos de algo malo. “Compre el nuevo Thunderbolt, ya que ofrece un rendimiento
de gasolina un 27 por ciento mejor”. Esto suena convincente hasta que te detienes a preguntarte: "¿Veintisiete
por ciento mejor que qué?" Una comparación faltante aquí hace que la estadística no tenga ningún sentido.
Quizás el Thunderbolt obtenga un 27 por ciento más de millaje que un tanque de dos toneladas, lo que no es
un argumento para comprarlo.
Incluso cuando se hace una comparación específi ca, a menudo sigue siendo inapropiada. Con
frecuencia se afirma en la publicidad que un producto es mejor que el modelo del año pasado. “Compre el
Thunderbolt nuevo y mejorado. Obtiene un 27 por ciento más de millaje que el modelo del año pasado”. Por
supuesto, todavía podría ser un perro de verdad, incluso si es mejor que el perro del año pasado. Lo que
realmente le gustaría al consumidor es una comparación de la eficiencia de kilometraje del nuevo Thunderbolt
con otros autos nuevos en aproximadamente la misma clase, como ahora lo proporcionan las pruebas gubernam
Otro problema al hacer comparaciones es la falta de información sobre la confiabilidad de las diferencias.
En un comercial, dos automóviles de la misma marca y año se llenaron con un galón de gasolina y se probaron
a una velocidad constante en una pista. La diferencia en la prueba fue el tipo de gasolina utilizada. Un
automóvil se detuvo antes que el otro y se suponía que los espectadores debían concluir que la gasolina del
patrocinador era superior a la de la otra marca. Pero solo después de una larga serie de comparaciones, un
investigador podría probar estadísticamente una diferencia confiable entre los dos tipos de gas. Este es el
mismo problema que ocurre en el caso de comparar dos detergentes: la muestra de observaciones es
demasiado pequeña.
En general, observe para asegurarse de que en las declaraciones que implican una comparación, el
objeto de la comparación se describe y es apropiado. También debe haber alguna declaración acerca de si
las diferencias son estadísticamente confiables.

La falacia del jugador

Las pruebas estadísticas se basan en la teoría de la probabilidad: la teoría de las expectativas sobre
la probabilidad de eventos aleatorios. Es interesante notar que las percepciones de la gente sobre
la aleatoriedad de los eventos no concuerdan en algunos aspectos importantes con las ideas de la
teoría de la probabilidad. Las personas a menudo sacan conclusiones que parecen irracionales
cuando se las juzga según la lógica de la teoría de la probabilidad. Hay mucha investigación
interesante sobre este fenómeno (por ejemplo, Tversky & Kahneman, 1971, 1974). Aquí,
examinaremos uno de los errores más comunes en los juicios de probabilidad.
Imagina que una persona lanza una moneda 1000 veces. Si es una moneda justa, debería salir
cara unas 500 veces y cruz unas 500 veces. La probabilidad de que salga cara en un gran número
de intentos es de 0,50, pero, por supuesto, incluso una moneda justa probablemente no saldrá cara
exactamente 500 veces en 1000 lanzamientos: podría salir 490 o 505. Sin embargo, el resultado
está bastante cerca. Ahora, ¿qué pasa si la persona está apostando si la moneda saldrá cara o
cruz? Si la situación es verdaderamente aleatoria, un jugador tiene una probabilidad de 0,50 de
ganar en cualquier prueba en particular. Imagine que en cinco intentos seguidos, el jugador apuesta
cinco dólares a que la moneda saldrá cara y cada vez que salga cruz. Por supuesto, el hecho de
que la moneda salga cruz cinco veces seguidas es inusual, y las posibilidades de tal evento son
bastante bajas (0.03). El jugador nota este extraño suceso.
En la siguiente apuesta, dobla su apuesta a diez dólares y vuelve a apostar a cara. Ahora está más
seguro de que la moneda saldrá cara.
La lógica que utiliza el jugador es la siguiente. “La moneda es una moneda justa. En promedio,
saldrá cara la mitad de las veces y cruz la mitad de las veces. La moneda acaba de salir cruz cinco
veces seguidas. Por lo tanto, debe salir cara para igualar las cosas, porque en promedio saldrá cara
la mitad de las veces. Así que debería apostar a cara e incluso aumentar mi apuesta”. En términos
más generales, la lógica es: "Si el juego es realmente aleatorio y estoy perdiendo, entonces debo
seguir jugando, porque mi suerte cambiará para mejor".
Este tipo de lógica hace que los casinos de apuestas en Las Vegas y Atlantic City sigan funcionando
y acaba con las fortunas de personas inteligentes.
La falacia del argumento está en la aplicación de las leyes de la probabilidad, como una moneda
justa que sale cara la mitad de las veces, que se cumplen solo en un número tremendamente grande
de eventos. Las leyes no se pueden aplicar a tiradas pequeñas. Lo que el jugador pasa por alto es
que los lanzamientos de la moneda son eventos independientes; lo que sucedió en los lanzamientos
anteriores no infl uye en lo que sucede a continuación. Si la moneda salió cruz cinco veces seguidas,
esto no aumenta la probabilidad de cara en el siguiente lanzamiento. Todavía es 0,50. La moneda
no tiene memoria de intentos anteriores, como parece suponer implícitamente el jugador. El jugador
no debería sentirse más seguro en la sexta prueba que en las primeras cinco. La probabilidad de
que salgan caras no ha cambiado.
En cierto sentido, el error del jugador es natural. Hay un tono de verdad en el argumento, y se
basa en leyes verdaderas de probabilidad. En una serie muy grande de lanzamientos, una moneda
justa saldrá cara el 50 por ciento de las veces. El error viene al aplicar a una serie pequeña lo que
es cierto sobre una serie muy grande de eventos. Las leyes tampoco se aplican a pequeñas series
de eventos aleatorios. Con, digamos, 10 millones de lanzamientos de monedas, saldrá cara casi
exactamente el 50 por ciento de las veces. Pero si un jugador toma una serie pequeña del número
más grande, digamos, cinco lanzamientos, podría salir cara cero o cinco veces con una probabilidad
de 0.06. Estos resultados (todo cara o todo cruz) no son terriblemente probables, pero tampoco son
extremadamente pequeños.

ÿ RESUMEN
1. La comprensión de algunos principios elementales sobre control, difieren entre sí, usamos la prueba t o la prueba U de
estadística es crucial para la realización de investigaciones Mann-Whitney , que se aplican cuando se emplean dos
psicológicas. Hay dos ramas de la estadística, descriptiva e grupos independientes de sujetos, y la prueba de signos, la
inferencial. prueba t y la prueba de rangos con signo de Wilcoxon, que
2. Las estadísticas descriptivas se utilizan para resumir y se aplican cuando las medidas en las dos condiciones están
organizar datos sin procesar. Existen métodos gráficos para relacionadas (ya sea mediante el uso de un diseño dentro de
hacerlo, como histogramas y polígonos de frecuencia. Sin los sujetos o mediante el emparejamiento de sujetos). Las
embargo, las medidas de resumen primarias son las de pruebas de Mann-Whitney y Wilcoxon son pruebas estadísticas
tendencia central de una distribución y dispersión de una no paramétricas, ya que no hacen suposiciones acerca de
distribución. los parámetros de la población que subyacen a las
3. La principal medida de tendencia central es la media de la observaciones de la muestra que en realidad se utilizan. Para
distribución, o lo que suele llamarse el promedio de las determinar qué tan equivocada está la hipótesis nula, se
puntuaciones. A veces se utiliza la mediana (la puntuación calcula una medida de la magnitud del efecto de la variable
más media), especialmente para distribuciones con independiente. Esta medida suele adoptar la forma de un
puntuaciones extremas. Las principales medidas de dispersión coeficiente de correlación. un considerable
son la desviación estándar y la varianza. La desviación la magnitud del efecto sin significación estadística sugiere
estándar se utiliza más de que puede ser necesario un tamaño de muestra más grande
diez en estadística descriptiva, y la varianza se usa para rechazar la hipótesis nula.
principalmente en estadística inferencial. Se supone que la 6. El análisis de varianza es el procedimiento estadístico
mayoría de las distribuciones en psicología son normales, lo importante que se usa para hacer comparaciones entre más
que significa que la media y la mediana caen en el mismo de dos grupos. El análisis de varianza simple se usa para
lugar; que la distribución sea simétrica; y que una cierta probar la confiabilidad cuando se manipula una variable
proporción de puntajes cae bajo cada parte de la curva normal. independiente. Los análisis multifactoriales más complicados
se utilizan cuando dos o más variables independientes se
4. La estadística inferencial nos permite hacer inferencias manipulan simultáneamente. Estos diseños multifactoriales
sobre la fiabilidad de las diferencias entre condiciones. son especialmente importantes porque nos permiten evaluar
Queremos inferir de una muestra de puntajes cuál es el caso la interacción de los factores que determinan el comportamiento
para las poblaciones involucradas. En la estadística inferencial
se utiliza una gran variedad de pruebas. En todos se aplica
una lógica similar. Se prueba una hipótesis alternativa contra 7. Disraeli dijo que “hay tres tipos de mentiras: mentiras, malditas
la hipótesis nula, que sostiene que no hay diferencias entre mentiras y estadísticas”. Algunas formas en las que las
los grupos en el experimento. Se realizan cálculos que dan estadísticas pueden ser mal utilizadas incluyen sacar
lugar a un valor. Luego, este valor se compara con una conclusiones de muestras pequeñas o sesgadas; exagerar
distribución de valores en una tabla que nos informa qué nivel las escalas en los gráficos para efectos; hacer comparaciones
de confianza podemos inapropiadas; y suponiendo que las leyes de probabilidad que
se cumplen para muestras enormes de observaciones pueden
tienen al rechazar la hipótesis nula. generalizarse a muestras pequeñas (como en la falacia del
5. Usamos una prueba de puntaje z para comparar una muestra jugador). Las estadísticas en sí mismas no mienten, pero
con una población conocida para ver si la muestra proviene pueden usarse para dar impresiones engañosas.
de la misma población. Para determinar si dos grupos, uno
experimental y otro

ÿ TÉRMINOS CLAVE
desviación media absoluta curva normal
nivel alfa () análisis de varianza hipótesis nula
media aritmética entre grupos prueba estadística de una cola
varianza entre sujetos diseño parámetros
tendencia central chi-cuadrado pruebas paramétricas
( ) prueba de independencia Coeficiente de correlación producto-momento de Pearson
grados de libertad estadística pearson _
2
descriptiva prueba direccional
dispersión distribución de punto biserial
medias muestrales eta ( ) hipótesis experimental población poder
de una prueba estadística
variación cualitativa variación
cuantitativa muestreo aleatorio
medidas relacionadas diseño
prueba estadística robusta
prueba f prueba
distribuciones de frecuencia de signos
polígonos de frecuencia de muestra análisis simple de
histogramas homogeneidad varianza desviación estándar error
de varianza estadística estándar de las puntuaciones
inferencial punto de inflexión estándar medias
efectos de interacción nivel de Estadísticas
confianza magnitud del efecto prueba t
efectos principales prueba de dos colas
error tipo I
error tipo II
Prueba U de Mann-Whitney varianza
mediana análisis Prueba de rangos con signo de
multifactorial de varianza prueba no Wilcoxon Varianza dentro de los grupos
direccional puntuaciones z
pruebas no parametricas
CONEXIONES WEB
Explore la presentación paso a paso de:
Tendencia Central y Variabilidad
Puntuaciones Z
Error estándar
Correlación
Prueba t para una muestra
Prueba t para entre grupos y grupos relacionados

sobre las actividades del Centro de Recursos de Psicología del Aprendizaje de Cengage, Estadísticas y Métodos de
Investigación en:
Puede encontrar un libro completo de estadísticas con un paquete de análisis y demostración en:
http://www.ruf.rice.edu/~lane/rvls.html
Este sitio contiene programas de análisis estadístico para casi cualquier problema estadístico aplicado:
http://members.aol.com/johnp71/javastat.html

APÉNDICE C
ESTADÍSTICO
MESAS
TABLA A
Proporciones del área bajo la curva normal
TABLA B
Valores críticos del estadístico U de la prueba de Mann-Whitney
TABLA C
Distribución para la Prueba de Signos
TABLA D
Valores críticos del estadístico T de Wilcoxon para los pares emparejados
Prueba de rangos con signo
TABLA E
Valores críticos de t
TABLA F
Valores críticos de la distribución F
TABLA G
2
Valores Críticos de la Distribución
TABLA H
Números al azar
59533_19_appendixC_p494-510.indd494 494 9533_19_appendixC_p494-510.indd494 494 28/03/08 /28/08

ÿ TABLA A
Proporciones del área bajo la curva normal

Cómo utilizar la Tabla A: Los valores de la Tabla A representan la proporción de
áreas en la curva normal estándar, que tiene una media de 0, una desviación
estándar de 1,00 y un área total igual a 1,00. Para usar la Tabla A, primero se
debe transformar la puntuación bruta en una puntuación z . La columna A representa
este puntaje z ; La columna B representa la distancia entre la media de la
distribución normal estándar (0) y la puntuación z ; y la Columna C representa la
proporción del área más allá de un z dado.
La columna A da la z positiva
puntaje.
La columna B da el área entre

la media y z. B
Dado que la curva es simétrica, las

áreas para puntajes z negativos son
Significar Con
las mismas que para puntajes z positivos.

unos.
La columna C da el área que está

más allá de z. C
Significar Con
(A) (B) (C) (A) (B) (C) (A) (B) (C)
área área área

entre área entre área entre área
Media más allá Media más allá Media más allá
Con yz Con Con yz Con Con yz Con
0.00 .0000 .5000 0.14 .0557 .4443 0.28 .1103 .3897

0.01 .0040 .4960 0.15 .0596 .4404 0.29 .1141 .3859
0.02 .0080 .4920 0.16 .0636 .4364 0.30 .1179 .3821
0,03 .0120 .4880 0.17 .0675 .4325 0.31 .1217 .3783
0,04 .0160 .4840 0.18 .0714 .4286 0.32 .1255 .3745
0.05 .0199 .4801 0.19 .0753 .4247 0,33 .1293 .3707
0.06 .0239 .4761 0.20 .0793 .4207 0,34 .1331 .3669
0.07 .0279 .4721 0.21 .0832 .4168 0,35 .1368 .3632
0.08 .0319 .4681 0.22 .0871 .4129 0,36 .1406 .3594
0.09 .0359 .4641 0,23 .0910 .4090 0.37 .1443 .3557
0.10 .0398 .4602 0,24 .0948 .4052 0.38 .1480 .3520
0.11 .0438 .4562 0.25 .0987 .4013 0,39 .1517 .3483
0.12 .0478 .4522 0.26 .1026 .3974 0,40 .1554 .3446
0.13 .0517 .4483 0.27 .1064 .3936 0.41 .1591 .3409
Continúa en la parte superior ÿ ÿÿ Continúa en la parte superior Continúa en la parte superior
de la columna siguiente. de la columna siguiente. de la página siguiente.

ÿ TABLA A
Continuado
(A) (B) (C) (A) (B) (C) (A) (B) (C)
área área área

0.42 .1628 .3372 0.87 .3078 .1922 1.32 .4066 .0934

0.43 .1664 .3336 0.88 .3106 .1894 1.33 .4082 .0918
0.44 .1700 .3300 0.89 .3133 .1867 1.34 .4099 .0901
0,45 .1736 .3264 0.90 .3159 .1841 1.35 .4115 .0885
0.46 .1772 .3228 0.91 .3186 .1814 1.36 .4131 .0869
0.47 .1808 .3192 0,92 .3212 .1788 1.37 .4147 .0853
0.48 .1844 .3156 0,93 .3238 .1762 1.38 .4162 .0838
0.49 .1879 .3121 0,94 .3264 .1736 1.39 .4177 .0823
0.50 .1915 .3085 0,95 .3289 .1711 1.40 .4192 .0808
0.51 .1950 .3050 0,96 .3315 .1685 1.41 .4207 .0793
0.52 .1985 .3015 0.97 .3340 .1660 1.42 .4222 .0778
0.53 .2019 .2981 0.98 .3365 .1635 1.43 .4236 .0764
0.54 .2054 .2946 0.99 .3389 .1611 1.44 .4251 .0749
0,55 .2088 .2912 1.00 .3413 .1587 1.45 .4265 .0735
0.56 .2123 .2877 1.01 .3438 .1562 1.46 .4279 .0721
0.57 .2157 .2843 1.02 .3461 .1539 1.47 .4292 .0708
0.58 .2190 .2810 1.03 .3485 .1515 1.48 .4306 .0694
0.59 .2224 .2776 1.04 .3508 .1492 1.49 .4319 .0681
0,60 .2257 .2743 1.05 .3531 .1469 1.50 .4332 .0668
0,61 .2291 .2709 1.06 .3554 .1446 1.51 .4345 .0655
0,62 .2324 .2676 1.07 .3577 .1423 1.52 .4357 .0643
0,63 .2357 .2643 1.08 .3599 .1401 1.53 .4370 .0630
0,64 .2389 .2611 1.09 .3621 .1379 1.54 .4382 .0618
0,65 .2422 .2578 1.10 .3643 .1357 1.55 .4394 .0606
0,66 .2454 .2546 1.11 .3665 .1335 1.56 .4406 .0594
0,67 .2486 .2514 1.12 .3686 .1314 1.57 .4418 .0582
0,68 .2517 .2483 1.13 .3708 .1292 1.58 .4429 .0571
0,69 .2549 .2451 1.14 .3729 .1271 1.59 .4441 .0559
0.70 .2580 .2420 1.15 .3749 .1251 1.60 .4452 .0548
0.71 .2611 .2389 1.16 .3770 .1230 1.61 .4463 .0537
0.72 .2642 .2358 1.17 .3790 .1210 1.62 .4474 .0526
0.73 .2673 .2327 1.18 .3810 .1190 1.63 .4484 .0516
0.74 .2704 .2296 1.19 .3830 .1170 1.64 .4495 .0505
0.75 .2734 .2266 1.20 .3849 .1151 1,65 .4505 .0495
0.76 .2764 .2236 1.21 .3869 .1131 1.66 .4515 .0485
0.77 .2794 .2206 1.22 .3888 .1112 1.67 .4525 .0475
0.78 .2823 .2177 1.23 .3907 .1093 1.68 .4535 .0465
0.79 .2852 .2148 1.24 .3925 .1075 1.69 .4545 .0455
0.80 .2881 .2119 1.25 .3944 .1056 1.70 .4554 .0446
0.81 .2910 .2090 1.26 .3962 .1038 1.71 .4564 .0436
0.82 .2939 .2061 1.27 .3980 .1020 1.72 .4573 .0427
0.83 .2967 .2033 1.28 .3997 .1003 1.73 .4582 .0418
0.84 .2995 .2005 1.29 .4015 .0985 1.74 .4591 .0409
0.85 .3023 .1977 1.30 .4032 .0968 1.75 .4599 .0401
0.86 .3051 .1949 1.31 .4049 .0951 1.76 .4608 .0392
Continúa en la parte superior ÿ ÿÿ Continúa en la parte superior Continúa en la parte superior
de la columna siguiente. de la columna siguiente. de la página siguiente.
Derechos de autor 2009 Cengage Learning. Reservados todos los derechos.

No se puede copiar, escanear o duplicar, en su totalidad o en parte.

ÿ TABLA A
Continuado
(A) (B) (C) (A) (B) (C) (A) (B) (C)
área área área

1.77 .4616 .0384 2.22 .4868 .0132 2.67 .4962 .0038

1.78 .4625 .0375 2.23 .4871 .0129 2.68 .4963 .0037
1.79 .4633 .0367 2.24 .4875 .0125 2.69 .4964 .0036
1.80 .4641 .0359 2.25 .4878 .0122 2.70 .4965 .0035
1.81 .4649 .0351 2.26 .4881 .0119 2.71 .4966 .0034
1.82 .4656 .0344 2.27 .4884 .0116 2.72 .4967 .0033
1.83 .4664 .0336 2.28 .4887 .0113 2.73 .4968 .0032
1.84 .4671 .0329 2.29 .4890 .0110 2.74 .4969 .0031
1.85 .4678 .0322 2.30 .4893 .0107 2.75 .4970 .0030
1.86 .4686 .0314 2.31 .4896 .0104 2.76 .4971 .0029
1.87 .4693 .0307 2.32 .4898 .0102 2.77 .4972 .0028
1.88 .4699 .0301 2.33 .4901 .0099 2.78 .4973 .0027
1.89 .4706 .0294 2.34 .4904 .0096 2.79 .4974 .0026
1,90 .4713 .0287 2.35 .4906 .0094 2.80 .4974 .0026
1.91 .4719 .0281 2.36 .4909 .0091 2.81 .4975 .0025
1.92 .4726 .0274 2.37 .4911 .0089 2.82 .4976 .0024
1.93 .4732 .0268 2.38 .4913 .0087 2.83 .4977 .0023
1.94 .4738 .0262 2.39 .4916 .0084 2.84 .4977 .0023
1,95 .4744 .0256 2.40 .4918 .0082 2.85 .4978 .0022
1.96 .4750 .0250 2.41 .4920 .0080 2.86 .4979 .0021
1.97 .4756 .0244 2.42 .4922 .0078 2.87 .4979 .0021
1.98 .4761 .0239 2.43 .4925 .0075 2.88 .4980 .0020
1.99 .4767 .0233 2.44 .4927 .0073 2.89 .4981 .0019
2.00 .4772 .0228 2.45 .4929 .0071 2.90 .4981 .0019
2.01 .4778 .0222 2.46 .4931 .0069 2.91 .4982 .0018
2.02 .4783 .0217 2.47 .4932 .0068 2.92 .4982 .0018
2.03 .4788 .0212 2.48 .4934 .0066 2.93 .4983 .0017
2.04 .4793 .0207 2.49 .4936 .0064 2.94 .4984 .0016
2.05 .4798 .0202 2.50 .4938 .0062 2.95 .4984 .0016
2.06 .4803 .0197 2.51 .4940 .0060 2.96 .4985 .0015
2.07 .4808 .0192 2.52 .4941 .0059 2.97 .4985 .0015
2.08 .4812 .0188 2.53 .4943 .0057 2.98 .4986 .0014
2.09 .4817 .0183 2.54 .4945 .0055 2.99 .4986 .0014
2.10 .4821 .0179 2.55 .4946 .0054 3.00 .4987 .0013
2.11 .4826 .0174 2.56 .4948 .0052 3.01 .4987 .0013
2.12 .4830 .0170 2.57 .4949 .0051 3.02 .4987 .0013
2.13 .4834 .0166 2.58 .4951 .0049 3.03 .4988 .0012
2.14 .4838 .0162 2.59 .4952 .0048 3.04 .4988 .0012
2.15 .4842 .0158 2.60 .4953 .0047 3.05 .4989 .0011
2.16 .4846 .0154 2.61 .4955 .0045 3.06 .4989 .0011
2.17 .4850 .0150 2.62 .4956 .0044 3.07 .4989 .0011
2.18 .4854 .0146 2.63 .4957 .0043 3.08 .4990 .0010
2.19 .4857 .0143 2.64 .4959 .0041 3.09 .4990 .0010
2.20 .4861 .0139 2.65 .4960 .0040 3.10 .4990 .0010
2.21 .4864 .0136 2.66 .4961 .0039 3.11 .4991 .0009
Continúa en la parte superior ÿ ÿÿ Continúa en la parte superior
de la columna siguiente.
Continúa en la parte superior
de la página siguiente.
de la columna siguiente.

ÿ TABLA A
Continuado
(A) (B) (C) (A) (B) (C) (A) (B) (C)
área área área

3.12 .4991 .0009 3.20 .4993 .0007 3.40 .4997 .0003
3.13 .4991 .0009 3.21 .4993 .0007 3.45 .4997 .0003
3.14 .4992 .0008 3.22 .4994 .0006 3.50 .4998 .0002
3.15 .4992 .0008 3.23 .4994 .0006 3.60 .4998 .0002
3.16 .4992 .0008 3.24 .4994 .0006 3.70 .4999 .0001
3.17 .4992 .0008 3.25 .4994 .0006 3.80 .4999 .0001
3.18 .4993 .0007 3.30 .4995 .0005 3.90 .49995 .00005
3.19 .4993 .0007 3.35 .4996 .0004 4.00 .49997 .00003
Continúa en la parte superior ÿ Continúa en la parte superior ÿ

de la columna siguiente. de la columna siguiente.
ÿ TABLA B
Valores críticos del estadístico U de la prueba de Mann-Whitney

Para usar estas tablas, primero decida qué nivel de significancia desea con una
prueba de una o dos colas. Por ejemplo, si desea p .05, dos colas, use (c). Luego
ubique el número de casos o medidas (n) en ambos grupos en la subtabla
particular que haya elegido. El valor U que ha calculado debe ser menor que el
del lugar correspondiente en la tabla. Por ejemplo, si tuviera 18 sujetos en cada
grupo de un experimento y calculara U 90, entonces podría concluir que la
hipótesis nula se puede rechazar, porque el valor crítico de U con grupos de
estos tamaños es 99 [consulte la subtabla (c) ].
(a) Valores críticos de U para una prueba de una cola en .001 o para una prueba de dos colas en .002
n1/n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1
2
0 0 0 0
34 0 0 0 1 1 1 2 2 3 3
5 1 1 2 2 3 4 5 5 36 7 7
6 2 3 4 4 5 36 7 8 9 10 11 12
7 3 5 6 7 8 9 10 11 13 14 15 dieciséis
8 5 6 8 9 11 12 14 15 17 18 20 21
9 7 8 10 12 14 15 17 19 21 23 25 26
10 8 10 12 14 17 19 21 23 25 27 29 32
11 10 12 15 17 20 22 24 27 29 32 34 37
12 12 14 17 20 23 25 28 31 34 37 40 42
13 14 17 20 23 26 29 32 35 38 42 45 48
14 15 19 22 25 29 32 36 39 43 46 50 54
15 17 21 24 28 32 36 40 43 47 51 55 59
dieciséis 19 23 27 31 35 39 43 48 52 56 60 sesenta y cinco
17 21 25 29 34 38 43 47 52 57 61 66 70
18 23 27 32 37 42 46 51 56 61 66 71 76
19 25 29 34 40 45 50 55 60 66 71 77 82
20 26 32 37 42 48 54 59 65 70 76 82 88
Continuado

ÿ TABLA B
Continuado
(b) Valores críticos de U para una prueba de una cola en .01 o para una prueba de dos colas en .02
n1 n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1
2 00000 0 1 1
3 111222334 4 5 9 9 4 5
4 3 3 4 5 6 7 7 8 9 10
5 5 6 7 8 10 11 12 13 14 15 dieciséis
6 7 8 9 11 12 13 15 dieciséis 18 19 20 22
7 9 11 12 14 dieciséis 17 19 21 23 24 26 28
8 11 13 15 17 20 22 24 26 28 30 32 34
9 14 dieciséis 18 21 23 26 28 31 33 36 38 40
10 dieciséis 19 22 24 27 30 33 36 38 41 44 47
11 18 22 25 28 31 34 37 41 44 47 50 53
12 21 24 28 31 35 38 42 46 49 53 56 60
13 23 27 31 35 39 43 47 51 55 59 63 67
14 26 30 34 38 43 47 51 56 60 65 69 73
15 28 33 37 42 47 51 56 61 66 70 75 80
dieciséis 31 36 41 46 51 56 61 66 71 76 82 87
17 33 38 44 49 55 60 66 71 77 82 88 93
18 36 41 47 53 59 65 70 76 82 88 94 100
19 38 44 50 56 63 69 75 82 88 94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114
(c) Valores críticos de U para una prueba de una cola en .025 o para una prueba de dos colas en .05
n1 n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1
2 001111 1 1 2 2 2 2
3 233445 5 6 6 7 7 8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 dieciséis 17 19 21 22 24 25 27
7 12 14 dieciséis 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 sesenta y cinco 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
dieciséis 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 sesenta y cinco 72 78 85 92 99 106 113 119

20 48 55 62 69 76 83 90 98 105 112 119 127
Continuado

ÿ TABLA B
Continuado
(d) Valores críticos de U para una prueba de una cola en .05 o para una prueba de dos colas en .10
n1 n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1 0 0
2 1112 2 2 3 4 4 4
3 3 4 5 6 7 37 8 3 9 10 11
4 6 7 8 5 10 11 12 14 9 15 dieciséis 17 18
5 9 11 12 9 15 dieciséis 18 19 20 22 23 25
6 12 14 dieciséis 13 17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 26 28 31 33 36 39 41 44 47
9 21 24 27 30 33 36 39 42 45 48 51 54
10 24 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 57 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37 42 47 51 56 61 65 70 75 80 84
14 36 41 46 51 56 61 66 71 77 82 87 92
15 39 44 50 55 61 66 72 77 83 88 94 100
dieciséis 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 94 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138
Fuente: Adaptado con autorización de “Extended Tables for the Mann-Whitney Statistic”, de D. Aube, 1953, Bulletin of the Institute of Educational
Investigación en la Universidad de Indiana 1, No. 2, Tablas 1, 3, 5 y 7. Tomado de Estadísticas no paramétricas para las ciencias del comportamiento, por S. Siegel, 1956,
Nueva York: McGraw-Hill Book Company.



ÿ TABLA E
Valores críticos de t
Para encontrar el valor apropiado de t, lea la fila que contiene el número
de grados de libertad en su experimento. Las columnas están determinadas
por el nivel de significancia que ha elegido, y las entradas de las celdas son
los valores críticos para cada df en cada nivel de probabilidad. El valor de t
que obtenga debe ser igual o mayor que el de la tabla para que sea
significativo. Por ejemplo, con df 15 y p .05 (prueba de dos colas), su t debe
ser mayor o igual a 2.131.
Nivel de significancia para una prueba de una cola
.25 .10 .05 .025 .01 .005 .0025 .001
Nivel de significación para una prueba de dos colas
d.f. .50 .20 .10 .05 .02 .01 .005 .002
1 1.000 3.078 6.314 12.706 31.821 63.657 127.321 318.309

2 0.816 1.886 2.920 4.303 6.965 9.925 14.089 22.327
3 0.765 1.638 2.353 3.182 4.541 5.841 7.453 10.214
4 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173
5 0.727 1.476 2.015 2.571 3.365 4.032 4.773 5.893
6 0.718 1.440 1.943 2.447 3.143 3.707 4.317 5.208
7 0.711 1.415 1.895 2.365 2.998 3.499 4.029 4.785
8 0.706 1.397 1.880 2.306 2.896 3.366 3.833 4.501
9 0.703 1.383 1.833 2.262 2.821 3.256 3.690 4.297
10 0.700 1.372 1.812 2.228 2.764 3.169 3.581 4.144
11 0.697 1.363 1.796 2.201 2.718 3.106 3.497 4.025
12 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.930
13 0.694 1.350 1.771 2.160 2.650 3.012 3.372 3.852
14 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787
15 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733
dieciséis 0.690 1.337 1.746 2.120 2.583 2.921 3.252 3.686
17 0.689 1.333 1.740 2.110 2.567 2.898 3.223 3.646
18 0.688 1.330 1.734 2.101 2.552 2.878 3.197 3.610
19 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579
20 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552
21 0.686 1.323 1.721 2.080 2.518 2.831 3.135 3.527
22 0.686 1.321 1.717 2.074 2.508 2.819 3.119 3.505
23 0.685 1.319 1.714 2.069 2.500 2.807 3.104 3.485
24 0,685 1.318 1.711 2.064 2.492 2.797 3.090 3.467

25 0,684 1.316 1.708 2.060 2.485 2.787 3.078 3.450
26 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435
27 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421
28 0,683 1.313 1.701 2.048 2.467 2.763 3.047 3.408
29 0,683 1.311 1.699 2.045 2.462 2.756 3.038 3.396
30 0,683 1.310 1.697 2.042 2.457 2.750 3.030 3.385
35 0,682 1.306 1.690 2.030 2.438 2.724 2.996 3.340
40 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307
45 0.680 1.301 1.679 2.014 2.412 2.690 2.952 3.281
50 0,679 1.299 1.676 2.009 2.403 2.678 2.937 3.261
55 0,679 1.297 1.673 2.004 2.396 2.668 2.925 3.245
60 0,679 1.296 1.671 2.000 2.390 2.668 2.915 3.232
70 0,678 1.294 1.667 1.994 2.381 2.648 2.899 3.211
Continuado

ÿ TABLA E
Continuado
Nivel de significancia para una prueba de una cola
.25 .10 .05 .025 .01 .005 .0025 .001
Nivel de significación para una prueba de dos colas
d.f. .50 .20 .10 .05 .02 .01 .005 .002
80 0.678 1.292 1.664 1.990 2.374 2.639 2.877 3.195

90 0.677 1.291 1.662 1.987 2.368 2.632 2.878 3.183
100 0.677 1.290 1.660 1.984 2.364 2.626 2.871 3.174
.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090
Fuente: la tabla E se tomó de "Tablas extendidas de los puntos porcentuales de la distribución t de Student", de ET Federighi, 1959, Journal of the American
Asociación Estadística, 54, 683–688. Se reproduce con permiso de la Asociación Estadounidense de Estadística. Reservados todos los derechos.
ÿ TABLA F
Valores críticos de la distribución F

Encuentre la ubicación de los valores apropiados en la tabla buscando los
grados de libertad en el numerador y el denominador de la razón F. Después
de haber decidido el nivel de significación deseado, la relación F obtenida debe
ser mayor que la de la tabla. Por ejemplo, con p .05 y 9 df
en el numerador y 28 en el denominador, su valor F debe ser mayor a 2.24 para
ser confiable.
df para numerador
para _
Denominador 1 2 345678 9
.25 2.02 2.28 2.36 2,39 2.41 2.42 2.43 2.44 2.44
.10 5.54 5.46 5.39 5,34 5.31 5.28 5.27 5.25 5.24
3 .05 10.1 9,55 9,28 9.12 9,01 8,94 8,89 8.85 8.81
.025 17.4 16,0 15,4 15.1 14,9 14,7 14,6 14.5 14.5
.01 34.1 30.8 29.5 28.7 28.2 27,9 27.7 27.5 27.4
.001 167 148 141 137 135 133 132 131 130
.25 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08
.10 4.54 4,32 4,19 4.11 4.05 4.01 3,98 3,95 3.94
4 .05 7.71 6,94 6,59 6,39 6.26 6.16 6,09 6,04 6.00
.025 12.2 10,6 9,98 9,60 9.36 9.20 9.07 8,98 8.90
.01 21.2 18.0 16,7 16,0 15.5 15.2 15.0 14,8 14.7
.001 74.1 61.2 56.2 53.4 51.7 50.5 49.7 49.0 48.5
.25 1,69 1.85 1.88 1.89 1,89 1,89 1.89 1,89 1.89
.10 4,06 3.78 3,62 3.52 3,45 3,40 3,37 3,34 3.32
5 .05 6.61 5,79 5,41 5.19 5.05 4,95 4,88 4,82 4.77
.025 10.0 8,43 7.76 7,39 7.15 6,98 6.85 6.76 6.68
.01 16,3 13.3 12.1 11,4 11.0 10.7 10.5 10,3 10.2
.001 47,2 37.1 33.2 31.1 29.8 28.8 28.2 27,6 27.2
Continuado

ÿ TABLA F
Continuado
df para numerador
para _
.25 1.62 1,76 1.78 1.79 1.79 1.78 1.78 1.78 1.77
.10 3.78 3,46 3,29 3.18 3.11 3.05 3.01 2.98 2.96
6 .05 5.99 5.14 4,76 4,53 4.39 4.28 4.21 4,15 4.10
.025 8.81 7.26 6,60 6,23 5.99 5.82 5,70 5,60 5.52
.01 13.8 10.9 9.78 9.15 8.75 8.47 8,26 8.10 7.98
.001 35.5 27,0 23.7 21,9 20.8 20.0 19.5 19.0 18.7
.25 1.57 1,70 1.72 1,72 1.71 1.71 1.70 1.70 1.69
.10 3.59 3,26 3.07 2,96 2.88 2.83 2.78 2.75 2.72
7 .05 5.59 4,74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
.025 8.07 6,54 5.89 5.52 5,29 5.12 4,99 4,90 4.82
.01 12.2 9.55 8.45 7.85 7,46 7.19 6,99 6,84 6.72
.001 29.2 21.7 18.8 17.2 16,2 15.5 15.0 14.6 14.3
.25 1,54 1.66 1.67 1.66 1.66 1,65 1.64 1.64 1.63
.10 3,46 3.11 2.92 2.81 2,73 2,67 2.62 2.59 2.56
8 .05 5.32 4.46 4.07 3.84 3,69 3,58 3.50 3.44 3.39
.025 7.57 6.06 5.42 5.05 4.82 4,65 4,53 4,43 4.36
.01 11.3 8.65 7.59 7.01 6.63 6,37 6,18 6,03 5.91
.001 25.4 18.5 15.8 14.4 13.5 12.9 12.4 12.0 11.8
.25 1,51 1.62 1.63 1,63 1.62 1.61 1.60 1.60 1.59
.10 3,36 3.01 2.81 2,69 2.61 2.55 2.51 2.47 2.44
9 .05 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
.025 7.21 5.71 5,08 4.72 4.48 4.32 4.20 4.10 4.03
.01 10.6 8.02 6,99 6.42 6.06 5.80 5.61 5.47 5.35
.001 22,9 16.4 13.9 12.6 11.7 11.1 10.7 10.4 10.1
.25 1.49 1.60 1.60 1,59 1.59 1,58 1.57 1.56 1.56
.10 3,29 2.92 2.73 2,61 2.52 2,46 2.41 2.38 2.35
10 .05 4,96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02
.025 6,94 5,46 4,83 4.47 4.24 4.07 3.95 3,85 3.78
.01 10.0 7,56 6,55 5.99 5.64 5.39 5.20 5,06 4.94
.001 21.0 14.9 12,6 11.3 10.5 9.92 9.52 9.20 8.96
.25 1.47 1,58 1,58 1.57 1.56 1.55 1.54 1.53 1.53
.10 3.23 2,86 2,66 2.54 2.45 2.39 2.34 2.30 2.27
.05 4.84 3,98 3,59 3.36 3.20 3.09 3,01 2,95 2.90
11 .025 6.72 5,26 4,63 4.28 4.04 3.88 3,76 3,66 3.59
.01 9.65 7.21 6,22 5.67 5.32 5.07 4,89 4.74 4.63
.001 19.7 13.8 11.6 10.4 9.58 9.05 8,66 8.35 8.12
.25 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.51 1.51
.10 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21
.05 4.75 3.89 3.49 3.26 3.11 3.00 2,91 2.85 2.80
12 .025 6.55 5.10 4.47 4.12 3,89 3.73 3,61 3.51 3.44
.01 9,33 6.93 5.95 5.41 5,06 4.82 4,64 4.50 4.39
.001 18,6 13.0 10.8 9.63 8.89 8.38 8.00 7.71 7.48
.25 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49
.10 3,14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16
.05 4,67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
Continuado

ÿ TABLA F
Continuado
df para numerador
para _
13 .025 6.41 4,97 4.35 4.00 3,77 3,60 3.48 3.39 3.31
.01 9.07 6,70 5.74 5.21 4,86 4,62 4.44 4.30 4.19
.001 17.8 12.3 10.2 9.07 8.35 7.86 7.49 7.21 6.98
.25 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47
.10 3,10 2.73 2.52 2.39 2,31 2.24 2,19 2.15 2.12
.05 4,60 3,74 3.34 3.11 2,96 2.85 2,76 2.70 2.65
14 .025 6,30 4,86 4.24 3.89 3,66 3,50 3.38 3.29 3.21
.01 8,86 6.51 5.56 5,04 4,69 4,46 4.28 4.14 4.03
.001 17.1 11.8 9.73 8,62 7.92 7.43 7.08 6.80 6.58
.25 1.43 1.52 1.52 1,51 1.49 1.48 1,47 1.46 1.46
.10 3.07 2,70 2.49 2,36 2.27 2.21 2,16 2.12 2.09
.05 4,54 3,68 3.29 3,06 2.90 2.79 2.71 2.64 2.59
15 .025 6,20 4,77 4.15 3.80 3,58 3.41 3.29 3.20 3.12
.01 8.68 6,36 5.42 4.89 4,56 4.32 4.14 4.00 3.89
.001 16.6 11.3 9.34 8.25 7.57 7.09 6.74 6.47 6.26
.25 1.42 1,51 1,51 1.50 1.48 1.47 1.46 1.45 1.44
.10 3.05 2,67 2,46 2.33 2.24 2.18 2,13 2.09 2.06
.05 4,49 3,63 3.24 3.01 2.85 2.74 2,66 2.59 2.54
dieciséis .025 6,12 4,69 4.08 3.73 3.50 3.34 3.22 3.12 3.05
.01 8,53 6,23 5.29 4.77 4.44 4.20 4,03 3,89 3.78
.001 16,1 11.00 9.00 7.94 7.27 6.81 6,46 6,19 5.98
.25 1.42 1,51 1.50 1.49 1.47 1.46 1.45 1.44 1.43
.10 3.03 2,64 2.44 2,31 2.22 2.15 2.10 2.06 2.03
.05 4,45 3,59 3.20 2,96 2.81 2.70 2.61 2,55 2.49
17 .025 6,04 4,62 4.01 3,66 3.44 3.28 3.16 3,06 2.98
.01 8.40 6.11 5.18 4,67 4.34 4.10 3,93 3,79 3.68
.001 15.7 10.7 8.73 7,68 7.02 6.56 6,22 5,96 5.75
.25 1.41 1,50 1.49 1.48 1.46 1.45 1.44 1.43 1.42
.10 3.01 2,62 2.42 2.29 2.20 2,13 2.08 2.04 2.00
.05 4.41 3,55 3.16 2,93 2.77 2,66 2.58 2.51 2.46
18 .025 5.98 4,56 3.95 3,61 3.38 3.22 3.10 3.01 2.93
.01 8.29 6,01 5.09 4,58 4,25 4.01 3,84 3,71 3.60
.001 15.4 10.4 8.49 7,46 6,81 6.35 6,02 5,76 5.56
.25 1.41 1,49 1.49 1.47 1.46 1.44 1,43 1.42 1.41
.10 2.99 2,61 2.40 2.27 2.18 2.11 2,06 2.02 1.98
19 .05 4.38 3.52 3.13 2,90 2.74 2.63 2.54 2.48 2.42
.025 5.92 4.51 3.90 3,56 3.33 3.17 3.05 2,96 2.88
.01 8.18 5.93 5.01 4,50 4.17 3,94 3.77 3,63 3.52
.001 15.1 10.2 8.28 7,26 6.62 6,18 5.85 5.59 5.39
.25 1.40 1.49 1.48 1.47 1,45 1.44 1.43 1.42 1.41
.10 2.97 2.59 2.38 2.25 2,16 2,09 2.04 2.00 1.96
20 .05 4.35 3,49 3,10 2.87 2.71 2,60 2.51 2.45 2.39
.025 5.87 4,46 3,86 3.51 3.29 3.13 3.01 2,91 2.84
.01 8.10 5.85 4.94 4.43 4.10 3,87 3,70 3,56 3.46
.001 14.8 9.95 8.10 7.10 6.46 6,02 5,69 5.44 5.24
Continuado

ÿ TABLA F
Continuado
df para numerador
para _
.25 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39
.10 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93
22 .05 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
.025 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76
.01 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
.001 14.4 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99
.25 1.39 1.47 1.46 1.44 1.43 1.41 1.40 1.39 1.38
.10 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91
24 .05 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70
.01 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
.001 14.0 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80
.25 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37
.10 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88
26 .05 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
.025 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65
.01 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
.001 13.7 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64
.25 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37
.10 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1,90 1.87
28 .05 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
.025 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61
.01 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
.001 13.5 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50
.25 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36
.10 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85
30 .05 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57
.01 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
.001 13.3 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39
.25 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34
.10 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79
40 .05 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45
.01 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
.001 12.6 8.25 6.60 5.70 5.13 4.73 4.44 4.21 4.02
.25 1.35 1.42 1.41 1.38 1.37 1.35 1.33 1.32 1.31
.10 2.79 2.39 2.18 2.04 1,95 1.87 1.82 1.77 1.74
60 .05 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33
.01 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
.001 12.0 7.76 6.17 5.31 4.76 4.37 4.09 3.87 3.69
.25 1.34 1.40 1.39 1.37 1.35 1.33 1.31 1.30 1.29
.10 2.75 2.35 2.13 1.99 1,90 1.82 1.77 1.72 1.68
120 .05 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96
.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22
Continuado

ÿ TABLA F
Continuado
df para numerador
para _
.01 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
.001 11.4 7.32 5.79 4.95 4.42 4.04 3.77 3.55 3.38
.25 1.32 1.39 1.37 1.35 1.33 1.31 1.29 1.28 1.27
.10 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63
.05 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88
.025 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11
.01 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41
.001 10.8 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10
Fuente: Adaptado y resumido de Biometrika Tables for Statisticians, 2nd ed., vol. 1 (Cuadro 18), pág. 159–163, editado por ES Pearson y HO Hartley.
Copyright © 1958, Oxford University Press. Reimpreso con permiso de los fideicomisarios de Biometrika .
ÿ TABLA G
Valores Críticos de la Distribución

2
Encuentre el valor crítico ingresando a la tabla con el número de grados de

2
libertad [(# Rows – 1) (# Columns – 1)]. Un significado debe igualar o exceder
el valor de un
nivel de significado dado. Por ejemplo, con p .05 y gl 9,
2
debe ser mayor o igual a 16,92.
d.f. pág . 10 pág . 05 pág . 01
1 2.71 3.84 6.63

2 4.62 5.99 9.21
6.25 7.82 11.35
34 7.78 9.49 13.28
5 9,24 11.07 15.09
6 10,64 12.59 16.81
7 12.02 14.07 18.48
8 13,36 15.51 20.09
9 14,68 16.92 21.66
10 15.99 18.31 23.21

11 17.28 19.68 24.72
12 18.55 21.03 26.21
13 19.81 22.36 27.69

14 21.06 23.69 29.14
15 22,31 25.00 30.58
dieciséis 23,54 26.30 32.00
17 24,77 27.59 33.41
18 25,99 28.87 34.81
19 27.20 30,14 36.19

20 28.41 31,41 37.56
21 29.62 32,67 38.92
22 30.81 33.93 40.29
23 32.01 35,17 41.64

24 33,20 36,42 42.98
25 34,38 37,65 44.32
Fuente: Resumido de la tabla de Estadísticas fundamentales para las ciencias del comportamiento (3.ª ed.), por DC Howell, 1995, Belmont, CA: Duxbury.

ÿ TABLA H
Números al azar
12345678 9
1 32942 95416 42339 59045 26693 49057 87496 20624 14819

2 07410 99859 83828 21409 29094 65114 36701 25762 12827
3 59981 68155 45673 76210 58219 45738 29550 24736 09574

4 46251 25437 69654 99716 11563 08803 86027 51867 12116
65558 51904 93123 27887 53138 21488 09095 78777 71240

56 99187 19258 86421 16401 19397 83297 40111 49326 81686
7 35641 00301 16096 34775 21562 97983 45040 19200 16383

8 14031 00936 81518 48440 02218 04756 19506 60695 88494
9 60677 15076 92554 26042 23472 69869 62877 19584 39576
10 66314 05212 67859 89356 20056 30648 87349 20389 53805
11 20416 87410 75646 64176 82752 63606 37011 57346 69512
12 28701 56992 70423 62415 40807 98086 58850 28968 45297
13 74579 33844 33426 07570 00728 07079 19322 56325 84819
14 62615 52342 82968 75540 80045 53069 20665 21282 07768
15 93945 06293 22879 08161 01442 75071 21427 94842 26210

16 75689 76131 96837 67450 44511 50424 82848 41975 71663
17 02921 16919 35424 93209 52133 87327 95897 65171 20376
18 14295 34969 14216 03191 61647 30296 66667 10101 63203
19 05303 91109 82403 40312 62191 67023 90073 83205 71344
20 57071 90357 12901 08899 91039 67251 28701 03846 94589
21 78471 57741 13599 84390 32146 00871 09354 22745 65806
22 89242 79337 59293 47481 07740 43345 25716 70020 54005
23 14955 59592 97035 80430 87220 06392 79028 57123 52872

24 42446 41880 37415 47472 04513 49494 08860 08038 43624
25 18534 22346 54556 17558 73689 14894 05030 19561 56517
26 39284 33737 42512 86411 23753 29690 26096 81361 93099
27 33922 37329 89911 55876 28379 81031 22058 21487 54613
28 78355 54013 50774 30666 61205 42574 47773 36027 27174
29 08845 99145 94316 88974 29828 97069 90327 61842 29604

30 01769 71825 55957 98271 02784 66731 40311 88495 18821
31 17639 38284 59478 90409 21997 56199 30068 82800 69692

32 05851 58653 99949 63505 40409 85551 90729 64938 52403
33 42396 40112 11469 03476 03328 84238 26570 51790 42122
34 13318 14192 98167 75631 74141 22369 36757 89117 54998

35 60571 54786 26281 01855 30706 66578 32019 65884 58485
36 09531 81853 59334 70929 03544 18510 89541 13555 21168
37 72865 16829 86542 00396 20363 13010 69645 49608 54738

38 56324 31093 77924 28622 83543 28912 15059 80192 83964
39 78192 21626 91399 07235 07104 73652 64425 85149 75409
40 64666 34767 97298 92708 01994 53188 78476 07804 62404
41 82201 75694 02808 65983 74373 66693 13094 74183 73020
42 15360 73776 40914 85190 54278 99054 62944 47351 89098
43 68142 67957 70896 37983 20487 95350 16371 03426 13895
44 19138 31200 30616 14639 44406 44236 57360 81644 94761
45 28155 03521 36415 78452 92359 81091 56513 88321 97910
46 87971 29031 51780 27376 81056 86155 55488 50590 74514
47 58147 68841 53625 02059 75223 16783 19272 61994 71090
48 18875 52809 70594 41649 32935 26430 82096 01605 65846
49 75109 56474 74111 31966 29969 70093 98901 84550 25769

50 35983 03742 76822 12073 59463 84420 15868 99505 11426
51 12651 61644 11769 75109 86996 97669 25757 32535 07122
Continuado

ÿ TABLA H
Continuado
12345678 9
52 81769 74436 02630 72310 45049 18029 07469 42341 98173

53 36737 98863 77240 76251 00654 64688 09343 70278 67331
54 82861 54371 76610 94934 72748 44124 05610 53750 95938
55 21325 15732 24127 37431 09723 63529 73977 95218 96074
56 74146 47887 62463 23045 41490 07954 22597 60012 98866
57 90759 64410 54179 66075 61051 75385 51378 08360 95946
58 55683 98078 02238 91540 21219 17720 87817 41705 95785
59 79686 17969 76061 83748 55920 83612 41540 86492 06447
60 70333 00201 86201 69716 78185 62154 77930 67663 29529
61 14042 53536 07779 04157 41172 36473 42123 43929 50533
62 59911 08256 06596 48416 69770 68797 56080 14223 59199
63 62368 62623 62742 14891 39247 52242 98832 69533 91174
64 57529 97751 54976 48957 74599 08759 78494 52785 68526
sesenta y cinco 15469 90574 78033 66885 13936 42117 71831 22961 94225
66 18625 23674 53850 32827 81647 80820 00420 63555 74489
67 74626 68394 88562 70745 23701 45630 65891 58220 35442
68 11119 16519 27384 90199 79210 76965 99546 30323 31664
69 41101 17336 48951 53674 17880 45260 08575 49321 36191
70 32123 91576 84221 78902 82010 30847 62329 63898 23268
71 26091 68409 69704 82267 14751 13151 93115 01437 56945
72 67680 79790 48462 59278 44185 29616 76531 19589 83139
73 15184 19260 14073 07026 25264 08388 27182 22557 61501
74 58010 45039 57181 10238 36874 28546 37444 80824 63981
75 56425 53996 86245 32623 78858 08143 60377 42925 42815
76 82630 84066 13592 60642 17904 99718 63432 88642 37858
77 14927 40909 23900 48761 44860 92467 31742 87142 03607
78 23740 22505 07489 85986 74420 21744 97711 36648 35620
79 32990 97446 03711 63824 07953 85965 87089 11687 92414
80 05310 24058 91946 78437 34365 82469 12430 84754 19354
81 21839 39937 27534 88913 49055 19218 47712 67677 51889
82 08833 42549 93981 94051 28382 83725 72643 64233 97252
83 58336 11139 47479 00931 91560 95372 97642 33856 54825
84 62032 91144 75478 47431 52726 30289 42411 91886 51818
85 45171 30557 53116 04118 58301 24375 65609 85810 18620
86 91611 62656 60128 35609 63698 78356 50682 22505 01692
87 55472 63819 86314 49174 93582 73604 78614 78849 23096
88 18573 09729 74091 53994 10970 86557 65661 41854 26037
89 60866 02955 90288 82136 83644 94455 06560 78029 98768
90 45043 55608 82767 60890 74646 79485 13619 98868 40857
91 17831 09737 79473 75945 28394 79334 70577 38048 03607
92 40137 03981 07585 18128 11178 32601 27994 05641 22600
93 77776 31343 14576 97706 16039 47517 43300 59080 80392
94 69605 44104 40103 95635 05635 81673 68657 09559 23510
95 19916 52934 26499 09821 87331 80993 61299 36979 73599
96 02606 58552 07678 56619 65325 30705 99582 53390 46357
97 65183 73160 87131 35530 47946 09854 18080 02321 05809
98 10740 98914 44916 11322 89717 88189 30143 52687 19420
99 98642 89822 71691 51573 83666 61642 46683 33761 47542
100 60139 25601 93663 25547 02654 94829 48672 28736 84994

REFERENCIAS
Adams, JA (1972). Investigar Asociación Americana de Psicología

y el futuro de la psicología de la ción (2002). Principios éticos de los
ingeniería. Psicólogo americano, 27, psicólogos y código de conducta
615–622. 2002. Consultado en marzo
Adamson, RE (1952). Función 21, 2003, de http://www.apa.
fi jación cional en relación con org/ethics/code2002.html.
Resolución de problemas: Una Asociacion Americana de Psicologia.
repetición de tres experimentos. (2003a). Pautas de conducta ética
Revista de Psicología Experimental, 44, en el cuidado
288–291. y uso de animales. Recuperado el
Adler, R. (2001). Munología de la 21 de marzo de 2003, de http://
psiconeuroimía. Direcciones actuales www.apa.org/science/anguide .
en ciencia psicológica, 10, html
94–98. Asociación psicológica americana
Ader, R. y Cohen, N. (1982). ciación (2003b). Investigación con
Inmunosupresión conductualmente animales en psicología.
condicionada y lupus eritematoso Recuperado el 21 de marzo de 2003,
sistémico murino. de http://www.apa.org/science/
Ciencia, 215, 1534-1536. animal2.html .
Adler, SA, Gerhardstein, P., Amodio, DM, Harmon-Jones, E. y Devine,
& Rovee-Collier, C. (1998). P. (2003). Diferencias individuales en
¿Efectos de los niveles de la activación
procesamiento en la memoria infantil? y control de carrera afectiva
Child Development, 69, 280–294. sesgo evaluado por respuesta de
Ahn, W. y Graham, LM parpadeo de sobresalto y autoinforme.
(1999). El impacto de la necesidad Revista de Personalidad y Psicología
y la suficiencia en la tarea de Social, 84, 738–753.
selección de cuatro cartas de Wason. Amsel, A. (1994). Precisamente
Ciencias Psicológicas, 10, Teoría de la frustración: un análisis
237–242. del aprendizaje y la memoria
Asociacion Americana de Psicologia. disposicionales. Psychonomic Bulletin
(1987). Libro de casos sobre & Review, 1, 280–296.
cuestiones éticas. Washington, DC: Angell, JR (1907). la prueba
Autor. ince de la psicología funcional.
Asociacion Americana de Revisión psicológica, 14,
Psicologia. (2001). Manual de 61–91.
publicación de la Asociación Arnold, DH, Fisher, PH,
Americana de Psicología (5ª Ed.). Doctoroff, GL y Dobbs, J. (2002).
Washington DC: Autor. Acelerar el desarrollo matemático
en Head Start
511
59533_20_referencias_p511-527.ind511 511 9533_20_referencias_p511-527.ind511 511 3/5/08 /5/08

aulas Revista de Psicología Educativa, 94, Bevan, W. (1980). Al meterse en la cama con un león. Americano
762–770. Psicólogo, 35, 779–789.
Asch, SE (1951). Efecto de la presión grupal sobre la modificación y Bhalla, M. y Proffitt, DR (1999). Reca visomotora
distorsión del juicio. En H. Guetzknow (Ed.), Grupos, liderazgo libración en la percepción sesgada geográfica. Revista de
y hombres psicología experimental: percepción y rendimiento humanos, 25,
(págs. 117 a 190). Pittsburg: Carnegie. 1076–1096.
Asch, SE (1956). Estudios de independencia y confor Blaney, RH (1986). Afecto y memoria: una revisión. Boletín psicológico,
midad: I. Una minoría de uno contra una mayoría unánime. 99, 229–246.
Monografías Psicológicas, 70, 9 (Entero No. 416). Blass, T. (1999). El paradigma de Milgram después de 35 años:
Asch, SE (1958). Efectos de la presión grupal sobre la modificación y Algunas cosas que ahora sabemos acerca de la obediencia a la
distorsión de los juicios. En EE Maccoby, TM Newcomb y EL autoridad. Revista de Psicología Social Aplicada, 29, 955–978.
Hartley (Eds.), Lecturas de psicología social (3.ª ed., págs. 174– Blass, T. (2002). Obediencia a la autoridad: perspectivas actuales
183). Nueva York: Holt. sobre el paradigma de Milgram. Mahwah, Nueva Jersey:
Lawrence Erlbaum Associates.
Baker, T. (2006, noviembre). El Dr. Ambati es el más joven. Blaxton, TA (1989). Investigando disociaciones entre medidas de
cirujano voluntario en la historia del hospital de ojos voladores. memoria: Soporte para un marco de procesamiento apropiado
MSG Ciencia/ Noticias médicas. Facultad de Medicina de Georgia. para transferencias. Revista de Psicología Experimental:
Recuperado el 20 de julio de 2007, de http://www.mcg.edu/ Aprendizaje, Memoria y Cognición, 15,
noticias/2006NewsRel/Ambati091806.html. 657–668.
Balota, DA y Cortese, MJ (2000). Teorías en la cognición Blough, DS (1958). Un método para obtener umbrales psicofísicos
psicología tiva. En A. Kazdin (Ed.), La enciclopedia de la psicología. de palomas. Diario del Análisis Experimental del
Washington, DC: Asociación Americana de Psicología. Comportamiento, 1, 31–43.
Blough, DS (1961). Experimentos en psicofísica animal. Scientific
Peluquería, TX (1976). Trampas en la investigación humana: Diez American, 205, 32.
puntos fundamentales. Nueva York: Pérgamo. Blum, D. (2002). Amor en Goon Park: Harry Harlow y
Barber, TX y Silver, MJ (1968). Realidad, ficción y el efecto de sesgo del la ciencia del afecto (págs. 113–290). Nueva York: Berkeley.
experimentador. Suplemento de la monografía del Psychological Boneau, CA (1998). Hermann Ebbinghaus: En el camino
Bulletin, 70 (6, pt. 2), 1–29. para progresar o por el camino del jardín? En M. Wertheimer (Ed.),
Barker, RG (1968). Psicología ecológica. Stanford, CA: Prensa de la Retratos de pioneros en psicología, (Vol. 3, págs. 51–64). Washington,
Universidad de Stanford. DC: Psicología estadounidense
Barker, RG y Wright, HF (1951). El día de un niño. Asociación.
Nueva York: Harper and Row. Aburrido, EG (1950). Una historia de la psicología experimental. Nueva
Barón, RA y Bell, PA (1976). Agresión y calor: York: Appleton-Century-Crofts.
La influencia de la temperatura ambiente, el afecto negativo y una Boroditsky, L. (2000). Estructuración metafórica: Bajo
bebida refrescante en la agresión física. Revista de Personalidad y tiempo de pie a través de metáforas espaciales. Cognición, 75,
Psicología Social, 33, 245–255. 1–28.
Bartoshuk, LM (2000). Comparación de experiencias sensoriales entre Boroditsky, L. y Ramscar, M. (2002). Los roles del cuerpo y la mente en
individuos: Los avances psicofísicos recientes iluminan la variación el pensamiento abstracto. Ciencia psicológica, 13, 185–189.
genética en la percepción del gusto. Sentidos químicos, 25, 447–460.
Bornstein, MH y Sigman, MD (1986). Continuidad en el desarrollo mental
Bateson, J. G. y Hui, M. K. (1992). la ecología desde la infancia. Desarrollo infantil, 57, 251–274.
validez cal de diapositivas fotográficas y cintas de video para
simular el entorno del servicio. Revista de Investigación del Bowd, AD (1980). Reservas éticas sobre la investigación psicológica con
Consumidor, 19, 271–281. animales. Registro Psicológico, 30,
Baumrind, D. (1964). Algunas reflexiones sobre la ética de 201–210.
investigación: Después de leer el “Estudio conductual de la Bower, G. (1961). Un efecto de contraste en condiciones diferenciales
obediencia” de Milgram. Psicólogo estadounidense, 19, 421–423. acondicionamiento Revista de Psicología Experimental, 62,
Beck, SB (1963). Acondicionamiento de párpados en función de CS 196–199.
intensidad, intensidad UCS y puntuación de la escala de ansiedad manifiesta. Bramel, D. y Friend, R. (1981). Hawthorne, el mito del trabajador dócil y el
Revista de Psicología Experimental, 66, 429–438. sesgo de clase en psicología. American Psychologist, 36, 867–878.
Bem, DJ (2004). Redacción del artículo de revista empírica. En JM Darley,
MP Zanna y HL Roediger III (Eds.), The Compleat Academic (págs. Brannigan, A. y Zwerman, W. (2001). El verdadero “efecto
185–219). Washington DC: Asociación Americana de Psicología. Hawthorne”. Society, enero/febrero, 55–60.
Breitmayer, BJ y Ramey, CT (1986). Biológico
Benjamín, LT (1997). Una historia de la psicología: fuentes originales e no óptimo y calidad del entorno posnatal como codeterminantes
investigación contemporánea. Nueva York, McGraw-Hill. del desarrollo intelectual. Desarrollo infantil, 57, 1151–1165.

Brickner, MA, Harkins, SG y Ostrom, TM Memoria autobiográfica (págs. 253-272). Nueva York: Cambridge
(1986). Efectos de la participación personal: Implicaciones que University Press.
provocan pensamientos para la holgazanería social. Revista de Calhoun, JB (1962). Densidad de población y patología social. Scientific
Personalidad y Psicología Social, 51, 763–769. American, 206, 139–148.
Bridgeman, B., McCamley-Jenkins, L. y Ervin, N. Calhoun, JB (1966). El papel del espacio en la sociología animal. Revista
(2000). Predicciones del promedio de calificaciones de los estudiantes de Asuntos Sociales, 22, 46–58.
de primer año del SAT1 revisado y centrado: Prueba de razonamiento. Calhoun, JB (1971). El espacio y la estrategia de la vida. En AH Esser
(Informe de investigación del College Board No. 2000-1). Nueva York: (Ed.), Comportamiento y medio ambiente. El uso del espacio por
Junta de examen de ingreso a la universidad. animales y hombres (págs. 329–387).
Bridgeman, PW (1945). Algunos principios generales del análisis Nueva York: Plenum.
operacional. Revisión psicológica, 52, 246–249. Campbell, DT y Erlebacher, A. (1970a). ¿Cómo retrocede?
Amplio, W. y Wade, M. (1982). Traidores de la verdad: fraude y engaño Los artefactos de sión en las evaluaciones cuasi-experimentales
en los pasillos de la ciencia. Nueva York: Simon and Schuster. pueden hacer que la educación compensatoria parezca dañina. En J.
Helmuth (Ed.), Educación compensatoria: un debate nacional: vol. 3,
Broadbent, DE (1971). Decisión y estrés. Nueva York: niño desfavorecido. (págs. 185–210).
Prensa Académica. Nueva York: Brunner/Mazel.
Bronzaft, AL (1993). Arquitectos, ingenieros y urbanistas como defensores Campbell, DT y Erlbacher, A. (1970b). Responder a las respuestas. En
de la lucha contra el ruido. Revista de investigación arquitectónica y J. Helmuth (Ed.), Educación compensatoria: un debate nacional: vol.
de planificación, 10, 146–159. 3, niño desfavorecido
Marrón, J. (1958). Algunas pruebas de la teoría del decaimiento de im (págs. 221–225). Nueva York: Brunner/Mazel.
mediar la memoria. Revista trimestral de psicología experimental, Campbell, DT y Stanley, JC (1966). Experimental
10, 12–21. y diseños cuasi-experimentales para la investigación. Chicago: Rand
Marrón, R. (1962). Modelos de cambio de actitud. En R. Brown, E. Galanter, McNally.
EH Hess y G. Mandler (Eds.), Nuevas direcciones en psicología (Vol. Capaldi, EJ (1964). Efecto de la longitud N, el número de longitudes N
1, págs. 1–85). Nueva York: Holt, Rinehart y Winston. diferentes y el número de refuerzos en la resistencia a la extinción.
Revista de Psicología Experimental, 68, 230–239.
Brown, R. y Kulik, J. (1977). Memorias de flash. Cognición, 5, 73–79.
Capaldi, EJ (1994). La visión secuencial: desde las huellas de estímulo
Bryant, RA y Barnier, AJ (1999). provocando autobiografía que se desvanecen rápidamente hasta la organización de la
Pseudomemorias gráficas: la relevancia de la hipnosis, la memoria y el concepto abstracto de número. Psychonomic Bulletin
hipnotizabilidad y las atribuciones. Revista internacional de hipnosis & Review, 1, 156–181.
clínica y experimental, 47, 267–283. Carnevale, PJ y Probst, TM (1998). Valores sociales y conflicto social
Buckner, RL y Tulving, E. (1995). Estudios de neuroimagen de la memoria: en la resolución creativa de problemas y categorización. Journal
Teoría y hallazgos recientes del PET. En F. Boller & J. Grafman of Personality and Social Psychology, 74, 1300–1309.
(Eds.), Handbook of neuropsy chology (Vol. 10, pp. 439–466).
Ámsterdam: Elsevier. Carter, LF (1941). Intensidad del estímulo condicionado y tasa de
Bulgren, JA, Deshler, DD, Schumaker, JB y condicionamiento. Revista de Psicología Experimental, 28, 481–490.
Lenz, BK (2000). El uso y la eficacia de la instrucción analógica
en aulas de diversos contenidos secundarios. Revista de Cermak, LS y Craik, FIM (Eds.). (1979). Niveles
Psicología Educativa, 92, 426–441. de procesamiento en la memoria humana. Hillsdale, Nueva
Jersey: Erlbaum.
Bullinger, HJ y Dangelmaier, M. (2003). Prototipado virtual y prueba de Cermak, LS y Reale, L. (1978). Profundidad de procesamiento
interfaces en vehículos. Ergonomía, 46, 1–3, 41–51. y retención de palabras por pacientes alcohólicos de Korsakoff.
Journal of Experimental Psychology: Human Learning and Memory,
Bushman, BJ y Huesmann, LR (2006). Efectos a corto y largo plazo de 4, 165–174.
los medios violentos sobre la agresión en niños y adultos. Archives of Cheesman, J. y Merikle, PM (1984). Cebado con y sin conciencia. Percepción
Pediatrics and Adolescent Medicine, 160, 348–352. y Psicofísica, 36,
387–395.
Bushman, BJ, Ridge, RD, Da, E., Key, CW y Busath, GL (2007). Cuando Cheesman, J. y Merikle, PM (1986). Distinguir la percepción consciente
Dios sanciona matar. Ciencia psicológica, 18, 204–207. de la inconsciente. Revista Canadiense de Psicología, 40, 343–
367.
Buss, DM y Schmitt, DP (1993). Estrategias sexuales Chekroun, P. y Brauer, M. (2002). El efecto espectador y el comportamiento
teoría: una perspectiva evolutiva sobre el apareamiento humano. de control social: el efecto de la presencia de otros en las reacciones
Revisión psicológica, 100, 204–232. de las personas ante las violaciones de las normas.
Mantequillas, N. y Cermak, LS (1986). Un estudio de caso de la Revista Europea de Psicología Social, 32, 853–866.
olvido del conocimiento autobiográfico: Implicaciones para el estudio Childress, ME, Hart, SG y Bortolussi, MR
de la amnesia retrógrada. En D. Rubín (Ed.), (mil novecientos ochenta y dos). La fiabilidad y validez de la tarea de vuelo

clasificaciones de carga de trabajo. Actas de la Sociedad de Cowey, A. (1995). Vista ciega en monos. Naturaleza, 373,
Factores Humanos, 26, 319–323. 247–249.
Chomsky, N. (1959). Una revisión del comportamiento verbal de Skinner. Cox, JR y Griggs, RA (1982). Los efectos de ex
Idioma, 35, 26–58. experiencia sobre el desempeño en la tarea de selección de Wason.
Churchland, PM y Churchland, PS (1990). ¿Podría pensar una máquina? Memoria y cognición, 10, 496–502.
Scientific American, (enero) 32–37. Craik, FIM (1977). Las diferencias de edad en humanos
Cicirelli, VG (1970). La relevancia de la regresión memoria. En JE Birren & W. Schaie (Eds.), Manual de la psicología
problema de los artefactos a la evaluación de Head Start de del envejecimiento. Nueva York: Van Nostrand Reinhold.
Westinghouse-Ohio. Una respuesta a Campbell y Eriebacher. En
J. Helmuth (Ed.), Educación compensatoria: un debate nacional: vol. Craik, FIM y Lockhart, RS (1972). niveles de pro
3, Niño desfavorecido (págs. 211–215). cessing: Un marco para la investigación de la memoria. Revista de
Nueva York: Brunner/Mazel. aprendizaje verbal y comportamiento verbal, 11, 671–684.
Cicirelli, V. y Granger, R. (1969, junio). El impacto de Head Start: una Craik, FIM y Tulving, E. (1975). Profundidad de procesamiento y
evaluación de los efectos de Head Start en el desarrollo cognitivo y retención de palabras en la memoria episódica. Revista de Psicología
afectivo de los niños. Un informe presentado a la Oficina de Experimental: General, 104, 671–684.
Oportunidad Económica de conformidad con el Contrato B89-4356. Cutler, BL y Penrod, SD (1989). rel forense
Westinghouse Learning Corporation, Universidad de Ohio. moderadores destacados de la relación entre la precisión y la
(Distribuido por Clearinghouse for Federal Scientific and Technical confianza en la identificación de testigos presenciales. Revista de
Information, US Department of Commerce, National Bureau of Psicología Aplicada, 74, 650–652.
Standards, Institute of Applied Technology, PB 184–328.) D'Amato, MR (1970). Psicología experimental:
Metodología, psicofísica y aprendizaje. Nueva York: McGraw-Hill.
Clark, HH (1973). La falacia del efecto del lenguaje como fijo: una crítica Darley, JM y Latané, B. (1968). Intervención de espectadores
de las estadísticas del lenguaje en la investigación psicológica. ción en emergencias: Difusión de la responsabilidad. Revista de
Diario de Aprendizaje Verbal y Comportamiento Verbal, 12, Personalidad y Psicología Social, 8, 377–383.
335–359. De Greene, KB (Ed.). (1970). Psicología de sistemas. Nuevo
Clark, WC (1969). Análisis de la teoría de la decisión sensorial de York: McGraw-Hill.
el efecto placebo sobre el criterio de dolor y sensibilidad térmica (d). Devine, PG y Elliot, AJ (1995). ¿Están realmente desapareciendo los
Revista de Psicología Anormal, 74, estereotipos raciales? La trilogía de Princeton revisada. Boletín de
363–371. Personalidad y Psicología Social, 21, 1139-1150.
Clark, WC y Yang, JC (1974). Analgésico acupuntural Dewar, RE, Kline, DW y Swanson, HA
sia: Evaluación por teoría de detección de señales. Ciencias, 184, (1994). Diferencias de edad en la comprensión de los símbolos de
1096–1098. las señales de tráfico. 73.ª Reunión Anual de la Junta de Investigación
Cohen, S., Glass, DC y Singer, JE (1973). Ruido de apartamento, del Transporte (documento n.º 940979). Washington, DC: Junta de
discriminación auditiva y capacidad de lectura en niños. Revista de Investigación de Transporte.
Psicología Social Experimental, 9, 407–422. Dewey, J. (1896). El concepto de arco reflejo en psicología.
Revisión psicológica, 3, 357–370.
Colom, R., Jung, RE y Haier, RJ (2006). Hallazgo Muñeco, R. (1955). Etiología del cáncer de pulmón. Avances en lata
el factor g en la estructura del cerebro utilizando el método de cer Research, 3, 1–50.
vectores relacionados con cor. Inteligencia, 34, 561–570. Jueves , FC (1868/1969). Acerca de la velocidad de psy
Cook, TD y Campbell, DT (1979). Cuasi procesos de chische. (Sobre la velocidad de los procesos mentales.)
experimentación: problemas de diseño y análisis para (w. Koster, Trans.). En WG Koster, Atención y desempeño II (págs.
escenarios de campo. Chicago: Rand McNally. 412–431). Ámsterdam: Holanda Septentrional.
Coren, S., Ward, LM y Enns, JT (1994). Sensación Duncan, J. (2003). Las pruebas de inteligencia predicen el cerebro
y percepción. Fort Worth: Harcourt Brace. respuesta a eventos de tareas exigentes. Nature Neuroscience,
Cornsweet, Tennessee (1962). El método de la escalera en 6, 207–208.
psicofísica. Diario Americano de Psicología, 75, Duncan, J., Seitz, RJ, Kolodny, J., Bor, D., Herzog,
485–491. H., Ahmed, A., et al. (2000). Una base neural para inteligencia
Correll, J., Park, B., Judd, CM y Wittenbrink, B. general. Ciencia, 289, 457–460.
(2002). El dilema del oficial de policía: usar la etnicidad para Duncker, K. (1945). Sobre la resolución de problemas. Monografías
eliminar la ambigüedad de individuos potencialmente psicológicas, 58, 1–112. (Entero N° 270).
amenazantes. Revista de Personalidad y Psicología Social, 83, Dunn, J. (1998). Memoria implícita y amnesia. En
1314-1329. K. Kirsner y C. Speelman (Eds.), Procesos mentales implícitos y
Corrigan, PW, Holmens, EP, Luchins, D., Buican, explícitos (págs. 99–117). Mahwah, Nueva Jersey: Erlbaum.
B., Basit, A. y Parks, JJ (1994). Agotamiento del personal en un Dweck, CS (1999). Autoteorías: su papel en la motivación, la
hospital psiquiátrico: un diseño de panel cruzado. Journal of personalidad y el desarrollo. Filadelfia: Psychology Press.
Organizational Behavior, 15, 65–74.

Dweck, CS y Bempechat, J. (1983). Teorías infantiles de la inteligencia: Ericsson, KA, Krampe, R. y Tesch-Romer, C. (1993).
Consecuencias para el aprendizaje. En SG Paris, GM Olson y HW El papel de la práctica deliberada en la adquisición de la
Stevenson (Eds.), Aprendizaje y motivación en el aula (págs. 239– actuación experta. Revisión psicológica, 100,
256). Hillsdale, Nueva Jersey: Erlbaum. 363–406.
Eriksen, CW (1960). Discriminación y aprendizaje con
Dweck, CS y Elliott, ES (1983). Logro motivacional. En EM Hetherington conciencia: un estudio y una evaluación metodológica.
(Ed.), Manual de psicología infantil: vol. 4, Socialización, personalidad Revisión psicológica, 67, 279–300.
y desarrollo. Nueva York: Wiley. Eron, LD (1982). Interacción padre-hijo, televisión vio
lencia y agresión en los niños. Psicólogo estadounidense, 37, 197–
Dweck, C., Mangels, J. y Good, C. (2004). Efectos motivacionales sobre 211.
la atención, la cognición y el rendimiento. En DY Dai y RJ Sternberg Eron, LD, Huesmann, LR, Lefkowitz, MM y
(Eds.), Motivación, emoción y cognición: Perspectivas integradoras Walder, LO (1972). ¿La violencia televisiva provoca agresión?
sobre el funcionamiento y desarrollo intelectual (págs. 41–55). Psicólogo estadounidense, 27, 253–263.
Mahwah, Nueva Jersey: Evans, GW, Palsane, MN, Lepore, SJ y Martin, J.
Erlbaum. (1989). Densidad residencial y salud psicológica: los efectos
Eagle, AH y Wood, W. (1999). Los orígenes de las diferencias sexuales en mediadores del apoyo social. Revista de Personalidad y Psicología
el comportamiento humano: disposiciones evolucionadas versus Social, 57, 994–999.
roles sociales. Psicólogo estadounidense, 54, 408–423. Evans, GW y Wener, RE (2007). hacinamiento y por
Ebbinghaus, H. (1885/1913). Memoria: Una contribución a la psicología sonal space invasion on the train: Por favor, no me hagas sentar en
experimental. Nueva York: Columbia University Press. (Reimpreso el medio. Journal of Environmental Psychology, 27, 90–94.
por Dover, 1964)
Edwards, AC (2003). Respuesta a la inteligencia espiritual Evans, JW y Schiller, J. (1970). que preocupacion
Debate de gencia: ¿Se necesitan aquí algunas distinciones con posibles artefactos de regresión puede conducir a una estrategia
conceptuales? Revista Internacional de Psicología de la Religión, 13, defectuosa para la evaluación de los programas de acción social:
49–52. una respuesta a Campbell y Erlebacher. En J. Helmuth (Ed.),
Eibl-Eibesfeldt, I. (1970). Etología: La biología del comportamiento. Nueva Educación compensatoria: un debate nacional: vol. 3, Niño
York: Holt, Rinehart & Winston. desfavorecido (págs. 216–220). Nueva York: Brunner/Mazel.
Eibl-Eibesfeldt, I. (1972). Semejanzas y diferencias ser Eveland, WP, Seo, M. y Marton, K. (2002). Aprendiendo de las noticias
entre culturas en movimientos expresivos. En RA Hinde (Ed.), en la campaña 2000: una comparación experimental de noticias de
Comunicación no verbal (págs. 297–312). televisión, periódicos y noticias en línea.
Cambridge: Prensa de la Universidad de Cambridge. Psicología de los medios, 4, 353–378.
Ellsworth, J. y Ames, L. (1998). Perspectivas críticas Eysenck, HJ y Aleros, LJ (1981). La causa y los efectos
sobre Project Head Start: Revisando la esperanza y el desafío. de fumar. Nueva York: Gage.
Albany, Nueva York: Prensa de la Universidad Estatal de Nueva York. Farah, MJ (1990). Agnosias visuales. Cambridge, MA: El
Elmes, DG, Chapman, PF y Selig, CW (1984). Prensa del MIT.
Papel del estado de ánimo y la connotación en el efecto espaciador. Agricultor, CM (1995). Estimaciones de efectividad para luces de freno
Boletín de la Psychonomic Society, 22, 186–188. montadas en el centro alto: un estudio de seis años. Arlington, VA:
Elmes, DG, Kantowitz, BH, y Roediger, HL Instituto de Seguros para la Seguridad en las Carreteras.
(1992). Métodos de investigación en psicología (4ª Ed.). Fechner, G. (1860/1966). Elementos de psicofísica (Vol. 1, HE Adler, DH
San Pablo: Oeste. Howes y EG Boring, Trans.). Nueva York: Holt, Rinehart y Winston.
Elmes, DG, Kantowitz, BH, y Roediger, HL
(2006). Métodos de investigación en psicología (8ª Ed.). Feingold, BF (1975). Hiperquinesis y problemas de aprendizaje
Belmont, CA: Wadsworth Thomson Learning. Habilidades vinculadas a los sabores y colores de los alimentos artificiales.
Emmons, RA (2000). ¿Es la espiritualidad una inteligencia? Revista estadounidense de enfermería, 75, 797–803.
Motivación, cognición y la psicología de la máxima preocupación. Festinger, L. (1957). Una teoría de la disonancia cognitiva.
Revista Internacional de Psicología de la Religión, 10, 3–26. Stanford, CA: Prensa de la Universidad de Stanford.
Festinger, L., Riecken, HW y Schachter, S. (1956).
Inglés, RW (2002). Capacidad de la memoria de trabajo como atención Cuando la profecía falla. Minneapolis: Prensa de la Universidad
ejecutiva. Direcciones actuales en psicología, 11, de Minnesota.
19–23. Ficken, MS, Rusch, KM, Taylor, SJ y Powers, DR (2000). El canto
Engle, R., Tuholski, SW, Laughlin, JE y Conway, del colibrí barbazul: un pináculo de vocalizaciones no
ARA (1999). Memoria de trabajo, memoria a corto plazo e inteligencia cinemáticas. Alca, 117,
fluida general: un enfoque de variable latente. 120–128.
Revista de Psicología Experimental: General, 128, 309–331. Fischhoff, B., Slovic, P. y Lichtenstein, S. (1977).
Saber con certeza: Lo apropiado de la confianza extrema. Revista de
Ericsson, KA y Simon, HA (1979). Informes verbales como datos. Revisión psicología experimental: percepción y rendimiento humanos, 3, 522–
psicológica, 87, 215–251. 564.

Fisher, RP y Craik, FIM (1977). Interacción entre las operaciones de Gardner, H. (1983). Estados de ánimo: La teoría de las inteligencias
codificación y recuperación en el recuerdo con claves. Journal of múltiples. Nueva York: Libros básicos.
Experimental Psychology: Human Learning and Memory, 3, 701– Gardner, H. (1998a). ¿Hay inteligencias adicionales?
711. El caso de las inteligencias naturalista, espiritual y existencial.
Fishman, DB y Neigher, WD (1982). Americano En J. Kane (Ed.), Educación, información y transformación.
psicología en los años ochenta: ¿Quién va a comprar? Psicólogo Englewood Cliffs, Nueva Jersey: Prentice Hall.
estadounidense, 37, 533–546. Gardner, H. (1998b). Mentes extraordinarias: retratos de 4 personas
Fossey, D. (1972). Vivir con gorilas de montaña. En excepcionales y un examen de nuestra propia extraordinariedad.
TB Allen (Ed.), Las maravillas del comportamiento animal. Nueva York: Libros básicos.
Washington, DC: Sociedad Geográfica Nacional. Gardner, H. (2000a). Inteligencia reformulada: Múltiple en
Fostervold, KI, Buckmann, E. y Lie, I. (2001). Filtros de pantalla inteligencias para el siglo XXI. Nueva York: Libros básicos.
VDU: ¿Remedio o el omnipresente efecto Hawthorne? Revista Gardner, H. (2000b). Un caso contra la inteligencia espiritual.
Internacional de Ergonomía Industrial, 27, 107–118. Revista Internacional de Psicología de la Religión, 10, 27–34.
Fraser, S. (Ed.). (1995). Las guerras de la curva de campana: Raza, Gardner, H. (2007). Cinco mentes para el futuro (págs. 1–20).
inteligencia y el futuro de América. Nueva York: Libros básicos. Boston: Prensa de la Escuela de Negocios de Harvard.
Garner, WR (1974). El procesamiento de la información y

Freedman, JL y Landauer, TK (1966). Recuperación de la memoria a estructura. Hillsdale, Nueva Jersey: Erlbaum.
largo plazo: fenómeno de la “punta de la lengua”. Garner, WR, Merluza, HW y Eriksen, CW (1956).
Ciencia Psiconómica, 4, 309–310. El operacionismo y el concepto de percepción. Revisión
Friend, R., Rafferty, Y. y Bramel, D. (1990). Una desconcertante mala psicológica, 63, 149–159.
interpretación del estudio de "conformidad" de Asch. Revista Geher, G., Bauman, KP, Hubbard, SEK y Legare, JR (2002).
Europea de Psicología Social, 20, 29–44. Estimaciones de obediencia propia y de otros: sesgos y
Frost, R., Katz, L. y Bentin, S. (1987). Estrategias para moderadores. Revista de Psicología Social, 142, 677–689.
reconocimiento visual de palabras y profundidad ortográfica:
una comparación multilingüe. Revista de Psicología Gentner, D., Loewenstein, J. y Thompson, L. (2003).
Experimental: Percepción y Desempeño Humano, 13, Aprendizaje y transferencia: un rol general para la codificación
104–115. analógica. Revista de Psicología Educativa, 95,
Furnham, A. (2001). Recordar historias en función del medio de 393–405.
presentación. Informes psicológicos, 89, 483–486. Germán, TP y Defeyter, MA (2000). Inmunidad a la fijeza funcional
en niños pequeños. Psychonomic Bulletin & Review, 2000, 707–
Furumoto, L. (1991). De “socios emparejados” a un 712.
Psicología del yo: La odisea intelectual de Mary Whiton Gibson, JJ (1979). El enfoque ecológico de la percepción. Boston:
Calkins. En GA Kimble, M. Werthheimer y CL White (Eds.), entra Houghton Miffl.
Retratos de pioneros en psicología. Gick, ML y Holyoak, KJ (1980). Resolución de problemas analógicos.
Hillsdale, Nueva Jersey: Erlbaum. Psicología Cognitiva, 12, 306–355.
Gabbert, F., Memon, A. y Allan, K. (2003). Conformidad de la Gick, ML y Holyoak, KJ (1983). la inducción de esquema y transferencia
memoria: ¿Pueden los testigos presenciales influir en los analógica. Psicología Cognitiva, 15,
recuerdos de los demás para un evento? Psicología Cognitiva 1–38.
Aplicada, 17, 533–543. Gigerenzer, G. (1993). El superyó, el ego y el ello en el razonamiento
Gabrenya, W. K., Latané, B., & Wang, Y. (1983). Social estadístico. En G. Keren & C. Lewids (Eds.), Un manual para el
holgazaneando en una perspectiva transcultural: chinos en taiwán. análisis de datos en las ciencias del comportamiento: Cuestiones
Revista de Psicología Intercultural, 14, 368–384. metodológicas. (págs. 311–339). Mahwah, Nueva Jersey: Erlbaum.
Gabrieli, JDE, Keane, MM, Zarella, MM y
Poldrack, RA (1997). Preservación de la memoria implícita Ginsburg, HJ y Miller, SM (1982). Diferencias de sexo en el
para nuevas asociaciones en amnesia global. comportamiento de riesgo de los niños. Desarrollo infantil, 53,
Ciencia Psicológica, 8, 326–329. 426–428.
Galle, OR, Grove, WR y McPherson, JM (1972). Glaser, MO y Glaser, WR (1982). Análisis del curso temporal del
Densidad de población y patología: ¿Cuáles son las relaciones fenómeno Stroop. Journal of Experimental Psychology: Human
para el hombre? Ciencia, 176, 23–30. Perception and Performance, 8, 875–894.
Galton, F., señor. (1869/1979). Genio hereditario: una investigación
sobre sus leyes y consecuencias. Londres: Julian Friedman Glucksberg, S. (1966). Procesos simbólicos. Dubuque, Iowa:
Publishers. Guillermo C. Brown.
Gardiner, JM, Java, RI y Richardson-Klavehn, A. Glucksberg, S. y Danks, JH (1967). Funcional
(1996). Cómo el nivel de procesamiento realmente influye fi jación: Equivalencia de estímulos mediada por similitud acústica
en la conciencia en la memoria de reconocimiento. Revista semántica. Revista de Psicología Experimental, 74, 400–405.
Canadiense de Psicología Experimental, 50, 114–122.

Glucksberg, S. y Danks, JH (1968). Efectos de dis mensajes del sistema de información al viajero. XIII Simposio
etiquetas criminatorias y etiquetas sin sentido según la disponibilidad Bienal sobre Visibilidad Nocturna y Comportamiento del Conductor.
de la función novedosa. Revista de aprendizaje verbal y Washington, DC: Consejo Nacional de Investigación.
comportamiento verbal, 7, 72–76. Hanson, NR (1958). Patrones de descubrimiento. Cambridge:
Glucksberg, S. y Weisberg, RW (1966). Comportamiento verbal y Prensa de la Universidad de Cambridge.
resolución de problemas: algunos efectos del etiquetado en un Hardy, JD, Wolff, HG y Goodell, H. (1952). Dolor
problema de fijeza funcional. Journal of Experimental Psychology, reacciones y sensaciones. Baltimore: Williams & Wilkins.
71, 659–664. Harre, R. (1983). Grandes experimentos científi cos. Oxford:
Goodman, MJ, Tijerina, L., Bents, FD y Wierwille, WW (1999). Uso Prensa de la Universidad de Oxford.
de teléfonos celulares en vehículos: ¿seguro o inseguro? Factores Harlow, HF (1958). La naturaleza del amor. American Psychologist, 13,
humanos del transporte, 1, 3–42. 673–685.
Graf, P. y Schacter, DL (1985). Memoria implícita y explícita para Hart, BM, Allen, KE, Buell, JS, Harris, FR y
nuevas asociaciones en sujetos normales y amnésicos. Journal Lobo, MM (1964). Efectos del refuerzo social sobre el llanto
of Experimental Psychology: Learning, Memory and Cognition, 11, operante. Revista de Psicología Infantil Experimental, 1, 145–153.
501–518.
Grant, DA y Schneider, DE (1948). Intensidad del estímulo condicional y Hart, JT (1965). La memoria y la experiencia del sentimiento de saber.
fuerza del condicionamiento: I. Revista de Psicología Educativa, 56,
La respuesta condicionada del párpado a la luz. Revista de 208–216.
Psicología Experimental, 38, 690–696. Hart, SG, Hauser, JR y Leser, PT (1984). A bordo
Green, BG, Shaffer, GS y Gilmore, MM (1993). Una escala de magnitud evaluación de cuatro medidas de carga de trabajo piloto. Actas de
de sensación oral etiquetada semánticamente con propiedades de la Human Factors Society, 28, 945–949.
proporción aparente. Sentidos químicos, 18, Hauser, L. (1997). La caja china de Searle: Desacreditando el argumento
683–702. de la habitación china. Mentes y máquinas, 7, 199–226.
Green, DM y Swets, JA (1966). La teoría de detección de señales y Hebb, DO y Donderi, DC (1987). Libro de texto de psicología (4ª Ed.).
la psicofísica. Nueva York: Wiley. Hillsdale, Nueva Jersey: Erlbaum.
Greenough, WT (1992). Las respuestas sobre los derechos de los animales Helmholtz, H. von (1962). Tratado sobre óptica fisiológica (Vol. 3),
están distorsionadas y mal informadas. Ciencias Psicológicas, 3, 142. JPC Southall, Ed. Nueva York: Dover.
Greenwald, AG (1992). Nuevo look 3: Recuperación de la cognición Herman, LM y Kantowitz, BH (1970). El efecto psicológico del período
inconsciente. Psicólogo estadounidense, 47, 766–779. refractario: ¿Solo la mitad de la historia de la doble estimulación?
Gregorio, RL (1970). El ojo inteligente. Nueva York: Boletín Psicológico, 73, 74–86.
McGraw-Hill. Herrnstein, RJ (1962). Efecto placebo en la rata. Ciencia, 138, 677–678.
Grice, GR (1966). Dependencia de las leyes empíricas sobre la fuente
de variación experimental. Boletín Psicológico, 66, 488–498. Herrnstein, RJ y Murray, C. (1994). La curva de campana.
Nueva York: La Prensa Libre.
Grice, GR y Hunter, JJ (1964). Intensidad del estímulo Hetherington, EM y Parke, RD (1986). Niño
los efectos dependen del tipo de diseño experimental. psicología: un punto de vista contemporáneo (págs. 429–480).
Revisión psicológica, 71, 247–256. Nueva York: McGraw-Hill.
Guilford, JP (1967). La naturaleza de la inteligencia humana. Hilts, PJ (1995). El fantasma de la memoria. La naturaleza de la memoria y
Nueva York: McGraw-Hill. la extraña historia del Sr. M. Nueva York: Simon & Schuster.
Hadamard, J. (1945). La psicología de la invención en el campo matemático.
Princeton, Nueva Jersey: Princeton University Press. Holanda, PW (1993). ¿Qué viene primero, la causa o el efecto?
En G. Keren & C. Lewids (Eds.), Un manual para el análisis de
Hahn, G., Charlin, VL, Sussman, S., Dent, CW, Manzi, J., datos en las ciencias del comportamiento: Cuestiones
Stacy, A., Flay, B., Hansen, WB y Burton, D. (1990). metodológicas (págs. 273–282). Mahwah, Nueva Jersey: Erlbaum.
Primeras y más recientes situaciones de consumo de tabaco sin Holyoak, KJ (1990). Resolución de problemas. En DN Osherson & EE
humo y cigarrillos por parte de adolescentes: Similitudes y Smith (Eds.), Pensamiento: Una invitación a la ciencia cognitiva
diferencias. Comportamiento adictivo, 15, 439–448. (Vol. 3, págs. 117–146). Cambridge: MIT
Haier, RJ, Jung, RE, Yeo, RA, Head, K. y Alkire, MT (2004). Variación Prensa.
cerebral estructural e inteligencia general. NeuroImagen, 23, 425– Holyoak, KJ y Thagard, P. (1989). Mapa analógico
433. ping por satisfacción de la restricción. Ciencias cognitivas, 13,
Haines, MM, Stansfeld, SA, Jefe, J., & Job, RFS 295–355.
(2002). Modelado multinivel del ruido de aeronaves en pruebas de Holyoak, KJ y Thagard, P. (1997). La mente analógica. Psicólogo
desempeño en escuelas alrededor del aeropuerto de Heathrow en Londres. estadounidense, 52, 35–44.
Revista de Epidemiología y Salud Comunitaria, 56, 139–144. Horowitz, LM (1974). Elementos de estadística para la psicología y la
educación. Nueva York: McGraw-Hill.
Hanowski, RJ, Kantowitz, BH y Kantowitz, SC Howard, DV y Wiggs, CL (1993). Envejecimiento y aprendizaje:
(1996). Memoria del controlador para vehículos avanzados conocimientos de pruebas implícitas y explícitas. En J. Cerella,

WJ Hoyer, J. Rybash y M. Commons (Eds.), Diferencias de edad Jacobs, J. (1961). Muerte y vida de las grandes ciudades americanas.
en adultos: límites de pérdida. Nueva York: Prensa Académica. Nueva York: Random House.
Howell, DC (2008). Estadísticas fundamentales para las ciencias del Jacobson, E. (1978). Debes relajarte (5ª Ed.). Nueva York:
comportamiento (6.ª ed., cap. 9). Belmont, CA: McGraw-Hill.
Wadsworth. Jacoby, LL y Dallas, M. (1981). Sobre la relación entre la memoria
Howell, WC (1994). Los factores humanos y los desafíos autobiográfica y el aprendizaje perceptivo. Journal of Experimental
del futuro. Ciencias psicológicas, 5, 1–7. Psychology: General, 3, 306–340.
Huesmann, LR, Eron, LD, Lefkowitz, MM y
Walder, LO (1973). Violencia y agresión televisivas: el efecto causal Jacoby, LL y Witherspoon, D. (1982). Recordar sin conciencia. Revista
permanece. Psicólogo estadounidense, 28, 617–620. Canadiense de Psicología, 32, 300–324.
Huesmann, LR, Moses-Titus, J, Podolski, CL, . Jagacinski, RJ y Flach, JM (2003). Teoría de control para humanos:
Eron, LD (2003). Relaciones longitudinales entre la exposición de enfoques cuantitativos para modelar el rendimiento. Mahwah, Nueva
los niños a la violencia televisiva y su comportamiento agresivo y Jersey, Erlbaum.
violento en la edad adulta joven: 1977-1992. James, W. (1890). Principios de la psicología. Nueva York:
Psicología del desarrollo, 39, 2001–221. Bosquecillo.
Huesmann, LR y Taylor, LD (2006). El rol de Jenkins, J. (1979). Cuatro puntos para recordar: un modelo tetraédrico de
la violencia mediática en la conducta violenta. Revisión anual de experimentos de memoria. En LS Cermak & FIM Craik (Eds.), Niveles
salud pública, 27, 393–415. de procesamiento en la memoria humana (págs. 429–446). Hillsdale,
Huff, D. (1954). Cómo mentir con las estadísticas. Nueva York: Nueva Jersey: Erlbaum.
Norton. Jennings, JR y Coles, MGH (1991a). Introducción. En JR Jennings
Casco, CL (1943). Principios de comportamiento. Nueva York: y MGH Coles (Eds.), Manual de psicofisiología cognitiva.
Appleton-Century-Crofts. Nueva York: Wiley.
Hunt, E. y Lansman, M. (1975). teoría cognitiva
aplicado a las diferencias individuales. En WK Estes (Ed.), Manual Jennings, JR y Coles, MGH (Eds.). (1991b).
de aprendizaje y proceso cognitivo (Vol. 1, págs. 81–110). Hillsdale, Manual de psicofisiología cognitiva. Nueva York: Wiley.
Nueva Jersey: Erlbaum.
Hunt, E., Streissguth, A., Kerr, B. y Olson, H. Jensen, AR (1969). ¿Cuánto podemos aumentar el coeficiente intelectual y
(1995). Consumo de alcohol de las madres durante el embarazo: rendimiento escolar? Harvard Educational Review, 39, 1–123.
Efectos sobre el razonamiento espacial-visual en niños de 14 años.
Ciencia Psicológica, 6, 339–342. Jones, D. (1999). La psicología cognitiva de la distracción auditiva: la
Huxley, A. (1946). Ciencia, libertad y paz. Nueva York: conferencia BPS Bradbent de 1997. Revista británica de
Harper. psicología, 90, 167–187.
Hyde, TS y Jenkins, JJ (1969). Efectos diferenciales Kahneman, D. (1973). Atención y esfuerzo. Englewood
de tareas incidentales sobre la organización del recuerdo de una lista Cliffs, Nueva Jersey: Prentice-Hall.
de palabras altamente asociadas. Revista de Psicología Experimental, Kahng, SW, Boscoe, JH y Byrne, S. (2003). los
82, 472–481. uso de una contingencia de escape y una economía simbólica para
Hygge, S., Evans, G. y Bullinger, M. (2002). Un estudio prospectivo de aumentar la aceptación de alimentos. Revista de análisis de
algunos efectos del ruido de los aviones en el rendimiento cognitivo comportamiento aplicado, 36, 349–353.
de niños en edad escolar. Ciencia Psicológica, 13, 469–474. Kamin, LJ (1969). Previsibilidad, sorpresa, atención y condicionamiento.
En BA Campbell & RM Church (Eds.), Castigo y comportamiento
Hyman, R. (1964). La naturaleza de la investigación psicológica. aversivo (págs. 279–296).
Englewood Cliffs, Nueva Jersey: Prentice-Hall. Nueva York: Appleton-Century-Crofts.
Intraub, H. y Nicklos, H. (1985). Niveles de procesamiento y Kangas, J. y Bradway, K. (1971). Inteligencia en la mediana edad: un
memoria de imágenes: el efecto de superioridad física. Revista seguimiento de treinta y ocho años. Psicología del desarrollo, 5, 333–
de Psicología Experimental: Aprendizaje, Memoria y Cognición, 11, 337.
284–298. Kantowitz, BH (1972). Fuerza de respuesta como indicador de conflicto en
Irwin, MR y Miller, AH (2007). Trastornos depresivos e inmunidad: 20 años doble estimulación. Revista de Psicología Experimental, 110, 302–
de avances y descubrimientos. 309.
Cerebro, comportamiento e inmunidad, 21, 374–383. Kantowitz, BH (1982). Interfaz de información humana
Iwanaga, M. e Ito, T. (2002). Efecto perturbador de procesamiento y psicología de la ingeniería. En WC Howell & EA
música en el procesamiento de memorias verbales y espaciales. Fleishman (Eds.), Human Performance and Productivity (págs. 31–
Perceptual and Motor Skills, 94, 1251–1258. 81). Hillsdale, Nueva Jersey: Erlbaum.
Jacob, T., Tennenbaum, D., Seilhamer, RA, Bargiel, K. y Sharon, T. Kantowitz, BH (1985). Etapas y canales en el procesamiento de la
(1994). Efectos de la reactividad durante información humana: un análisis limitado de la teoría y la
observación naturalista de angustiados y no angustiados metodología. Revista de Psicología Matemática, 29, 135–174.
familias Revista de psicología familiar, 8, 354–363.

Kantowitz, BH (1987). Premisas y promesas de Kawai, N. e Imada, H. (1996). Entre y dentro
psicofisiología. Psicología Contemporánea, 32, 1002–1004. efectos sujetos de la duración de los EE. UU. en la supresión
condicionada en ratas: el contraste hace que la duramadre pase desapercib
Kantowitz, BH (1989a). Interfaz de inteligencia humana y de máquina. En se destacan. Aprendizaje y motivación, 27, 92–111.
PA Hancock & MH Chignell (Eds.), Interfaces inteligentes: Teoría, Kazdin, AE (2001). Modificación del comportamiento en entornos
investigación y diseño (pp. aplicados. Belmont, CA: Wadsworth/Thomson Learning.
49–67). Ámsterdam: Elsevier. Keisler, A. y Willingham, CT (2007). El aprendizaje de secuencias no
Kantowitz, BH (1989b). El papel de la información humana declarativas no muestra ahorros en el re-aprendizaje.
modelos de procesamiento en el desarrollo de sistemas. Actas Ciencia del movimiento humano, 26, 247–256.
de la 33.ª Reunión Anual de la Sociedad de Factores Humanos, Keith-Spiegel, P. y Koocher, GP (2005). La paradoja del IRB: ¿Podrían
1059–1063. Santa Mónica, CA: Sociedad de Factores Humanos. los protectores también fomentar el engaño? Ética y comportamiento,
15, 339–349.
Kantowitz, BH (1995). Simulador de evaluación de la carga de trabajo Kelman, H. (1966). El engaño en la investigación social. Transacción, 3,
del conductor de vehículos pesados. Actas de la 39.ª reunión 20–24.
anual de la Sociedad de Factores Humanos y Ergonomía Keppel, G. y Underwood, BJ (1962). Inhibición proactiva en la retención a
(Vol. 2, págs. 1107–1111). Santa Mónica, CA: Sociedad de factores corto plazo de artículos individuales. Revista de aprendizaje verbal y
humanos y ergonomía. comportamiento verbal, 1, 153–161.
Kantowitz, BH (1998). Modelos computacionales para Kihlstrom, JF, Barnhardt, TM y Tataryn, DJ
Factores humanos del transporte. Actas de la 42.ª reunión anual (1992). El inconsciente psicológico: encontrado, perdido,
de la Sociedad de factores humanos y ergonomía, 2, 1220–1221. recuperado. Psicólogo estadounidense, 47, 788–791.
Rey, DJ (1968). Retención de significado conectado
Kantowitz, BH (2001). Uso de micromundos para diseñar interfaces material en función de la presentación y el recuerdo. Journal of
inteligentes que minimicen la distracción del conductor. Actas del Experimental Psychology, 77, 676–683.
Primer Simposio Internacional de Conducción sobre Factores Kinsey, A., Pomeroy, W. y Martin, C. (1953). Sexual
Humanos en la Evaluación, Capacitación y Diseño de Vehículos de comportamiento en la mujer humana. Filadelfia: Saunders.
Conductores, 42–57. Aspen, CO. Kintsch, W. y Kozminsky, E. (1977). Resumiendo esto
Kantowitz, BH y Campbell, JL (1996). Carga de trabajo del piloto y ries después de leer y escuchar. Revista de Psicología Educativa, 69,
automatización del puesto de pilotaje. En R. Parasuraman & M. 491–499.
Mouloua (Eds.), Human performance in automat ed systems (págs. Kluger, AN y Tikochinsky, J. (2001). El error de aceptar la hipótesis
117–136). Carga de trabajo humano en la aviación. nula “teórica”: Auge, caída y resurrección de las hipótesis del
Kantowitz, BH y Casper, PA (1988). trabajo humano sentido común en psicología. Boletín Psicológico, 127 (3), 408–
Carga en aviación. En E. Wiener & D. Nagel (Eds.), Factores 423.
humanos en la aviación (págs. 157–186). Nueva York: académico Kolodner, JL (1997). Implicaciones educativas de la analogía: una
Prensa. mirada desde el razonamiento basado en casos. Psicólogo
Kantowitz, BH y Fujita, Y. (1990). Teoría cognitiva, identificabilidad y estadounidense, 52, 57–66.
análisis de confiabilidad humana (HRA). Koriat, A. y Levy-Sadot, R. (2001). El combinado
Ingeniería de Confiabilidad y Seguridad de Sistemas, 29, contribuciones de las heurísticas de familiaridad con claves y
317–328. accesibilidad a los sentimientos de conocimiento. Revista de
Kantowitz, BH, Hart, SG y Bortolussi, MR Psicología Experimental: Aprendizaje, Memoria y Cognición, 27,
(1983). Medición de la carga de trabajo del piloto en un simulador 34–53.
de base móvil: I. Tarea asincrónica secundaria de elección- Koestler, A. (1964). El acto de creación. Nueva York: Dell.
reacción. Actas de la Sociedad de Factores Humanos, 27, Kohler, W. (1927). La mentalidad de los simios. Londres:
319–322. Routledge y Kegan Paul.
Kantowitz, BH y Knight, JL (1976). Prueba de tapping timesharing: Tarea Kohn, A. (1986). falsos profetas. Nueva York: albahaca
secundaria auditiva. Acta Psycho logica, 40, 343-362. Blackwell.
Koocher, GP (1977). Comportamiento en el baño y humano.
Kantowitz, BH y Sanders, MS (1972). anuncio parcial dignidad. Revista de Personalidad y Psicología Social, 35, 120–121.
Información avanzada y dimensionalidad del estímulo. Revista de
Psicología Experimental, 92, 412–418. Kravitz, DA y Martín, B. (1986). Ringelmann redescubierto: El artículo
Kantowitz, BH y Simsek, O. (2000). tarea secundaria original. Revista de Personalidad y Psicología Social, 50, 936–941.
medidas de la carga de trabajo del conductor. En P. Hancock Desmond
(Eds.), Estrés, carga de trabajo y fatiga. (págs. 395–408). Kuhn, TS (1970). Lógica del descubrimiento o psicología de la
Mahwah, Nueva Jersey: Erlbaum. investigación. En I. Lakatos & A. Musgrave (Eds.), La crítica y el
Kantowitz, BH y Sorkin, RD (1983). rostro humano crecimiento del conocimiento (págs. 1–23). Nueva York: Cambridge
tores: comprensión de las relaciones entre personas y sistemas. University Press.
Nueva York: Wiley. Kulpe, O. (1893). Esquema de Psicología. en
Kaufman, L. (1974). Vista y mente. Nueva York: Oxford. base experimental [Un esbozo de

psicología desde una perspectiva experimental]. Lovelace, EA y Twohig, PT (1990). mayores sanos
Leipzig: Engelmann. la percepción del adulto de su función de memoria y el uso de
Kwilecki, S. (2000). La inteligencia espiritual como teoría de la religión mnemotécnicos. Boletín de la Psychonomic Society, 28, 115–118.
individual: una aplicación de caso. Revista Internacional de
Psicología de la Religión, 10, 35–46. Lowe, DG y Mitterer, JO (1982). selectivo y
Carril, DM y Robertson, L. (1979). La generalidad de la hipótesis de atención dividida en una tarea de Stroop. Revista Canadiense de
los niveles de procesamiento: una aplicación a la memoria para Psicología, 36, 684–700.
posiciones de ajedrez. Memoria y cognición, 7, Luminet, O., Curci, A., Marsh, EJ, Wessel, I., Constan tin, T., Gencoz,
253–256. F. y Yogo, M. (2004). Los impactos cognitivos, emocionales y
Latané, B. (1981). La psicología del impacto social. sociales de los ataques del 11 de septiembre: diferencias grupales
Psicólogo estadounidense, 36, 343–356. en la memoria para el contexto de recepción y sus determinantes.
Latané, B. y Darley, JM (1970). el que no responde El Diario de Psicología General, 131, 197–224.
espectador: ¿Por qué no ayuda? Nueva York: Appleton Century-
Crofts. MacLeod, CM (1988). Olvidado pero no desaparecido: Ahorros para
Latané, B., Williams, K. y Harkins, S. (1979). Muchos imágenes y palabras en la memoria a largo plazo. Revista de
las manos aligeran el trabajo: Causas y consecuencias de la Psicología Experimental: Aprendizaje, Memoria y Cognición, 14,
holgazanería social. Revista de Personalidad y Psicología Social, 195–212.
37, 822–832. Madigan, S. (1983). Memoria de imágenes. En JC Yuille (Ed.),
Lee, YS. (2002). Niveles de procesamiento y preparación fonológica en Imágenes, memoria y cognición: Ensayos en honor a Allan Paivio
las pruebas de finalización de caracteres chinos. Journal of (págs. 65–89). Hillsdale, Nueva Jersey: Erlbaum.
Psycholinguistic Research, 31, 349–362. Malone, tuberculosis (1986). La luz de freno montada en alto centrada:
Lester, BM y Brazelton, TB (1982). Evaluación transcultural del una historia de éxito de factores humanos. Boletín de la Sociedad
comportamiento neonatal. En DA Wagner y HW Stevenson de Factores Humanos, 29.
(Eds.), Perspectivas culturales sobre el desarrollo infantil. San Mann, T. (1994). Consentimiento informado para psicoterapia
Francisco: Freeman. investigación: ¿Comprenden los sujetos los formularios de
Levy, SR, Plaks, JE, Hong, Y., Chiu, C. y Dweck, consentimiento y entienden sus derechos legales? Ciencia
CS (2001). Teorías estáticas versus dinámicas y la percepción de Psicológica, 5, 140–143.
grupos: Diferentes rutas a diferentes destinos. Revista de Mantzicopoulos, P. (2003). Kindergarten reprobatorio después de Head
personalidad y psicología social, Start: una investigación sobre la contribución de las variables
5, 156–168. contextuales e individuales. Revista de Psicología Educativa, 95,
Lewin, K. (1948). Resolución de confl ictos sociales. Nueva York: 268–278.
Harper. Marcel, AJ (1983). Percepción consciente e inconsciente: experimentos
Lichtenstein, S. y Fischhoff, B. (1977). ¿Aquellos que saben más sobre enmascaramiento visual y reconocimiento de palabras.
también saben más acerca de cuánto saben? Comportamiento Psicología cognitiva, 15, 197–237.
organizacional y desempeño humano, 20, 159–183. Marcas, LE (1974). Procesos sensoriales: La nueva psicofísica. Nueva
York: Prensa Académica.
Locke, J. (1659/1959). Un ensayo sobre el entendimiento humano. Maril, A., Simons, JS, Mitchell, JP, Schwwartz, BL y Schacter, DL
Nueva York: Dover. (2003). Sensación de saber en la memoria episódica: un estudio de
Lockhart, RS y Craik, FIM (1990). niveles de pro fMRI relacionado con eventos. Neuroimagen, 18, 827–836.
cessing: un comentario retrospectivo sobre un marco para la
investigación de la memoria. Revista Canadiense de Psicología, Marriott, P. (1949). Tamaño de los grupos de trabajo y producción.
44, 87–112. Psicología Ocupacional, 23, 47–57.
Loft, S., Sanderson, P., Neal, A. y Mooij, M. (2007). Marshall, JE y Heslin, R. (1975). Niños y niñas
Modelado y predicción de la carga de trabajo mental en el control juntos: composición sexual y el efecto de la densidad y el tamaño
del tráfico aéreo en ruta: revisión crítica e implicaciones más del grupo en la cohesión. Revista de Personalidad y Psicología
amplias. Factores humanos, 49, 376–399. Social, 31, 952–961.
Loftus, EF y Klinger, MR (1992). ¿El inconsciente es inteligente o tonto? Martell, RF y Willis, CE (1993). Efectos de las expectativas de desempeño
Psicólogo estadounidense, 47, de los observadores en las calificaciones de comportamiento de los
761–765. grupos de trabajo: ¿Memoria o sesgo de respuesta? Comportamiento
LoLord, VM (2001). Ayuda aprendida y depresión. En ME Carroll y BJ organizacional y procesos de decisión humanos, 56, 91–109.
Overmier (Eds.), Investigación animal y salud humana: Promoción Massaro, DW (1975). Psicología experimental y procesamiento de la
del bienestar humano a través de la ciencia del comportamiento información. Chicago: Rand McNally.
(págs. 63–77). Mayer, RE (1983). Pensamiento, resolución de problemas, cogni
Washington, DC: Asociación Americana de Psicología. ción Nueva York: Freeman.
Largo, GM y Garvey, PM (1988). Los efectos de la longitud de onda McCall, RB (1990). Fundamentos de estadística para las ciencias del
objetivo en la agudeza visual dinámica bajo visualización fotópica y comportamiento (5ª Ed.). San Diego: Harcourt Brace.
escotópica. Factores humanos, 30, 3–14.

McConahay, JB, Hardee, BB y Batts, V. (1981). ¿Ha disminuido el Miller, DB (1977). Papeles de la observación naturalista en la
racismo en Estados Unidos? Depende de quién pregunte y qué psicología comparada. Psicólogo estadounidense, 32, 211–219.
se pregunte. Diario de Resolución de Conflictos,
25, 563–579. Miller, J. y Ulrich, R. (1998). Locus del efecto del número de respuestas
McDaniel, MA, Friedman, A. y Bourne, LE (1978). alternativas: Evidencia del potencial de preparación lateralizado.
Recordar los niveles de información en palabras. Journal of Experimental Psychology: Human Perception &
Memoria y cognición, 6, 156–164. Performance, 24 (4), 1215–1231.
McDermott, KB y Buckner, RL (2002). Estudios de neuroimagen
funcional de recuperación de la memoria. En LR Miller, JO, Franz, V. y Ulrich, R. (1999). Efectos de la intensidad del
Squire & DL Schacter (Ed.), Neuropsychology of Memory estímulo sobre la fuerza de respuesta en RT simple, go-no go
(3ra Ed.) (págs. 166–173). Nueva York: Guilford y elección. Percepción y Psicofísica, 67, 107–119.
Prensa.
McDougall, D., Hawkins, J., Brady, M. y Jenkins, A. Miller, NE (1959). Liberalización de conceptos básicos de RS:
(2006). Innovaciones recientes en el diseño de criterios Extensiones a conductas de conflicto, motivación y aprendizaje
cambiantes: implicaciones para la investigación y la práctica en social. En S. Koch (Ed.), Psicología: Un estudio de una ciencia
educación especial. El Diario de Educación Especial, 40, 2–15. (Vol. 2, págs. 196–292). Nueva York:
McDougall, D. y Smith, D. (2006). Innovación reciente en diseños de n Colina McGraw.
pequeña para investigación y práctica en consejería escolar Miller, NE (1985). El valor de la investigación del comportamiento en
profesional. Consejería escolar profesional, 9, 392–400. animales. Psicólogo estadounidense, 40, 423–440.
Mitchell, CJ y Lovibond, PF (2002). Hacia atrás y
Meade, ML y Roediger, HL, III (2002). Exploraciones en el contagio bloqueo directo en el condicionamiento electrodérmico humano: el
social de la memoria. Memory & Cognition, 30, 995–1009. bloqueo requiere una suposición de aditividad de resultados.
Revista trimestral de psicología experimental, 55B,
Medawar, PB (1969). Inducción e intuición en la ciencia. 311–329.
pensamiento tifico. Londres: Methuen. Mook, DG (1983). En defensa de la nulidad externa.
Merikle, PM y Reingold, EM (1992). Medición de procesos Psicólogo estadounidense, 38, 379–387.
perceptivos inconscientes. En RF Bornstein y TS Pittman Moriarty, T. (1975). Crimen, compromiso y el espectador receptivo:
(Eds.), Percepción sin conciencia: perspectivas cognitivas, dos estudios de campo. Journal of Personality and Social
clínicas y sociales (págs. 55–80). Psychology, 31, 370–376.
Nueva York: Guilford Press. Morris, CD, Bransford, JD y Franks, JJ (1977).
Merikle, PM, Smilek, D. y Eastwood, JD (2001). Niveles de procesamiento versus procesamiento apropiado
Percepción sin conciencia: Perspectivas desde la psicología de transferencia. Revista de aprendizaje verbal y
cognitiva. Cognición, 79, 114–134. comportamiento verbal, 16, 519–533.
Metcalfe, J. (1986). Las premoniciones de intuición predicen Mortimer, RG (1993). La luz de freno elevada: una causa sin teoría.
error inminente. Revista de Psicología Experimental: Aprendizaje, Actas de la 37.ª reunión anual de la Sociedad de Factores
Memoria y Cognición, 12, 623–634. Humanos y Ergonomía
Middlemist, RD, Knowles, ES y Matter, CF (1977). (págs. 955–959). Santa Mónica, CA: Sociedad de Ergonomía y
Qué hacer y qué informar: una respuesta a Koocher. Factores Humanos.
Revista de Personalidad y Psicología Social, 35, Moscovitch, M. (1982). Múltiples disociaciones de funciones en el
122–124. síndrome amnésico. En L. Cermak (Ed.), Memoria humana y
Milgram, S. (1963). Estudio conductual de la obediencia. Journal of amnesia. Hillsdale, Nueva Jersey: Erlbaum.
Abnormal and Social Psychology, 67, 371–378. Moy, P., Xenos, MA y Hess, VK (2005). Cebado
Milgram, S. (1964a). Presión grupal y acciones contra Efectos de la comedia nocturna. Revista internacional de
una persona. Revista de Psicología Social y Anormal, 69, 137–143. investigación de opinión pública, 18, 198–210.
Murphy, MD y Brown, AL (1975). Incidental
Milgram, S. (1964b). Problemas en el estudio de la obediencia: una aprendizaje en niños preescolares en función del nivel de
respuesta a Baumrind. Psicólogo estadounidense, 19, análisis cognitivo. Revista de Psicología Infantil Experimental,
848–852. 19, 509–523.
Milgram, S. (1965). Algunas condiciones de obediencia y Grupo de Trabajo de Ciencias del Comportamiento del Consejo
desobediencia a la autoridad. Relaciones humanas, 18, 57–76. Asesor Nacional de Salud Mental. (1995). Investigación básica
en ciencias del comportamiento para la salud mental: una inversión nacion
Milgram, S. (1974). Obediencia a la autoridad: una visión experimental. ment (resumen ejecutivo). Ciencia Psicológica, 6, 192–202.
Nueva York: Harper & Row.
Miller, AG, Collins, BE y Brief, DE (1995). Perspectivas sobre la Consejo Nacional de Seguridad. (1999). Hechos de lesiones, 1999 Edi
obediencia a la autoridad: El legado de los experimentos de ción Itasca, IL: Autor.
Milgram. Revista de Asuntos Sociales, 51, Natsoulas, T. (1967). ¿De qué tratan los informes perceptivos?
1–19. Boletín Psicológico, 67, 249–272.

Navón, D. y Miller, J. (2002). ¿Hacer cola o compartir? A Padilla, AM (1971). Análisis de incentivo y contraste conductual en la rata.
evaluación crítica de la noción de cuello de botella único. Psicología Journal of Comparative and Physi ological Psychology, 45, 464–470.
cognitiva, 44, 193–251.
Nelson, TO (1977). Repetición y niveles de procesamiento. Paillard, J., Michel, F. y Stelmach, G. (1983). Localización sin contenido:
Revista de Aprendizaje Verbal y Comportamiento Verbal, 16, un análogo táctil de la “visión ciega”.
151–171. Archivos de Neurología, 40, 548–551.
Ng, CF (2000). Efectos del ruido de la construcción de edificios en los Paivio, A. (1969). Las imágenes mentales en el aprendizaje asociativo y
residentes: un cuasi-experimento. Revista de Psicología Ambiental, la memoria. Revisión psicológica, 76, 241–263.
20, 375–385. Papini, MR, Thomas, BL y McVicar, DG (2002).
Neisser, U. y Harsch, N. (1992). Flashes fantasma: falsos recuerdos PREE entre sujetos y PREE dentro de sujetos en pruebas
de escuchar las noticias sobre Chal lenger. En E. Winograd & U. de extinción espaciadas con palomas. Learning and Moti vation, 33,
Neisser (Eds.), Afecto y precisión en el recuerdo (págs. 9–31). 485–509.
Nueva York: Cambridge University Press. Parr, WV, Heatherbell, D. y White, KG (2002).
Desmitificando la experiencia en vinos: Umbral olfativo, habilidad
Niedzwienska, A. (2003). Distorsión de los recuerdos autobiográficos. perceptiva y memoria semántica en jueces de vinos expertos y
Psicología Cognitiva Aplicada, 17, 81–91. novatos. Sentidos químicos, 27,
Nisbett, R. (1995). Raza, coeficiente intelectual y cientificismo. En S. 475–755.
Fraser (Ed.), The bell curve wars: Race, intelligence and the future Parsons, HM (1970). Vida y muerte. Factores humanos,
of America (págs. 36–57). Nueva York: básico 12, 1–6.
Libros. Parsons, HM (1974). ¿Qué pasó en Hawthorne?
Nisbett, RE y Wilson, TD (1977). Contar más de lo que podemos saber: Ciencia, 183, 922–931.
Informes verbales sobre procesos mentales. Pashler, H. (1989). Disociaciones y dependencias entre velocidad
Revisión psicológica, 84, 231–259. y precisión: evidencia de una teoría de dos componentes de
Nissani, M. (1990). Una interpretación cognitiva de las observaciones atención dividida en tareas simples.
de Stanley Milgram sobre la obediencia a la autoridad. Psicología Cognitiva, 21, 469–514.
Psicólogo estadounidense, 45, 1384–1385. Pávlov, IP (1963). Conferencias sobre reflejos condicionados.
Norman, J. (2002). Dos sistemas visuales y dos teorías de la percepción: Nueva York: Editores internacionales.
un intento de reconciliar los enfoques constructivista y ecológico. Payne, BK (2001). Prejuicio y percepción: el papel
Ciencias del comportamiento y del cerebro, 25, 73–144. de proceso automático y controlado en la percepción errónea de un
arma. Revista de Personalidad y Psicología Social, 81, 181–192.
Notterman, JM y Mintz, DE (1965). Dinámica de
respuesta. Nueva York: Wiley. Payne, BK, Lambert, AJ y Jacoby, LL (2002).
Novick, LR (1990). Transferencia representacional en la resolución de Los mejores planes: efectos de los objetivos en el sesgo de
problemas. Ciencia Psicológica, 1, 128–132. accesibilidad y el control cognitivo en las percepciones erróneas de
Oltmanns, TF, Martin, M., Neale, JM y Davison, GC las armas basadas en la raza. Revista de Psicología Social
(2006). Estudios de casos en psicología anormal (7ª ed., págs. 1– Experimental, 38, 384–396.
14). Nueva York, Wiley. Pedhazur, EJ y Pedhazur Shmelkin, L. (1991).
Olton, RM y Johnson, DM (1976). Mecanismos Medición, diseño y análisis: un enfoque integrado. Hillsdale,
de incubación en la resolución creativa de problemas. Revista Nueva Jersey: Erlbaum.
estadounidense de psicología, 89, 617–630. Peirce, CS (1877). La fijación de la creencia. Ciencia popular
Orne, MT (1962). Sobre la psicología social de la Mensual, 12, 1–15. Reimpreso en EC Moore (Ed.). (1972).
experimento psicológico: Con particular referencia a las Charles Sanders Peirce: Los escritos esenciales. Nueva York: Harper
características de la demanda y sus implicaciones. Psicólogo & Row.
estadounidense, 17, 776–783. Perfecto, TJ y Hollins, TS (1999). Los juicios de sensación de saber no
Orne, MT (1969). Características de la demanda y el concepto de cuasi- predicen el rendimiento de reconocimiento posterior para la memoria
controles. En R. Rosnow y RL Rosenthal (Eds.), Artefacto en la del testigo presencial. Revista de Psicología Experimental: Aplicada,
investigación del comportamiento (págs. 147–179). 5, 250–264.
Nueva York: Prensa Académica. Peterson, LR y Peterson, MJ (1959). Término corto
Orne, MT y Evans, TJ (1965). Control social en el experimento retención de elementos individuales. Revista de Psicología
psicológico: Conducta antisocial e hipnosis. Revista de Experimental, 58, 193–198.
Personalidad y Psicología Social, 1, 189–200. Piaget, J. (1932). El lenguaje y el pensamiento del niño
(2ª ed.). Londres: Routledge & Kegan Paul.
Pachalla, RG (1974). La interpretación del tiempo de reacción en la Piaget, J. e Inhelder, B. (1969). La psicología del niño. Londres:
investigación del procesamiento de la información. En BH Kantowitz Routledge & Kegan Paul.
(Ed.), Procesamiento de información humana: tutoriales sobre Pickren, WE y Dewsbury, DA (2002). en evolución
desempeño y cognición (págs. 41–82). Hillsdale, Nueva Jersey: Perspectivas de la historia de la psicología. Washington, DC:
Erlbaum. Asociación Americana de Psicología.

Piliavin, IM, Rodin, J. y Piliavin, JA (1969). Buen samaritanismo: ¿un Rescorla, R. (1999). Efecto de extinción de refuerzo parcial dentro del
fenómeno clandestino? Revista de Personalidad y Psicología sujeto en autoformado. Revista trimestral de psicología
Social, 13, 289–299. experimental, 52B, 75–87.
Plant, EA, Peruche, BM y Butz, DA (2005). eliminar Rescorla, RA (1967). El condicionamiento pavloviano y su
ning automático sesgo racial: hacer que la raza no sea diagnóstica procedimientos de control adecuados. Revisión psicológica, 74,
para las respuestas a los sospechosos criminales. Journal of 71–80.
Experimental Social Psychology, 41, 141–156. Rescorla, RA (1988). Condicionamiento pavloviano: no es lo que
Plus, S. (1991). Una encuesta de actitud de los activistas por los derechos crees que es. Psicólogo estadounidense, 43, 151–160.
de los animales. Ciencia psicológica, 2, 194–196.
Plus, S. (1996a). Actitudes hacia el uso de animales en la Rieber, RW y Salzinger, K. (1998). Psicología:
investigación y educación psicológica. Psicólogo Perspectivas teórico-históricas ( 2ª Ed.)
estadounidense, 51, 1167–1180. Washington, DC: Asociación Americana de Psicología.
Plus, S. (1996b). Actitudes hacia el uso de animales en la investigación Ringelmann, M. (1913). investigación de motores
y educación psicológica: resultados de una encuesta nacional de anime: Trabajo del hombre. Anales del Instituto
estudiantes de psicología. Ciencia Psicológica, 7, 352–358. National Agronomique, segunda serie, tomo XII, 1–40.
Roberts, C. (1971). Debate I. Experimentación y evolución animal.
Poincaré, H. (1929). Los fundamentos de la ciencia. Nuevo Académico estadounidense, 40, 497–503.
York: Science House, Inc. Roberts, S. y Pashler, H. (2000). ¿Qué tan persuasivo es un buen
Popper, KR (1961). La lógica del descubrimiento científico. ajuste? Un comentario sobre la prueba de la teoría. Revisión
Nueva York: Libros básicos. psicológica, 107, 358–367.
Posner, MI (1973). Cognición: una introducción. Glenview, IL: Scott, Rodgers, JL y Rowe, DC (2002). Desarrollo de la teoría
Foresman. El proceso debe comenzar (pero no terminar) con buenos ajustes
Posner, MI (1993). Atención antes y durante el empíricos. Un comentario sobre Roberts y Pashler (2000). Revisión
década del cerebro. En D. Meyer & S. Kornblum (Eds.), Atención psicológica, 109 (3), 599–603.
y desempeño XIV (págs. 340–351). Roediger, HL (1990). Memoria implícita: Retención
Cambridge: MIT Press. sin recordar Psicólogo estadounidense, 45,
Posner, MI y Raichle, ME (1994). Imágenes de la mente. 1043-1056.
Nueva York: Scientific American Library. Roediger, HL, III, Marsh, EJ y Lee, SC (2002).
Proctor, RW y Capaldi, EJ (2001). Evaluación empírica y justificación Variedades de memoria. En H. Pashler & D. Medin (Eds.),
de metodologías en la ciencia psicológica. Boletín Psicológico 127 Manual de psicología experimental de Steven
(3), 759–777. (3ª Ed.), Vol 2: Memoria y procesos cognitivos
Prescott, J. y Wilkie, J. (2007). Tolerancia al dolor incrementada (págs. 1 a 41). Nueva York: Wiley.
selectivamente por un olor dulce. Psychological Science, 18, 308– Roediger, HL, III y McDermott, KB (1993).
311. La memoria implícita en sujetos humanos normales. En F. Boller
Proffitt, DR (2006). La percepción corporizada y la economía de & J. Grafman (Eds.), Manual de neuropsicología
la acción. Perspectivas sobre la ciencia psicológica, 1, 110– (Vol. 8, págs. 63–131). Ámsterdam: Elsevier.
122. Roediger, HL, III, Meade, ML y Bergman, ET
Proffitt, DR, Bhalla, M., Gossweiller, R. y Midgett, J. (2001). Contagio social de la memoria. Psychonomic Bulletin
(1995). Percepción del sesgo geográfico. Psychonomic Bulletin & Review, 8, 365–371.
& Review, 2, 409–428. Roediger, HL, III, Weldon, MS, Stadler, MA y Riegler, GH (1992).
Pytte, CL, Rusch, KM y Ficken, MS (2003). regulación Comparación directa de raíces de palabras y fragmentos de
ción de amplitud vocal por el colibrí garganta azul, Lampornis mundo en pruebas de retención implícitas y explícitas. Revista
clemenciae. Comportamiento animal, 66, 703–710. de Psicología Experimental: Aprendizaje, Memoria y Cognición,
Queller, S. y Smith, ER (2002). subtipificación versus 18, 1251–1269.
contabilidad en el aprendizaje y el cambio de estereotipos: Roediger, HL, III. (2007). Doce consejos para autores.
simulaciones conexionistas y hallazgos empíricos. Revista de Observador, 20, 39–41.
Personalidad y Psicología Social, 82, 300–313. Roediger, HL, III. (2008). Relatividad del recuerdo:
Rapport, A. (1975). Hacia una redefinición de la densidad. Por qué se desvanecieron las leyes de la memoria. Revisión anual
Ambiente y Comportamiento, 7, 133–158. de psicología, 59, 225–254.
Reed, MP y Green, PA (1999). Comparación del rendimiento de Rollin, BE (1985). El estatus moral de la investigación.
conducción en carretera y en un simulador de bajo coste animales en psicología. Psicólogo estadounidense, 40, 920–
utilizando una tarea de marcación telefónica concurrente. 926.
Ergonomía, 42 (8), 1015–1037. Rosa, TL (1978). La relación funcional entre los colorantes
Reed, SB, Kirsch, I., Wickless, C., Moffitt, KH y Taren, P. (1996). alimentarios artificiales y la hiperactividad. Revista de análisis
Reporte de sesgos en hiponosis: ¿Sugerencia o cumplimiento? de comportamiento aplicado, 11, 439–446.
Revista de Psicología Anormal, 105, 142–145. Rosenthal, R. (1966). Efectos del experimentador en el comportamiento.
investigar. Nueva York: Appleton-Century-Crofts.

Rosenthal, R. (1969). Expectativas interpersonales: Efectos de la Scialfa, CT, Garvey, PM, Gish, KW, Deering, LM, Leibowitz, HW y
hipótesis del experimentador. En R. Rosental & RL Rosnow (Eds.), Goebel, CC (1988).
Artefacto en la investigación del comportamiento Relaciones entre medidas de sensibilidad visual estática y
(págs. 183–277). Nueva York: Prensa Académica. dinámica. Factores humanos, 30, 677–688.
Rosenthal, R. (2002). Comunicación encubierta en aulas, clínicas, Searle, JR (1980). Mentes, cerebros y programas. Behav ioral and
tribunales y cubículos. Psicólogo estadounidense, 57, 839–849. Brain Sciences, 3, 417–458.
Searle, JR (1990). ¿Es la mente del cerebro un programa de
Rosenthal, R. y Fode, K. (1963). Los efectos de ex computadora? Scientific American, (enero) 26–31.
sesgo perimenter en el rendimiento de la rata albina. Seidenberg, MS y McClelland, JL (1989). Un modelo distribuido, de
Ciencias del comportamiento, 8, 183–189. desarrollo del reconocimiento de palabras y nombres. Revisión
Ross, EA (1908). Psicología Social. Nueva York: MacMillan. psicológica, 96, 523–568.
Ross, M. (1989). Relación de las teorías implícitas con la Sergent, C. y Dehaene, S. (2004). ¿Es la conciencia un fenómeno
construcción de historias personales. Psychological Review, 96, gradual? Evidencia de una bifurcación de todo o nada durante
341–357. el parpadeo atencional. Ciencia Psicológica, 15, 720–729.
Rovee-Coller, C. (1993). La capacidad de largo plazo
memoria en la infancia. Direcciones Actuales en Ciencias Sherif, M. (1935). Un estudio de algunos factores sociales en la percepción.
Psicológicas, 2, 130–135. Archivos de Psicología, 187.
Rowan, AN y Lowe, FM (1995). El animal Shimamura, AP (1986). Efectos de cebado en la amnesia:
controversia de investigación: protesta, proceso y política pública. Evidencia de una función de memoria disociable. Revista trimestral
North Grafton, MA: Centro de Animales y Políticas Públicas de la de psicología experimental, 38A, 619–644.
Universidad de Tufts. Shweder, RA y Sullivan, MA (1993). Cultural
Rowland, LW (1939). ¿Las personas hipnotizadas intentarán hacerse Psicología: ¿Quién la necesita? En LW Porter & MR Rosenz weig
daño a sí mismas oa otros? Revista de Psicología Social (Eds.), Revisión anual de psicología (Vol. 44, págs. 497–523). Palo
Anormal, 34, 114–117. Alto, CA: revisiones anuales.
Saegert, S., Mackintosh, E. y West, S. (1975). Dos estudios de Sidman, M. (1960). Tácticas de la investigación científi ca. Nuevo
hacinamiento en espacios públicos urbanos. Ambiente y York: Libros básicos.
Comportamiento, 7, 159–184. Silveira, T. (1971). Incubación: el efecto del tiempo y la duración de la
Salmón, WC (1988). Predicción racional. En A. Grünbaum & WC Slamon interrupción en la solución del problema y la calidad del
(Eds.), Las limitaciones del deductivismo procesamiento del problema. Tesis doctoral inédita, Universidad de
(págs. 47–60) Berkley: Prensa de la Universidad de California. Oregón.
Salvucci, DD, Mandalia, HM, Kuge, N. y Yamamura, T. (2007). Detección Cantante, P. (1995). Experimentación animal: Perspectivas filosóficas.
de cambio de carril utilizando un modelo computacional de conductor. En WT Reich (Ed.), Encyclopedia of bioethics, (Vol. 1, págs. 147–
Factores humanos, 49, 532–542. 153). Nueva York: Prensa libre.
Scarborough, DL (1972). Efectos de la modalidad de estímulo sobre el Skinner, BF (1957). Comportamiento verbal. Nueva York: Appleton
olvido en la memoria a corto plazo. Revista de Psicología Century-Crofts.
Experimental, 95, 285–289. Skinner, BF (1959). El vuelo del laboratorio (págs. 242-257).
Schacter, DL (1983). Sensación de saber en episodios Registro acumulativo, Nueva York: Appleton-Century-Crofts.
memoria. Revista de Psicología Experimental, 9, 39–54.
Schacter, DL (1987). Memoria implícita: Historia y Slaughter-Defoe, DT y Rubin, HH (2001). A
estado actual. Revista de Psicología Experimental: Aprendizaje, estudio de caso longitudinal de niños elegibles para Head Start:
Memoria y Cognición, 13, 501–518. Implicaciones para la educación urbana. Psicóloga Educativa, 36,
Schacter, DL (1990). Introducción a la memoria implícita: Múltiples 31–44.
perspectivas. Boletín de la Psychonomic Society, 28, 338–340. Smith, AD y Winograd, E. (1978). Diferencias de edad en adultos para
recordar caras. Psicología del desarrollo, 14, 443–444.
Schaie, KW (1977). Diseños cuasi-experimentales en el
psicología del envejecimiento. En JE Birren & KW Schaie (Eds.), Smith, ER y Miller, FD (1978). Límites en las percepciones de los
Manual de psicología y envejecimiento. Nueva York: Van Nostrand. procesos cognitivos: una respuesta a Nisbett y Wilson. Revisión
psicológica, 85, 355–362.
Schmolck, H., Buffalo, EA y Squire, LR (2000). Smith, SM (1995). Entrar y salir de las rutinas mentales: una teoría de
Las distorsiones de la memoria se desarrollan con el tiempo: recuerdos fijación, incubación e introspección. En RJ
del veredicto del juicio de OJ Simpson después de 15 y 32 meses. Sternberg y JE Davidson (Eds.), La naturaleza de la comprensión
Ciencia Psicológica, 11, 39–45. (págs. 229–251).
Schreibman, L., O'Neill, RE y Koegel, RL (1983). Entrenamiento Smith, SM y Blankenship, SE (1989). Efectos de la incubación. Boletín
conductual para hermanos de niños autistas. Revista de análisis de de la Psychonomic Society, 27, 311–314.
comportamiento aplicado, 16, 129–138. Smith, SM y Blankenship, SE (1991). La incubación y la persistencia
Schultz, DP y Schultz, SE (1987). Una historia de la psicología moderna de la fi jación en la resolución de problemas.
(4ª Ed.). Nueva York: Prensa Académica. Revista estadounidense de psicología, 104, 61–87.

Snellgrove, L. (1981). Conocimiento de los resultados. En LT Strayer, DL y Johnston, WA (2001). Impulsado a
Benjamin & KD Lowman (Eds.), Manual de actividades para la distracciones: estudios de doble tarea de conducción simulada y
enseñanza de la psicología (p. 66). Washington, DC: Asociación conversación en un teléfono celular. Psychological Science, 12 (5),
Americana de Psicología. 462–466.
Spence, KW (1948). Los postulados y métodos del “conductismo”. Stroop, JR (1935). Estudios de interferencia en serie
Revisión psicológica, 55, 67–78. reacciones verbales. Revista de Psicología Experimental, 18, 643–
Spencer, SJ, Steele, CM y Quinn, DM (1999). 662.
Amenaza estereotipada y rendimiento matemático de la mujer. Sussman, S., Hahn, G., Dent, CW, Stacy, AW,
Revista de Psicología Social Experimental, 35, 4–28. Burton, D. y Flay, BR (1993). Observación naturalista del
Spencer, RM y Weisberg, RW (1986). Contexto consumo de tabaco en adolescentes. Revista Internacional de
efectos dependientes en la transferencia analógica. Memoria y Adicciones, 28, 803–811.
cognición, 14, 442–449. Svartdal, F. (2000). Persistencia durante la extinción: PREE
Stanley, A. (8 de mayo de 1990). Estudiante de pre-medicina, 12, va por convencional e invertido bajo múltiples esquemas. Aprendizaje
registro. Roanoke Times & World News, 1, 10. y motivación, 31, 21–40.
Steele, CM y Aronson, J. (1995). La amenaza del estereotipo y el Svartdal, F. (2003). Extinción después del reforzamiento parcial:
desempeño intelectual de los afroamericanos en las pruebas. persistencia predicha versus juzgada. Revista escandinava de
Revista de Personalidad y Psicología Social, 69, 797–811. psicología, 44, 55–64.
Swazey, JP, Anderson, MS y Lewis, KS (1993).
Steinhauser, M., Maier, M. y Hubner, R. (2007). Problemas éticos en la investigación académica. Científico
Control cognitivo bajo estrés. Ciencia Psicológica, 18, 540–545. estadounidense, 81, 542–553.
Swets, JA, Dawes, RM y Monahan, J. (2000).
Sternberg, RJ (1988). La mente triárquica: una nueva teoría de la La ciencia psicológica puede mejorar las decisiones de
inteligencia humana. Nueva York: vikingo. diagnóstico. Ciencia psicológica en el interés público, 1 (1), 1–26.
Sternberg, RJ (1992). Cómo ganar aceptaciones por psy
Revistas psicológicas: 21 consejos para escribir mejor. Swinnen, SP, Schmidt, RA, Nicholson, DE y
APS Observer, (septiembre) 12–18. Shapiro, DC (1990). Retroalimentación de información para la
Sternberg, RJ (1993). El compañero del psicólogo. adquisición de habilidades: El conocimiento instantáneo de los
(3ra ed.). Nueva York: Cambridge University Press. resultados degrada el aprendizaje. Revista de Psicología
Sternberg, RJ (1995). Por quién dobla la curva de campana: Una Experimental: Aprendizaje, Memoria y Cognición, 16, 706–716.
revisión de la curva de campana. Ciencia Psicológica, 6, 257– Talarico, JM y Rubin, DC (2003). La confianza, no la consistencia,
261. caracteriza las memorias flash. Psychological Science, 14, 455–
Sternberg, RJ (1997). Inteligencia y aprendizaje permanente: ¿Qué hay 461.
de nuevo y cómo podemos usarlo? Psicólogo estadounidense, 52, Telford, CW (1931). La fase refractaria de las respuestas voluntarias y
1134–1139. asociativas. Revista de Psicología Experimental, 14, 35–36.
Sternberg, RJ, Grigorenko, EL y Kalmar, DA
(2001). El papel de la teoría en la psicología unificada. Theeuwes, J. y Alferdinck, JWAM (1995). Disposiciones de luces
Revista de Psicología Teórica y Filosófica, 21 (2), 100–117. traseras para automóviles equipados con una luz de freno
central montada en alto. Factores humanos, 37, 371–380.
Sternberg, RJ y Salter, W. (1982). Concepciones de inteligencia. En Theios, J. (1973). Medidas del tiempo de reacción en el
RJ Sternberg (Ed.), Manual de inteligencia humana (págs. 3– estudio de los procesos de memoria. En GH Bower (Ed.), La
28). Cambridge: Prensa de la Universidad de Cambridge. psicología del aprendizaje y la motivación (Vol. 7, págs. 44–85).
Nueva York: Prensa Académica.
Sternberg, S. (2001). Modificabilidad separada, módulos mentales y el Thompson, JB y Buchanan, W. (1979). Análisis de datos psicológicos.
uso de medidas puras y compuestas para revelarlos. Acta Nueva York: Scribner's.
Psychologica, 106, 147–246. Thompson, KM, Graham, JD y Zellner, JW
Stevens, SS (1961). La psicofísica de las funciones sensoriales. En WA (2001). Métodos de análisis riesgo-benefi cio para dispositivos
Rosenblith, Comunicación sensorial de seguridad vehicular. 17ª Conferencia Técnica Internacional
(págs. 1-33). Cambridge: MIT Press. sobre la Seguridad Mejorada de los Vehículos, Ámsterdam, Países
Stokols, D. y Altman, I., (Eds.). (1987). Manual de psicología ambiental Bajos.
(Vol. 1). Nueva York: Wiley. Thompson, K. M., Segui-Gomez, M., & Graham, J. D.
Strayer, DL y Drews, FA (2007). Distracción del conductor inducida por el (2002). Validación de estimaciones de beneficios y costos: el caso de la
teléfono celular. Direcciones actuales en ciencia psicológica, 16, regulación de las bolsas de aire. Análisis de riesgos, 22 (4), 803–811.
128–131. Thorndike, EL (1898). Inteligencia animal: un estudio experimental de
Strayer, DL, Drews, FA y Johnston, WA (2003). los procesos asociativos en animales.
Fallas de atención visual inducidas por teléfonos celulares durante Suplemento de la monografía de Psychological Review, 2.
una conducción simulada. Revista de Psicología Experimental: Thorndike, EL (1932). Los fundamentos del aprendizaje.
Aplicada, 95, 23–32. Nueva York: Teachers College, Universidad de Columbia.

Tombu, M. y Joliceur, P. (2003). Una capacidad central Weiskrantz, L. (1986). Visión ciega: un estudio de caso y
modelo compartido de desempeño de tareas duales. Revista de trascendencia. Oxford: Clarendon Press.
psicología experimental: percepción y rendimiento humanos, 29 Weiskrantz, L. (1997). Conciencia perdida y encontrada: una
(1), 3–18. explicación neuropsicológica (págs. 40–42). Nuevo
Tulving, E. (1992). Ebbinghaus, Hermann. En LR Squire (Ed.), York: Oxford.
Enciclopedia de aprendizaje y memoria Weiskrantz, L. (2002). Prime-sight y blindsight. Cognición y Conciencia,
(págs. 151–154). Nueva York: Macmillan. 11, 568–581.
Tulving, E. y Pearlstone, Z. (1966). Disponibilidad versus accesibilidad Weiskrantz, L., Cowey, A. y LeMare, C. (1998).
de información en memoria para palabras. Aprendiendo de la pupila: un canal visual espacial en ausencia
Revista de aprendizaje verbal y comportamiento verbal, 5, 381– de V1 en monos y humanos. Cerebro, 121, 1065–1072.
391.
Turing, AM (1950). Maquinaria informática e inteligencia Weizenbaum, J. (1976). El poder de la computadora y el ser humano
ligence. Mind, 59, 433–460. razón. San Francisco: WH Freeman.
Tversky, B. y Marsh, EJ (2000). recuentos sesgados de Weldon, MS y Roediger, HL (1987). alterar
los eventos producen recuerdos sesgados. Psicología Cognitiva, 40, las demandas de recuperación invierten el efecto de
1–38. superioridad de la imagen. Memoria y cognición, 15, 269–280.
Ueda, T., Nawa, Y., Yukawa, E., Taketani, F. y Hara, Y. Welker, RL (1976). Adquisición de una respuesta apetitiva operante libre
(2006). Cambio en la agudeza visual dinámica por dilatación de la en palomas en función de la experiencia previa con alimentos
pupila. Factores humanos, 48, 651–655. independientes de la respuesta. Aprendizaje y motivación, 7, 394–
Ulrich, R. y Mattes, S. (1996). ¿Excitación inmediata? 405.
mejorar la fuerza de respuesta en un tiempo de reacción simple? Wesp, R., Cichello, P., Gracia, E. B., & Davis, K.
Quarterly Journal of Experimental Psychology, Sección A: Human (2004). Observar y participar en acciones intencionadas con objetos
Experimental Psychology, 49, 972–990. influye en las estimaciones de su tamaño. Percepción y Psicofísica,
Ulrich, R., Mattes, S. y Miller, J. (1999). el as de donder 66, 1261–1267.
Suposición de inserción pura: Una evaluación sobre la base de la Blanco, RJ (1971). DebateII. Antivivisección: La reluc
dinámica de respuesta. Acta Psychologica, 102, 43–75. hidra tangente. Académico estadounidense, 40, 503–512.
Underwood, BJ (1975). Las diferencias individuales como crisol en la Wickelgren, WA (1977). Aprendizaje y Memoria. inglés
construcción de teorías. Psicólogo estadounidense, 30, 128–134. Wood Cliffs, Nueva Jersey: Prentice-Hall.
Wickström, G. y Bendix, T. (2000). El "Hawthorne
van Wolkenten, H., Davis, JM, Gong, ML y efecto”: ¿qué mostraron en realidad los estudios originales de
de Waal, FBM (2006). Lidiando con el hacinamiento agudo por Hawthorne? Scandanarian Journal of Work Environment Health, 26
Cebus paella. Revista internacional de primatología, 27, 1241– (4), 363–367.
1256. Willerman, L., Schultz, R., Rutledge, JN y Bigler,
Velten, EA (1968). Una tarea de laboratorio para la inducción de EDI (1991). Tamaño e inteligencia del cerebro in vivo. Inteligencia,
estados de ánimo. Investigación y terapia del comportamiento, 15, 223–228.
6, 473–478. Williams, KD, Nida, SA, Baca, LD y Latané,
Walden, P. (2004). Procedimientos, contenido y B. (1989). Holgazanería social y natación: Efectos de la
descripción general del conjunto de datos. En D. Romer, K. capacidad de identificación del rendimiento individual y de relevos
Kenski, P. Waldman, C. Adasiewicz y KH Jamieson (Eds.), de nadadores interuniversitarios. Psicología Social Básica y
Capturando la dinámica de la campaña: la encuesta electoral Aplicada, 10, 73–82.
nacional de Annenberg (págs. 12–33). Nueva York: Oxford University Williams, K., Harkins, S. y Latané, B. (1981). identi -
Press. la habilidad como elemento disuasorio de la holgazanería social:
Warrington, EK y Weiskrantz, L. (1970). Síndrome amnésico: dos experimentos que animan. Revista de Personalidad y
¿consolidación o recuperación? Naturaleza, 228, 628–630. Psicología Social, 40, 303–311.
Witt, JK y Proffitt, D. (2005). Ver la pelota, golpear la pelota: el tamaño
Wason, PC (1968). Razonar sobre una regla. Revista trimestral de aparente de la pelota se correlaciona con el promedio de bateo.
psicología experimental, 20, 273–281. Ciencia Psicológica, 16, 937–938.
Watson, JB (1913). La psicología como el conductista ve. Revisión Wolf, MM y Risley, TR (1971). Refuerzo: Investigación aplicada. En
psicológica, 20, 158–177. R. Glaser (Ed.), La naturaleza del refuerzo (págs. 310–325).
Watson, JB (1919). La psicología desde el punto de vista de un Nueva York: Prensa Académica.
conductista. Filadelfia: Lippincott.
Watson, JB (1925). Behaviorismo. Nueva York: Norton. Wolters, G. y Goudsmit, JJ (2005). Flashbulb y memoria de eventos
Waugh, NC y Norman, DA (1965). Memoria primaria. del 11 de septiembre de 2001: Consistencia, confianza y
Revisión psicológica, 72, 89–104. efectos de la edad. Informes psicológicos, 96, 605–619.
Webb, EJ, Campbell, DT, Schwartz, RD y Sechrest, L. (1966). Medidas
discretas: Investigación no reactiva en las ciencias sociales. Wood, JM, Garth, D., Grounds, G., McKay, P. y Mulvahil, A.
Chicago: Rand McNally. (2003). La dilatación de la pupila afecta

algunos aspectos de la conducción diurna. Revista británica de Zajonc, RB (1962). Supresión de respuesta en defensa perceptiva.
oftalmología, 87, 1387–1390. Revista de Psicología Experimental, 64, 206–214.
Woodworth, RS y Schlosberg, H. (1954). Psicología experimental (Rev.
Ed., págs. 396–397, 485–486). Nueva York: Henry Holt and Zimbardo, PG (2007). El efecto Lucifer: comprender cómo las personas
Company. buenas se vuelven malas. Nueva York: Random House.
Wundt, W. (1874). Principios de psicología fisiológica.
Leipzig: Engelmann. Zimmer, HD y Engelkamp, J. (1999). Niveles de
Yeager, K. (1996). I+D y las dimensiones del valor. Revista EPRI, 21, 16– efectos de procesamiento en las tareas realizadas por el sujeto.
25. Memoria y cognición, 27, 907–914.
Joven, PC (1952). Usos antisociales de la hipnosis. En Zuckerman, M. (1995). Buenos y malos humores: Bases bioquímicas de
LM LeCron (Ed.), Hipnosis experimental. Nueva York: Macmillan. la personalidad y sus trastornos. Ciencia Psicológica, 6, 325–332.
Joven, PT (1928). Precauciones en la experimentación con animales.

Boletín Psicológico, 25, 487–489.

GLOSARIO
Método a priori según Imagen remanente que surge después de

Peirce, una forma de fijar la mirar un estímulo visual, por lo general
creencia según la razonabilidad durante varios segundos. Ver
del acontecimiento Imagen remanente positiva; Imagen
remanente negativa
Diseño AB un diseño de uso frecuente en
terapia en el que se instituye una AI (inteligencia artificial) la
terapia (B) después de medir un noción de que los programas de
comportamiento particular (A); un mal computadora pueden ejecutar acciones
diseño de investigación que se cree que requieren inteligencia
cuando las realizan personas
Diseño ABA ver diseño Reversal
Nivel alfa ver nivel de significancia
ABAB diseña una rever completa
diseño sal usado a menudo en terapia
de tal manera que se reintroduce el Ondas alfa de gran amplitud,
procedimiento terapéutico (B) ondas cerebrales lentas vistas
durante la vigilia relajada
ABBA diseña un contrapeso intrasujeto en
el que los tratamientos o las Diseño de tratamientos alternos
condiciones A y B se administran en un diseño de n pequeña en el que
el orden ABBA o BAAB hay más de dos niveles de la
variable independiente
Abscisa el eje horizontal Amnesia un trastorno de la memoria,
(o eje X) en un gráfico generalmente causada por alguna
Desviación media absoluta lesión en el cerebro, caracterizada
valor absoluto de las desviaciones de las por la pérdida total o parcial de la
memoria
puntuaciones con respecto a la media
analogía entender uno

Umbral absoluto en psicofísica,
concepto en términos de otro
una barrera hipotética que los
estímulos entrantes deben cruzar Análisis de varianza una prueba estadística
antes de que puedan ser percibidos apropiada para analizar la
confiabilidad de experimentos con
cualquier número de niveles en una
Resumen breve resumen al comienzo de
o más variables independientes
un artículo de revista que informa al
lector sobre lo que se hizo (método)
y los resultados El enfoque analítico intenta predecir
Afectos reacciones emocionales, como eventos sobre la base de una teoría

o modelo.
el odio, la alegría y el amor.
59533_21_glosario_p528-541.indd 528 9533_21_glosario_p528-541.indd 528 3/5/08 /5/08

Antropomorfizar atribuyendo características o emociones humanas, como la Experimento ciego en el que los sujetos no saben si están o no en la condición de
felicidad, a los animales. tratamiento
formato APA el formato de artículo de revista especificado por el Vista ciega según Weiskrantz, el efecto de ciertos tipos de daño cerebral en el
Asociación Americana de Psicología (APA); el Manual de Publicaciones que el sujeto no puede reconocer objetos pero conserva la capacidad
de la APA se encuentra actualmente en su quinta edición de detectar la presencia y el movimiento de los objetos .
Afásico una persona que tiene un trastorno del lenguaje; generalmente asociado
con daño en el hemisferio izquierdo del cerebro El bloqueo de un estímulo condicionado previamente aprendido bloquea el
aprendizaje de un nuevo estímulo condicionado presentado en un
Aparato una subsección de la parte del método de un documento técnico que
compuesto con él porque el nuevo es redundante
describe cualquier equipo especial utilizado en la investigación para evaluar
a los participantes. Procesos cognitivos de procesamiento de abajo hacia arriba que implican la
extracción de características que comienzan con la estimulación sensorial.
Investigación aplicada Investigación dirigida a la solución de un problema
práctico. Condiciones de contorno las condiciones necesarias para
producir un fenómeno, o las condiciones requeridas para obtener el
La media aritmética suele llamarse la media, es una medida
fenómeno
seguro de tendencia central que es la suma de las puntuaciones dividida
por el número de puntuaciones La técnica de Brown-Peterson es una forma de estudiar la memoria a
corto plazo que consiste en presentar primero un elemento que
Transferencia asimétrica ver efecto de arrastre
debe recordarse y luego presentar material que limita el ensayo para
Tarea auditiva extraña: una tarea de monitoreo en la que el observador un intervalo de retención antes de una prueba de retención.
cuenta el menos frecuente de dos estímulos auditivos distintos.
Intervención del espectador (efecto espectador) cuanto más

Autor la persona o personas responsables de un documento técnico; una personas que observan una crisis y que son ayudantes potenciales, es
búsqueda bibliográfica a través del nombre de un autor puede ser una menos probable que un espectador ayude a la víctima
fuente rentable de referencias adicionales
Capacidad de compartir una clase de modelos de atención que postulan un
Memoria autobiográfica memoria para la propia vida recurso común necesario para las operaciones mentales
Fenómeno autocinético: la percepción por parte de una persona en una efecto de arrastre el efecto relativamente permanente que los sujetos de
habitación oscura de que un solo punto de luz estacionario parece prueba en una condición tienen en su comportamiento posterior en
moverse. otra condición
Conciencia un problema en la percepción de si un Estudio de caso la investigación intensiva de un particular en

el individuo puede responder perceptivamente a un evento en ausencia postura, o caso, de algún comportamiento; no permite inferencias de
de conciencia
causa y efecto sino que es meramente descriptivo
Cuadrado latino equilibrado un esquema de contrapeso en Lista categorizada de palabras usadas en experimentos de memoria que están
en el que cada condición es precedida y seguida con la misma frecuencia relacionadas por ser miembros de la misma categoría; por ejemplo,
por cualquier otra condición artículos de mobiliario: silla, cama, sofá, mesa
Línea de base una medida utilizada como base para la comparación, generalmente Porque inferimos una causa a partir de resultados experimentales cuando
cuando no se administra ningún tratamiento vemos un efecto producido por el factor variado
Investigación de investigación básica destinada a aumentar la comprensión Efecto techo ver Efectos de atenuación de escala
fundamental .
Cuello de botella central: una clase de modelos de atención que postulan
Conductismo la escuela de psicología, originada por John procesamiento secuencial tardío de una tarea a la vez
Watson, que dirigió la atención de los psicólogos al estudio del
Tendencia central el centro de una distribución de puntajes; estadísticas
comportamiento manifiesto, no a la mente o los eventos mentales.
descriptivas que indican el centro de una distribución de puntajes (ver
Beta ( ) un estadístico en la teoría de detección de señales relacionado con el Media, mediana)
criterio adoptado por el observador
Diseño de criterio cambiante un diseño de n pequeña en el que el criterio para
Ondas beta de baja amplitud, ondas cerebrales rápidas vistas durante obtener algún resultado cambia sistemáticamente con el tiempo.
atención a las tareas cognitivas
Varianza entre grupos una medida de la dispersión entre grupos en un Sala china un experimento mental desarrollado por Searle que supuestamente
experimento demuestra que la inteligencia artificial es imposible
Diseño entre sujetos un diseño experimental en

en el que cada sujeto se prueba bajo un solo nivel de cada variable Chi-cuadrado ( 2) prueba de independencia una prueba estadística que se
independiente utiliza a menudo para determinar la importancia de la relación entre las
Bit la unidad básica de información medida en dígitos binarios variables en la investigación de contingencias

Tarea de elección-reacción Tarea secundaria que implica más de un Investigación de contingencia un diseño de investigación relacional en
estímulo y más de una respuesta que se utiliza para medir las el que se evalúan las frecuencias de todas las combinaciones de
demandas de atención de una tarea primaria. dos variables para determinar la relación entre ellas.
Elección-tiempo de reacción ver reacción de Donders B

refuerzo continuo un programa de refuerzo
edad cronológica la edad física de un individuo
en el que sigue una recompensa cada vez que se emite el
Condicionamiento clásico una forma básica de aprendizaje, en la que los comportamiento apropiado
estímulos inicialmente incapaces de evocar ciertas respuestas
Condición de control una condición experimental, generalmente sin
adquieren la capacidad de hacerlo a través del emparejamiento
tratamiento, utilizada como línea de base
repetido con otros estímulos (estímulos incondicionados) que pueden
provocar tales respuestas; también llamado condicionamiento del Grupo de control un grupo de participantes que no recibieron tratamiento
respondedor experimental
Psicología cognitiva el estudio de cómo las personas adquieren, Variable de control una variable independiente potencial que se mantiene
almacenar y usar información constante en un experimento
Cohorte a las personas que tienen una edad equivalente a la persona que Operaciones convergentes un conjunto de líneas de investigación
se examina en un estudio del desarrollo. relacionadas que refuerzan una conclusión común
La cohorte produce una confusión potencial cuando la edad es un

Coeficiente de correlación un número que puede variar de
variable, atribuible a los efectos de las personas que viven en un
1.00 a 1.00 y que indica el grado de relación entre dos variables
momento en que un individuo determinado se está desarrollando
Búsqueda bibliográfica computarizada un método de búsqueda de bases

La investigación correlacional permite al experimentador
de datos en una biblioteca o en la Web usando una computadora
determinar simultáneamente el grado y la dirección de una relación
Réplica conceptual el intento de demostrar un fenómeno experimental con una sola estadística
con un paradigma completamente nuevo o un conjunto de
Equilibrio de un término que describe cualquier técnica utilizada para variar
condiciones experimentales (ver Operaciones convergentes)
sistemáticamente el orden de las condiciones en un experimento para
distribuir los efectos del tiempo de prueba (p. ej., práctica y fatiga),
Procesamiento basado en conceptos ver Procesamiento de arriba hacia abajo para que no se confundan con las condiciones
Respuesta condicionada (RC) la respuesta aprendida a una

Estimulo condicionado
Criterio en la detección de señales el nivel establecido por el proceso de
Estímulo condicionado (CS) un estímulo originalmente neutral que, a través decisión para determinar si decir "sí" o "no" a la presencia de un
de repetidos emparejamientos con un estímulo incondicionado, estímulo.
adquiere la capacidad de provocar la respuesta originalmente producida Validez de criterio ver Validez predictiva
solo por el estímulo incondicionado.
Experimento crítico un experimento clave que pretende distinguir entre
Confidencialidad la directriz del investigador que establece que la teorías en competencia.
información obtenida sobre los sujetos debe permanecer
confidencial a menos que se acuerde lo contrario El procedimiento de correlación de panel cruzado implica
varias correlaciones que ayudan a determinar la dirección de la
Sesgo de confirmación la tendencia a buscar información que confirme en
posible causalidad entre las variables
lugar de refutar la hipótesis de uno.
Interacción cruzada la inversión del efecto de uno
Conformidad que pone el comportamiento de acuerdo con lo social.
variable independiente en una variable dependiente en un cierto
normas
nivel de una segunda variable independiente
Confundir la variación simultánea de una segunda vari
Diseño de diseño transversal que usa una gran muestra de la población
capaz con una variable independiente de interés para que cualquier
de varias edades al mismo tiempo para fines de prueba (en contraste
efecto sobre la variable dependiente no pueda atribuirse con certeza a
con el diseño longitudinal)
la variable independiente; inherente a la investigación correlacional
Diseño secuencial cruzado: un experimento que combina los
procedimientos transversales y longitudinales.
Validez de constructo cuando varias medidas se ajustan sensatamente
juntos y convergen en (y pueden ser explicados por) un concepto d una estadística en la teoría de detección de señales relacionada con la
psicológico subyacente sensibilidad del observador
Contingencia la relación entre una respuesta y su resultado en el Data las puntuaciones obtenidas en una variable dependiente
condicionamiento operante o la relación estímulo condicionado-
Procesamiento basado en datos ver Procesamiento ascendente
estímulo incondicionado en el condicionamiento clásico
59533_21_glossary_p528-541.indd 530 9533_21_glossary_p528-541.indd 530 3/5/08 /5/08

interrogatorio cuando a los sujetos se les informan todos los detalles de un Reproducción directa la repetición de un experimento de la manera más
experimento después de haber participado; una obligación ética del idéntica posible a la primera ejecución, para determinar si se
investigador obtendrán los mismos resultados.
engaño una técnica de investigación en la que se engaña al participante sobre Escalado directo Técnica de escalado en la que el observador
algún aspecto del proyecto; puede ser poco ético responde directamente en unidades de escala psicológica
Prueba direccional ver Prueba de una cola
Umbral de decisión el estímulo que provoca una respuesta que resulta tanto Estímulo discriminativo (SD) un estímulo que indica si una respuesta será
del criterio como de la fuerza del estímulo (ver Beta, d )
reforzada o no
Discusión una sección de un documento técnico en el que el autor saca

Razonamiento de deducción de lo general a lo particular
conclusiones teóricas al examinar, interpretar y calificar los resultados.
Grados de libertad el número de valores libres para variar si el número total
de valores y su suma son fijos
Dispersión la cantidad de dispersión en una distribución de puntajes
Delimitando las observaciones, especialmente en la observación naturalista,
Diseño de criterio distribuido un diseño de n pequeña en el que
la necesidad de limitar o elegir las clases de comportamientos a observar.
los criterios para los resultados se distribuyen entre dos o más
comportamientos (ver Diseño de criterio cambiante)
Características de la demanda : las señales disponibles para los sujetos en
Distribución de medias muestrales una distribución de medias muestrales
un experimento que pueden permitirles determinar el propósito del
tomadas de una población que se aproxima a una distribución normal
experimento o lo que espera el experimentador.
Desarrollo dicigótico a partir de dos óvulos fertilizados diferentes

Densidad una variable independiente primaria en el hacinamiento
investigación, que generalmente se define como el número de Dolorímetro un dispositivo similar a un secador de pelo que puede
personas por unidad de área presentar un calor radiante enfocado a la piel
Donders Una reacción una tarea de tiempo de reacción en la que un

variable dependiente la variable medida y registrada por el experimentador
estímulo está vinculado con una respuesta
Donders B reacción una tarea de tiempo de reacción en la que hay

Métodos estadísticos descriptivos para organizar y resumir datos
son dos o más respuestas, cada una vinculada a su propio estímulo
Diseñar el marco de un experimento: las variables independientes,

Donders C reacción una tarea de tiempo de reacción en la que hay dos
dependientes, del sujeto y de control
estímulos pero solo una respuesta
determinismo la creencia filosófica de que todos los eventos se derivan
de causas Experimento doble ciego una técnica experimental en la que ni el sujeto ni el
experimentador saben qué sujetos están en qué condiciones de tratamiento
Análisis de casos desviados Investigación de casos similares que difieren en
el resultado en un intento de especificar las razones de los diferentes
resultados. Doble disociación de función una técnica en la que dos tareas diferentes de
diferentes áreas de funcionamiento provocan comportamientos
Diferencia una propiedad básica de todas las escalas de medición.
opuestos (ver Operaciones convergentes)
tal que los objetos o sus atributos se pueden categorizar como diferentes
entre sí
Dualismo la idea de que la mente y el cuerpo están separados
Umbral de diferencia el punto promedio en el que se juzga que dos
entidades
estímulos son diferentes
La perimetría dinámica es un procedimiento utilizado para medir el campo
El arrastre diferencial produce un problema en el interior.
visual, en el que un pequeño objetivo visual se introduce gradualmente
sujetos diseños experimentales cuando la exposición a condiciones
en el campo visual.
anteriores altera el comportamiento en condiciones posteriores
Agudeza visual dinámica capacidad para percibir detalles en objetos en
Difusión (I Nt ) la ley de potencia que muestra ese impacto
movimiento
(I) de otras personas disminuye en función del número (N) de otras
personas Configuración véase Conjunto
Difusión de la responsabilidad la tendencia de los individuos a asumir menos Electroencefalograma (EEG) un registro de la actividad eléctrica del
responsabilidad para actuar en una situación de grupo cerebro que se realiza mediante electrodos colocados en el cuero
cabelludo
Aproximación directa a la percepción La idea de Gibson de que recogemos
y utilizamos directamente la información que nos proporciona el Ley de Emmert el tamaño de una imagen residual es proporcional a la distancia
entorno. de visualización

Dependencia empírica o derivada de la observación o el experimento. Explicaciones que hacen inteligible un conjunto de eventos
Enfoque empírico en contraste con el ap analítico Prueba de memoria explícita una prueba de memoria que requiere que una
enfoque, intentos de lograr poder predictivo sobre la base de persona trate conscientemente de recordar eventos específi cos
regularidades empíricas
Variables extrañas variables de control, también conocidas como
Teoría empírica de la percepción el argumento de que las percepciones variables molestas
están totalmente determinadas por la experiencia pasada

F prueba una razón de dos varianzas que es la base del análisis
Memoria episódica memorias que son autobiográficas hermana de varianza
y fechado personalmente
Validez aparente la condición en la que un instrumento de medición
Intervalo igual propiedad de las escalas de medición tal que un cambio intuitivamente parece medir lo que se supone
de una unidad es equivalente en todo el rango de la escala para medir
diseño factorial un diseño experimental en el que cada nivel de cada

Eta (n) una medida de la magnitud del efecto para la prueba F variable independiente ocurre con todos los niveles de las otras
variables independientes
Cuestiones éticas una variedad de problemas relacionados con la
tratamiento de los participantes de la investigación, como el engaño, Falsa alarma el informe incorrecto de la presencia de un
el consentimiento informado y el trato humanitario de los sujetos animales señal en un ensayo en el que sólo se produce ruido
Falsifiability ver la afirmación de Popper de que los resultados negativos de

Etograma un inventario relativamente completo de especies una prueba son más informativos que los resultados positivos
comportamientos específi cos mostrados por una especie
Efecto de fatiga una forma de efecto de arrastre en el que el comportamiento
Etología el estudio del comportamiento natural disminuye en el transcurso de un experimento.
Potencial relacionado con eventos (ERP) un tipo de onda cerebral que se Ley de Fechner la relación logarítmica, desarrollada por k log(s)
mide poco después de un estímulo evocador específico (ver N100, Fechner, de la sensación a la intensidad del estímulo:
N400, P200 y P300)
Investigación de campo Investigación realizada en entornos naturales .
Ex post facto literalmente, “después del hecho”; Describe las condiciones en donde los sujetos normalmente no saben que están en un experimento
un experimento que no se determinan antes del experimento, sino solo
después de que se haya producido alguna manipulación de forma
Figuras presentaciones gráficas de datos en las secciones de resultados
natural.
de un informe de investigación
Experimentar la manipulación sistemática de algunos factores del entorno
Flashbulb memory la memoria vívida de uno para escuchar el
para observar el efecto de esta manipulación en el comportamiento.
noticia de un evento sorprendente
Efecto de suelo ver Efectos de atenuación de escala

Control experimental de la constante de mantenimiento de extrane
varias variables en un experimento para que cualquier efecto sobre la La resonancia magnética funcional fMRI es una herramienta para
variable dependiente pueda atribuirse a la manipulación de la variable medir el flujo sanguíneo en el cerebro, un correlato de la actividad
independiente neuronal
Error experimental cualquier variación en la variable dependiente que no prueba de reconocimiento de elección forzada una prueba en la que el
sea causada por la variable independiente participante debe seleccionar entre dos o más afirmaciones; a menudo
se utiliza para controlar los estilos de respuesta
Extinción experimental cuando el reforzador de una respuesta
instrumental ya no se da después de la respuesta Fraude la distorsión deliberada de los resultados de la investigación, que
incluye la fabricación de datos, la alteración de los datos y
deliberadamente no informar los resultados que se consideran
Hipótesis experimental la hipótesis de investigación que especifica los inapropiados para los intereses de uno.
efectos de las variables independientes (en contraste con la hipótesis
nula) Prueba de recuerdo libre en la que los sujetos recuperan el futuro
elementos recordados sin la ayuda de recuperación externa
Fiabilidad experimental la medida en que los resultados experimentales
señales; pueden recordar en cualquier orden, por lo que recordar es libre
pueden reproducirse o se obtendrán de nuevo si se repite el experimento en ese sentido
Libertad para retirar la obligación ética de los experimentadores de permitir

Sesgo del experimentador el efecto que un experimentador puede
que sus sujetos dejen de participar en el proyecto de investigación.
ejercer sin saberlo sobre los resultados de un experimento, generalmente
en una dirección que favorece la hipótesis del experimentador
Distribución de frecuencias un conjunto de puntajes dispuestos en orden a
Experimentador efectúa resultados artefactos debido a la presencia de un
lo largo de una distribución, que indica el número de veces que ocurre
experimentador cada puntaje

Polígono de frecuencia un gráfico lineal de una frecuencia Ilusión un error o percepción distorsionada
distribución
Las imágenes son un componente de la experiencia consciente que implica
Fijo funcional la incapacidad de usar un objeto en un viendo "en el ojo de la mente"
nuevo contexto si ya ha cumplido una función diferente
Juego de imitación ver Test de Turing
Funcionalismo la escuela de psicología que se ocupa de la función de los
Impacto (I = Nt ) la ley de potencia que muestra que el impacto
procesos psicológicos.
(I ) de otros aumenta con el número (N) de otras personas
La práctica general afecta la tendencia al desempeño.
mejorar con la repetición
Pruebas de medidas de actitud implícitas que miden las actitudes de una
Generalidad de los resultados la cuestión de si un resultado experimental persona (p. ej., sobre la raza) sin su conocimiento de lo que se está
en particular se obtendrá en diferentes circunstancias, como con midiendo
una población de sujetos diferente o en un entorno experimental
Prueba de memoria implícita una prueba de "memoria" que no
diferente
requiere que una persona recuerde explícitamente experiencias
Generalización formación de amplias proposiciones derivadas específicas pero que exhibe espontáneamente los efectos de esas
de hechos individuales experiencias
Psicología de la Gestalt la escuela de psicología que enfatiza los patrones Incubación durante la resolución de problemas, un momento en que una
completos como importantes en la percepción, en lugar del análisis persona recurre a otros asuntos después de no poder resolver el problema
artificial de la experiencia en partes (como en el estructuralismo) Se dice que el problema se incuba, como lo hacen los huevos mientras una
gallina se sienta sobre ellos, y se puede resolver más rápidamente más adelante.
Graphemic el nivel de letra del análisis perceptivo. variable independiente la variable manipulada por el experimentador
Alucinación un informe de una experiencia en ausencia de cualquier estímulo

aparente Enfoque indirecto de la percepción la idea de que la percepción resulta
de la interpretación de las sensaciones
Efecto Hawthorne la condición en la que el rendimiento en un experimento
se ve afectado por el conocimiento de los participantes de que están Escalado indirecto La escala psicológica se construye indirectamente
en un experimento (ver Características de la demanda) poniendo en una fila sucesivas unidades de diferencia apenas
perceptibles.
Disímiles heterogéneos ; variando de otros Razonamiento por inducción de lo particular a lo general
Efectos de interacción de interacción de orden superior que involucran Procedimientos estadísticos inferenciales para determinar la
más de dos variables independientes en experimentos multifactoriales confiabilidad y generalidad de un hallazgo experimental particular
Histograma una distribución de frecuencia en la que la altura de las barras Punto de inflexión el punto de una curva normal en el que la cola comienza
en el gráfico indica la frecuencia de una clase de puntajes; también a extenderse; una desviación estándar de la media
llamado gráfico de barras
La historia produce una posible confusión en la investigación que, Información de hechos; datos del mundo exterior; también una
inadvertidamente, se lleva a cabo entre mediciones debido a cambios unidad de medida en teoría de la información
históricos en el participante.
Consentimiento informado decisión de los posibles participantes
Acertar en la detección correcta de una señal que se ha presentado de participar en un experimento
Homogeneidad de la varianza el análisis de la varianza asume que Insight el momento de la iluminación en la resolución de problemas; cuando
las varianzas dentro de los grupos de las diferentes condiciones se “eclosiona” una idea; a veces acompañado de una experiencia "ajá"
son equivalentes
homogéneo similar; del mismo tipo que otros Comité Institucional de Cuidado y Uso de Animales (IACUC) un comité
que supervisa la protección de los sujetos animales en casi todas
Factores humanos la disciplina que trata de optimizar la relación entre la
las instituciones de los Estados Unidos que realizan investigaciones
tecnología y el ser humano
Hipótesis una declaración comprobable que ofrece una relación predicha

Junta de Revisión Institucional (IRB) una junta que supervisa la protección
entre variables dependientes e independientes
de los participantes humanos en casi todos los
Institución de los Estados Unidos que realiza investigaciones.
Ideas pensamientos
Condicionamiento instrumental condicionamiento en el que un sujeto
Iluminación una etapa intermedia en la resolución de problemas en la que aprende a dar una respuesta que conduce a una recompensa o evita
el individuo gana conocimiento o descubre una posible solución a un un castigo; en contraste con el condicionamiento clásico, no se presenta
problema. ningún estímulo provocador

Edad mental de la inteligencia (determinada por una prueba) dividida Magnitud una propiedad de las escalas de medición que tiene que
por edad cronológica multiplicada por 100 ver con el hecho de que los valores de escala se pueden ordenar en el
base de magnitud: si AB y BC, entonces AC
Interacción resultado experimental que ocurre cuando los niveles de una
variable independiente se ven afectados diferencialmente por los niveles Magnitud del efecto un cálculo, como rpb, que revela la magnitud del efecto
de otras variables independientes de la variable independiente: qué tan equivocada es la hipótesis nula
Tarea interpolada una tarea utilizada para llenar el intervalo entre

el estudio del material y su recuerdo en experimentos de Los observadores de estimación de magnitud asignan números a los atributos
memoria de los estímulos, generalmente sin restricción, excepto que los números
se asignan proporcionalmente a la magnitud juzgada (una escala de
Intervalo de incertidumbre la diferencia entre los umbrales superior e
razón)
inferior en un cálculo del umbral de diferencia
Efecto principal la condición en la que el efecto de uno en
variable dependiente es la misma en todos los niveles de otra variable
escala de intervalo una escala de medida que posee las propiedades de
independiente
diferencia, magnitud e intervalos iguales
Prueba U de Mann-Whitney una prueba no paramétrica para determinar la
Variables intervinientes conceptos abstractos que vinculan variables
diferencia entre dos muestras
independientes con variables dependientes
Mapeo en resolución de problemas, el conjunto de correspondencias entre un
Introducción la parte de un documento técnico que especifica el problema a
problema fuente y objetivo; cómo los dos problemas se "asignan" entre
estudiar y explica por qué es importante
sí
Introspección un método utilizado por los psicólogos estructurales para mirar
dentro y examinar su propia conciencia. Enmascarar la técnica de presentar una imagen desordenada
estímulo inmediatamente después de un estímulo objetivo para detener
Diferencia apenas perceptible (JND) acuñada por Fechner, la sensación interna la persistencia visual del objetivo
evocada por un umbral de diferencia y la unidad básica que define una
Emparejamiento que intenta hacer que diferentes grupos de sujetos sean
escala psicológica interna
equivalentes en función de las características o puntajes del sujeto
en las pruebas
Escala de magnitud etiquetada una escala psicofísica de proporción

Los grupos emparejados diseñan un diseño experimental en
que empareja números delimitados por 0 y 100 con etiquetas verbales
qué sujetos se emparejan en alguna variable que se supone que está
que van desde “nada” hasta “la sensación más fuerte imaginable”
correlacionada con la variable dependiente y luego se asignan
aleatoriamente a las condiciones
Landolt C una forma de medir la agudeza visual, en la que se varía la brecha
Materiales una subsección de la sección de métodos que
de la C y el observador determina cuándo la brecha ya no es visible
escribe cualquier bosquejo escrito o grabado en video, cuestionarios,
encuestas, etc. que se usaron para evaluar a los sujetos
Gran-n diseñar un experimento que involucre una gran cantidad de sujetos;
generalmente analizados por procedimientos estadísticos complejos
Medición la asignación sistemática de números o nombres a objetos o
atributos de objetos.
Latencia cantidad de tiempo necesario para completar una tarea
Escalas de medición en orden creciente de información nominal, ordinal, de
Ley del efecto el principio de que el refuerzo de una respuesta conduce intervalo y de razón
a que la respuesta sea más probable que ocurra en el futuro
mediana una medida de tendencia central; la puntuación media de
una distribución, o el que divide una distribución por la mitad
Nivelar el valor de una variable independiente
Mediador una variable que proporciona el vínculo causal entre dos variables; un
Nivel de confianza Ver nivel de signifi cación mecanismo causal subyacente
Niveles de procesamiento un marco para estudiar la memoria que predice Edad mental la edad intelectual de un individuo medida por una prueba de
que las tareas de codificación semántica o “más profunda” producirán coeficiente intelectual en contraste con la edad cronológica
una mejor memoria para el material que las tareas de codificación
Carga de trabajo mental una variable interviniente, similar a la atención, que
perceptual o “superficial”
modula la sintonía entre las demandas del entorno y la capacidad del
Búsqueda de literatura un método de búsqueda de bases de datos en organismo.
una biblioteca o en la Web usando una computadora
método una sección de un documento técnico que describe en detalle las
Diseño longitudinal Pruebas repetidas de un grupo de operaciones realizadas por el experimentador
personas a medida que envejecen (en contraste con el diseño transversal)
método de autoridad un método para fijar la creencia en el que la palabra de
Recuperación de la memoria a largo plazo de recuerdos que han desaparecido una autoridad se toma como fe (en contraste con
de la conciencia después de su percepción inicial Empírico)

Método de límites un procedimiento psicofísico para disuadir Efecto de contraste negativo una disminución en el comportamiento
umbrales de minería en los que se presentan secuencias cuando la magnitud del refuerzo disminuye de tal manera que el
ascendentes y descendentes de estímulos comportamiento es menor que cuando siempre ha sido seguido por
una pequeña magnitud.
Método de tenacidad un método para fijar una creencia que implica una
firme adhesión a una creencia en particular, independientemente Correlación negativa una relación observada entre dos variables en la
de los argumentos o datos contrarios (en contraste con empírico) que un cambio en una variable va acompañado de un cambio en
la dirección opuesta en la segunda variable
Diseño mixto un diseño experimental que contiene variables
independientes dentro y entre sujetos
Estímulo reforzante negativo Estímulo que, cuando
La modalidad afecta diferentes efectos sobre la retención a menudo
eliminado, aumenta la probabilidad de la respuesta que lo eliminó
producidos por la presentación visual y auditiva; La presentación
auditiva generalmente produce una mejor memoria para los últimos
elementos de una serie que la presentación visual. Ruido un sonido complejo compuesto de muchas frecuencias
presentación diferentes
Tarea de monitoreo: una forma de escucha dicótica en la que no se escala nominal una escala de medida que posee la propiedad de la
requiere que los observadores verbalicen un mensaje tal como diferencia
se presenta. Prueba no direccional ver Prueba de dos colas
relación monótona la relación entre dos
Pruebas no paramétricas Pruebas estadísticas que no hacen
variables en las que un aumento en una variable es
suposiciones sobre la distribución de la población subyacente;
acompañado por un aumento o disminución constante en la
generalmente se usa cuando los datos no están en el intervalo /
otra variable
nivel de relación
Desarrollo monocigótico a partir del mismo óvulo fecundado

Sílabas sin sentido , por ejemplo, consonante-vocal
efecto de Mozart el hallazgo de que escuchar composiciones de Mozart trigamas de consonantes (p. ej., YUN) que no tienen significado
conduce a un mayor rendimiento en el campo visual-espacial en el idioma inglés
pruebas
Curva normal una distribución que produce una curva simétrica en forma
Análisis de varianza multifactorial un análisis de varianza de de campana
experimentos que tienen más de una variable independiente
Línea normal de mirada la línea de visión que las personas normalmente
adoptan cuando se dedican a una tarea en particular (p. ej., conducir
inteligencias múltiples la teoría de que la inteligencia en realidad un automóvil)
está compuesta por siete inteligencias diferentes
Contingencia nula una contingencia de refuerzo en la que no hay relación
Diseño de línea de base múltiple un diseño de n pequeña en el que entre una respuesta y estímulos de refuerzo
diferentes comportamientos (o diferentes personas) reciben
períodos de línea de base de diferentes duraciones antes de la
Hipótesis nula la predicción de que la variable independiente no tendrá
introducción de la variable independiente
efecto sobre la variable dependiente
N100 un componente negativo del potencial relacionado con el evento
Resultado nulo resultado experimental en el que el
que ocurre aproximadamente 100 ms después del inicio del
la variable dependiente no está influenciada por la variable
estímulo que indexa el análisis básico del estímulo independiente
N400 un componente negativo del potencial relacionado con el evento
Cultivar la creencia de que los factores experienciales infl uyen
que ocurre alrededor de 400 ms después del inicio del estímulo que
como se desarrolla un organismo
se supone que indica sorpresa o incongruencia
Obediencia conformidad a una orden o mandato directo
Teoría nativista de la percepción la teoría de que los mecanismos
genéticos “conectados” dan cuenta de las capacidades perceptivas El objetivo mide variables dependientes como el tiempo de reacción que
(ver Teoría empírica de la percepción) puede verificarse fácilmente (en contraste con las medidas subjetivas)
observación naturalista la descripción de naturalmente

eventos que ocurren sin intervención por parte del investigador Umbral objetivo según Cheesman y Merikle, el nivel de energía del
estímulo que provoca un comportamiento verdaderamente aleatorio
(compárelo con el umbral subjetivo)
Teoría de la naturaleza la teoría de que las diferencias genéticas bajo
mentira las diferencias individuales Observación la cuidadosa observación y registro de un fenómeno.
La imagen residual negativa es opuesta en brillo y complementaria en

color al estímulo visual (en contraste con la imagen residual Prueba de una cola Prueba que coloca el área de rechazo en una
final de una distribución
positiva)

Condicionamiento operante ver Condicionamiento instrumental Las diferencias de ecuaciones personales en el tiempo de reacción
notadas por primera vez por los astrónomos del siglo XVIII
Definición operativa una definición de un concepto en términos de las
operaciones que deben realizarse para demostrar el concepto espacio personal el área física que rodea a una persona dentro de la
cual una persona experimentará incomodidad si entra otra persona;
se mide observando las reacciones defensivas de la persona
Operacionismo la posición de que los conceptos se definen por las
operaciones utilizadas para medirlos y producirlos, pero ignora el
hecho de que se necesitan al menos dos conjuntos de observaciones experiencia fenomenológica la conciencia de una persona de
para una definición completa su propio estado mental
Escala ordinal una escala de medida que posee las propiedades de Feromonas olores emitidos por una persona (o animal) que están
diferencia y magnitud relacionados con la receptividad sexual
Ordenar el eje vertical (o eje Y) en un gráfico Fonémico (fonológico) el nivel de sonido del análisis perceptual de las
palabras
Estructuras de organización del conocimiento existente; un carácter
característica de una buena teoría Visión fotópica visión controlada por los conos en el
retina, típicamente en condiciones de visualización diurna
P200 y P300 componentes positivos del potencial relacionado con el evento
que ocurren 200 y 300 ms, respectivamente, después del inicio del Efecto placebo: la mejora que a menudo se muestra en los medicamentos.
estímulo que indican la atención al estímulo estudios de eficacia cuando los pacientes creen que han recibido
un fármaco, aunque en realidad han recibido una sustancia inerte
Recuerdo asociado por pares una tarea de memoria en la que se dan
un par de palabras (p. ej., mangosta-elefante); luego se proporciona
la primera palabra y la tarea es recordar la segunda palabra Plagio el uso no acreditado de las palabras, datos o ideas de otra persona
Formas paralelas dos formas alternativas de una prueba

Punto biserial r un coeficiente de correlación que se usa a menudo en
El procesamiento distribuido en paralelo (PDP) utiliza modelos
experimentos de dos grupos para determinar la magnitud del efecto
informáticos para simular la cognición; El modelo consta de una red
de la variable independiente
de unidades de procesamiento simples que caen en capas distintas,
con todas las unidades de procesamiento dentro de una capa Punto de igualdad subjetiva la media de la parte superior y
conectadas a todas las unidades de procesamiento en capas adyacentes. umbral inferior en una determinación de la diferencia
límite
Parámetros estadísticos que describen características de
poblaciones Población el conjunto total de observaciones potenciales (de las que se
Pruebas paramétricas Pruebas estadísticas que asumen una normalidad puede extraer una muestra)
distribución de puntajes y nivel de intervalo o razón de La imagen remanente positiva es similar en brillo y color a
medición el estímulo visual original
Parsimonia utilizando el menor número de declaraciones en un El efecto de contraste positivo rara vez encuentra mejoras en el
teoría comportamiento cuando se aumenta la magnitud del reforzamiento y
refuerzo parcial un programa de refuerzo en se compara el comportamiento con el que siempre ha sido seguido
por una gran magnitud de reforzamiento.
que una recompensa sigue a una respuesta deseada solo en
algunas ocasiones Correlación positiva Relación observada entre dos variables en la que
un cambio en una variable va acompañado de un cambio en la
Efecto de extinción del refuerzo parcial (PREE) el
misma dirección en la segunda variable.
mayor resistencia a la extinción exhibida por las respuestas aprendidas
bajo programas de reforzamiento parciales en lugar de continuos
Estímulo reforzante positivo Estímulo que, cuando
presentado, aumenta la probabilidad de la respuesta que lo produjo
Observación participante Técnica de observación en la que el
observador participa con los observados; por ejemplo, vivir con
gorilas en la naturaleza Potencia (de una prueba estadística) la probabilidad de que una
prueba rechace la hipótesis nula cuando en realidad es falsa
Pearson r una medida paramétrica de correlación entre dos variables
Efecto de práctica un efecto de arrastre en un experimento tal que el
comportamiento mejora durante el experimento debido a la práctica
Percepción el proceso de toma de conciencia típicamente visto como
y no a la variable independiente
más complejo que la sensación y por lo general implica una
interpretación de la sensación
Precisión la cualidad de ser exactamente especificado
Defensa perceptiva : falta de voluntad para informar que se ha percibido
material desagradable, en contraste con la incapacidad para Declaración de predicción de un resultado futuro antes de que se obtengan los datos.
percibir dicho material. recogido

Validez predictiva la capacidad de la puntuación de una prueba para predecir Inserción pura la suposición de que un módulo mental se puede agregar o
el comportamiento en alguna medida de criterio; también llamada eliminar sin alterar la duración del procesamiento de otros módulos
validez de criterio (p. ej., si un examen de ingreso a la facultad de
derecho predice correctamente el éxito como abogado)
Manipulación de la variación cualitativa de un independiente
Preparación la etapa inicial en la resolución de problemas en la que un individuo variable a lo largo de una dimensión que no es fácil de cuantificar, como
se sumerge en el pensamiento sobre los hechos y las consideraciones proporcionar a las personas diferentes tipos de instrucciones en un
que rodean un problema dado. experimento
Efecto de primacía: la mejor retención de la información se produce al principio Año de vida ajustado por calidad (QALY) una estimación ajustada
de una lista, en relación con la información en el medio. estadísticamente del bene cio de la nueva tecnología
Manipulación de variación cuantitativa de una variable independiente a lo

Tarea primaria la tarea más importante en un conjunto de concur largo de una dimensión medible, como la cantidad de gránulos de
alquilar tareas comida que se le dan a una rata como refuerzo.
Experiencia previa principal que puede no facilitar el comportamiento Cuasi-experimento un experimento en el cual la variable independiente ocurre
(principal) naturalmente y no está bajo el control directo del experimentador.
Preste atención a las imágenes secundarias percibidas por el paciente DB para

estímulos visuales para los que afirmó ser ciego Cuasi-experimental diseña un experimento en el que la variable
independiente ocurre naturalmente y no está bajo el control directo del
Cebado facilitación de una respuesta debido a una experiencia previa; por
experimentador.
ejemplo, la presentación previa de una palabra acelera la lectura
posterior de la misma palabra Variable cuasi independiente una variable independiente que se selecciona o
mide en lugar de manipularse directamente
Olvido de interferencia proactiva que se produce por el aprendizaje previo
Asignación aleatoria un procedimiento que asegura que cada sujeto tenga
la misma oportunidad de ser asignado a tratamientos experimentales
Problema una pregunta vaga que es demasiado general para ser probada sin
un refinamiento adicional (ver Hipótesis)
Procedimiento una subsección de la sección de método de un Muestra aleatoria Muestra no sesgada en la que cada unidad de la población
tiene la misma probabilidad de ser seleccionada.
documento técnico que explica lo que les sucedió a los participantes/
sujetos y contiene suficiente información para que otra persona pueda Selección aleatoria un procedimiento que asegura que cada miembro de una
replicar el estudio (repetir el estudio exactamente como se realizó población tenga la misma oportunidad de participar en un experimento
originalmente)
Protección contra daños compromiso ético de los investigadores Diseño de grupos aleatorios: la asignación aleatoria de sujetos a condiciones
para proteger a sus súbditos de cualquier daño en un diseño entre sujetos.
Pseudocondicionamiento de una elevación temporal en la mañana Aleatorización un procedimiento de muestreo estadístico donde cada
plenitud de la respuesta condicionada que no se debe a la asociación elemento tiene la misma probabilidad de ser seleccionado
entre el estímulo condicionado y el
estímulo incondicionado
Criterio de cambio con límite de rango una variación del diseño de
Período refractario psicológico en las reacciones de elección criterio de cambio, en el que los criterios para los resultados tienen
con un retraso entre estímulos, el período en el que se retrasa el tiempo un rango especificado por un límite superior e inferior
de reacción de la segunda respuesta
Psiconeuroinmunología un campo interdisciplinario que examina las relaciones Escala de razón una escala de medición que posee las propiedades de
entre el comportamiento, los procesos neuronales, endocrinos e diferencia de magnitud, intervalos iguales y un punto cero significativo
inmunológicos.
Métodos psicofísicos como el método de los límites que inició Fechner e Experimento de tiempo de reacción un experimento en el que el tiempo es la
incluyen métodos modernos como la detección de señales. medida dependiente; por lo general, las reacciones aceleradas se miden
en estos experimentos
Psicofísica el estudio de cómo los cambios en los estímulos físicos se Reactividad La reacción no planificada de un participante a la
traducen en experiencia psicológica investigador o entorno de investigación que puede confundir los
resultados de la investigación
Psicofisiología que utiliza medidas físicas para inferir procesos psicológicos
(en contraste con Psicofísica) Recordar una medida de retención en la que se requiere la reproducción del
material
Castigo un estímulo que, cuando se presenta, disminuye
la probabilidad de la acción que lo produjo Característica operativa del receptor (ROC) véase ROC
función

Efecto de actualidad : mejor retención de la información al final de una lista, en Resultados una sección de un documento técnico que describe los datos
relación con la información en el medio. obtenidos en la investigación y proporciona análisis estadísticos
realizados sobre los datos.
Reconocimiento una medida de retención en la que se juzga la familiaridad
de la información. Información de clave de recuperación presentada en el momento de una
prueba de memoria para ayudar a recordar
Referencias encontradas al final de un documento técnico; solamente
los artículos citados en el texto se incluyen en la referencia Interferencia retroactiva el olvido de material producido por el aprendizaje de
sección material posterior
Artefactos de regresión un artefacto en la medición del cambio en una Diseño de reversión (ABA) un diseño de n pequeña en el que el
variable cuando los grupos de sujetos que puntuaron en los extremos comportamiento de un sujeto se mide bajo una condición de referencia
de la variable se prueban nuevamente (ver Regresión a la media) (A), luego se aplica un tratamiento experimental durante la fase B y se
observa cualquier cambio en el comportamiento; finalmente, las
condiciones iniciales originales (A) se restablecen para asegurar que el
Regresión a la media la tendencia al extremo
tratamiento experimental fue responsable de cualquier cambio observado
medidas sobre alguna variable para estar más cerca de la media del
durante el
grupo cuando se vuelven a medir, debido a la falta de fiabilidad de
medición fase B
Pruebas robustas poderosas pruebas estadísticas

Diseño de medidas relacionadas en el que se toman varias medidas sobre el
mismo tema o sobre temas que coinciden en dimensiones importantes Función ROC (característica operativa del receptor) un diagrama que grafica
los aciertos contra las falsas alarmas
Investigación relacional investigación que trata de determinar cómo Corriendo encabezado el encabezado que aparece en la parte superior de la
dos o más variables están relacionadas página de un artículo publicado
Confiabilidad la repetibilidad de un resultado experimental; un Ejemplos de observaciones seleccionadas de una población

estimación a partir de estadísticas inferenciales de la probabilidad
Ejemplo de generalización un problema de representatividad con
que un hallazgo es repetible; también, la consistencia de una prueba
sobre si la muestra utilizada en un experimento es representativa de
o instrumento de medición determinada al calcular una correlación entre
otras muestras
las puntuaciones obtenidas por sujetos que toman la prueba dos veces
(confiabilidad test-retest), al tomar dos formas paralelas diferentes de la Muestreo en estadística la selección de sujetos o artículos para experimentos.
prueba, o por las puntuaciones obtenidas en cada una de ellas. la mitad

de la prueba (confiabilidad dividida por la mitad) Método de ahorro La memoria se puede medir como una reducción (ahorro) en
La confiabilidad de los resultados se refiere a la repetibilidad de un ex el número de intentos necesarios para volver a aprender el material
resultado perimental; las estadísticas inferenciales proporcionan una previamente estudiado
estimación de la probabilidad de que un hallazgo sea repetible; también El puntaje de ahorro es la diferencia entre el número de
se refiere a la consistencia de una prueba o instrumento de medición ensayos en el aprendizaje original (OL) de una lista y su reaprendizaje
determinada al calcular una correlación entre las puntuaciones obtenidas (RL) dividido por el número de intentos en el aprendizaje original, con
por los participantes que toman la prueba dos veces (confiabilidad de esta relación multiplicada por 100
prueba-reevaluación) o que toman dos formas paralelas diferentes de la
Dificultades de interpretación de los efectos de atenuación de escala
prueba (confiabilidad de prueba paralela), o examinando las puntuaciones
resultados cuando el desempeño en la variable dependiente es casi
obtenido en dos mitades de la prueba (confiabilidad de dos mitades)
perfecto (un efecto techo) o casi inexistente (un efecto piso)
Eliminar las consecuencias dañinas Los intentos de los investigadores éticos
de eliminar cualquier consecuencia dañina en la que sus sujetos puedan
Método científi co la formulación y prueba de hipótesis mediante observación
haber incurrido.
y experimentación sistemáticas; la formulación y prueba de teorías por
Replicación la repetición de un experimento anterior para duplicar (y tal inducción y deducción
vez extender) sus hallazgos (ver también
replicación sistemática)
Escotoma una región de ceguera en el campo visual causada por un defecto
Representatividad un problema relacionado con si las variables en un físico en el sistema visual
experimento permiten extensiones a situaciones más generales
Visión escotópica visión nocturna controlada por los bastones
en la retina
Reproducibilidad ver Fiabilidad
Tarea secundaria una tarea adicional en la que el desempeño es un
Condicionamiento respondiente ver Condicionamiento clásico índice de atención
Restricción del rango cuando la muestra no representa el rango completo Autocorrección un procedimiento que detecta y repara automáticamente
de valores posibles para una variable o factor dado; reduce el grado los errores
de una correlación o relación observada entre dos variables
Análisis semántico significativo de las palabras.

Sensación la ingesta básica y elemental de estímulo. distribución sesgada una distribución no simétrica
información
Diseño de investigación de diseño de n pequeña utilizando un pequeño número
Modificabilidad separada una forma de independencia que ocurre cuando de sujetos
un módulo mental se puede cambiar sin modificar otro módulo.
Facilitación social el aumento del esfuerzo individual producido por la
presencia de otras personas y cuando se mide el desempeño individual
Posición de serie el orden en que aparece la información cuando se estudia
para una prueba de memoria posterior
Holgazanería social la disminución en el esfuerzo individual que algunas veces
Curva de posición serial la representación gráfica de la retención en ocurre cuando otras personas están presentes y cuando se mide el
función de la posición de entrada de la información; por lo general, la desempeño del grupo
memoria es mejor para los primeros elementos (efecto de primacía) y los
Normas sociales Normas de comportamiento de la sociedad
últimos elementos (efecto de actualidad) que para los que están en el
medio; este hallazgo típico se conoce como el efecto de posición en serie Patología social: la ruptura de la interacción social ordinaria que se observa a
menudo en animales sometidos a hacinamiento extremo.
Recuerdo en serie una prueba de memoria en la que los sujetos intentan

recordar el material en el orden exacto en que se presentó; recordar un Psicología social el estudio psicológico de cómo la sociedad afecta al individuo
número de teléfono ejemplifica una tarea de recuerdo en serie
Especismo un término usado para describir la visión de que los animales
Establecer el efecto de la expectativa de la cognición; por ejemplo, si las la vida es cualitativamente diferente de la vida humana
personas resuelven los problemas de una manera particular, a menudo Compensación entre velocidad y precisión en los experimentos de tiempo de
abordarán los nuevos problemas de la misma manera establecida, aun reacción, la capacidad del respondedor para sustituir cambios en el
cuando la estrategia original ya no sea efectiva; también llamado porcentaje de respuestas correctas por cambios en la velocidad de
Einstellung, del experimento alemán original respuesta
Fiabilidad dividida por la mitad la determinación de la fiabilidad de un

Constancia de forma: la forma de un objeto parece constante a pesar de prueba dividiendo los ítems de la prueba en dos grupos arbitrarios y
los cambios en las sensaciones retinianas. correlacionando los puntajes obtenidos en las dos mitades de la prueba
Dar forma a una técnica para condicionar una respuesta deseada

recompensando aproximaciones sucesivas a esa respuesta Técnica de camada dividida: la asignación aleatoria de animales de la misma
camada a diferentes grupos; un tipo de diseño de grupos emparejados
Memoria a corto plazo Recuperación de información poco después de

haber sido percibida y antes de que haya dejado la conciencia Estabilidad cuando una medida dependiente produce lo mismo
puntuación en experimentos repetidos con el mismo sujeto, los mismos
Prueba de signos una prueba no paramétrica utilizada para determinar diferencias niveles de la variable independiente, etc.
diferencias entre dos conjuntos de puntajes obtenidos en un
Método de escalera: un método más nuevo de procedimiento de límites que
diseño de medidas concentra las presentaciones de estímulo alrededor del umbral.
nivel de significación la probabilidad de que un hallazgo experimental se

deba al azar, o a una f luctuación aleatoria, que opera en los datos Desviación estándar una medida descriptiva de dispersión; raíz cuadrada de
la suma de las desviaciones al cuadrado de cada puntaje de la media,
Análisis simple (de un factor) un análisis de varianza para un experimento dividida por el número de puntajes
que tiene una variable independiente con más de dos niveles Error estándar de la media la desviación estándar de
la distribución de medias muestrales
Reacción simple ver reacción de Donders A Reglas de predicción estadística basadas en variables predictoras e
Simulación de participantes de control participantes experimentales información de diagnóstico que se puede consultar durante las decisiones
a quienes se les dice que simulen el comportamiento de cómo de detección
esperan que actúen los demás (p. ej., se les dice a las personas que Fiabilidad estadística que rechaza la hipótesis nula sobre la base de una
simulen la hiponosis) prueba estadística que arroja un nivel alfa de menos de .05
Cambios de contraste simultáneos en el comportamiento instrumental que

resultan de que el sujeto experimente dos o más magnitudes de refuerzo Números estadísticos usados para descripción o inferencia
contrastantes.
ley de Stevens el principio, establecido por Stevens, que sensa
Experimento simple ciego un experimento en el que ción crece como un poder de la intensidad del estímulo: sn
los sujetos no conocían las condiciones de tratamiento asignadas
Error de estímulo un error de introspección en el que el
observador informó haber visto un objeto (por ejemplo, una mesa) en lugar de

que los elementos que componían la experiencia (p. ej., color, patrón) t prueba una prueba estadística paramétrica para determinar la
significación de la diferencia entre dos grupos, o entre dos tratamientos
asincronía de inicio del estímulo el intervalo de tiempo entre

dos estímulos en una tarea de tiempo de reacción de elección Tablas una forma no gráfica de resumir datos en un documento técnico; los
valores resumidos de la variable dependiente se presentan bajo
Destacar un estado psicológico de un organismo cuando existe una disparidad
encabezados que describen los niveles de la variable independiente
entre su capacidad para hacer frente a las demandas del medio ambiente y
el nivel de tales demandas.
Enfóquese en el elemento de prueba en una tarea de preparación; de

IA fuerte: la opinión de que las máquinas pueden poseer inteligencia del tipo que
interés es si la experiencia previa facilita (prepara) una decisión
poseen los humanos.
sobre el objetivo
Inferencia fuerte La opinión de Platt de que el progreso científico se produce
Taquistoscopio un dispositivo que permite una presentación muy rápida
a través de una serie de pruebas de resultados teóricos alternativos.
ción de estímulos visuales
Capacidad de prueba de una teoría para ser examinada local y empíricamente.

Efecto Stroop Dificultad para nombrar el color de un objeto cuando el color
entra en conflicto con el nombre del objeto (cuando la palabra azul está
impresa en tinta roja) Test-retest fiabilidad la práctica de dar la misma prueba
dos veces seguidas durante un breve intervalo para ver si el
Consistencia estructural (resolución de problemas) cuando
las puntuaciones son estables o fiables; generalmente expresado como
los elementos mapeados en los problemas de origen y destino juegan
una correlación entre las puntuaciones en las pruebas
roles similares
Modelo tetraédrico de experimentos de memoria Análisis de cuatro partes de
Estructuralismo la escuela de psicología, originada por
Jenkins de experimentos de memoria en tipo de sujetos, tareas de
Wundt, en el que se consideraba que la tarea principal de la
orientación, tipo de prueba y tipo de materiales
psicología era el análisis de la estructura de la experiencia consciente a
través de la introspección
Teoría un conjunto de declaraciones relacionadas que explican una variedad de
Sujeto (participante) Una persona que participa en el
ocurrencias
investigar
La teoría de la detección de señales postula que las impresiones sensoriales

Representatividad de los sujetos Determinación de la generalidad de los
y los procesos de decisión juntos determinan la detección de señales.
resultados entre diferentes poblaciones de sujetos
Sujeto variable una característica de las personas que pueden

ser medido o descrito pero no puede ser variado cognición del pensamiento
experimentalmente (p. ej., altura, peso, sexo y coeficiente intelectual) Umbral ver Umbral absoluto y Umbral de diferencia
Medidas subjetivas Informes introspectivos dados en escalas de calificación Diseño de retardo de tiempo un diseño cuasi-experimental similar a
que por lo general no pueden verificarse objetivamente el diseño transversal en el que se comparan personas de diferentes edades
en diferentes momentos para que su edad en el momento de la prueba sea
Informe subjetivo informe verbal de lo percibido por una persona
estado mental la misma
El título proporciona una idea del contenido de un artículo o documento técnico

Umbral subjetivo el nivel de energía del estímulo que
y, por lo general, establece solo las variables dependientes e independientes.
produce afirmaciones de inconsciencia pero comportamiento que indica
percepción del evento (ver Umbral objetivo)
Agnosia tonal una incapacidad para apreciar la melodía en la música y el habla;
Método sustractivo una técnica originada por Donders para estimar la cantidad
generalmente asociado con daño en el hemisferio derecho del cerebro
de tiempo requerido para varias operaciones mentales restando un
componente de otro.
Procesos cognitivos de procesamiento de arriba hacia abajo que comienzan
con conocimiento de conceptos (en contraste con el procesamiento de
encuesta de investigación la técnica de obtener un limitado
abajo hacia arriba)
cantidad de información de un gran número de personas, generalmente a
través de muestreo aleatorio Procesamiento apropiado para la transferencia: el principio de que si las
actividades de codificación promueven la memoria dependerá del tipo
Sinergismo otro término para la interacción en la que los efectos conjuntos de dos
de prueba utilizada para evaluar el rendimiento de la memoria.
variables se combinan de una manera que no es una simple función de sus
efectos individuales.
Ensayos para determinar el número de ensayos de estudio y de prueba
Replicación sistemática la repetición de un experimento mientras se varían
necesarios para recordar el material perfectamente
numerosos factores que se consideran irrelevantes para el fenómeno para
ver si sobrevivirá a estos cambios. Cero verdadero la ausencia de una propiedad física (peso cero en gramos) en
oposición a un cero arbitrario, como cero grados centígrados
59533_21_glossary_p528-541.indd 540 9533_21_glossary_p528-541.indd 540 3/5/08 /5/08

Rango truncado un problema en la interpretación de correlaciones bajas; la Máscara visual utilizada en tareas informáticas para bloquear imágenes
cantidad de dispersión (o rango) de puntajes en una variable puede residuales visuales
ser pequeña, lo que lleva a la baja correlación encontrada
Tarea de selección de cartas Wason una tarea de razonamiento en la que
los sujetos a menudo eligen opciones que confirman (en lugar de
Test de Turing el test ideado por Turing en el que una máquina da respuestas descartar) sus hipótesis
indistinguibles de las de los humanos; supuestamente apoya la fuerte
IA débil: la opinión de que los programas de computadora se pueden usar para
posición de la IA
probar teorías de la inteligencia humana.
Prueba de dos colas una prueba que coloca el área de rechazo en ambos
Ley de Weber una fórmula desarrollada por Weber que establece que la
extremos de una distribucion
diferencia perceptible más pequeña (la diferencia apenas perceptible)
Error tipo I la probabilidad de que la hipótesis nula sea entre dos estímulos (por ejemplo, pesos) se puede establecer como
rechazado cuando de hecho es cierto; es igual al nivel de significación una relación entre los estímulos que es independiente de su
magnitud,
yo/ ik
Error tipo II : no rechazar la hipótesis nula cuando en realidad es falsa.
Experimento hipotético un experimento realizado para ver qué podría
suceder en lugar de probar una hipótesis específica.
Respuesta incondicionada (UCR) una respuesta dada a un
estímulo incondicionado
Prueba de rangos con signo de Wilcoxon una prueba no paramétrica utilizada

Estímulo no condicionado (UCS) un estímulo que puede provocar una
para determinar las diferencias entre dos conjuntos de puntuaciones
respuesta en ausencia de condicionamiento
obtenido en un diseño de medidas relacionadas
Inferencia inconsciente La opinión de Helmholtz de que la percepción
ción implica inferencias acerca de las sensaciones y que el Varianza dentro del grupo una medida de la dispersión
entre sujetos del mismo grupo en un experimento
el observador no es consciente de hacer las inferencias
Medidas discretas medidas tomadas desde el re Diseño intra-sujetos un diseño experimental en el que cada sujeto es evaluado
bajo más de un nivel de la variable independiente
resultados de la conducta, no de la conducta misma (ver
No reactivo)
Observaciones discretas ver No reactivo Tarea de finalización de fragmentos de palabras Prueba de memoria
implícita en la que el sujeto tiene que completar las letras que faltan
Validez si un procedimiento u observación es sólido o en una palabra fragmentada.
auténtico
Carga de trabajo la cantidad de esfuerzo que demanda atención
Variable algo que se puede medir o manipular. impuesto a una persona
Representatividad de la variable la determinación de la generalidad de los 2

prueba de independencia una prueba estadística que se usa a menudo
resultados a través de diferentes manipulaciones de una variable para determinar si los datos en una tabla de contingencia son
independiente o diferentes variables dependientes estadísticamente significativos
Varianza una medida de dispersión; la desviación estándar Sí/no prueba de reconocimiento una prueba de memoria en la que sub
al cuadrado Los sujetos deciden si cada ítem fue estudiado o no (diciendo sí o no)
Informe verbal la descripción de un sujeto de su phe

experiencia nomenológica, a menudo muy difícil de verificar puntuación z una puntuación estándar en la que la diferencia entre
Verifi cación la etapa final en la resolución de problemas que implica la una puntuación individual y la media se expresa en unidades de
desviaciones estándar
verificación cuidadosa de una solución potencial

ÍNDICE DE NOMBRES
Adams, J., Brown, J., 269

19 Adamson, RE, 313, Brown, R., 296, 319
314 Ader, R., 228 Adler, Bryant, RA, 374
SA, 278 Ahn, W., 326 Buckner, RL, 444
Ambati, BK, 328 Amodio, Bulgren, JA, 308
DM, 381 Angell, JR, 439 Bullinger, HJ, 423
Arnold, DH, 349 Asch, Buss, DM, 360
SE, 360–361 Aube, D., Butters, N., 32
500
Calhoun, JB, 396–397
Calkins, M., 266
Campbell, DT, 247, 345, 347, 348
Bacon, F., 9, Carnevale, PJ, 312 Carroll, L., 100
20 Balota, DA, Carter, LF, 235 Cermak, LS, 276
443 Barber, TX, 93, Cheesman, J., 192–196, 198, 199,
371 Barnier, AJ, 374 204
Baron, RA, 366, 369, 394
Bartoshuk, LM, 173
Bateson, JEG, 400 Chekroun, P., 377
Baumrind, D., 370 Beck, Childress, ME, 419
SB, 238 Bem, DJ, 154 Chomsky, N., 443
Benchley, R., 262, 263 Churchland, PM, 342
Benjamin, LT, 439 Bevan, Cicirelli, V., 347–348
W., 19 Beveridge, WIB, 52 Clark, HH, 292 Clark,
Binet, A., 329 Blaney, RH, WC, 168 Cohen, S.,
84 Blass, T., 370 Blondlot, 389 Cook, TD, 46
RP, 35 Blough, DS, 176, Coren, S., 181, 204
188 Boring, EG, 154, 433, Correll, J., 381 Cowey,
434 Bornstein, MH, 336 A., 199 Cox, JR, 326
Boroditsky, L., 309 Bowd, Craik, FIM, 274–280
AD, 89 Bower, G., 241– Cutler, BL, 26
244 Bradway, KP, 335
Brannigan, A., 69
Breitmayer, BJ, 349
Brickner, MA, 61–62 D'Amato, MR, 166
Bridgeman, B., 43 Bridgman, Darley, JM, 376–377
PW, 196 Broad, W., 93, DeGreene, KB, 21
370 Broadbent, DE, 219 Descarte, R., 20, 433–434
Bronzaft, AL, 407 Devine, PG, 380 Dewar,
RE, 429, 431 Dewey, J.,
411, 439 Donders , FC,
208 Duncker, K., 304–
305, 312–313, 315 Dunn, J., 287
Dweck, CS, 350–353
59533_22_índice_nombre_p542-544.indd542 542 9533_22_índice_nombre_p542-544.indd542 542 3/5/08 /5/08

Eagly, AH, 360 Hadamard, J., 304 Koriat, A., 317
Ebbinghaus, H., 262–266, 433, 435, 436, 437 Hahn, G., 33 Kravitz, DA, 383
Edwards, AC, 344 Eibl-Eibesfeldt, I., 28–30 Haines, MM, 402 Kuhn, TS, 11
Einstein, A., 262 Ellsworth, J., 349 Elmes, DG, Hanowski, RJ, 429, 431 Kulpe, O., 212
67, 83 Emmons, RA, 344 Engle, RW, 343 Hanson, NR, 35 Hardy, Kwilecki, S., 344
Ericsson, KA, 318, 319, 330 Eriksen, CW, 190 JD, 156, 168 Harkins,
Eron, LD, 44, 45, 46 Evans, GW, 398, 399 SG, 12 Harlow, HF, 27 Latané, B., 4–5, 8–9, 11, 376, 383
Evans, JW, 348 Eveland, WP, 293 Eysenck, Harré, R. , 9 Hart, BM, Lester, BM, 73 Levy, SR, 350
HJ, 42 248 Hart, JT, 316 Hebb, Lewin, K., 361–362 Lichtenstein,
D., 328, 331 Herman, LM, S., 317 Locke, J., 434 Lockhart,
217, 220 Herrnstein, RJ, RS, 276 Loftus, EF, 198 LoLordo,
228, 330, 334 Hilt, P., VM, 233 Largo, GM, 416, 417,
283 Holland, PW, 77 426 Lovelace, EA, 33, 34 Lowe,
Holyoak, KJ , 310, 311 Horowitz, DG, 197
LM, 460, 461, 462 Howard, DV,
44 Howell, DC, 39, 508 Howell,
WC, 19, 20 Huesmann, LR, 44,
Farah, MJ, 199 46 Huff, D., 38 Hull, CL, 235
Farmer, CM, 426 Hunt, E., 330, 331 Huxley, A.,
Fechner, G., 154, 171–172, 436–437 391 Huxley, TH, 208 Hyde, TS, MacLeod, CM, 265
Federighi, ET, 504 Feingold, BF, 249 279 Hygge, S., 401 Hyman, R., Madigan, S., 289
Festinger, L., 31, 34 Ficken, MS, 25, 25, 35 Malone, TB, 425–426
27 Fischhoff , B., 317 Fisher, RP, 279 Mantzicopoulos, P., 349
Fishman, DB, 19 Fossey, D., 30 Marcel, AJ, 190–194
Fostervold, KI, 69 Fraser, S., 330 Marks, LE, 173 Marriott,
Freedman, JL, 316 Freud, S., 31, 34 P., 5 Massaro, DW, 271
Friend, R., 361 Frost, R., 103 Mayer, RE , 304
Furnham, A., 293 Furumoto, L., 266 McConahey, JB, 378
McDaniel, MA, 279
McDermott, KB, 443
McDougall, W., 359
Intraub, H., 278 Meade, ML, 361
It, 409 Medawar, PB, 4, 390
Merikle, PM, 198
Jacobs, J., Metcalfe, J., 318–319
391 Jacoby, LL, 281, Middelmist, RD, 404
283 Jagacinski, RJ, Milgram, S., 364–370
Gabrenya, WK, 4 424 James, W., 17, Miller, AG, 370 Miller,
Gabrieli, JDE, 287 266, 438 Jenkins, J., 276, DB, 27, 33 Miller, J., 223
Galle, OR, 398 Gallo, 277, 279 Jennings, JR, Miller, JO, 212 Miller,
DA, 121, 122 Gallup, 443, 444 Jensen, AR, NE, 15, 89, 91 Mitchell,
GG, 91 Galton, F., 334 Jones, D., 409 CJ, 231 Mook, DG, 22
330 Gardiner, JM, Moriarty, T., 377 Morris,
276 Gardner, H., Kahneman, D., 224 CD, 279, 281 Moscovitch,
330, 343–344 Garner, WR, Kamin, LJ, 231 M., 33 Müller, J., 435
196 Gentner, D., 308 Kangas, J., 335–338 Murphy, MD, 278
Alemán, TP, 312 Gibson, Kantowitz, BH, 13, 212, 219, 344, 407, 411,
JJ, 181 Gick, ML, 304–308 418, 419, 422, 427, 443, 444
Gigerenzer, G., 77 Ginsburg, Kaufman, L., 183
HJ, 27 Glaser, MO, 197 Kawai, N., 240
Glucksberg, S., 315 Kaysen, C., 359
Goodman, MJ, 425 Graf, Kazdin, AE, 252 Natsoulas, T., 188, 190
P., 266 Grant, DA, 235, Kelman, H., 319 Navon, D., 219 Neisser,
238 Green, BG, 173 Keppel, G., 269 U., 296 Nelson, TO,
Greenough, WT, 91 Kihlstrom, JF, 198 276 Ng, CF, 402
Greenwald, AG, 198 King, JD, 293 Niedzwienska, A., 296
Gregory, RL, 26, 181 Grice, Kinsey, A., 31 Nisbett, R., 330 Nisbett,
GR, 238–240, 244 Guilford, Kluger, AN, 12 RE, 317 Nissani, M .,
JR , 335 Koestler, A., 320 370 Norman, J., 181,
Köhler, W., 300–301 183, 199 Notterman,
Kohn, A., 93 JM, 63 Novick, LR, 310
Kolodner, JL, 308
Koocher, GP, 405
59533_22_nameindex_p542-544.indd543 543 9533_22_nameindex_p542-544.indd543 543 3/5/08 /5/08

Oltmann, TF, 25, 32 Scarborough, DL, 269–272, 281 Titchener, EB, 438–439
Olton, RM, 322 Orne, Schacter, DL, 266, 317 Schaie, Tombu, M., 219, 220
MT, 371, 372, 373 KW, 338 Schmolck, H., 296 Tulving, E., 266, 306
Schreibman, L., 251, 252 Schultz, Turing, AM, 339–342
Pachella, RG, 216, 217 DP, 330, 433, 435 Scialfa, CT, 415 Tversky, A., 490 Tversky,
Padilla, AM, 243 Paillard, Searle , JR, 340, 342 Seidenberg, B., 296 Twain, M., 229, 298
J., 185 Parr, WV, 161 MS, 443 Sherif, M., 360, 361
Parsons, HM, 69, 413 Shimamura, AP, 287 Shweder, RA,
Pashler, H., 217–219 360 Sidman, M., 21, 78 Siegel, S., Ulrich, R., 212, 213, 214
Pavlov, IP, 34–35, 229– 500, 502 Silveira, T., 322 Simon, Underwood, BJ, 72
232 Payne , BK , 378 , 379 , T., 329 Singer, P., 90 Skinner, BF,
380 Pearson , ES , 508 233, 252, 300 Slaughter-Defoe, DT, Velten, EA, 83, 86
Pedhazur , EJ , 338 Peirce , 349 Smith, AD, 278 Smith, ER, 322 von Helmholtz, H., 181, 435, 436
CS , 6 Perfect , TJ , 317 Smith, S., 322 Snellgrove, L., 259
Peterson , LR , 269 Piaget , Spence, KW, 316 Spencer, RM, Warrington, EK, 283, 284, 287, 289
J. , 330 Pickren , WE , 433 308, 309 Spencer, SJ, 343 Stanley, Wason, PC, 325 Watson, JB, 316, 440
Piliavin , IM , 377 . 378 Plous , A., 328 Steele, CM, 343 Sternberg, Webb, EJ, 30, 375 Weber, EH, 159,
S. , 90 , 91 Poincaré , H. , RJ, 119, 146, 210, 330, 343, 344, 161, 171, 179 Weiskrantz, L., 183, 185,
319 , 320 , 389 Popper , KR , 345 188, 189,
10 Posner , MI , 298 , 321 ,
322 , 443 Proctor , RW , 11 194, 199
Weizenbaum, J., 391
Weldon, MS, 287
Welker, RL, 233
Wells, HG, 449
Wertheimer, M., 441
Queller, S., 443 White, RJ, 91
Wickelgren, WA, 283
Reed, MP, 423, 425 Wickstrom, G., 69
Reed, SB, 374 Wilcoxon, E. , 502
Rescorla, RA, 229 Sternberg, S., 18 Willerman, L., 40
Rieber, RW, 433 Stevens, SS, 171–172 Williams, K., 4, 384
Roberts, C., 90 Stokols, D., 389 Strayer, Wolf, MM, 249 Madera,
Roberts, S., 15 DL, 424 Stroop, JR, RW, 35 Wundt, W.,
Rodgers, JL, 15 190–194 Sussman, S., 262, 435, 436, 437–438
Roediger, HL, 268, 281, 282, 287 , 33 Svartdl, F., 240
288, 289, 361 Swazey, JP, 93 Swets, Yeager, K., 20
Rollin, BE, 89 JA, 174, 175 Swinnen, Young, PT, 91
Rose, TL, 250 SP, 260
Rosenthal, R., 70, 371 Zajonc, RB, 187
Ross, EA, 359 Ross, Zimmer, HD, 278
M., 296 Rovee-Coller, Talarico, JM, 296 Zuckerman, M., 331
C., 228, 233 Rowan, AN, Telford, CW, 219
91 Rowland, LW, 373 Theeuwes, J., 426
Theios, J., 216
Thompson, JB, 477
Saegert, S., 399 Thompson, KM, 414, 415
Salmón, WC, 11 Thorndike, EL, 231, 259, 299–301
59533_22_nameindex_p542-544.indd544 544 9533_22_nameindex_p542-544.indd544 544 3/5/08 /5/08

ÍNDICE DE MATERIA
Métodos a priori de fijación de creencias, 6, 7 Diseños Autoridad, fijación de creencias y, 6–7

AB, ABA, ABAB , 247–249 Diseño ABBA , 244 Autoría de artículos, 94 95, 101 Recuerdos
Abscisa, 78 Desviación media absoluta, 452–453 autobiográficos, 296 Fenómeno autocinético,
Resúmenes, 101–102, 109, 120, 123, 143 360 Conciencia. Ver investigación de
Acupuntura, 169 Afecciones, 438 Imágenes percepción
secundarias, 189 Edad, como variable, 336–339
Edad, mental versus cronológica, 332 Nivel alfa ( ), Diseño de cuadrado latino equilibrado, 244–245
466 Diseños de tratamiento alternativos, 249–250 Línea de base, 64, 67–68, 250–253, 282
Pautas de investigación animal de la Asociación Modificación del comportamiento, 246–253
Americana de Psicología (APA), 91–92 divisiones Problemas de comportamiento en niños, 246–253
de, 445 normas éticas, 83, 84–85, 94–95 formato de Conductismo, 316, 440–441, 442, 446
informe de investigación, 78–79, 144–146, 148. Creencia, fijación de, 6–8
Consulte también Informes de investigación Amnesia, Beta (), 166, 167, 168, 174–175, 188, 211
283–284 Analogía/razonamiento analógico, 302–312 Varianza entre grupos, 478–479,
Análisis de varianza , 477–486 Enfoque analítico, 330 481, 482
Investigación con animales Condiciones de control de diseños
entre sujetos, 67–68, 364 contrapeso,
240–245 descrito, 64–65, 235 Reacción
de Donders y, 215 diseño de línea de
base múltiple y, 250–252 pruebas
estadísticas, 469 versus diseños dentro de los
sujetos, 235 –238, 238, 238, 257, 259
alternativas a, 92 Parcialidad
antropomorfizar, 34 cuestiones sesgo de confirmación, 325–326

éticas, 89–92, 95 efectos del deliberado, 93 sesgo del
experimentador, 69–70 generalizar experimentador, 370–374 en pruebas
resultados a humanos, 274 técnica de arena de inteligencia, 343–345 error de
dividida, 237 medición y, 345–350 en observaciones
Derechos de los animales, 9, naturalistas, 35 expectativas de los
90, 91 Antropomorfismo, 34 participantes, 370 aleatorización y, 65 sesgo
Afásico, definido, 344 Media de respuesta, 162–163, 167, 196 tamaño de
aritmética, 450–451 Inteligencia muestra y, 488–489
artificial (IA), 340–342, 443 Transferencia asimétrica.
Ver efecto arrastre Técnicas ciegas, 370, 371
Vista ciega, 183–186, 190, 199
Atención, índice de, 21, 418, 419 Bloqueo, 231
Atención y tiempo de reacción, 207–226 confusión, Vista desde abajo, 182, 183
209–215 efectos de interacción, 221–222 Condiciones de frontera, 310
medición de la atención, 222–224 equilibrio Problema de caja, 312–313
entre velocidad y precisión, 215–220, 226 Ondas cerebrales, 221–222, 427–428, 444
variables en, 211, 215–221, 221–222, 223–224 Luces de freno, 425–426
técnica de Brown-Peterson, 269
Intervención de espectadores, 374–378
545
59533_23_subjectindex_p545-551.i545 545 9533_23_subjectindex_p545-551.i545 545 3/5/08 /5/08

Capacidad, 219 Control (continuación) en Experimentos doble ciego, 70, 372
Efecto de arrastre, 66, 236, 240, 245, 255, 257 investigación de campo, 374–378 Conducción, 423–425, 429–431
Estudios de casos, 25, 31–32, 34 fi jez funcional y, 311–315 en condicionamiento Dualismo, 433
Causalidad, 40, 41–42, 44, 46, 53, 336, 402 operante, 246, 252 en investigación de Agudeza visual dinámica, 415–417
Causa, implicaciones del término, 46, 47 resolución de problemas, 299 simulación de
Efectos de techo, 57, 243, 268–273, 289, 292, 293, 314, participantes de control, 374 en psicología Evaluación educativa, 345–350
336 social, 362–367 ley de Emmert, 190
Teléfonos móviles, 423–425 Grupos de control, definidos, 67–68 Emociones, 350–354
Modelo de cuello de botella central, 219–220 Condiciones de control, definidas, 67–68 Enfoque empírico, 329–330, 332, 434
Modelo de capacidad compartida central, 219–220 Evidencia convergente, 41 Observación empírica, 7, 9–12
Tendencia central, 449, 450–451 Operaciones convergentes, 196–201, 341 Teoría empírica de la percepción, 181–182
salón chino, 342 Correlación, 40–42, 72, 74, 398–399 Teoría de la entidad, 351–353
Prueba de chi-cuadrado, 37, 486–487, 508 Coeficientes de correlación, 38–44, 456–458 Psicología ambiental, 389–407
Elección del tiempo de reacción, 209 Correlación, panel cruzado, 46 vida en la ciudad/hacinamiento, 391–393, 396–
Tarea de elección-reacción, 419, 421 Correlación, punto biserial, 476–477 401 definido, 389 ética en, 389–391, 403–405
Neurociencia cognitiva, 443–444 Técnica correlacional, 26 investigación de campo, 399 generalidad de los
Rendimiento cognitivo, 399, 400, 401, 405–407, Contrapeso, 65–66, 237, 241–245, resultados, 389, 393–401, 405–407
417–425, 427–428 257, 292, 353
Procesos cognitivos, 208, 209, 317, 319 Criterio, 163, 165, 167, 264
Psicología cognitiva, 442–443 Validez de criterio, 329. ruido, 389, 401–403, 405–407, 409 variables
Efectos de cohorte, 337 Experimentos críticos, 54 en, 394–395 Memoria episódica, 266
Cohortes, 337 Correlación de panel rezagado cruzado, 44 Intervalos iguales (medición), 169 Eta ( ), 477
Ilusión de distancia de color, 201–204 Interacciones cruzadas, 284 Ética, 82–98 en investigación animal, 89–92
Informática, 330–333, 443 Diseño transversal, 337 Normas APA, 83, 84, 87, 94 fraude, 93–94, 371
Búsqueda bibliográfica computarizada, 100–101, 148– Diseño secuencial cruzado, 338 en investigación humana, 71, 83–89, 353, 370,
149 Hacinamiento, 396–401 374–375, 377–378, 389, 403–405 mal uso de
Ocultamiento, 403–405 Curiosidad, 5–6 las estadísticas, 487–490 Etnograma, 28, 29
Réplica conceptual, 307–308, 310 Etnología, definida, 28 Investigación ex post
Procesamiento impulsado conceptualmente, 182 D'(sensibilidad del observador), 167, 188, 211 Datos, 9, facto , 36–38, 73–75, 402–403 Control experimental.
Reflejos condicionados, 34 36, 77–79, 370. Véase también Análisis estadístico Bases Véase Control Error experimental, reducción,
Respuestas condicionadas, 230 de datos, 100 Procesamiento basado en datos, 182 362–370 Extinción experimental, 233 Hipótesis
Estímulo condicionado (CS), 231, 234, 235 Debriefi ng, 85, 87, 375 Engaño, 85 –86, 374, 403–405 experimental, 463–464 Sesgo del experimentador, 370–
Condicionamiento y aprendizaje, 227–260 Criterio de decisión (), 166, 168, 167, 174–175 Deducción, 374 Efectos del experimentador, 69–70 Expectativas
condicionamiento clásico, 228, 229–231, 235– 9–13 Grados de libertad, 475, 476, 481, 483, 485 del experimentador, 370–374 Experimentos, 51–80.
236, 238–240 contrapeso y, 240–245 Delimitación, defi nido, 27, 29 Características de la Véase también Diseño de investigación; Reportes
condicionamiento instrumental (operante), 228– demanda , 69, 370–374, 387 Densidad de poblaciones, 394– de investigación; Variables ventajas de, 47, 53–54
229, 231–233, 246–256 refuerzo, 253–256, 259– 401 Percepción de profundidad, 201–204 Descripción, defi suposiciones incluidas, 11 automatización de, 70–
260 condicionamiento respondiente , 232 nida, 9 Estadística descriptiva, 78 Determinismo, 7 Desarrollo. 71 como correlaciones controladas, 46–48 definidas, 52
diseños de n pequeña, 246–253 variables en, Ver Diferencias individuales y desarrollo Psicología del observación como base para, 27 relevancia para la vida
235–238 desarrollo, 72 Análisis de casos desviados, 32 Diferencia real, 21–22 teoría y, 9 experimentos, crítico, 54
(escalas de medición), 169 Efectos diferenciales de arrastre, Experimentos, "qué pasaría si", 53–54 Explicación, defi
66 Difusión de responsabilidad, 5, 8, 10, 12, 63, 376–377, nido, 9 Memoria explícita, 266 Pruebas de memoria
Confidencialidad, 88–89 383 Reproducción directa, 308 Escala directa, 172 Pruebas explícita, 281–283 Extinción, 233, 234, 253–256 Flash de
Estudios de conformidad, 360–361, 362–370 estadísticas direccionales, 467, 469 Estímulo discriminativo cejas, 28–29
Confusión, 41. Véase también Variables, confusión, atención (SD), 233 Dispersión, 449, 451–453 Distribución de medias
y tiempo de reacción, 210–215 en diseños entre de muestra, 460–463 Dolorímetro, 168 Reacciones de
sujetos, 235–236, 240, 240–245 Donders A, B y C, 209–210, 212 , 215, 217, 224 Doble
disociación de funciones, 199
defi nidos, 212, 362
efectos de historia, 338
en pruebas de inteligencia, 336–339
definiciones operativas y, 395 en cuasi-
experimentos, 75
Conciencia, 183, 195, 438, 440
Validez de constructo, 340
Contingencia, 231, 233
Investigación de contingencias, 36–37
tablas de contingencia, 37
Refuerzo continuo, 254
Efectos de contraste, 243–244
Control Relación F , 479, 483, 485
estadística a posteriori, 398–399 definida, Prueba F , 476, 479
53 valor F , 481

Validez aparente, 329–330 humanistas, 18 Efectos de interacción, 281–291, 483
Falsas alarmas (en detección de señales), Hiperactividad, 249–250 Interacciones
165, 166, 167, 173–174 Hipnosis, 370–374 cruzado, 284, 287
Vista de capacidad de falsifi, 11 Hipótesis de definido, 221 efectos
Efectos de la fatiga, 237 sentido común, 13 suelo/techo y, 289 gráficos de datos,
Ley de Fechner, 171–172, 436–437 definidas, 12, 77 290–291 de orden superior, 289, 290
Fenómeno del sentimiento de saber, 316; hipótesis experimental, 463–464 hipótesis variables independientes, 58–63, 284–
Investigación de campo, 374–378, 389, 400, nula, 302, 463–464, 465 fuente de, 12–13 290 en diseños multifactoriales, 281 en psicología
417–422, 425–428 social, 378 , 380 tipos de, 281–291 Intervalo de
Figuras/gráficos, 79, 103, 104 Prueba de hipótesis, 12–14, 47, 77, 463–469 incertidumbre, 160 Escalas de intervalo, 170, 171,
Memorias de flash, 296 291 Introspección, 210, 438–439. Véase también
Simuladores de vuelo, 417–420, 427–428 Plagio de ideas, 93 Informes verbales
Efectos de piso, 56, 268–273, 289, 293, 315 ideas, 438
Pruebas de reconocimiento de elección forzada, 267 Iluminación (en resolución de problemas), 320
Fraude en la investigación, 92–94, 370 Ilusiones, 26, 182–183, 201–204, 205, 360
Pruebas de recuerdo libre, 267, 284–288, 289 Imágenes, 438
Libertad de retiro, 87; Juego de imitación, 339–345 Revistas 100. Ver también Informes de investigación
Distribuciones de frecuencia, 450 Respuesta inmune, 228 Diferencia apenas perceptible, 171, 436
polígono de frecuencia, 450 Medidas implícitas de actitud, 378.
Fijo funcional, 311–315 Memoria implícita, 266, 267, 268 Conocimiento, científi co, adquirir, 7
Resonancia magnética funcional (fMRI), 443 Pruebas de memoria implícita, 281–283, 378 Conocimiento de los resultados como refuerzo, 259–
Incubación (en resolución de problemas), 319–323 260
Funcionalismo, 439–440, 446 Escalado indirecto, 172
Diferencias individuales y desarrollo, Escala de magnitud etiquetada, 173
Falacia del jugador, 490 327–387 Landolt C, 4l5, 4l6 Diseños de n
Género, controlando por, 53, 70, 353 enfoques, 329–333 definiciones grande , 246 Latencia, 314 Ley del
Efectos de la práctica general, 65–66 cognitivas de inteligencia, 339–345 evaluación efecto, 300 Aprendizaje, 279, 299–
Generalidad de los resultados (generalizabilidad) educativa, 345–350 motivación y 300, 320, 328, 331, 440.
definida, 12–13 características de la demanda emoción, 350–354 contraste naturaleza-crianza,
y, 372–374 en psicología ambiental, 389, 393– 330–333 confiabilidad de las medidas, 328–329 Véase también Condicionamiento y aprendizaje
401, 405–406 en investigación de la memoria, diseños de investigación y confiabilidad , 333– Nivel de confianza, 163 Niveles de procesamiento,
275–281, 292, 293, 308 número de 334 teoría del desarrollo, 330 variables que 276–281 Niveles de variables, 52–53, 67 Vida, valor
variables y, 63 percepción sin conciencia, 198 muestreo conducen a, 330–333 de, 413–415 Búsquedas bibliográficas, 100–101,
aleatorio y, 459 replicación y, 308 148–149 Diseño longitudinal, 338 Largo -memoria a
término, 266
Inducción, 9–12
Inferencias, 32, 46, 72, 78, 181, 249. Véase también
Principios de la Gestalt para la resolución de problemas, 313. Causalidad; Generalidad de los resultados
Psicología de la Gestalt, 441–442, 446 (generalizabilidad) Máquinas, inteligencia en, 339–345 Estimación
Bondad de ajuste, 15 Estadística inferencial. Ver en Estadística de la magnitud, 170, 188 Magnitud (escalas
Nivel de análisis grafémico, 274–276 análisis de medición), 170 Magnitud del efecto, 476–477
Gráficos, 103, 290–291, 450, 488–489 Punto de inflexión, 445, 456 Efectos principales, 284, 483 Prueba U de Mann-
Procesamiento de la información. Ver Atención y Whitney , 469–471, 498, 500 Mapeo, 310
Alucinaciones, 188 Efecto tiempo de reacción Enmascaramiento, 190–192, 378–379 Diseño de
Hawthorne, 69 Programa Teoría de la información, 443 grupos emparejados, 237 Coincidencia, 64, 65, 73–
Head Start, 348–349 Herencia frente Consentimiento informado, 85–86, 353, 403–404 75, 347 Media, aritmética, 450–451 Media (estadística),
a entorno, 328, 330–333, 359–360 Interacciones de Insight (en resolución de problemas), 300, 320 74, 77, 445, 460–463 Medición, definición ned, 169–
orden superior, 289 Histogramas, 450 Efectos Aprobación institucional de la investigación, 83, 84, 170 Error de medición, 333–334, 334–339, 346–350
históricos, 338 Aciertos (en la detección de señales), 86–87, 95, 403–405 Escalas de medición, 155, 169–170, 268–273, 290–
164, 165, 166, 175 Homogeneidad de varianza, 486 Teoría incremental instrumental, 350–354 291 Medidas, confiabilidad de, 328–329, 333–334
Hormonas y personalidad, 331 Investigación de Condicionamiento instrumental (operante), 228, 231– Medidas, discreto , 30–31, 375, 427 Mediana, 445,
factores humanos, 410–431 233, 246–253 451 Memoria. Véase Recordar y olvidar Carga de
inteligencia trabajo mental, 417–425, 427–428 Método de
rendimiento académico y, 345–350 edad y, 336– autoridad, 6–7 Método de límites, 158, 159–162, 167,
339 artifi cial (IA), 340, 443 defi niciones 184, 192 Método de tenacidad, 7
investigación de campo, 417–425, 425–426 cognitivas de, 339–345 definido, 335, 343–345
futuro de, 20 carga de trabajo mental, 417– genética y, 331 medición, 330, 334, 340
425, 427–428 observación naturalista, 28, 29 motivación y emoción, 350–354 inteligencias
principio primario de, 412–413 señales de múltiples, 343, 355
tráfico, 429–431 valor de la vida y, 413–415
variables en, 414, 416, 417–425
Pruebas de inteligencia, 329–339, 343–345, 456

Problema mente-cuerpo, 433 Operacionismo, definido, 196 Precisión de las teorías, 14
diseños mixtos, 67 ilusiones ópticas, 26 Predicción
Diferencias de modalidad, 268–273, 291–292 Escalas ordinales, 170, 171 enfoques a, 329 técnica
Motivación, 350–354 ordenada, 78 correlacional, 26, 39–40 teorías, papel de, 8,
“Efecto Mozart”, 109–118 Organización de datos, 8–9 10 frente a explicación, 18 Validez predictiva,
resonancia magnética, 443 Exceso de confianza en el juicio, 315–319 329 Prejuicio, 378–381 Preparación (en
Análisis de varianza multifactorial, 482–486 Sobrecarga, 211 resolución de problemas), 320 Tarea principal,
Inteligencias múltiples, 343–345 418, 419– 420, 422 Prime, 378, 380 Prime Sight,
Diseño de línea de base múltiple, 250–252 Pruebas de recuerdo de pares asociados, 266, 267 190 Priming, 190–194, 197–198, 267, 282, 288–
Procesamiento distribuido en paralelo (PDP), 443 289, 378
NASA, 418–422 Formas paralelas (de pruebas), 334
Teoría nativista, 181. Estimación de parámetros, 14
Naturalismo, 14 Parámetros, defi nidos, 459
Observación naturalista, 26–27, 392 Pruebas paramétricas, 469
Teoría de la naturaleza, 330–331 Parsimonia, 14 Interferencia proactiva, 269 Teoría
Contraste naturaleza-crianza, 330, 331–333, 359–360 Efecto de extinción del refuerzo parcial de la probabilidad, 490–491
Imágenes secundarias negativas, 189 (PREE), 253–256 Resolución de problemas. Véase Pensamiento y
Efectos de contraste negativo, 242, 243 Efecto participante. Véase Reactividad resolución de problemas Procesamiento, niveles
Correlación negativa, 38, 39 Observación de los participantes, 30 de, 274–281 Procesamiento, transferencia apropiada,
Estímulos reforzantes negativos, 233. Investigación de Pavlov, 35, 229–231 280–281 Prueba de productos, 412 Protección contra
transferencia negativa, 215 Coeficiente de correlación producto-momento de daños, 87 Pseudocondicionamiento, 234 Revistas
Neurotransmisores y personalidad, 331 Pearson (r de Pearson), 38–40, 43, 456–458 psicológicas, 105 Período refractario psicológico, 217–
Ruido, ambiental, 389, 401–405, 405–407, 409 Precisión de la percepción de, 26–27 de 220, 223 Psicología, científi ca , 3–23 definido, 7 primeros
profundidad, 201–203 niveles de , 183, 274–275 trabajos en, 435–438 objetivo de, 4 tendencias modernas
Ruido en la detección de señales, 163–169 de significado, 190–195 medidas de, 186 en, 442–446 orígenes de, 433–435 investigación y vida real,
Escalas nominales, 170–171 memoria como subproducto de, 274 definición 19–21 escuelas de, 438–442, 446 especialización, 18, 444–
Pruebas estadísticas no direccionales, 467, 469 operativa de, 195–196 psicofísica y, 154–156 446 Psiconeuroinmunología, 228 Métodos psicofísicos,
Pruebas no paramétricas, 469 infl uencia social en, 360 Investigación de la 154–155 Psicofísica, 153–179 definido, 154 fundación
Sílabas sin sentido, 263–265 percepción, 180–206 de, 437 escalas de medición, 155, 169–173 definiciones
Curva normal/distribución normal, operativas, 155–156 teoría de detección de señales, 162–
454–456, 464, 465, 468, 495–497 169 diseños de n pequeña , 156, 174–176, 246 estímulos
línea normal de mirada, 426; y juicios, 155, 159–160 umbrales, determinantes, 158–
Normas, 360 162 variables en, 157 Ley de Weber, 161, 171–172, 178–
Contingencia nula, 233; 179 Psicofisiología, 443 PsycINFO, 148 Política pública,
Hipótesis nula, 302, 463–464, 465 conciencia 391, 423–425 Publicaciones. Véase Búsquedas bibliográficas;
Resultados nulos, 55–57 vista ciega, 183–186 falta Informes de investigación Inserción pura, 212, 215
Nutrir la vista, 330–331 de conciencia verbal, 190–195 percepción
sin conciencia, 196–198 informes verbales, 187–195
Obediencia a la autoridad, 362–370 ilusión de distancia de color, 201–204 enfoque directo
Medidas objetivas, 418, 420. a, 181–183 teoría empírica de, 181 enfoque indirecto a,
objetividad, 35 181–183
Observación
como base para la experimentación, 28

sesgo/objetividad, 35 empírico, 7 errores Efecto Stroop, 190–194, 197, 204 variables
de, 26–27, 36 naturalista, 25–35, 392 en, 186–187, 189, 202–204
participante, 30 teoría y, 9–11 discreto, Ecuación personal, 208
30, 31 personalidad, 331
Experiencia fenomenológica, 187;
Nivel fonético (fonológico) de análisis, 274–275
Navaja de Occam, 14 Visión fotópica, 417

Pruebas estadísticas unilaterales, 467, 468 Efecto de superioridad de imagen, 287–290
Condicionamiento operante (instrumental), 231– Efecto placebo, 372–373
234, 246–256 Placebos, 68, 169
Defi niciones operativas que Plagio, 93 Variación cualitativa, 482
confunden y, 395 defi nieron, Correlación biserial puntual, 476–477 Años de vida ajustados por calidad (AVAC), 414–415
155, 328, 341 funciones de, Punto de igualdad subjetiva, 160; Variación cuantitativa, 482
345 de inteligencia, 339–345 Imágenes secundarias positivas, 189 Diseños cuasiexperimentales, 71–75, 345,
limitaciones de, 341 escalas de Efectos de contraste positivo, 243–244 389, 401–403
medición y, 173 en psicofísica, Correlación positiva, 38, 39
154–155, 156–157 con operaciones Estímulos de refuerzo positivo, 233. Carrera, 70, 378–381
simples, 196 Poder (de pruebas estadísticas), 302, 466–468, 476 Problema de radiación, 305–306, 307–308
Efectos de práctica, 65–66, 237, 292 Asignación aleatoria, 77

Tabla de números aleatorios, 509–510 Muestreo Eliminación de consecuencias dañinas, 87–88 Condiciones Informes de investigación (continuación)
aleatorio, 459, 460 Selección aleatoria, 77, 79 límite de replicación y, 310 conceptual, 307–308, 310 diseño sección de diseño, 102, 112 discusión,
Diseño de grupos aleatorios, 235 Aleatorización, de experimentos para, 55 directo, 307 exposición del 105, 107–108, 115–116, 120, 136–138, 143, 143 figuras/
65, 79, 241, 247, 307, 364 Medidas clasificadas, fraude, 94, 371 generalidad de los resultados y, 307–309 gráficos, 103, 104, 119, 120 introducción, 102, 106,
170 Escalas de razón, 170, 171, 172 , 291 Tiempo de razón para, 308, 316, 318 confiabilidad estadística, 306– 108, 111, 119, 120, 124–128, 143
reacción (RT). Véase también Atención y 307 sistemática, 307, 308, 310 Investigación. Ver también
Financiamiento de experimentos para, 20 meta de, 76–
77 aprobación institucional, 83, 84, 86, 94 problemas sección de materiales, 102

tiempo de reacción interpretativos, 34, 41 replicación de, 55, 93 métodos, 102, 106, 108, 111–112, 119, 120, 128–131,
Reacciones de Donders A, B y C, 208–210 tasa de error reproducibilidad de, 34 143, 144 sección de participantes, 102, 128, 144
y, 215–216, 218 olores y, 221–222 ecuación personal, sección de procedimientos, 102 sección de referencia,
208 fuerza de respuesta y, 212, 215 modificabilidad 105, 116–118, 119– 120, 121, 138–139, 143 resultados,
separada, 210 equilibrio entre velocidad y precisión, 215– 102–105, 106, 108, 114–115, 119–120, 131–136, 143,
220, 226 144 trabajos de estudiantes, 121 estilo de
escritura, 119, 143–146, 148 tablas , 103, 120, 121, 141–
142
Experimento de tiempo de reacción, 435
Reactividad
en la investigación de contingencias, 36–38 Enfoques de investigación

engaño para el control de, 85 características aplicada/básica, 19–21, 55 errores Condicionamiento del encuestado, 232
de la demanda, 69 de los participantes, 27, de observación y, 27, 36 no experimental, 25– Sesgo de respuesta, 162–163, 167, 195 Fuerza
28, 30–31, 33, 85 26, 50 enfoque relacional, 36–48 subcampos/ de respuesta, 212–215 Restricción del rango en
Razonamiento por analogía, 302–312 especialización, 17, 444–446 la correlación, 42–43 Diseño de inversión, 248–249
Pruebas de recuperación, 267, 269–273, 284–286, 288, 409 Recompensas, 233, 240–244, 253–256. Ver también
Características de funcionamiento del receptor (ROC), 165– Diseño de investigación, 51–81 Estímulos de refuerzo positivo
166, 174–175 diseños de tratamiento alternativo, 249–250 diseño de
Pruebas de reconocimiento, 268. cuadrado latino equilibrado, 244–246 diseños entre Pruebas estadísticas robustas, 486.
Período refractario, psicológico, 217–220, 223 sujetos, 64–65, 67–68, 215, 235–238, 250–252, 256, 259,
363, 469 Muestra, definida, 458–459
Artefactos de regresión, 74–75, 345– Generalización de la muestra, 393
350, 356–357 condiciones de control, 67–68 Medias de la muestra, 460–463, 461–465 Tamaño
Regresión a la media, 74–75, 329 transversal, 337–338 diseño secuencial de la muestra, 302, 467, 476, 488–489 Muestreo,
Refuerzo, 233, 253–256, 259–260 cruzado, 339 experimentos doble ciego, 79, 458–459 Método de ahorro, 265 Puntaje de
Diseño de medidas relacionadas, 471 70 efectos sobre el resultado, 237, 240– ahorro, 264– 265 Atenuación de escala, 173 Efectos
Enfoque relacional, 36–48 causalidad y, 241, 243 estudios ex post facto , 401–402 diseño de atenuación de escala, 268–274 Ciencia. Ver
46–47 procedimientos correlacionales longitudinal, 338 diseño de grupos, 237 diseños mixtos, también Psicología, elementos básicos científi cos
complejos, 44–46 investigación de contingencia, 36–38 67 diseño de línea de base múltiple, 250–252 dificultades de, 9–10 beneficios de, 7–8, 20, 91, 389–390
coeficiente de correlación, 38–40 investigación de correlación, (reducción de errores), 68–71 cuasi-experimentos, 71– curiosidad, papel de, 5–6 enfoque deductivo versus
36–37 75, 345–347, 389, 401–402 inductivo, 9–10 definido, 7 limitaciones of, 390–391
como camino hacia la verdad, 389–393 potencial de
Fiabilidad de mal uso, 83 como autocorrección, 7–8, 11, 25, 93,

las medidas, 328–329, 333–339 de los 393 escepticismo, 6 hechos científi cos, 6 método científi
resultados, 299 mitad dividida, 334 test-retest, co, 6–8, 14 Visión escotópica, 417 Tarea secundaria,
334, 335 diseño de grupos aleatorios, 235 418, 419–420, 422–423 Nivel semántico de análisis, 274–
diseños de n pequeña, 66–67, 246–253, 415–417 diseño de 275 Sensación, 181, 438. Véase también Psicofísica
Recordar y olvidar, 261–296 Ataques terroristas del 11 intervalo de tiempo, 339 diseños dentro de sujetos, 64, 65– Sensibilidad, medición, 168, 175 Sensibilidad del
de septiembre, 296 recuerdos autobiográficos, 296 66, 215, 235–238, 255, 259 observador (d), 166 –168, 186–188
La contribución de Ebbinghaus, 262–266 curva de
olvido, 265 pruebas de memoria implícita/explícita, Participantes de la investigación. Véase también
281–291 niveles de enfoque de procesamiento, 274– Investigación con animales; Variables, ética/
281 medidas de memoria, 264 –266, 267, 279–281 estudio protección de la asignatura, 83–89, 389, 403–405
de memoria: manuscrito de muestra en estilo APA, 121– expectativas de, 371, 372, 384 efectos del experimentador,
142 efectos de modalidad/atenuación de escala, 268–273 69–71 emparejamiento, 64, 65 reactividad, 27, 28, 370,
ruido y, 401–402, 409 lectura versus escucha, 269– 387 estudiantes como, 77, 84 retirarse de los estudios,
273, 291–293 social contagio de la memoria, 361 variables 87, 337 Informes de investigación, 99–149 lista de
en investigación sobre, 267–268 variedades de verificación del lector crítico, 105–108 partes/formato de,
memoria, 266–268 101–147 resúmenes, 101–102, 109, 123, 143 aparato,
102, 128, 144 autores, 93, 101, 121, 122 Modificabilidad separada, 210, 212 Ataques
terroristas del 11 de septiembre, 296
Pruebas de memoria en serie, 267
Constancia de forma, 441
Modelado (de la conducta), 232
Memoria (de trabajo) a corto plazo, 266

Prueba de signos, 471– Análisis estadístico (continuación) poder Teorías (continuación) prueba
472 Ventaja de detección de, defi nido, 302 nivel de significancia, de hipótesis, 12–14 definiciones
de señales, 167–169 escalas 103–105 operativas y, 345
de medición, 169–173 en investigación Reglas de predicción estadística, 176. Teoría de la detección de señales, 162–169
de percepción, 194 diseños de n pequeña, Fiabilidad estadística, defi nida, 306–307 Pensamiento y resolución de problemas, 297–326
174–176 teoría de, 162–169 Nivel de Cuadros estadisticos razonamiento analógico, 301–311 sesgo de
significación, 103–105 Análisis simple de valores críticos de la distribución F , 504–508 valores enfoques, 325 enfoques de, 299–301 fi jación
varianza , 478, 479–482 Reacción simple, críticos de t, 503 valores críticos de la distribución chi- funcional, 311–315 incubación en, 319–322
208–209, 210 Simulación de participantes de control, cuadrado, 508 inteligencia y, 345 exceso de confianza en los
374 Experimentos simple ciego, 372 Escepticismo, 6 juicios, 315–319 variables en, 303–304
Caja de Skinner, 232, 233 Diseños con n pequeña, 66, Prueba U de Mann-Whitney , 498–500
156, 174–176, 246– 253, 415–417 Facilitación social, curva normal, 495–498
381–384 Holgazanería social, 4–5, 8–9, 10, 11, 12, 61– Estadístico T de Wilcoxon para la prueba de rangos con
63, 383–384 Normas sociales, 360 Psicología social, signo de pares emparejados, 502 Pensamiento, definido, 298–299
358–386 Intervención de espectadores, 374 –378 Estereotipos, 7, 378–381, 386 umbrales
definido, 359 ética en, 370, 375–376, 378 Ley de potencia de Stevens, 172–173 absoluto, 158–159, 161, 172, 177
investigación de campo, 374–378 investigación sobre Estímulos conocimiento, 198 decisión, 166, 169
hipnosis, 370–374 orígenes de, 359–362 facilitación en condicionamiento clásico, 229–231, 233– detección, 192 determinación, 158–162, 170–
social, 381–384 estereotipos y prejuicios, 378–381 235, 238–240 estímulo discriminativo 173 diferencia, 160–162, 171, 178–179
variables, 362–363, 367–370, 374–375, 378–381 Social (SD), 233 en condicionamiento operante, 231– objetivo, 194–195 definición operativa de, 157
Science Citation Index (SSCI), 149 Especismo, 90 233 refuerzo, 233 Contraste de estímulo, 240– de dolor, 168–169
Compensación de precisión de velocidad, 215–220, 244 Error de estímulo, 438 Intensidad de
226 Fiabilidad de mitades divididas, 334 Técnica de estímulo, 235, 238–240 Asincronía de inicio de
camada dividida, 237 Estabilidad, 56, 335–336 estímulo (SOA), 217–220, 223 Estrés, 394, 395 IA
Método de la escalera, 161–162, 176–177 Desviación fuerte, 340–342 Efecto Stroop, 190–195, 197, 206 curva ROC y, 166 subjetivo,
estándar, 453, 454, 455, 456, 461–462 Error estándar Consistencia estructural, 310 Psicología estructural, 194–195, 196–197, 198 visual, 176–177, 188
de la media, 461–463 Puntuaciones estándar. Ver 316 Estructuralismo, 438–439, 441, 446
Análisis estadístico de puntajes Z, 448–493 Variables del sujeto. Ver Variables, sujeto Medidas El tiempo como variable, 47
subjetivas, 418, 420 Informes subjetivos. Ver Diseño de retardo de tiempo, 339.
Informes verbales Sujetos. Ver Participantes de la Tonal agnosia, 344

investigación Lógica sustractiva, método de, 215 Enfoque de arriba hacia abajo, 301
Método sustractivo, 209–210 Sumas de cuadrados, Vista desde arriba, 182, 183
480–481, 483–485 Encuestas, 25–26, 32–33 Señales de tráfico, 429–431
Sinergismo, 73, 349 Réplica sistemática, 307, 308, Transferir el procesamiento apropiado,
310 280–281
Ensayos a criterio, 264;

Sitio web “Experimentos verdaderos”, 81
Cero verdadero (escalas de medida), 170
Prueba de Turing, 340–342
Pruebas estadísticas de dos colas, 467, 469
Error tipo I, 466
Error tipo II, 466
suposiciones subyacentes, 43 Estímulo no condicionado (EE. UU.), 231, 233, 234

Prueba chi-cuadrado para independencia, 37 Pruebas T, 469, 473–476 Inferencias inconscientes, 181.
coeficientes de correlación, 38–43, 456–458 defi nidos, Taquistoscopio, 186 Medidas discretas, 30–31, 375, 427
459 estadística descriptiva, 78, 449–458 estadística Objetivo, 378–380 Observaciones discretas, 30, 31
inferencial, 458 análisis de varianza, 477–486 prueba Tenacidad, fijación de creencias y, 6, 7
chi-cuadrado, 486–487 distribución de medias Terminología de la psicología, 156–157 Validez, 329–330, 342–343
muestrales, 460–463 prueba de hipótesis, 463–469 Ataques terroristas del 11 de septiembre, 296 Representatividad variable, 394–396
magnitud del efecto, 476–477 muestreo, 458–459 Testimonio de las teorías, 14–15 Variables
pruebas de diferencias entre dos Fiabilidad test-retest, 334, 335 causalidad y, 47, 53–54 partes
Modelo tetraédrico de memoria, 276–277 complejas e interactivas, 47–48 definidas, 36, 55
teorías emparejamiento, 73–74, 237 Variables, confusión,
supuestos incluidos, 11–12 cambios en, 71–75, 211–214, 414.
10 experimentos críticos y, 54 vista
deductiva de, 10–11 definido, 8, 9, 10 Véase también Confundir
grupos, 469–476 usos evaluación, 14–15 vista de falsabilidad, variables, controlar
de, 103–105, 306 mal uso de 11 funciones de, 8–9, 17–18 defi nido, 57, 362
estadísticas, 487–490 descripción generalizaciones y, 12–14 efectos del experimentador como, 70
general, 78, 449 estadísticas no fi jación funcional, 311–315 ejemplos de
paramétricas, 170 estadísticas investigación, 157, 187, 211, 234, 268, 304, 333, 363, 395,
paramétricas, 170 414

Variables, definición Variables, intermedias, 15–17. Véase también Prueba de rangos con signo de Wilcoxon, 469,
dependiente, 15–17, 52, 56, 57 Operaciones convergentes Variables, 471, 472–473, 502 Varianza dentro de los
rango inadecuado, 56–57 variables multivariadas, 217 Variables, casi independientes, grupos, 478–479, 481, 482 Efecto de arrastre de los
independientes y, 15–17, 53 múltiples, 63, 215– 221 Variables, sujetas, 71–75, 328–329, 332–333, diseños dentro de los sujetos, 236 condicionamiento, 233–
220 ejemplos de investigación, 157, 186, 211, 234, 336–338, 351–354 Varianza, 236, 453, 478–479, 481 , 482, 234, 238–240 contrapeso, 240–244, 255 descrito, 64,
486 65–66, 236–237 transferencia negativa y, 215 vs.
267–268, 303–304, 332, 363, 378–381, 394, 414, diseños entre sujetos, 235–237, 238, 240, 255, 259–
417–425 estabilidad, 56 informes verbales como, 260 Prueba t intra-sujetos , 475–476 Tarea de
319 verificación de, 186 Informes verbales, 187–190, 194–195, 299, 315–319, completar fragmentos de palabras , 282, 288,
378–380
Verifi cación (en la resolución de problemas), 320
Variables, control extraño, Visión
53, 54, 240–244, 311–312 ejemplos de investigación, vista ciega, 183–185, 187–188,
73, 299, 332–333, 414 189–190 289
Variables, independientes en daño cerebral y, 199 agudeza Teoría de la percepción de las palabras, 311–312
estudios de correlación, 398–399 definidas, visual dinámica, 415–417 pruebas de Reconocimiento de palabras, 194
15, 16, 52, 55, 57 variables dependientes memoria y, 269–273, 291–293 línea normal de Tarea de completar raíz de palabra, 282
y, 15–17, 53 efectos del experimentador como, mirada, 426 Productividad del trabajador, 4
70 identificación, 57 interacción entre, 59–61, Efecto Stroop, 190–195 Carga de trabajo, 417–425, 427–428
284–290 niveles , 52–53, 67 resultados nulos, reconocimiento de palabras, 181, 182
55–56 ejemplos de investigación, 157, 186–187, Ilusiones visuales, 26, 182, 201–204, 205 Pruebas de reconocimiento sí/no, 267
211, 234, 267–268, 303–304, 332–333, 363, 394– Máscaras visuales, 378–379
395, 414 usando varios en un experimento, 58–63, Umbrales visuales, 176–177, 188 Puntajes Z, 456, 464–465, 467, 473
281, 289 manipulación válida de, 55–56
Tarea de selección de tarjetas Wason, 325
IA débil, 340
Ley de Weber, 161, 171, 178–179, 436
Estudio Westinghouse-Ohio, 347–349
Experimentos hipotéticos, 54–55

Psicología Experimental

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Psicología Experimental

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

Machine Translated by Google

Enrique L. Roediger III

Australia • Brasil • Japón • Corea • México •

Psicología Experimental, Novena Edición © 2009, 2005 Wadsworth, Cengage Learning

Asistente de marketing: Melanie Cregger

Director de arte: Vernon Boes

Editor de permisos de texto/arte: ISBN-10: 0-495-59533-0

Editor de permisos de imagen: Deanna Ettinger Wadsworth

Ilustradora: Lori Heckleman

Compositor: Graphic World Inc.

Para su curso y soluciones de aprendizaje, visite academic.cengage.com.

Compre cualquiera de nuestros productos en su tienda universitaria local o en nuestra tienda

Impreso en los Estados Unidos de América

59533_01_fm_pi-xxiv.indd ii 9533_01_fm_pi-xxiv.indd ii 3/6/08 /6/08

A tres destacados psicólogos que compartieron la diversión

59533_01_fm_pi-xxiv.indd iii 9533_01_fm_pi-xxiv.indd iii 3/6/08 /6/08

Esta página se dejó en blanco intencionalmente

SOBRE LOS AUTORES

BARRY H. KANTOWITZ es profesor de psicología,

El Dr. Kantowitz fue elegido miembro de la Asociación Estadounidense de

HENRY L. ROEDIGER III es el James S.

59533_01_fm_pi-xxiv.indd v 9533_01_fm_pi-xxiv.indd v 3/6/08 /6/08

entre otros. Se ha desempeñado como presidente de la Sociedad Estadounidense de Psicología, la

DAVID G. ELMES es Profesor Emérito de Psicología en la Universidad

El profesor Elmes es un apasionado del valor educativo de la investigación de pregrado.

59533_01_fm_pi-xxiv.indd vi 9533_01_fm_pi-xxiv.indd vi 3/6/08 /6/08

ÿ PRIMERA PARTE FUNDAMENTOS DE LA INVESTIGACIÓN 1

Capítulo 1 Explicación en Psicología Científica 3

Capitulo 2 Técnicas de Investigación: Observación

Capítulo 3 Técnicas de Investigación: Experimentos 51

Capítulo 4 Ética en la Investigación Psicológica 82

Capítulo 5 Cómo leer y escribir informes de investigación 99

ÿ SEGUNDA PARTE PRINCIPIOS Y PRÁCTICAS

Capítulo 6 Psicofísica 153

Capítulo 7 Percepción 180

Capítulo 8 Atención y tiempo de reacción 207

Capítulo 9 Condicionamiento y aprendizaje 227

Capítulo 10 Recordar y olvidar 261

Capítulo 11 Pensamiento y resolución de problemas 297

Capítulo 12 Diferencias individuales y desarrollo 327

Capítulo 13 Psicología Social 358

capitulo 14 Psicología Ambiental 388

Capítulo 15 Factores humanos 410

59533_01_fm_pi-xxiv.indd vii 9533_01_fm_pi-xxiv.indd vii 3/6/08 /6/08

Esta página se dejó en blanco intencionalmente

ÿ PRIMERA PARTE FUNDAMENTOS DE LA INVESTIGACIÓN 1

CAPÍTULO 1 EXPLICACIÓN EN PSICOLOGÍA CIENTÍFICA 3

Dar sentido al mundo 4

Curiosidad: la fuente de la ciencia 5

La naturaleza de la explicación científica 8 ¿Qué es una

intervinientes 15 Zorros y erizos deambulando por

la teoría psicológica 17 La ciencia de la psicología

18 La psicología y el mundo real 19 Resumen 22

Términos clave 23 Preguntas de discusión 23

CAPÍTULO 2 TÉCNICAS DE INVESTIGACIÓN: OBSERVACIÓN Y

Ventajas y desventajas de las observaciones naturalistas 33

Procedimientos correlacionales complejos 44

59533_01_fm_pi-xxiv.indd ix 9533_01_fm_pi-xxiv.indd ix 3/6/08 /6/08

CAPÍTULO 3 TÉCNICAS DE INVESTIGACIÓN: EXPERIMENTOS ¿Qué es un 51

de una variable independiente 58 Más de una

mixtos 67 Condiciones de control 67 Dificultades

Del problema al experimento: las tuercas y los tornillos 76

CAPÍTULO 4 ÉTICA EN LA INVESTIGACIÓN PSICOLÓGICA 82